Shing H Zhan, et al. doi:https://doi.org/10.1101/2023.06.08.544212
Recopilado por Carlos Cabrera Lozada. Miembro Correspondiente Nacional, ANM puesto 16. ORCID: 0000-0002-3133-5183. 11/06/2023
Resumen
La recombinación es una característica continua y cada vez más importante de los linajes circulantes del SARS-CoV-2, que desafía la forma en que representamos la historia evolutiva de este virus y da lugar a nuevas variantes de posible preocupación para la salud pública al combinar las propiedades de transmisión y evasión inmunitaria de diferentes linajes. La detección de nuevas cepas recombinantes es un desafío, ya que la mayoría de los métodos buscan rupturas entre conjuntos de mutaciones que caracterizan linajes distintos. Además, muchos enfoques básicos fundamentales para el estudio de la evolución viral asumen que la recombinación es insignificante, en el sentido de que un solo árbol filogenético puede representar la ascendencia genética de las cepas circulantes. Aquí presentamos una versión inicial de sc2ts, un método para detectar automáticamente recombinantes en tiempo real e integrarlos de manera cohesiva en una genealogía en forma de un gráfico de recombinación ancestral (ARG), que registra conjuntamente la mutación, la recombinación y la herencia genética. Inferimos dos ARG bajo diferentes estrategias de muestreo y estudiamos sus propiedades. Uno contiene 1,27 millones de secuencias muestreadas hasta el 30 de junio de 2021, y el segundo tiene una muestra más escasa, que consta de 657 000 secuencias muestreadas hasta el 30 de junio de 2022. Encontramos que ambos ARG son muy consistentes con las características conocidas del SARS-CoV-2 evolución, recuperando la filogenia básica del esqueleto, los espectros mutacionales y recapitulando detalles sobre la mayoría de los linajes recombinantes conocidos. Usando la biblioteca tskit bien establecida y rica en funciones, los ARG también se pueden almacenar de manera concisa y procesar de manera eficiente utilizando las herramientas estándar de Python. Por ejemplo, el ARG para 1,27 millones de secuencias (que codifica la ascendencia reticulada inferida, la variación genética y los extensos metadatos) requiere 58 MB de almacenamiento y se carga en menos de un segundo. La capacidad de integrar completamente los efectos de la recombinación en los análisis posteriores, de detectar rápida y automáticamente nuevos recombinantes y de utilizar una plataforma eficiente y conveniente para el cálculo basada en tecnologías bien diseñadas, hace que sc2ts sea un enfoque prometedor.