CV. El panorama global de los genomas, variantes y haplotipos del SARS-CoV-2 en 2019nCoVR. Preprint, 29/08/2020

Compartir

El 22 de enero de 2020, el Centro Nacional de Bioinformación de China (CNCB) / Centro Nacional de Datos de Genómica (NGDC) creó el recurso de coronavirus nuevo 2019 (2019nCoVR, https://bigd.big.ac.cn/ncov/), un repositorio de libre acceso a la información sobre SARS-CoV-2. El 2019nCoVR presenta una integración completa de secuencias e información clínica sobre todos los aislados de SARS-CoV-2 del dominio público, que se curan manualmente con anotaciones de valor agregado, y la calidad evalúa nuestra base de datos interna y automatizada. Cabe destacar que 2019nCoVR realiza análisis sistemáticos para obtener un panorama dinámico de las variaciones genómicas del SARS-CoV-2 a escala global. Proporciona todas las variantes identificadas y estadísticas detalladas para cada virus aislado, y reúne la puntuación de calidad, la anotación funcional y la frecuencia de población para cada variante. También genera visualización del cambio espacio-temporal para cada variante y produce mapas históricos de redes de haplotipos virales para el curso del brote de todos los genomas completos y de alta calidad. Además, 2019nCoVR proporciona una colección completa de la literatura sobre COVID-19, incluidos artículos publicados de PubMed, así como preprints de servicios como bioRxiv y medRxiv a través de Europe PMC. Además, al vincularse con bases de datos relevantes en CNCB / NGDC, 2019nCoVR ofrece servicios de envío de datos para lecturas de secuencias sin procesar y genomas ensamblados, e intercambio de datos con el Centro Nacional de Información Biotecnológica. En conjunto, todas las secuencias, variantes, haplotipos y literatura del genoma del SARS-CoV-2 se actualizan diariamente para proporcionar información oportuna, lo que convierte a 2019nCoVR en un recurso valioso para la comunidad de investigación global.

Una respuesta basada en datos del SARS-CoV-2 requiere un recurso de datos público, gratuito y de acceso abierto que contenga los datos completos de secuencias del genoma, de alta calidad y que esté equipado con canales automatizados para analizar rápidamente las secuencias del genoma en tiempo real. Por lo tanto, 2019nCoVR (así como otros recursos en NGDC / CNCB) proporciona una amplia gama de servicios de datos, que incluyen un archivo de datos de secuenciación, secuenciación del genoma y gestión de metainformación con control de calidad y conservación, análisis de variaciones y presentación y visualización de datos. Además, 2019nCoVR proporciona un seguimiento dinámico espacio-temporal para todas las variantes identificadas con el fin de facilitar a los usuarios de todo el mundo monitorear cualquier variante que pueda estar asociada con una transmisión rápida y alta virulencia. Para comprender mejor el ciclo de vida y la patogenicidad del SARS-CoV-2, las direcciones futuras son recopilar cada vez más secuencias del genoma en todo el mundo, incluir otros tipos de datos ómicos (como el transcriptoma y el epitranscriptoma, si están disponibles), y también proporcionar más interfaces amigables y herramientas en línea que apoyan las actividades de investigación en todo el mundo.

Publicado por Rafael Rangel-Aldao

Deja un comentario

Academia Nacional de Medicina