Hace algunos años, los creadores del Proyecto 1000 genomas (1000 Genomes Project o 1kGP, en inglés) lanzaron una plataforma de libre acceso, basada en datos de secuenciación del genoma completo (WGS) realizada a 2.504 individuos de 26 poblaciones representativas de los cinco continentes. Este recurso ha sido destacado en numerosas oportunidades por ser el primer esfuerzo a gran escala para ofrecer un catálogo de la variación genética humana.
Pero, hace poco se conoció que la herramienta del Proyecto 1000 genomas ha sido actualizada y expandida, incluyendo a casi todos los tríos de padres e hijos de la colección, junto con las muestras originales. Los datos fueron procesados con alta cobertura utilizando instrumentos Illumina NovaSeq. Tras estos análisis, la plataforma de libre acceso cuenta con 3.202 muestras, incluidos 602 tríos.
“La cohorte del Proyecto 1000 Genomas es un recurso tan valioso que pensamos que sería útil para la comunidad actualizar la secuenciación con la última versión de la tecnología de lectura corta, añadiendo al mismo tiempo la riqueza de las muestras familiares omitidas anteriormente”, explicó el doctor Michael Zody, director científico de biología computacional del NYGC y autor principal del estudio publicado en la revista Cell.
También le puede interesar: Sandoz dejará de ser parte de Novartis en 2023
Claves sobre los procesos de secuenciación genética que ampliaron los datos del Proyecto 1000 genomas
De acuerdo con el artículo, los investigadores utilizaron métodos y algoritmos más avanzados para secuenciar el ADN derivado de las líneas celulares linfoblastoides (LCLs; es decir, células B humanas inmortalizadas de sangre periférica) de la cohorte ampliada hasta una profundidad objetivo de 30X de cobertura del genoma.
Posteriormente, se realizó la identificación de variantes de un solo nucleótido (SNV) y de inserciones y deleciones cortas (INDEL), proceso que consiste en la localización de puntos de variantes, a partir de los datos de la secuencia en relación con la referencia del genoma humano y el genotipado de las muestras de la cohorte. En la actualización del Proyecto 1000 genomas también se incluyó el descubrimiento de un amplio conjunto de variantes estructurales (VS) y su genotipificación, gracias a la integración de múltiples enfoques analíticos.
No olvide leer: FDA autoriza dosis de refuerzo para la variante ómicron de Pfizer y Moderna
En general, el estudio muestra mejoras significativas tanto en el poder de descubrimiento como en la precisión de las llamadas de variantes, especialmente entre los SNV raros, así como los INDEL y los SV que abarcan el espectro de frecuencias, que antes eran inaccesibles con la secuenciación de baja cobertura, coinciden los investigadores.
Uno de los elementos fundamentales de la plataforma es el panel de referencia para la imputación de variantes. Ahora, la ampliación del recurso original facilitó la actualización de este panel para incluir más variantes descubiertas mediante WGS de alta cobertura y familias de tríos. La información ya ha sucitado el interés de la comunidad científica, ya que la naturaleza de acceso abierto del Proyecto 1000 genomas permite la distribución pública de datos genéticos sin restricciones de uso.
La investigación fue un trabajo colaborativo entre el Centro del Genoma de Nueva York (NYGC) con con grupos del Hospital General de Massachusetts, la Universidad de Yale y el Consorcio de Variación Estructural del Genoma Humano (HGSVC).
Le puede interesar: Supersalud solicitó a las EPS retomar a la vacunación covid-19 como prioridad