El 'alfabeto de la vida' ve la luz: publicada la secuencia más completa del genoma de un ser humano

Toño Fraguas

0

Seis artículos científicos simultáneos aparecidos este jueves en la revista 'Science' documentan la publicación de la versión más completa, hasta la fecha, del genoma de un ser humano: el conjunto del material genético que hace al Homo sapiens diferente de un ratón o de un mosquito. El anuncio se produce dos décadas después de que el Proyecto Genoma Humano lograra un primer borrador del alfabeto químico que forma nuestro material genético. Los genes son segmentos de ADN –el ácido que contiene las unidades básicas de la herencia genética– y albergan información sobre características concretas de los organismos vivos, su funcionamiento y su desarrollo.

“Estas partes del genoma humano que no habíamos podido estudiar durante más de 20 años son importantes para comprender el funcionamiento del genoma, las enfermedades genéticas y la diversidad y la evolución humanas”, afirma en un comunicado de prensa Karen Miga, profesora adjunta de ingeniería biomolecular de la Universidad de California en Santa Cruz, y una de las líderes de este proyecto que ahora culmina.

En el año 2000, el anuncio de lo que en realidad no era sino un borrador del genoma humano se convirtió en todo un acontecimiento político. En una ceremonia retransmitida vía satélite, protagonizada al alimón por el entonces presidente de EEUU, Bill Clinton, y el primer ministro británico, Tony Blair, aquel día de finales de junio los medios de comunicación se llenaron de frases grandilocuentes. “Estamos aprendiendo el lenguaje con el que Dios creó la vida”, llegó a decir Clinton.

En aquel entonces, la batuta científica fue compartida por el genetista Francis Collins y el biólogo Craig Venter (el primero desde el sector público; el segundo desde su empresa, Celera) quienes ya entonces advirtieron del carácter preliminar de los resultados y la ingente tarea que quedaba por delante. En julio de 2021 otra batería de papers científicos anunciaron esta versión mejorada del monumental proyecto, cuyos resultados son públicos desde hoy. Los investigadores de todo el mundo podrán por fin estudiar un 8% del genoma que todavía permanecía sin descifrar.  

3.000 millones de bases de ADN

La conocida 'doble hélice' del ADN está compuesta por dos hebras de bases –una suerte de letras químicas unidas por puentes de hidrógeno– que se enroscan como un tirabuzón formando los brazos de los cromosomas, los filamentos en forma de equis localizados en el núcleo de las células. El genoma humano consta aproximadamente de 3.000 millones de pares de bases de ADN. Según indican los investigadores en la nota de prensa, la disponibilidad de una secuencia más completa y sin huecos del genoma es fundamental para comprender “todo el espectro de la variación genómica humana y el condicionamiento genético de determinadas enfermedades”.

El trabajo ha sido realizado por el consorcio Telómero a Telómero (T2T) formado en 2019, entre otros, por miembros del Instituto Nacional de Investigación del Genoma Humano (NHGRI), que a su vez forma parte de los Institutos Nacionales de Salud de EEUU; la citada Universidad de California, en Santa Cruz, y la Universidad de Washington, Seattle. El NHGRI ha financiado la mayor parte del proyecto.

Dos mil genes por estudiar

El nuevo genoma de referencia, denominado T2T-CHM13, añade cerca de 200 millones de pares de bases de nuevas secuencias de ADN, entre las que se encuentran 99 genes que “probablemente” codifican proteínas y casi 2.000 genes que todavía necesitan un estudio más profundo. También corrige miles de errores estructurales en la que hasta ahora era la secuencia de referencia.

Las lagunas que ahora cubre la nueva secuencia abarcan la totalidad de los brazos cortos de cinco cromosomas humanos y cubren algunas de las regiones más complejas del genoma. Entre ellas, secuencias de ADN repetitivas que se encuentran en importantes estructuras cromosómicas como los telómeros (los extremos de los cromosomas) y los centrómeros (el estrechamiento del cromosoma que separa un brazo corto de un brazo largo) que coordinan la separación de los cromosomas replicados durante la división celular.

La nueva secuencia también revela duplicaciones de segmentos no detectadas anteriormente, en muchas ocasiones porque la tecnología disponible entonces no era capaz de hacerlo. Se trata de largos tramos de ADN que se duplican y que desempeñan importantes funciones tanto en la evolución como en el desarrollo de enfermedades. “Muchas de las regiones recién reveladas tienen funciones importantes en el genoma aunque no incluyan genes activos”, indican los investigadores.

"Hay una profunda ventaja en ver el genoma entero como un sistema completo. Nos pone en situación de desentrañar cómo funciona ese sistema"

“Hay una profunda ventaja en ver el genoma entero como un sistema completo. Nos pone en situación de desentrañar cómo funciona ese sistema”, señala David Haussler, director del Instituto de Genómica de la Universidad de California en Santa Cruz. “Hemos conseguido una enorme comprensión de la biología humana y de las enfermedades al disponer de aproximadamente el 90% del genoma humano, pero había muchos aspectos importantes que permanecían ocultos, fuera de la vista de la ciencia, porque no teníamos la tecnología necesaria para leer esas partes del genoma. Ahora podemos situarnos en la cima de la montaña y ver todo el paisaje que hay debajo y obtener una imagen completa de nuestro patrimonio genético humano”.

El nuevo genoma de referencia de T2T complementará el genoma de referencia humano estándar, conocido como Genome Reference Consortium build 38 (GRCh38), que tuvo su origen en el Proyecto Genoma Humano, financiado con fondos públicos, y que se ha ido actualizando continuamente desde el primer borrador en el año 2000 (anunciado en aquella solemne ceremonia política de Clinton y Blair).

Pangenómica: la nueva meta

“Estamos añadiendo un segundo genoma completo, y luego habrá más”, explica Haussler. “La siguiente fase consiste en pensar que la referencia del genoma de la humanidad no es una única secuencia genómica. Se trata de una profunda transición, el presagio de una nueva era en la que acabaremos captando la diversidad humana de forma imparcial”.

El Consorcio T2T se ha unido ahora al Consorcio de Referencia del Pangenoma Humano, cuyo objetivo es crear una nueva “referencia del pangenoma humano” basada en las secuencias genómicas completas de 350 individuos. El pangenoma es la colección de todos los genes de una especie, tanto los que tienen en común todos los individuos como los que difieren entre unos y otros.

“La pangenómica consiste en captar la diversidad de la población humana, y también en asegurar que hemos captado el genoma completo de forma adecuada”, apunta Benedict Paten, profesor asociado de ingeniería biomolecular en la Universidad de California, coautor de los trabajos de T2T y líder del proyecto de pangenómica. “Si no disponemos de un mapa de estas regiones del genoma difíciles de secuenciar en múltiples individuos, nos estamos perdiendo una gran cantidad de variación presente en nuestra población”.

TF