por Melissa Southey y Tu Nguyen-Dumont
La publicación del borrador de la secuencia del genoma humano en 2001 fue un momento sísmico en nuestra comprensión del genoma humano y allanó el camino para avances en nuestra comprensión de la base genómica de la biología y las enfermedades humanas.
Pero las secciones se dejaron sin secuenciar y parte de la información de la secuencia era incorrecta. Ahora, dos décadas después, tenemos una versión mucho más completa, publicada como preimpresión (que aún no se ha sometido a revisión por pares) por un consorcio internacional de investigadores.
Las limitaciones tecnológicas significaron que el borrador original de la secuencia del genoma humano cubría solo la porción “eucromática” del genoma, el 92% de nuestro genoma donde se encuentran la mayoría de los genes y que es más activo en la fabricación de productos genéticos como ARN y proteínas.
La secuencia recién actualizada llena la mayoría de los vacíos restantes, proporcionando los 3.055 mil millones de pares de bases (“letras”) de nuestro código de ADN en su totalidad. Estos datos se han puesto a disposición del público, con la esperanza de que otros investigadores los utilicen para promover su investigación.
¿Por qué tomó 20 años?
Gran parte del material recién secuenciado es la parte “heterocromática” del genoma, que está más “empaquetada” que el genoma eucromático y contiene muchas secuencias altamente repetitivas que son muy difíciles de leer con precisión.
Alguna vez se pensó que estas regiones no contenían ninguna información genética importante, pero ahora se sabe que contienen genes que están involucrados en procesos fundamentalmente importantes, como la formación de órganos durante el desarrollo embrionario. Entre los 200 millones de pares de bases recién secuenciados, se estima que hay 115 genes que se prevé que participen en la producción de proteínas.
Dos factores clave hicieron posible la finalización del genoma humano:
1. Elegir un tipo de celda muy especial
La secuencia del genoma recientemente publicada se creó utilizando células humanas derivadas de un tipo de tejido muy raro llamado mola hidatiforme completa , que ocurre cuando un óvulo fertilizado pierde todo el material genético aportado por la madre.
La mayoría de las células contienen dos copias de cada cromosoma, una de cada padre y el cromosoma de cada padre que contribuye con una secuencia de ADN diferente. Una célula de una mola hidatiforme completa tiene solo dos copias de los cromosomas del padre y la secuencia genética de cada par de cromosomas es idéntica. Esto hace que la secuencia completa del genoma sea mucho más fácil de reconstruir.
2. Avances en la tecnología de secuenciación
Después de décadas de progreso glacial, el Proyecto Genoma Humano logró su gran avance en 2001 al ser pionero en un método llamado “secuenciación de escopeta”, que implicaba dividir el genoma en fragmentos muy pequeños de aproximadamente 200 pares de bases, clonarlos dentro de bacterias , descifrar sus secuencias y luego reconstruyéndolos como una sierra de calar gigante.
Esta fue la razón principal por la que el borrador original cubría solo las regiones eucromáticas del genoma; solo estas regiones podían secuenciarse de manera confiable usando este método.
La última secuencia se dedujo utilizando dos nuevas tecnologías complementarias de secuenciación de ADN. Uno fue desarrollado por PacBio y permite secuenciar fragmentos de ADN más largos con una precisión muy alta. El segundo, desarrollado por Oxford Nanopore, produce tramos ultralargos de secuencia continua de ADN. Estas nuevas tecnologías permiten que las piezas del rompecabezas tengan miles o incluso millones de pares de bases, lo que facilita su ensamblaje.
La nueva información tiene el potencial de mejorar nuestra comprensión de la biología humana, incluida la forma en que los cromosomas funcionan y mantienen su estructura. También mejorará nuestra comprensión de las condiciones genéticas, como el síndrome de Down, que tienen una anomalía cromosómica subyacente.
¿Está el genoma ahora completamente secuenciado?
Bueno no. Una omisión obvia es el cromosoma Y, porque las células molares hidatiformes completas utilizadas para compilar esta secuencia contenían dos copias idénticas del cromosoma X. Sin embargo, este trabajo está en marcha y los investigadores anticipan que su método también puede secuenciar con precisión el cromosoma Y, a pesar de que tiene secuencias altamente repetitivas.
Aunque la secuenciación del genoma (casi) completo de una célula humana es un hito extremadamente impresionante, es solo uno de varios pasos cruciales para comprender completamente la diversidad genética de los humanos.
El próximo trabajo será estudiar los genomas de diversas poblaciones (las células molares hidatiformes completas eran europeas). Una vez que la nueva tecnología haya madurado lo suficiente como para usarse de manera rutinaria para secuenciar muchos genomas humanos diferentes, de diferentes poblaciones, estará mejor posicionada para tener un impacto más significativo en nuestra comprensión de la historia humana, la biología y la salud.
Se necesita tanto cuidado como desarrollo tecnológico para garantizar que esta investigación se lleve a cabo con una comprensión completa de la diversidad del genoma humano para prevenir la exacerbación de las disparidades en la salud al limitar los descubrimientos a poblaciones específicas.
Crédito de la imagen: Arek Socha / Pixabay
MELISSA SOUTHEY
La profesora Melissa C. Southey, BSc (Hons, Pathology) PhD (Medicina), GradDip (Law), es genetista molecular (FHGSA) y miembro fundadora de la Facultad de Ciencias, Royal College of Pathologists of Australasia (FFSc, RCPA) . Es presidenta de Medicina de Precisión, Facultad de Ciencias Clínicas de Monash Health, directora de la nueva iniciativa Biobanking Victoria de la Universidad de Monash y directora de investigación …