El ADN es el dispositivo informático de la naturaleza.
por Shelly Fan

A diferencia de los centros de datos, DNA es increíblemente compacto. Estas moléculas empaquetan el plano genético de todo un organismo en estructuras diminutas pero sofisticadas dentro de cada célula. Conservados en frío, por ejemplo, dentro de un congelador o en la tundra siberiana, el ADN y los datos codificados en su interior pueden durar milenios.
Pero el ADN no es solo un dispositivo de almacenamiento. Una miríada de moléculas activan y desactivan los genes, un poco como si se ejecutaran selectivamente fragmentos de código, para orquestar las funciones celulares cotidianas. El cuerpo “lee” fragmentos del código genético en una célula en particular en un momento específico y, juntos, compilan los datos para una vida saludable que funcione sin problemas.
Los científicos han considerado durante mucho tiempo el ADN como un dispositivo informático para complementar las computadoras portátiles de uso diario. Con el aumento exponencial de los datos en el mundo, los chips de silicio se esfuerzan por satisfacer las demandas de almacenamiento y computación de datos. El auge de los grandes modelos de lenguaje y otros modos de inteligencia artificial está impulsando aún más la necesidad de soluciones alternativas.
Pero el problema con el almacenamiento de ADN es que a menudo se destruye después de “leer” los datos que contiene.
El mes pasado, un equipo de la Universidad Estatal de Carolina del Norte y la Universidad Johns Hopkins encontró una solución. Incrustaron moléculas de ADN, que codifican múltiples imágenes, en una estructura ramificada similar a un gel que se asemeja a una célula cerebral.
Apodados “dendricoloides”, las estructuras almacenaban archivos de ADN mucho mejor que los liofilizados solos. El ADN dentro de los dendricoloides se puede secar y rehidratar repetidamente aproximadamente 170 veces sin dañar los datos almacenados. Según una estimación, cada hebra de ADN podría durar más de dos millones de años a temperaturas normales de congelación.
A diferencia de las computadoras de ADN anteriores, los datos se pueden borrar y reemplazar como la memoria en las computadoras clásicas para resolver múltiples problemas, incluido un simple juego de ajedrez y sudoku.
Hasta ahora, el ADN se consideraba principalmente como un dispositivo de almacenamiento a largo plazo o una computadora de un solo uso. El desarrollo de una tecnología de ADN que pueda almacenar, leer, “reescribir, recargar o calcular archivos de datos específicos” repetidamente parecía difícil o imposible, dijo el autor del estudio, Albert Keung, en un comunicado de prensa.
Sin embargo, “hemos demostrado que estas tecnologías basadas en el ADN son viables, porque hemos creado una”, dijo.
Un grano de arena
Este no es el primer intento de secuestrar el código de la vida para aumentar el almacenamiento y la computación.
Los primeros pasos que se dieron fueron en el almacenamiento de datos. Nuestras computadoras funcionan con bits binarios de información codificados en ceros y unos. El ADN, por el contrario, utiliza cuatro moléculas diferentes representadas normalmente por las letras A, T, C y G. Esto significa que diferentes pares de ceros y unos (00, 01, 10, 11) se pueden codificar en diferentes letras de ADN. Debido a la forma en que está empaquetado en las células, el ADN puede, en teoría, almacenar muchos más datos en menos espacio que los dispositivos digitales.
“Podrías poner el valor de mil computadoras portátiles de datos en un almacenamiento basado en ADN que es del mismo tamaño que un borrador de lápiz”, dijo Keung.
Con cualquier ordenador, tenemos que ser capaces de buscar y recuperar información. Nuestras células han desarrollado mecanismos que leen partes específicas de una cadena de ADN a pedido, una especie de memoria de acceso aleatorio que extrae un dato en particular. Estudios anteriores han aprovechado estos sistemas para almacenar y recuperar libros, imágenes y GIF dentro de archivos de ADN. Los científicos también han utilizado cuentas de vidrio microscópicas con “etiquetas” de ADN como una especie de sistema de archivo para facilitar la extracción.
Pero almacenar y extraer datos es solo la mitad de la historia. Un ordenador necesita, bueno, computar.
El año pasado, un equipo desarrolló una computadora de ADN programable que puede ejecutar miles de millones de circuitos diferentes con una energía mínima. Tradicionalmente, estas máquinas moleculares funcionan permitiendo que diferentes hebras se agarren entre sí en función de las necesidades de cálculo. Diferentes pares podrían señalar puertas lógicas “y”, “o” y “no”, recapitulando el corazón de las computadoras digitales de hoy.
Pero la lectura y la computación a menudo destruyen los datos originales de ADN, lo que hace que la mayoría de los sistemas basados en ADN sean de un solo uso. Los científicos también han desarrollado otro tipo de computadora de ADN, que monitorea los cambios en las estructuras de la molécula. Estos se pueden reescribir. Al igual que los discos duros estándar, pueden codificar múltiples rondas de datos, pero también son más difíciles de escalar.
El ADN se une a los datos
El nuevo estudio combinó lo mejor de ambos mundos. El equipo diseñó una computadora de ADN que puede almacenar información, realizar cálculos y reiniciar el sistema para otra ronda.
El núcleo del sistema se basa en un dogma central de la biología. El ADN se encuentra en una pequeña jaula dentro de las células. Cuando los genes se activan, sus datos se traducen en ARN, que convierte el plano genético en proteínas. Si el ADN se almacena de forma segura, la adición de “interruptores” de proteínas que activan o disminuyen los genes cambia la lectura genética en el ARN, pero mantiene intactas las secuencias genéticas originales.
Debido a que los datos originales no cambian, es posible ejecutar varias rondas de cálculos basados en ARN a partir de un solo conjunto de datos codificado por ADN, con mejoras.
Basándose en estas ideas, el equipo diseñó una estructura gelatinosa con ramas similares a las de una célula cerebral. Apodados “dendricoloides”, los materiales blandos permitieron que cada hebra de ADN se agarrara al material circundante “sin sacrificar la densidad de datos que hace que el ADN sea atractivo para el almacenamiento de datos en primer lugar”, dijo el autor del estudio, Orlin Velev.
“Podemos copiar la información del ADN directamente desde la superficie del material sin dañar el ADN. También podemos borrar fragmentos específicos de ADN y luego reescribirlos en la misma superficie, como borrar y reescribir la información almacenada en el disco duro”, dijo el autor del estudio, Kevin Lin.
Para probar su sistema, el equipo incrustó una secuencia de ADN sintético de 200 letras en el material. Añadiendo un cóctel molecular que convierte las secuencias de ADN en ARN, el material fue capaz de generar ARN repetidamente durante 10 rondas. En teoría, el ARN resultante podría codificar 46 terabytes de datos almacenados a temperaturas normales de refrigerador y congelador.
Los dendricoloides también podrían absorber más de 2.700 hebras de ADN diferentes, cada una de casi 250 letras de largo para proteger sus datos. En una prueba, el equipo codificó tres archivos JPEG diferentes en las estructuras, traduciendo los datos digitales en datos biológicos. En simulaciones que imitaban el acceso a los archivos de ADN, el equipo pudo reconstruir los datos 10 veces sin perderlos en el proceso.
Que empiece el juego
A continuación, el equipo se inspiró en una especie de “borrador” biológico. Estas proteínas corroen el ARN sin dañar el plano del ADN. Este proceso controla la forma en que una célula realiza sus funciones habituales, por ejemplo, destruyendo cadenas de ARN perjudiciales para la salud.
Como prueba de concepto, el equipo desarrolló 1.000 fragmentos de ADN diferentes para resolver múltiples acertijos. Para una simple partida de ajedrez, cada molécula de ADN codificaba nueve posiciones potenciales. Las moléculas se agruparon, y cada una representaba una configuración potencial. Estos datos permitieron que el sistema aprendiera. Por ejemplo, un gen, cuando se activa, podría dirigir un movimiento en el tablero de ajedrez replicándose a sí mismo en ARN. Otro podría reducir los niveles de ARN perjudiciales para el juego.
Estos procesos de ADN a ARN fueron controlados por una proteína modificada cuyo trabajo era mantener los resultados finales bajo control. Como último paso, todas las cadenas de ARN que violaban las reglas fueron destruidas, dejando solo aquellas que representaban la solución final esperada. Además del ajedrez, el equipo implementó este proceso para resolver también sudokus sencillos.
La computadora del ADN todavía está en pañales. Pero a diferencia de las generaciones anteriores, esta captura el almacenamiento y la computación en un solo sistema.
“Hay mucho entusiasmo sobre el almacenamiento y la computación de datos moleculares, pero ha habido preguntas significativas sobre qué tan práctico puede ser el campo”, dijo Keung. “Queríamos desarrollar algo que inspirara el campo de la computación molecular”.