Elaborado por Materia para OpenMind Recomendado por Materia
4
Inicio El ADN, un archivo de información digital
13 julio 2023

El ADN, un archivo de información digital

Tiempo estimado de lectura Tiempo 4 de lectura

Cuando en 1953 Francis Crick, James Watson, Maurice Wilkins y Rosalind Franklin desvelaron la estructura del ADN, terminaba una carrera científica, pero comenzaba otra: sabiendo que el ADN era una secuencia ordenada que combinaba cuatro bases, adenina (A), timina (T), citosina (C) y guanina (G), había que descubrir cómo a partir de esa información se construía una proteína, una cadena formada por 20 tipos de aminoácidos. La traducción de una a otra implica la existencia de un código, el código genético. Pero un código puede servir para otros fines. Y desde hace años se prueba como soporte para almacenar información digital que podría sobrevivir incluso a la extinción de la humanidad.

BBVA-OpenMind-Yanes-El ADN archivo informacion digital_1 El ADN, como soporte para almacenar información digital, podría sobrevivir incluso a la extinción de la humanidad. Crédito: MAURICIO LIMA/AFP via Getty Images
El ADN, como soporte para almacenar información digital, podría sobrevivir incluso a la extinción de la humanidad. Crédito: MAURICIO LIMA/AFP via Getty Images

Fue el físico George Gamow quien primero propuso que eran unidades formadas por tres bases (tripletes) las que codificaban los aminoácidos. En 1966 las aportaciones de varios científicos descifraron el código genético, que consta de 64 tripletes o codones —cuatro elementos (A, T, G y C) tomados de tres en tres— y su correspondencia con los 20 aminoácidos. Ambos números no son iguales porque el código es degenerado; varios codones codifican el mismo aminoácido.

Códigos y algoritmos de conversión a secuencias de ADN

La idea de utilizar el código genético para almacenar otro tipo de información no tardó en picar la curiosidad de los científicos. A comienzos de los años 60 los físicos Richard Feynman y Mikhail Samoilovich Neiman, junto con el matemático Norbert Wiener, especularon con esta posibilidad. En 1988 el artista Joe Davis y la Universidad de Harvard pusieron en práctica el uso del ADN como código en el proyecto Microvenus: la figura de una runa germánica fue representada como un mapa simple de bits (ceros y unos), el cual se tradujo a una secuencia de ADN mediante un código, y dicha secuencia se insertó en una bacteria.

En 1988 el artista Joe Davis y la Universidad de Harvard pusieron en práctica el uso del ADN como código en el proyecto Microvenus. Crédito: researchgate.net
En 1988 el artista Joe Davis y la Universidad de Harvard pusieron en práctica el uso del ADN como código en el proyecto Microvenus. Crédito: researchgate.net

En 2008 el biotecnólogo y empresario Craig Venter creó el primer genoma sintético en una bacteria. Para diferenciarlo del original, en la secuencia de ADN insertó a modo de marcas de agua —una verificación que se emplea en los organismos transgénicos— el nombre del instituto junto con algunos de los nombres de los autores de los investigadores. Venter utilizó un código alfabético literal, aprovechando la denominación de una letra de cada aminoácido para escribir las palabras; el problema es que los aminoácidos son solo 20, y faltan las vocales O y U y las consonantes B, J, X y Z. En 2010, el instituto de Venter presentó una bacteria sintética autorreplicante con una marca de agua que incluía una dirección web, citas de Feynman y del escritor James Joyce, y otra alusiva al físico Robert Oppenheimer

BBVA-OpenMind-Yanes-El ADN archivo informacion digital_3 Un gramo de ADN puede almacenar 215 petabytes (millones de GB). Crédito: MAURICIO LIMA/AFP via Getty Images
Un gramo de ADN puede almacenar 215 petabytes (millones de GB). Crédito: MAURICIO LIMA/AFP via Getty Images

Pero el propósito de la codificación en ADN no es ocultar mensajes secretos, y menos gastando tres bases de ADN por cada letra, sino almacenar cualquier archivo digital y de forma comprimida. Por ello, una traducción alfabética directa es poco útil. Se han diseñado diversos códigos y algoritmos de conversión de datos binarios a secuencias de ADN y viceversa, introduciendo sistemas de redundancia y verificación para evitar errores, algo parecido al dígito de control en las cuentas bancarias. Así se han traducido a ADN textos como sonetos de Shakespeare o libros de Arquímedes y otros, pero también álbumes de música, imágenes, la Wikipedia entera en inglés o un episodio de la serie de Netflix Biohackers. La malograda sonda espacial israelí Beresheet-1, que se estrelló en la Luna en 2019, llevaba un archivo con 20 libros y 10.000 imágenes en formato de ADN.

Fósiles artificiales de ADN encapsulado

Las ventajas del ADN frente a los sistemas actuales de almacenamiento de archivos digitales son sobre todo la densidad de información y la durabilidad. Respecto a lo primero, según Latchesar Ionkov, científico computacional de Los Alamos National Laboratory que trabaja en un proyecto en este campo, los 33 zettabytes (billones de gigabytes, GB) estimados que ocupará toda la información digital que la humanidad generará anualmente de aquí a 2025 cabrían, en forma de ADN, en una pelota de ping pong. Según otra estimación, un gramo de ADN puede almacenar 215 petabytes (millones de GB). 

En cuanto a la durabilidad, dependerá del contenedor del ADN sintético. Un método habitual es repartir el ADN en fragmentos e introducir estos en bacterias que perpetúan la información al multiplicarse; el inconveniente es que con el tiempo aparecerán mutaciones, cambios en la secuencia que pueden hacer la información ilegible incluso utilizando robustos códigos de verificación. Frente a esto, el grupo de Robert Grass en el Instituto Federal Suizo de Tecnología en Zúrich (ETH) ha creado fósiles artificiales: nanoesferas de sílice, como granos de arena, que contienen el ADN encapsulado y que pueden disolverse si se desea recuperar la información, pero que pueden durar 2.000 años a una temperatura como la de Zúrich, y hasta 2 millones de años si se conservaran a -18 °C, por ejemplo en el Banco Mundial de Semillas de Svalbard.

El grupo de Robert Grass en el ETH ha creado fósiles artificiales que contienen el ADN encapsulado y que pueden durar hasta 2 millones de años. Crédito: Philipp Stössel/ETH Zurich
El grupo de Robert Grass en el ETH ha creado fósiles artificiales que contienen el ADN encapsulado y que pueden durar hasta 2 millones de años. Crédito: Philipp Stössel/ETH Zurich

Aún quedan grandes retos técnicos que resolver. La síntesis y secuenciación de ADN ha progresado enormemente, pero la velocidad aún es baja y el coste alto: el proyecto de Ionkov tiene como objetivo escribir 1 terabyte (TB) y leer 10 TB en 24 horas por 1.000 dólares, lo cual aún será demasiado lento y caro. Disponer de aparatos que integren todos los pasos, grabadores y reproductores de ADN rápidos, baratos y que minimicen los errores, llevará décadas. Pero según los expertos, urgen soluciones, ya que el volumen de información digital crece más deprisa que la capacidad de memoria instalada en los centros de datos. ¿Qué ocurrirá si llega el día en que no exista memoria en el mundo para toda nuestra información? 

Javier Yanes

Comentarios sobre esta publicación

El nombre no debe estar vacío
Escribe un comentario aquí…* (Máximo de 500 palabras)
El comentario no puede estar vacío
*Tu comentario será revisado antes de ser publicado
La comprobación captcha debe estar aprobada