Cada vez más, la información de la civilización se almacena digitalmente, y ese almacenamiento es abundante y creciente. No nos molestamos en borrar esos siete videos de alta definición del techo o 20 fotos borrosas de la esquina de una mesa tomadas por nuestro hijo. Hay mucho espacio en un teléfono inteligente o en la nube, y contamos con que ambos aumenten cada año.
A medida que copiamos información de forma fluida de un dispositivo a otro, esta situación parece duradera. Pero eso no es necesariamente cierto.
La cantidad de datos que creamos aumenta rápidamente. Y si (apocalípticamente) perdiéramos la capacidad de producir dispositivos de almacenamiento digital (discos duros o cinta magnética, por ejemplo), el registro digital colectivo de nuestra civilización comenzaría a tener agujeros en unos años. En décadas, se volvería casi ilegible. El almacenamiento digital no es como libros o tablillas de piedra. Tiene una fecha de vencimiento más corta. Y, aunque damos por sentado el almacenamiento, sigue siendo caro y consume mucha energía.
Es por eso que los investigadores buscan nuevas formas de archivar información. Y el ADN, el propio "disco duro" de la vida, puede ser una solución. El ADN ofrece un almacenamiento de datos increíblemente denso y, en las condiciones adecuadas, puede mantener la información intacta durante milenios.
En los últimos años, los científicos han avanzado en el almacenamiento de datos de ADN. Han demostrado cómo podemos codificar libros individuales , fotografías e incluso GIF en el ADN y luego recuperarlos. Pero no ha habido una forma escalable de organizar y recuperar grandes colecciones de archivos de ADN.
En una nueva Nature Materials de papel , un equipo del MIT y Instituto Broad de Harvard describe un sistema de almacenamiento basado en el ADN que les permite buscar y tirar de archivos individuales en este caso las imágenes codificadas en el ADN. Es un poco como hojear su archivador, leer las pestañas de papel para identificar una carpeta y luego sacar la escritura de su automóvil desde allí. Solo que, obviamente, los detalles son un poco más complicados.
"Necesitamos nuevas soluciones para almacenar estas enormes cantidades de datos que el mundo está acumulando, especialmente los datos de archivo", dijo Mark Bathe, profesor de ingeniería biológica del MIT y autor principal del artículo. “El ADN es mil veces más denso que incluso la memoria flash, y otra propiedad que es interesante es que una vez que se produce el polímero de ADN, no consume energía. Puedes escribir el ADN y luego almacenarlo para siempre ".
Cómo organizar un sistema de almacenamiento de ADN
De todos modos, ¿cómo se codifica una imagen en una hebra de ADN? Es una cuestión de traducción bastante simple.
Cada píxel de una imagen digital está codificado en bits. Estos bits están representados por unos y ceros. Para convertirlo en ADN, los científicos asignan cada uno de estos bits a las cuatro moléculas de base del ADN, o nucleótidos, adenina, citosina, guanina y timina, a las que generalmente se hace referencia en forma abreviada con las letras A, C, G y T. El ADN las bases A y G, por ejemplo, podrían representar 1, y C y T podrían representar 0.
A continuación, los investigadores encadenan (o sintetizan) una cadena de bases de ADN que representan todos y cada uno de los bits de información del archivo original. Para recuperar la imagen, los investigadores invierten el proceso, leen la secuencia de bases de ADN (o la secuencian) y traducen los datos nuevamente en bits.
El proceso de recuperación estándar tiene algunas desventajas, sin embargo.
Los investigadores utilizan una técnica llamada reacción en cadena de la polimerasa (PCR) para extraer archivos. Cada hebra de ADN incluye una secuencia de identificación que coincide con una secuencia corta de nucleótidos llamada cebador de PCR. Cuando se agrega el cebador a la solución de ADN, se une a las cadenas de ADN coincidentes, las que queremos leer, y solo esas secuencias se amplifican (es decir, se copian para secuenciar). ¿El problema? Los cebadores pueden interactuar con secuencias fuera del objetivo. Peor aún, el proceso utiliza enzimas que mastican todo el ADN.
"Estás quemando el pajar para encontrar la aguja, porque el resto del ADN no se amplifica y básicamente lo estás tirando", dijo Bathe.
Las esferas de vidrio microscópicas que se muestran aquí son "archivos" de ADN. Cada uno contiene una imagen, codificada en ADN, y está recubierta de etiquetas de ADN que describen la imagen que contiene.
Para evitar esto, el equipo del Broad Institute encapsuló las hebras de ADN en microesferas de vidrio microscópicas (de 6 micrones). Colocaron etiquetas de ADN cortas de una sola hebra en la superficie de cada cuenta. Al igual que los nombres de archivo, las etiquetas describen el contenido de la cuenta. Una imagen de tigre puede etiquetarse como "naranja", "gato", "salvaje". Un gato doméstico puede estar etiquetado como "naranja", "gato", "doméstico". Con solo cuatro etiquetas por perla, puede etiquetar de forma única 10 20 archivos de ADN.
El equipo puede recuperar archivos específicos agregando secuencias de nucleótidos complementarias, o cebadores, correspondientes a la etiqueta de un archivo individual. Los cebadores contienen moléculas fluorescentes y cuando se enlazan con una hebra complementaria, es decir, la etiqueta buscada, forman una doble hélice y brillan. Las máquinas separan las perlas brillantes, que se abren y se secuencia el ADN del interior. El resto de los archivos de ADN permanecen intactos, se dejan en paz para proteger su información.
La mejor parte del método es su escalabilidad. En teoría, podría tener una enorme biblioteca de ADN almacenada en un tubo de ensayo (Bathe señala que una taza de café con ADN podría almacenar todos los datos del mundo), pero sin una manera fácil de buscar y recuperar el archivo exacto que está buscando, es sin valor. Con este método, se puede recuperar todo.
George Church, profesor de genética de Harvard y figura muy conocida en el campo de la biología sintética, lo calificó como un "gran salto" para el campo.
"El rápido progreso en la escritura, copia, lectura y almacenamiento de datos de archivo de baja energía en forma de ADN ha dejado oportunidades poco exploradas para la recuperación precisa de archivos de datos de enormes ... bases de datos", dijo. "El nuevo estudio aborda esto de manera espectacular utilizando una capa externa de ADN completamente independiente y aprovechando diferentes propiedades del ADN (hibridación en lugar de secuenciación) y, además, utilizando instrumentos y químicas existentes".
Esto no vendrá para su computadora
Para ser claros, todo el almacenamiento de datos de ADN, incluido el trabajo descrito en este estudio, permanece firmemente en la fase de investigación. No espere discos duros DNA para su computadora portátil en el corto plazo.
Sintetizar ADN sigue siendo extremadamente caro. Escribir un petabyte de datos en el ADN costaría algo así como un billón de dólares. Para igualar la cinta magnética, un método común de almacenamiento de datos de archivo, Bathe estima que los costos de síntesis tendrían que caer seis órdenes de magnitud. Además, esta no es la técnica más rápida (por decirlo suavemente).
El costo de la síntesis de ADN disminuirá (la tecnología también se está avanzando en otras áreas) y con más trabajo, la velocidad mejorará. Pero esto último puede estar fuera de lugar. Es decir, si lo que nos preocupa principalmente es realizar una copia de seguridad de los datos esenciales a largo plazo con requisitos mínimos de energía y sin necesidad de acceder a ellos con regularidad, entonces la velocidad es menos importante que la fidelidad, la densidad de datos y la durabilidad.
El ADN ya almacena la información del mundo viviente, ahora, al parecer, también puede hacer lo mismo con todo lo digital.
Comments