La prueba de concepto de Project Silica almacena la película Superman en un vidrio de cuarzo

78

Por Jennifer Langston, Writer, Microsoft Stories

Microsoft y Warner Bros. han colaborado para recuperar y almacenar con éxito la icónica película “Superman” de 1978 en un trozo de vidrio apenas del tamaño de un portavaso, de 75 por 75 por 2 milímetros de grosor.

Se trató de la primera prueba de concepto para Project Silica, una iniciativa de Microsoft Research que utiliza descubrimientos recientes en ópticos láser ultra rápidos e inteligencia artificial para almacenar datos en vidrio de cuarzo. ¿Cómo funciona? Un láser codifica datos en vidrio al crear capas de rejillas y deformaciones tridimensionales a nano escala, en varios ángulos y profundidades. Los algoritmos de aprendizaje automático vuelven a leer los datos al decodificar imágenes y patrones que son creados a medida que la luz polarizada brilla a través del vidrio.

El vidrio de silicio puede soportar agua caliente, ser horneadocon microondas, mojado, fregado, desmagnetizado y otras amenazas ambientales que pueden destruir archivos históricos o tesoros culturales invaluables si las cosas salen mal.

El proyecto implica una inversión por parte de Microsoft Azure para desarrollar tecnologías de almacenamiento construidas en específico para patrones de cómputo en la nube, en lugar de confiar en medios de almacenamiento diseñados para trabajar en computadoras u otros escenarios. Es solo una de las muchas maneras en las que Azure se apoya en la experiencia de Microsoft Research para resolver desafíos a corto y largo plazo – desde las pruebas de centros de datos bajo el agua de Project Natick, al poder de procesamiento FPGA de Project Brainwave, a la emergente investigación de Optics for the Cloud.

Warner Bros., que se acercó a Microsoft después de conocer la investigación, siempre está en la búsqueda de nuevas tecnologías para salvaguardar su vasta librería de recursos: tesoros históricos como “Casablanca”, programas de radio de la década de los cuarenta, cortos animados, películas teatrales filmadas de manera digital, comedias de televisión, diarios de platós. Por años, han buscado una tecnología de almacenamiento que pueda durar cientos de años, que soporte inundaciones o erupciones solares y que no requiera ser mantenida a una cierta temperatura o que necesite una renovación constante.

Disminuir los costos de almacenamiento a largo plazo

La mayoría de las personas piensan en “la nube” como una manera de almacenar todo: desde miles de fotos familiares a millones de emails sin utilizar espacio en su teléfono o computadora. Pero toda esa información es almacenada de manera física en hardware en una ubicación remota, lo que les permite acceder a ella desde múltiples dispositivos.
La cantidad de datos que la humanidad ahora busca almacenar –desde registros médicos a divertidos videos de gatos o imágenes tomadas por una nave espacial– ha comenzado a explotar al mismo tiempo que la capacidad de las tecnologías existentes de almacenamiento se reduce.

Los costos de almacenamiento a largo plazo aumentan debido a la necesidad de transferir datos de manera repetida hacia nuevos medios antes de que se pierda la información. Las unidades de disco duro se pueden desgastar después de tres a cinco años; la cinta magnética sólo puede durar de cinco a siete. Los formatos de archivo se vuelven obsoletos, y las actualizaciones son caras. Warner Bros., por ejemplo, en sus propios archivos digitales migra, de manera proactiva, contenido cada tres años para adelantarse a posibles problemas de degradación.

El almacenamiento en vidrio tiene el potencial de convertirse en una opción de bajo costo debido a que solo escribes los datos en el vidrio una vez. Los láseres de femtosegundos –que emiten pulsos ópticos ultra-cortos y que se usan por lo general en cirugías LASIK– cambian de manera permanente la estructura del vidrio, para que los datos puedan ser preservados por siglos. El vidrio de cuarzo tampoco necesita aire acondicionado de alto consumo de energía para mantener el material a una temperatura constante o de sistemas que remuevan la humedad del aire – los cuales podrían disminuir la huella ambiental del almacenamiento de datos de gran escala.

Project Silica busca almacenar lo que es conocido como datos “fríos” – datos de archivo que podrían tener un gran valor o que las compañías deben mantener –pero a los que no se necesita acceder de manera frecuente. Esto podría incluir datos médicos que necesitan mantenerse durante toda la vida de un paciente, datos de regulación financiera, contratos legales, información geológica relacionada con la exploración energética y planes de construcción que las ciudades deben mantener.

Convertir los datos digitales en artefactos físicos

Con una historia de casi 100 años en el cine y la televisión, Warner Bros. posee una de las librerías de entretenimiento más profunda y significativa. La compañía cuenta con planes de redundancia para manejar varios de los peores escenarios posibles: un terremoto o huracán que impacte una de las costas, un incendio donde los sistemas de supresión no arranquen o una falla en el control del clima que permita crecer a la humedad y arruinar el inventario de cintas. La meta es contar con tres copias de archivo de cada recurso, almacenadas en diferentes ubicaciones en el mundo: dos copias digitales separadas, junto con la copia física original en cualquier medio que haya sido creada una película o episodio de televisión o cartón animado.

La compañía espera que Project Silica pueda probar ser una alternativa más barata y de mayor calidad para crear archivos físicos de contenido digital. Hay mucho trabajo por delante para alcanzar esa escala: los investigadores de Microsoft necesitarán incrementar de manera significativa la velocidad a la que los datos pueden ser escritos y leídos, así como su densidad.

Diseñar almacenamiento para la nube

Es imposible saber cuánta información se ha perdido debido a que nadie se dio cuenta de su valor en ese momento –desde películas mudas que nadie pensó que serían vistas fuera de un cine a datos históricos de los que las herramientas modernas de analítica e IA podrían obtener nueva información de valor.

Una meta de la investigación de Microsoft de almacenamiento de siguiente generación, que incluye esfuerzos paralelos para almacenar datos en ADN, es desarrollar soluciones que sean lo suficientemente baratas y no requieran esfuerzo como para que en verdad no se tenga que tomar la decisión sobre dónde almacenar sus datos, señaló la compañía.

Con una inversión de Azure, el laboratorio de Microsoft en Cambridge, Reino Unido, construyó un equipo interdisciplinario de físicos, expertos en óptica, ingenieros eléctricos e investigadores con antecedentes en almacenamiento para empujar esta tecnología. Desde entonces, el equipo de Microsoft Research ha conseguido importantes avances en velocidad y precisión. También han trabajado de cerca con sus contrapartes de Azure para diseñar Project Silica con los desafíos y requerimientos diarios del almacenamiento de nube comercial en mente.

Los láseres infrarrojos de Project Silica codifican los datos en “vóxels”, el equivalente tridimensional de los pixeles que forman una imagen plana. A diferencia de los medios ópticos de almacenamiento que escriben datos en la superficie de algo, Project Silica almacena datos dentro del vidrio. Una pieza de vidrio de dos milímetros de espesor, por ejemplo, puede contener más de 100 capas de vóxels. Los datos son codificados en cada vóxel al cambiar la fuerza y orientación de cada pulso intenso de laser que deforma de manera física el vidrio. Es algo como crear icebergs boca abajo nano escala, con diferentes profundidades y tamaños y surcos que los hacen únicos.

Para volver a leer esos datos, los algoritmos de aprendizaje automático decodifican los patrones creados cuando la luz polarizada brilla a través del vidrio. A diferencia de la cinta de almacenamiento –que toma tiempo en cola para llegar al lugar que quieres volver a leer– los algoritmos pueden llegar a cualquier punto dentro del cuadrado de vidrio, lo que reduce de manera potencial el tiempo de retraso para recuperar la información.

A diferencia de las frágiles copas de vino o los focos, los cuadrados de vidrio de cuarzo utilizados para el almacenamiento de datos son, sorprendentemente, difíciles de destruir. Hace un tiempo, el equipo de investigación trató de hornear uno a 500 grados, meterlo a un microondas, hervirlo, y fregarlo con lana de acero. Y cuando leyeron los datos, todo seguía ahí.