Alors que le volume de données produit dans le monde pourrait atteindre 175 zettaoctets en 2025 selon IDC (International Data Corporation), les datacenters engloutissent une énergie de plus en plus colossale. Depuis plusieurs années, les scientifiques essayent donc de trouver une solution alternative pour archiver cette montagne d’informations.
Il en existe une disponible de façon universelle sur notre Planète : l'ADN. En 2016, les équipes du Molecular Information Systems Lab (MISL) de l'université de Washington et de Microsoft avaient ainsi réussi à encoder un clip vidéo d'environ 200 Mo sur de l'ADN -- ils sont depuis parvenus à un nouveau record de 1 Go. Début 2018, les chercheurs du Waterford Institute of Technology ont, de leur côté, fait la démonstration d'encodage et décodage d'un message dans une bactérie E.coli.
Vers l'automatisation du processus ?
Mais alors que le séquençage et la synthèse d'ADN ont fait de gros progrès ces dernières années, bon nombre des étapes intermédiaires restent manuelles. Un gros frein au développement commercial du stockage. « Vous imaginez des personnes arpentant toute la journée le centre de données avec des pipettes ? C'est bien trop coûteux et sujet à l'erreur humaine, sans compter l'espace nécessaire », met en avant Chris Takahashi, chercheur à l'école de sciences et technologie Paul Allen de l'université de Washington. L'automatisation du processus est donc la clé pour rendre le système abordable. Et c'est justement ce que vient de réussir l'équipe de Takahashi en collaboration avec les ingénieurs de Microsoft.
Un convertisseur qui a coûté moins de 10.000 dollars
Les chercheurs ont réussi à fabriquer une machine capable de transformer automatiquement des données numériques (suites de 0 et de 1) en séquences ADN (bases azotées A, C, T et G). Le prototype, qui a coûté à peine 10.000 dollars, est réalisé avec des bouteilles en verre où sont fabriqués des brins d'ADN synthétique, et un séquenceur d'Oxford Nanopore pour les décoder et les reconvertir en données numériques.
Lors d'une démonstration, la machine a réussi à traduire le mot « hello » en ADN. L'algorithme développé par Microsoft convertit d'abord les bits en bases ADN, qui sont obtenus à l'aide d'un synthétiseur en ajoutant des produits chimiques. Les cinq octets de « hello » (01001000 01000101 01001100 01001100 01001111) peuvent ainsi être stockés dans 1 mg d'ADN, soit moins de 4 microgrammes sous la forme exploitable par séquençage.
Le processus est, pour l'instant, incroyablement lent : 21 heures pour convertir 5 octets ! Mais, les chercheurs assurent avoir déjà trouvé un moyen de le diviser par deux. « Notre objectif est de mettre au point un système qui, pour l'utilisateur final, ressemble à n'importe quel autre service de stockage cloud, où les données sont envoyées dans un datacenter ADN, puis sont reconverties en bits lorsque le client en a besoin », explique Karin Strauss, chercheuse principale chez Microsoft.
De l’informatique solide à l’informatique liquide
Mais quel est l’intérêt de l’ADN par rapport à nos bonnes vieilles puces en silicone ? D'une part, un gain significatif de place : selon Microsoft, la totalité de l'information contenue dans un datacenter pourrait tenir dans un petit cube de la taille d'un dé. D'autre part, l'ADN perdure plusieurs millions d'années, là où les composants informatiques ne résistent guère plus de 10 ans. Adopter massivement ce stockage biologique va cependant nécessiter une totale révolution : contrairement aux puces, l'ADN est stocké sous forme liquide, ce qui nécessite des technologies complètement différentes.
Par ailleurs, de gros progrès doivent encore être accomplis. Microsoft estime ainsi qu'il faudra atteindre une vitesse de conversion d'environ 100 Mo par seconde pour être viable commercialement. Le coût de la fabrication d'ADN doit également baisser. La start-up française DNA Script affirme ainsi pouvoir produire 1.000 nucléotides en une journée avec son « imprimante ADN ». Le MISL (Molecular Information Systems Lab) travaille, quant à lui, sur des logiciels capables d'effectuer une recherche de données à partir des molécules d'ADN, comme par exemple retrouver une image de chat ou une phrase d'un texte.
Source: Futura Sciences
Tags: Microsoft