FILTRER
Réinitialiser

Le rendez-vous de l'innovation #10

08 décembre 2021

L’ADN comme nouveau disque dur ?

En 2018, la quantité mondiale de données numériques était estimée à 33 zettaoctets (1021), et ce chiffre double tous les deux à trois ans. Le stockage de données sur disques durs ou bandes magnétiques nécessite de plus en plus de place et des ressources toujours plus importantes en infrastructures et en énergie. De plus, le stockage classique est peu durable : les données archivées sur CD ou bandes magnétiques doivent être transférées tous les 10 ans environ.

Depuis quelques années, de nombreuses recherches se penchent sur la possibilité de stocker des données dans l’ADN, l’un des « disques durs » les plus compacts qui soient. La première démonstration de stockage de données dans l’ADN date des années 1980 mais le véritable essor de ces techniques a commencé au début des années 2010. Selon certains spécialistes, cette solution serait une piste pour répondre aux difficultés actuelles de stockage des données. Marc Antonini, directeur de recherche au CNRS et responsable du projet européen OligoArchive a indiqué : « Si on devait réunir toutes nos données actuelles sur des Blu-ray, nous aurions vingt-trois piles de disques allant jusqu’à la Lune ».
Avec la solution de l’ADN, toutes ces données pourraient tenir dans une boîte à chaussures, un seul gramme d’ADN pouvant contenir 455 milliards de milliards de bits.
Par ailleurs, ce support possède une longévité incomparable qui pourrait atteindre des millions d’années avec des conditions de stockage optimales.

  • Vos données dans des tubes à essai ou dans des bactéries

Le stockage de données dans l’ADN (acide désoxyribonucléique) peut-être in vitro : les données à conserver (textes, images) initialement codées en séquence de 0 et de 1 sont transposées en séquences de bases nucléiques (éléments de base de l’ADN), les quatre bases possibles étant A (adénine), C (cytosine), G (guanine) et T (thymine). La molécule d’ADN est ensuite synthétisée par des appareils dédiés, qui ajoutent les nucléotides souhaités les uns à la suite des autres pour former des brins d’ADN. Une information assez volumineuse sera ainsi répartie sur plusieurs brins d’ADN et les molécules peuvent ensuite être stockées, souvent dans une solution aqueuse dans un tube à essais.
L’une des limites du procédé concerne l’étape de synthèse ou du séquençage : elle est nécessaire pour la lecture des données mais peut être longue et générer des erreurs. 

Il est également possible de stocker des données in vivo, dans le génome d’organismes vivants tels que des bactéries. Les bases constituant le code étant intégrées dans un endroit précis du génome. En 2021, des chercheurs de l’université de Columbia ont mis en place un système permettant de transférer les données directement d’un format numérique à un stockage biologique.
Dans ce nouveau système, dit « enregistrement moléculaire électrobiologique », le format numérique, composé de 0 et de 1, est exprimé en signal électrique. Si la quantité de données encodées est encore faible, c’est la première démonstration qu’il est possible de transférer des données directement de l’ordinateur vers un organisme vivant capable d’enregistrer ces données sur l’équivalent biologique de la bande magnétique : l’ADN.
 
Il est plus difficile de manipuler l’ADN in vivo qu’in vitro, et, pour les méthodes d’« enregistrement moléculaire », la densité d’espace de stockage (quantité d’information par nucléotide) y est plus faible.  Cependant, les données enregistrées in vivo ont pour avantage d’être faciles à copier grâce à la division cellulaire.

  • Stockage de données « froides »

Le stockage de données dans l’ADN semble plutôt être indiqué pour l’archivage de données dites « froides », c’est-à-dire des données auxquelles on accède peu fréquemment.
Ce moyen serait idéal entre autres pour l’archivage en plusieurs copies du patrimoine culturel, les archives photographiques, de films, de musées et de tous les fonds documentaires. Ce stock grandit de 60% chaque année alors que les capacités de stockage ne s’améliorent que de 20%, ce qui pousse à la construction de toujours plus de centres.

Le coût reste un obstacle pour la diffusion de cette technologie qui va encore considérablement progresser notamment grâce aux économies d’échelle d’une augmentation de la quantité d’information stockable par nucléotide. Les progrès qui vont être accomplis contribueront certainement à faire baisser ce coût comme ce fut le cas avec le séquençage du génome.

Sur la même thématique

Je souhaite être recontacté
close
*Champs obligatoires
close
*Champs obligatoires