Bonjour! Le premier stockage automatique de données au monde dans les molécules d'ADN

Bonjour! Le premier stockage automatique de données au monde dans les molécules d'ADN

Des chercheurs de Microsoft et de l'Université de Washington ont démontré le premier système de stockage de données entièrement automatisé et lisible pour l'ADN créé artificiellement. Il s’agit d’une étape clé vers le passage des nouvelles technologies des laboratoires de recherche aux centres de données commerciaux.

Les développeurs ont prouvé le concept avec un test simple : ils ont réussi à encoder le mot "bonjour" en fragments d'une molécule d'ADN synthétique et à le reconvertir en données numériques à l'aide d'un système de bout en bout entièrement automatisé, décrit dans article, publié le 21 mars dans Nature Scientific Reports.


Cet article est sur notre site Web.

Les molécules d’ADN peuvent stocker des informations numériques à des densités très élevées, c’est-à-dire dans un espace physique plusieurs fois plus petit que celui occupé par les centres de données modernes. Il s’agit de l’une des solutions prometteuses pour stocker la grande quantité de données que le monde génère chaque jour, depuis les dossiers commerciaux et les vidéos d’animaux mignons jusqu’aux photographies médicales et aux images spatiales.

Microsoft étudie les moyens de combler le fossé potentiel entre la quantité de données que nous produisons et nous voulons les préserver, ainsi que notre capacité à les préserver. Ces méthodes incluent le développement d'algorithmes et de technologies de calcul moléculaire pour codage de données dans de l'ADN artificiel. Cela permettrait à toutes les informations stockées dans un grand centre de données moderne de tenir dans un espace de la taille de plusieurs dés.

"Notre objectif principal est de lancer un système qui, pour l'utilisateur final, ressemblera presque à n'importe quel autre système de stockage cloud : les informations sont envoyées au centre de données et y sont stockées, puis elles apparaissent simplement lorsque le client en a besoin, » déclare Karin Strauss, chercheuse principale chez Microsoft. « Pour ce faire, nous devions prouver que cela avait un sens pratique du point de vue de l’automatisation. »

Les informations sont stockées dans des molécules d'ADN synthétique créées en laboratoire, plutôt que dans l'ADN des humains ou d'autres êtres vivants, et peuvent être cryptées avant d'être envoyées au système. Bien que des machines complexes telles que des synthétiseurs et des séquenceurs exécutent déjà des éléments clés du processus, de nombreuses étapes intermédiaires nécessitaient jusqu'à présent un travail manuel dans un laboratoire de recherche. "Il n'est pas adapté à un usage commercial", a déclaré Chris Takahashi, chercheur principal à la Paul Allen School of Computer Science and Engineering de l'USF (École d'informatique et d'ingénierie Paul G. Allen).

« Vous ne pouvez pas laisser des personnes courir dans le centre de données avec des pipettes, c'est trop sujet aux erreurs humaines, c'est trop cher et cela prend trop de place », a expliqué Takahashi.

Pour que cette méthode de stockage de données ait un sens commercial, les coûts de la synthèse de l'ADN (créant les éléments fondamentaux de séquences significatives) et du processus de séquençage nécessaire à la lecture des informations stockées doivent être réduits. Les chercheurs disent que c'est la direction à prendre développement rapide.

L'automatisation est une autre pièce clé du puzzle, rendant le stockage des données à une échelle commerciale et plus abordable, selon les chercheurs de Microsoft.

Dans certaines conditions, l’ADN peut durer beaucoup plus longtemps que les systèmes de stockage d’archives modernes, qui se dégradent au fil des décennies. Une partie de l’ADN a réussi à survivre dans des conditions loin d’être idéales pendant des dizaines de milliers d’années : dans les défenses de mammouth et dans les os des premiers humains. Cela signifie que les données peuvent être stockées de cette manière aussi longtemps que l’humanité existe.

Le système automatisé de stockage d'ADN utilise un logiciel développé par Microsoft et l'Université de Washington (UW). Il convertit les uns et les zéros des données numériques en séquences de nucléotides (A, T, C et G), qui sont les « éléments constitutifs » de l’ADN. Le système utilise ensuite un équipement de laboratoire peu coûteux, généralement disponible dans le commerce, pour fournir les fluides et réactifs nécessaires à un synthétiseur, qui collecte les fragments d'ADN fabriqués et les place dans un conteneur de stockage.

Lorsque le système a besoin d'extraire des informations, il ajoute d'autres produits chimiques pour préparer correctement l'ADN et utilise des pompes microfluidiques pour pousser les fluides dans les parties du système qui lisent les séquences de molécules d'ADN et les reconvertissent en informations qu'un ordinateur peut comprendre. Les chercheurs affirment que l’objectif du projet n’était pas de prouver que le système pouvait fonctionner rapidement ou à moindre coût, mais simplement de montrer que l’automatisation était possible.

L’un des avantages les plus évidents d’un système automatisé de stockage d’ADN est qu’il permet aux scientifiques de résoudre des problèmes complexes sans perdre de temps à chercher des flacons de réactifs ni à la monotonie d’ajouter des gouttes de liquide dans des tubes à essai.

"Disposer d'un système automatisé pour effectuer des travaux répétitifs permet aux laboratoires de se concentrer directement sur la recherche et de développer de nouvelles stratégies pour innover plus rapidement", a déclaré Bihlin Nguyen, chercheur chez Microsoft.

Equipe du Laboratoire des Systèmes d'Information Moléculaires Laboratoire de systèmes d'information moléculaire (MISL) a déjà démontré qu'il pouvait stocker des photographies de chats, de merveilleuses œuvres littéraires, vidéo et les enregistrements ADN archivés et extraire ces fichiers sans erreurs. À ce jour, ils ont réussi à stocker 1 gigaoctet de données dans l'ADN, battant ainsi précédent record du monde de 200 Mo.

Les chercheurs ont également développé des méthodes pour effectuer des calculs significatifscomme rechercher et récupérer uniquement les images contenant une pomme ou un vélo vert en utilisant les molécules elles-mêmes, sans reconvertir les fichiers au format numérique.

« On peut affirmer sans se tromper que nous assistons à la naissance d’un nouveau type de système informatique, dans lequel des molécules sont utilisées pour le stockage des données et l’électronique pour le contrôle et le traitement. Cette combinaison ouvre des possibilités très intéressantes pour l’avenir », a déclaré le professeur de l’Allen School de l’Université de Washington. Louis Sésé.

Contrairement aux systèmes informatiques basés sur le silicium, les systèmes informatiques et de stockage basés sur l’ADN doivent utiliser des fluides pour déplacer les molécules. Mais les liquides sont de nature différente des électrons et nécessitent des solutions techniques complètement nouvelles.

L'équipe de l'Université de Washington, en collaboration avec Microsoft, développe également un système programmable qui automatise les expériences en laboratoire en utilisant les propriétés de l'électricité et de l'eau pour déplacer des gouttelettes sur une grille d'électrodes. Un ensemble complet de logiciels et de matériel appelé Flaque d'eau et PurpleDrop, peut mélanger, séparer, chauffer ou refroidir divers liquides et exécuter des protocoles de laboratoire.

L’objectif est d’automatiser les expériences de laboratoire actuellement réalisées manuellement ou par des robots coûteux de manipulation de liquides et de réduire les coûts.

Les prochaines étapes pour l’équipe MISL comprennent l’intégration d’un système automatisé simple de bout en bout avec des technologies telles que Purple Drop, ainsi que d’autres technologies permettant la recherche de molécules d’ADN. Les chercheurs ont délibérément rendu leur système automatisé modulaire afin qu’il puisse évoluer à mesure que de nouvelles technologies de synthèse, de séquençage et de manipulation de l’ADN émergent.

"L'un des avantages de ce système est que si nous voulons remplacer l'une des pièces par quelque chose de nouveau, meilleur ou plus rapide, nous pouvons simplement brancher la nouvelle pièce", a déclaré Nguyen. "Cela nous donne plus de flexibilité pour l'avenir."

Image du haut : des chercheurs de Microsoft et de l'Université de Washington ont enregistré et compté le mot "hello", en utilisant le premier système de stockage de données ADN entièrement automatisé. Il s’agit d’une étape clé dans le transfert des nouvelles technologies des laboratoires vers les centres de données commerciaux.

Source: habr.com

Ajouter un commentaire