Hallo! 's Werelds eerste automatische gegevensopslag in DNA-moleculen

Hallo! 's Werelds eerste automatische gegevensopslag in DNA-moleculen

Onderzoekers van Microsoft en de Universiteit van Washington hebben het eerste volledig geautomatiseerde, leesbare gegevensopslagsysteem voor kunstmatig gecreëerd DNA gedemonstreerd. Dit is een belangrijke stap in de richting van het verplaatsen van nieuwe technologie van onderzoekslaboratoria naar commerciële datacentra.

De ontwikkelaars bewezen het concept met een eenvoudige test: ze codeerden met succes het woord ‘hallo’ in fragmenten van een synthetisch DNA-molecuul en zetten dit weer om in digitale gegevens met behulp van een volledig geautomatiseerd end-to-end-systeem, dat wordt beschreven in статье, gepubliceerd op 21 maart in Nature Scientific Reports.


Dit artikel staat op onze website.

DNA-moleculen kunnen digitale informatie in zeer hoge dichtheden opslaan, dat wil zeggen in een fysieke ruimte die vele ordes van grootte kleiner is dan die van moderne datacenters. Het is een van de veelbelovende oplossingen voor het opslaan van de enorme hoeveelheid gegevens die de wereld dagelijks genereert, van bedrijfsdocumenten en video's van schattige dieren tot medische foto's en beelden uit de ruimte.

Microsoft onderzoekt manieren om de potentiële kloof tussen de hoeveelheid data die we produceren en we willen ze behouden, en ons vermogen om ze te behouden. Deze methoden omvatten de ontwikkeling van algoritmen en moleculaire computertechnologieën voor het coderen van gegevens in kunstmatig DNA. Hierdoor zou alle informatie die is opgeslagen in een groot modern datacenter kunnen passen in een ruimte die ongeveer zo groot is als een paar dobbelstenen.

“Ons belangrijkste doel is om een ​​systeem te lanceren dat er voor de eindgebruiker vrijwel hetzelfde uit zal zien als elk ander cloudopslagsysteem: informatie wordt naar het datacenter gestuurd en daar opgeslagen, en verschijnt dan eenvoudigweg wanneer de klant deze nodig heeft. zegt Sr. Microsoft-onderzoeker Karin Strauss. “Om dit te doen, moesten we bewijzen dat het praktisch zinvol was vanuit een automatiseringsperspectief.”

De informatie wordt opgeslagen in synthetische DNA-moleculen die in een laboratorium zijn gemaakt, in plaats van in het DNA van mensen of andere levende wezens, en kan worden gecodeerd voordat ze naar het systeem worden verzonden. Hoewel complexe machines zoals synthesizers en sequencers al belangrijke onderdelen van het proces uitvoeren, vereisten veel van de tussenstappen tot nu toe handarbeid in een onderzoekslaboratorium. "Het is niet geschikt voor commercieel gebruik", zegt Chris Takahashi, senior research fellow aan de Paul Allen School of Computer Science and Engineering bij USF (Paul G. Allen School of Computer Science & Engineering).

"Je kunt geen mensen met pipetten door het datacenter laten rennen, het is te gevoelig voor menselijke fouten, het is te duur en het neemt te veel ruimte in beslag", legt Takahashi uit.

Om deze methode voor gegevensopslag commercieel zinvol te maken, moeten de kosten van zowel de DNA-synthese – het creëren van de fundamentele bouwstenen van betekenisvolle sequenties – als het sequentieproces dat nodig is om de opgeslagen informatie te lezen, worden verlaagd. Onderzoekers zeggen dat dit de richting is snelle ontwikkeling.

Automatisering is een ander belangrijk stukje van de puzzel, waardoor gegevensopslag op commerciële schaal en betaalbaarder wordt, aldus Microsoft-onderzoekers.

Onder bepaalde omstandigheden kan DNA veel langer meegaan dan moderne archiefopslagsystemen, die in de loop van tientallen jaren achteruitgaan. Een deel van het DNA is erin geslaagd om al tienduizenden jaren onder minder dan ideale omstandigheden te overleven – in de slagtanden van mammoeten en in de botten van vroege mensen. Dit betekent dat gegevens op deze manier kunnen worden opgeslagen zolang de mensheid bestaat.

Het geautomatiseerde DNA-opslagsysteem maakt gebruik van software ontwikkeld door Microsoft en de Universiteit van Washington (UW). Het zet de enen en nullen van digitale gegevens om in reeksen van nucleotiden (A, T, C en G), de ‘bouwstenen’ van DNA. Het systeem maakt vervolgens gebruik van goedkope, meestal kant-en-klare laboratoriumapparatuur om de benodigde vloeistoffen en reagentia aan een synthesizer te leveren, die de gefabriceerde DNA-fragmenten verzamelt en in een opslagcontainer plaatst.

Wanneer het systeem informatie moet extraheren, voegt het andere chemicaliën toe om het DNA op de juiste manier voor te bereiden en gebruikt het microfluïdische pompen om vloeistoffen in delen van het systeem te duwen die de sequenties van DNA-moleculen lezen en deze weer omzetten in informatie die een computer kan begrijpen. De onderzoekers zeggen dat het doel van het project niet was om te bewijzen dat het systeem snel of goedkoop kon werken, maar simpelweg om te laten zien dat automatisering mogelijk was.

Een van de meest voor de hand liggende voordelen van een geautomatiseerd DNA-opslagsysteem is dat het wetenschappers de vrijheid geeft om complexe problemen op te lossen zonder tijd te verspillen aan het zoeken naar flessen reagentia of de eentonigheid van het toevoegen van druppels vloeistof aan reageerbuizen.

“Door een geautomatiseerd systeem te hebben dat repetitief werk kan doen, kunnen laboratoria zich direct op onderzoek richten en nieuwe strategieën ontwikkelen om sneller te innoveren”, aldus Microsoft-onderzoeker Bihlin Nguyen.

Team van het Laboratorium voor Moleculaire Informatiesystemen Laboratorium voor moleculaire informatiesystemen (MISL) heeft al aangetoond dat het foto's van katten, prachtige literaire werken, video en gearchiveerde DNA-records en extraheer deze bestanden zonder fouten. Tot nu toe hebben ze 1 gigabyte aan data in DNA kunnen opslaan vorig wereldrecord van 200 MB.

Onderzoekers hebben daar ook methoden voor ontwikkeld zinvolle berekeningen uitvoerenzoals het vinden en ophalen van alleen afbeeldingen die een appel of een groene fiets bevatten met behulp van de moleculen zelf, zonder de bestanden terug naar digitaal formaat te converteren.

“Het is veilig om te zeggen dat we getuige zijn van de geboorte van een nieuw type computersysteem, waarin moleculen worden gebruikt voor gegevensopslag en elektronica voor controle en verwerking. Deze combinatie opent zeer interessante mogelijkheden voor de toekomst”, aldus de Allen School-professor aan de Universiteit van Washington. Louis Sese.

In tegenstelling tot op silicium gebaseerde computersystemen moeten op DNA gebaseerde opslag- en computersystemen vloeistoffen gebruiken om moleculen te verplaatsen. Maar vloeistoffen zijn van nature anders dan elektronen en vereisen compleet nieuwe technische oplossingen.

Het team van de Universiteit van Washington ontwikkelt in samenwerking met Microsoft ook een programmeerbaar systeem dat laboratoriumexperimenten automatiseert door de eigenschappen van elektriciteit en water te gebruiken om druppeltjes op een rooster van elektroden te verplaatsen. Een complete set software en hardware genoemd Plas en PurpleDrop, kan verschillende vloeistoffen mengen, scheiden, verwarmen of koelen en laboratoriumprotocollen uitvoeren.

Het doel is om laboratoriumexperimenten die momenteel handmatig of door dure vloeistofverwerkingsrobots worden uitgevoerd te automatiseren en de kosten te verlagen.

Volgende stappen voor het MISL-team omvatten de integratie van een eenvoudig, end-to-end geautomatiseerd systeem met technologieën zoals Purple Drop, evenals andere technologieën die het zoeken naar DNA-moleculen mogelijk maken. De onderzoekers hebben hun geautomatiseerde systeem bewust modulair gemaakt, zodat het kon evolueren naarmate nieuwe technologieën voor DNA-synthese, sequencing en manipulatie opkwamen.

“Een van de voordelen van dit systeem is dat als we een van de onderdelen willen vervangen door iets nieuws, beters of snellers, we het nieuwe onderdeel gewoon kunnen aansluiten”, aldus Nguyen. “Dit geeft ons meer flexibiliteit voor de toekomst.”

Bovenste afbeelding: Onderzoekers van Microsoft en de Universiteit van Washington hebben het woord 'opgenomen en geteld'hallo", met behulp van het eerste volledig geautomatiseerde DNA-gegevensopslagsysteem. Dit is een belangrijke stap in het verplaatsen van nieuwe technologie van laboratoria naar commerciële datacenters.

Bron: www.habr.com

Voeg een reactie