"Hello"! Перше у світі автоматичне сховище даних у молекулах ДНК

"Hello"! Перше у світі автоматичне сховище даних у молекулах ДНК

Дослідники з Microsoft та Вашингтонського університету продемонстрували першу повністю автоматизовану систему зберігання даних у штучно створеній ДНК із можливістю зчитування. Це ключовий крок на шляху до перенесення нової технології з дослідницьких лабораторій до комерційних центрів обробки даних.

Розробники підтвердили концепцію за допомогою простого тесту: успішно закодували слово «hello» у фрагментах синтетичної молекули ДНК і перетворили його назад на цифрові дані, використовуючи повністю автоматизовану наскрізну систему, яка описана в статті, опублікованій 21 березня у Nature Scientific Reports.


Ця стаття на нашому сайті.

У молекулах ДНК можна зберігати цифрову інформацію з дуже високою щільністю, тобто у фізичному просторі, який набагато порядків менше, ніж займають сучасні центри обробки даних. Це одне з багатообіцяючих рішень для зберігання величезної кількості даних, які світ генерує щодня — від ділових записів та відео з милими тваринами до медичних знімків та зображень з космосу.

Microsoft вивчає способи подолання потенційного розриву між обсягом даних, які ми виготовляємо і хочемо зберігати і нашою здатністю їх зберігати. До таких способів входить розробка алгоритмів і технологій молекулярних обчислень для кодування даних у штучних ДНК. Це дозволило б вмістити всю інформацію, що зберігається у великому сучасному центрі обробки даних, у простір приблизно дорівнює розміру декількох гральних кісток.

«Наша головна мета — запустити в експлуатацію систему, яка для кінцевого користувача виглядатиме майже так само, як і будь-яка інша система хмарного зберігання: відомості відправляються до центру обробки даних і зберігаються там, а потім просто з'являються, коли знадобляться клієнту, — каже старший дослідник Microsoft Карін Штраус. — Для цього нам потрібно було довести, що це має практичне значення з погляду автоматизації».

Інформація зберігається в синтетичних молекулах ДНК, створених у лабораторії, а не в ДНК людей або інших живих істот, і може бути зашифрована перед відправкою до системи. Хоча складні машини, такі як синтезатори та секвенсори, вже виконують ключові частини процесу, багато проміжних етапів досі вимагали ручної праці в дослідній лабораторії. "Це не підходить для комерційного використання", - сказав Кріс Такахаші, старший науковий співробітник Школи інформатики та техніки імені Пола Аллена в Університеті США (Школа комп'ютерних наук та інженерії Пола Г. Аллена).

"По центру обробки даних не можуть бігати люди з піпетками, при такому підході занадто висока ймовірність людської помилки, він занадто дорогий і вимагає занадто багато місця", - пояснив Такахаші.

Щоб цей метод зберігання даних мав сенс з комерційної точки зору, необхідно знизити витрати як на синтез ДНК - створення фундаментальних будівельних блоків зі значущими послідовностями, так і на процес секвенування, необхідний для зчитування збереженої інформації. Дослідники кажуть, що у цьому напрямі йде стрімкий розвиток.

За словами дослідників з Microsoft, автоматизація – ще одна ключова частина цієї головоломки, що дозволяє організувати зберігання даних у комерційному масштабі та зробити його більш доступним.

При дотриманні певних умов ДНК може бути набагато довше, ніж сучасні засоби архівного зберігання, які руйнуються протягом десятиліть. Деяким ДНК вдалося зберегтися в далеких від ідеалу умовах протягом десятків тисяч років — у бивнях мамонта та кістках ранніх людей. Отже, дані можна зберігати в такий спосіб, доки існує людство.

Автоматизована система зберігання даних ДНК використовує програмне забезпечення, розроблене фахівцями Microsoft та Вашингтонського університету (UW). Воно перетворює одиниці і нулі цифрових даних у послідовності нуклеотидів (A, T, C і G), що є «будівельними блоками» ДНК. Потім система використовує недороге, в основному стандартне, лабораторне обладнання для подачі необхідних рідин і реагентів синтезатор, який збирає виготовлені фрагменти ДНК і поміщає їх в ємність для зберігання.

Коли системі необхідно отримати інформацію, вона додає інші хімічні речовини для правильної підготовки ДНК і використовує мікрофлюїдні насоси для проштовхування рідин в ті частини системи, які зчитують послідовності молекул ДНК і перетворюють їх назад в інформацію, зрозумілу комп'ютеру. Дослідники кажуть, що метою проекту було не довести, що система може працювати швидко чи дешево, а просто показати, що автоматизація можлива.

Одна з очевидних переваг автоматизованої системи зберігання ДНК полягає в тому, що вона звільняє вчених для вирішення складних завдань, дозволяючи не витрачати час на пошук пляшок з реагентами або монотонне додавання крапель рідини в пробірки.

"Наявність автоматизованої системи для виконання роботи, що повторюється, дозволяє співробітникам лабораторій займатися безпосередньо дослідженнями, розробляти нові стратегії, щоб впроваджувати інновації швидше", - сказав дослідник з Microsoft Біхлін Нгуєн.

Команда з Лабораторії молекулярних інформаційних систем Molecular Information Systems Lab (MISL) вже продемонструвала, що може зберігати фотографії котиків, чудові літературні твори, відео та архівні записи в ДНК та витягувати ці файли без помилок. На сьогоднішній день вони змогли зберегти в ДНК 1 гігабайт даних, побивши попередній світовий рекорд у 200 Мб.

Дослідники також розробили методи для виконання значних обчислень, таких як пошук та вилучення тільки зображень, на яких є яблуко або зелений велосипед, використовуючи для цього самі молекули, без перетворення файлів назад у цифровий формат.

«Можна впевнено сказати, що ми спостерігаємо народження комп'ютерної системи нового типу, в якій для зберігання даних використовуються молекули, а для управління та обробки — електроніка. Таке поєднання відкриває дуже цікаві можливості на майбутнє», - сказав професор школи Аллена Вашингтонського університету Луїс Сезе.

На відміну від обчислювальних систем на основі кремнієвих компонентів, системи зберігання та обчислення на основі ДНК повинні використовувати рідини для переміщення молекул. Але рідини за своєю природою відрізняються від електронів і вимагають абсолютно нових технічних рішень.

Команда Вашингтонського університету у співпраці з Microsoft розробляє також програмовану систему, яка автоматизує лабораторні експерименти, використовуючи властивості електрики та води для переміщення крапель на сітці електродів. Повний набір програмного та апаратного забезпечення, який отримав назви Puddle та PurpleDropможе змішувати, розділяти, нагрівати або охолоджувати різні рідини і виконувати лабораторні протоколи.

Ціль полягає в тому, щоб автоматизувати лабораторні експерименти, які в даний час проводяться вручну або дорогими роботами, що працюють з рідиною, і скоротити витрати.

Наступні кроки для команди MISL включають інтеграцію простої наскрізної автоматизованої системи з такими технологіями, як Purple Drop, а також з іншими технологіями, які дозволяють шукати молекули ДНК. Дослідники спеціально зробили свою автоматизовану систему модульною, щоб вона могла розвиватися у міру появи нових технологій для синтезу, секвенування та роботи з ДНК.

«Одна з переваг цієї системи полягає в тому, що якщо ми хочемо замінити одну з частин чимось новим, досконалішим чи швидшим, ми можемо просто підключити нову частину, — сказав Нгуєн. — Це дає нам більшу гнучкість на майбутнє».

Верхнє зображення: дослідники з Microsoft та Вашингтонського університету записали та вважали слово «привіт», використовуючи першу повністю автоматизовану систему зберігання даних у ДНК. Це ключовий крок для перенесення нової технології з лабораторій до комерційних центрів обробки даних.

Джерело: habr.com

Додати коментар або відгук