Ученые говорят, что они сделали резкий шаг вперед в попытках хранить информацию в виде молекул ДНК.
Магнитные жесткие диски, которые мы в настоящее время используем для хранения компьютерных данных, могут занимать много места, и их также необходимо заменять по мере старения.
Использование предпочтительного для жизни носителя информации для резервного копирования наших ценных данных позволило бы архивировать огромные объемы информации в крошечных молекулах.
По словам ученых, этих данных хватит и на тысячи лет.
Команда из Атланты, США, теперь разработала чип, который, по их словам, может улучшить существующие формы хранения ДНК в 100 раз.
«Плотность функций в нашем новом чипе [примерно] в 100 раз выше, чем у современных коммерческих устройств», — сказал BBC News Николас Гиз, старший научный сотрудник Технологического исследовательского института Джорджии (GTRI).
«Итак, как только мы добавим всю управляющую электронику — что мы и будем делать в течение следующего года программы — мы ожидаем чего-то вроде 100-кратного улучшения по сравнению с существующей технологией хранения данных ДНК».
Технология работает, выращивая уникальные нити ДНК по одному строительному блоку за раз. Эти строительные блоки известны как основания — четыре различные химические единицы, составляющие молекулу ДНК.
- Ученые записывают пленку в ДНК бактерий
Основания, иногда называемые буквами ДНК, затем могут использоваться для кодирования информации способом, аналогичным последовательностям единиц и нулей (двоичный код), которые несут данные в традиционных вычислениях.
Существуют различные потенциальные способы хранения этой информации в ДНК — например, ноль в двоичном коде может быть представлен основаниями аденином или цитозином, а один — гуанином или тимином. В качестве альтернативы, единицу и ноль можно сопоставить только с двумя из четырех баз.
Все это часть проекта между GTRI и другими партнерами, который называется SMASH (Программное и аппаратное обеспечение масштабируемого молекулярного архивирования).
Ученые заявили, что, если его отформатировать в ДНК, каждый когда-либо снятый фильм может уместиться в объеме меньше кубика сахара.
Учитывая, насколько она компактна и надежна, неудивительно, что в настоящее время существует широкий интерес к ДНК как к следующему средству для архивирования данных, которые необходимо хранить неограниченное время.
Структуры на чипе, используемые для выращивания ДНК, называются микролунками и имеют глубину в несколько сотен нанометров — меньше толщины листа бумаги.
Текущий прототип микрочипа имеет квадрат около 2,5 см (один дюйм) и включает в себя несколько микролунок, что позволяет синтезировать несколько цепей ДНК параллельно. Это позволит вырастить большее количество ДНК за более короткий промежуток времени.
После того, как последовательность химических оснований, хранящих данные, будет завершена, нити ДНК будут удалены с поверхности и высушены для длительного хранения.
Поскольку это прототип, еще не все микролунки подключены. Это означает, что общий объем данных ДНК, который может быть записан с помощью этого конкретного чипа, в настоящее время меньше, чем то, что ведущие компании по синтезу могут произвести на коммерческих чипах.
Однако, как объяснил доктор Гиз, когда все наладится, это изменится.
«Для сравнения: самая большая опубликованная демонстрация хранения цифровых данных ДНК составляет [около] 200 МБ (мегабайт), выполненная группой из Вашингтонского университета и Microsoft (Organick et al., 2018). Для написания всей ДНК для этой демонстрации потребовалось несколько работает на чипах коммерческого синтеза «, — сказал он BBC News.
«Один цикл синтеза для целей хранения данных обычно занимает около 24 часов — это зависит только от длины цепочек ДНК, которые вы пишете, а не количества цепей, которые вы пишете параллельно. С нашими новыми чипами мы в принципе сможем записать примерно в 100 раз больше данных ДНК, чем текущая запись, за то же время ».
Одна из проблем, над решением которой работают специалисты, — это высокая стоимость хранения ДНК. До сих пор это ограничивало технологию «бутиковых клиентов», например тех, кто хочет архивировать информацию в капсулах времени.
Команда GTRI считает, что их работа может помочь изменить кривую затрат. Он установил партнерские отношения с двумя калифорнийскими биотехнологическими компаниями, чтобы продемонстрировать коммерчески жизнеспособную технологию. Компания Twist Bioscience из Сан-Франциско работает над методами «записи» или синтеза ДНК. Компания Roswell Biotechnologies из Сан-Диего предоставит технологию для «чтения» ДНК.
Хранилище данных ДНК изначально не заменит серверные фермы для информации, к которой нужно обращаться быстро и часто. Из-за времени, необходимого для чтения последовательности, этот метод был бы наиболее полезен для информации, которая должна оставаться доступной в течение длительного времени, но доступ к которой осуществляется нечасто.
Этот тип данных в настоящее время хранится на магнитных лентах, которые следует заменять каждые 10 лет.
Однако с ДНК, «пока вы поддерживаете достаточно низкую температуру, данные будут сохраняться в течение тысяч лет, поэтому стоимость владения упадет почти до нуля», — пояснил доктор Гиз.
«Записать ДНК один раз вначале и затем прочитать ДНК в конце стоит очень дорого. Если мы сможем добиться, чтобы стоимость этой технологии была конкурентоспособной со стоимостью записи данных магнитным способом, то стоимость хранения и хранения информации в ДНК через много лет должно быть ниже ».
Еще один недостаток хранения данных в ДНК — более высокая частота ошибок — значительно выше, чем то, что компьютерные инженеры терпели бы с обычным хранилищем на жестких дисках.
В сотрудничестве с Вашингтонским университетом исследователи GTRI придумали способ выявления и исправления этих ошибок для защиты данных.
Работа была поддержана Проектом перспективных исследований разведки (IARPA), который поддерживает науку, которая преодолевает проблемы, актуальные для разведывательного сообщества США.