Способность ДНК хранить информацию получает обновление


Команда междисциплинарных исследователей открыла новый метод хранения информации в ДНК — в данном случае «Волшебник страны Оз», переведенный на эсперанто, — с беспрецедентной точностью и эффективностью. Этот метод использует способность хранения информации переплетенных цепочек ДНК для кодирования и извлечения информации таким образом, чтобы она была прочной и компактной.

Этот метод описан в статье, опубликованной на этой неделе в журнале Proceedings of the National Academy of Sciences .

«Ключевым достижением является алгоритм кодирования, который позволяет точно извлекать информацию, даже если нити ДНК частично повреждены во время хранения», — сказал Илья Финкельштейн, доцент кафедры молекулярной биологии и один из авторов исследования.

/ p>

Люди создают информацию с экспоненциально большей скоростью, чем мы привыкли, что способствует потребности в способе эффективного хранения большего количества информации таким образом, чтобы она сохранялась долгое время. Такие компании, как Google и Microsoft, входят в число тех, кто исследует использование ДНК для хранения информации.

«Нам нужен способ хранения этих данных, чтобы они были доступны, когда и где это необходимо, в удобочитаемом формате», — сказал Стивен Джонс, ученый-исследователь, который сотрудничал над проектом с Финкельштейном; Билл Пресс, профессор информатики и интегративной биологии; и к.т.н. выпускник Джон Хокинс. «Эта идея использует преимущества того, что биология делала на протяжении миллиардов лет: хранение большого количества информации в очень маленьком пространстве, которое длится долгое время. ДНК не занимает много места, ее можно хранить при комнатной температуре, и она может длиться сотни тысяч лет «

ДНК примерно в 5 миллионов раз эффективнее существующих методов хранения. Другими словами, капля ДНК в один миллилитр может хранить такой же объем информации, как два Walmarts, заполненные серверами данных. И ДНК не требует постоянного охлаждения и жестких дисков, которые подвержены механическим сбоям.

Есть только одна проблема: ДНК подвержена ошибкам. А когда в генетическом коде есть ошибки, это сильно отличается от ошибок в компьютерном коде. Ошибки в компьютерных кодах, как правило, проявляются в виде белых пятен. Ошибки в последовательностях ДНК проявляются как вставки или удаления. Проблема в том, что когда что-то удаляется или добавляется в ДНК, вся последовательность сдвигается, и нет пустых пятен, чтобы кого-то предупредить.

Раньше, когда информация хранилась в ДНК, фрагмент информации, который нужно было сохранить, например абзац из романа, повторялся от 10 до 15 раз. Когда информация была прочитана, повторения сравнивались, чтобы исключить любые вставки или удаления.

«Мы нашли способ построить информацию, больше похожую на решетку», — сказал Джонс. «Каждый фрагмент информации подкрепляет другие фрагменты информации. Таким образом, его нужно прочитать только один раз».

Язык, разработанный исследователями, также позволяет избежать участков ДНК, которые подвержены ошибкам или трудночитаемы. Параметры языка также могут изменяться в зависимости от типа хранимой информации. Например, пропущенное слово в романе не так важно, как пропущенный ноль в налоговой декларации.

Чтобы продемонстрировать извлечение информации из деградированной ДНК, команда подвергла код «Волшебник страны Оз» воздействию высоких температур и экстремальной влажности. Несмотря на то, что нити ДНК были повреждены в этих суровых условиях, вся информация по-прежнему успешно декодировалась.

«Мы пытались решить как можно больше проблем с процессом одновременно», — сказал Хокинс, недавно работавший в Оденском институте вычислительной техники и наук UT. «То, что у нас получилось, весьма примечательно».


Добавить комментарий