Биоинженеры распечатали книгу на молекулах ДНК и успешно прочитали ее
16 августа 2012 года
Американские биоинженеры "напечатали" книгу из 53 тысяч слов на молекулах ДНК, и прочитали ее при помощи устройства секвенирования, достигнув рекордной плотности записи информации на сегодняшний день, говорится в статье, опубликованной в журнале Science.
Молекулы ДНК представляют собой надежное устройство по хранению информации, хорошо защищенное от ошибок чтения и записи. Ученые пытаются приспособить их для хранения произвольных данных с 1988 года, когда американским биоинформатикам впервые удалось записать 7,9 килобайт информации на молекулу ДНК и прочитать ее.
Группа ученых под руководством Шрирама Косури (Sriram Kosuri) из Гарвардской медицинской школы в Бостоне (США) разработала особый компьютерный алгоритм, позволяющий сжать и подготовить для записи на молекулу ДНК практически неограниченный объем информации.
По этой методике данные разбиваются на куски одинаковой длины и записываются на короткие фрагменты ДНК длиной в 159 нуклеотидов. Каждый такой блок содержит 96 бит данных, 19 битный адрес блока и два фрагмента по 22 бита, кодирующих начало и конец "пакета" информации. В каждом случае один нуклеотид кодирует один бит данных - азотистые основания аденин (А) и цитозин (С) обозначают логическую "единицу", а гуанин (G) и тимин (T) - логический ноль.
При записи информации блоки синтезируются из отдельных нуклеотидов при помощи струйного ДНК-принтера. Наличие адреса у каждого блока позволяет хранить информацию в виде смеси из коротких последовательностей нуклеотидов, а не единой цепочки ДНК. Это позволяет хранить практически неограниченный объем информации, увеличивая длину адресной части блока.
Косури и его коллеги проверили свой алгоритм в деле, "напечатав" электронную версию книги "Регенезис: как синтетическая биология переизобретет природу и нас самих", написанной участником группы Джорджем Черчем (George Church) и писателем Эдом Реджисом (Ed Regis).
В общей сложности, электронная версия книги содержит в себе 5,27 мегабит (658 килобайт) информации, в том числе 53,5 тысячи слов, 11 картинок и 1 ява-скрипт. Ученые синтезировали необходимые фрагменты ДНК, смешали их, размножили и прочитали при помощи устройства секвенирования Illumina HiSeq.
По словам биоинженеров, алгоритм кодирования оказался очень эффективным - книга была считана всего с десятью ошибками на 5,27 мегабит данных.
Как утверждают авторы статьи, их технология имеет несколько других преимуществ, кроме неограниченной длины записи и устойчивости к ошибкам. Во-первых, использование нуклеотидов в качестве единичных битов позволяет достичь невероятно высокой плотности записи - 5,5 петабит на кубический миллиметр. Это больше аналогичной характеристики для флеш-памяти и жестких дисков в миллионы раз, и в сотни раз превышает плотность записи данных в квантовой голографии.
Ученые полагают, что такие характеристики ДНК-памяти могут помочь ей стать одним из основных способов хранения информации в архивах и для других целей, не требующих быстрого доступа к данным.