В прошлом году компания Microsoft рассказала о своих исследованиях, посвященных разработке ДНК-хранилищ. Ученые заявили, что их технология позволит хранить данные дата-центра в нескольких кубах сахара. И вот на прошлой неделе сотрудник Microsoft Research Даг Кармин (Doug Carmean) сказал, что компания планирует внедрить в одном из своих ЦОД устройство хранения на основе ДНК к 2020 году.
Над новым проектом работает исследовательское подразделение компании Microsoft Research, ученым из которого удалось записать на искусственные спирали ДНК 200 мегабайт данных. В молекулы дезоксирибонуклеиновой кислоты записали музыкальный клип в высоком разрешении, Всеобщую декларацию прав человека, переведенную на 100 языков и первые сто книг в списке проекта «Гутенберг».
Microsoft использует метод, предложенный специалистами из Гарварда, которые отказались от работы с живыми организмами — теперь синтетическая ДНК внедряется в молекулу, сгенерированную на специальном ДНК-чипе.
Сначала единицы и нули двоичного кода переводятся в комбинации нуклеотидов — аденин, гуанин, цитозин и тимин. Затем, выполняется синтез искусственной ДНК со всеми этими данными. Для определения конца и начала записываемых файлов в молекулу ДНК вводятся специальные маркеры. Из электронной версии сформированной последовательности компания-подрядчик Twist Bioscience синтезирует фрагменты ДНК длиной в 150 нуклеотидов каждый. Всего для записи понадобилось порядка 1,5 млрд азотистых оснований.
Даг Кармин говорит, что разрабатываемая ими система будет сопоставима по размерам с крупными копировальными аппаратами от Xerox 70-х годов прошлого века. Скорость записи данных пока что составляет всего 400 байт в секунду. Для считывания данных с ДНК используются секвенаторы.
Сейчас массовому внедрению систем хранения данных на основе ДНК препятствуют дороговизна технологии и низкие скорости чтения/записи информации. В Microsoft считают, что для успешного коммерческого внедрения решения необходимо удешевить его в 10 тыс. раз и увеличить скорость записи до 100 мегабайт в секунду.
Однако при этом в компании убеждены, что даже удвоения скорости чтения данных с ДНК будет достаточно, чтобы создать коммерческий продукт для определенных ситуаций, например архивирования важной медицинской информации. Также исследователи из Microsoft ставят перед собой более амбициозную цель — заменить ДНК-носителями магнитную ленту, до сих пор использующуюся сегодня для длительного хранения информации.
P.S. Другие материалы из Первого блога о корпоративном IaaS:
- Резервное копирование, клонирование и восстановление данных с помощью инструментов NetApp и VMware. Часть 1
- Резервное копирование, клонирование и восстановление данных с помощью инструментов NetApp и VMware. Часть 2
- Облачные технологии в киноиндустрии: как DreamWorks решила проблему обработки больших объемов данных
- Хостинг персональных данных в облаке— особенности услуги
- Репликация данных в облако NetApp сервис-провайдера
- Зарубежное или локальное размещение данных в облаке: подводные камни
Автор: it_man