20.05.2020
Биохимики предложили новый метод записи информации на естественные молекулы ДНК, в котором кодирование происходит за счет положения места одноцепочечного разрыва. Запись информации в такую ячейку память застрахована от ошибок при кодировании и происходит гораздо быстрее, чем синтетическое кодирование нуклеотидами, однако пока что новый способ проигрывает в плотности записи. Статья опубликована в журнале Nature Communications.
Впервые идею о хранении цифровой информации в молекуле ДНК затронул в 1959 году американский физик Ричард Фейнман в своей лекции под названием «Внизу полным-полно места: приглашение в новый мир физики». Хранение информации на молекулах ДНК интересно за счет своей колоссальной информационной емкости — в прошлом году ученые записали 16 гигабайт текста английской версии Википедии в одной молекуле ДНК. Кодирование в таких системах происходит за счет синтеза молекулы из определенной последовательности нуклеотидов: аденина, тимина, цитозина и гуанина. Однако у этого подхода есть много ограничений и неудобств. За один цикл к молекуле ДНК добавляется только один нуклеотид, а потому процесс протекает значительное время и требует больших затрат относительно распространенных оптических и магнитных средств записи. Более того сам синтез подвержен ошибкам и даже при оптимальном процессе количество ошибок может достигать 21 процента.
Известные разрывные ферменты — никазы — способны распознавать и связывать только определенные последовательности в цепи ДНК, которые сильно ограничены их окружением. Например, разрывные эндонуклеазы признают только специфические последовательности длиной в шесть пар нуклеотидов, что ограничивает их использование для масштабной записи. Никаза SpCas9n пиогенного стрептококка (Streptococcus pyogenes) часто используется в генной инженерии, но для ее работы требуется два гуанина в цепи подряд, что ограничивает емкость в 16 раз. В качестве такого фермента биофизики предложили использовать фермент пирококка (Pyrococcus furiosus) PfAgo — высокоточный искусственный ограничительный фермент с возможностью расщепления на произвольных частях цепи ДНК. Этот фермент за время своего действия способен совершить сотни разрывов в отличие от SpCas9n и ранее уже использовался для сборки генома и распознавании цепи ДНК.
В качестве основы для записи ученые выделили ДНК бактерии кишечной палочки штамма K12 MG1655. При выборе длины цепочки в 450 пар азотистых оснований они руководствовались двумя ограничениями: не менее десяти позиций обрыва с промежутками не менее 25 нуклеотидов и отсутствие диссоциации между участками обрыва.
Для проверки качества записи биофизики закодировали Геттисбергскую речь Авраама Линкольна и фотографию мемориала Линкольна в двоичную последовательность из десятибитовых строк, в которой единица — наличие разрыва, а ноль — его отсутствие в возможном месте разрыва. Затем полученные строки переводили в позиционную систему для сжатия информации вдвое. Чтобы достичь быстрой и эффективной записи данных ученые для каждого регистра создавали библиотеку возможных направляющих фрагментов ДНК для фермента автоматизированной комбинацией вариантов.
Биофизики для хранения информации поместили регистры в сеть микропланшетов, которые обеспечивают произвольный доступ к регистрам и организуют доступ к данным, аналогично дорожкам на CD-дисках и магнитных лентах. Однако авторы признают, что такой метод хранения не годится для масштабируемого производства, тем не менее они надеются на разработку масштабируемых систем позиционного хранения данных с использованием МАЛДИ-пластин или микрофлюидных устройств. Чтобы своими силами улучшить емкостную способность позиционного хранения ученые предложили три варианта улучшения: использование в одной ячейке нескольких регистров, в которых крайне мало пересечение в последовательностях, введение специфичного разрыва в зависимости от цепи — увеличение емкости одного разрыва на 58 процентов, комбинаторное смешивание молекул одного регистра по специальным схемам.
Для считывания информации биофизики подвергали цепь ДНК денатурации и получали одноцепочечные молекулы ДНК с разной длиной в зависимости от положения разрыва. Эти последовательности они сравнивали с известной последовательностью регистра и выстраивали цепочку, определяли возможные позиции разрывов и присваивали ноль, если разрыв в этом потенциальном месте отсутствовал. В качестве неразрушающего метода считывания информации авторы рассмотрели два варианта: внедрение в разрыв флуоресцентного гена или прохождение молекулы ДНК сквозь двумерную нанопористую мембрану дисульфида молибдена — на зависимости ионного тока от времени отчетливо заметно положение одноцепочечного разрыва. А для подтверждения своей гипотезы они смоделировали прохождение молекулы ДНК через нанопору.
ДНК уже несколько лет используется в качестве экзотического средства записи. Два года назад группа Massive Attack к 20-летнему юбилею своего альбома «Mezzanine» записала его в ДНК.
https://yandex.ru/turbo/s/nplus1.ru/news/2020/04/17/dna-punch-card