С каждым годом информации становится все больше: ее настолько много, что однажды нам может не хватить привычных носителей вроде SSD и HHD. Что придет им на смену? Ученые считают, что наиболее важную информацию можно научиться записывать, например, в ДНК. О фантастических (пока что) перспективах подобных технологий рассказывает профессор Массачусетского Технологического Института Джо Дэвис в лекции в рамках программы Moove от Сколково&МТС.

Друзья, то, что вы видите — результат сканирования компьютерным томографом иглы в яйце. Вы узнаете этот мем, посвященный Кощею Бессмертному. Мы про него еще вспомним.

В общем, мы с вами будем говорить про археи и астры (имеется в виду выражение per aspera ad astra — через тернии к звездам). И про звездные дали, с которыми мы ассоциируем наше будущее. И про пучины древности, о которых мы можем узнать больше, анализируя мир архей.

В Массачусетском Технологическом Институте (MIT) мы часто используем такой образ, как «попытка напиться из пожарного гидранта». Это выражение появилось еще в 80-х годах, когда не было ни смартфонов, ни интернета, а выражение уже существовало. В каком-то смысле мы продолжаем пить из гидранта, но напор воды растет с каждым годом.

С 2010 года очень резко рос объем производства цифровых данных, превосходя массу других параметров на нашей с вами планете. На графике показано, сколько было произведено данных, если считать в зеттабайтах. Обратите внимание: к 2025 году прогнозируется, что общий объем информации достигнет 160-ти зеттабайт.

Один зеттабайт — это один миллиард терабайтов

В каком-то смысле нас ждет кризис в области систем хранения данных и в области ЦОДов (центров обработки данных), которые должны и дальше обрабатывать все эти данные. Ожидается, что спрос на цифровые данные существенно превзойдет имеющиеся у нас запасы кремния. И хотя кремния у нас много — даже этих запасов не хватит. Без прорывных технологий для хранения можно предположить, что всех существующих средств хранения данных типа Blu-Ray, SDD, HDD просто не хватит для всей информации.

Большая часть генерируемых данных, конечно, ничего не стоит и выбрасывается, но какие-то сохранению подлежат. Если мы совместим эти тренды, то станет понятно, что доля данных, которые мы можем хранить с каждым годом, будет снижаться. Неудивительно, что в этих условиях проводится масса исследований на тему того, как бы мы могли научиться фиксировать важную для нас информацию иначе, а особенно — приобрести навык записи, например, в ДНК.

Вот обзор мета-исследования 2018-го года, посвященного различным барьерам в области использования ДНК для хранения данных. Здесь мы ссылаемся на исследования группы из Microsoft и Apple. Стоит подчеркнуть, что в свое время с Джеффом Нивала я несколько лет проработал в одной лаборатории.

Авторы этой работы указывают на три основных фактора, определяющих наши возможности по хранению данных: плотность данных, долговечность систем хранения, и, наконец, энергетические затраты — как на запись данных, так и на поддержание этих данных в доступном виде.


Использование ДНК поможет нам хранить в шесть раз больше информации в расчете на 1 см³. Это больше, чем самые современные полупроводниковые технологии. ДНК позволит хранить гигантские объемы информации с минимальными затратами. Реальные расходы энергии практически смехотворны. Но необходимо сравнить ДНК и с другими технологиями: например, трехмерное (объемное) оптическое хранение данных.

В конце восьмидесятых годов Питер Рентзепис доказал, что возбуждение двух фотонов дает нам возможность трехмерного хранения данных, которое используют все существующие на сегодняшний день системы, разработанные в развитии идеи Рентзеписа. Их можно производить за счет сплава элементов кварца. Они будут иметь свойства мощности и хранения, сравнимые с дисками Blu-Ray.

Главным недостатком этой технологии является ее высокая стоимость, чем и объясняется отсутствие коммерческого предложения. Вы можете возразить, ведь есть 3D оптическая память, которая может быть произведена в больших объемах. Однако никакой антропогенный механизм производства не может дать нам те масштабы, которые придумала природа. Этим я занимался еще в семидесятых годах, в рамках исследовательской группы Питера Рентзеписа в Нью-Джерси.

История показала, насколько надежной является система хранения данных в ДНК

Даже если вы следуете самым консервативным теориям, вы должны признать, что формы жизни с ДНК существуют на нашей планете как минимум четыре миллиарда лет. Ну, и собственно ионная масс-спектрометрия позволяет нам детальнее изучать и делать выводы о том, как менялись конкретные бактерии-носители этих ДНК.

Кстати говоря, наши наблюдения показывают, что ДНК, защищенный от внешних раздражителей (включая свет), может храниться при определенных температурах в течение миллионов лет. Возможно, нужна будет и защита от радиации.

Смотрите, придуманные нами системы хранения (например, ленточные библиотеки) данных обычно имеют срок полезной службы несколько десятков лет, а у ДНК счет идет на миллионы лет. При том, что наши системы также отличаются и низкой механической надежностью, и представляют серьезную угрозу для окружающей среды.


Устаревание — одна из актуальных проблем. Можно взять в пример библиотеку Американского Конгресса, где значительная часть бюджета уходит на конвертацию данных из более старых источников в современные системы ленточного хранения. Они, конечно, отличаются некоторой обратной совместимостью, но она охватывает только несколько последних поколений. Базовые процессы хранения ДНК, предполагающие кодирование информации и запись последовательностей аминокислот в конкретные носители, позволяют нам использовать ДНК как библиотеки, и далее получать к ним доступ, извлекать нужную информацию, кодировать и декодировать.

Незадолго до начала карантина я думал о том, что было бы здорово разработать USB процессор, который мог бы выполнять большую часть всех этих операций. Это было бы устройство размером с комнату. Я даже придумал, как его сделать излишне сложным: умудрился вставить все «свистелки» (bells and whistles).

Кто-то, может, помнит мой проект Microvenus восьмидесятых годов, посвященный визуализации идей хранения информации в ДНК. Ребята из Нью-Йоркского университета написали, что «именно этот проект Джо Дэвиса фактически стал первым опытом такого рода». Тогда было записано тридцать пять генов.

Это ДНК-синтезатор из восьмидесятых. Сейчас он выставляется в музее науки в Лондоне. Тогда он работал на восьмидюймовых дискетах. Там было два блока: химический блок отвечал за сборку ДНК, в то время как компьютерный блок контролировал ход реакции и использовался для дальнейшей конфигурации химического блока.

На самом деле, еще до появления моего проекта Microvenus определенные связки двоичного и химического кода уже существовали. Конечно, тогда использовались очень неустойчивые реагенты, и для обслуживания таких устройств требовались только высококлассные специалисты.

Кстати говоря, эта машина смогла в пятнадцать раз ускорить процедуру кодирования информации в ДНК. Стоило это устройство около $15 000, а для того, чтобы синтезировать Microvenus, в 1986 году требовалось 84 часа, и три часа уходило только на добавку каждого нуклеотида. Появившиеся обновления для таких устройств уже в начале девяностых годов сильно демократизировали эту сферу. Выяснилось, что можно использовать гораздо менее грамотных специалистов. Настоящая коммерциализация этой сферы началась в 1989 году.

Vega Coder 300, который использовался в Га...

Vega Coder 300, который использовался в Гарвардской школе медицины для работы над проектом

Даже ранние машины такого рода предполагали использование компьютерного интерфейса: здесь еще стоит старый CRT-дисплей

В свое время я вдохновлялся работой коллег из программы «Сети», которые придумывали сообщения для инопланетян. Вы можете вспомнить астронома Френсиса Дрейка, который с телескопа в обсерватории Аресибо послал состоящее из простых чисел сообщение, которое мог бы прочитать инопланетный математик. Организовав слова в массивы, инопланетяне смогли бы извлечь нужную информацию. У нас тоже использовался определенный набор простых чисел. И каждая база нуклеотидов здесь шифровала определенный фазовый переход в двоичной системе.

Далее мы зашифровали 18-ти мерное сообщение, используя 10-ти мерный ключ для дешифровки. Таким образом, у нас получилась 28-ми мерная молекула ДНК!


Конечно, идеи о том, как еще можно использовать ДНК, появились задолго до проекта Microvenus. Известный физик MIT Норберт Винер за четверть века до моего проекта предсказал возможность использовать ДНК для хранения информации. Параллельно с этим советский ученый Михаил Найман писал в журнале «Радиотехника» о том, как можно использовать эти идеи в области радиоэлектроники.

Интересно, что некоторые даже пытались игнорировать вклад в эту тему Нобелевских лауреатов Джорджа Бидла и Макса Дельбрука, которые еще в 1958 году писали о том, как можно шифровать английские тексты в ДНК. Надо сказать, что их идеи были изложены в примечаниях к двум книгам: биографии Макса Дельбрука и их совместной книге. Для них эти идеи не были такими важными, они их привели в сносках, не более того. Еще в 1946 году, выступая в Университете Рокфеллера, Дельбрук говорил о том, что «любая живая клетка несет в себе опыт миллиардов лет экспериментирования ее предков».

Конечно, в те годы синтез ДНК был гораздо менее удобным и простым делом, чем сейчас

При всем этом, Дельбрук и Бидл обмени...

При всем этом, Дельбрук и Бидл обменивались телеграммами, написанными вот таким шифром

Кажется, в 1947 году Дельбрук отправил телеграмму, в которой использовались четыре буквы. В инструкции для расшифровки было указано, что в имени Макс (англ. Max) пропущена последняя буква «X». Бидлу потребовалось несколько дней, чтобы расшифровать телеграмму, но ответил он в итоге таким же шифром.

Дальше коллеги из Caltech придумали вот такую графическую модель, где они использовали разноцветные зубочистки для того, чтобы зашифровать следующий текст: «Я — загадка жизни, познай меня, и ты познаешь себя». Однако только к концу 80-х годов появились подходящие технологии для реального синтеза ДНК.

Я впервые синтезировал молекулы, соответствующие той самой загадке жизни Дельбрука и Бидла, в 1994 году. В том же году мы отправили бактерию с соответствующим ДНК нашим коллегам. Ее дешифровали и извлекли в трех лабораториях Берлина.

Во время проекта я вдохновлялся тем, что послания Дельбрука имеют древние исторические корни: то же самое написано на храме Аполлона в древнегреческом городе Дельфы.

Вот уже в девяностых годах я пришел в Лабораторию MIT. Кому-то из моих коллег казалось, что мои проекты того времени имеют в первую очередь художественную ценность. Однако к концу девяностых годов Американское Министерство Обороны всерьез заинтересовалось нашей работой, когда выяснилось, что мы легко можем зашифровать в ДНК важное сообщение. В качестве такого шифротекста выбрали послание, с которого началась операция в Нормандии 1944 года.

В 2012 году Джордж Черч с коллегами показали, как можно шифровать по 5.5 петабайт данных на грамм ДНК. Их книга стала первой, напечатанной в формате ДНК.

В 2013 году группа товарищей смогла зашифровать все сонеты Шекспира, несколько фотографий, и 26-ти секундный отрывок из речи Мартина Лютера Кинга Младшего «I have a dream» в ДНК микроба. Ставки резко выросли, и гонка ускорилась.

В 2016 году ребята из Microsoft Research университета Вашингтона вместе с каким-то стартапом из Сан-Франциско опубликовали свою работу, посвященную системе хранения данных на основе ДНК. Там они использовали полупроводниковую систему, которая позволяла существенно ускорять шифровку ДНК. В итоге они зашифровали 260 Мб информации. Туда попали разные документы: декларация прав человека на сотне разных языков, часть баз данных Гутенберга и прочее. Тогда коллеги заявили, что вполне реально хранить в десятках миллиграммов ДНК невозможное количество данных.

В 2016 году фильм «Путешествие на Луну» 1902-го года стал первым, зашифрованным в формат ДНК; за данный проект отвечала французская компания Technicolor.

Метод DNA Fountain был представлен широкой публике в 2017 году. Он стал результатом работы ученых Зелински и Эрлиха. Интересно, что инструменты шифрования, которым воспользовались исследователи, ждали своего часа почти 20 лет. Они смогли записать в один грамм ДНК 215 петабайт данных. Они туда поместили один из первых фильмов «Приход поезда», манускрипт Шеннона, посвященный теории информации.

Следующий наш персонаж — Надриан Симэн. Он работает в Нью-Йоркском университете, и он придумал другой инструмент кодирования информации ДНК: его техника позволяет записывать в ДНК объемную информацию. В данном случае используется способность формирующих ДНК нуклеотидов к образованию базовых пар. Симэн осознал, что такое легко предсказуемое поведение нуклеотидов можно использовать в наших интересах — для того чтобы формировать трехмерные объекты практически любой геометрии. В 94-ом году он сформировал кубик, за который получил награду имени Ричарда Файнмана. Тут надо отметить, что мы вместе работали в лаборатории Черчя в MIT.

Пол Ротмунд из Caltech улучшил технологию ДНК-оригами. Он использовал цепочку, состоящую из 7000 элементов, для того чтобы свернуть ее в самые разные геометрические фигуры. Она не очень эффективна с точки зрения плотности хранения информации, но можно восхититься ее эстетическими свойствами.

В 2012 году появилась еще одна интересная техника, которую разработали Брайн Вай с коллегами в Институте Висс. Они создали самособираемый ДНК-алфавит. Надо сказать, что надежность работы этой техники очень низкая, порядка 12-17%. Во всех остальных случаях нуклеотиды не складываются в нужную последовательность. Когда говорят о технике оригами из ДНК, конечно, не имеют в виду что-то реально похожее на японскую технику оригами.

Однако и мой недавний проект был посвящен такому трехмерному кодированию информации ДНК. Мне было интересно посмотреть, как можно использовать двухмерные инструменты для создания трехмерных структур. Это ведь был по сути первый проект трехмерного ДНК. Здесь мы создавали на базе ДНК двойную цепочку. Для того, чтобы ту же самую информацию записать в двоичном коде, потребовалось около 28 000 битов. Но я был уверен, что мы можем очень резко снизить потребность в объеме хранения просто за счет использования этой техники.

В прошлом году я ездил в Бангалор, где встречался с тремя коллегами. Мы с ними допоздна обсуждали интересные задачки нашей науки.

Мы вместе вывели одну формулу: здесь есть паттерн вместе с инструкциями по свертке, который можно записать буквально 84-мя битами.

Дальше мы синтезировали ДНК в Гарварде, отправили результаты в Индию, там было произведено клонирование в бактериальном материале. Авторы статьи в Nature Review (?) утверждают, что разработка новых технологий синтеза бактериальных ДНК также вызывает появление новых технологий хранения данных в ДНК, а дальше должны появиться технологии дешифровки данных, которые, видимо, будут различаться по своей сложности. Здорово, что информация, зашифрованная в ДНК, имеет много уровней избыточности. Механизмы делеции встроены в то, как работает ДНК, которое устроено так, что там предусмотрена избыточность как физическая, так и логическая. За счет этого информация, зашифрованная в ДНК, достаточно хорошо защищена и от внешнего воздействия, и от ошибок воспроизведения.

Даже авторы технологии шифрования RSA в свое время вдохновлялись тем, как работает ДНК. Мои коллеги Джефф Нивала и Сэт Шипман были рады презентовать на TEDx в Бостоне еще одну технологию хранения данных в ДНК. Сразу могу сказать, что этот проект был результатом работы в первую очередь не моей, а моих коллег. Подобно тому, как наши предки оставляли рисунки на стенах пещер, мои коллеги решили оставить рисунок человеческой руки, записанной при помощи технологии редактирования генов CRISPR. Эта технология позволяет нам бороться с некоторыми генетическими заболеваниями за счет редактирования генома живого существа. Известная гифка с человеком на лошади была успешно зашифрована и извлечена из ДНК, что показало о возможности использования данных техник для создания клеточных записывающих устройств.

Технология CRISPR-Cas — это система, запоминающая ДНК и РНК, которая дает возможность их редактировать

В то время как комплекс Cas1 и Cas2, так называемый интегратор, используется для интегрирования небольших участков интересующих нас ДНК в препарируемый геном.

Надо сказать, что новые внедряемые элементы обычно ставятся выше старых проектов. Процесс записи Cas1 и Cas2 может быть заново использован, с каждым проходом можно вносить новые данные. Очевидно, что у всех этих инструментов записи очень многообещающее будущее в различных сферах науки.

На этом графике вы можете увидеть все попытки записать цифровые данные ДНК в In Vivo проектах.

Все эти проекты были посвящены фиксации интересующей нас информации в живых клетках. И этот переход к In Vitro решениям объясняется тем, что, по мнению исследователей, они будут иметь больший коммерческий и мейнстримный успех в силу большего размера. Наверное, этим объясняется то, что проводилось не так много тестов, посвященных разработке более устойчивых решений на базе живых клеток.

Здесь видите Габриэла Филсингера, который должен был проиллюстрировать идею того, что немногие находят смелость проводить подобные проекты. Кстати говоря, клетки не должны оставаться в одном месте, и для воспроизводства им не нужно человеческое вмешательство, поэтому в долгосрочной перспективе получится, что даже относительно невысокая плотность более не будет проблемой, поскольку клетки прекрасно делятся.

Мы продолжаем осваивать эту сложную науку внесения устойчивых и неразмывающихся с репродукционными циклами изменений

И мне кажется, мы движемся в правильном направлении. И проблемы, связанные с сохранением данных In Vivo, остаются сложными. Большие объемы, выбранной нами ДНК-информации, невозможно записывать одновременно, нужно делать это рационно. Опять же, со временем популяции могут пытаться проводить, домять какие-то элементы этой информации. Опять же, все равно будут работать какие-то механизмы делеции. Используемые нами инструменты должны быть еще биологически и биохимически совместимы так, чтобы не возникало конфликтов с носителями. В идеале, если мы добьемся того, к чему стремимся, то сможем «писать двумя руками»: биологическими механизмами воспроизведения информации, и биохимическими.

Некоторые проекты, в том числе и мои, были построены на дегенеративной природе этого информационного кода. Здесь мы показываем, как мы маркировали избыточные пары нуклеотидов разными способами. Дальше мы пришли к выводу, что любую молекулу можно описать в двоичном коде. В каждом из этих трех бинарных кодов можно сопоставить достаточно большой объем информации, и такая система хотя бы теоретически обеспечивает возможность хранения большого объема данных внутри гена, не вызывая существенного увеличения длины цепочки.

Вот еще пример: мы видим ключ для суперкода в двадцатеричной базе. В данном случае используется мононуклеоитидный кодон. Очевидно, что здесь мы наблюдаем РНК-код. Эти четыре мононуклеоитидных кодона и четыре стоп-кодона дают нам возможность использовать для кодирования еще 57 кодонов, если мы считаем, что всего их 64. Можем использовать эти 57 кодонов для того, чтобы указывать количество повторов, например. Конечно, трудно читать подобные записи, используя традиционные инструменты. Я могу себе представить электромеханическую торсионную (?) систему, которая позволит нам обойти это ограничение. За счет этого мы сможем разложить суперкод на легко читаемую последовательность кодов.

В девяностых годах я использовал аналогичный ДНК-суперкод для того, чтобы закодировать того самого специалиста NASA. Здесь, как вы понимаете, зашифрована какая-то информация про нашу галактику Млечный Путь. Мы как раз тогда получили первые снимки нашей галактики. Этот суперкод предполагал возможность частичной компрессии данных, и позволял включать какие-то дополнительные элементы, которые мы называем рестрикшн-сайды (?). То есть отдельные молекулы можно было бы удалить, провести редактуру, исправить ошибки, бороться с механизмами делеции.

В 2018 году коллеги из Кореи опубликовали технологию, позволившую им использовать на базу три с половиной бита, таким образом, побив почти вдвое предыдущий рекорд. Они пишут, что во многом вдохновлялись работами исследователя Корниша-Баудена из Бирмингема, посвященными поведению дегенеративных баз в определенных ситуациях.

Подрезюмирую: была проведена масса разных экспериментов, в которых цифровая информация шифровалась в виде ДНК. При этом обычная ДНК легко может быть поглощена бактериями в естественной их среде. Более того, специально использовавшиеся лабораторные образцы ослаблялись исследователями. Надежнее всего хранить информацию в ДНК живого существа. Немножко странно применить такие технологии к решению современных проблем, связанных с недостатком систем хранения и обработки данных. Однако кризиса, о котором я говорил в начале, нам с вами не избежать. Можно создать специальные репозитарии знаний, которые могут пережить человечество.

Ископаемые доказательства указывают на то, что легко и неожиданно могут исчезнуть млекопитающие виды. Мы можем вспомнить, что наши предки неандертальцы успешно существовали буквально 300 тысяч лет, в то время как человек прямоходящий находился на этой земле около полутора миллионов лет. Ученые продолжают спорить на тему того, долго ли мы будем еще засорять эту планету своим существованием. Есть разные прогнозы о том, как человечество уничтожит само себя. Кто-то говорит, что осталась пара десятилетий, и даже самые оптимистичные прогнозы дают нам не больше семи с половиной миллионов лет на этой планете. Хомо Сапиенсы в какой-то степени уникальны, мы имеем большее понимание своей смертности и недолговечности наших близких. Это знание кого-то вдохновляет на создание произведений искусства, что после вдохновляет и наших потомков. Закономерный вопрос: а что человечество может оставить после себя в настоящее наследство? Больше, чем на пару тысяч лет.

Своим проектом Microvenus я публично задался вопросом о том, можем ли мы отправить информацию о себе на сотни миллионов километров, и на световые годы

Этот проект был первым произведением искусства, созданным с помощью редактирования ДНК, и параллельно первым проектом межгалактического свойства. Здесь полезно вспомнить, что наша галактика даже по консервативным оценкам в поперечнике имеет длину более ста световых лет. И если бы Митохондриальная Ева собрала все необходимые технологии для того, чтобы отправить какое-то послание, которое кто-то бы получил на другом конце галактики и тут же на него ответил, то этот ответ до нас бы даже не успел дойти.

В каком-то смысле можно сказать, что для хранения данных в микробиальной или бактериальной ДНК будут актуальны те же самые требования: информация должна храниться долго и с минимальными затратами. Перспективы впечатляющие: ведь ДНК может выносить и очень жесткие температуры, и даже условия, близкие к космическому вакууму.

Здесь хочется рассказать про галобактерию Солинарум. На самом деле, это не совсем бактерия, а архей, который известен своей устойчивостью к радиации. Ребята из университета Мэриленда пятнадцать лет назад писали: «мы смогли разбомбить радиацией ДНК галобактерии, потом разобрали и собрали обратно, чтобы все работало, буквально за пару часов». Причем, чтоб развалить бактерию, пришлось подвергнуть ее сильному облучению. Это неудивительно, ведь галобактерии выдерживают большой перепад температур, могут существовать в условиях практически полного отсутствия влаги, прекрасно выдерживают ультрафиолет, очень здорово ведут себя в условиях микрогравитации. С апреля 1994 по январь 1995 на МКС коллеги из NASA подвергали такому космическому воздействию эти бактерии. Биопэн размещался на посадочном модуле фотон Роскосмоса. Также в 2008-2009 году эти бактерии подвергались экспериментам в составе блока Коламбус.

Я использовал ядовитый газ оксид этилена для стерилизации, он убивает массу бактерий, но мои эксперименты показали, что эти бактерии могут переживать достаточно большую концентрацию этого газа в течение 36-ти часов. Не все выживали, но смертность была существенно ниже ста процентов. Я даже могу сказать, что я нашел образцы в метеоритах, которые демонстрируют аналогичную устойчивость к оксиду этилена. Но об этом в другой раз.

Здесь я подвергаю стерилизации пламенем те же несчастные археи в течение двух минут.

Я специально ходил по модным органическим магазинам и искал минеральные соли, в некоторых солях есть эта бактерия, она придает им яркий цвет.

Меня, конечно, удивили мои находки, как выяснилось, я выращивал существа из геологических слоев возрастом 250 миллионов лет. Как раз в конце палеозоя, когда очень много было тектонических движений, большое количество внутренних морей перевернулось, а сверху они были покрыты лавой и осадочными породами. Есть некоторые исследования, которые показывают, что некоторые из этих бактерий могли прожить даже больше, чуть ли не 750 миллионов лет.

После этого я начал целую экспедицию в целях поиска древних образцов минеральных солей, и вместе с геологами искал массу образцов солей, которые после их формирования, сотни миллионов лет назад, ни разу не проходили процесс разжижения и рекристаллизации. Здесь мы видим образцы ордовикских солей из шахты Каюга в штате Нью-Йорк. В общем, эти ребята из царства археев могут пережить, что угодно. Даже те события, в которых исчезала масса существ. Есть даже такая легенда, что философский камень мог не просто превратить рядовой металл в золото, но и подарить вечную жизнь.

Можно сказать, я нашел свой философский камень, а состоит он из соли

Этот зонд летит в направлении Альдебарана, до которого еще 68 световых лет. Не строго к Альдебарану, конечно, он летит. Если бы у него была нулевая скорость относительно нас, то понадобилось бы два миллиона световых лет. И это Пионер-10, один из самых быстрых предметов во Вселенной. Он сейчас летит со скоростью 2.5 а.е. в год. Он уже находится на расстоянии 270 тысяч а.е. от Proxima Centauri. Если бы он летел туда, то добрался бы за 106-107 тысяч световых лет. А мы как Хомо Сапиенсы меньшее количество времени существуем, в отличие от других гоминидов.

Мы реально даже не знаем, сколько уникальных звездных систем существует от нас на большем расстоянии, чем 6070 световых лет. Ну, и добраться до них при помощи нынешних технологий мы не можем. Смешно рассчитывать, что мы сможем поймать от них какие-то сообщения. Однако вот такие технологии позволят нам оставить какое-то сообщение, и отправить его.

При этом кажется, что Земля вполне может пережить человечество, и остаться пригодной для существования каких-то нечеловеческих живых форм в течение долгого промежутка времени. Очень хочется на это надеяться.

В прошлом году меня пригласили на Уральскую биеннале в Екатеринбурге как одного из участников секции по бессмертию. Плюс я прочитал несколько курсов в университете Кентукки, где познакомился с профессором Дмитрием Сороковским. Он — иммигрант в первом поколении. Он меня познакомил с таким персонажем, как Кощей Бессмертный. Согласно вашим легендам, Кощей голым разъезжает на своей лошади по лесам, ворует красивых девчонок, и он считается бессмертным потому, что спрятал свою душу на кончике иглы, и хорошо эту иглу спрятал. Вот я вам показываю кончик иглы. Его толщина 44.4 микрона. Если Кощей считается человеком, а его душа спрятана где-то в его геноме, размер и вес должны быть такими. И пока получается, что Кощей обскакал всех ученых, потому что так мелко упаковывать информацию мы пока не можем. Прячет он иголку в яйце, а дальше вы помните: яйцо — в утке, утка — в зайце, сундук — на дереве, оно — на острове. А дальше наш герой побеждает Кощея.

Я придумал специальную двумерную последовательность свертки, которая позволяет нам сделать трехмерную иголку. Четыре дня я работал вместе с хорошим математиком из MIT Мэйсоном Биамонтом, который помог мне все это записать коротким кодом. Также мы закодировали и яйцо. В итоге все это мы можем сформулировать на языке базовых пар. Здесь вы можете видеть работу по синтезу этих 138 пар в Гарварде. Найденная симметрия усложняет дальнейший синтез, и мой коллега Тин Де Корт помог нам обойти это ограничение за счет разбивки этой последовательности. Мы использовали инструмент Golden Gate Assembly, и получили возможность более эффективной свертки ДНК в яйцо. Вместе с Алексом Биссоном в Гарвардской лаборатории мы разработали все эти фрагменты. Они и вверх, и вниз имеют длину по одной тысяче базовых пар. Ну, а дальше ДНК Кощея мы инкорпорировали в плазму.

Вот здесь происходит инкубация галобактерии Кощея Бессмертного. Первый случай интеграции человеческого ДНК в галобактерию. Дальше мы решили, что было бы здорово вложить эти галобактерии в соли, чтобы обеспечить им дальнейшую защиту.

В рамках той самой Екатеринбургской биеннале коллега Марков вместе со мной читал ряд лекций. Как раз там мы использовали раствор из разных древних солей и проводили их рекристаллизацию в течение нескольких месяцев. Мы использовали древние минеральные соли. Провели стерилизацию, разжижение, потом рекристаллизацию. Ну, и я могу утверждать, что на сегодня не придумано технологии долгосрочного хранения информации. Ребята тогда, может, не догадывались, что наш небольшой проект принесет большую известность команде, и привлечет внимание к нашей работе. Ну, вы наверняка читали, потому что эта статья вышла в февральском номере журнала Science.

По сути, этот проект имел класс PUC (?). Нам нужно было показать, что эта технология может использоваться. Надеемся, что в будущем мы сможем поставить эту технологию на широкую ногу, и, может, действительно сможем оставить о себе память.

Для того, чтобы показать, чем наша методика отличается от ранней технологии оригами, мы разработали четырехмерный гиперкуб, имеющий 224 (?) базы, и параллельно встроили и этот код в ту же самую галобактерию Солинариум. Хотя техники оригами не могут обрабатывать больше, чем стандартный набор (?) двух измерений, мы можем обрабатывать гораздо больше. На самом деле, мы до сих пор не знаем, как так получилось, что эти археи так здорово смогли выжить в течение сотен миллионов лет. Есть разные идеи: что, может быть, во всем виноваты так называемые жидкие инклюзии (такие пузырики газа или жидкости, остающиеся внутри минерала или кристалла). Даже вот такие устройства, как соляные лампы, для людей, страдающих астмой и прочими болезнями, якобы могут улучшить вам настроение, помочь со сном и так далее. На самом деле нет никаких научных доказательств тому, что лампы из гималайской соли подобную функцию действительно выполняют, но здесь все же есть о чем подумать, согласитесь.

Все, что здесь перечислено, это никак не подтвержденные наукой маркетинговые заявления. Вместе с Алексом мы решили создать соляную лампу, которая будет гореть в темном свете. Там будут использоваться галобактерии с флуоресцентными метками, и мы сможем с использованием темного света проверить, находятся они на месте или они на самом деле мигрируют внутри кристальной матрицы соли. Заодно сможем посмотреть, находятся ли они в спящем состоянии, или проявляют какую-то активность, даже находясь в жидких инклюзиях. Это результат компьютерного томографирования иглы в яйце.

Вопросы и ответы

Ольга Ремнева, ИТМО: Расскажите подробнее про Microvenus.

Джо Дэвис: Это, конечно, большая история. Если не уточнять, то вдохновением для меня было то, что я когда-то с помощью радаров передавал в космос сообщения. Я понимал, что у радаров масса ограничений. Нужно вещать на той частоте, на которой не слишком активно солнце, потому что оно может задавить сигнал. И вам нужна фантастическая мощность: 2 млн ватт для того, чтобы послать свое сообщение хотя бы на пару тысяч лет. И еще нужно держаться центра луча, а так очень легко промахнуться. То самое известное сообщение 1974 года из Аресибо — его буквально пару минут транслировали в направлении Созвездия Геракла. Это была работа Фрэнсиса Дрейка, и поразительно, что он как астроном не учел детально чисто астрономические параметры движения звезд. Ну ,то есть мы понимаем, что все звезды и звездные скопления вращаются вокруг некоего центра галактики. Ну, а до Созвездия Геракла — 25 тысяч световых лет. А он стрелял там, где они находятся сейчас, не учитывая вот эту погрешность. Ну, а с другой стороны, тогда был еще 1986 год, только заря молекулярной биологии. Эта сфера была совсем крохотной, все со всеми были знакомы. Но было и много инноваций. Было множество попыток синтезировать ДНК, куда-то записать информацию в живые клетки. Я бегал из лаборатории в лабораторию, потому что ни одна не хотела заниматься чисто художественным проектом, и никому в голову не приходило, что у этого проекта есть серьезные научные перспективы. В общем, я синтезировал ДНК в лаборатории Джона Бекмана в Гарварде. Дальше, я очищал уже в Беркли в Калифорнии. А закачивал бактерии в Гарварде, это было в 1987 году. То есть, на то, чтобы обработать кусочек в 28 базовых пар, потребовалось столько времени. И сейчас то эти процедуры стали гораздо проще, но тогда у меня на все ушел практически год.

Мне еще кажется, что это красивое и романтичное послание, напоминающее в том числе о женской анатомии, потому что в одном из посланий был показан мужчина, а из соображений приличия, женские гениталии показаны не были. Как будто инопланетяне — дети до двенадцати лет. И в каком-то смысле это самый феминистический из моих проектов.

Вопрос от зрителя: Можно ли отправить ДНК человека в космос и надеяться, что это дальше как-то воспроизведет человека?

Джо Дэвис: Гипотетически да, мы можем развивать последовательность ДНК человека, можем отдельные кусочки вогнать в кристаллики соли и отправить куда-то в космос. Я не думаю, что дальше из них можно будет собрать человека, но можно будет собрать массу информации о нас, как устроен метаболизм Хомо Сапиенса, и так далее.

Одни из ранних языков человека — пиктографический. Значение текста заложено в рисунок. Такие вещи, конечно, лучше передавать картинкой. Если вы можете показать, как слон перепрыгивает через забор, то это будет совершенно универсальное послание. Для него неважно, каким языком владеть, он и так видит и понимает. Здесь мне видится большая перспектива обмена сообщениями с внеземными цивилизациями.

Мне интересно то, что до сих пор не существует никакого трехмерного языка. Есть язык брайля, но это все-таки шифр для обычного языка.

Владислав Карсон: Есть ли какое-то коммерческое приложение этих механизмов хранения данных на сегодняшний день?

Джо Дэвис: Да, конечно. Мне кажется, что когда вы закачиваете свою информацию в экстремофилов, и прячете их в соль, вы гарантируете сохранность этой информации на долгие столетия вперед. Можете также и Coli E (?) использовать как носитель информации, держа ее при температуре -80 градусов. Можно и нашу галобактерию при такой же температуре держать в глицерине, а после разморозки нужно подождать две недели, и она начнет размораживаться. А если взять ту же самую кристаллизованную архею галобактерию Солинариум и хранить ее три года при комнатной температуре, она начнет активно раздавать свою информацию буквально через сутки. По-моему это ужасно дешевый и долгосрочный способ хранения информации. Какой-то архив реально важной информации должен быть создан. Это наша обязанность перед лицом наших потомков.

Арина Фатигина: Насколько быстро могут дешифровываться такие данные? Можно ли рассчитывать на появление плееров, которые будут считывать музыку с ДНК?

Джо Дэвис: Конечно! Сейчас есть секвенаторы ДНК формата флешки. Так что да, я не сомневаюсь, что со временем появится устройство, которое можно вставить прямо в телефон и считать информацию с ДНК.

Я, конечно, мечтаю о том, чтобы весь биом на земле стал своеобразным носителем информации, таким образом мы ничего не сможем по-настоящему уничтожить. У человечества бывали такие припадки, когда уничтожались хранилища данных: Культурная революция в Китае, были такие случаи в Америке и других странах. Были случаи, когда уничтожалось культурно-историческое наследие. Мы помним, как пылали библиотеки Александрии. Огромная фантастическая библиотека была уничтожена в Багдаде, огромное количество классических греческих текстов там погибло. Здорово было бы хранить такую информацию в носителях, которые абсолютно не боятся фанатиков.

Sophisticated Sociopath: А какие требования? Достаточно тех же условий, что и для полимеразно-цепной реакции?

Джо Дэвис: Галобактерии в соли могут храниться бесконечно долго. Другое дело, из-за разницы между pH уровня клетки и окружающей среды такая клетка практически сразу взорвется, если вы ее погрузите в пресную воду. Но 98% запасов воды на земле — соленая. Мизерная часть пресной воды находится на поверхности, по большей части это подземные воды, а остальное сконцентрировано в реках и озерах. Поэтому я очень верю в перспективы галобактерий Солинариум. И да, легко можно хранить их в куске соли прямо у вас на полке. Это надежнее любого другого носителя.

Никита Рожков: Может ли информация, закодированная таким образом, меняться по ходу мутаций?

Джо Дэвис: Если бы она была в обычной клетке, например, в клетке кишечной палочки E Coli, то да. Но в галобактериях происходит фазовый переход, и архея засыпает, поэтому регулярного деления не происходит и никакие транскрипционные ошибки не совершаются. Там приглушенный метаболизм и вероятность мутации очень низки. Можно сказать, что в таком замороженном состоянии сохраняются галобактерии. Получается, что и соли, и соляные растворы обеспечивают хорошую защиту в том числе от радиации. У нас в MIT есть собственный исследовательский ядерный реактор. В девяностых годах я обнаружил живые существа прямо под кожухом реактора. Мы их оттуда удалили, и через пару лет снова нашли, хотя там не самые комфортные условия для жизни, как вы понимаете. Там излучение 10^9 нейтронов на см²/с. Получается, организмы могут так быстро восстанавливаться, что даже такая атака их не убивает. Это все происходит в охладителе первичного контура.

Вопрос: Почему важно заниматься трехмерными ДНК, если можно все делать в привычном двухмерном виде?

Джо Дэвис: Представьте, что вы храните какой-то образ предмета. Картинка — это хорошо, но если у вас есть модель, то вы можете гораздо больше узнать об объекте. Его можно нарезать на огромное количество слоев. И это проще читать. Вам не нужно учить язык, на котором был составлен такой текст.

Если появятся еще какие-то вопросы, пишите: joedavis@mit.edu