Способ сохранения информации с использованием днк и устройство хранения информации

Группа изобретений относится к биотехнологии, в частности нано-технологиям для сохранения информации с использованием ДНК. Информация размещается последовательно на одноцепочечной ДНК путем соединения с ней комплементарных этой ДНК закрытых праймеров. Каждый закрытый праймер содержит цепь дезоксинуклеотидов, завершенную на 3' конце дидезоксинуклеотидом. Закрытые праймеры размещены на одноцепочечной ДНК с промежутками, на которых к одноцепочечной ДНК не присоединены никакие нуклеотиды. Длина праймеров кодирует цифру хранящейся цифровой информации. Ноль представляют закрытым праймером длиной N нуклеотидов, единицу представляют закрытым праймером длиной K нуклеотидов. Между двумя последовательными закрытыми праймерами, соединенными с одноцепочечной ДНК, делают промежуток M нуклеотидов. > 0, > 0, K ≠ N, > 0. Решения предназначены для архивирования и длительного хранения любых видов существующей информации. 2 н. и 16 з.п. ф-лы, 5 ил., 6 пр.

 

Область техники

Представленная группа технических решений относится к нано-технологиям для сохранения информации с использованием ДНК. Решения предназначены для архивирования и длительного хранения любых видов существующей информации.

Предшествующий уровень техники

Четыре молекулы нуклеотидов известны как аденин (“A”), цитозин (“C”), гуанин (“G”), тимин (“T”). Структура молекулы нуклеотида включает фосфатную группу, пентозный сахар (сахар дезоксирибозу) и азотистое основание (фиг. 4). Фосфатная группа и пентозный сахар одинаковые для всех нуклеотидов. A, C, G, T отличаются азотистым основанием. Фосфатная группа соединена с 5' (пять прайм) углеродом пентозного сахара, азотистое основание соединено с 1' углеродом пентозного сахара. С 2' углеродом пентагонального сахара пентозы связан водород (“H”), а с 3' углеродом связана группа “OH”. Детальная молекулярная структура в целом каждого нуклеотида выявляет, что именно эта причина позволяет связывать соответствующий нуклеотид последовательно на 3' углероде с группой “OH”. Отсутствие одного атома кислорода (“O”) у водорода, связанного с 2' углеродом, делает молекулу нуклеотида молекулой “дезоксинуклеотида”. Таким образом, в одной цепи нуклеотидов каждый дезоксинуклеотид соединен через 3' узел (3' углерод) предыдущего дезоксинуклеотида. Теперь, один узел дезоксинуклеотида, который является 3' узлом, приближается к фосфатной группе 5' узла следующего дезоксинуклеотида. Очевидно, каждый блок дезоксинуклеотидов может также быть визуализирован количественно в форме “пять прайм углерод к три прайм узлу (5'-3') и никогда в обратном порядке”. Дезоксинуклеотиды последовательно соединены в порядке [....5'-3'5'-3'5'-3'....], где “OH” группа 3' углерода предыдущего дезоксинуклеотида приближена к “OH” группе фосфатной группы 5' углерода следующего дезоксинуклеотида, в результате чего устанавливается “C-O” связь между молекулами дезоксинуклеотидов. Причина, по которой между дезоксинуклеотидами создается связь “C-O”, заключается только в кислороде (“O”) в группе “OH” 3' углерода в пентозном (дезоксирибозном) сахаре в молекуле дезоксинуклеотида и высвобождении молекулы H2O при близком контакте группы "OH" с фосфатной группой на 5’ углероде следующего дезоксинуклеотида. Таким образом, рекурсивно 3' узел предыдущего дезоксинуклеотида образует “C-O” связь с 5' узлом следующего дезоксинуклеотида в форме [....5'-3'5'-3'....], так как “O” (кислород) присутствует в группе “OH” на 3' углероде предыдущего дезоксинуклеотида. Это объясняет тот факт, почему в теоретической нотации двухцепочечного фрагмента ДНК верхняя цепь отмечена как 5' на крайнем левом конце и 3' на крайнем правом конце, и отметки перевернуты для нижней комплементарной цепи, отмеченной 5' на ее крайнем правом конце и 3' на крайнем левом конце.

Если кислород (“О”) в группе “ОН” 3' углерода в пентозном сахаре отсутствует, это предотвращает формирование “С-О” связи между фосфатной группой следующего последовательного нуклеотида и 3' углерода пентозного сахара текущего нуклеотида. Поскольку отсутствие кислорода (“О”) в группе “ОН” 3' углерода приводит к особому типу молекулы нуклеотида, показанной на фиг. 5, которая способна предотвратить последующее подсоединение дезоксинуклеотидов, то возможно создание закрытых комплементарных цепей нуклеотидов (праймеров) различной длины и их присоединение к образцу нуклеотидных оснований (одноцепочечной ДНК). На фиг. 5 молекула дезоксинуклеотида специально обработана для удаления кислорода от 3' углерода в части пентозного сахара. На фиг. 5 показана абстракция молекулы дидезоксинуклеотида, которая используется как завершитель при производстве коротких полинуклеотидных праймеров. Отсутствие кислорода (“О”) у 3' углерода пентозного сахара в молекуле дидезоксинуклеотида предотвращает дальнейшее присоединение дезоксинуклеотидов.

Одна цепь ДНК содержит такие биомолекулы как A, C, G, T в одном измерении. Эту цепь получают нагреванием культивируемой среды с размещенным в ней геном до 94°C - 95°C в процессе, называемом денатурацией (K. Mullis, F. Faloona, S. Scharf, R. Saiki, G. Horn, H. Erlich; "Конкретная ферментативная амплификация ДНК in vitro: полимеразная цепная реакция” (“Specific enzymatic amplification of DNA in vitro: the polymerase chain reaction”); Симпозиум по количественной биологии в Колд-Спринг-Харбор; стр. 263 - 273; 1986).

Структура ДНК состоит из двух комплементарных цепей молекул нуклеотидных оснований, соединенных друг с другом водородными связями между комплементарными основаниями (A-T, G-C, T-A, C-G) в лестничной структуре, образованной сахаро-фосфатный остовом. Эта структура ДНК секвенируется и изучается на протяжении многих лет, ей придерживаются, ее наблюдают и ей манипулируют в нескольких биомолекулярных процессах с целью представления цифровой информации и хранения цифровой информации в наноразмерном измерении, несколькими исследователями также были выполнены соответствующие работы по реализации цифровой логики.

С появлением нанотехнологий исследование показало, что размер каждой молекулы нуклеотидного основания составляет от 2,0 нм до 2,5 нм, также наблюдается электрическое обнаружение отдельной биомолекулы с помощью сканирующей туннельной микроскопии (СТМ), пропускающей цепь нуклеотидных оснований через нанопоровую щель 2,7 нм между сканирующими электродами.

Также технология нанопорового секвенирования Oxford Nanopore (oxford nanopore sequencing technology, MinION технология) может быть использована для определения порядка нуклеотидов в ДНК (Hengyun Lu, Francesca Giordano, Zemin Ning; “Oxford nanopore MinION секвенирование и сборка генома” (“Oxford nanopore MinION sequencing and genome assembly”); Genomics Proteomics Bioinformatics 14; стр. 265-279; 2016. Miten Jain, Hugh E. Olsen, Benedict Paten, Mark Akeson; “Oxford nanopore MinION: представление нанопорового секвенирования сообществу геномики” (“The oxford nanopore MinION: delivery of nanopore sequencing to the genomics community”); Genome Biology 17; стр. 1 - 11; 2016. Oxford nanopore technologies; “Нанопоровое секвенирование. Применение и преимущества нанопорового секвенирования длинных последовательностей для структурного анализа изменений” (“Nanopore sequencing. The application and advantages of long-read nanopore sequencing to structural variation analysis”). Белые страницы. Публикации Nanoporetech; SV_W1002_v1_revA_24Mar2017, 2017). В основе нанопорового секвенирования лежит "синтетическая молекула белка, которая содержит нанопору в форме трубки в ее центре". Эта нанопора помещена в синтетическую мембрану из синтетического полимера. Эта мембрана имеет очень высокое электрическое сопротивление. При приложении разности потенциалов по разные стороны этой мембраны, находящейся в электрофизиологическом растворе, через нанопору начинает протекать ионный ток. Всякий раз, когда биомолекула (A, C, G или T) проходит через нанопору (апертуру нанопоры), происходит характерное изменение тока через мембрану, потому что биомолекула перекрывает апертуру нанопоры. Биомолекулы A, C, G и T имеют различные физические размеры, поэтому различное количество ионов может пройти через апертуру нанопоры когда биомолекула занимает это пространство. Поэтому изменение (уменьшение) ионного тока характерно для каждого из типов биомолекул и, следовательно, порядок их оснований (A, C, G и T) может быть обнаружен при прохождении цепи гена через апертуру нанопоры, образованной синтетической белковой молекулой.

Может быть применен другой способ для секвенирования ДНК, совмещающий нанопоровую архитектуру с явлениями полевой эмиссии и туннелирования, используемыми в сканирующей туннельной микроскопии (D. Dragoman, M. Dragoman; “Детектирование в реальном времени оснований дезоксирибонуклеиновой кислоты через их сигнатуру отрицательной дифференциальной проводимости” (“Real-time detection of deoxyribonucleic acid bases via their negative differential conductance signature”); Physical Review E 80, 022901; стр. 191-194; 2009). Каждый из нуклеотидных оснований имеет различное сопротивление (R) протекающему току (I). Если напряжение (V) измерять через каждое нуклеотидное основание, тогда в соответствии с законом Ома V = I R; так как R изменяется при прохождении каждого нуклеотидного основания через нанопору (диаметром 2.7 нанометра), то V через нанопору варьируется между величинами 1.74 эВ (эВ - электрон-вольт), 2.12 эВ, 1.7 эВ, 1.81 эВ соответственно для аденина (“A”), цитозина (“C”), гуанина (“G”), тимина (“T”). В СТМ зависимость тока (I) от напряжения (V) определяется формулой

I(V) = (V / R) + a·V2·exp(-b / V);

где (V / R) представляет “вклад активного сопротивления R”, а (a·V2·exp(-b / V)) представляет “характеристику Фаулера-Нордгейма”, которая определяет полевую эмиссию в зависимости от высоты барьера (ΦB). Основания ДНК или нуклеотидные основания могут быть смоделированы как потенциальные барьеры высотой (ΦB) для излучаемых полем электронов, их работа выхода (workfunction) определяется из следующего выражения:

m0 - масса свободного электрона ≈ 0.89X10-30 килограмм, L - расстояние от образца до наконечника для сканирующего туннельного микроскопа, ориентировочно L = 0.66 нанометров), ΦB - высота одной базы, проходящей через нанопору за один раз, e - свободный заряд электрона ≈ -1.602X10-19 Кулонов), - постоянная Планка ≈ 6.023X10-34 Джоуль секунд),

Генетические нуклеотидные основания ведут себя как потенциальные барьеры разной высоты в электрическом поле при прохождении через нанопору между сканирующими электродами. Электроны в состоянии возбуждения, как и в потоке тока, ведут себя подобно волне или кванту, проходя через потенциальный барьер нуклеотидного основания, находящегося в данный момент внутри нанопоры. Таким образом, нуклеотидное основание сканируется одно за другим. Из-за разной высоты нуклеотидные основания проявляют различное сопротивление проходящим через них электронам и фиксируется различное значение разности потенциалов в единицах электрон-вольт (эВ).

Перенос заряда через каждое из четырех нуклеотидных оснований зависит от их индивидуальной электронной и химической структуры, что позволяет каждому основанию стать потенциальным барьером с уникальной высотой. Таким образом, каждое нуклеотидное основание несет уникальную сигнатуру с точки зрения скорости(частоты) электронов в волновой форме, прошедших через барьер. Эта сигнатура не зависит от ближайших соседних нуклеотидов. Разница в проводимости нуклеотидных оснований велика при ориентации оснований вдоль между электродами. Электродный сэндвич каждого из нуклеотидных оснований одноцепочечной ДНК имеет соответствующую пространственную ширину. Значительная разница в проводимости по каждому нуклеотидному основанию и в переносе заряда по каждому нуклеотидному основанию одноцепочечной ДНК в один момент времени в направлении, перпендикулярном оси остова одноцепочечной ДНК, приводит к различимости амплитудных пиков тока. Метод обнаружения, основанный на наблюдении пиков тока, а не различий в значениях тока, потенциально более точен. Основываясь на этом, амплитудные пиковые значения тока, все неотрицательные амплитуды принимаются во внимание, определяются более одного амплитудного значения на нуклеотид-основание. Это ситуация, когда запрограммированный микроконтроллер должен быть включен для обнаружения изменений в текущих амплитудных пиковых значениях. Микроконтроллер должен быть загружен соответствующими диапазонами значений пиков неотрицательной амплитуды тока для обнаружения каждого из четырех нуклеотидных оснований в реальном времени, чтобы иметь место секвенирование нуклеотидов на основе сканирующей туннельной микроскопии.

Известно, что период полураспада генетического материала составляет более 500 лет. При этом долговечность для флэш-памяти и жесткого диска составляет около 5 лет, для магнитной ленты - от 15 до 30 лет.

Известен способ сохранения информации, в котором информация представлена в четверичной (основание 4) системе счисления нуклеотидами A, C, G, T синтезированной двухцепочечной ДНК (Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos, Ewan Birney; “К практическому, малообслуживаемому хранению информации большой емкости в синтезированной ДНК” (“Towards practical, high-capacity, low-maintenance information storage in synthesized DNA”); “NATURE”, VOL000, 00 MONTH; стр. 77 - 80; 2013).

Недостатком этого способа является невозможность синтезирования длинных последовательностей ДНК.

Известен другой, реализуемый, способ сохранения информации (James Bornholt, Luis Ceze, Randolph Lopez,Georg Seelig, Douglas M. Carmean, Karin Strauss; “Архивная система хранения на основе ДНК” (“A DNA-based archival storage system”); Вашингтонский университет; Microsoft Research; ASPLOS'16; стр. 637-649; 2016, DOI: http://dx.doi.org/10.1145/2872362.2872397). Информация представлена в четверичной системе счисления нуклеотидами A, C, G, T синтезированной двухцепочечной ДНК. Для уменьшения ошибок информация может быть представлена в троичной системе счисления. Короткие последовательности синтезированной ДНК (длиной 100-200 нуклеотидов) сохраняют в емкостях, которые имеют стохастическую пространственную организацию.

Недостатком этого способа является представление данных в виде набора большого числа различных цепей ДНК. Каждая из этих цепей должна иметь адрес. Способ восстановления информации из среды является сложным.

Раскрытие изобретений

Описанные изобретения решают техническую задачу создания реализуемого технического средства для хранения информации с использованием ДНК.

Заявляемые способ и устройство обеспечивают использование существующих ДНК последовательностей для сохранения информации. Также они не требуют синтезирование длинных последовательностей ДНК.

Сущность заявленного способа сохранения информации с использованием ДНК состоит в том, что информацию размещают последовательно на одноцепочечной ДНК путем соединения с ней комплементарных этой ДНК закрытых праймеров. Ноль представляют закрытым праймером длиной N нуклеотидов, единицу представляют закрытым праймером длиной K нуклеотидов, между двумя последовательными закрытыми праймерами, соединенными с одноцепочечной ДНК, делают промежуток M нуклеотидов. > 0, > 0, K ≠ N, > 0. Каждый закрытый праймер содержит цепь дезоксинуклеотидов, завершенную на 3' конце дидезоксинуклеотидом.

Вышеуказанная сущность является совокупностью существенных признаков заявленного способа, обеспечивающих достижение всех заявленных технических результатов.

В частных случаях допустимо выполнять заявленный способ следующим образом.

В качестве одноцепочечной ДНК могут выбрать существующую в природе одноцепочечную ДНК или ее часть, или одну цепь существующей в природе двухцепочечной ДНК или ее часть.

Одноцепочечную ДНК секвенируют, затем определяют состав и последовательность нуклеотидов в закрытых праймерах. Затем синтезируют закрытые праймеры. Затем присоединяют закрытые праймеры к одноцепочечной ДНК с образованием биомолекулярного архива.

Присоединение закрытых праймеров к одноцепочечной ДНК проводят предпочтительно одновременно по крайней мере для части закрытых праймеров. В этом случае перед синтезированием закрытых праймеров определяют их несовместимость с одноцепочечной ДНК. Несовместимость имеет место, если по крайней мере для одного закрытого праймера имеется несколько участков его комплементарности с упомянутой ДНК и если один из этих участков пересекается с местом расположения промежутка или местом расположения закрытого праймера другого размера.

При обнаружении несовместимости закрытых праймеров и одноцепочечной ДНК может быть выполнен один из следующих наборов действий:

- для размещения всей информации выбирают другой участок ДНК и повторяют определение закрытых праймеров;

- информацию скремблируют и повторяют определение закрытых праймеров;

- изменяют длину закрытых праймеров для нуля и/или единицы и/или длину промежутков, после чего повторяют определение закрытых праймеров;

- одноцепочечную ДНК делят на две части, соответственно делят на две части информацию для сохранения. Затем синтезируют закрытые праймеры независимо для двух упомянутых частей. Затем независимо присоединяют закрытые праймеры к одной и второй частям одноцепочечной ДНК;

- закрытые праймеры, для которых обнаружена несовместимость, синтезируют отдельно от остальных. Присоединяют такие закрытые праймеры к одноцепочечной ДНК после присоединения к этой ДНК других праймеров;

- берут другую одноцепочечную ДНК из библиотеки. Затем новую одноцепочечную ДНК секвенируют, повторяют определение закрытых праймеров.

Биомолекулярный архив могут секвенировать, по результатам секвенирования восстанавливают данные, закодированные в этом архиве. Затем восстановленные данные сравнивают с исходной информацией, которую требовалось сохранить. При восстановлении данных по результатам секвенирования биомолекулярного архива могут определять длину каждого закрытого праймера, присоединенного к одноцепочечной ДНК биомолекулярного архива.

Упомянутые действия предпочтительно осуществляют одновременно с несколькими одинаковыми молекулами одноцепочечной ДНК.

Информацию предварительно могут скремблировать.

Сущность заявленного устройства хранения информации состоит в том, что это устройство содержит одноцепочечную ДНК, к которой комплементарно присоединены закрытые праймеры. Каждый закрытый праймер содержит цепь дезоксинуклеотидов, завершенную на 3' конце дидезоксинуклеотидом. Закрытые праймеры присоединены к одноцепочечной ДНК с промежутками, на которых к одноцепочечной ДНК не присоединены никакие комплементарные нуклеотиды. Длина праймеров кодирует цифру хранящейся цифровой информации.

Вышеуказанная сущность является совокупностью существенных признаков заявленного устройства, обеспечивающих достижение всех заявленных технических результатов.

В частных случаях допустимо выполнять заявленное устройство следующим образом.

Закрытый праймер длиной N нуклеотидов может кодировать ноль, закрытый праймер длиной K нуклеотидов может кодировать единицу, между двумя последовательными закрытыми праймерами, соединенными с одноцепочечной ДНК, выполнен промежуток M нуклеотидов, и > 0, > 0, K ≠ N, > 0.

Несколько идентичных вышеупомянутых одноцепочечных ДНК может быть размещено в сосуде с консервирующей жидкостью.

Краткое описание чертежей

На фиг. 1 показана диаграмма примера записанного двоичного числа 010.

На фиг. 2 показана зависимость тока от времени при нанопоровом секвенировании биомолекулярного архива описанных решений.

На фиг. 3 показан пример секвенирования биомолекулярного архива описанных решений с расчетом временных интервалов.

На фиг. 4 показана структура молекулы дезоксинуклеотида.

На фиг. 5 показана структура молекулы дидезоксинуклеотида.

Подробное описание изобретений

Информация для сохранения описанным способом представлена как конечный одномерный бинарный массив. Этот массив может представлять все виды информации, например, текст, графику, аудио, видео, сообщения, составные документы, любую структурированную информацию, такую как файловая система. Информация может быть предварительно скремблирована (рандомизирована) для представления почти одинакового числа двоичных нулей и единиц в записываемых данных.

Для сохранения этой информации берут произвольную существующую в природе ДНК. Двухцепочечную ДНК молекулу берут из источника и помещают в культивируемую среду. Используя процесс полимеразной цепной реакции, ДНК молекулу денатурируют для получения одной цепи, которая есть последовательность нуклеотидных оснований, используемых на следующих этапах сохранения информации. Эта одна цепь далее называется “биомолекулярной лентой”. Для биомолекулярной ленты определяют последовательность нуклеотидов. Для этих целей используют технологию сканирующего туннельного микроскопа или нанопорового секвенирования (oxford nanopore sequencing). Последовательность запоминают (в файле, например) для использования на следующих этапах.

В качестве ДНК может быть использован, например, плазмид бактерии E. coli. Кольцо этого ДНК-плазмида разрывают для использования в заявленном способе.

Затем проектируют закрытые цепи нуклеотидов для записи данных на биомолекулярную ленту, присоединяя комплементарно цепи нуклеотидов к ленте. Эти цепи представляют двоичные нули и единицы информации. Проект формируется с помощью программы на компьютере. Термин “закрытые цепи нуклеотидов” означает, что к концу цепи дезоксинуклеотидов присоединяют дидезоксинуклеотид. Далее для обозначения закрытых цепей нуклеотидов будет использоваться термин “закрытый праймер”. Длина закрытого праймера измеряется в нуклеотидах и показывает число нуклеотидов в праймере, включая завершающий дидезоксинуклеотид.

Информация будет записана на биомолекулярной ленте как последовательность двоичных нулей и единиц, где:

- каждый двоичный ноль представлен закрытым праймером длиной N нуклеотидов, > 0;

- каждая двоичная единица представлена закрытым праймером длиной K нуклеотидов, > 0, K ≠ N;

- между двумя последовательными двоичными битами (праймерами) выполнен промежуток в M нуклеотидов (разделитель), > 0.

На практике N, K, M могут принимать значения от 1 до 10000.

Таким образом, проектирование закрытых праймеров есть вычисление состава и порядка нуклеотидов в праймерах для заданной информации и существующей биомолекулярной ленты. Закрытые праймеры должны быть комплементарны биомолекулярной ленте точно в своих позициях. Комплементарность определяется по правилам связей A-T, T-A, C-G, G-C.

На фиг. 1 показана диаграмма записанного двоичного числа 010 на биомолекулярной ленте 3'CCTAAGGGCAGTTAACCCCCCGAAA5', сверху которой присоединены комплементарные закрытые праймеры, утолщенные черные квадраты есть дидезоксинуклеотиды, завершающие комплементарные полинуклеотидные цепи длиной четыре и восемь нуклеотидов; праймеры (двоичные биты) разделены интервалами в три нуклеотида. В этом примере = 4, K = 8, M = 3.

Для записи n двоичных бит информации требуется totnucs нуклеотидов на биомолекулярной ленте:

totnucs = n(0)·N + n(1)·K + (n - 1)·M,

где n(0) - число нулевых бит в информации,

n(1) - число единичных бит в информации.

Для примера на фиг. 1 totnucs = 2·4 + 1·8 + (3 - 1)·3 = 22.

Когда информации много и используется скремблирование для рандомизации данных для записи, то n(0) ≈ n(1) и totnucs оценивается как

totnucs ≈ (n - 1)·M + (N + K)·n / 2.

После вычисления (проектирования) всех закрытых праймеров их производят по известной технологии синтезирования цепей нуклеотидов. Праймеры имеют две длины: N и K. К примеру, создание закрытых праймеров делают в соответствии с процессом массивной параллельной геномики, реализованной в производстве микрочипов Affymetrix GeneChip.

Завершение закрытых праймеров дидезоксинуклеотидом ограничивает их цепь, предотвращает наращивание цепи, запрещая последующее присоединение нуклеотидов.

Биомолекулярная лента может быть обрезана с начала или с конца. Таким образом, любой участок одноцепочечной ДНК может быть использован в качестве биомолекулярной ленты.

В завершение закрытые праймеры и биомолекулярную ленту помещают в культивируемую среду и, нагревая эту среду до температуры от 40°C до 60°C, начинают процесс присоединения, в результате чего праймеры присоединяются в комплементарные им позиции на биомолекулярной ленте. Таким образом двоичные биты записаны на носителе из нуклеотидов и представляют собой биомолекулярный архив.

Для повышения надежности хранения данных одновременно используются несколько копий биомолекулярной ленты и наборов закрытых праймеров.

Биомолекулярный архив есть одноцепочечная последовательность нуклеотидов с праймерами длиной N и K нуклеотидов, комплементарно присоединенными к ней с промежутками длиной M нуклеотидов, каждый праймер завершен дидезоксинуклеотидом.

Биомолекулярный архив может быть помещен в емкость (сосуд) с консервирующей жидкостью.

Когда это необходимо для верификации и чтения, восстановление последовательности двоичных бит может быть выполнено в соответствии с технологией нанопорового секвенирования. При этом биомолекулярный архив пропускают через модифицированную нанопору с более широкой апертурой, чем в установках нанопорового секвенирования oxford nanopore. Апертура модифицированной нанопоры достаточна для вмещения двойной цепи ДНК.

Детектирование последовательности двоичных бит заключается в определении длины комплементарных закрытых праймеров, присоединенных к биомолекулярной ленте биомолекулярного архива.

Модифицированная нанопора может быть небиологическим твердым телом или синтетической молекулой белка. Эта нанопора размещается в синтетической мембране из синтетического полимера. Мембрана имеет очень большое электрическое сопротивление. При приложении разности потенциалов по разные стороны этой мембраны, находящейся в электрофизиологическом растворе, через нанопору начинает протекать ионный ток. Всякий раз, когда биомолекула (A, C, G или T) или комплементарная пара биомолекул (A-T или C-G или T-A или G-C) проходит через нанопору (апертуру нанопоры), происходит характерное изменение тока через мембрану, потому что биомолекула перекрывает апертуру нанопоры. Биомолекулы A, C, G, T и их комплементарные соединения имеют различные физические размеры, поэтому различное количество ионов может пройти через апертуру нанопоры когда биомолекула или пара биомолекул занимает пространство апертуры. Поэтому изменение (уменьшение) ионного тока характерно для каждого из типов биомолекул или их возможных пар. Уменьшение тока ионов для любой из пар нуклеотидов больше, чем уменьшение ионного тока для любого из отдельных нуклеотидов. Следовательно, порядок нуклеотидов (A, C, G и T), порядок их пар и переходы от одного нуклеотида к парам нуклеотидов могут быть обнаружены при прохождении биомолекулярного архива через апертуру нанопоры.

На фиг. 2 показана зависимость тока от времени для нанопорового секвенирования участка биомолекулярного архива. Ток (i) отложен по оси y, а время (t) отложено по оси x. Секвенируемая часть биомолекулярного архива показана внизу графика. Эта часть содержит соединенные пары нуклеотидов и единичные нуклеотиды. Цепь 3'ACGCTGACGCTG5' есть часть биомолекулярной ленты, а цепь 5’TGCGAC3’ есть часть закрытого праймера, присоединенного к биомолекулярной ленте. Горизонтальные линии показывают уровни тока при нахождении соответствующего нуклеотида или соединенной пары нуклеотидов в апертуре нанопоры. Окружности показывают значения электрического сигнала для соответствующих нуклеотидов или их пар. График этого сигнала (тока) показан как первый график (1).

Второй график (2) на фиг. 2 представляет усредненное удаление между окружностями. Нижнее значение тока обусловлено набором окружностей для пар нуклеотидов, таких как A-T, C-G, G-C, C-G, T-A, G-C, ввиду их большего сопротивления при наличии парных связей. Верхнее значение тока обусловлено набором окружностей для единичных нуклеотидов, таких как A, C, G, C, T, G, ввиду их единичных соответствующих сопротивлений в непарных состояниях. Таким образом, переход во втором графике (2) (положительная диагональ - фронт на фиг. 2) имеется в месте, где двухцепочечный участок переходит в одноцепочечный, и соответствующий другой переход на втором графике (2) (отрицательная диагональ - спад - не показана) будет появляться по тем же причинам изменения сопротивления в месте, где одноцепочечный участок переходит в двухцепочечный.

Когда скорость движения биомолекулярного архива через модифицированную нанопору постоянна, восстановление двоичных цифр выполняется определением интервалов времени в изменении электрического сигнала.

На фиг. 3 также показана зависимость тока от времени для нанопорового секвенирования участка биомолекулярного архива. Эта фигура представлена для понимания возможной алгоритмически реализованной системы для восстановления двоичных бит в правильном порядке. Прямоугольники с толстой рамкой показывают дидезоксинуклеотиды, завершающие праймеры комплементарных нуклеотидов длиной четыре (N = 4 представляет двоичный ноль) и восемь (K = 8 представляет двоичную единицу). Окружности показывают значения тока ионов, когда соответствующий нуклеотид или пара нуклеотидов расположены в апертуре нанопоры. Они определяются для того, чтобы в области цифровой обработки сигналов подтвердить двоичные биты, имеющиеся в биомолекулярном уровне, путем анализа электрических сигналов в присутствии присоединенных комплементарных нуклеотидных праймеров.

График (2) на фиг. 3 иллюстрирует усредненное удаление от окружностей, относящихся к единичным нуклеотидам, для показанного верхнего горизонтального уровня короткой длительности, и усредненное удаление от окружностей, относящихся к парам нуклеотидам, для показанного нижнего горизонтального уровня большей длительности. Эти уровни эффективно автоматически вычисляются с помощью программируемого микроконтроллера, запрограммированного на основе динамических условий дисциплины цифровой обработки сигналов. Кроме того, соединение верхних горизонтальных линий с нижними горизонтальными линиями диагональными линиями автоматизировано путем алгоритмического задания условий.

Алгоритм временной обработки электрических сигналов на фиг. 3:

старт

Если (отрицательная диагональ - спад обнаружена) то считается длительность времени до появления положительной диагонали (фронта), пересекающего верхнюю горизонталь

Если (длительность времени ≈ ∆t) то двоичная цифра ноль воспринимается;

Если (длительность времени ≈ ∆T) то двоичная цифра один воспринимается;

стоп

Кроме того, другие известные способы могут быть использованы для чтения биомолекулярного архива, такие как упомянутые выше в разделе уровня техники сканирующий туннельный микроскоп или комбинация нанопоровой архитектуры с явлениями полевой эмиссии и туннелирования.

Описанный способ может быть реализован аналогично для любого основания в представлении цифровой информации, не только для двоичной информации. Например, для третичного, четверичного или десятичного представления информации. В этом случае для кодирования каждой цифры выбирается уникальная длина закрытого праймера.

Возможно, что один из вычисленных закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции и некоторые из этих позиций предназначены для промежутка или праймера другой длины (другого бита). Принимая во внимание, что присоединение осуществляется для всех закрытых праймеров и всей биомолекулярной ленты одновременно, это может привести к неправильному присоединению указанного праймера к ленте. В худшем случае записанные данные не будут совпадать с изначальной информацией. Указанная ситуация определяется на этапе проектирования (вычисления) праймеров.

Далее приведены примеры действий, которые могут быть реализованы для предотвращения указанной ошибки.

Пример 1

При обнаружении, что один из закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции, размещение всей информации сдвигают вдоль биомолекулярной ленты.

Пример 2

При обнаружении, что один из закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции, информацию кодируют другим скремблером.

Пример 3

При обнаружении, что один из закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции, выбирают другую длину для закрытых праймеров (N и/или K) или промежутков (M).

Пример 4

При обнаружении, что один из закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции, данные могут быть разделены на две части, которые подготавливаются независимо как два отдельных биомолекулярных архива, а помещаются в одну емкость (сосуд).

Пример 5

При обнаружении, что один из закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции, процесс присоединения разделяют на два этапа. На первом этапе присоединяют к биомолекулярной ленте все закрытые праймеры, за исключением проблемного праймера. На втором этапе присоединяют проблемный праймер.

Может быть столько дополнительных этапов присоединения, сколько типов проблемных праймеров обнаруживается.

Этот пример также требует, чтобы проблемные закрытые праймеры были изготовлены отдельно от других закрытых праймеров.

Пример 6

При обнаружении, что один из закрытых праймеров будет комплементарен биомолекулярной ленте в более чем одной позиции, выбирают другую ДНК для биомолекулярной ленты.

Этот пример описанного способа позволяет выбрать ДНК из набора различных ДНК (библиотека ДНК).

Промышленная применимость

Описанная группа изобретений реализована с использованием промышленно выпускаемых устройств и материалов, может быть реализована в лабораторных условиях и в промышленном масштабе и найдет широкое применение в области хранения информации.

1. Способ сохранения информации с использованием ДНК, отличающийся тем, что информацию размещают последовательно на одноцепочечной ДНК путем соединенния с ней комплементарных этой ДНК цепей нуклеотидов, каждая из которых представляет собой либо отдельный дидезоксинуклеотид, либо один или несколько соединенных в цепь дезоксинуклеотидов, к 3' концу которых присоединен дидезоксинуклеотид, при этом между двумя последовательными цепями нуклеотидов, соединенными с одноцепочечной ДНК, делают промежуток M нуклеотидов, > 0, на котором к одноцепочечной ДНК не присоединены никакие комплементарные нуклеотиды, при этом длина упомянутых цепей нуклеотидов кодирует цифру хранящейся цифровой информации, причем для кодирования каждой цифры выбрана уникальная длина цепи нуклеотидов.

2. Способ по п. 1, отличающийся тем, что в качестве одноцепочечной ДНК выбирают существующую в природе одноцепочечную ДНК или ее часть, или одну цепь существующей в природе двухцепочечной ДНК или ее часть.

3. Способ по п. 1 или 2, отличающийся тем, что одноцепочечную ДНК секвенируют, затем определяют состав и последовательность нуклеотидов в упомянутых цепях нуклеотидов, после чего синтезируют эти цепи нуклеотидов, а затем присоединяют их к одноцепочечной ДНК с образованием биомолекулярного архива.

4. Способ по п. 3, отличающийся тем, что присоединение упомянутых цепей нуклеотидов к одноцепочечной ДНК проводят одновременно по крайней мере для части цепей нуклеотидов, при этом перед синтезированием цепей нуклеотидов определяют их несовместимость с одноцепочечной ДНК, если по крайней мере для одной цепи нуклеотидов имеется несколько участков ее компплементарности с упомянутой ДНК и если один из этих участков пересекается с местом расположения промежутка или местом расположения цепи нуклеотидов другого размера.

5. Способ по п. 4, отличающийся тем, что при обнаружении несовместимости упомянутых цепей нуклеотидов и одноцепочечной ДНК для размещения всей информации выбирают другой участок ДНК и повторяют определение цепей нуклеотидов.

6. Способ по п. 4, отличающийся тем, что при обнаружении несовместимости упомянутых цепей нуклеотидов и одноцепочечной ДНК информацию скремблируют и повторяют определение цепей нуклеотидов.

7. Способ по п. 4, отличающийся тем, что при обнаружении несовместимости упомянутых цепей нуклеотидов и одноцепочечной ДНК изменяют длину цепей нуклеотидов для нуля и/или единицы и/или длину промежутков, после чего повторяют определение цепей нуклеотидов.

8. Способ по п. 4, отличающийся тем, что при обнаружении несовместимости упомянутых цепей нуклеотидов и одноцепочечной ДНК эту ДНК делят на две части, соответственно делят на две части информацию для сохранения, после чего синтезируют упомянутые цепи нуклеотидов независимо для двух упомянутых частей, а затем независимо присоединяют цепи нуклеотидов к одной и второй частям одноцепочечной ДНК.

9. Способ по п. 4, отличающийся тем, что при обнаружении несовместимости упомянутых цепей нуклеотидов и одноцепочечной ДНК цепи нуклеотидов, для которых обнаружена несовместимость, синтезируют отдельно от остальных и присоединяют такие цепи нуклеотидов к одноцепочечной ДНК после присоединения к этой ДНК других цепей нуклеотидов.

10. Способ по п. 4, отличающийся тем, что при обнаружении несовместимости упомянутых цепей нуклеотидов и одноцепочечной ДНК берут другую одноцепочечную ДНК из библиотеки, после чего новую одноцепочечную ДНК секвенируют, повторяют определение цепей нуклеотидов.

11. Способ по любому из пп. 1-10, отличающийся тем, что биомолекулярный архив секвенируют, по результатам секвенирования восстанавливают данные, закодированные в биомолекулярном архиве, и сравнивают эти данные с исходной информацией, которую требовалось сохранить.

12. Способ по п. 11, отличающийся тем, что при восстановлении данных по результатам секвенирования биомолекулярного архива определяют длину каждой цепи нуклеотидов, присоединенной к одноцепочечной ДНК биомолекулярного архива.

13. Способ по любому из пп. 1-12, отличающийся тем, что осуществляют упомянутые действия одновременно с несколькими одинаковыми молекулами одноцепочечной ДНК.

14. Способ по любому из пп. 1-5, 7-10, отличающийся тем, что информацию предварительно скремблируют.

15. Способ по любому из пп. 1-14, отличающийся тем, что ноль представляют цепью нуклеотидов длиной N нуклеотидов, единицу представляют цепью нуклеотидов длиной K нуклеотидов, > 0, > 0, K ≠ N.

16. Устройство хранения информации, отличающееся тем, что содержит одноцепочечную ДНК, к которой комплементарно присоединены цепи нуклеотидов, каждая из которых представляет собой либо отдельный дидезоксинуклеотид, либо один или несколько соединенных в цепь дезоксинуклеотидов, к 3' концу которых присоединен дидезоксинуклеотид, при этом цепи нуклеотидов присоединены к одноцепочечной ДНК с промежутками в M нуклеотидов, > 0, на которых к одноцепочечной ДНК не присоединены никакие комплементарные нуклеотиды, при этом длина цепей нуклеотидов кодирует цифру хранящейся цифровой информации, причем для кодирования каждой цифры выбрана уникальная длина цепи нуклеотидов.

17. Устройство по п. 16, отличающееся тем, что цепь нуклеотидов длиной N нуклеотидов кодирует ноль, цепь нуклеотидов длиной K нуклеотидов кодирует единицу, > 0, > 0, K ≠ N.

18. Устройство по п. 16 или 17, отличающееся тем, что оно представляет собой сосуд с консервирующей жидкостью, в котором размещено несколько идентичных вышеупомянутых одноцепочечных ДНК.



 

Похожие патенты:

Изобретение относится к области биотехнологии и производству противоящурных вакцин. Описан способ опосредованного определения титра вируса ящура в неинактивированном сырье для вакцины при амплификации вирусной нуклеиновой кислоты и детекции РНК-ампликонов с применением технологии молекулярных биконов и разработанной показательной функции с основанием 10 зависимости величины порогового цикла амплификации РНК и титра вируса ящура.

Группа изобретений относится к области молекулярных вычислительных устройств. Предложено молекулярное вычислительное устройство (варианты), способ проведения вычислений с помощью устройства, фармацевтическая формуляция, содержащая устройства, а также применение фармацевтической формуляции для регуляции экспрессии гена.

Изобретение относится к ветеринарной вирусологии, а именно к средствам молекулярной диагностики. Разработана высокочувствительная тест-система, состоящая из ОТ-ПЦР смеси, Taq-ДНК-полимеразы, обратной транскриптазы, положительного контроля и отрицательного контроля, позволяющая в кратчайшие сроки обнаруживать РНК вируса SARS-CoV-2 в биоматериале от животных, пищевых продуктах и объектах окружающей среды.

Изобретение относится к области биотехнологии, а именно к способу опосредованного определения инфекционного титра вируса бешенства в неинактивированном сырье для антирабических вакцин при транскрипционной амплификации и детекции продуктов реакции с применением beacon-технологии и разработанной логарифмической функции зависимости величины порогового цикла транскрипционной амплификации РНК и инфекционного титра вируса бешенства.

Изобретение относится к области биотехнологии, а именно к способу опосредованного определения инфекционного титра вируса бешенства в неинактивированном сырье для антирабических вакцин при транскрипционной амплификации и детекции продуктов реакции с применением beacon-технологии и разработанной логарифмической функции зависимости величины порогового цикла транскрипционной амплификации РНК и инфекционного титра вируса бешенства.

Изобретение относится к медицине, в частности к гастроэнтерологии. Сущность изобретения состоит в том, что у пациентов с язвенной болезнью желудка с локализацией язвы в антральном отделе желудка, ассоциированной с Helicobacter pylori (Н.

Изобретение относится к биотехнологии и медицине и может быть использовано в кардиологии, ангиологии, кардиохирургии, терапии, реабилитологии. Определяют концентрацию цитомегаловирусной ДНК на 1 мл плазмы крови методом полимеразной цепной реакции (ПЦР) с гибридизационно-флуоресцентной детекцией продуктов амплификации в режиме «реального времени» (Real-time).

Группа изобретений относится к области биотехнологии. Предложены система и способ анализа фенотипа и последовательности полинуклеотидов биологической частицы.

Изобретение относится к соединению Формулы (I) или к его соли, где X представляет собой O, S или NRn, где Rn представляет собой H; каждый из R и R1 независимо представляет собой H; каждый из R2 и R4 независимо представляет собой H или -SO3H; R3 представляет собой C2-6алкил, замещенный -CO2H; каждый R5 независимо представляет собой галоген или -SO3H; и m составляет 0 или 1.

Изобретение относится к медицинской биотехнологии. Изобретение представляет собой способ определения генотипа человека, связанный с быстрым и медленным ацетилированием ксенобиотиков.

Изобретение относится к биотехнологии, в частности к композициям и способам тестирования активности никующей эндонуклеазы и полимеразы в реакции, включающей использование субстрата в виде молекулы нуклеиновой кислоты, который детектирует активность никующей эндонуклеазы и полимеразы путем высвобождения детектируемого репортера (например, флуорофора).
Наверх