Геномная инженерия

Авторы патента:

ЧЁРЧ, Джордж М. (US)

ЯН, Лухан (US)

КАРГОЛ, Марк Гуэль (US)

ЯН, Джойс Личи (US)

C12N5/10 - клетки, модифицированные введением чужеродного генетического материала, например клетки, трансформированные вирусом

C12N15/90 - стабильное введение чужеродной ДНК в хромосому

C12N15/09 - метод рекомбинантных ДНК

A61K48/00 - Лекарственные препараты, содержащие генетический материал, который включен в клетки живого организма для лечения генетических заболеваний; для генной терапии

Владельцы патента RU 2764757:

ПРЕЗИДЕНТ ЭНД ФЭЛЛОУЗ ОФ ХАРВАРД КОЛЛИДЖ (US)

Настоящее изобретение относится к биотехнологии и клеточной инженерии, в частности к способу изменения ДНК-мишени в стволовой клетке, экспрессирующей фермент Cas из системы CRISPR типа II, который формирует комплекс колокализации с направляющей РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом и к стволовой клетке для РНК-направленного основанного на Сas редактирования генома, которая не является клеткой зародышевой линии человека или эмбриональной клеткой человека. Для осуществления указанного способа сначала в указанную стволовую клетку вводят направляющую РНК, комплементарную ДНК-мишени, причём РНК и фермент Cas являются членами комплекса колокализации на ДНК-мишени. Далее в ту же стволовую клетку вводят донорную последовательность нуклеиновой кислоты. Вследствие направляющая РНК и фермент Cas колокализуются с ДНК-мишенью, фермент Cas расщепляет ДНК-мишень и донорная последовательность нуклеиновой кислоты встраивается в ДНК-мишень. Таким образом получают измененную ДНК в указанной стволовой клетке. Настоящее изобретение позволяет применять специально сконструированные нуклеазы при конструировании человеческих индуцированных плюрипотентных стволовых клеток. 2 н. и 33 з.п. ф-лы, 50 ил., 9 табл., 20 пр.

Данные связанных заявок

Данная заявка испрашивает приоритет предварительной заявки на патент США No. 61/858866, поданной 26 июля 2013 г. и включенной в данный документ ссылкой в полном объеме и для всех целей.

Заявление государственных интересов

Это изобретение было осуществлено при государственной поддержке согласно P50 HG003170 от Национального научно-исследовательского центра генома человека за выдающиеся достижения в геномике. Правительство имеет определенные права на это изобретение.

Предшествующий уровень техники

Известно редактирование генома с помощью специфических к последовательности нуклеаз. Смотрите источники 1, 2 и 3, которые включены в данный документ ссылкой в полном объеме. Опосредованный нуклеазой разрыв двухцепочечной ДНК (дцДНК) в геноме может быть устранен с помощью двух основных механизмов: негомологичного соединения концов (NHEJ), который часто приводит к введению неспецифических вставок и делеций (indels), или направляемой гомологией репарации (HDR), которая использует гомологичную цепь в качестве шаблона для репарации. См. источник 4 включенный ссылкой в полном объеме. Когда специфичная к последовательности нуклеаза доставляется вместе с гомологичной донорной ДНК-конструкцией, содержащей искомые мутации, эффективности направленного воздействия на ген повышаются в 1000 раз по сравнению только с доставкой донорной конструкции отдельно. См. источник 5, включенный в данный документ ссылкой в полном объеме. Сообщалось об использовании одноцепочечных олигодезоксирибонуклеотидов («ssODNs») в качестве ДНК-доноров. См. источники 21 и 22, включенные в данный документ ссылкой в полном объеме.

Несмотря на большие достижения в области технологий редактирования генов, остаются нерешенными многие проблемы и многие вопросы относительно применения специально сконструированных нуклеаз при конструировании человеческих индуцированных плюрипотентных стволовых клеток («hiPSC»). Во-первых, несмотря на простоту своей конструкции TALEN (эффекторные нуклеазы, подобные активаторам траснкрипции) нацеливаются на определенные последовательности ДНК тандемными копиями доменов RVD (домены вариабельных двух остатков). См. источник 6, включенный в данный документ ссылкой в полном объеме. В то время как модульный характер RVDs упрощает дизайн TALEN, их повторяющиеся последовательности усложняют способы синтеза ДНК-конструкций на их основе (см. источники 2, 9 и 15-19, включенные в данный документ ссылкой в полном объеме), а также делает практически невозможным их совместное применение вместе со средствами доставки генов на основе лентивирусов. См. источник 13, включенный в данный документ ссылкой в полном объеме.

В современной практике NHEJ и HDR часто оцениваются с помощью отдельных анализов. Тесты с эндонуклеазой, чувствительной к некомлементарности (см. источник 14, включенный в данный документ ссылкой в полном объеме) часто используются для оценки NHEJ, но количественная точность этого способа переменчива, и чувствительность ограничивается частотами NHEJ выше ~ 3%. См. источник 15, включенный в данный документ ссылкой в полном объеме. HDR часто оценивается с помощью клонирования и секвенирования, совершенно иной и часто громоздкой процедуры. Чувствительность по-прежнему является проблемой, поскольку, несмотря на высокие частоты редактирования порядка 50% о которых часто сообщалось в случае некоторых типов клеток, таких как U20S и К562 (см. источники 12 и 14, включенные в данный документ ссылкой в полном объеме), в случае hiPSC частоты, как правило, ниже. См. Источник 10, включенный в данный документ ссылкой в полном объеме. В последнее время высокие частоты редактирования были зарегистрированы в hiPSC и hESC, достигнутые с помощью TALENs (см. источник 9, включенный в данный документ ссылкой в полном объеме), и еще более высокие частоты были достигнуты с помощью системы CRISPR Cas9-гидРНК (см. источники 16-19, включенные в данный документ ссылкой в полном объеме. Тем не менее, показатели редактирования на различных участках по всей видимости, сильно отличаются (см. источник 17, включенный в данный документ ссылкой в полном объеме), а в некоторых участках редактирование иногда не обнаруживается вообще (см. источник 20, включенный в данный документ ссылкой в полном объеме).

Бактериальные и архейные системы CRISPR-Cas основываются на коротких направляющих РНК (гидРНК) в комплексе с Cas-белками, которые управляют деградацией комплементарных последовательностей, присутствующих во вторгающихся чужеродных нуклеиновых кислотах. См. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011); Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012); Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012); Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282 (2011); and Bhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011). Недавнее воссоздание in vitro системы CRISPR II типа из S. pyogenes показало, что crRNA («CRISPR РНК»), слитая, как правило, с транс-кодируемой tracrRNA («транс-активированная CRISPR РНК») достаточны для направления белка Cas9 к специфически расщепляемой последовательности ДНК-мишени, соответствующей crRNA. Экспрессия гидРНК гомологичных сайту-мишени приводит к рекрутированию Cas9 и деградации ДНК-мишени. См. H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008).

Сущность изобретения

Аспекты настоящего описания относятся к применению модифицированных нуклеаз TALEN (эффекторные нуклеазы, подобные активатору транскрипции) для генетической модификации клетки, такой как соматическая клетка или стволовая клетка. Как известно, TALEN включают повторяющиеся последовательности. Аспекты настоящего раскрытия относятся к способу изменения ДНК-мишени в клетке, в том числе введением в клетку TALEN, утратившую последовательности повторов в 100 п.о. или длиннее, где TALEN расщепляет ДНК-мишени и клетка подвергается негомологичному соединению концов с получением измененной ДНК в клетке. В соответствии с некоторыми аспектами, повторяющиеся последовательности искомой длины были удалены из TALEN. В соответствии с некоторыми аспектами, TALEN была лишена повторяющихся последовательностей определенной искомой длины. В соответствии с некоторыми аспектами, TALEN предоставляется с удаленными повторяющимися последовательностями искомой длины. В соответствии с некоторыми аспектами, TALEN модифицируется, для удаления повторяющихся последовательностей искомой длины. В соответствии с некоторыми аспектами, TALEN сконструирована с удалением повторяющихся последовательностей искомой длины.

Аспекты настоящего изобретения включают способы изменения ДНК-мишени в клетке, в том числе объединением в клетке TALEN, утратившей повторяющиеся последовательности в 100 п.о. или длиннее, и последовательности донорной нуклеиновой кислоты, где TALEN расщепляет ДНК-мишень и донорная последовательность нуклеиновой кислоты встраивается в ДНК клетки. Аспекты настоящего раскрытия направлены на вирус, включающий последовательность нуклеиновой кислоты, кодирующую TALEN, утратившую повторяющиеся последовательности в 100 п.о. или длиннее. Аспекты настоящего раскрытия относятся к клетке, включающей последовательность нуклеиновой кислоты, кодирующую TALEN, утратившую повторяющиеся последовательности в 100 п. н. или длиннее. В соответствии с некоторыми аспектами, описанными в данном документе, TALEN утратила повторяющиеся последовательности в 100 п.о. или длиннее, 90 п.о. или длиннее, 80 п.о. или длиннее, 70 п.о. или длиннее, 60 п.о. или длиннее, 50 п.о. или длиннее, 40 п.о. или длиннее, 30 п.о. или длиннее, 20 п.о. или длиннее, 19 п.о. или длиннее, 18 п.о. или длиннее, 17 п.о. или длиннее, 16 п.о. или длиннее, 15 п.о. или длиннее, 14 п.о. или длиннее, 13 п.о. или длиннее, 12 п.о. или длиннее, на 11 п.о. или длиннее, или 10 пар или длиннее.

Аспекты настоящего раскрытия направлены на изготовление TALE, включающего объединение эндонуклеазы, ДНК-полимеразы, ДНК-лигазы, экзонуклеазы, множество блоков нуклеотидных димеров, кодирующих RVD-домены (домены вариабельных двух остатков) и каркасного вектора TALE-N/TF, включающего сайт расщепления эндонуклеазой, активацию эндонуклеазы для разрезания каркасного вектора TALE-N/TF по сайту разрезания эндонуклеазой, с получением первого конца и второго конца, активацию экзонуклеазы, для создания 3' и 5' выступов на каркасном векторе TALE-N/TF и множестве блоков нуклеотидных димеров и соединения каркасного вектора TALE-N/TF и множества блоков нуклеотидных димеров в искомом порядке, активации ДНК-полимеразы и ДНК-лигазы для соединения каркасного вектора TALE-N/TF и множества блоков нуклеотидных димеров. Специалист в данной области техники легко поймет на основании настоящего описания, как идентифицировать подходящие эндонуклеазы, ДНК-полимеразы, ДНК-лигазы, экзонуклеазы, блоки нуклеотидных димеров, кодирующих RVD-домены и каркасные векторы TALE-N/TF.

Аспекты настоящего описания относятся к способу изменения ДНК-мишени в стволовых клетках, экспрессирующих фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, включающий (а) введение в стволовую клетку первой чужеродной нуклеиновой кислоты, кодирующей РНК, комплементарную ДНК-мишени, который направляет фермент на ДНК-мишень, где РНК и фермент являются членами комплекса колокализации на ДНК-мишени, введение в стволовую клетку второй чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, где РНК и донорная нуклеотидная последовательность экспрессируются, где РНК и фермент колокализуются с ДНК-мишенью, фермент расщепляет ДНК-мишени и донорная нуклеиновая кислота встраивается в ДНК-мишени, с получением измененной ДНК в стволовой клетке.

Аспекты настоящего раскрытия направлены на стволовую клетку, включающую первую чужеродную нуклеиновую кислоту, кодирующую фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом.

Аспекты настоящего раскрытия относятся к клетке, включающую первую чужеродную нуклеиновую кислоту, кодирующую фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом и включающую индуцируемый промотор для содействия экспрессии фермента. Таким образом, экспрессия может регулироваться, например, она может быть запущена и может быть остановлена.

Аспекты настоящего раскрытия нацелены на клетку, включающую первую чужеродную нуклеиновую кислоту, кодирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, где первая чужеродная нуклеиновая кислота является удаляемой из геномной ДНК клетки с помощью удаляющего фермента, такого как транспозаза.

Аспекты настоящего раскрытия относятся к способу изменения ДНК-мишени в клетке, экспрессирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, который включает (а) введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, введение в клетку из среды, окружающей клетку, РНК, комплементарной ДНК-мишени, которая направляет фермент на ДНК-мишень, где и РНК и фермент являются членами комплекса колокализации на ДНК-мишени, где последовательность донорной нуклеиновой кислоты экспрессируется, где РНК и фермент колокализованы на ДНК-мишени, фермент расщепляет ДНК-мишень и донорная нуклеиновая кислота встраивается в ДНК-мишень с получением измененной ДНК в клетке.

Аспекты настоящего раскрытия направлены на использование направляемого РНК ДНК-связывающего белка для генетической модификации стволовых клеток. В одном аспекте, стволовая клетка генетически модифицирована для включения нуклеиновой кислоты, кодирующей направляемый РНК ДНК-связывающий белок и стволовая клетка экспрессирует направляемый РНК ДНК-связывающий белок. Согласно конкретному аспекту, донорные нуклеиновые кислоты для введения специфических мутаций оптимизированы для редактирования генома с использованием либо модифицированных TALEN, либо направляемого РНК ДНК-связывающего белка.

Аспекты настоящего раскрытия направлены на модификацию ДНК, например, мультиплексную модификацию ДНК, в стволовой клетке с помощью одной или нескольких направляющих РНК (рибонуклеиновых кислот), для того, чтобы направить фермент, обладающий нуклеазной активностью, экспрессируемый стволовой клеткой, например, ДНК-связывающий белок, имеющий активность нуклеазы, в указанное положение на ДНК (дезоксирибонуклеиновой кислоте), где фермент разрезает ДНК и экзогенная донорная нуклеиновая кислота встраивается в ДНК, например, путем гомологичной рекомбинации. Аспекты настоящего изобретения включают циклические или повторяющиеся стадии модификации ДНК стволовой клетки для создания стволовой клетки, имеющей множество модификаций ДНК внутри клетки. Модификации могут включать введение экзогенных донорных нуклеиновых кислот.

Множественные экзогенные вставки нуклеиновых кислот могут быть осуществлены одиночной стадией введения в стволовую клетку, которая экспрессирует фермент, нуклеиновых кислот, кодирующих множество РНК и множество экзогенных донорных нуклеиновых кислот, например, путем котрансформации, где РНК экспрессируются и где каждая РНК в совокупности направляет фермент на конкретный участок ДНК, фермент разрезает ДНК и одна из множества экзогенных нуклеиновых кислот встраивается в ДНК в месте разреза. Согласно этому аспекту, многие изменения или модификации ДНК в клетке создаются в одиночном цикле.

Множественные экзогенные вставки нуклеиновых кислот в стволовую клетку могут быть осуществлены путем повторных стадий или циклов введения в стволовую клетку, которая экспрессирует фермент, одной или нескольких нуклеиновых кислот, кодирующих одну или несколько РНК или множество РНК и одну или несколько экзогенных нуклеиновых кислот или множество экзогенных нуклеиновых кислот, где РНК экспрессируется и направляет фермент на конкретный участок ДНК, фермент разрезает ДНК и экзогенная нуклеиновая кислота встраивается в ДНК в месте разреза, при этом получается клетка, обладающая несколькими изменениями или вставками экзогенной ДНК в ДНК внутри стволовой клетки. Согласно одному аспекту, стволовая клетка, экспрессирующая фермент, была генетически изменена для экспрессии фермента, например, путем введения в клетку нуклеиновой кислоты, кодирующей фермент, которая может экспрессироваться стволовой клеткой. Таким образом, аспекты настоящего изобретения включают циклические стадии введения РНК в стволовую клетку, которая экспрессирует фермент, введения экзогенной донорной нуклеиновой кислоты в стволовую клетку, которая экспрессирует РНК, образования комплекса колокализации РНК, фермента и ДНК, ферментативное разрезание ДНК ферментом, и вставку донорной нуклеиновой кислоты в ДНК. Цикл или повторение вышеуказанных стадий приводит к мультиплексной генетической модификации стволовых клеток во множестве локусов, т. е. приводит к образованию стволовой клетки, имеющей множество генетических модификаций.

В соответствии с некоторыми аспектами, ДНК-связывающие белки или ферменты в пределах объема настоящего изобретения включают белок, который образует комплекс с направляющей РНК, и с помощью направляющей РНК комплекс направляется к двухцепочечной последовательности ДНК, где комплекс связывается с последовательностью ДНК. Согласно одному аспекту, фермент может быть РНК направляемым ДНК-связывающим белком, таким как РНК направляемый ДНК-связывающий белок системы CRISPR II типа, который связывается с ДНК и направляется РНК. Согласно одному аспекту, направляемый РНК ДНК-связывающий белок представляет собой белок Cas9.

Этот аспект настоящего изобретения может быть отнесен к колокализации РНК и ДНК-связывающего белка с двухцепочечной ДНК. Таким образом, комплекс ДНК-связывающего белка-направляющей РНК может быть использован для расщепления множества участков на двухцепочечной ДНК, с образованием таким образом стволовой клетки с несколькими генетическими модификациями, например, множественными вставками экзогенной донорной ДНК.

В соответствии с некоторыми аспектами, предлагается способ внесения нескольких изменений в ДНК-мишень в стволовой клетке, экспрессирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, который включает (а) введение в стволовую клетку первой чужеродной нуклеиновой кислоты, кодирующей одну или несколько РНК, комплементарных ДНК-мишени, которые направляют фермент к ДНК-мишени, где одна или несколько РНК и фермент являются членами комплекса колокализации с ДНК-мишенью, введение в стволовую клетку второй чужеродной нуклеиновой кислоты, кодирующей одну или несколько последовательностей донорной нуклеиновой кислоты, где одна или несколько РНК и одна или несколько последовательностей донорной нуклеиновой кислоты экспрессируются, где одна или несколько РНК и фермент колокализуются с ДНК-мишенью, фермент расщепляет ДНК и донорная нуклеиновая кислота встраивается в ДНК-мишень, с получением таким образом измененной ДНК в стволовой клетке, и повторение стадии (а) несколько раз, для внесения множества изменений в ДНК стволовой клетки.

Согласно одному аспекту, длина РНК составляет от около 10 до около 500 нуклеотидов. Согласно одному аспекту, длина РНК составляет от около 20 до около 100 нуклеотидов.

Согласно одному аспекту, одна или несколько РНК представляют собой направляющую РНК. Согласно одному аспекту, одна или несколько РНК представляют собой химеру tracrRNA-crRNA.

Согласно одному аспекту, ДНК представляет собой геномную ДНК, митохондриальную ДНК, вирусную ДНК или экзогенную ДНК.

Согласно одному аспекту, клетка может быть генетически модифицирована для обратимого включения нуклеиновой кислоты, кодирующей ДНК-связывающий фермент, с использованием вектора, который может быть легко удален с помощью фермента. Полезные векторы и способы известны специалистам в данной области техники и включают лентивирусы, аденоассоциированный вирус, опосредованные нуклеазами и интегразами способы направленной вставки и способы вставки, опосредованные транспозонами. Согласно одному аспекту, нуклеиновая кислота, кодирующая ДНК-связывающую фермент, который был добавлен, например, с помощью кассеты или вектора, к примеру, может быть удалена полностью вместе с кассетой и вектором, не оставляя часть такой нуклеиновой кислоты, кассеты или вектора в геномной ДНК. Такое удаление упоминается в данной области техники как «не оставляющее шрамов» удаление, поскольку геном становится таким же, каким он был до добавления нуклеиновой кислоты, кассеты или вектора.

Одним примерным воплощением вставки и удаления без шрамов является вектор PiggyBac, коммерчески доступный у System Biosciences.

Дополнительные признаки и преимущества определенных воплощений настоящего изобретения станут более очевидными в следующем описании воплощений и чертежей, и из формулы изобретения.

Краткое описание чертежей

Вышеуказанные и другие признаки и преимущества настоящих воплощений будут более понятны из нижеследующего подробного описания иллюстративных воплощений, рассматриваемых вместе с сопроводительными чертежами, где:

Фиг. 1 относится к функциональным тестам re-TALENs в соматических и стволовых клетках человека.

(а) Схематическое изображение экспериментального проекта для тестирования эффективности направленного воздействия на геном. Интегрированная в геном последовательность, кодирующая GFP, нарушается вставкой стоп-кодона и 68 п.о. геномного фрагмента, полученного из локуса AAVS1 (внизу). Восстановление последовательности GFP с помощью нуклеазо-опосредованной гомологичной рекомбинации с помощью донора tGFP (вверху) приводит к образованию клеток GFP⁺, которые могут быть количественно оценены с помощью FACS. Re-TALENs и TALENs направлено воздействуют на одинаковые последовательности в пределах фрагментов AAVS1.

(b) Столбиковая диаграмма, демонстрирующая процент GFP⁺ клеток, полученных с помощью только tGFP-донора отдельно, с помощью TALENs с tGFP-донором и re-TALENs с tGFP-донором в локусе-мишени, согласно измерениям с помощью FACS. (N = 3, планки погрешности = SD). Репрезентативные графики FACS показаны ниже.

(с) Схематический обзор, изображающий стратегию направленного воздействия, для нативного локуса AAVS1. Плазмида-донор содержит акцептор сплайсинга (SA) - 2A (саморасщепляющиеся пептиды), ген устойчивости к пуромицину (PURO) и GFP (см. источник 10, включенный в данный документ ссылкой в полном объеме). Места расположения ПЦР-праймеров, используемых для обнаружения успешных событий редактирования, изображены в виде голубых стрелок.

(d) Подвергнутые успешному направленному воздействию клоны PGP1 hiPSCs отбирали на пуромицине (0,5 мкг/мл) в течение 2 недель. Показаны микроскопические изображения трех представительных GFP⁺ клонов. Клетки также окрашивали по маркерам плюрипотентности TRA-1-60. Измерительная линейка: 200 мкм.

(e) Анализы ПЦР, выполненные на этих моноклональных GFP⁺ hiPSC клонах, продемонстрировали успешное встраивание донорных кассет в участок AAVS1 (дорожки 1,2,3), в то время как обычные hiPSCs не демонстрировали никаких признаков успешного встраивания (дорожка C).

(f) Отображение последовательности SEQ ID NO: 1.

Фиг. 2 относится к сравнению эффективности направленного воздействия на геном с помощью reTALENs и Cas9-гидРНК на CCR5 в iPSCs.

(а) Схематическое изображение эксперимента по геномной инженерии. В целевой участок пары re-TALEN или Cas9-гидРНК в PGP1 hiPSCs доставляли 90-мер ssODN, несущий 2 п.о. несоответствие относительно геномной ДНК, вместе с конструкциями reTALEN или Cas9-гидРНК. Участки расщепления нуклеазами изображены на фигуре в виде красных стрелок.

(b) Анализ глубоким секвенированием эффективностей HDR и NHEJ для пар re-TALEN (CCR5 #3) и ssODN, или Cas9-гидРНК и ssODN. Изменения в геноме hiPSCs анализировали на основе данных о последовательности, полученной высокопроизводительными способами, с помощью GEAS. Вверху: HDR количественно оценивали из фракции ридов, содержащих 2 п.о. точечные мутации, встроенных в центр ssODN (синий), а активность NHEJ количественно оценивали из фракции делеций (серые)/вставок (красные) в каждом конкретном положении в геноме. Для графиков reTALEN и ssODN, зеленый пунктир нанесен для того, чтобы отметить внешнюю границу участков связывания пар re-TALENs, которые находятся в положениях -26 п.о. и + 26 п.о. относительно центра двух участков связывания re-TALEN. Для графиков Cas9-гидРНК и ssODN, зеленый пунктир отмечает внешнюю границу участка направленного воздействия гидРНК, который находится в положениях -20 и -1 п.о. по отношению к последовательности РАМ. Внизу: распределение по размерам Делеция/Вставка в hiPSCs анализировали по всей популяции NHEJ с обработкой, указанной выше.

(с) Эффективность редактирования генома re-TALENs и Cas9-гидРНК, направленно воздействовавших на CCR5 в PGP1 hiPSCs.

Вверху: схематическое представление участков, подвергшихся направленному редактированию геномов в CCR5. 15 участков для направленного воздействия показаны синими стрелками снизу. Для каждого участка клетки котрансфецировали парой re-TALENs и их соответствующего донорного ssODN, несущего 2 п.о. несовпадение относительно геномной ДНК. Эффективность редактирования генома анализировали через 6 дней после трансфекции. Аналогичным образом, 15 Cas9-гидРНК трансфецировали с соответствующими ssODNs индивидуально в PGP1-hiPSCs для направленного воздействия не те же 15 участков и анализировали эффективность через 6 дней после трансфекции. Внизу: эффективность редактирования генома re-TALENs и Cas9-гидРНК при направленном целевом воздействии на CCR5 в PGP1 hiPSCs. Панели 1 и 2 демонстрируют эффективности NHEJ и HDR, опосредованные reTALENs. Панель 3 и 4 демонстрируют эффективности NHEJ и HDR, опосредованные Cas9-гидРНК. Показатели NHEJ рассчитывали по частоте геномных аллелей, несущих делеции или вставки в подвергнутом направленному воздействию участке; показатели HDR рассчитывали по частоте геномных аллелей, несущих 2 п.о. несоответствия. Панель 5, профиль DNAseI HS для клеточной линии hiPSC из базы данных ENCODE (Duke DNase HS, iPS NIHi7 DS). Следует отметить, что масштабы панелей отличаются.

Фиг. 3 направлена на изучение функциональных параметров, регулирующих ssODN-опосредованную HDR с re-TALENs или Cas9-гидРНК в PGP1 hiPSCs.

(а) PGP1 hiPSCs котрансфецировали с помощью пары re-TALENs (#3) и ssODNs различной длины (50, 70, 90,110, 130 150 170 нуклеотидов). Все ssODNs обладали идентичным 2 п.о. несовпадением относительно геномной ДНК в середине своей последовательности. 90-мерный ssODN достиг оптимального уровня HDR в подвергнутом направленному воздействию геноме. Оценка HDR-, NHEJ-опосредованной эффективности делеции и вставки описана в данном документе.

(b) 90-мерные ssODNs, соответствующие паре re-TALEN # 3, каждая из которых содержит 2 п.о. несовпадение (А) в центре и дополнительное 2 п.о. несовпадение (B) в разных положениях, смещенных от А (где смещения варьировали от -30 п.о. -> 30 п.о.), были использованы для тестирования последствий отклонения от гомологии вдоль ssODN. Эффективность редактирования генома каждого ssODN оценивали в PGP1 hiPSCs. Нижняя столбиковая диаграмма демонстрирует частоту включения только А, только В и А + В в подвергнутом направленному воздействию геноме. Показатели HDR уменьшались по мере увеличения расстояния от центра участка с отклонением по гомологии.

(с) ssODNs, нацеленные на участки с варьирующими расстояниями (-620 п.о. ~ 480 п.о.) от участка-мишени пары #3 re-TALEN, были испытаны для оценки максимального расстояния, в пределах которого ssODNs могут быть помещены для введения мутаций. Все ssODNs несли 2 п.о. несоответствие в середине своих последовательностей. Наблюдали минимальную эффективность HDR (<= 0,06%), когда несовпадение в ssODN располагалось на расстоянии 40 п.о. от середины участка связывания пары re-TALEN.

(d) PGP1 hiPSCs котрансфецировали Cas9-гидРНК (AAVS1) и ssODNs различной ориентации (Ос: комлпементарная гидРНК; On: некомплементарная гидРНК) и разной длины (30, 50, 70, 90, 110 нуклеотидов). Все ssODNs обладали идентичными 2 п.о. несовпадениями относительно геномной ДНК в середине своих последовательностей. 70-мерный Ос достигал оптимального значения HDR в подвергнутом направленному воздействию геноме.

Фиг. 4 направлен на использование re-TALENs и ssODNs для получения моноклональных hiPSCc отредактированным геномом без селекции.

(а) Временная шкала эксперимента.

(b) Эффективность редактирования генома пары re-TALENs и ssODN (# 3), оценивали с помощью платформы NGS, описанной на фигуре 2b.

(с) Результаты секвенирования по Сенгеру колоний моноклональных hiPSC после редактирования генома. 2 п.о. гетерогенный генотип (CT/CT->TA/CT) был успешно внедрен в геном колоний PGP 1-IPS-3-11, PGPl-IPS-3-13.

(d) Иммунофлуоресцентное окрашивание подвергнутых направленному воздействию PGPl-IPS-3-11. Клетки окрашивали на маркеры плюрипотентности TRA-1-60 и SSEA4.

(e) Гематоксилин-эозиновое окрашивание срезов тератом, полученных из моноклональных клеток PGPl-IPS-3-11.

Фиг. 5. Дизайн reTALE. (a) Выравнивание последовательности исходного мономера TALE RVD относительно мономеров в re-TALE-16.5 (re-TALE-M1>re-TALE-M17). Нуклеотидные изменения относительно исходной последовательности выделены серым, (b) Тест повторяемости re-TALE с помощью ПЦР. Верхняя панель показывает структуру re-TALE/TALE и позиции праймеров для ПЦР-реакции. Нижняя панель показывает полосы ПЦР в условиях, указанных ниже. Электрофоретическая картина фрагментов ПЦР представлена с помощью исходного шаблона TALE (правая дорожка).

Фиг. 6. Дизайн и практическое осуществление сборки TASA (TALE Single-incubation Assembly), (а) Схематическое представление библиотеки димерных блоков re-TALE для сборки TASA. Представлена библиотека 10 димерных блоков re-TALE, кодирующих два RVDs. Внутри каждого блока, все 16 димеров имеют одну и ту же последовательность, за исключением последовательностей, кодирующих RVD; Димеры в различных блоках имеют отличающиеся последовательности, но спроектированы таким образом, чтобы они имели общие 32 п.о. перекрывания с соседними блоками. Нуклеотидная и аминокислотная последовательности одного димера (Блок 6_AC) представлены справа.

(b) Схематическое представление сборки TASA. На левой панели показан способ сборки TASA: однореакторная реакция инкубации проводится с ферментной смесью/re-TALE блок s/re-TALE-N/TF каркасными векторами. Продукт реакции может быть использован непосредственно для трансформации бактерий. Правая панель демонстрирует механизм TASA. Вектор назначения линеаризуется эндонуклеазой при 37°C для того, чтобы отрезать контрселективную кассету ccdB; экзонуклеаза, которая обрабатывает конец блоков и линеаризованных векторов, экспонирует оцДНК выступы на конце фрагментов, что позволяет блокам и векторным каркасам соединяться в назначенном порядке. При повышении температуры до 50°C, полимеразы и лигазы работают вместе для того, чтобы заделать разрыв, что позволяет получить конечные конструкции, готовые к трансформации.

(с) Эффективность сборки TASA для re-TALEs, обладающих разными длинами мономеров. Используемые для сборки блоки показаны слева, а эффективность сборки представлена справа.

Фиг. 7. Функциональность и целостность последовательности Lenti-reTALEs. Клетки 293T, трансдуцированные lenti-re-TALE-TF показали 36x активацию экспрессии репортера по сравнению с только отрицательным репортером.

Фиг. 8. Чувствительность и воспроизводимость GEAS.

(А) Информационный анализ предела обнаружения HDR. С учетом набора данных re-TALENs (# 10)/ssODN, были определены «риды», содержащие ожидаемое редактирование (HDR) и эти HDR-«риды» систематически удалялись для создания различных искусственных наборов данных с «разведенным» редактирующим сигналом. Наборы данных с 100, 99,8, 99,9, 98,9, 97,8, 89,2, 78,4, 64,9, 21,6, 10,8, 2,2, 1,1, 0,2, 0,1, 0,02 и 0% удалением HDR-«ридов» были сгенерированы для получения искусственных наборов с эффективностью HR в диапазоне 0-0,67%. Для каждого отдельного набора данных, была оценена взаимная информация (mutual information, MI) фонового сигнала (обозначено фиолетовым) и сигнала, полученного в участке направленного воздействия (обозначено зеленым). MI в участке направленного воздействия заметно выше, чем фон, при этом эффективность HDR выше 0,0014%. По оценке предел обнаружения HDR находится в диапазоне от 0,0014% до 0,0071%. Расчет MI описан в данном документе.

(b) Тест воспроизводимости системы оценки редактирования генома. Пары графиков (верхний и нижний) демонстрируют результаты оценки HDR и NHEJ в двух повторах с парой re-TALENs и типом клеток, указанным выше. Для каждого эксперимента независимо были проведены нуклеофекция, направленная амплификация генома, глубокое секвенирование и анализ данных. Разброс повторов при оценке редактирования генома рассчитывали как V2 (|HDRl-HDR2|)/((HDR+HDR2)/2) =AHDR/HDR и V2 (|NHEJ1-NHEJ2|) /((NHEJl+NHEJ2)/2) =ANHEJ/NHEJ, а результаты по разбросу приведены ниже графиков. Средний разброс системы составил (19% + 11% + 4% + 9% + 10% + 35%)/6 = 15%. Факторы, которые могут способствовать разбросу, включают статус клеток при нуклеофекции, эффективность нуклеофекции, охват и качество секвенирования.

Фиг. 9. Статистический анализ эффективностей NHEJ и HDR при использовании reTALENs и Cas9-гидРНК на CCR5.

(а) Корреляция эффективностей HR и NHEJ при использовании reTALENs на одинаковых участках в iPSCs (i=0,91, P <IX 10-5).

(b) Корреляция эффективностей HR и NHEJ, опосредованных Cas9-гидРНК на одинаковых участках в iPSCs (i=0,74, р=0,002).

(с) Корреляция эффективности NHEJ, опосредованной Cas9-гидРНК и температуры Tm целевого участка для гидРНК в iPSCs (г=0,52, р=0,04)

Фиг. 10. Корреляционный анализ эффективности редактирования генома и эпигенетического состояния. Корреляции Пирсона использовали для изучения возможных связей между чувствительностью ДНКазы I и эффективностью геномной инженерии (HR, NHEJ). Наблюдаемую корреляцию сравнивали с рандомизированным набором (N = 100000). Наблюдаемые корреляции выше 95-го процентиля или ниже 5-го процентиля моделируемого распределения считались потенциальными ассоциациями. Не наблюдали заметной корреляции между чувствительностью ДНКазы 1 и эффективностью NHEJ/HR.

Фиг. 11. Влияние гомологичного спаривания при ssODN-опосредованном редактировании генома.

(а) В эксперименте, описанном на рисунке 3b, общая HDR снижалось, что измерялось по темпам, с которыми происходило включение среднего 2 п.о. несовпадения (А), по мере того, как росла дистанция на которую вторичные несовпадения В удалялись от А (относительное положение В по отношению к А, к варьирует от -30 до 30 п.о.). Более высокие темпы включения, когда В находится всего лишь в 10 п.о. от A (-10 п.о. и + 10 п.о.) могут отражать меньшую потребность в спаривании ssODN против геномной ДНК, проксимальной к двухцепочечному разрыву ДНК.

(b) Распределение длин генной конверсии вдоль ssODN. На каждом расстоянии В от А, доля событий HDR включает только А, тогда как друга доля включает как А, так и В. Эти два события могут интерпретироваться в терминах трактов конверсии генов (Elliott et al., 1998), в результате чего A+B-события представляют длинные конверсионные тракты, которые выходят за рамки только В и только А событий, представляющие более короткие пути, которые не достигают В. Согласно данной интерпретации, может быть оценено распределение трактов генной конверсии в обоих направлениях вдоль олигонуклеотида (середина ssODN определяется как 0, конверсионные тракты по направлению к 5'-концу ssODN - как «-» направление, а к 3'-концу - как «+» направление). Тракты генной конверсии постепенно уменьшаются по мере увеличения их длин, результат очень похожий на распределение трактов генной конверсии, наблюдаемое с дцДНК-донорами, но на сильно сжатой шкала дистанций в десятки п.о. для одноцепочечных олигодезоксинуклеотидов по сравнению с сотнями пар оснований для дцДНК-доноров.

(с) Анализы трактов генной конверсии с использованием одиночного ssODN, который содержит ряд мутаций, и измерение непрерывных последовательностей включений. Использовали ssODN-донор с тремя парами 2 п.о. несовпадений (оранжевый), разнесенных с интервалом в 10 нуклеотидов в обе стороны от центрального 2 п.о. несовпадения (вверху). Было обнаружено незначительное количество «ридов» геномного секвенирования (см. источник 62, включенный в данный документ ссылкой в полном объеме), несущих >=1 несовпадения, определенных с помощью ssODN среди> 300 000 «ридов» при секвенировании этой области. Все эти «риды» были нанесены на график (внизу), а последовательность «ридов» была закодирована условной окраской. Оранжевый: определенные несоответствия; зеленый: последовательность дикого типа. Геномное редактирование с этими ssODN дало паттерн, в котором средняя мутация отдельно была включена в 85% (53/62) моментов времени, с множеством В- несовпадений, включенных в другие моменты. Хотя количество событий В-включений было слишком низким для оценки распределения длин путей > 10 п. о., ясно, что преобладает область коротких путей от -10 до 10 п.о.

Фиг. 12. Эффективности редактирования генома Cas9-гидРНК нуклеазой и никазами.

PGP1 iPSCs котрансфецировали комбинацией нуклеазы (С2) (Cas9-гидРНК) или никазы (Cc) (Cas9D10A-гидРНК) и ssODNs различной ориентации (Oc и On). Все ssODNs обладали идентичным 2 п.о. несовпадением относительно геномной ДНК в середине своей последовательности. Оценка HDR описана в данном документе.

Фиг. 13. Дизайн и оптимизация последовательности re-TALE.

Последовательность re-TALE подвергали эволюции в течение нескольких циклов дизайна для устранения повторов. В каждом цикле оценивали синонимичные последовательности из каждого повтора. Отбирали те из них, которые имели наибольшее расстояние Хэмминга к эволюционирующей ДНК. Окончательная последовательность имела cai = 0,59 ΔG = -9,8 ккал/моль. Для выполнения общей основы для дизайна синтетического белка использовали пакет R.

Фиг. 14 представляет собой изображение геля, демонстрирующее проверку с помощью ПЦР геномной вставки Cas9 в клетки PGP1. Дорожки 3, 6, 9, 12 являются продуктами ПЦР обычных клеточных линий PGP1.

Фиг. 15 представляет собой график уровня экспрессии мРНК Cas9 при индукции.

Фиг. 16 представляет собой график, показывающий эффективность направленного воздействия на геном РНК с различным дизайном.

Фиг. 17 представляет собой график, показывающий эффективность направленного воздействия на геном 44% гомологичной рекомбинации, достигнутой с помощью химеры направляющей РНК- донорной ДНК.

Фиг. 18 является схемой, демонстрирующей генотип изогенных клеточных линий PGP 1, полученных с помощью системы, описанной в данном документе. PGPl-IPS-BTHH имеет фенотип с однонуклеотидными делециями, как у пациентов с BTHH. PGP 1-NHEJ имеет 4 п.о. делеции, которые образуют мутации со сдвигом рамки считывания другим образом.

Фиг. 19 представляет собой график, показывающий, что кардиомиоциты, полученные из изогенных PGP1 iPS, воспроизводят дефектную выработку АТФ и специфическую активность F1F0 АТФазы, как продемонстрировано в пациент-специфических клетках.

Фиг. 20 показывает последовательности для последовательности re-TALEN-основной и основной последовательности re-TALE-TF.

Подробное описание

Аспекты настоящего изобретения относятся к применению TALEN, которая утратила определенные повторяющиеся последовательности, для инженерии нуклеиновых кислот, например, путем расщепления двухцепочечной нуклеиновой кислоты. Применение TALEN для расщепления двухцепочечной нуклеиновой кислоты может привести к негомологичному соединению концов (NHEJ) или к гомологичной рекомбинации (HR). Аспекты настоящего раскрытия также предусматривают применение TALEN, которая утратила повторяющиеся последовательности, для инженерии нуклеиновых кислот, например, путем расщепления двухцепочечной нуклеиновой кислоты в присутствии донорной нуклеиновой кислоты и введения донорной нуклеиновой кислоты в двухцепочечную нуклеиновую кислоту, например, путем негомологичного соединения концов (NHEJ) или гомологичной рекомбинации (HR).

Эфеекторные нуклеазы, подобные активаторам транскрипции (TALEN) известны в данной области техники и включают искусственные ферменты рестрикции, полученные слиянием ДНК-связывающего домена TAL-эффектора с ДНК-расщепляющим доменом. Ферменты рестрикции являются ферментами, которые разрезают цепи ДНК в определенной последовательности. Эффекторы, подобные активаторам транскрипции (TALE) могут быть сконструированы для связывания с искомой последовательностью ДНК. См. Boch, Jens (February 2011). "TALEs of genome targeting". Nature Biotechnology 29 (2): 135-6, включенный в данный документ ссылкой в полном объеме. Путем объединения такого сконструированного TALE с ДНК-расщепляющим доменом (который разрезает нити ДНК), получается TALEN, которая является ферментом рестрикции, специфичным к любой искомой последовательности ДНК. В соответствии с некоторыми аспектами, TALEN вводят в клетку для целевого редактирования нуклеиновой кислоты in situ, например, для редактирования генома in situ.

Согласно одному аспекту, неспецифический ДНК-расщепляющий домен с конца эндонуклеазы FokI может быть использован для создания гибридных нуклеаз, которые активны в клетках дрожжей, растений и животных. Домен FokI функционирует в виде димера, требующего две конструкции с уникальными ДНК-связывающими доменами для участков в геноме-мишени с правильной ориентацией и расстоянием. Как число аминокислотных остатков между TALE ДНК-связывающим доменом и расщепляющим доменом Fokl, так и количества оснований между двумя отдельными участками связывания TALEN оказывают влияние на активность.

Взаимоотношение между аминокислотной последовательностью и распознаванием ДНК связывающим доменом TALE позволяет создавать конструируемые белки. Компьютерные программы, такие как «DNA Works» могут быть использованы для разработки TALE-конструкций. Другие способы разработки TALE-конструкций известны специалистам в данной области техники. См. Cermak, Т.; Doyle, E. L.; Christian, M.; Wang, L.; Zhang, Y.; Schmidt, C; Bailer, J. A.; Somia, N. V. et al. (2011). "Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting". Nucleic Acids Research. doi:10. 1093/nar/gkr218; Zhang, Feng; et. al. (February 2011). "Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription", Nature Biotechnology 29 (2): 149-53; Morbitzer, R.; Elsaesser, J.; Hausner, J.; Lahaye, T. (2011). "Assembly of custom TALE-type DNA binding domains by modular cloning". Nucleic Acids Research. doi:10'1093/nar/gkrl51; Li, Т.; Huang, S.; Zhao, X.; Wright, D.A.; Carpenter, S.; Spalding, M.H.; Weeks, D.P.; Yang, B. (2011). "Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes". Nucleic Acids Research. doi"10. 1093/nar/gkrl88; GeipTer, R.; Scholze, H.; Hahn, S.; Streubel, J.; Bonas, U.; Behrens, S.E.; Boch, J. (2011). "Transcriptional Activators of Human Genes with Programmable DNA-Specificity". In Shiu, Shin-Han. PLoS ONE 6 (5): el9509; Weber, E.; Graetzner, R.; Werner, S.; Engler, C; Marillonnet, S. (2011). "Assembly of Designer TAL Effectors by Golden Gate Cloning". In Bendahmane, Mohammed. PLoS One 6 (5): el9722, которые включены в данный документ ссылкой в полном объеме.

В соответствии с типичным аспектом, сразу после сборки гены TALEN можно вставлять в плазмиды, в соответствии с определенными воплощениями; плазмиды затем используются для трансфекции клетки-мишени, при этом генные продукты экспрессируются и входят в ядро для доступа к геному. Согласно типичным аспектам, TALEN, как описано в данном документе, могут быть использованы для редактирования целевой нуклеиновой кислоты, например, генома, с помощью индукции двухцепочечных разрывов (DSB), на которые клетки реагируют посредством механизмов репарации. Примерные механизмы репарации включают негомологичное соединение концов (NHEJ), который восстанавливает ДНК по обе стороны от двухцепочечного разрыва, где имеется весьма незначительное перекрывание для отжига, или такое перекрывание отсутствует вовсе. Этот репаративный механизм индуцирует ошибки в геноме, через вставку или делецию (indel), или хромосомную перестройку; такие ошибки могут сделать генные продукты, кодируемые в данном месте, нефункциональными. См. Miller, Jeffrey; et. al. (February 2011). "A TALE nuclease architecture for efficient genome editing". Nature Biotechnology 29 (2): 143-8, включенный в данный документ ссылкой в полном объеме. Поскольку эта активность может изменяться в зависимости от используемых вида, типа клеток, гена-мишени, и нуклеазы, активность можно контролировать с помощью анализа гетеродуплексного расщепления, который не обнаруживает никакой разницы между двумя аллелеями, амплифицированными с помощью ПЦР. Продукты расщепления могут быть визуализированы на простом агарозном геле или блочной гелевой системе.

В ином случае, ДНК может быть введена в геном посредством NHEJ в присутствии экзогенных фрагментов двухцепочечной ДНК. Управляемая гомологией репарация также может ввести чужеродную ДНК в DSB, поскольку трансфецированные двухцепочечные последовательности используются в качестве шаблонов для ферментов репарации. В соответствии с некоторыми аспектами, TALEN, описанные в данном документе, могут быть использованы для получения стабильно модифицированных человеческих эмбриональных стволовых клеток и клонов индуцированных плюрипотентных стволовых клеток (iPSCs). В соответствии с некоторыми аспектами, TALEN, описанные в данном документе, могут быть использованы для получения нокаутных видов, таких как C. elegans, нокаутные крысы, нокаутные мыши или нокаутные данио-рерио.

Согласно одному аспекту настоящего раскрытия, воплощения нацелены на применение экзогенной ДНК, нуклеазных ферментов, таких как ДНК-связывающие белки и направляющие РНК, для колокализации с ДНК в стволовой клетке и гидролиза или разрезания ДНК с вставкой экзогенной ДНК. Такие ДНК-связывающие белки хорошо известны специалистам в данной области техники, для связывания с ДНК для различных целей. Такие ДНК-связывающие белки могут быть природными. ДНК-связывающие белки, включенные в объем настоящего изобретения, включают те, которые могут направляться РНК, которые называются в данном документе как направляющие РНК. Согласно этому аспекту, направляющая РНК и РНК-направляемый ДНК-связывающий белок образуют комплекс колокализации на ДНК. Такие ДНК-связывающие белки, обладающие нуклеазной активностью, известны специалистам в данной области техники, и включают природные ДНК-связывающие белки, имеющие нуклеазную активность, такие как белки Cas9, присутствующие, например, в системах CRISPR II типа. Такие белки Cas9 и системы CRISPR типа II хорошо описаны в данной области техники. См. Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477 включая всю дополнительную информацию, включенный в данный документ ссылкой в полном объеме.

Типичные ДНК-связывающие белки имеют функцию нуклеазной активности для внесения одноцепочечных разрывов (ников) или разрезания двухцепочечной ДНК. Такая нуклеазная активность может быть результатом действия ДНК-связывающего белка, имеющего одну или несколько полипептидных последовательностей, демонстрирующих нуклеазную активность. Такие типичные ДНК-связывающие белки могут иметь два отдельных нуклеазных домена, при этом каждый домен отвечает за разрезание или внесение одноцепочечных разрывов конкретной цепи двухцепочечной ДНК. Типичные полипептидные последовательности, имеющие нуклеазную активность, известные специалистам в данной области, включают домен, родственный нуклеазе McrA-HNH и домен RuvC-подобной нуклеазы. Соответственно, типичными ДНК-связывающими белками являются те, которые по своей природе содержат один или несколько из числа домена, родственного нуклеазе McrA-HNH и домен RuvC-подобной нуклеазы.

Типичный ДНК-связывающий белок представляет собой РНК управляемый ДНК-связывающий белок системы CRISPR II типа. Типичный ДНК-связывающий белок представляет собой белок Cas9.

В S. pyogenes, Cas9Cas9 образует двухцепочечной разрыв с тупыми концами на 3 п.о. выше мотива PAM (прилегающий к протоспейсеру мотив) с помощью процесса, опосредованного двумя каталитическими доменами в белке: доменом HNH, который расщепляет комплементарную нить ДНК и доменом подобного RuvC, который расщепляет некомплементарную цепь. См. Jinke et al., Science, 337, 816-821 (2012), включенный в данный документ ссылкой в полном объеме. Белки Cas9, как известно, существуют во многих системах CRISPR типа II, включая те, которые определены в дополнительных документах к Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477: Methanococcus maripaludis C7; Corynebacterium diphtheriae; Corynebacterium efficiens YS-314; Corynebacterium glutamicum ATCC 13032 Kitasato; Corynebacterium glutamicum ATCC 13032 Bielefeld; Corynebacterium glutamicum R; Corynebacterium kroppenstedtii DSM 44385; Mycobacterium abscessus ATCC 19977; Nocardia farcinica IFM10152; Rhodococcus erythropolis PR4; Rhodococcus jostii RHA1; Rhodococcus opacus B4 uid36573; Acidothermus cellulolyticus 11B; Arthrobacter chlorophenolicus A6; Kribbella flavida DSM 17836 uid43465; Thermomonospora curvata DSM 43183; Bifidobacterium dentium Bdl; Bifidobacterium longum DJO10A; Slackia heliotrinireducens DSM 20476; Persephonella marina EX HI; Bacteroides fragilis NCTC 9434; Capnocytophaga ochracea DSM 7271; Flavobacterium psychrophilum JIP02 86; Akkermansia muciniphila ATCC BAA 835; Roseiflexus castenholzii DSM 13941; Roseiflexus RSI; Synechocystis PCC6803; Elusimicrobium minutum Peil91; бактериальный филотип Rs D17 некультивированной группы 1 Termite; Fibrobacter succinogenes S85; Bacillus cereus ATCC 10987; Listeria innocua;Lactobacillus casei; Lactobacillus rhamnosus GG; Lactobacillus salivarius UCC118; Streptococcus agalactiae A909; Streptococcus agalactiae NEM316; Streptococcus agalactiae 2603; Streptococcus dysgalactiae equisimilis GGS 124; Streptococcus equi zooepidemicus MGCS10565; Streptococcus gallolyticus UCN34 uid46061; Streptococcus gordonii Challis subst CHI; Streptococcus mutans NN2025 uid46353; Streptococcus mutans; Streptococcus pyogenes Ml GAS; Streptococcus pyogenes MGAS5005; Streptococcus pyogenes MGAS2096; Streptococcus pyogenes MGAS9429; Streptococcus pyogenes MGAS10270; Streptococcus pyogenes MGAS6180; Streptococcus pyogenes MGAS315; Streptococcus pyogenes SSI-1; Streptococcus pyogenes MGAS 10750; Streptococcus pyogenes NZ131; Streptococcus thermophiles CNRZ1066; Streptococcus thermophiles LMD-9; Streptococcus thermophiles LMG 18311; Clostridium botulinum A3 Loch Maree; Clostridium botulinum В Eklund 17B; Clostridium botulinum Ba4 657; Clostridium botulinum F Langeland; Clostridium cellulolyticum H10; Finegoldia magna ATCC 29328; Eubacterium rectale ATCC 33656; Mycoplasma gallisepticum; Mycoplasma mobile 163K; Mycoplasma penetrans; Mycoplasma synoviae 53; Streptobacillus moniliformis DSM 12112; Bradyrhizobium BTAil; Nitrobacter hamburgensis X14; Rhodopseudomonas palustris BisB18; Rhodopseudomonas palustris BisB5; Parvibaculum lavamentivorans DS-1; Dinoroseobacter shibae DFL 12; Gluconacetobacter diazotrophicus Pal 5 FAPERJ; Gluconacetobacter diazotrophicus Pal 5 JGI; Azospirillum B510 uid46085; Rhodospirillum rabram ATCC 11170; Diaphorobacter TPSY uid29975; Verminephrobacter eiseniae EF01-2; Neisseria meningitides 053442; Neisseria meningitides alphal4; Neisseria meningitides Z2491; Desulfovibrio salexigens DSM 2638; Campylobacter jejuni doylei 269 97; Campylobacter jejuni 81116; Campylobacter jejuni; Campylobacter lari RM2100; Helicobacter hepaticus; Wolinella succinogenes; Tolumonas auensis DSM 9187; Pseudoalteromonas atlantica T6c; Shewanella pealeana ATCC 700345; Legionella pneumophila Paris; Actinobacillus succinogenes 130Z; Pasteurella multocida; Francisella tularensis novicida U112; Francisella tularensis holarctica; Francisella tularensis FSC 198; Francisella tularensis tularensis; Francisella tularensis WY96-3418; и Treponema denticola ATCC 35405. Соответственно, аспекты настоящего раскрытия направлены на белок Cas9, присутствующий в системе CRISPR II типа.

Белок Cas9 может быть назван специалистом в данной области литературы как Csn1. Белок Cas9 из S. pyogenes показан ниже. См. Deltcheva et al., Nature 471, 602-607 (2011), включенный в данный документ ссылкой в полном объеме.

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGET

AEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHER

HPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGD

LNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPG

EKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYAD

LFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKY

KEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTF

DNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAW

MTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYN

ELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVE

ISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTY

AHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFM

QLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVM

GRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNE

KLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGK

SDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLV

ETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINN

YHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAK

YFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN

IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVE

KGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELEN

GRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHK

HYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAP

AAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD-

Согласно одному аспекту, управляемый РНК ДНК-связывающий белок включает гомологи и ортологи Cas9, которые сохраняют способность белка связываться с ДНК, быть управляемыми РНК и разрезать ДНК. Согласно одному аспекту, белок Cas9 включает последовательность, которая представлена в естественном белке Cas9 из S. pyogenes и белковых последовательностях, гомологичных, по меньшей мере, на 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95 %, 98% или 99% к этому белку, и, являющихся ДНК-связывающим белком, таким как направляемый РНК ДНК-связывающий белок.

Согласно одному аспекту предлагается сконструированная система Cas9-гидРНК, которая позволяет осуществить направляемое РНК разрезание генома сайт-специфическим образом в стволовой клетке, при необходимости, и модификацию генома стволовой клетки путем вставки экзогенных донорных нуклеиновых кислот. Направляющие РНК являются комплементарными к участкам-мишеням или локусам-мишеням на ДНК. Направляющие РНК могут быть химерами crRNA-tracrRNA. Направляющие РНК могут быть введены из среды, окружающей клетки. Таким образом, предлагается способ непрерывной модификации клетки, которая осуществляется при внесении направляющих РНК в окружающую среду и при поглощении данных направляющих РНК и при обогащении среды дополнительными направляющими РНК. Обогащение может идти непрерывно. Cas9 связывается с или около ДНК-мишени в геноме. Одна или несколько направляющих РНК связываются с или около ДНК-мишени в геноме. Cas9 разрезает ДНК-мишень в геноме и экзогенная донорская ДНК встраивается в ДНК в месте разреза.

Соответственно, способы направлены на применение направляющей РНК с белком Cas9 и экзогенной донорной нуклеиновой кислотой для мультиплексных вставок экзогенных донорных нуклеиновых кислот в ДНК стволовой клетки, экспрессирующей Cas9, посредством циклической вставки нуклеиновой кислоты, кодирующей РНК (или путем предоставления РНК из окружающей среды) и экзогенной донорной нуклеиновой кислоты, экспрессирующей РНК (или путем поглощения РНК), колокализации РНК, Cas9 и ДНК таким образом, чтобы происходило разрезание ДНК, и вставки экзогенной донорной нуклеиновой кислоты. Стадии способа могут быть циклически повторены любое необходимое количество раз для получения необходимого количества модификаций ДНК. Способы настоящего описания соответственно направлены на редактирование генов-мишеней с помощью белков Cas9 и направляющих РНК, описанных в данном документе, с целью осуществления мультиплексной генетической и эпигенетической инженерии стволовых клеток.

Дальнейшие аспекты настоящего описания направлены на применение ДНК-связывающих белков или систем (например, модифицированных TALENs или Cas9, описанных в данном документе) в целом для мультиплексной вставки экзогенных донорных нуклеиновых кислот в ДНК, такую как геномная ДНК стволовой клетки, например, человеческой стволовой клетки. Специалист в данной области техники легко определит типичные ДНК-связывающие системы на основании настоящего описания.

Клетки в соответствии с настоящим описанием, если не указано иное, включают любую клетку, в которую могут быть введены и в которой могут быть экспрессированы чужеродные нуклеиновые кислоты, как описано в данном документе. Следует понимать, что основные принципы настоящего раскрытия, описанные в данном документе, не ограничиваются типом клеток. Клетки, согласно настоящему изобретению, включают соматические клетки, стволовые клетки, эукариотические клетки, прокариотические клетки, клетки животных, растительные клетки, клетки грибов, клетки, клетки архей, клетки эубактерий и т.п. Клетки включают эукариотические клетки, такие как дрожжевые клетки, растительные клетки и клетки животных. Конкретные клетки включают клетки млекопитающих, такие как клетки человека. Кроме того, клетки включают любую клетку, в которой было бы выгодно или желательно модифицировать ДНК.

Нуклеиновой кислоты включают любую последовательность нуклеиновой кислоты, в случае которой TALEN или направляемый РНК ДНК-связывающий белок, обладающий нуклеазной активностью, как описано в данном документе, могут быть полезны для внесения одноцепочечных разрывов или разрезания. Нуклеиновые кислоты-мишени включают любую последовательность нуклеиновой кислоты, в случае которой комплекс колокализации, как описано в данном документе, может быть полезен для внесения одноцепочечных разрывов или разрезания. Нуклеиновые кислоты-мишени включают гены. Для целей настоящего описания, ДНК, такая как двухцепочечная ДНК, может включать нуклеиновую кислоту-мишень, а комплекс колокализации может связываться или иным образом колокализоваться с ДНК или TALEN может в ином случае связываться с ДНК в или в непосредственной близости или вблизи нуклеиновой кислоты-мишени таким образом, чтобы комплекс колокализации или TALEN оказывали искомый эффект на нуклеиновую кислоту-мишень. Такие нуклеиновые кислоты-мишени могут включать эндогенную (или естественную) нуклеиновую кислоту и экзогенную (или чужеродную) нуклеиновую кислоту. Специалист на основе настоящего описания легко идентифицирует или разработает направляющие РНК и белки Cas9, которые колокализуются с ДНК или TALEN, которые связываются с ДНК, включающей нуклеиновую кислоту-мишень. Специалист также будет способен идентифицировать транскрипционные регуляторные белки или домены, такие как транскрипционные активаторы или транскрипционные репрессоры, которые аналогичным образом колокализуются с ДНК, включающей нуклеиновую кислоту-мишень. ДНК включает геномную ДНК, митохондриальную ДНК, вирусную ДНК или экзогенную ДНК. Согласно одному аспекту, материалы и способы, используемые при практическом осуществлении настоящего изобретения, включают те, которые описаны в Di Carlo, et al., Nucleic Acids Research, 2013, vol. 41, No. 7 4336-4343, включенном в данный документ ссылкой в полном объеме и для всех целей, включая типичные штаммы и среды, плазмидные конструкции, трансформацию плазмид, электропорацию транзиторной гидРНК-кассеты и донорных нуклеиновых кислот, трансформацию гидРНК-плазмиды с донорной ДНК в Cas9-экспрессирующие клетки, индукцию Cas9 галактозой, определение мишеней CRISPR-Cas в геноме дрожжей, и т.д. Дополнительные источники, включая информацию, материалы и методы, полезные для специалиста в данной области при осуществлении изобретения, приведены в Mali, P., Yang, L., Esvelt, K.M., Aach, J., Guell, M., DiCarlo, J.E., Norville, J. E. and Church, G.M. (2013) RNA-Guided human genome engineering via Cas9. Science, 10. 1126fscience. 1232033; Storici, F., Durham, C.L., Gordenin, D.A. and Resnick, M.A. (2003) Chromosomal site-specific double-strand breaks are efficiently targeted for repair by oligonucleotides in yeast. PNAS, 100, 14994-14999 and Jinek, M., Chylinski, K., Fonfara, l., Hauer, M., Doudna, J.A. and Charpentier, E. (2012) A programmable dual-RNA-Guided DNA endonuclease in adaptive bacterial immunity. Science, 337, 816-821, каждый из которых включен в данное описание ссылкой в полном объеме и для всех целей.

Чужеродные нуклеиновые кислоты (т.е. те, которые не являются частью природной композиции нуклеиновых кислот клетки) могут быть введены в клетку с помощью любого способа, известного специалистам в данной области техники для такого введения. Такие способы включают трансфекцию, трансдукцию, вирусную трансдукцию, микроинъекции, липофекцию, нуклеофекцию, бомбардировку наночастицами, трансформацию, конъюгацию и т. п. Специалисту в данной области техники легко понять и адаптировать такие способы, с помощью легко идентифицируемых литературных источников.

Донорные нуклеиновые кислоты включают любую нуклеиновую кислоту, которая будет вставлена в последовательность нуклеиновой кислоты, как описано в данном документе.

Следующие примеры приведены в качестве типичных образцов настоящего описания. Эти примеры не должны быть истолкованы как ограничивающие объем настоящего описания, поскольку они и другие эквивалентные воплощения будут очевидны в свете настоящего описания, чертежей и сопровождающей формулы изобретения.

Пример I

Сборка направляющей РНК

19 п.о. выбранной последовательности-мишени (т. е. 5'-N19 5'-N19-NGG-3') были включены в два комплементарных олигонуклеотида 100-мера (TTCTTGGCTTTATAT

ATCTTGTGGAAAGGACGAAACACCGN19GTTTTAGAGCTAGAAATAGCAAG

TTAAAATAAGGCTAGTCC). Каждый олигонуклеотид 100-мер суспендировали в концентрации 100 мМ в воде, смешивали с равным объемом и гибридизовали в термоциклере (95°C, 5 мин; линейное уменьшение до 4°C, 0,1°C/сек). Для приготовления вектор назначения, клонирующий вектор с гидРНК (Addgene plasmid ID 41824) линеаризовали с помощью AflII и очищали вектор. Реакцию сборки (10 мкл) гидРНК проводили с 10 нг соединившегося 100 п.о. фрагмента, 100 нг каркаса назначения, IX реакционной смеси для сборки Gibson (New England Biolabs) при 50°C в течение 30 мин. Продукт реакция может быть сразу же трансформирован в бактерии для получения колоний отдельных сборок.

Пример II

Дизайн и Сборка перекодированных TALE

re-TALEs были оптимизированы на разных уровнях для облечения сборки, а также для улучшения экспрессии. ДНК-последовательности вначале вместе оптимизировали для приближения к частоте использования кодонов у человека, и низкой энергии сворачивания мРНК на 5'-конце (GeneGA, Bioconductor). Полученную последовательность подвергали эволюции в течение нескольких циклов для устранения повторов (прямых или инвертированных) длиннее, чем 11 п.о. (см. Фиг. 12). В каждом цикле оценивали синонимичные последовательности для каждого повтора. Отбирали те, у которых было наибольшее расстояние Хэмминга к эволюционирующей ДНК. Последовательность одного из re-TALE, обладающего 16,5 мономерами представлена ниже

CTAACCCCTGAACAGGTAGTCGCTATAGCTTCAAATATCGGGGGCAAGCAAGCACTTGAGACCGTTCAACGACTCCTGCCAGTGCTCTGCCAAGCCCATGGATTGACTCCGGAGCAAGTCGTCGCGATCGCGAGCAACGGCGGGGGGAAGCAGGCGCTGGAAACTGTTCAGAGACTGCTGCCTGTACTTTGTCAGGCGCATGGTCTCACCCCCGAACAGGTTGTCGCAATAGCAAGTAATATAGGCGGTAAGCAAGCCCTAGAGACTGTGCAACGCCTGCTCCCCGTGCTGTGTCAGGCTCACGGTCTGACACCTGAACAAGTTGTCGCGATAGCCAGTCACGACGGGGGAAAACAAGCTCTAGAAACGGTTCAAAGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTAACACCCGAACAAGTAGTAGCGATAGCGTCAAATAACGGGGGTAAACAGGCTTTGGAGACGGTACAGCGGTTATTGCCGGTCCTCTGCCAGGCCCACGGACTTACGCCAGAACAGGTGGTTGCAATTGCCTCCAACATCGGCGGGAAACAAGCGTTGGAAACTGTGCAGAGACTCCTTCCTGTTTTGTGTCAAGCCCACGGCTTGACGCCTGAGCAGGTTGTGGCCATCGCTAGCCACGACGGAGGGAAGCAGGCTCTTGAAACCGTACAGCGACTTCTCCCAGTTTTGTGCCAAGCTCACGGGCTAACCCCCGAGCAAGTAGTTGCCATAGCAAGCAACGGAGGAGGAAAACAGGCATTAGAAACAGTTCAGCGCTTGCTCCCGGTACTCTGTCAGGCACACGGTCTAACTCCGGAACAGGTCGTAGCCATTGCTTCCCATGATGGCGGCAAACAGGCGCTAGAGACAGTCCAGAGGCTCTTGCCTGTGTTATGCCAGGCACATGGCCTCACCCCGGAGCAGGTCGTTGCCATCGCCAGTAATATCGGCGGAAAGCAAGCTCTCGAAACAGTACAACGGCTGTTGCCAGTCCTATGTCAAGCTCATGGACTGACGCCCGAGCAGGTAGTGGCAATCGCATCTCACGATGGAGGTAAACAAGCACTCGAGACTGTCCAAAGATTGTTACCCGTACTATGCCAAGCGCATGGTTTAACCCCAGAGCAAGTTGTGGCTATTGCATCTAACGGCGGTGGCAAACAAGCCTTGGAGACAGTGCAACGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTTACTCCTGAGCAAGTCGTAGCTATCGCCAGCAACATAGGTGGGAAACAGGCCCTGGAAACCGTACAACGTCTCCTCCCAGTACTTTGTCAAGCACACGGGTTGACACCGGAACAAGTGGTGGCGATTGCGTCCAACGGCGGAGGCAAGCAGGCACTGGAGACCGTCCAACGGCTTCTTCCGGTTCTTTGCCAGGCTCATGGGCTCACGCCAGAGCAGGTGGTAGCAATAGCGTCGAACATCGGTGGTAAGCAAGCGCTTGAAACGGTCCAGCGTCTTCTGCCGGTGTTGTGCCAGGCGCACGGACTCACACCAGAACAAGTGGTTGCTATTGCTAGTAACAACGGTGGAAAGCAGGCCCTCGAGACGGTGCAGAGGTTACTTCCCGTCCTCTGTCAAGCGCACGGCCTCACTCCAGAGCAAGTGGTTGCGATCGCTTCAAACAATGGTGGAAGACCTGCCCTGGAA

В соответствии с некоторыми аспектами, могут быть использованы TALEs, имеющие, по меньшей мере, 80% идентичность последовательности, по меньшей мере, 85% идентичность последовательности, по меньшей мере, 90% идентичность последовательности, по меньшей мере, 95% идентичность последовательности, по меньшей мере, 98% идентичность последовательности, или, по меньшей мере, 99% идентичность последовательности с приведенной выше последовательностью. Специалист легко поймет, где указанная последовательность может варьировать при сохранении ДНК-связывающей активности TALE.

Димерные блоки re-TALE кодирующие два RVDs (см. Фиг. 6A) получали с помощью двух раундов ПЦР в стандартных условиях Кара HIFI (KPAP), при которых первый раунд ПЦР вводил RVD-кодирующую последовательность, а второй раунд ПЦР приводил к образованию целых димерных блоков с 36 п.о. перекрытием с соседними блоками. ПЦР-продукты очищали с помощью QIAquick 96 PCR Purification Kit (QIAGEN), а концентрации измеряли с помощью Nano-drop. Последовательности праймеров и матриц перечислены в таблице 1 и таблице 2 ниже.

Таблица 1. последовательности блоков re-TALE

Блок 0	CGCAATGCGCTCACGGGAGCACCCCTCAACCTAACCCCTGAACAGGTAGTCGCTATAGCTTCANNNNNNGGGGGCAAGCAAGCACTTGAGACCGTTCAACGACTCCTGCCAGTGCTCTGCCAAGCCCATGGATTGACTCCGGAGCAAGTCGTCGCGATCGCGAGCNNNNNNGGGGGGAAGCAGGCGCTGGAAACTGTTCAGAGACTGCTGCCTGTACTTTGTCAGGCGCATGGTCTC
Блок 1	AGACTGCTGCCTGTACTTTGTCAGGCGCATGGTCTCACCCCCGAACAGGTTGTCGCAATAGCAAGmNNNNNGGCGGTAAGCAAGCCCTAGAGACTGTGCAACGCCTGCTCCCCGTGCTGTGTCAGGCTCACGGTCTGACACCTGAACAAGTTGTCGCGATAGCCAGTNNNNNNGGGGGAAAACAAGCTCTAGAAACGGTTCAAAGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTA
Блок 1'	TGCGCTCACGGGAGCACCCCTCAACCTCACCCCCGAACAGGTTGTCGCAATAGCAAGTNNNNNNGGCGGTAAGCAAGCCCTAGAGACTGTGCAACGCCTGCTCCCCGTGCTGTGTCAGGCTCACGGTCTGACACCTGAACAAGTTGTCGCGATAGCCAGTNNNNNNGGGGGAAAACAAGCTCTAGAAACGGTTCAAAGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTA
Блок 2	AGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTAACACCCGAACAAGTAGTAGCGATAGCGTCANNNNNNGGGGGTAAACAGGCTTTGGAGACGGTACAGCGGTTATTGCCGGTCCTCTGCCAGGCCCACGGACTTACGCCAGAACAGGTGGTTGCAATTGCCTCCNNNNNNGGCGGGAAACAAGCGTTGGAAACTGTGCAGAGACTCCTTCCTGTTTTGTGTCAAGCCCACGGCTTGACGCCT
Блок 3	AGACTCCTTCCTGTTTTGTGTCAAGCCCACGGCTTGACGCCTGAGCAGGTTGTGGCCATCGCTAGCNNNNNNGGAGGGAAGCAGGCTCTTGAAACCGTACAGCGACTTCTCCCAGTTTTGTGCCAAGCTCACGGGCTAACCCCCGAGCAAGTAGTTGCCATAGCAAGCNNNNNNGGAGGAAAACAGGCATTAGAAACAGTTCAGCGCTTGCTCCCGGTACTCTGTCAGGCACACGGTCTA
Блок 4	CGCTTGCTCCCGGTACTCTGTCAGGCACACGGTCTAACTCCGGAACAGGTCGTAGCCATTGCTTCCNNNNNNGGCGGCAAACAGGCGCTAGAGACCGTCCAGAGGCTCTTGCCTGTGTTATGCCAGGCACATGGCCTCACCCCGGAGCAGGTCGTTGCCATCGCCAGTNNNNNNGGCGGAAAGCAAGCTCTCGAAACAGTACAACGGCTGTTGCCAGTCCTATGTCAAGCTCATGGACTG
Блок 5°	CGGCTGTTGCCAGTCCTATGTCAAGCTCATGGACTGACGCCCGAGCAGGTAGTGGCAATCGCATCTNNNNNNGGAGGTAAACAAGCACTCGAGACTGTCCAAAGATTGTTACCCGTACTATGCCAAGCGCATGGTTTAACCCCAGAGCAAGTTGTGGCTATTGCATCTTSnSINNNNGGTGGCAAACAAGCCTTGGAGACCGTGCAACGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTT
Блок 6	CGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTTACTCCTGAGCAGGTGGTCGCTATCGCCAGCNNNNNNGGGGGCAAGCAAGCACTGGAAACAGTCCAGCGTTTGCTTCCAGTACTTTGTCAGGCGCATGGATTGACACCGGAACAAGTGGTGGCTATAGCCTCANNNNNNGGAGGAAAGCAGGCGCTGGAAACCGTCCAACGTCTTTTACCGGTGCTTTGCCAGGCGCACGGGCTC
Блок 6'	CGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTTACTCCTGAGCAAGTCGTAGCTATCGCCAGCNNNNNNGGTGGGAAACAGGCCCTGGAAACCGTACAACGTCTCCTCCCAGTACTTTGTCAAGCACACGGGTTGACACCGGAACAAGTGGTGGCGATTGCGTCCNNNNNNGGAGGCAAGCAGGCACTGGAGACCGTCCAACGGCTTCTTCCGGTTCTTTGCCAGGCTCATGGGCTC
Блок 7	CGGCTTCTTCCGGTTCTTTGCCAGGCTCATGGGCTCACGCCAGAGCAGGTGGTAGCAATAGCGTCGNNNNNNGGTGGTAAGCAAGCGCTTGAAACGGTCCAGCGTCTTCTGCCGGTGTTGTGCCAGGCGCACGGACTCACACCAGAACAAGTGGTTGCTATTGCTAGTTSnsnsnsnSINGGTGGAAAGCAGGCCCTCGAGACGGTGCAGAGGTTACTTCCCGTCCTCTGTCAAGCGCACGGCCTC

Таблица 2. Последовательности праймеров блоков re-TALE

Блок O-F	CGCAATGCGCTCACGGGAGCACCCCTCAACctAACCCCTGAACAGGTAG
Блок O-R	GAGACCATGCGCCTGACAAAGTACAGGCAGCAGTCTCTGAACAGTT
Блок 1'-F	TGGCGCAATGCGCTCACGGGAGCACCCCTCAAC
Блок 1-F	AGACTGCTGCCTGTACTTTGTCAGGCGCATGGTCTCACCCCCGAACAGG
Блок -R/Блок l'-R	TAACCCATGTGCTTGGCACAGAACGGGCAACAACCTTTGAACCGTT
Блок 2-F	AGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTAACACCCgaacаа
Блок 2-R	AGGCGTCAAGCCGTGGGCTTGACACAAAACAGGAAGGAGTCTCTGCACAGTT
Блок 3-F	AGACTCCTTCCTGTTTTGTGTCAAGCCCACGGCTTGACGCCTGAG
Блок З-R	TAGACCGTGTGCCTGACAGAGTACCGGGAGCAAGCGCTGA
Блок 4-F	CGCTTGCTCCCGGTACTCTGTCAGGCACACGGTCTAACT
Блок 4-R	CAGTCCATGAGCTTGACATAGGACTGGCAACAGCCGTTGT
Блок 5-F	CGGCTGTTGCCAGTCCTATGTCAAGCTCATGGACTGACG
Блок 5-R	AAGGCCATGGGCCTGACATAAGACAGGCAGTAATCGTTGC
Блок 6-F	CGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTTACT
Блок 6-R	GAGCCCGTGCGCCTGGCAAAGCACCGGTAAAAGACGTTGGACG
Блок 6'-F	CGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTTACTCCTGAGCAA
Блок 6'-R	GAGCCCATGAGCCTGGCAAAGAACCGGAAGAAGCCGTTGG
Блок 7-F	CGGCTTCTTCCGGTTCTTTGCCAGGCTCATGGGCTCACGCCAGAGCAGGTG
Блок 7-R	GAGGCCGTGCGCTTGACAGAGGACGGGAAGTAACCTCTGC

Re-TALENs и векторы назначения re-TALE-TF были сконструированы путем модификации TALE-TF и клонирующего каркаса TALEN (см. источник 24, включенный в данный документ ссылкой в полном объеме). 0,5 RVD-области на векторах были повторно закодированы, а в назначенный участок для клонирования re-TALE был включен сайт разрезания SapI. Последовательности re-TALENs и каркасы re-TALE-TF представлены на Фиг. 20. Плазмиды могут быть предварительно обработаны с помощью SapI (New England Biolabs) в рекомендованных производителем условиях, и очищены с помощью набора для очистки ПЦР QIAquick (QIAGEN).

Однореакторную (10 мкл) реакцию сборки TASA проводили с 200 нг каждого блока, 500 нг каркаса назначения, IX ферментной смеси TASA (2 Ед. SapI, 100 Ед. амплигазы (Epicentre), 2,5 Ед. ДНК-полимеразы (New England Biolabs)) и IX буфер для изотермической реакции сборки, как описано ранее (см. источник 25, включенный в данный документ ссылкой в полном объеме) (5% PEG-8000, 100 мМ Трис-HCl, рН 7,5, 10 мМ MgC12, 10 мМ DTT, 0,2 мМ каждого из четырех dNTP и 1 мМ NAD). Инкубирование проводили при 37°C в течение 5 мин и 50°C в течение 30 мин. Реакция может быть подвергнута непосредственно бактериальной трансформации для получения колоний отдельных сборок. При таком подходе эффективность получения полноразмерного конструкции составила -20%. В ином случае эффективность > 90% может быть достигнута трехступенчатой сборкой. Во-первых, 10 мкл реакции сборки re-TALE осуществляли с 200 нг каждого блока, 1X ферментной смеси re-TALE, (100 Ед. амплигазы, 12,5 мЕд. T5-экзонуклеазы, 2,5 Ед. ДНК-полимеразы Phusion) и IX изотермического буфера для сборки при 50°C в течение 30 мин, а затем проводили стандартизированные реакции ПЦР Кара HIFI, электрофореза в агарозном геле и экстракции из геля QIAquick Gel extraction (Qiagen) для обогащения полноразмерных re-TALEs. 200 нг ампликонов re-TALE затем могут быть смешаны с 500 нг каркаса назначения, предварительно обработанного SapI, 1X изотермического реакционного буфера для сборки re-TALE и инкубировали при 50°C в течение 30 мин. Конечная реакция сборки re-TALE может быть подвергнута непосредственно бактериальной трансформации для получения колоний отдельных сборок. Специалист в данной области техники легко сможет выбрать эндонуклеазы, экзонуклеазы, полимеразы и лигазы из числа тех, которые известны для практического осуществления способов, описанных в данном документе. Например, можно использовать эндонуклеазы типа IIs, такие как: Fok 1, Bts I, Ear I, Sap I. Могут быть использованы титруемые экзонуклеазы, такие как лямбда-экзонуклеаза, Т5-экзонуклеаза и экзонуклеаза III. Могут быть использованы полимеразы, применяемые без горячего старта, такие как, ДНК-полимераза Phusion, ДНК-полимераза Taq и ДНК-полимераза VentR. В данной реакции могут быть использованы термостойкие лигазы, такие как амплигаза, ДНК-лигаза pfu, ДНК-лигаза Taq. Кроме того, в зависимости от конкретного вида используемых ферментов для активации таких эндонуклеаз, экзонуклеаз, полимераз и лигаз могут быть использованы различные условия реакции.

Пример III

Клеточная линия и Клеточная культура

Клетки PGP1 iPS поддерживали в покрытых матригелем (BD Biosciences) планшетах в mTeSRl (StemCell Technologies). Культуры пересевали каждые 5-7 дней с TrypLE Express (Invitrogen). Клетки 293T и 293FT выращивали и поддерживали в модифицированной Дульбекко среде Игла (DMEM, Invitrogen) с высоким содержанием глюкозы с добавлением 10% фетальной бычьей сыворотки (FBS, Invitrogen), пенициллина/стрептомицина (pen/strep, Invitrogen), и незаменимых аминокислот (NEAA, Invitrogen). Клетки К562 выращивали и поддерживали в среде RPMI (Invitrogen) с добавлением 10% фетальной бычьей сыворотки (FBS, Invitrogen 15%) и пенициллина/стрептомицина (pen/strep, Invitrogen). Все клетки поддерживали при 37°C и 5% CO2 в увлажненном инкубаторе.

Была создана стабильная клеточная линия 293Т для детекции эффективности HDR, как описано в источнике 26, включенном в данное описание ссылкой в полном объеме. В частности, репортерную клеточную линию, несущую интегрированные в геном последовательности, кодирующие GFP, разрушали вставкой стоп-кодона и 68 п.о. геномного фрагмента, полученного из локуса AAVS1.

Пример IV

Тест активности re-TALENs

Репортерные клетки 293Т высевали при плотности 2 х 105 клеток на лунку в 24-луночный планшет и трансфецировали их 1 мкг каждой плазмиды re-TALENs и 2 мкг плазмиды с донорной ДНК с использованием Lipofectamine 2000 согласно протоколам производителя. Клетки собирали с помощью TrypLE Express (Invitrogen) через ~ 18 ч после трансфекции и ресуспендировали в 200 мкл среды для анализа проточной цитометрией с использованием анализатора клеток LSRFortessa (BD Biosciences). Данные проточной цитометрии анализировали с использованием FlowJo (FlowJo). По меньшей мере, 25000 событий анализировали для каждого трансфецированного образца. Для экспериментов по направленному воздействию на эндогенный локус AAVS1 в клетках 293T, процедуры трансфекции были идентичны описанным выше, и отбор на пуромицине был проведен с концентрацией лекарственного средства 3 мкг/мл через 1 неделю после трансфекции.

Пример V

Оценка образования функциональных лентивирусов

Лентивирусные векторы были созданы с помощью стандартных методов ПЦР и клонирования. Лентивирусные плазмиды трансфецировали Lipofectamine 2000 с помощью лентивирусной упаковочной смеси (Invitrogen) в культивируемые клетки 293FT (Invitrogen), с целью получения лентивируса. Надосадочную жидкость собирали через 48 и 72 ч после трансфекции, стерильно фильтровали, и 100 мкл фильтрованной надосадочной жидкости добавляли к 5 х 105 свежих клеток 293Т с полибреном. Титр лентивируса рассчитывали на основании следующей формулы: титр вируса = (процент клеток GFP+ 293T * исходное количество клеток при трансдукции)/(объем исходной вирус-содержащей надосадочной жидкости, используемой в эксперименте трансдукции). Чтобы проверить работоспособность лентивирусов, через 3 дня после трансдукции, лентивирус-трансдуцированные клетки 293T трансфецировали 30 нг плазмиды, несущей репортер mCherry и 500 нг плазмиды pUC19 с помощью Lipofectamine 2000 (Invitrogen). Изображения клеток анализировали с помощью Axio Observer Zl (Zeiss) через 18 часов после трансфекции, после чего клетки собирали с помощью TrypLE Express (Invitrogen) и ресуспендировали в 200 мкл среды для анализа проточной цитометрией с использованием анализатора клеток LSRFortessa (BD Biosciences). Данные проточной цитометрии анализировали с использованием BD FACSDiva (BD Biosciences).

Пример VI

Тест эффективности редактирования генома с помощью re-TALENs и Cas9-гидРНК

PGP1 iPSCs культивировали с ингибитором Rho-киназы (ROCK) Y-27632 (Calbiochem) за 2 ч перед нуклеофекцией. Трансфекцию проводили с помощью P3 Primary Cell 4D-Nucleofector X Kit (Lonza). В частности, клетки собирали с помощью TrypLE Express (Invitrogen) и ресуспендировали 2x106 клеток в 20 мкл смеси для нуклеофекции, содержащей 16,4 мкл раствора Р3 Nucleofector, 3,6 мкл добавки, 1 мкг каждой плазмиды re-TALENs или 1 мкг Cas9 и 1 мкг гидРНК-конструкции, 2мкл 100 мкМ ssODN. Затем смеси переносили в 20мкл полоски Nucleocuvette и проводили нуклеофекцию с помощью программы CB150. Клетки высевали в планшеты, покрытые матригелем в среде mTeSR1 среде с добавлением ингибитора ROCK в течение первых 24 часов. Для эксперимента направленного воздействия на эндогенный локус AAVS1 с помощью донорной двухцепочечной ДНК, проводили такую же процедуру за исключением того, что было использовано 2 мкг донорной двухцепочечной ДНК, а среда mTeSRl была дополнена пуромицином в концентрации 0,5 мкг/мл через 1 неделю после трансфекции.

Информация о reTALENs, гидРНК и ssODNs, используемых в данном примере, приведена в Таблице 3 и Таблице 4 ниже.

Таблица 3. Информация о парах re-TALEN/Cas9-гидРНК, нацеленных на CCR5

# Целевого участка	re-TALENs	re-TALENs	re-TALEN-L целевая последовательность	re-TALEN-R целевая последовательность	гидРНК целевая последователь ность	гидРНК начальная позиция целевой последовательности
	целевой участок пары (начало)	целевой участок пары (конец)
	/chr3:
/chr3:
1	4640 9942	4640 9993	TCCCCACTTTCTTGTGAA	TAACCACTCAGGACAGGG	CACTTTCTTGTGAATCCTT	46409946
2	4641 0227	4641 0278	TCACACAGCAAGTCAGCA	TAGCGGAGCAGGCTCGGA	TGGGCTAGCGGAGCAGGCT	4641 0264
3	4641 1260	4641 1311	TACCCAGACGAGAAAGCT	TCAGACTGCCAAGCTTGA	ACCCAGACGAGAAAGCTGA	4641 1261
4	4641 1464	4641 1515	TCTTGTGGCTCGGGAGTA	TATTGTCAGCAGAGCTGA	AGAGGGCATCTTGTGGCTC	4641 1456
5	4641 1517	4641 1568	TTGAGATTTTCAGATGTC	TATACAGTCATATCAAGC	ATCAAGCTCTCTTGGCGGT	4641 1538
6	4641 1634	4641 1685	TTCAGATAGATTATATCT	TGCCAGATACATAGGTGG	GCTTCAGATAGATTATATC	4641 1632
7	4641	4641	TTATACTGTCT	TCAGCTCTTCT	ACGGATGTCTCA	4641
2396	2447	ATATGAT	GGCCAGA	GCTCTTC	2437
8	4641 2432	4641 2483	TGGCCAGAAGAGCTGAGA	TTACCGGGGAGAGTTTCT	CCGGGGAGAGTTTCTTGTA	4641 2461
9	4641 2750	4641 2801	TTTGCAGAGAG ATGAGTC	TTAGCAGAAGA TAAGATT	GAAATCTTATCT TCTGCTA	4641 2782
10	4641 3152	4641 3203	TATAAGACTAA ACTACCC	TCGTCTGCCAC CACAGAT	AATGCATGACAT TCATCTG	4641 3172
11	4641 4305	4641 4356	TAAAACAGTTT GCATTCA	TATAAAGTCCT AGAATGT	AACAGTTTGCAT TCATGGA	4641 4308
12	4641 4608	4641 4659	TGGCCATCTCT GACCTGT	TAGTGAGCCCA GAAGGGG	CCAGAAGGGGA CAGTAAGA	4641 4632
13	4641 4768	4641 4820	TAGGTACCTGG CTGTCGT	TGACCGTCCTG GCTTTTA	CTGACAATCGAT AGGTACC	4641 4757
14	4641 5017	4641 5068	TGTCATGGTCA TCTGCTA	TCGACACCGAA GCAGAGT	ACACCGAAGCA	4641 5046
15	4642 0034	4642 0084	TGCCCCCGCGA GGCCACA	TCTGGAAGTTG AACACCC	GGAAGTTGAAC ACCCTTGC	4642 0062

Таблица 4. Дизайн ssODN для изучения ssODN-опосредованного редактирования генома

Фигура 3b	Дистанция между второй мутацией и DSB	90-*1	CTACTGTCATTCAGGGCAATACCCAGACGAGAAAGCTGAGGGTATAACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTT
		90-*2	CTACTGTCATTCAGCCCAATACCCTAACGAGAAAGCTGAGGGTATAACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTT
		90-*3	CTACTGTCATTCAGCCCAATACCCAGACGAGAAAAGTGAGGGTATAACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTT
		90M-0	CTACTGTCATTCAGCCCAATACCCAGACGAGAAAGCTGAGGGTATAACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTT
		90-*4	CTACTGTCATTCAGCCCAATACCCAGACGAGAAAGCTGAGGGTATAACAGGTTTGTAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTT
		90-*5	CTACTGTCATTCAGCCCAATACCCAGACGAGAAAGCTGAGGGTATAACAGGTTTCAAGCTTGGCTCTCTGACTACAGAGGCCACTGGCTT
90-*6	CTACTGTCATTCAGCCCAATACCCAGACGAGAAAGCTGAGGGTATAACAGGTTTCAAGCTTGGCAGTCTGACTAGTGAGGCCACTGGCTT
Фигура 3с	Дистанция между ssODN и DSB	L670 bp_9 0M	CACTTTATATTTCCCTGCTTAAACAGTCCCCCGAGGGTGGGTGCGGAAAAGGCTCTACACTTGTTATCATTCCCTCTCCACCACAGGCAT
		L570 bp_9 OM	TAAGGCACAGAGCTTCAATAATTTGGTCAGAGCCAAGTAGCAG
		L480 bp_9 OM	GGAGGTTAAACCCAGCAGCATGACTGCAGTTCTTAATCAATGCCCCTTGAATTGCACATATGGGATGAACTAGAACATTTTCTCGATGAT
		L394 bp_9 OM	CTCGATGATTCGCTGTCCTTGTTATGATTATGTTACTGAGCTCTACTGTAGCACAGACATATGTCCCTATATGGGGCGGGGGTGGGGGTG
		L290 bp_9 OM	GGTGTCTTGATCGCTGGGCTATTTCTATACTGTTCTGGCTTTTCGGAAGCAGTCATTTCTTTCTATTCTCCAAGCACCAGCAATTAGCTT
		L200 bp_9 OM	GCTTCTAGTTTGCTGAAACTAATCTGCTATAGACAGAGACTCCGACGAACCAATTTTATTAGGATTTGATCAAATAAACTCTCTCTGACA
		L114 bp_9 OM	GAAAGAGTAACTAAGAGTTTGATGTTTACTGAGTGCATAGTATGCACTAGATGCTGGCCGTGGATGCCTCATAGAATCCTCCCAACAACT
		L45b p_90 M	GCTAGATGCTGGCCGTGGATGCCTCATAGAATCCTCCCAACAACCGATGAAATGACTACTGTCATTCAGCCCAATACCCAGACGAGAAAG
		R40b p_90 M	ACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTTTACCCCTGGGTTAGTCTGCCTCTGTAGGATTGGGGGCACGTAATTT
		R100 bp_90 M	TTAGTCTGCCTCTGTAGGATTGGGGGCACGTAATTTTGCTGTTTAAG
		R200 bp_90 M	GGAAGCCCAGAGGGCATCTTGTGGCTCGGGAGTAGCTCTCTGCTACCTTCTCAGCTCTGCTGACAATACTTGAGATTTTCAGATGTCACC
		R261 bp_90 M	TCAGCTCTGCTGACAATACTTGAGATTTTCAGATGTCACCAACCAGCAAGAGAGCTTGATATGACTGTATATAGTATAGTCATAAAGAAC
		R322 bp_90 M	CATAAAGAACCTGAACTTGACCATATACTTATGTCATGTGGAAATCTTCTCATAGCTTCAGATAGATTATATCTGGAGTGAAGAATCCTG
		R375 M_90 M	GTGGAAAATTTCTCATAGCTTCAGATAGATTATATCTGGAGTGAGCAATCCTGCCACCTATGTATCTGGCATAGTGTGAGTCCTCATAAA
		R448 bp_90 M	GGTTTGAAGGGCAACAAAATAGTGAACAGAGTGAAAATCCCCACCTAGATCCTGGGTCCAGAAAAAGATGGGAAACCTGTTTAGCTCACC
Комплементарный-30-мер	GGCCACTAGGGACAAAATTGGTGAcagaaa
Фигура 3d	Длина и ориентация ssODN для напраленного воздействия Cas9-гидРНК	Комплементарный-50-мер	CCCACAGTGGGGCCACTAGGGACAAAATTGGTGAcagaaaagccccatcc
		Комплементарный-70-мер	TCCCCTCCACCCCACAGTGGGGCCACTAGGGACAAAATTGGTGAcag aaaagccccatccttaggcctcc
		Комплементарный-90-мер	cttTTATCTGTCCCCTCCACCCCACAGTGGGGCCACTAGGGACAAAAT TGGTGAcagaaaagccccatccttaggcctcctccttcctag
		Комплементарный-110-мер	gttctgggtacttTTATCTGTCCCCTCCACCCCACAGTGGGGCCACTAGGGA CAAAATTGGTGAcagaaaagccccatccttaggcctcctccttcctagtctcctgata
		Некомплементарный - 30-Мер	TTTCTGTCACCAATGGTGTCCCTAGTGGCC
		Некомплементарный -50-мер	GGATGGGGCTTTTCTGTCACCAATGGTGTCCCTAGTGGCCCCACTGTGGG
		Некомплементарный -70-Мер	GGAGGCCTAAGGATGGGGCTTTTCTGTCACCAATGGTGTCCCTAGTGGCCCCACTGTGGGGTGGAGGGGA
		Некомплементарный-90-мер	CTAGGAAGGAGGAGGCCTAAGGATGGGGCTTTTCTGTCACCAATGGTGTCCCTAGTGGCCCCACTGTGGGGTGGAGGGGACAGATAAAAG
Некомплементарный-110-мер	TATCAGGAGACTAGGAAGGAGGAGGCCTAAGGATGGGGCTTTTCTGTCACCAATGGTGTCCCTAGTGGCCCCACTGTGGGGTGGAGGGGACAGATAAAAGTACCCAGAAC
Фигура 2c	Дононорный ssO DN для направленного воздействия Cas9-гидРНК на CC R5	Cas9 гидРНК-CCR 5-1	TTCTAGTAACCACTCAGGACAGGGGGGTTCAGCCCAAAAATTCACA AGAAAGTGGGGACCCATGGGAAAT
		Cas9 гидРНК-CCR 5-2	CAGCAAGTCAGCAGCACAGCGTGTGTGACTCCGAGGGTGCTCCGCT AGCCCACATTGCCCTCTGGGGGTG
		Cas9 гидРНК-CCR 5-3	GTCAGACTGCCAAGCTTGAAACCTGTCTTACCCTCTACTTTCTCGTC TGGGTATTGGGCTGAATGACAGT
		Cas9 гидРНК-CCR 5-4	CAGAGCTGAGAAGACAGCAGAGAGCTACTCCCGAAGCACAAGATG CCCTCTGGGCTTCCGTGACCTTGGC
		Cas9 гидРНК-CCR 5-5	CTGACAATACTTGAGATTTTCAGATGTCACCAACGACCAAGAGAGC TTGATATGACTGTATATAGTATAG
Cas9 гидРНК-CCR 5-6	CAGATACATAGGTGGCAGGATTCTTCACTCCAGACTTAATCTATCT GAAGCTATGAGAAATTTTCCACAT
		Cas9 гидРНК-CCR 5-7	TATATGATTGATTTGCACAGCTCATCTGGCCAGATAAGCTGAGACA TCCGTTCCCCTACAAGAAACTCTC
		Cas9 гидРНК-CCR 5-8	ATCTGGCCAGAAGAGCTGAGACATCCGTTCCCCTTGAAGAAACTCTCCCCGGTAAGTAACCTCTCAGCTG
		Cas9 гидРНК-CCR 5-9	AGGCATCTCACTGGAGAGGGTTTAGTTCTCCTTAAGAGAAGATAAGATTTCAAGAGGGAAGCTAAGACTC
		Cas9 гидРНК-CCR 5-10	ATAATATAATAAAAAATGTTTCGTCTGCCACCACTAATGAATGTCATGCATTCTGGGTAGTTTAGTCTTA
		Cas9 гидРНК-CCR 5-11	TTTATAAAGTCCTAGAATGTATTTAGTTGCCCTCGTTGAATGCAAACTGTTTTATACATCAATAGGTTTT
		Cas9 гидРНК-CCR 5-12	GCTCAACCTGGCCATCTCTGACCTGTTTTTCCTTCCCACTGTCCCCTTCTGGGCTCACTATGCTGCCGCC
		Cas9 гидРНК-CCR 5-13	TTTTAAAGCAAACACAGCATGGACGACAGCCAGGCTCCTATCGATTGTCAGGAGGATGATGAAGAAGATT
		Cas9 гидРНК-CCR 5-14	GCTTGTCATGGTCATCTGCTACTCGGGAATCCTAATTACTCTGCTTCGGTGTCGAAATGAGAAGAAGAGG
Cas9 гидРНК-CCR 5-15	ATACTGCCCCCGCGAGGCCACATTGGCAAACCAGCTTGGGTGTTCAACTTCCAGACTTGGCCATGGAGAA
	Донорный ssO DN для направленного воздействия RETALENs на CC R5	reTALEN-CCR 5-1	CTGAAGAATTTCCCATGGGTCCCCACTTTCTTGTGAATCCTTGGAGTGAACCCCCCTGTCCTGAGTGGTTACTAGAACACACCTCTGGAC
		reTALEN-CCR 5-2	TGGAAGTATCTTGCCGAGGTCACACAGCAAGTCAGCAGCACAGCCAGTGTGACTCCGAGCCTGCTCCGCTAGCCCACATTGCCCTCTGGG
		reTALEN-CCR 5-3	CTACTGTCATTCAGCCCAATACCCAGACGAGAAAGCTGAGGGTATAACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTT
		reTALEN-CCR 5-4	GGAAGCCCAGAGGGCATCTTGTGGCTCGGGAGTAGCTCTCTGCTACCTTCTCAGCTCTGCTGACAATACTTGAGATTTTCAGATGTCACC
		reTALEN-CCR 5-5	TCAGCTCTGCTGACAATACTTGAGATTTTCAGATGTCACCAACGCCCAAGAGAGCTTGATATGACTGTATATAGTATAGTCATAAAGAAC
reTALEN-CCR 5-6	GTGGAAAATTTCTCATAGCTTCAGATAGATTATATCTGGAGTGAGCAATCCTGCCACCTATGTATCTGGCATAGTGTGAGTCCTCATAAA
		reTALEN-CCR 5-7	GAAACAGCATTTCCTACTTTTATACTGTCTATATGATTGATTTGGTCAGCTCATCTGGCCAGAAGAGCTGAGACATCCGTTCCCCTACAA
		reTALEN-CCR 5-8	TTGATTTGCACAGCTCATCTGGCCAGAAGAGCTGAGACATCCGTATCCCTACAAGAAACTCTCCCCGGTAAGTAACCTCTCAGCTGCTTG
		reTALEN-CCR 5-9	GGAGAGGGTTTAGTTCTCCTTAGCAGAAGATAAGATTTCAAGATGAGAGCTAAGACTCATCTCTCTGCAAATCTTTCTTTTGAGAGGTAA
		reTALEN-CCR 5-10	TAATATAATAAAAAATGTTTCGTCTGCCACCACAGATGAATGTCGAGCATTCTGGGTAGTTTAGTCTTATAACCAGCTGTCTTGCCTAGT
		reTALEN-CCR 5-11	TTAAAAACCTATTGATGTATAAAACAGTTTGCATTCATGGAGGGTGACTAAATACATTCTAGGACTTTATAAAAGATCACTTTTTATTTA
		reTALEN-CCR 5-12	GACATCTACCTGCTCAACCTGGCCATCTCTGACCTGTTTTTCCTATTTACTGTCCCCTTCTGGGCTCACTATGCTGCCGCCCAGTGGGAC
		reTALEN-CCR 5-13	TCATCCTCCTGACAATCGATAGGTACCTGGCTGTCGTCCATGCTACGTTTGCTTTAAAAGCCAGGACGGTCACCTTTGGGGTGGTGACAA
		reTALEN-CCR 5-14	GGCTGGTCCTGCCGCTGCTTGTCATGGTCATCTGCTACTCGGGAGACCTAAAAACTCTGCTTCGGTGTCGAAATGAGAAGAAGAGGCACA
reTALEN-CCR 5-15	GGCAAGCCTTGGGTCATACTGCCCCCGCGAGGCCACATTGGCAAGTCAGCAAGGGTGTTCAACTTCCAGACTTGGCCATGGAGAAGACAT

Пример VII

Получение библиотеки ампликонов целевых участков

Собирали клетки через 6 дней после нуклеофекции и 0,1 мкл фермента-тканевой протеазы prepGEM (ZyGEM) и 1 мкл буфера prepGEM gold (ZyGEM) добавляли к 8,9 мкл 2~5 X 105 клеток в среде, затем по 1 мкл реакций добавляли в 9 мкл ПЦР-смеси, содержащей 5 мкл готовой смеси 2X КАРА Hifi Hotstart Readymix (КАРА Biosystems) и 100 нМ соответствующих пар праймеров для амплификации. Реакционные смеси инкубировали при 95°C в течение 5 мин с последующими 15 циклами 98°C, 20 с; 65°C, 20 с и 72°C, 20 с. Для добавления адаптерной последовательности Illumina, 5 мкл продуктов реакции затем добавляли в 20 мкл ПЦР-смеси, содержащей 12,5 мкл готовой смеси 2X КАРА HIFI Hotstart Readymix (КАРА Biosystems) и 200 нМ праймеров, несущих адаптерные последовательности Illumina. Реакционные смеси инкубировали при 95°C в течение 5 мин с последующими 25 циклами 98°C, 20 с; 65°C, 20 с и 72°C, 20 с. ПЦР-продукты очищали с помощью набора для очистки ПЦР QIAquick, смешивали приблизительно в одинаковых концентрациях, и секвенировали с помощью персонального секвенатора MiSeq. ПЦР-праймеры перечислены ниже в Таблице 5.

Таблица 5 Последовательности ПЦР-праймеров для участка направленного воздействия в CCR5

# участка направленного воздействия в CCR5	название	последовательность праймера
°	Site1-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATTTT GCAGTGTGCGTTACTCC
°	Site1-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGTTT GCAGTGTGCGTTACTCC
1	Site1-F3	ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAATTT GCAGTGTGCGTTACTCC
°	Site1-F4	ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCATTT GCAGTGTGCGTTACTCC CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTCCAAGCAACTAAGTCACAGCA
°	Site1-R
°	°
°	Site2-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATATG AGGAAATGGAAGCTTG
°	Site2-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGAT GAGGAAATGGAAGCTTG
2	Site2-F3	ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAAAT GAGGAAATGGAAGCTTG
°	Site2-F4	ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCAATG AGGAAATGGAAGCTTG
°	Site2-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTCATTAGGG TATTGGAGGA
°	site3-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATAAT CCTCCCAACAACTCAT
°	site3-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGAA TCCTCCCAACAACTCAT
3	site3-F3	ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAAAA TCCTCCCAACAACTCAT
°	site3-F4	ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCAAAT CCTCCCAACAACTCAT
°	site3_R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTCCCAATCCT ACAGAGGCAG
°	site4-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATAA
°	site4-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGAA
4	site4-F3	ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAAAA
°	site4-F4	ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCAAA
°	site4_R	ACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGCCAAA GCTTTTTATTCT
5	Site5-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATATC TTGTGGCTCGGGAGTAG
°	Site5-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGATC TTGTGGCTCGGGAGTAG
°	Site5-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTTGGCAGGA TTCTTCACTCCA
°	site6-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATCTA TTTTGTTGCCCTTCAAA
6	site6-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGCTA TTTTGTTGCCCTTCAAA
°	site6-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTAACCTGAA CTTGACCATATACT
°	site7-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATCA GCTGAGAGGTTACTTACC
7	site7-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGCA GCTGAGAGGTTACTTACC
°	site7-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTAATGATTTA ACTCCACCCTC
°	site8-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATACT CCACCCTCCTTCAAAAGA
8	site8-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGACT CCACCCTCCTTCAAAAGA
°	site8-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTTGGTGTTTG CCAAATGTCT
°	site9_F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATGG GCACATATTCAGAAGGCA
9	site9_F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGGG GCACATATTCAGAAGGCA
°	site9_R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTAGTGAAAG ACTTTAAAGGGAGCA
°	site10-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATCAC AATTAAGAGTTGTCATA
10	site10-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGCA CAATTAAGAGTTGTCATA
°	site10-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTCTCAGCTA GAGCAGCTGAAC
11	site11-Fl	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTGACACTTG ATAATCCATC
	site11-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGTCA
		ATGTAGACATCTATGTAG
site11-R	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATTCA ATGTAGACATCTATGTAG
12	site12-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATACT GCAAAAGGCTGAAGAGC
	site12-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGACT GCAAAAGGCTGAAGAGC
	site12-F3	ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAAACT GCAAAAGGCTGAAGAGC
	site12-F4	ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCAACT GCAAAAGGCTGAAGAGC
site12-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTGCCTATAA AATAGAGCCCTGTCAA
13	site13-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATCTC TATTTTATAGGCTTCTTC
13	site13-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGCTC TATTTTATAGGCTTCTTC
site13-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTAGCCACCA CCCAAGTGATC
14	site14-F1	ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGTTC CAGACATTAAAGATAGTC
14	site14-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATTTC CAGACATTAAAGATAGTC
site14-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTAATCATGA TGGTGAAGATAAG
15	site15-Fl	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATCCG GCAGAGACAAACATTAAA
15	site15-F2	ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCGGCAGA GACAAACATTAAA
site15-R	CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTAGCTAGGA AGCCATGGCAAG

адаптер Illumina	PE-PCR-F	AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACA cgacgc
PE-PCR-R	CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCT GCTGAACcgc
Мультиплексные сиквенсные праймеры для ПЦР
3	site3-MF	ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGTGCATA GTATGTGCTAGATGCTG
°	site3-MR	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGATCTC TAAGAAGGCAAATGAGAC
Illumina адаптер	Index-PCR	CAAGCAGAAGACGGCATACGAGATN1N2N3N4N5N6GTGAC TGGAGTTCAGACGTGTGCTCTTCCGATCT
universal-PCR	AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACA CGACGCTCTTCCGATCT

* index-PCR - праймеры приобретены в Epicentre (праймеры ScriptSeq™ Index PCR Primers)

Пример VIII

Система оценки редактирования генома (GEAS)

Для обнаружения редких геномных изменений использовали секвенирование нового поколения. См. источники 27-30, включенные в данный документ ссылкой в полном объеме. Для того, чтобы сделать возможным широкое применение данного подхода для быстрой оценки эффективности HDR и NHEJ в hiPSCS, было создано программное обеспечение, названное «pipeline», для анализа данных инженерии генома. «Pipeline» интегрирована в одиночный модуль Unix, который использует различные инструменты, такие как R, BLAT и FASTX Toolkit.

Разбивка по штрих-коду: Группы образцов объединяли вместе и секвенировали по технологии спаренных концов с длиной прочтения 150 п.о. на секвенаторе MiSeq (PE150) (Illumina Next Gen Sequencing), а далее разделяли на основе ДНК-штрихкодирования с помощью пакета программ FASTX.

Качество фильтрации: Нуклеотиды с низким качеством последовательности (балл Phred <20) были обрезаны. После обрезки, «риды» короче 80 нуклеотидов были отброшены.

Картирование: BLAT использовали для независимого картирования «ридов», полученных секвенированием спаренных концов, на эталонном геноме и на выходе получали файлы *.psl.

Определение вставок/делеций: вставки/делеции были определены как полноразмерные «риды», содержащие 2 блока совпадений при выравнивании. В расчет принимались только «риды», соответствующие этому паттерну в обоих «ридах» спаренных концов. В качестве контроля качества требовались «риды» вставок/делеций, которые обладали минимальным 70 нуклеотидным совпадением с эталонным геномом, а оба блока должны иметь длину, по меньшей мере, 20 нуклеотидов. Размер и положение вставок/делеций рассчитывали по положению каждого блока в эталонном геноме. Негомологичное соединение концов (NHEJ) оценивали как процент «ридов», содержащих вставки/делеции (см. уравнение 1 ниже). Большинство событий NHEJ были обнаружены в непосредственной близости от участка направленного воздействия.

Эффективность рекомбинации, направляемой гомологией (HDR): Сравнение с паттерном (grep) в окне 12 п.о. центрированном по DSB, использовали для подсчета специфических сигнатур, соответствующих «ридам», содержащим эталонную последовательность, модификации эталонной последовательности (предполагаемые 2 п.о. несовпадения), и «риды», содержащие только 1 п.о. мутацию в пределах предполагаемых 2 п.о. несовпадений (2 п.о. предполагаемые несовпадения) (см. уравнение 1 ниже).

Уравнение 1. Оценка NHEJ и HDR

А = риды идентичные эталону: XXXXXABXXXXX

B = риды, содержащие 2 п.о. несовпадения, которые кодируются ssODN: XXXXXabXXXXX

C = риды, содержащие только 1 п.о. мутацию в участке-мишени: например, XXXXXaBXXXXX или XXXXXAbXXXXX

D = риды, содержащие вставки/делеции, как описано выше

Пример IX

Скрининг Генотипа колонизированных hiPSCs

Человеческие клетки iPS на безфидерных культурах предварительно обрабатывали средой mTesr-1, обогащенной SMC4 (5 мкМ тиазовивин, 1 мкМ CHIR99021, 0,4 мкМ PD0325901, 2 мкМ SB431542) (см. источник 23, включенный в данный документ ссылкой в полном объеме), по меньшей мере, за 2 часа до сортировки FACS. Культуры диссоциировали с помощью аккутазы (Millipore) и ресуспендировали в среде mTesr-1, обогащенной SMC4 и красителем ToPro-3 для проверки жизнеспособности (Invitrogen) в концентрации 1-2 X107/мл. Живые клетки hiPS сортировали по одной клетке с помощью BD FACSAria II SORP UV (BD Biosciences) со 100 мкм соплом в стерильных условиях в 96-луночные планшеты, покрытые облученными мышиными эмбриональными фибробластами CF-1 (Global Stem). Каждая лунка содержала клеточную среду для hES (см. источник 31, включенный в данный документ ссылкой в полном объеме) со 100 нг/мл рекомбинантного человеческого основного фактора роста фибробластов (bFGF) (Millipore) с добавлением SMC4 и 5 мкг/мл фибронектина (Sigma). После сортировки планшеты центрифугировали при 70 x g в течение 3 мин. Образование колоний было отмечено через 4 дня после сортировки, а культуральную среду заменили клеточной средой для hES с SMC4. SMC4 может быть удалена из клеточной среды для hES через 8 дней после сортировки.

Собирали несколько тысяч клеток через 8 дней после флуоресцентно-активируемой сортировки клеток и (FACS) и добавляли 0,1 мкл фермента-тканевой протеазы prepGEM (ZyGEM) и 1 мкл буфера prepGEM gold (ZyGEM) к 8,9 мкл клеток в среде. Реакции затем добавляли к 40 мкл ПЦР-смеси, содержащей 35,5 мл platinum 1,1X Supermix (Invitrogen), 250 нМ каждого dNTP и 400 нМ праймеров. Реакционные смеси инкубировали при 95°C в течение 3 мин с последующими 30 циклами 95°C, 20 с; 65°C, 30 и 72°C, 20 с. Продукты секвенировали по Сенгеру с использованием любого из ПЦР-праймеров таблицы 5 и анализировали последовательности с помощью DNASTAR (DNASTAR).

Пример X

Иммунноокрашивание и анализы тератом, полученных из hiPSCs

Клетки инкубировали в нокаутной среде DMEM/F-12 при 37°C в течение 60 минут с использованием следующих антител: анти-SSEA-4 PE (Millipore) (разбавленное 1: 500); Tra-1-60 (BD Pharmingen) (разбавленное 1: 100). После инкубации клетки промывали три раза нокаутной DMEM/F-12 и фотографировали на на Axio Observer Z.1 (ZIESS).

Для проведения анализа образования тератом, человеческие iPSCs собирали с помощью коллагеназы IV типа (Invitrogen), ресуспендировали клетки в 200 мкл матригеля и вводили внутримышечно в подушечки задних конечностей мышей с нокаутом по Rag2gamma. Тератомы выделяли и фиксировали в формалине через 4-8 недель после инъекции. Тератомы затем анализировали после окрашивания гематоксилином и эозином.

Пример XI

Ориентация локусов генома в соматических клетках человека и стволовых клетках человека с помощью reTALENS

Согласно некоторым аспектам, TALEs, известные специалистам в данной области техники, модифицированы или перекодированы для устранения повторяющихся последовательностей. Такие TALEs, подходящие для модификации и применения в способах редактирования генома в вирусных средствах доставки и в различных клеточных линиях и микроорганизмах, описанных в данном документе, описаны в источниках 2, 7-12, включенных в данных документ ссылкой в полном объеме. Было разработано несколько стратегий для сборки массива повторяющихся TALE RVD (см. источники 14 и 32-34, включенные в данных документ ссылкой в полном объеме. Однако после сборки повторяющиеся последовательности TALE остаются нестабильными, что ограничивает широкую применимость этого инструмента, особенно для вирусных средств доставки гена (см. источники 13 и 35 включенные в данных документ ссылкой в полном объеме. Соответственно, один аспект настоящего изобретения относится к TALEs, лишенных повторов, например, полностью лишенных повторов. Такие перекодированные TALE является эффективными, поскольку позволяют быстрее и проще синтезировать расширенные массивы TALE RVD.

Для устранения повторов, нуклеотидные последовательности массивов TALE RVD эволюционировали вычислительным образом с тем, чтобы минимизировать количество последовательностей-повторов при сохранении аминокислотной композиции. Перекодированные TALE (Re-TALEs), кодирующие 16 тандемных мономеров RVD, распознающих ДНК, плюс конечный полуповтор RVD, лишены любых 12 п.о. повторов (см. Фигуру 5а). Примечательно, что этот уровень перекодирования достаточен для того, чтобы провести амплификацию ПЦР какого-либо конкретного мономера или подраздела из полноразмерного конструкции с re-TALE (см. Фиг. 5b). Усовершенствованный дизайн re-TALEs может быть синтезирован с помощью стандартных технологий синтеза ДНК (см. источник 36, включенный в данный документ ссылкой в полном объеме, без каких дополнительных расходов или процедур, связанных с обогащенными повтрами последовательностями. Кроме того, дизайн перекодированных последовательностей позволяет эффективно собирать конструкции с re-TALE с использованием модифицированной изотермической реакции сборки, как описано в способах данного документа и со ссылкой на Фиг. 6.

NGS-данные по редактированию генома статистически анализировали следующим образом. Для анализа специфичности HDR, использовали точный биномиальный тест для вычисления вероятности наблюдения различных количеств «ридов», содержащих 2 п.о. несовпадения. На основании результатов секвенирования 10 п.о. окон до и после участка направленного воздействия, оценивали максимальные скорости замены оснований двух окон (PI и Р2). С помощью нулевой гипотезы о том, что изменения каждой из двух целевых п.о. были независимыми, была вычислена ожидаемая вероятность обнаружения 2 п.о. несоответствия в участке направленного воздействия случайно как произведение этих двух вероятностей (Р1 * Р2). Учитывая набор данных, содержащих N количество общих ридов и n количество HDR-ридов, мы рассчитали p-значение наблюдаемой эффективности HDR. Для анализа чувствительности HDR, донорные ssODN содержали 2 п.о. несовпадение относительно генома-мишени, что делает вероятной одновременную замену оснований в двух п.о., являющихся мишенями при включении ssODN в геном-мишень. Прочие нецелевые наблюдаемые изменения последовательностей, вероятно, не будут изменяться в это же время. Соответственно, нецелевые изменения были гораздо менее взаимозависимы. Исходя из этих предположений, взаимная информация (MI) была использована для измерения взаимной зависимости одновременных двух изменений пар оснований во всех других парах позиций, и предел обнаружения HDR оценивали как наименьшее HDR, где MI целевого 2 п.о. сайта выше, чем MI всех пар в других позициях. Для данного эксперимента, в оригинальном файле fastq были идентифицированы риды HDR с целевым 2 п.о. несовпадением и набор файлов fastq с разбавленными эффективностями HDR был смоделирован посредством систематического удаления различных количеств ридов HDR из исходного набора данных. Взаимную информацию (MI) вычисляли между всеми парами положений в пределах 20 п.о. окна с центром на участке направленного воздействия. В этих расчетах вычисляется взаимная информация о композиции оснований между любыми двумя позициями. В отличие от меры специфичности HDR, описанной выше, эта мера не оценивает тенденцию пар позиций изменять какие-либо конкретные пары целевых оснований, а только оценивает их тенденцию изменяться в одно и тоже время (см. Фиг. 8А). В таблице 6 приведены эффективности HDR и NHEJ для направленного воздействия re-TALEN/ssODN на CCR5 и эффективность NHEL для Cas9-гидРНК. Мы запрограммировали наш анализ в R и рассчитали MI при помощи пакета infotheo.

Таблица 6

# участок направленного воздействия	тип клеток	HDR (ReTALEN) (%)	NHEJ (reTALE) (%)	Предел обнаружения HDR на основе информациионного анализа	NHEJ (Cas9-гидРНК)	HDR (Cas9-гидРНК)
1	PGP1-iPS	0,06%	0,80%	0,04%	0,58%	0,38%
2	PGP1-iPS	0,48%	0,26%	0,01%	16,02%	3,71%
3	PGP1-iPS	1,71%	0,07%	0,03%	3,44%	3,20%
4	PGP1-iPS	0,02%	1,20%	0,02%*	1,50%	0,14%
5	PGP1-iPS	0,80%	0,04%	0,00%	3,70%	0,39%
6	PGP1-iPS	0,20%	0,73%	0,00%	1,12%	0,49%
7	PGP1-iPS	0,01%	0,15%	0,01%*	1,98%	1,78%
8	PGP1-iPS	0,03%	0,00%	0,00%	1,85%	0,03%
9	PGP1-iPS	1,60%	0,06%	0,00%	0,50%	0,13%
10	PGP1-iPS	0,68%	1,25%	0,01%	8,77%	1,32%
11	PGP1-iPS	0,06%	0,27%	0,00%	0,62%	0,44%
12	PGP1-iPS	1,60%	0,03%	0,04%	0,18%	0,99%
13	PGP1-iPS	0,00%	1,47%	0,00%	0,65%	0,02%
14	PGP1-iPS	0,47%	0,13%	0,02%	2,50%	0,31%
15	PGP1-iPS	0,8	0,14	0,08%	1,50	1,10%

* Группа, в которой предел обнаружения HDR превышает реальное детектируемое значение HDR

Корреляцию между эффективностью редактирования генома и эпигенетическим состоянием урегулировали следующим образом. Коэффициенты корреляции Пирсона рассчитывали для изучения возможных связей между эпигенетическими параметрами (заполненность ДНКазой I HS или нуклеосомами) и эффективностями генной инженерии (HDR, NHEJ). Набор данных по гиперчувствительности к ДНКазе I был загружен из геномного браузера UCSC. ДНКаза I HS из hiPSCs:

/gbdb/hgl9/bbi/wgEncodeOpenChromDnaseIpsnihi7Sig. bigWig

Для вычисления значения р, наблюдаемую корреляцию сравнивали с моделируемым распределением, которая была построена рандомизацией положения эпигенетического параметра (N = 100 000). Наблюдаемые корреляции выше, чем 95-й процентиль, или ниже, чем 5-й процентиль моделируемого распределения, считались потенциальными ассоциациями.

Определяли функцию re-TALEN по сравнению с соответствующими не перекодироваными TALEN в клетках человека. Линию клеток НЕК 293, содержащую репортерную кассету с GFP, и несущую вставку, смещающую рамку считывания, использовали, как описано в источнике 37, включенном в данное описание ссылкой в полном объеме. Смотрите также Фиг. 1а. Доставка TALENs или reTALENs, направленно воздействующих на последовательность вставки, вместе с беспромоторной донорной конструкцией с GFP, приводит к DSB-индуцированному HDR-восстановлению кассеты с GFP, при этом эффективность восстановления GFP может быть использована для оценки эффективности разрезания нуклеазой. См. источник 38, включенный в данный документ ссылкой в полном объеме. Индуцированное reTALENs восстановление GFP в 1,4% трансфецированных клеток, было аналогично полученному с помощью TALENs (1,2%) (см. Фиг. 1b). Активность reTALENs была протестирована в локусе AAVS1 в PGP1 hiPSCs (см. Фиг. 1с), при этом успешно восстановленные клеточные клоны, содержащие специфические вставки (см. Фиг. 1d, e), подтвердили, что reTALENs активны как в соматических, так и в плюрипотентных клетках человека.

Устранение повторов позволяет получить функциональный лентивирирус, нагруженный re-TALE. В частности, лентивирусные частицы, в которые были упакованы фрагменты, кодирующие re-TALE-2A-GFP, были протестированы на активность re-TALE-TF, кодируемых вирусными частицами, путем трансфекции репортера mCherry в пул клеток 293Т, инфецированных lenti-reTALE-2A-GFP. Клетки 293T, трансдуцированные lenti-re-TALE-TF показали 36x активацию экспрессии репортера по сравнению с только отрицательным репортером (см. Фиг. 7a, b, c). Проверяли целостность последовательности re-TALE-TF в лентивирус-инфицированных клетках и обнаружили полноразмерные reTALEs во всех 10 протестированных клонах (см. Фиг. 1d).

Пример XII

Сравнение эффективности ReTALEs и Cas9-гидРНК в hiPSCs с к помощью системы оценки редактирования генома (GEAS)

Для сравнения эффективности редактирования re-TALENs относительно Cas9-гидРНК в hiPSCs, была разработана платформа секвенирования следующего поколения (Система оценки Редактирования Генома) для выявления и количественной оценки как NHEJ, так и HDR событий генного редактирования. Пары re-TALEN и Cas9-гидРНК были спроектированы и сконструированы как направленно воздействующие на область, лежащую выше CCR5 (re-TALEN, Cas9-гидРНК пара # 3 в Таблице 3), вместе с 90 нуклеотидным ssODN-донором, идентичным участку направленного воздействия за исключением 2 п.о. несовпадения (см. Фиг. 2а). Нуклеазные конструкции и донорный ssODN трансфецировали в hiPSCs. Для количественной оценки эффективности генного редактирования, через 3 дня после трансфекции проводили глубокое секвенирование с использованием спаренных концевых фрагментов на целевой геномной области. Эффективность HDR измеряли по проценту «ридов», содержащих точное 2 п.о. несовпадение. Эффективность NHEJ измеряли как процент «ридов», несущих вставки/делеции.

Доставка ssODN отдельно в hiPSCs давала минимальные показатели HDR и NHEJ, в то время как доставка re-TALENs и ssODN давала эффективности 1,7% по HDR и 1,2% по NHEJ (см. Фиг. 2b). Введение Cas9-гидРНК с ssODN давало эффективности 1,2% по HDR и 3,4% по NHEJ. Примечательно, что показатель геномных делеций и вставок достиг своего пика в середине спейсерной области между двумя участками связывания reTALENs, но своего пика достиг на 3-4 п.о. выше последовательности Protospacer Associated Motif (РАМ) участка направленного воздействия Cas9-гидРНК (см. Фиг. 2b), как и следовало ожидать, поскольку двухцепочечные разрывы происходят в этих областях. В случае re-TALENs наблюдали средний геномный размер делеции 6 п.о. и размер вставки 3 п.о., а в случае Cas9-гидРНК средний размер делеции 7 п.о., вставки - 1 п.о. (см. Фиг. 2b), в соответствии с паттернами повреждений ДНК обычно образованных NHEJ (см. источник 4, включенный в данный документ ссылкой в полном объеме). Несколько анализов на платформе секвенирования следующего поколения показало, что GEAS может обнаружить уровень обнаружения HDR до 0,007%, который является одновременно высоко воспроизводимым (коэффициент вариации между повторами = ± 15% * измеренная эффективность) и в 400X более чувствительным, чем наиболее часто используемые тесты с чувствительной к несовпадениям эндонуклеазой (см. Фиг. 8).

Пары re-TALEN и Cas9-гидРНК, нацеленные на пятнадцать участков в геномном локусе CCR5, были созданы для определения эффективности редактирования (см. Фиг. 2с, таблица 3). Эти участки были выбраны для того, чтобы представлять широкий спектр чувствительностей ДНКазы I (см. источник 39, включенный в данный документ ссылкой в полном объеме). Нуклеазные конструкции трансфецировали вместе с соответствующими донорными ssODNs (см. таблицу 3) в PGP1 hiPSCs. Через шесть дней после трансфекции профилировали эффективности редактирования генома в этих участках (таблица 6). Для 13 из 15 пар re-TALEN с донорным ssODN, NHEJ и HDR детектировали на уровнях выше статистического порога обнаружения, со средней эффективностью NHEJ 0,4% и средней эффективностью HDR 0,6% (см. Фиг. 2с). Кроме того, статистически значимую положительную корреляцию (R2 = 0,81) обнаружили между эффективностями HR и NHEJ в одних и тех же целевых локусах (P <1 х 10-4) (см. Фиг. 9а), что предполагает, что образование DSB, общей вышестоящей стадии как для HDR, так и для NHEJ, является скорость-лимитирующей стадией для reTALEN-опосредованного редактирования генома.

В противоположность этому, все 15 пар Cas9-гидРНК показали значительные уровни NHEJ и HR, со средней эффективностью NHEJ 3% и средней эффективностью HDR 1,0% (см. Фиг. 2с). Кроме того, положительная корреляция была также обнаружена между эффективностью NHEJ и HDR, вызванных Cas9-гидРНК (см. Фиг. 9b) (R2 = 0,52, р = 0,003), что согласуется с наблюдениями для reTALENs. Эффективность NHEJ, достигаемая Cas9-гидРНК была значительно выше, чем та, что достигается с помощью reTALENs (t-тест, спаренные концы, P = 0,02). Наблюдалось умеренная, но статистически значимая корреляция между эффективностью NHEJ и температурой плавления целевой последовательности гидРНК (см. Фиг. 9c) (R2 = 0,28, р = 0,04), что позволяет предположить, что сила спаривания оснований между гидРНК и его геномной мишенью может объяснить вплоть до 28% вариации в эффективности Cas9-гидРНК-опосредованного образования DSB. Даже если Cas9-гидРНК продуцируют уровни NHEJ в среднем в 7 раз выше, чем соответствующие reTALEN, Cas9-гидРНК достигает уровней HDR (среднее = 1,0%), схожих с уровнями соответствующих reTALENs (среднее = 0,6%). Без связи с научной теорией, эти результаты позволяют предложить либо то, что концентрация ssODN при DSB является ограничивающим фактором для HDR, либо то, что структура геномного разрыва, образованного Cas9-гидРНК не выгодна для эффективного HDR. Никакой корреляции между ДНКазой I HS и эффективностями направленного воздействия на геном не наблюдали ни для одного из способов (см. Фиг. 10).

Пример XIII

Оптимизация Дизайна донорных ssODN для HDR

Высоко эффективные в hiPSCs ssODNs были разработаны следующим образом. Был разработан набор донорных ssODNs разных длин (50-170 нуклеотидов), которые все несут одинаковое 2 п.о. несовпадение в середине спейсерной области участков направленного воздействия пары re-TALEN #3 для CCR5. Наблюдаемая эффективность HDR варьировала в зависимости от длины ssODN, и оптимальная эффективность HDR -1,8% наблюдалась с 90 нуклеотидным ssODN, тогда как более длинные ssODNs имели пониженную эффективность HDR (см. Фиг. 3а). Поскольку более длинные участки гомологии улучшают показатели HDR, когда донорные дцДНК использовались с нуклеазами (см. источник 40, включенный ссылкой в полном объеме), возможные причины такого результата могут заключаться в том, что ssODNs используются в альтернативном процессе восстановления генома; более длинные ssODNs менее доступны для аппарата восстановления генома; или в том, что более длинные ssODNs привносят отрицательные эффекты, которые нейтрализуют любые улучшения, придаваемые более длинной гомологией, по сравнению с дцДНК-донорами (см. источник 41, включенный в данный документ ссылкой в полном объеме). Тем не менее, если дело было в любой из первых двух причин, то показатели NHEJ должны быть либо неизменными, либо увеличиваться с более длинными ssODNs, потому что репарация NHEJ не включает донорный ssODN. Тем не менее, наблюдали снижение показателей NHEJ вместе с HDR (см. Фиг. 3а), что позволяет предположить, что более длинные ssODNs демонстрируют компенсирующие эффекты. Возможные гипотезы могут заключаться в том, что более длинные ssODNs являются токсичными для клетки (см. источник 42, включенный в данный документ ссылкой в полном объеме), или в том, что трансфекция длинных ssODNs насыщает машинерию процессирования ДНК, тем самым вызывая уменьшение молярного поглощения ДНК и уменьшая емкость клеток поглощать и экспрессировать плазмиды с re-TALEN.

Была проведена проверка вариабельности показателя включения несовпадений, которые несут донорные ssODN, в зависимости от дистанции от двухцепочечного разрыва («DSB»). Для этого разработали серию 90 нуклеотидных ssODNs, которые все обладают одинаковым 2. п.о. несовпадением (А) в центре спейсерной области пары re-TALEN # 3. Каждый ssODN также содержала второе 2 п.о. несовпадение (B) на различных расстояниях от центра (см. Фиг. 3b). ssODN, обладающий лишь одним 2 п.о. несовпадением использовали в качестве контроля. Каждый из этих ssODNs вводили в индивидуальном порядке с парой re-TALEN #3 и анализировали результаты с помощью GEAS. Мы обнаружили, что общий HDR - если измерять по показателю, при котором включение несовпадения А (только А или A + B) - уменьшается по мере того, как несовпадения В располагаются дальше от центра (см. Фиг. 3b, см. Фиг. 11а). Более высокий показатель HDR, наблюдаемый, когда В находится всего лишь в 10 п.о. от А, может отражать меньшую потребность в отжиге ssODN против геномной ДНК в непосредственной близости от разрыва двухцепочечной ДНК.

Для каждого расстояния В от А, часть событий HDR относится к включению только несовпадения А, тогда как другая часть относится к включению как А, так и В несовпадений (см. Фиг. 3b (только A и A + B)). Эти два результата могут быть связаны с трактами генной конверсии (см. источник 43, включенный в данный документ ссылкой в полном объеме) по длине одноцепочечного ДНК-олигонуклеотида, в результате чего включение несовпадений А+В являющегося результатом длинных конверсионных трактов, которые простираются за пределы несовпадения В, а включение только А несовпадения является результатом более коротких путей, которые не достигают В. в соответствии с этой интерпретацией, оценивали распределение трактов генной конверсии в обоих направлениях вдоль ssODN (см. Фиг. 11b). Оцененное распределение подразумевает, что тракты генной конверсии постепенно становятся менее частыми, по мере увеличения их длин, результат, очень похожий на распределения трактов генной конверсии, наблюдаемых с донорными дцДНК, но на сильносжатой шкале дистанций в десятки основания для оцДНК донора относительно сотен оснований для дцДНК доноров. В соответствии с этим результатом, эксперимент с ssODN, включающим три пары 2 п.о. несовпадений с интервалом 10 нуклеотидов в обе стороны от центрального 2 п.о. несовпадения «А», позволил получить паттерн, в котором А отдельно был включен в 85% случаев, с множественными несовпадениями В, включенными в других случаях (см. Фиг. 11с). Хотя количество событий с включением только В было слишком низким для оценки распределения длин путей менее 1 п. о., ясно, что область с коротким путем в пределах 10 п.о. от нуклеазного сайта является преобладающей (см. Фиг. 11,b). Наконец, во всех экспериментах с одиночными несовпадениями В, наблюдалась небольшая часть событий включения только B (0,04% ~ 0,12%), что приблизительно постоянно для всех расстояний от А до В.

Кроме того, был проведен анализ того, как далеко может быть расположен донор ssODN от re-TALEN-индуцированного разрыва двухцепочечной ДНК, при сохранении его включения. Протестировали набор 90-нуклеотидных ssODNs с центральными 2 п.о. несовпадениями, нацеленными на диапазон больших дистанций (-600 п.о. до + 400 п.о.) от re-TALEN-индуцированного участка разрыва дцДНК. Когда ssODNs совпадает с последовательностью в > 40 п.о., мы наблюдали > 30x более низкие эффективности HDR по сравнению с контрольным ssODN, расположенным по центру над областью разрезания (Фиг. 3с). Наблюдавшийся низкий уровень включения может быть результатом процессов, несвязанных с разрезанием дцДНК, как видно в экспериментах, в которых геномы изменены отдельно оцДНК донором, см. источник 42, включенный в данный документ ссылкой в полном объеме. Между тем, низкий уровень HDR, который имеет место, когда ssODN расположен в ~ 40 п.о., может быть связан с комбинацией ослабленной гомологии на содержащей несовпадение стороне разреза дцДНК, вместе с недостаточной длиной оцДНК олигонуклеотида на другой стороне дцДНК разрыва.

Было проведено тестирование дизайна донора ssODNs ДНК для опосредованного Cas9-гидРНК направленного воздействия. Сконструировали Cas9-гидРНК (С2), направленно воздействующий на локус AAVS 1, и ssODN-доноры различных ориентаций (Ос: комплементарная к гидРНК и On: некомплементарная к гидРНК) и длин (30, 50, 70, 90, 110 нуклеотидов). Ос были более эффективны, чем On, а 70-мерный Oc достиг оптимального показателя HDR 1,5% (см. Фиг. 3d.) Такую же тенденциозность цепи ssODN детектировали с помощью никазы из Cas9 (CC: Cas9_D10A), несмотря на тот факт, что эффективности HDR, опосредованные Cc с ssODN были значительно меньше, чем С2 (t-тест, спаренные концы, Р = 0,02). (см. Фиг. 12).

Пример XIV

Клональное Выделение Скорректированных Клеток hiPSC

GEAS показало, что re-TALEN пара #3 достигла точного редактирования генома в hiPSCsc эффективностью ~ 1%, уровня, при котором правильно отредактированные клетки обычно можно выделить скринингом клонов. HiPSCs имеют плохую жизнеспособность в виде отдельных клеток. Оптимизированные протоколы, описанные в источнике 23, включенном в данный документ ссылкой в полном объеме, вместе с процедурой сортировки одноклеточной FACS использовали для создания надежной платформы сортировки одиночных hiPSCs и их поддержания, где клоны hiPSC могут быть восстановлены с показателями выживания > 25%. Этот способ был объединен с быстрой и эффективной системой генотипирования, для проведения экстракции хромосомной ДНК и целевой амплификации генома в 1 ч реакциях в одной пробирке, что позволяет осуществить генотипирование hiPSCs в большом масштабе. Вместе эти способы представляют собой конвейер для надежного получения hiPSCs с отредактированным геномом без отбора.

Чтобы продемонстрировать эту систему (см. Фиг. 4а), PGP1 hiPSCs трансфецировали парой reTALENs и ssODN, предназначенных для направленного воздействия на CCR5 в участке #3 (таблица 3). GEAS проводили на части трансфецированных клеток, при этом обнаружили частоту HDR 1,7% (см. Фиг. 4b). Эта информация, наряду с 25% выходом отсортированных клонов единичных клеток, позволяют оценить получение, по меньшей мере, одного правильно отредактированного клона из пяти 96-луночных планшетов с пуассоновской вероятностью 98% (при условии, что μ = 0,017 * 0,25 * 96 * 5 * 2). Через шесть дней после трансфекции, hiPSCs сортировали с помощью FACS, а через восемь дней после сортировки, 100 клонов hiPSC подвергли скринингу. Секвенирование по Сенгеру показало, что 2 из этих 100 не подвергнутых отбору колоний hiPSC содержали гетерозиготный генотип, обладающий 2 п.о. мутацией, введенной донорным ssODN (см. Фиг. 4с). Эффективность направленного воздействия 1% (1% = 2/2 * 100, 2 моноаллельных скорректированных клона из 100 клеток, подвергнутых скринингу) была сопоставима с данными, полученными при анализе секвенированием следующего поколения (1,7%) (см. Фиг. 4b). Плюрипотентность полученных hiPSCs подтвердили иммуногистохимическое окрашивание SSEA4 и TRA-1-60 (см. Фиг. 4d). Подвергнутые успешному направленному воздействию клоны hiPSCs были способны образовывать зрелые тератомы с признаками всех трех зародышевых листков (см. Фиг. 4E).

Пример XV

Способ непрерывного редактирования генома клетки

Согласно некоторым аспектам, предлагается способ редактирования генома в клетках, включающий человеческую клетку, например, человеческую стволовую клетку, где клетка генетически модифицирована для включения нуклеиновой кислоты, кодирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени, и который расщепляет ДНК-мишень сайт-специфическим образом. Такой фермент включает направляемый РНК ДНК-связывающий белок, такой как РНК-направляемый ДНК-связывающий белок системы CRISPR II типа. Типичным ферментом является Cas9. Согласно этому аспекту, клетка экспрессирует фермент, а направляющая РНК вносится в клетку из среды, окружающей клетку. Направляющая РНК и фермент образуют комплекс колокализации на ДНК-мишени, где указанный фермент разрезает ДНК. Необязательно, донорная нуклеиновая кислота может присутствовать для вставки в ДНК в месте разреза, например, путем негомологичного соединения концов или гомологичной рекомбинации. Согласно одному аспекту, нуклеиновая кислота, кодирующая фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишени сайт-специфическим образом, такой как Cas9, находится под управлением промотора, так что нуклеиновая кислота может быть активирована и подавлена. Такие промоторы, хорошо известны специалистам в данной области техники. Одним примерным промотором является промотор, индуцируемый DOX. Согласно одному аспекту, клетка генетически модифицирована обратимой вставкой в ее геном нуклеиновой кислоты, кодирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом. После вставки нуклеиновая кислота может быть удалена с помощью реактива, такого как транспозаза. Таким образом, нуклеиновая кислота может быть легко удалена после применения.

Согласно одному аспекту, предлагается система непрерывного редактирования генома человеческих индуцированных плюрипотентных стволовых клеток (hiPSCs) с помощью системы CRISPR. В соответствии с типичным аспектом способ включает применение линии hiPSC с Cas9, обратимо вставленным в геном (Cas9-hiPSCs); и гидРНК, которые были модифицированы из их нативной формы с тем, чтобы позволить им переход из среды, окружающей клетки, в клетки для применения вместе с Cas9. Такие гидРНК обрабатывали фосфатазой, для удаления фосфатных групп. Редактирование генома в клетки осуществляется с помощью Cas9 путем обогащения обработанной фосфатазой гидРНК среды для культивирования тканей. Такой подход позволяет редактировать геном HiPSCs без «шрамов» с эффективностями вплоть до 50% при однодневных обработках, которые в 2-10 раз более эффективны, чем наилучшие эффективности, известные к настоящему времени. Кроме того, способ прост в использовании и имеет значительно меньшую клеточную токсичность. Воплощения настоящего изобретения включают одиночное редактирование hiPSCs для биологических исследований и терапевтических применений, мультиплексное редактирование hiPSCs для биологических исследований и терапевтических применений, направленную эволюцию hiPSCs и скрининг hiPSCs по фенотипу и клеток, производных от них.

В соответствии с некоторыми аспектами, другие клеточные линии и организмы, описанные в данном документе, могут быть использованы в дополнение к стволовым клеткам. Например, описанный в данном документе способ может быть использован для клеток животных, таких как мышиные или крысиные клетки, с получением мышиных и крысиных клеток со стабильной интеграцией Cas9, и может быть проведено тканеспецифичное редактирование генома местным введением обработанной фосфатазой направляющей РНК из среды, окружающей клетки. Более того, другие производные Cas9 могут быть вставлены во множество клеточных линий и микроорганизмов, и могут быть проведены геномные манипуляции направленного воздействия, такие как внесение одноцепочечных разрывов, специфичное к последовательности, активация генов, супрессия и эпигенетическая модификация.

Аспекты настоящего описания направлены на получение стабильных hiPSCs с вставленным в геном Cas9. Аспекты настоящего описания направлены на модификацию РНК, так чтобы позволить ей проникать в клетку через клеточную стенку и колокализоваться с Cas9, при этом избегая иммунного ответа клетки. Такая модифицированная направляющая РНК может достичь оптимальных эффективностей трансфекции с минимальной токсичностью. Аспекты настоящего раскрытия направлены на оптимизированное редактирование генома в Cas9-hiPSCs с использованием гидРНК, обработанных фосфатазой. Аспекты настоящего изобретения включают устранение Cas9 из hiPSCs для достижения редактирования генома без «шрамов», где нуклеиновая кислота, кодирующая Cas9, была обратимо помещена в клеточный геном. Аспекты настоящего изобретения включают биомедицинскую инженерию с использованием hiPSCs с вставленным в геном Cas9 в для создания искомых генетических мутаций. Такие подвергнутые инженерии hiPSCs поддерживают плюрипотентность и могут успешно дифференцироваться в различные типы клеток, в том числе кардиомиоциты, которые полностью воспроизводят фенотип клеточных линий пациента.

Аспекты настоящего изобретения включают библиотеки направляющих РНК, обработанных фосфатазой, для мультиплексного редактирования генома. Аспекты настоящего изобретения включают получение библиотеки клеточных линий PGP, в которых каждая клеточная линия несет несколько обозначенных мутаций в геном, которые служат в качестве ресурса для скрининга лекарственных средств. Аспекты настоящего изобретения включают получение клеточных линий PGP1 со всеми ретроэлементами, подвергнутыми штрихкодированию различными последовательностями, для отслеживания расположений и активности этого элемента.

Пример XVI

Получение стабильных hiPSCs со вставленным в геном Cas9

Конструкт с Cas9, экспрессируемый под DOX-индуцируемым промотором, помещали в вектор PiggyBac, который может быть вставлен в геном и удален из него с помощью транспозазы PiggyBac. Реакция ПЦР подтверждала стабильное введение вектора (см. Фиг 14). Индуцируемую экспрессию Cas9 определяли с помощью количественной ПЦР в реальном времени. Уровень мРНК Cas9 увеличился в 1000x после 8 часов 1 мкг/мл DOX в культуральной среде и упал до нормального уровня через ~20 часов после удаления DOX (См. Фиг. 15).

Согласно одному аспекту, редактирование генома на основе системы Cas9-hiPSC обходит процедуру трансфекции плазмиды с Cas9/РНК, большой конструкции обычно с эффективностью трансфекции в hiPSCs <1%. Настоящая система Cas9-hiPSC может служить в качестве платформы для осуществления высоко эффективной геномной инженерии стволовых клеток человека. Кроме того, кассета Cas9, введенная в hiPSCs, с помощью системы PiggyBac, может быть легко удалена из генома при введении транспозазы.

Пример XVII

Направляющая РНК, обработанная фосфатазой

Для того, чтобы сделать возможным непрерывное редактирование генома Cas9-hiPSCs, были получены серии модифицированных РНК, кодирующей направляющую РНК, которые вносились в культуральную среду для Cas9-iPS в комплексе с липосомой. Нативная РНК, обработанная фосфатазой, без какого-либо кэпирования достигает оптимального значения HDR 13%, что более чем в 30X больше, чем значения эффективности, сообщаемые ранее для 5'Cap-Mod РНК (см. Фиг. 16).

Согласно одному аспекту, направляющая РНК физически прикреплена к донорной ДНК. Таким образом, предлагается способ объединения опосредованного Cas9 разрезания в геноме и ssODN-опосредованной HDR, что приводит к стимуляции последовательность-специфического редактирования генома. Направляющая РНК, связанная с донорным ssODN в оптимизированной концентрации, достигает 44% HDR и 2% неспецифического NHEJ (см. Фиг. 17). Следует отметить, что эта процедура не вызывает видимой токсичности, которая наблюдается в случае нуклеофекции и электропорации.

Согласно одному аспекту, в настоящем изобретении предлагается in vitro сконструированная РНК-структура, кодирующая направляющую РНК, которая достигает высокой эффективности трансфекции, эффективности редактирования генома в сочетании со вставленным в геном Cas9. Кроме того, настоящее изобретение обеспечивает химерный конструкт направляющая РНК-ДНК для объединения события разрезания генома с реакцией направляемой гомологией рекомбинации.

Пример XVIII

Удаление из hiPSCs обратимо вставленного Cas9

Для достижения геномного редактирования без «шрамов» согласно некоторым аспектам, кассету с Cas9 вставляли в геном клеток hiPSC с помощью обратимого вектора. Соответственно, кассета Cas9 обратимо встраивается в геном клеток hiPSC с помощью вектора PiggyBac. Кассета с Cas9 удаляли из hiPSCs с отредактированным геномом трансфекцией клетки плазмидой, кодирующей транспозазу. Соответственно, аспекты настоящего изобретения включают применение обратимого вектора, который известен специалистам в данной области техники. Обратимый вектор является вектором, который может быть, например, вставлен в геном, и затем удален с помощью соответствующего фермента для удаления вектора. Такие векторы и соответствующие ферменты для удаления вектора известны специалистам в данной области техники. Проводили скрининг на колонизированных iPS-клетках, и выделяли колонии, лишенные кассеты с Cas9, что было подтверждено реакцией ПЦР. Соответственно, настоящее изобретение обеспечивает способ редактирования генома, который не затрагивает остальную часть генома, при наличии в клетке перманетно вставленной кассеты с Cas9.

Пример XIX

Редактирование генома в клетках iPGP1

Исследование патогенеза кардиомиопатии исторически было затруднено из-за отсутствия подходящих модельных систем. Дифференцировка кардиомиоцитов из индуцированных плюрипотентных стволовых клеток, полученных из пациентов (iPSCs) считается одним из перспективных путей преодоления данного препятствия, и в настоящее время начинают появляться сообщения о моделировании кардиомиопатии на основе iPSCs. Тем не менее, реализация этой перспективы требует подходов, которые преодолевают генетическую гетерогенность линий iPSC, полученных из пациентов.

Клеточные линии Cas9-iPGP1 и обработанную фосфатазой направляющую РНК, связанную с ДНК, использовали для получения трех линий iPSC, которые являются изогенными, за исключением последовательности экзона 6 TAZ, который был идентифицирован как несущий однонуклеотидную делецию у пациентов с синдромом Барта. Однораундная трансфекция РНК дает ~30% эффективность HDR. Модифицированные клетки Cas9-iPGP1 с искомыми мутациями выращивали до уровня колоний (см. Фиг. 18), после чего клеточные линии дифференцировали в кардиомиоциты. Кардиомиоциты полученные из сконструированных Cas9-iPGP1, полностью восстановили кардиолипин, митохондриальный дефицит и дефицит АТФ, наблюдаемые в iPSCs, которые были получены из пациентов, и в неонатальной крысиной модели с нокаутом TAZ (см. Фиг. 19). Соответственно, предлагаются способы коррекции мутаций, вызывающих заболевания, в плюрипотентных клетках с последующей дифференцировкой клеток в искомые типы клеток.

Пример XX

Материалы и методы

1. Получение стабильных клеточных линий iPS/ES с PiggyBacCas9, индуцируемым DOX

1. После достижения клетками 70% конфлюэнтности культуру предварительно обрабатывали в течение ночи ингибитором ROCK Y27632 в конечной концентрации 10 мкМ.

2. На следующий день готовили раствор для нуклеофекции путем объединения 82 мкл раствора для нуклеофекции человеческих стволовых клеток и 18 мкл добавки 1 в стерильной 1,5 мл пробирке Eppendorf. Хорошо перемешивали. Инкубировали раствор при 37°C в течение 5 минут.

3. Аспирировали mTeSRl; осторожно промывали клетки 2 мл DPBS на лунку шестилуночного планшета.

4. Аспирировали DPBS, добавляли 2 мл/лунку версена, и оставляли культуру в инкубаторе при температуре 37°C, пока они не сгруппируются вместе и не потеряют адгезию, но до отсоединения. Это требует 3-7 мин.

5. Аккуратно аспирировали версен и добавляли mTeSRl. Добавляли 1 мл mTeSRl и сбивали клетки с помощью 1000 мкл микропипетки медленным потоком mTeSRl.

6. Собирали отсоединившиеся клетки, мягко разбивали их в одноклеточную суспензию, количественно оценивали с помощью гематоцитометра, и корректировали плотность клеток до 1 миллиона клеток на мл.

7. Добавляли 1 мл суспензии клеток в 1,5 мл пробирку Eppendorf и центрифугировали при 1100 оборотов в минуту в течение 5 мин в настольной центрифуге.

8. Ресуспендировали клетки в 100 мкл раствора Nucleofector для нуклеофекции человеческих стволовых клеток из стадии 2.

9. Переносили клетки к кювету Nucleofector с помощью пипетки на 1 мл. Добавляли в суспензию клеток в кювете 1 мкг плазмиды с транспозазой и 5 мкг плазмид PB Cas9. Смешивали клетки и ДНК осторожным втряхиванием.

10. Помещали кювету в Nucleofector. Выбирали программу B-016 и подвергали клетки нуклеофекции нажатием кнопки X.

11. Добавляли 500ul среды mTeSRl с ингибитором ROCK в кювету после нуклеофекции. 12. Асперировали подвергнутые нуклеофекции клетки из кюветы с помощью предоставленной пластиковой пастеровской пипетки. Переносили клетки покапельно в покрытые матригелем лунки 6 луночного планшета со средом mTeSRl и ингибитором ROCK. Инкубировали клетки при 37°C в течение ночи.

13. Заменяли среду в mTesr1 на следующий день и через 72 часа после трансфекции, добавляли пуромицин в конечной концентрации 1 мкг/мл. Линия выводилась в течение 7 дней.

2. Выделение РНК

1. Готовили ДНК-матрицу, гдеТ7-промотор выше последовательности, кодирующей направляющую РНК.

2. Очищали ДНК с помощью Mega Clear Purification и нормализовали ее концентрацию.

3. Готовили пользовательские смеси NTPS для получения различных направляющих РНК.

# 1 Смесь нативной РНК	[Конечная] (мМ)
GTP	7,5
АТФ	7,5
CTP	7,5
UTP	7,5
Общий объем	°
# 2 Смесь Кэпированной нативной РНК	[Конечная] (мМ)
структурный аналог 3'-O-Ме-m7G Cap (NEB)	6
GTP	1,5
ATP	7,5
CTP	7,5
UTP	7,5
Общий объем	°
#3 Модифицированная смесь РНК	[Конечная] (мМ)
GTP	7,5
ATP	7,5
5-Me-CTP (Tri-Link)	7,5
Pseudo-UTP (Tri-Link)	7,5
Общий объем	°
#4 смесь кэпированной/модифицированной РНК	[Конечная] (мМ)
структурный аналог 3'-O-Ме-m7G Cap (NEB)	6
GTP	1,5
ATP	7,5
5-Me-CTP (Tri-Link)	7,5
Псевдо-UTP (Tri-Link)	7,5
Общий объем	°

4. Готовили смесь для транскипции in vitro при комнатной температуре.

Amt (мкл)
Пользовательские NTP (* Добавить об./IVT rxn как указано выше) на льду	Н.Д.
Продукт ПЦР (100 нг/мкл) = всего 1600 нг ([Окончательная конц.] = 40 нг/мкл)	16
Буфер x10 (набор MEGAscript из Ambion) @ RT	4
Фермент T7 (набор MEGAscript из Ambion)	4

5. Инкубировали в течение 4 часов (3-6 часов OK) при 37°C (амплификатор).

6. Добавляли 2мкл Turbo ДНКазы (набор MEGAscript из Ambion) к каждому образцу. Тщательно перемешивали и инкубировали при 37°C в течение 15'.

7. Очищали обработанную ДНКазой реакцию с использованием MegaClear от Ambion в соответствии с инструкциями изготовителя.

8. Очищали РНК с помощью MEGAclear (очищенная РНК может храниться при -80 в течение нескольких месяцев).

9. Удаляли фосфатные группы, с целью избежать иммунной реакции Toll2 в клетке-хозяине.

Обработка РНК фосфатазой	IX	12
Для каждого образца РНК	~ 100 мкл	НД
10х буфер для антарктической фосфатазы	11 мкл	132
Антарктическая фосфатаза	2 мкл	24

Аккуратно перемешивали образец и инкубировали при 37 С в течение 30 секунд (30 секунд - 1 ч ок)

3. Трансфекция РНК

1. Рассевали 10K-20K клеток на 48 лунок без антибиотиков. Для трансфекции клетки должны быть на 30-50% конфлюэнтны.

2. Заменяли клеточную среду с B18R (200 нг/мл), DOX (1 мкг/мл), пуромицином (2 мкг/мл), по меньшей мере, за два часа до трансфекции.

3. Готовили реагент для трансфекции, содержащий направляющую РНК (0,5 мкг ~ 2 мкг), донорную ДНК (0,5 мкг ~ 2 мкг) и RNAiMax, инкубировали смесь при температуре rm в течение 15 минут и переносили в камеру к клеткам.

4. Рассеивание одиночных человеческих iPS клеток рассевали и сбор одиночных клонов

1. Через 4 дня индукции DOX и 1 дня отмены DOX, асперировали среду, отмывали осторожно с помощью DPBS, добавляли 2 мл/лунку версена, и помещали культуру обратно в инкубатор при температуре 37°C до тех пор, пока клетки не группировались вместе и становились непрочно прикрепленными, но не отсоединенными. Это требовало 3-7 мин.

2. Аккуратно аспирировали версен и добавляли mTeSRl. Добавляли 1 мл mTeSRl и отсоединяли клетки с помощью 1000 мкл микропипетки медленным потоком mTeSRl.

3. Собирали отсоединенные клетки, мягко разбивали их в одноклеточную суспензию, количественно оценивали с помощью гематоцитометра, и корректировали плотность клеток до 100 тыс. клеток на мл.

4. Рассевали клетки на покрытые матригелем 10 см чашки с mTeSRl плюс ингибитор ROCK при плотности клеток 50К, 100К и 400К на 10 см чашку.

5. Скрининг клонов, образованных из одиночных клеток

1. Через 12 дней культивирования в 10 см чашке, клоны становились достаточно большими, чтобы быть идентифицированными невооруженным глазом, с возможностью мечения цветным маркером. Не давали клонам становиться слишком большими, и слипаться друг с другом.

2. Помещали 10 см чашку в ламинар и с помощью пипетки P20 (установленной на 10 мкл) с наконечниками с фильтрами аспирировали 10 мкл среды из каждой лунки 24 луночных планшетов. Отбирали клоны клон путем соскребания клона и переноса в каждую лунку 24 луночного планшета. Для каждого клона использовали отдельный наконечник с фильтром.

3. Через 4-5 дней клоны внутри одной лунки 24-луночного планшета становились достаточно большими для разделения.

4. Аспририровали среду и промывали 2 мл/лунку DPBS.

5. Аспирировали DPBS, заменяли 250 мкл/лунку диспазы (0,1 Ед/мл) и инкубировали клетки с диспазой при 37°C в течение 7 минут.

6. Заменяли диспазу 2 мл DPBS.

7. Добавляли 250 мкл mTeSRl. С помощью скребка для клеток снимали и собирали клетки.

8. Переносили 125 мкл суспензии клеток в лунку 24-луночного планшета, покрытого матригелем.

9. Переносили 125 мкл суспензии клеток в 1,5 мл пробирку Эппендорф для экстракции геномной ДНК.

6. Скрининг клонов

1. Центрифугировали пробирку из стадии 7.7

2. Аспирировали среду и добавляли 250 мкл буфера для лизиса на лунку (10 мМ + TrispH7. 5 + (или + 8,0), 10 мМ ЭДТА, 10 мМ

3. NaCl + 10% ДСН, 40 мкг/мл протеиназы К + (добавленной свежей перед использованием буфера).

4. Выдерживали при 55 в течение ночи.

5. Высаживали ДНК добавлением 250 мкл изопропанола.

6. Центрифугировали в течение 30 минут на максимальной скорости. Промывали 70% этанолом.

7. Аккуратно удаляли этанол. Сушили на воздухе в течение 5 мин.

8. Ресуспендировали гДНК в 100-200 мкл dH2O.

9. Амплифицировали с помощью ПЦР целевую геномную область с помощью специфических праймеров.

10. Секвенировали по Сенгеру продукт ПЦР с помощью соответствующего праймера.

11. Анализировали данные о последовательностях по Сэнгеру и экспансию целевых клонов.

7. Удаление вектора PiggyBac

1. Повторяли стадии 2.1-2.9

2. Переносили клетки в кювету Nucleofector с помощью 1 мл наконечника для пипетки. Добавляли 2 мкг плазмиды с транспозазой в суспензию клеток в кювете. Смешивали клетки и ДНК осторожным покачиванием.

3. Повторяли стадию 2.10-2.11

4. Асперировали нуклеофицированные клетки из кюветы с помощью предоставленной пастеровской пластиковой пипетки и переносили клетки покапельно в 10 см чашки покрытые матригелеем со средой mTeSR1 и ингибитором ROCK. Инкубировали клетки при 37°C в течение ночи.

5. На следующий день заменяли среду mTesr1 и заменяли среду каждый день в течение 4 последующих дней.

6. После того, как клоны стал достаточно большими забирали 20-50 клонов и рассевали в 24 луночный планшет.

7. Генотипировали клоны с помощью праймеров на вектор PB Cas9 PiggyBac и размножали отрицательные клоны.

Список литературы

Литературные источники обозначены в описании их номером и включены в описание как если бы они были полностью изложены в нем. Каждый из следующих источников включен в данное описание ссылкой в полном объеме.

1. Carroll, D. (2011) Genome engineering with zinc-finger nucleases. Genetics, 188, 773-82.

2. Wood, A.J., Lo, T. -W., Zeitler, B., Pickle, C.S., Ralston, E.J., Lee, A.H., Amora, R., Miller, J.C, Leung, E., Meng, X., et al. (2011) Targeted genome editing across species using ZFNs and TALENs. Science (New York, N. Y.), 333, 307.

3. Perez-Pinera, P., Ousterout, D.G. and Gersbach, C. A. (2012) Advances in targeted genome editing. Current opinion in chemical biology, 16, 268-77.

4. Symington, L.S. and Gautier, J. (2011) Double-strand break end resection and repair pathway choice. Annual review of genetics, 45, 247-71.

5. Urnov, F.D., Miller, J.C, Lee, Y.-L., Beausejour, C.M., Rock, J.M., Augustus, S., Jamieson, A.C, Porteus, M.H., Gregory, P.D. and Holmes, M.C. (2005) Highly efficient endogenous human gene correction using designed zinc-finger nucleases. Nature, 435, 646-51.

6. Boch, J., Scholze, H., Schornack, S., Landgraf, A., Hahn, S., Kay, S., Lahaye, T., Nickstadt, A. and Bonas, U. (2009) Breaking the code of DNA binding specificity of TAL-type III effectors. Science (New York, N. Y.), 326, 1509-12.

7. Cell, P., Replacement, K.S., Talens, A., Type, A., Collection, C, Ccl-, A. and Quickextract, E. Genetic engineering of human pluripotent cells using TALE nucleases.

8. Mussolino, C, Morbitzer, R., Lutge, F., Dannemann, N., Lahaye, T. and Cathomen, T. (2011) A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity. Nucleic acids research, 39, 9283-93.

9. Ding, Q., Lee, Y., Schaefer, E.A.K., Peters, D.T., Veres, A., Kim, K., Kuperwasser, N., Motola, D.L., Meissner, T.B., Hendriks, W.T., et al. (2013) Resource A TALEN Genome-Editing System for Generating Human Stem Cell-Based Disease Models.

10. Hockemeyer, D., Wang, H., Kiani, S., Lai, C.S., Gao, Q., Cassady, J.P., Cost, G. J., Zhang, L., Santiago, Y., Miller, J.C, et al. (2011) Genetic engineering of human pluripotent cells using TALE nucleases. Nature biotechnology, 29, 731-4.

11. Bedell, V.M., Wang, Y., Campbell, J.M., Poshusta, T.L., Starker, C.G., Krag Ii, R.G., Tan, W., Penheiter, S.G., Ma, A.C, Leung, A.Y. H., et al. (2012) In vivo genome editing using a high-efficiency TALEN system. Nature, 490, 114-118.

12. Miller, J.C, Tan, S., Qiao, G., Barlow, K. a, Wang, J., Xia, D.F., Meng, X., Paschon, D.E., Leung, E., Hinkley, S.J., et al. (2011) A TALE nuclease architecture for efficient genome editing. Nature biotechnology, 29, 143-8.

13. Holkers, M., Maggio, L, Liu, J., Janssen, J.M., Miselli, F., Mussolino, C, Recchia, A., Cathomen, T. and Goncalves, M. a F. V (2012) Differential integrity of TALE nuclease genes following adenoviral and lentiviral vector gene transfer into human cells. Nucleic acids research, 10. 1093/nar/gksl446.

14. Reyon, D., Tsai, S. Q., Khayter, C, Foden, J. a, Sander, J.D. and Joung, J.K. (2012) FLASH assembly of TALENs for high-throughput genome editing. Nature Biotechnology, 30, 460-465.

15. Qiu, P., Shandilya, H., D'Alessio, J.M., 0'Connor, K., Durocher, J. and Gerard, G. F. (2004) Mutation detection using Surveyor nuclease. BioTechniques, 36, 702-7.

16. Mali, P., Yang, L., Esvelt, K.M., Aach, J., Guell, M., DiCarlo, J.E., Norville, J.E. and Church, G.M. (2013) RNA-guided human genome engineering via Cas9. Science (New York, N.Y.), 339, 823-6.

17. Ding, Q., Regan, S. N., Xia, Y., Oostrom, L.A., Cowan, C.A. and Musunura, K. (2013) Enhanced Efficiency of Human Pluripotent Stem Cell Genome Editing through Replacing TALENs with CRISPRs. Cell Stem Cell, 12, 393-394.

18. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L. a, et al. (2013) Multiplex genome engineering using CRISPR/Cas systems. Science (New York, N. Y.), 339, 819-23.

19. Cho, S.W., Kim, S., Kim, J. M. and Kim, J. -S. (2013) Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nature biotechnology, 31, 230-232.

20. Hwang, W.Y., Fu, Y., Reyon, D., Maeder, M.L., Tsai, S.Q., Sander, J.D., Peterson, R.T., Yeh, J. -RJ. and Joung, J. K. (2013) Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology, 31, 227-229.

21. Chen, F., Praett-Miller, S.M., Huang, Y., Gjoka, M., Duda, K., Taunton, J., Collingwood, T.N., Frodin, M. and Davis, G.D. (2011) High-frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases. Nature methods, 8, 753-5.

22. Soldner, F., Laganiere, J., Cheng, A.W., Hockemeyer, D., Gao, Q., Alagappan, R., Khurana, V., Golbe, L.L, Myers, R.H., Lindquist, S., et al. (2011) Generation of isogenic pluripotent stem cells differing exclusively at two early onset Parkinson point mutations. Cell, 146, 318-31.

23. Valamehr, B., Abujarour, R., Robinson, M., Le, T., Robbins, D., Shoemaker, D. and Flynn, P. (2012) A novel platform to enable the high-throughput derivation and characterization of feeder-free human iPSCs. Scientific reports, 2, 213.

24. Sanjana, N.E., Cong, L., Zhou, Y., Cunniff, M. M., Feng, G. and Zhang, F. (2012) A transcription activator-like effector toolbox for genome engineering. Nature protocols, 7, 171-92.

25. Gibson, D.G., Young, L., Chuang, R., Venter, J.C., Iii, C. A. H., Smith, H. O. and America, N. (2009) Enzymatic assembly of DNA molecules up to several hundred kilobases. 6, 12-16.

26. Zou, J., Maeder, M.L., Mali, P., Praett-Miller, S.M., Thibodeau-Beganny, S., Chou, B. -K., Chen, G., Ye, Z., Park, I. -H., Daley, G. Q., et al. (2009) Gene targeting of a disease-related gene in human induced pluripotent stem and embryonic stem cells. Cell stem cell, 5, 97-110.

27. Perez, E.E., Wang, J., Miller, J. C, Jouvenot, Y., Kim, K. a, Liu, 0., Wang, N., Lee, G., Bartsevich, V.V, Lee, Y. -L., et al. (2008) Establishment of HIV-1 resistance in CD4+ T cells by genome editing using zinc-finger nucleases. Nature biotechnology, 26, 808-16.

28. Bhakta, M.S., Henry, I.М., OusteroutD. G., Das, K.T., Lockwood, S.H., Meckler, J.F., Wallen, M.C, Zykovich, A., Yu, Y., Leo, H., et al. (2013) Highly active zinc-finger nucleases by extended modular assembly. Genome research, 10. 1101/gr. 143693. 112.

29. Kim, E., Kim, S., Kim, D.H., Choi, B.-S., Choi, I.-Y. andKim, J.-S. (2012) Precision genome engineering with programmable DNA-nicking enzymes. Genome research, 22, 1327-33.

30. Gupta, A., Meng, X., Zhu, L.J., Lawson, N. D. and Wolfe, S. a (2011) Zinc finger protein-dependent and -independent contributions to the in vivo off-target activity of zinc finger nucleases. Nucleic acids research, 39, 381-92.

31. Park, I.-H., Lerou, P.H., Zhao, R., Huo, H. and Daley, G.Q. (2008) Generation of human-induced pluripotent stem cells. Природа протоколов, 3, 1180-6.

32. Cermak, T., Doyle, E.L., Christian, M., Wang, L., Zhang, Y., Schmidt, C, Baller, J.A., Somia, N.V, Bogdanove, A.J. and Voytas, D.F. (2011) Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting. Nucleic acids research, 39, e82.

33. Briggs, A.W., Rios, X., Chari, R., Yang, L., Zhang, F., Mali, P. and Church, G.M. (2012) Iterative capped assembly: rapid and scalable synthesis of repeat-module DNA such as TAL effectors from individual monomers. Nucleic acids research, 10. 1093/nar/gks624.

34. Zhang, F., Cong, L., Lodato, S., Kosuri, S., Church, G.M. and Arlotta, P. (2011) LETTErs Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription. 29, 149-154.

35. Pathak, V.K. and Temin, H.M. (1990) Broad spectrum of in vivo forward mutations, hypermutations, and mutational hotspots in a retroviral shuttle vector after a single replication cycle: substitutions, frameshifts, and hypermutations. Proceedings of the National Academy of Sciences of the United States of America, 87, 6019-23.

36. Tian, J., Ma, K. and Saaem, I. (2009) Advancing high-throughput gene synthesis technology. Molecular bioSystems, 5, 714-22.

37. Zou, J., Mali, P., Huang, X., Dowey, S. N. and Cheng, L. (2011) Site-specific gene correction of a point mutation in human iPS cells derived from an adult patient with sickle cell disease. Blood, 118, 4599-608.

38. Mali, P., Yang, L., Esvelt, K.M., Aach, J., Guell, M., Dicarlo, J. E., Norville, J. E. and Church, G. M. (2013) RNA-Guided Human Genome.

39. Boyle, A.P., Davis, S., Shulha, H.P., Meltzer, P., Margulies, E.H., Weng, Z., Furey, T.S. and Crawford, G.E. (2008) High-resolution mapping and characterization of open chromatin across the genome. Cell, 132, 311-22.

40. Orlando, S.J., Santiago, Y., DeKelver, R.C, Freyvert, Y., Boydston, E. a, Moehle, E. a, Choi, V.M., Gopalan, S.M., Lou, J.F., Li, J., et al. (2010) Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic acids research, 38, el52.

41. Wang, Z., Zhou, Z.-J., Liu, D.-P. and Huang, J.-D. (2008) Double-stranded break can be repaired by single-stranded oligonucleotides via the ATM/ATR pathway in mammalian cells. Oligonucleotides, 18, 21-32.

42. Rios, X., Briggs, A.W., Christodoulou, D., Gorham, J.M., Seidman, J. G. and Church, G. M. (2012) Stable gene targeting in human cells using single-strand oligonucleotides with modified bases. PloS one, 7, e36697.

43. Elliott, B., Richardson, C, Winderbaum, J., Jac, A., Jasin, M. and Nickoloff, J.A. C.A. (1998) Gene Conversion Tracts from Double-Strand Break Repair in Mammalian Cells Gene Conversion Tracts from Double-Strand Break Repair in Mammalian Cells. 18.

44. Lombardo, A., Genovese, P., Beausejour, C.M., Colleoni, S., Lee, Y.-L., Kim, K. a, Ando, D., Urnov, F.D., Galli, C, Gregory, P.D., et al. (2007) Gene editing in human stem cells using zinc finger nucleases and integrase-defective lentiviral vector delivery. Nature biotechnology, 25, 1298-306.

45. Jinek, M., Chylinski, K., Fonfara, I, Hauer, M., Doudna, J. a and Charpentier, E. (2012) A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science (New York, N. Y.), 337, 816-21.

46. Shrivastav, M., De Haro, L.P. and NickoloffJ. a (2008) Regulation of DNA double-strand break repair pathway choice. Cell research, 18, 134-47.

47. Kim, Y.G., Cha, J. and Chandrasegaran, S. (1996) Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain. Proceedings of the National Academy of Sciences of the United States of America, 93, 1156-60.

48. Mimitou, E.P. and Symington, L.S. (2008) Sae2, Exol and Sgsl collaborate in DNA double-strand break processing. Nature, 455, 7701.

49. Doyon, Y., Choi, V.M., Xia, D.F., Vo, T.D., Gregory, P.D. and Holmes, M.C. (2010) Transient cold shock enhances zinc-finger nuclease-mediated gene disruption. Nature methods, 7, 459-60.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Church, George

Yang, Luhan

Cargol, Marc

Yang, Joyce

<120> Genome Engineering

<130> 010498.00517

<140> PCT/US14/048140

<141> 2014-06-30

<150> US 61/858,866

<151> 2013-07-26

<160> 224

<170> PatentIn version 3.5

<210> 1

<211> 15

<212> DNA

<213> Artificial

<220>

<223> Oligonucleotide sequence

<400> 1

tggggcaagc ttctg 15

<210> 2

<211> 102

<212> DNA

<213> Artificial

<220>

<223> TALE template

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 2

ctaaccccag agcaggtcgt ggcaatcgcc tccnnnnnng gcggaaaaca ggcattggaa 60

acagtacagc ggctgctgcc ggtgctgtgc caagcgcacg ga 102

<210> 3

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 3

ctaacccctg aacaggtagt cgctatagct tcannnnnng ggggcaagca agcacttgag 60

accgttcaac gactcctgcc agtgctctgc caagcccatg ga 102

<210> 4

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 4

ttgactccgg agcaagtcgt cgcgatcgcg agcnnnnnng gggggaagca ggcgctggaa 60

actgttcaga gactgctgcc tgtactttgt caggcgcatg gt 102

<210> 5

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 5

ctcacccccg aacaggttgt cgcaatagca agtnnnnnng gcggtaagca agccctagag 60

actgtgcaac gcctgctccc cgtgctgtgt caggctcacg gt 102

<210> 6

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 6

ctgacacctg aacaagttgt cgcgatagcc agtnnnnnng ggggaaaaca agctctagaa 60

acggttcaaa ggttgttgcc cgttctgtgc caagcacatg gg 102

<210> 7

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 7

ttaacacccg aacaagtagt agcgatagcg tcannnnnng ggggtaaaca ggctttggag 60

acggtacagc ggttattgcc ggtcctctgc caggcccacg ga 102

<210> 8

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 8

cttacgccag aacaggtggt tgcaattgcc tccnnnnnng gcgggaaaca agcgttggaa 60

actgtgcaga gactccttcc tgttttgtgt caagcccacg gc 102

<210> 9

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 9

ttgacgcctg agcaggttgt ggccatcgct agcnnnnnng gagggaagca ggctcttgaa 60

accgtacagc gacttctccc agttttgtgc caagctcacg gg 102

<210> 10

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 10

ctaacccccg agcaagtagt tgccatagca agcnnnnnng gaggaaaaca ggcattagaa 60

acagttcagc gcttgctccc ggtactctgt caggcacacg gt 102

<210> 11

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 11

ctaactccgg aacaggtcgt agccattgct tccnnnnnng gcggcaaaca ggcgctagag 60

acagtccaga ggctcttgcc tgtgttatgc caggcacatg gc 102

<210> 12

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 12

ctcaccccgg agcaggtcgt tgccatcgcc agtnnnnnng gcggaaagca agctctcgaa 60

acagtacaac ggctgttgcc agtcctatgt caagctcatg ga 102

<210> 13

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 13

ctgacgcccg agcaggtagt ggcaatcgca tctnnnnnng gaggtaaaca agcactcgag 60

actgtccaaa gattgttacc cgtactatgc caagcgcatg gt 102

<210> 14

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 14

ttaaccccag agcaagttgt ggctattgca tctnnnnnng gtggcaaaca agccttggag 60

acagtgcaac gattactgcc tgtcttatgt caggcccatg gc 102

<210> 15

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 15

cttactcctg agcaagtcgt agctatcgcc agcnnnnnng gtgggaaaca ggccctggaa 60

accgtacaac gtctcctccc agtactttgt caagcacacg gg 102

<210> 16

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 16

ttgacaccgg aacaagtggt ggcgattgcg tccnnnnnng gaggcaagca ggcactggag 60

accgtccaac ggcttcttcc ggttctttgc caggctcatg gg 102

<210> 17

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 17

ctcacgccag agcaggtggt agcaatagcg tcgnnnnnng gtggtaagca agcgcttgaa 60

acggtccagc gtcttctgcc ggtgttgtgc caggcgcacg ga 102

<210> 18

<211> 102

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 18

ctcacaccag aacaagtggt tgctattgct agtnnnnnng gtggaaagca ggccctcgag 60

acggtgcaga ggttacttcc cgtcctctgt caagcgcacg gc 102

<210> 19

<211> 60

<212> DNA

<213> Artificial

<220>

<223> PCR primer

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 19

ctcactccag agcaagtggt tgcgatcgct tcannnnnng gtggaagacc tgccctggaa 60

<210> 20

<211> 5714

<212> DNA

<213> Artificial

<220>

<223> Oligonucleotide sequence encoding TALEN backbone

<400> 20

atgtcgcgga cccggctccc ttccccaccc gcacccagcc cagcgttttc ggccgactcg 60

ttctcagacc tgcttaggca gttcgacccc tcactgttta acacatcgtt gttcgactcc 120

cttcctccgt ttggggcgca ccatacggag gcggccaccg gggagtggga tgaggtgcag 180

tcgggattga gagctgcgga tgcaccaccc ccaaccatgc gggtggccgt caccgctgcc 240

cgaccgccga gggcgaagcc cgcaccaagg cggagggcag cgcaaccgtc cgacgcaagc 300

cccgcagcgc aagtagattt gagaactttg ggatattcac agcagcagca ggaaaagatc 360

aagcccaaag tgaggtcgac agtcgcgcag catcacgaag cgctggtggg tcatgggttt 420

acacatgccc acatcgtagc cttgtcgcag caccctgcag cccttggcac ggtcgccgtc 480

aagtaccagg acatgattgc ggcgttgccg gaagccacac atgaggcgat cgtcggtgtg 540

gggaaacagt ggagcggagc ccgagcgctt gaggccctgt tgacggtcgc gggagagctg 600

agagggcctc cccttcagct ggacacgggc cagttgctga agatcgcgaa gcggggagga 660

gtcacggcgg tcgaggcggt gcacgcgtgg cgcaatgcgc tcacgggagc acccctcaac 720

agttcacgct gacagagacc gcggccgcat taggcacccc aggctttaca ctttatgctt 780

ccggctcgta taatgtgtgg attttgagtt aggatccgtc gagattttca ggagctaagg 840

aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 900

gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 960

agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg 1020

cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga 1080

aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc 1140

aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac 1200

acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt 1260

ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt 1320

taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata 1380

cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg 1440

gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg 1500

gggcgtaaag atctggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg 1560

ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag 1620

gtatgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa 1680

ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt 1740

cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg 1800

tttattgaaa tgaacggctc ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa 1860

ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat 1920

tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga 1980

taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat 2040

gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag 2100

ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc 2160

aggctccctt atacacagcc agtctgcagg tcgacggtct cgctcttcga aggttacttc 2220

ccgtcctctg tcaagcgcac ggcctcactc cagagcaagt ggttgcgatc gcttcaaaca 2280

acggtggaag acctgccctg gaatcaatcg tggcccagct ttcgaggccg gaccccgcgc 2340

tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga cgacccgcct 2400

tggatgcggt gaagaagggg ctcccgcacg cgcctgcatt gattaagcgg accaacagaa 2460

ggattcccga gaggacatca catcgagtgg caggttccca actcgtgaag agtgaacttg 2520

aggagaaaaa gtcggagctg cggcacaaat tgaaatacgt accgcatgaa tacatcgaac 2580

ttatcgaaat tgctaggaac tcgactcaag acagaatcct tgagatgaag gtaatggagt 2640

tctttatgaa ggtttatgga taccgaggga agcatctcgg tggatcacga aaacccgacg 2700

gagcaatcta tacggtgggg agcccgattg attacggagt gatcgtcgac acgaaagcct 2760

acagcggtgg gtacaatctt cccatcgggc aggcagatga gatgcaacgt tatgtcgaag 2820

aaaatcagac caggaacaaa cacatcaatc caaatgagtg gtggaaagtg tatccttcat 2880

cagtgaccga gtttaagttt ttgtttgtct ctgggcattt caaaggcaac tataaggccc 2940

agctcacacg gttgaatcac attacgaact gcaatggtgc ggttttgtcc gtagaggaac 3000

tgctcattgg tggagaaatg atcaaagcgg gaactctgac actggaagaa gtcagacgca 3060

agtttaacaa tggcgagatc aatttccgca agctaaaatg gagaaaaaaa tcactggata 3120

taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt 3180

tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt taaagaccgt 3240

aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc gcctgatgaa 3300

tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat gggatagtgt 3360

tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc tctggagtga 3420

ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg cgtgttacgg 3480

tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg tctcagccaa 3540

tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca acttcttcgc 3600

ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga tgccgctggc 3660

gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt 3720

acaacagtac tgcgatgagt ggcagggcgg ggcgtaaaga tctggatccg gcttactaaa 3780

agccagataa cagtatgcgt atttgcgcgc tgatttttgc ggtataagaa tatatactga 3840

tatgtatacc cgaagtatgt caaaaagagg tatgctatga agcagcgtat tacagtgaca 3900

gttgacagcg acagctatca gttgctcaag gcatatatga tgtcaatatc tccggtctgg 3960

taagcacaac catgcagaat gaagcccgtc gtctgcgtgc cgaacgctgg aaagcggaaa 4020

atcaggaagg gatggctgag gtcgcccggt ttattgaaat gaacggctct tttgctgacg 4080

agaacagggg ctggtgaaat gcagtttaag gtttacacct ataaaagaga gagccgttat 4140

cgtctgtttg tggatgtaca gagtgatatt attgacacgc ccgggcgacg gatggtgatc 4200

cccctggcca gtgcacgtct gctgtcagat aaagtctccc gtgaacttta cccggtggtg 4260

catatcgggg atgaaagctg gcgcatgatg accaccgata tggccagtgt gccggtctcc 4320

gttatcgggg aagaagtggc tgatctcagc caccgcgaaa atgacatcaa aaacgccatt 4380

aacctgatgt tctggggaat ataaatgtca ggctccctta tacacagcca gtctgcaggt 4440

cgacggtctc gctcttcgaa ggttacttcc cgtcctctgt caagcgcacg gcctcactcc 4500

agagcaagtg gttgcgatcg cttcaaacaa cggtggaaga cctgccctgg aatcaatcgt 4560

ggcccagctt tcgaggccgg accccgcgct ggccgcactc actaatgatc atcttgtagc 4620

gctggcctgc ctcggcggac gacccgcctt ggatgcggtg aagaaggggc tcccgcacgc 4680

gcctgcattg attaagcgga ccaacagaag gattcccgag aggacatagc cccaagaaga 4740

agagaaaggt ggaggccagc ggttccggac gggctgacgc attggacgat tttgatctgg 4800

atatgctggg aagtgacgcc ctcgatgatt ttgaccttga catgcttggt tcggatgccc 4860

ttgatgactt tgacctcgac atgctcggca gtgacgccct tgatgatttc gacctggaca 4920

tgctgattaa ctctagaggc agtggagagg gcagaggaag tctgctaaca tgcggtgacg 4980

tcgaggagaa tcctggccca gtgagcaagg gcgaggagct gttcaccggg gtggtgccca 5040

tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg 5100

agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc 5160

ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct 5220

accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc 5280

aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt 5340

tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg 5400

gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg 5460

ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg 5520

gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc 5580

tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga 5640

agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg 5700

acgagctgta caag 5714

<210> 21

<211> 3465

<212> DNA

<213> Artificial

<220>

<223> Oligonucleotide sequence encoding TALE backbone sequence

<400> 21