Экспрессирующие cas мышиные эмбриональные стволовые клетки и мыши и их применения



C12N15/907 - Получение мутаций или генная инженерия; ДНК или РНК, связанные с генной инженерией, векторы, например плазмиды или их выделение, получение или очистка; использование их хозяев (мутанты или микроорганизмы, полученные генной инженерией C12N 1/00,C12N 5/00,C12N 7/00; новые виды растений A01H; разведение растений из тканевых культур A01H 4/00; новые виды животных A01K 67/00; использование лекарственных препаратов, содержащих генетический материал, который включен в клетки живого организма, для лечения генетических заболеваний, для генной терапии A61K 48/00 пептиды вообще C07K)

Владельцы патента RU 2782358:

РЕГЕНЕРОН ФАРМАСЬЮТИКАЛЗ, ИНК. (US)

Изобретение относится к области биотехнологии, в частности к мыши, содержащей экспрессионную кассету Cas9, геномно интегрированную в локус Rosa26, причем экспрессионная кассета Cas9 содержит кодирующую последовательность для белка Cas9, к клетке указанной мыши, а также к способу ее получения. Изобретение эффективно для испытания способности CRISPR/Cas9-нуклеазы, содержащей белок Cas9 и гидовую РНК, модифицировать целевой геномный локус in vivo, а также для оптимизации способности CRISPR/Cas9-нуклеазы модифицировать целевой геномный локус in vivo. 6 н. и 61 з.п. ф-лы, 27 ил., 12 табл., 2 пр.

 

Ссылка на родственные заявки

[0001] Согласно настоящей заявке испрашивается приоритет в соответствии с заявкой на выдачу патента США №62/539275, поданной 31 июля 2017 г., которая полностью включена в настоящий документ посредством ссылки для всех целей.

Ссылка на перечень последовательностей, представленный в виде текстового файла посредством файловой системы EFS

[0002] Перечень последовательностей, представленный в файле 516569SEQLIST.txt, характеризуется размером, составляющим 178 КБ, был создан 30 июля 2018 г. и включен в настоящий документ посредством ссылки.

Предшествующий уровень техники настоящего изобретения

[0003] Технология CRISPR/Cas является новым многообещающим терапевтическим средством. Однако существует необходимость в более эффективных средствах оценки эффективности создания мутаций или целевой модификации генов введенным агентом CRISPR/Cas in vivo. Одним из ограничений испытания системы in vivo является необходимость одновременного введения всех компонентов в живой организм. Типичный способ внедрения этих компонентов заключается во транзиентной трансфекции ДНК-конструктов в клетки, которые будут генерировать соответствующие РНК и белок. Несмотря на то, что этот подход является эффективным, ему присущим недостаток, поскольку клетки должны полагаться на конструкты плазмидной ДНК, чтобы сначала подвергнуться транскрипции, а затем трансляции, прежде чем белок Cas9 станет доступным для взаимодействия с компонентом sgPHК. Необходимы лучшие способы и инструменты для более эффективной оценки активности введенных агентов CRISPR/Cas и для оценки различных способов и параметров доставки для нацеливания на конкретные ткани или типы клеток in vivo.

[0004] Кроме того, доставке биологически активных агентов, таких как агенты CRISPR/Cas, субъектам часто препятствуют трудности в достижении компонентами целевой клетки или ткани. Эти ограничения могут приводить, например, к необходимости использовать гораздо более высокие концентрации агентов, чем это желательно для достижения результата, что увеличивает риск токсических эффектов и побочных эффектов. Необходимы улучшенные способы доставки и способы оценки таких способов доставки in vivo.

Краткое раскрытие настоящего изобретения

[0005] Предусмотрены Cas9-ready, далее по тексту - экспрессирующие Cas9 (т.е. готовые к использованию системы редактирования генома на основе Cas) не являющиеся человеком животные, а также предусмотрены способы и композиции для оценки способности агентов CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo. Согласно одному аспекту предусмотрены способы испытания способности CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo. Некоторые такие способы предусматривают следующее: (а) введение не являющемуся человеком животному гидовой РНК, предназначенной для нацеливания на целевую последовательность для гидовой РНК в целевом геномном локусе, причем не являющееся человеком животное содержит геномно интегрированную экспрессионную кассету Cas, содержащую кодирующую NLS-Cas последовательность, и причем гидовая РНК введена посредством опосредованной аденоассоциированным вирусом (AAV) доставки; и (b) оценка модификации целевого геномного локуса. Некоторые такие способы предусматривают следующее: (а) введение не являющемуся человеком животному гидовой РНК, предназначенной для нацеливания на целевую последовательность для гидовой РНК в целевом геномном локусе, причем не являющееся человеком животное содержит геномно интегрированную экспрессионную кассету Cas, содержащую кодирующую NLS-Cas последовательность, и причем гидовая РНК введена посредством опосредованной липидными наночастицами (LNP) доставки; и (b) оценка модификации целевого геномного локуса.

[0006] Согласно некоторым таким способам AAV представляет собой AAV7, AAV8 или AAV9, и стадия (b) предусматривает оценку модификации целевого геномного локуса в печени. Необязательно AAV представляет собой AAV8.

[0007] Согласно некоторым таким способам путь введения AAV не являющемуся человеком животному представляет собой внутривенную инъекцию, интрапаренхиматозную инъекцию, интраперитонеальную инъекцию, закапывание в нос или интравитреальную инъекцию.

[0008] Согласно некоторым таким способам экзогенную донорную нуклеиновую кислоту вводят на стадии (а), причем экзогенная донорная нуклеиновая кислота предназначена для рекомбинации с целевым геномным локусом. Необязательно экзогенная донорная нуклеиновая кислота представляет собой одноцепочечный олигодезоксинуклеотид (ssODN).

[0009] Согласно некоторым таким способам не являющееся человеком животное представляет собой крысу или мышь. Необязательно не являющееся человеком животное представляет собой мышь.

[0010] Согласно некоторым таким способам целевой геномный локус содержит целевой ген, и стадия (b) предусматривает измерение экспрессии целевого гена или активности белка, кодируемого целевым геном.

[0011] Согласно некоторым таким способам стадия (b) предусматривает секвенирование целевого геномного локуса в одной или нескольких клетках, выделенных из не являющегося человеком животного.

[0012] Согласно некоторым таким способам стадия (b) предусматривает выделение целевого органа или ткани из не являющегося человеком животного и оценку модификации целевого геномного локуса в целевом органе или ткани. Необязательно стадия (b) предусматривает оценку модификации целевого геномного локуса в двух или больше различных типах клеток в пределах целевого органа или ткани.

[0013] Согласно некоторым таким способам стадия (b) предусматривает выделение нецелевого органа или ткани из не являющегося человеком животного и оценку модификации целевого геномного локуса в нецелевом органе или ткани.

[0014] Согласно некоторым таким способам кодирующая NLS-Cas последовательность представляет собой кодирующую NLS-Cas9 последовательность.

[0015] Согласно некоторым таким способам экспрессионная кассета Cas дополнительно содержит сигнал полиаденилирования, расположенный выше кодирующей NLS-Cas последовательности, причем сигнал полиаденилирования фланкирован сайтами распознавания рекомбиназы, и причем сигнал полиаденилирования в экспрессионной кассете Cas был вырезан тканеспецифическим образом. Необязательно сигнал полиаденилирования, расположенный выше NLS-кодирующей последовательности в экспрессионной кассете Cas, был вырезан в печени. Необязательно рекомбиназа, которая распознает сайты распознавания рекомбиназы в экспрессионной кассете Cas, представляет собой Cre-рекомбиназу. Необязательно не являющееся человеком животное дополнительно содержит геномно интегрированную экспрессионную кассету рекомбиназы Cre, причем экспрессионная кассета рекомбиназы Cre содержит кодирующую Cre-рекомбиназу последовательность, функционально связанную с тканеспецифическим промотором. Необязательно ген Cre-рекомбиназы функционально связан с одним из промоторов, представленных в таблице 2.

[0016] Согласно некоторым таким способам экспрессионная кассета Cas дополнительно содержит сигнал полиаденилирования, расположенный выше кодирующей NLS-Cas последовательности, причем сигнал полиаденилирования фланкирован сайтами распознавания рекомбиназы, и причем способ дополнительно предусматривает введение рекомбиназы не являющемуся человеком животному тканеспецифическим образом. Необязательно рекомбиназу вводят посредством опосредованной аденоассоциированным вирусом (AAV) доставки или опосредованной липидными наночастицами (LNP) доставки. Необязательно рекомбиназу вводят посредством ААУ8-опосредованной доставки. Необязательно рекомбиназу вводят в печень.

[0017] Согласно некоторым таким способам экспрессионная кассета Cas дополнительно содержит кодирующую флуоресцентный белок последовательность. Необязательно экспрессионная кассета Cas содержит мультицистронную нуклеиновую кислоту, содержащую кодирующую NLS-Cas последовательность и кодирующую флуоресцентный белок последовательность, разделенные промежуточным участком внутренней посадки рибосомы (IRES) или промежуточной кодирующей пептид 2А последовательностью. Необязательно мультицистронная нуклеиновая кислота в экспрессионной кассете Cas содержит кодирующую NLS-Cas последовательность и кодирующую зеленый флуоресцентный белок последовательность, разделенные промежуточной кодирующей пептид Р2А последовательностью. Согласно некоторым таким способам экспрессионная кассета Cas дополнительно не содержит кодирующую флуоресцентный белок последовательность. Согласно некоторым таким способам кодирующая NLS-Cas последовательность кодирует белок Cas, содержащий метку белка.

[0018] Согласно некоторым таким способам экспрессионная кассета Cas функционально связана с эндогенным промотором. Согласно некоторым таким способам экспрессионная кассета Cas функционально связана с экзогенным, конститутивным промотором.

[0019] Согласно некоторым таким способам 5' конец экспрессионной кассеты Cas дополнительно содержит 3' последовательность сплайсинга.

[0020] Согласно некоторым таким способам экспрессионная кассета Cas кодирует белок, содержащий последовательность, представленную в SEQ ID NO: 13, 16, 19 или 22. Необязательно экспрессионная кассета Cas содержит последовательность, представленную в SEQ ID NO: 28, 29, 30 или 31. Необязательно экспрессионная кассета Cas содержит последовательность, представленную в SEQ ID NO: 1, 12, 14, 15, 17, 18, 20 или 21.

[0021] Согласно некоторым таким способам экспрессионная кассета Cas интегрирована в локус «безопасная гавань». Необязательно локус «безопасная гавань» представляет собой локус Rosa26. Необязательно экспрессионная кассета Cas интегрирована в первый интрон локуса Rosa26.

[0022] Согласно некоторым таким способам не являющееся человеком животное является гетерозиготным по отношению к экспрессионной кассете Cas. Согласно некоторым таким способам не являющееся человеком животное является гомозиготным по отношению к экспрессионной кассете Cas.

[0023] Согласно некоторым таким способам не являющееся человеком животное представляет собой мышь, AAV представляет собой AAV8, экспрессионная кассета Cas функционально связана с эндогенным промотором Rosa26, вставлена в первый интрон локуса Rosa26 и содержит от 5' к 3' следующее: (i) 3' последовательность сплайсинга; и (ii) кодирующая NLS-Cas9 последовательность, и стадия (b) предусматривает оценку модификации целевого геномного локуса в печени не являющегося человеком животного. Согласно некоторым таким способам не являющееся человеком животное представляет собой мышь, AAV представляет собой AAV8, доставленный не являющемуся человеком животному с помощью внутривенной инъекции, экспрессионная кассета Cas функционально связана с эндогенным промотором Rosa26, вставлена в первый интрон локуса Rosa26 и содержит от 5' к 3' следующее: (i) 3' последовательность сплайсинга; и (ii) кодирующая NLS-Cas9 последовательность, и стадия (b) предусматривает оценку модификации целевого геномного локуса в печени не являющегося человеком животного.

[0024] Согласно одному аспекту предусмотрены способы оптимизации способности CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo. Некоторые такие способы предусматривают следующее: (I) проведение любого из приведенных выше способов испытания способности CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo в первый раз у первого не являющегося человеком животного; (II) изменение переменной и проведение способа согласно стадии (I) во второй раз с измененной переменной у второго не являющегося человеком животного; и (III) сравнение модификации целевого геномного локуса на стадии (I) с модификацией целевого геномного локуса на стадии (II), и выбор способа, приводящего к модификации целевого геномного локуса, характеризующейся одним или несколькими из следующего: повышенная эффективность, повышенная точность, повышенная согласованность, или повышенная специфичность.

[0025] Согласно некоторым таким способам измененная переменная на стадии (II) представляет собой серотип AAV. Согласно некоторым таким способам измененная переменная на стадии (II) представляет собой путь введения для введения гидовой РНК не являющемуся человеком животному. Согласно некоторым таким способам измененная переменная на стадии (II) представляет собой концентрацию или количество гидовой РНК, введенной не являющемуся человеком животному. Согласно некоторым таким способам измененная переменная на стадии (II) представляет собой гидовую РНК (например, форму или последовательность гидовой РНК), введенную не являющемуся человеком животному. Согласно некоторым таким способам способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и причем измененная переменная на стадии (II) представляет собой способ доставки для введения экзогенной донорной нуклеиновой кислоты не являющемуся человеком животному. Согласно некоторым таким способам способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная на стадии (II) представляет собой путь введения для введения экзогенной донорной нуклеиновой кислоты не являющемуся человеком животному. Согласно некоторым таким способам способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная на стадии (II) представляет собой концентрацию или количество экзогенной донорной нуклеиновой кислоты, введенной не являющемуся человеком животному. Согласно некоторым таким способам способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная на стадии (II) представляет собой концентрацию или количество гидовой РНК, введенной не являющемуся человеком животному, по отношению к концентрации или количеству экзогенной донорной нуклеиновой кислоты, введенной не являющемуся человеком животному. Согласно некоторым таким способам измененная переменная на стадии (II) представляет собой экзогенную донорную нуклеиновую кислоту (например, форму экзогенной донорной нуклеиновой кислоты), введенную не являющемуся человеком животному.

Краткое описание фигур

[0026] На фигуре 1 показан аллель Cas9 (MAID2599; без соблюдения масштаба), содержащий от 5' к 3' следующее: 3' последовательность сплайсинга; первый сайт loxP, ген устойчивости к неомицину; сигнал полиаденилирования; второй сайт loxP; кодирующая NLS-Cas9 последовательность; кодирующая пептид Р2А последовательность; и кодирующая GFP последовательность.

[0027] На фигуре 2А показана активность NHEJ в мышиных эмбриональных стволовых клетках F1H4 дикого типа (mESC) и экспрессирующих Cas9 mESC с и без неомициновой кассеты lox-stop-lox (MAID2599 и MAID2600, соответственно) после введения двух sgPHК (в форме плазмиды или в виде РНК), нацеленных на области старт- и стоп-кодона первого целевого гена, необязательно в сочетании с введением плазмиды Cas9. Эффективность 5' разрезания измеряли в левой панели, эффективность 3' разрезания измеряли в средней панели, частоту, с которой промежуточная ДНК подвергалась полной делеции, измеряли в правой панели.

[0028] На фигуре 2В показана эффективность разрезания (левая панель) и эффективность HDR (правая панель) после введения sgPHК (в форме плазмиды или в виде РНК), нацеленной на второй целевой ген вместе с одноцепочечным олигодезоксинуклеотидом (ssODN) в качестве донора точечной мутации, необязательно в комбинации с плазмидой Cas9.

[0029] На фигурах 3A-3F показаны светлопольные изображения тканей печени (фигура 3А), почки (фигура 3В) и головного мозга (фигура 3С) от мышей дикого типа и гетерозиготных экспрессирующих Cas9 мышей (MAID2600), и полученные с помощью GFP флуоресцентные изображения тканей печени (фигура 3D), почки (фигура 3Е) и головного мозга (фигура 3F) у мышей дикого типа и экспрессирующих Cas9 мышей (MAID2600).

[0030] На фигуре 4А показаны уровни экспрессии мРНК Cas9 в различных тканях, выделенных из гетерозиготных экспрессирующих Cas9 мышей (MAID2600), как определено с помощью ОТ-кПЦР. По оси у показано дельта Ct + 1 по сравнению со средним Ct Cas9 из ткани головного мозга.

[0031] На фигуре 4В показана экспрессия белка Cas9 в различных тканях, выделенных из мышей дикого типа и гетерозиготных экспрессирующих Cas9 мышей (MAID2600). Актин использовали в качестве контроля.

[0032] На фигуре 4С показаны средние уровни экспрессии мРНК Cas9 и бета-2-микроглобулина (B2m) в различных тканях, выделенных из гетерозиготных экспрессирующих Cas9 мышей (MAID2600), как определено с помощью ОТ-кПЦР. Число образцов, испытанных из каждого типа ткани, указано выше столбиков.

[0033] На фигурах 5А-5В показана активность NHEJ в процентах (частота инделей) в третьем целевом гене (целевой ген 3) в первичных гепатоцитах, выделенных из мышей дикого типа (фигура 5А) и мышей Cas9 с удаленной кассетой (MAID2600; фигура 5В) после с помощью доставки липидных наночастиц (LNP) любого из следующего: мРНК GFP и контрольная (мертвая) sgPHК, мРНК GFP и sgPHК целевого гена 3 или мРНК Cas9 и sgPHК целевого гена 3. Исследовали концентрации мРНК, составляющие 15,6, 62,5, 250 и 1000 нг/мл.

[0034] На фигурах 6A-6D показаны содержания в сыворотке белка, который секретируется печенью и обнаруживается в сыворотке и кодируется третьим целевым геном (целевой ген 3) после введения sgPHК целевого гена 3 мышам дикого типа (msCas9 -) или экспрессирующим Cas9 мышам с удаленной кассетой (msCas9+; MAID2600) посредством гидродинамической доставки ДНК (HDD), доставки с помощью липидных наночастиц (LNP) или доставки с помощью аденоассоциированного вируса (AAV) с помощью инъекции в хвостовую вену. В некоторых случаях Cas9 также вводят (в форме мРНК для LNP доставки и в форме ДНК для доставки с помощью HDD (плазмида Cas9) и AAV). Не получивших лечение мышей, контрольных мышей LNP, контрольных мышей AAV и контрольных мышей HDD использовали в качестве отрицательных контролей. Для LNP-опосредованной доставки испытывали три группы мышей: (1) экспрессирующие Cas9 мыши (3 самца + 3 самки; 2 мг/кг контрольной гидовой РНК + мРНК GFP); (2) экспрессирующие Cas9 мыши (3 самца + 3 самки; 2 мг/кг гидовой РНК для целевого гена 3 + мРНК GFP); и (3) мыши WT (3 самца + 3 самки; 2 мг/кг гидовой РНК для целевого гена 3 + мРНК Cas9). Для AAV-опосредованной доставки испытывали две группы мышей: (1) экспрессирующие Cas9 мыши (3 самца + 3 самки; AAV8-гидовая РНК для целевого гена 3); и (2) мыши WT (3 самца + 3 самки; AAV8-гидовая РНК для целевого гена 3 + AAV8-Cas9). Для HDD испытывали две группы мышей: (1) экспрессирующие Cas9 мыши (3 самца + 3 самки; гидовая РНК для целевого гена 3); и (2) мыши WT (3 самца + 3 самки; гидовая РНК для целевого гена 3 + Cas9). Содержания в сыворотке белка, кодируемого целевым геном 3, измеряли у самцов мышей (фигуры 6А и 6В) и самок мышей (фигуры 6С и 6D) и измеряли в день 7 (фигуры 6А и 6С) и день 21 (фигуры 6В и 6D).

[0035] На фигуре 7 показана активность NHEJ в процентах (частота инделей) в локусе целевого гена 3 в печени у мышей дикого типа (msCas9 -) и мышей Cas9 с удаленной кассетой (msCas9 +; MAID2600) через один месяц после доставки с помощью липидных наночастиц (LNP) sgPHК отдельно или вместе с мРНК Cas9, гидродинамической доставки (HDD) плазмиды sgPHК отдельно или вместе с плазмидой Cas9 или AAV8-sgPHК отдельно или вместе с AAV8-Cas9.

[0036] На фигуре 8А показана активность NHEJ в процентах (частота инделей) в локусе целевого гена 4 в печени у мышей Cas9 с удаленной кассетой (MAID2600) через 3-4 недели после ААУ8-доставки sgPHК с помощью инъекции в хвостовую вену. UNT = не получивший лечение контроль.

[0037] На фигуре 8В показаны относительные уровни экспрессии целевого гена 4, как определено с помощью анализа TAQMAN, в ткани печени, выделенной из мышей Cas9 с удаленной кассетой (MAID2600) через 3-4 недели после ААУ8-доставки sgPHК с помощью инъекции в хвостовую вену. Мастер-микс WT относится ко всем пяти вирусам sgPHК, смешанным вместе и введенным в виде инъекции мышам дикого типа в качестве отрицательного контроля.

[0038] На фигуре 9 показан вестерн-блоттинг экспрессии Cas9 у мышей LSL-Cas9 (MAID2599) в образцах печени, селезенки и почки, выделенных через одну неделю после того, как LNP-Cre ввели посредством инъекции в хвостовую вену. Мышей без инъекций LNP-Cre использовали в качестве отрицательного контроля. Мышей Cas9 с удаленной кассетой (MAID2600) использовали в качестве положительного контроля.

[0039] На фигуре 10 показаны содержания в сыворотке белка, который секретируется печенью и обнаруживается в сыворотке и кодируется третьим целевым геном (целевой ген 3) через 1 неделю и 3 недели после инъекции sgPHК целевого гена 3 мышам LSL-Cas9 (MAID2599) посредством AAV8, либо отдельно, либо вместе с LNP-Cre. Мышей без введения либо LNP-Cre, либо AAV8-rPHK использовали в качестве отрицательного контроля. Все условия также испытывали на мышах с удаленной кассетой (ROSA Cas9; MAID2600).

[0040] На фигуре 11 показана активность NHEJ в процентах (частота инделей) в локусе целевого гена 3 в образцах печени, выделенных через 3 недели после инъекции sgPHК целевого гена 3 мышам LSL-Cas9 (MAID2599) посредством AAV8, либо отдельно, либо вместе с LNP-Cre. Мышей без введения либо LNP-Cre, либо AAV8-rPHK использовали в качестве отрицательного контроля. Все условия также испытывали на мышах с удаленной кассетой (ROSA Cas9; MAID2600).

[0041] На фигуре 12А показан вестерн-блоттинг для Cas9 в образцах печени, выделенных из мышей LSL-Cas9 (MAID2599) и мышей LSL-Cas9/Alb-Cre. Актин использовали в качестве контроля нагрузки.

[0042] На фигуре 12В показан вестерн-блоттинг для Cas9 в образцах головного мозга, выделенных из мышей LSL-Cas9 (MAID2599) и мышей LSL-Cas9/Alb-Cre. Актин использовали в качестве контроля нагрузки.

[0043] На фигуре 13 показаны содержания в сыворотке белка, который секретируется печенью и обнаруживается в сыворотке и кодируется третьим целевым геном (целевой ген 3) через 1 неделю после инъекции sgPHК целевого гена 3 мышам WT, мышам Cas9 с удаленной кассетой (ROSA Cas9; MAID2600), мышам LSL-Cas9 (MAID2599), мышам Alb-Cre или мышам LSL-Cas9/Alb-Cre посредством AAV8.

[0044] На фигуре 14 показаны четыре различных аллеля Cas9 (без соблюдения масштаба), включая в себя аллель MAID2599 (MAID2600 после удаления кассеты lox-stop-lox (LSL)), аллель MAID2658 (MAID2659 после удаления кассеты LSL), аллель MAID2660 (MAID2661 после удаления кассеты LSL) и аллель MAID2672 (MAID2673 после удаления кассеты LSL).

Определения

[0045] Используемые взаимозаменяемо в настоящем документе термины «белок», «полипептид» и «пептид» включают в себя полимерные формы аминокислот любой длины, включая в себя кодированные и некодированные аминокислоты и химически или биохимически модифицированные или дериватизированные аминокислоты. Термины также включают в себя полимеры, которые были модифицированы, такие как полипептиды, характеризующиеся модифицированными пептидными каркасами.

[0046] Считается, что белки имеют «N-конец» и «С-конец». Термин «N-конец» относится к началу белка или полипептида, оканчивающемуся аминокислотой со свободной аминогруппой (-NH2). Термин «С-конец» относится к концу аминокислотной цепи (белка или полипептида), оканчивающейся свободной карбоксильной группой (-СООН).

[0047] Используемые взаимозаменяемо в настоящем документе термины «нуклеиновая кислота» и «полинуклеотид» включают в себя полимерные формы нуклеотидов любой длины, включая в себя рибонуклеотиды, дезоксирибонуклеотиды или их аналоги или модифицированные версии. Они включают в себя одно-, двух- и многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК и полимеры, содержащие пуриновые основания, пиримидиновые основания или другие природные, химически модифицированные, биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.

[0048] Считается, что нуклеиновые кислоты характеризуются наличием «5' концов» и «3' концов», потому что мононуклеотиды реагируют с образованием олигонуклеотидов таким образом, что 5'-фосфат одного мононуклеотидпентозного кольца прикреплен к 3' кислороду его соседа в одном направлении через фосфодиэфирную связь. Конец олигонуклеотида называют «5'-концом», если его 5'-фосфат не связан с 3'-кислородом мононуклеотидного пентозного кольца. Конец олигонуклеотида называют «3'-концом», если его 3'-кислород не связан с 5'-фосфатом другого мононуклеотидного пентозного кольца. Можно сказать, что последовательность нуклеиновой кислоты, даже если она находится внутри более крупного олигонуклеотида, характеризуются наличием 5' и 3' концов. В линейной или кольцевой молекуле ДНК дискретные элементы называются «расположенными выше по отношению к ходу транскрипции» или 5' относительно «расположенных ниже» или 3' элементов.

[0049] Термин «геномно интегрированный» относится к нуклеиновой кислоте, которая была введена в клетку так, что нуклеотидная последовательность интегрируется в геном клетки. Любой протокол можно использовать для стабильного включения нуклеиновой кислоты в геном клетки.

[0050] Термин «экспрессионный вектор» или «экспрессионный конструкт» относится к рекомбинантной нуклеиновой кислоте, содержащей требуемую кодирующую последовательность, функционально связанную с соответствующими последовательностями нуклеиновой кислоты, необходимыми для экспрессии функционально связанной кодирующей последовательности в конкретной клетке-хозяине или организме-хозяине. Последовательности нуклеиновых кислот, необходимые для экспрессии в прокариотах, как правило, включают в себя промотор, оператор (необязательно) и сайт связывания рибосомы, а также другие последовательности. Общеизвестно, что эукариотические клетки используют промоторы, энхансеры и сигналы терминации и полиаденилирования, хотя некоторые элементы могут быть удалены, а другие элементы могут быть добавлены без ущерба для необходимой экспрессии.

[0051] Термин «нацеливающий вектор» относится к рекомбинантной нуклеиновой кислоте, которую можно ввести путем гомологичной рекомбинации, лигирования, опосредованного негомологичным соединением концов или любым другим способом рекомбинации в отношении целевого положения в геноме клетки.

[0052] Термин «вирусный вектор» относится к рекомбинантной нуклеиновой кислоте, которая включает в себя по меньшей мере один элемент вирусного происхождения и включает в себя элементы, достаточные для или разрешающие упаковку в частицу вирусного вектора. Вектор и/или частицу можно использовать с целью переноса ДНК, РНК или других нуклеиновых кислот в клетки ex vivo или in vivo. Известны многочисленные формы вирусных векторов.

[0053] Термин «выделенный» в отношении белков, нуклеиновых кислот и клеток включает в себя белки, нуклеиновые кислоты и клетки, которые являются относительно очищенными по отношению к другим клеточным компонентам или компонентам организма, которые обычно могут присутствовать in situ, вплоть до и включая в себя по существу чистый препарат белка, нуклеиновой кислоты или клетки. Термин «выделенный» также включает в себя белки и нуклеиновые кислоты, которые не имеют встречающегося в природе аналога, или белки или нуклеиновые кислоты, которые были химически синтезированы и, таким образом, по существу не загрязнены другими белками или нуклеиновыми кислотами. Термин «выделенный» также включает в себя белки, нуклеиновые кислоты или клетки, которые были отделены или очищены от большинства других клеточных компонентов или компонентов организма, которые им сопутствуют в естественных условиях (например, другие клеточные белки, нуклеиновые кислоты или клеточные или внеклеточные компоненты).

[0054] Термин «дикий тип» включает в себя объекты, характеризующиеся структурой и/или активностью, обнаруживаемой в нормальном (в отличие от мутантного, болезненного, измененного и т.д.) состоянии или контексте. Гены и полипептиды дикого типа часто существуют в нескольких различных формах (например, аллели).

[0055] Термин «эндогенная последовательность» относится к последовательности нуклеиновой кислоты, которая встречается в природе внутри клетки или животного, не являющегося человеком. Например, эндогенная последовательность Rosa26 не являющегося человеком животного относится к нативной последовательности Rosa26, которая естественным образом встречается в локусе Rosa26 у не являющегося человеком животного.

[0056] «Экзогенные» молекулы или последовательности включают в себя молекулы или последовательности, которые обычно не присутствуют в клетке в этой форме. Нормальное присутствие включает в себя присутствие на конкретной стадии развития и при конкретных условиях окружающей среды клетки. Например, экзогенная молекула или последовательность может включать в себя мутантную версию соответствующей эндогенной последовательности в клетке, такую как гуманизированная версия эндогенной последовательности, или может включать в себя последовательность, соответствующую эндогенной последовательности в клетке, но в другой форма (т.е. не в пределах хромосомы). Напротив, эндогенные молекулы или последовательности включают в себя молекулы или последовательности, которые обычно присутствуют в такой форме в конкретной клетке на определенной стадии развития в определенных условиях окружающей среды.

[0057] Термин «гетерологичный» при использовании в контексте нуклеиновой кислоты или белка указывает на то, что нуклеиновая кислота или белок содержит по меньшей мере два сегмента, которые в природе не встречаются вместе в одной и той же молекуле. Например, термин «гетерологичный» при использовании в отношении сегментов нуклеиновой кислоты или сегментов белка указывает, что нуклеиновая кислота или белок содержит две или более подпоследовательности, которые не находятся в таком же отношении друг к другу (например, объединены) в природе. В качестве одного примера, «гетерологичная» область нуклеиновокислотного вектора представляет собой сегмент нуклеиновой кислоты в пределах или прикрепленный к другой молекуле нуклеиновой кислоты, которая не обнаружена в ассоциации с другой молекулой в природе. Например, гетерологичная область нуклеиновокислотного вектора может включать в себя кодирующую последовательность, фланкированную последовательностями, которые не обнаружены в природе в ассоциации с кодирующей последовательностью. Аналогично, «гетерологичная» область белка представляет собой сегмент аминокислот в пределах или прикрепленный к другой пептидной молекуле, который не обнаружен в природе в ассоциации с другой пептидной молекулой (например, слитый белок или белок с меткой). Аналогично, нуклеиновая кислота или белок могут содержать гетерологичную метку или гетерологичную последовательность секреции или гетерологичную последовательность локализации.

[0058] «Оптимизация ко донов» использует преимущества вырожденности ко донов, что проявляется в множественности комбинаций кодонов с тремя парами оснований, которые определяют аминокислоту, и, как правило, включает в себя процесс модификации последовательности нуклеиновой кислоты для усиленной экспрессии в конкретных клетках-хозяевах путем замены по меньшей мере одного кодона нативной последовательности на кодон, который чаще или чаще всего используется в генах клетки-хозяина при сохранении нативной аминокислотной последовательности. Например, нуклеиновую кислоту, кодирующую белок Cas9, можно модифицировать для замены кодонов, характеризующихся более высокой частотой использования в данной прокариотической или эукариотической клетке, включая в себя бактериальную клетку, дрожжевую клетку, клетку человека, клетку, не относящуюся к человеку, клетку млекопитающего, клетку грызуна, клетку мыши, клетку крысы, клетку хомяка или любую другую клетку-хозяина по сравнению с встречающейся в природе последовательностью нуклеиновой кислоты. Таблицы использования кодонов легко доступны, например, в «Базе данных использования кодонов». Эти таблицы можно адаптировать несколькими способами. См. Nakamura et al. (2000)Nucleic Acids Research 28:292, полностью включенный в настоящий документ посредством ссылки для всех целей. Также доступны компьютерные алгоритмы для оптимизации кодонов конкретной последовательности для экспрессии в конкретном хозяине (см., например, Gene Forge).

[0059] «Промотор» представляет собой регуляторную область ДНК, как правило, содержащую ТАТА-бокс, способный направлять РНК-полимеразу II для инициации синтеза РНК в соответствующем сайте инициации транскрипции для конкретной полинуклеотидной последовательности. Промотор может дополнительно содержать другие области, которые влияют на скорость инициации транскрипции. Раскрытые в настоящем документе промоторные последовательности модулируют транскрипцию функционально связанного полинуклеотида. Промотор может являться активным в одном или нескольких типах клеток, раскрытых в настоящем документе (например, эукариотическая клетка, клетка млекопитающего, не являющегося человеком, клетка человека, клетка грызуна, плюрипотентная клетка, эмбрион на стадии одной клетки, дифференцированная клетка или их комбинация). Промотор может являться, например, конститутивно активным промотором, условным промотором, индуцируемым промотором, ограниченным по времени промотором (например, промотором, регулируемым стадией развития) или пространственно ограниченным промотором (например, клеточноспецифическим или тканеспецифическим промотором). Примеры промоторов можно найти, например, в международной патентной публикации WO 2013/176772, полностью включенной в настоящий документ посредством ссылки для всех целей.

[0060] Конститутивный промотор представляет собой промотор, который является активным во всех тканях или конкретных тканях на всех стадиях развития. Примеры конститутивных промоторов включают в себя немедленный ранний промотор цитомегаловируса человека (hCMV), немедленный ранний промотор цитомегаловируса мыши (mCMV), промотор фактора элонгации 1 альфа человека (hEF1α), промотор фактора элонгации 1 альфа мыши (mEF1α), промотор фосфоглицераткиназы мыши (PGK), промотор гибрида бета-актина цыпленка (CAG или CBh), ранний промотор SV40 и промотор бета 2 тубулина.

[0061] Примеры индуцируемых промоторов включают в себя, например, химически регулируемые промоторы и физически регулируемые промоторы. Химически регулируемые промоторы включают в себя, например, регулируемые спиртом промоторы (например, промотор гена алкогольдегидрогеназы (a1cA)), регулируемые тетрациклином промоторы (например, чувствительный к тетрациклину промотор, последовательность оператора тетрациклина (tetO), промотор tet-On или промотор tet-Off), регулируемые стероидами промоторы (например, глюкокортикоидный рецептор крысы, промотор рецептора эстрогена или промотор рецептора экдизона) или регулируемые металлом промоторы (например, промотор металлопротеина). Физически регулируемые промоторы включают в себя, например, регулируемые температурой промоторы (например, промотор теплового шока) и регулируемые светом промоторы (например, светоиндуцируемый промотор или репрессируемый светом промотор).

[0062] Тканеспецифические промоторы могут представлять собой, например, нейрон-специфические промоторы, специфические по отношению к глии промоторы, специфические по отношению к мышечным клеткам промоторы, специфические по отношению к клеткам сердца промоторы, специфические по отношению к клеткам почек промоторы, специфические по отношению к костным клеткам промоторы, специфические по отношению к эндотелиальным клеткам промоторы или специфические по отношению к иммунным клеткам промоторы (например, промотор В-клеток или промотор Т-клеток).

[0063] Регулируемые стадией развития промоторы включают в себя, например, промоторы, активные только во время эмбриональной стадии развития или только во взрослой клетке.

[0064] Термин «функциональная связь» или «функционально связанный» включает в себя смежное положение двух или более компонентов (например, промотора и другого элемента последовательности) так, что оба компонента функционируют нормально и обеспечивают возможность того, что по меньшей мере один из компонентов может опосредовать функцию, на которую действует по крайней мере один из других компонентов. Например, промотор может быть функционально связан с кодирующей последовательностью, если промотор контролирует уровень транскрипции кодирующей последовательности в ответ на присутствие или отсутствие одного или нескольких транскрипционных регуляторных факторов. Функциональная связь может включать в себя такие последовательности, которые являются смежными друг с другом или действуют в транс-положении (например, регуляторная последовательность может действовать на расстоянии для управления транскрипцией кодирующей последовательности).

[0065] Термин «комплементарность» нуклеиновых кислот означает, что нуклеотидная последовательность в одной цепи нуклеиновой кислоты вследствие ориентации ее групп нуклеиновых оснований образует водородные связи с другой последовательностью на противоположной цепи нуклеиновой кислоты. Комплементарными основаниями в ДНК, как правило, являются А с Т и С с G. В РНК они, как правило, представляют собой С с G и U с А. Комплементарность может являться совершенной или существенной/достаточной. Совершенная комплементарность между двумя нуклеиновыми кислотами означает, что две нуклеиновые кислоты могут образовывать дуплекс, в котором каждое основание в дуплексе связано с комплементарным основанием за счет спаривания Уотсона-Крика. «Существенная» или «достаточная» комплементарность означает, что последовательность в одной цепи не является полностью и/или совершенно комплементарной последовательности в противоположной цепи, но что между основаниями на двух цепях происходит достаточное связывание для образования стабильного гибридного комплекса при наборе условий гибридизации (например, концентрация соли и температура). Такие условия можно предсказать с использованием последовательностей и стандартных математических расчетов для прогнозирования Tm (температуры плавления) гибридизированных нитей или путем эмпирического определения Tm с использованием рутинных способов. Tm включает в себя температуру, при которой популяция гибридизационных комплексов, образованных между двумя цепями нуклеиновой кислоты, денатурируется на 50% (т.е. популяция двухцепочечных молекул нуклеиновой кислоты становится наполовину диссоциированной на отдельные цепи). При температуре ниже Tm предпочтительным является образование гибридизационного комплекса, тогда как при температуре выше Tm предпочтительным является плавление или разделение цепей в гибридизационном комплексе. Tm можно оценить для нуклеиновой кислоты, характеризующейся известным содержанием G+C в водном 1 М растворе NaCl, с использованием, например, Tm=81,5+0,41 (% G+C), хотя другие известные вычисления Tm учитывают структурные характеристики нуклеиновой кислоты.

[0066] «Условие гибридизации» включает в себя совокупную среду, в которой одна цепь нуклеиновой кислоты связывается со второй цепью нуклеиновой кислоты посредством взаимодействия комплементарных цепей и образования водородных связей с образованием гибридизационного комплекса. Такие условия включают в себя химические компоненты и их концентрации (например, соли, хелатирующие агенты, формамид) водного или органического раствора, содержащего нуклеиновые кислоты, и температуру смеси. Другие факторы, такие как продолжительность инкубации или размеры реакционной камеры, могут влиять на окружающую среду. См., например, Sambrook et al., Molecular Cloning, A Laboratory Manual, 2-e изд., С. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989), полностью включенный в настоящий документ посредством ссылки для всех целей.

[0067] Гибридизация требует, чтобы две нуклеиновые кислоты содержали комплементарные последовательности, хотя возможны несовпадения между основаниями. Условия, подходящие для гибридизации между двумя нуклеиновыми кислотами, зависят от длины нуклеиновых кислот и степени комплементарности, переменные, которые хорошо известны. Чем больше степень комплементарности между двумя нуклеотидными последовательностями, тем больше значение температуры плавления (Tm) для гибридов нуклеиновых кислот, характеризующихся этими последовательностями. Для гибридизации между нуклеиновыми кислотами с короткими участками комплементарности (например, комплементарность более 35 или менее, 30 или менее, 25 или менее, 22 или менее, 20 или менее, или 18 или менее нуклеотидов) положение несовпадений становится важным (см. Sambrook et al., ранее, 11.7-11.8). Как правило, длина гибридизуемой нуклеиновой кислоты составляет по меньшей мере около 10 нуклеотидов. Иллюстративные минимальные длины для гибридизуемой нуклеиновой кислоты включают в себя по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 22 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов и по меньшей мере приблизительно 30 нуклеотидов. Кроме того, температуру и концентрацию соли в отмывающем растворе можно корректировать при необходимости в соответствии с такими факторами, как длина области комплементарности и степень комплементарности.

[0068] Последовательность полинуклеотида не обязательно должна быть на 100% комплементарной последовательности целевой нуклеиновой кислоты, чтобы являться специфически гибридизуемой. Кроме того, полинуклеотид может гибридизоваться с одним или несколькими сегментами, так что промежуточные или смежные сегменты не участвуют в событии гибридизации (например, структура петли или структура шпильки). Полинуклеотид (например, гРНК) может характеризоваться по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 99% или 100% комплементарностью последовательности по отношению к целевой области в пределах целевой последовательности нуклеиновой кислоты, на которую они нацелены. Например, гРНК, в которой 18 из 20 нуклеотидов являются комплементарными целевой области и, следовательно, будут специфически гибридизоваться, будет представлять 90% комплементарность. В этом примере оставшиеся некомплементарные нуклеотиды могут быть кластеризованы или могут перемежаться с комплементарными нуклеотидами и не обязательно должны быть смежными друг с другом или с комплементарными нуклеотидами.

[0069] Комплементарность в процентах между конкретными участками последовательностей нуклеиновых кислот в пределах нуклеиновых кислот можно определить обычным образом с использованием программ BLAST (базовые инструменты поиска локального выравнивания) и программ PowerBLAST (Altschul et al. (1990) J. Mol. Biol. 215:403-410; Zhang and Madden (1997) Genome Res. 7: 649-656) или с помощью программы Gap (пакет анализа последовательности Wisconsin Sequence Analysis Package, версия 8 для Unix, Genetics Computer Group, University Research Park, Madison Wis.) с использованием настроек по умолчанию, в которой используют алгоритм Smith и Waterman (Adv. Appl. Math., 1981, 2, 482-489).

[0070] Согласно способам и композициям, представленным в настоящем документе, используют множество различных компонентов. Некоторые компоненты во всем настоящем описании могут характеризоваться наличием активных вариантов и фрагментов. Такие компоненты включают в себя, например, белки Cas, РНК CRISPR, tracrPHK и гидовые РНК. Биологическая активность для каждого из этих компонентов описана в настоящем документе в другом месте. Термин «функциональный» относится к врожденной способности белка или нуклеиновой кислоты (или их фрагмента или варианта) проявлять биологическую активность или функцию. Такие биологические активности или функции могут включать в себя, например, способность белка Cas связываться с гидовой РНК и с целевой последовательностью ДНК. Биологические функции функциональных фрагментов или вариантов могут являться одинаковыми или могут быть фактически изменены (например, в отношении их специфичности, селективности или эффективности) по сравнению с исходными, но с сохранением основной биологической функции.

[0071] Термин «вариант» относится к нуклеотидной последовательности, отличающейся от последовательности, наиболее распространенной в популяции (например, одним нуклеотидом), или последовательности белка, отличающейся от последовательности, наиболее распространенной в популяции (например, одной аминокислотой).

[0072] Термин «фрагмент» применительно к белку означает белок, который является более коротким или содержит меньше аминокислот, чем полноразмерный белок. Термин «фрагмент» в отношении нуклеиновой кислоты означает нуклеиновую кислоту, которая является более короткой или содержит меньше нуклеотидов, чем полноразмерная нуклеиновая кислота. Фрагмент может являться, например, N-концевым фрагментом (т.е. удаление части С-концевого конца белка), С-концевым фрагментом (т.е. удаление части N-концевого конца белка) или внутренним фрагментом.

[0073] Термин «идентичность последовательности» или «идентичность» в контексте двух полинуклеотидных или полипептидных последовательностей относится к остаткам в двух последовательностях, которые являются одинаковыми при выравнивании для максимального соответствия в указанном окне сравнения. Когда процент идентичности последовательности используют в отношении белков, положения остатков, которые не являются идентичными, часто отличаются консервативными аминокислотными заменами, где аминокислотные остатки заменены другими аминокислотными остатками со сходными химическими свойствами (например, заряд или гидрофобность) и, следовательно, не меняют функциональные свойства молекулы. Когда последовательности отличаются по консервативным заменам, процентную идентичность последовательности можно повысить для корректировки консервативного характера замены. Говорят, что последовательности, которые отличаются такими консервативными заменами, характеризуются «сходством последовательностей» или «сходством». Средства для такой корректировки хорошо известны. Как правило, это включает в себя оценку консервативного замещения как частичного, а не полного несовпадения, что увеличивает процентную идентичность последовательности. Таким образом, например, когда идентичная аминокислота получает балл 1, а неконсервативная замена получает оценку 0, консервативная замена получает балл от 0 до 1. Рассчитывают балл консервативных замен, например, как это реализовано в программе PC/GENE (Intelligenetics, Mountain View, California).

[0074] «Процентное отношение идентичности последовательности» включает в себя значение, определенное путем сравнения двух оптимально выровненных последовательностей (наибольшее количество идеально совпадающих остатков) в окне сравнения, причем часть полинуклеотидной последовательности в окне сравнения может содержать добавления или удаления (т.е. пропуски) по сравнению с эталонной последовательностью (которая не содержит добавления или удаления) для оптимального выравнивания двух последовательностей. Процентное отношение рассчитывают путем определения количества положений, в которых идентичное основание нуклеиновой кислоты или аминокислотный остаток встречается в обеих последовательностях, для получения числа совпадающих положений, деления количества совпадающих положений на общее количество положений в окне сравнения и умножение результата на 100 для получения процентного отношения идентичности последовательности. Если не указано иное (например, более короткая последовательность включает в себя связанную гетерологичную последовательность), окно сравнения представляет собой полную длину более короткой из двух сравниваемых последовательностей.

[0075] Если не указано иное, значения идентичности/сходства последовательности включают в себя значение, полученное с использованием GAP версии 10 с использованием следующих параметров: % идентичности и % сходства для нуклеотидной последовательности с использованием штрафа за внесение пропуска согласно GAP, составляющего 50, и штрафа за удлинение пропуска, составляющего 3, и матрицы замен nwsgapdna. cmp; % идентичности и % сходства для аминокислотной последовательности с использованием штрафа за внесение пропуска согласно GAP, составляющего 8, и штрафа за удлинение пропуска, составляющего 2, и матрицы замен BLOSUM62; или любой эквивалентной им программы. «Эквивалентная программа» включает в себя любую программу сравнения последовательностей, которая для любых двух рассматриваемых последовательностей генерирует выравнивание, характеризующееся идентичными совпадениями нуклеотидных или аминокислотных остатков и идентичным процентным отношением идентичности последовательности по сравнению с соответствующим выравниванием, сгенерированным GAP версии 10.

[0076] Термин «консервативная аминокислотная замена» относится к замене аминокислоты, которая обычно присутствует в последовательности, на другую аминокислоту схожего размера, заряда или полярности. Примеры консервативных замен включают в себя замену неполярного (гидрофобного) остатка, такого как изолейцин, валин или лейцин, на другой неполярный остаток. Аналогичным образом, примеры консервативных замен включают в себя замену одного полярного (гидрофильного) остатка на другой, такой как между аргинином и лизином, между глутамином и аспарагином или между глицином и серином. Кроме того, замена основного остатка, такого как лизин, аргинин или гистидин, на другой, или замена одного кислотного остатка, такого как аспарагиновая кислота или глутаминовая кислота, на другой кислотный остаток являются дополнительными примерами консервативных замен. Примеры неконсервативных замен включают в себя замену неполярного (гидрофобного) аминокислотного остатка, такого как изолейцин, валин, лейцин, аланин или метионин, на полярный (гидрофильный) остаток, такой как цистеин, глутамин, глутаминовая кислота или лизин, и/или полярного остатка на неполярный остаток. Типичные классификации аминокислот приведены в таблице 1 ниже.

[0078] Термин «in vitro» включает в себя искусственные среды и процессы или реакции, которые происходят в искусственной среде (например, в пробирке). Термин «in vivo» включает в себя природные среды (например, клетку, организм или организм) и процессы или реакции, которые происходят в естественной среде. Термин «ех vivo» включает в себя клетки, которые были удалены из организма человека, а также процессы или реакции, которые происходят в таких клетках.

[0079] Термин «репортерный ген» относится к нуклеиновой кислоте с последовательностью, кодирующей продукт гена (как правило, фермент), который легко и количественно анализируется, когда конструкт, содержащий последовательность репортерного гена, функционально связан с эндогенным или гетерологичным промоторным и/или энхансерным элементом, введен в клетки, содержащие (или которые могут содержать) факторы, необходимые для активации промоторных и/или энхансерных элементов. Примеры репортерных генов включают в себя без ограничения гены, кодирующие бета-галактозидазу (lacZ), гены бактериальной хлорамфениколацетилтрансферазы (кошка), гены люциферазы светлячка, гены, кодирующие бета-глюкуронидазу (GUS), и гены, кодирующие флуоресцентные белки. «Репортерный белок» относится к белку, кодируемому репортерным геном.

[0080] Используемый в настоящем документе термин «флуоресцентный репортерный белок» означает репортерный белок, который можно обнаружить на основе флуоресценции, где флуоресценция может быть либо непосредственно от репортерного белка, активности репортерного белка на флуорогенном субстрате, либо белка с аффинностью в отношении связывания с флуоресцентным меченым соединением. Примеры флуоресцентных белков включают в себя зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, изумрудно-зеленый, Azami Green, мономерный Azami Green, CopGFP, AceGFP и ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, цитрин, Venus, YPet, PhiYFP и ZsYellowl), синие флуоресцентные белки (например, BFP, eBFP, eBFP2, азурит, mKalamal, GFPuv, сапфир и Т-сапфир), голубые флуоресцентные белки (например, CFP, eCFP, лазурь, CyPet, AmCyanl и Midoriishi-Cyan), красные флуоресцентные белки (например, RFP, mKate, mKate2, mPlum, DsRed-мономер, mCherry, mRFPl, DsRed-Express, DsRed2, DsRed-мономер, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry и Jred), оранжевые флуоресцентные белки (например, mOrange, mKO, Kusabira-Orange, мономерный Kusabira-Orange, mTangerine и tdTomato) и любой другой подходящий флуоресцентный белок, присутствие которого в клетках можно обнаружить с помощью способов проточной цитометрии.

[0081] Восстановление в ответ на двухцепочечные разрывы (DSB) происходит главным образом посредством двух консервативных путей восстановления ДНК: гомологичной рекомбинации (HR) и негомологичного соединения концов (NHEJ). См. Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886-897, полностью включенный в настоящий документ посредством ссылки для всех целей. Аналогичным образом, восстановление целевой нуклеиновой кислоты, опосредованной экзогенной донорной нуклеиновой кислотой, может включать в себя любой процесс обмена генетической информацией между двумя полинуклеотидами.

[0082] Термин «рекомбинация» включает в себя любой процесс обмена генетической информацией между двумя полинуклеотидами и может происходить по любому механизму. Рекомбинация может происходить посредством гомологичной репарации (HDR) или гомологичной рекомбинации (HR). HDR или HR включают в себя форму восстановления нуклеиновой кислоты, которая может требовать гомологии нуклеотидной последовательности, использует «донорную» молекулу в качестве матрицы для восстановления «целевой» молекулы (т.е. той, которая испытала двух цепочечный разрыв) и приводит к переносу генетической информации от донора к мишени. Не желая быть связанными какой-либо конкретной теорией, такой перенос может включать в себя коррекцию несовпадения гетеродуплексной ДНК, которая образуется между поврежденной мишенью и донором, и/или отжиг в зависимости от синтеза нитей, при котором донора используют для повторной синтеза генетической информации, которая станет частью мишени, и/или связанные процессы. В некоторых случаях донорный полинуклеотид, часть донорного полинуклеотида, копия донорного полинуклеотида или часть копии донорного полинуклеотида интегрируется в целевую ДНК. См. Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) FLOS ONE 7:e45768:1-9; и Wang et al. (2013) Nat Biotechnol. 31:530-532, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей.

[0083] NHEJ включает в себя восстановление двухцепочечных разрывов в нуклеиновой кислоте путем прямого лигирования концов разрывов друг с другом или с экзогенной последовательностью без необходимости гомологичной матрицы. Лигирование несмежных последовательностей с помощью NHEJ часто может приводить к делециям, вставкам или транслокациям вблизи сайта двухцепочечного разрыва. Например, NHEJ также может приводить к целенаправленной интеграции экзогенной донорной нуклеиновой кислоты посредством прямого лигирования концов разрыва с концами экзогенной донорной нуклеиновой кислоты (т.е. захват на основе NHEJ). Такая NHEJ-опосредованная целевая интеграция может быть предпочтительной для вставки экзогенной донорной нуклеиновой кислоты, когда пути гомологичной репарации (HDR) нелегко использовать (например, в неделящихся клетках, первичных клетках и клетках, которые плохо выполняют репарацию ДНК на основе гомологии). Кроме того, в отличие от гомологичной репарации, знание относительно больших областей идентичности последовательностей, фланкирующих сайт расщепления (за пределами свисающих концов, создаваемых Cas-опосредованным расщеплением), не требуется, что может быть благоприятным при попытке целенаправленной вставки в организмы, имеющие геномы, для которых знания о геномной последовательности ограничены. Интеграция может происходить посредством лигирования тупых концов между экзогенной донорной нуклеиновой кислотой и расщепленной геномной последовательностью или посредством лигирования липких концов (т.е. характеризующихся 5' или 3' свисающими концами) с использованием экзогенной донорной нуклеиновой кислоты, которая фланкирована свисающими концами, которые совместимы с таковыми, созданными белком Cas в расщепленной геномной последовательности. См., например, US 2011/020722, WO 2014/033644, WO 2014/089290 и Maresca et al. (2013) Genome Res. 23(3):539-546, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. Если тупые концы лигированы, может потребоваться вырезание мишени и/или донора для создания областей микрогомологии, необходимых для соединения фрагментов, что может привести к нежелательным изменениям в целевой последовательности.

[0084] Композиции или способы, «предусматривающие» или «включающие в себя» один или несколько перечисленных элементов, могут включать в себя другие элементы, которые конкретно не указаны. Например, композиция, которая «содержит» или «включает в себя» белок, может содержать белок отдельно или в комбинации с другими ингредиентами. Переходная фраза «состоящий по существу из» означает, что объем формулы изобретения должен интерпретироваться как охватывающий указанные элементы, перечисленные в формуле изобретения, и элементы, которые не оказывают существенного влияния на основную(ые) и новую(ые) характеристику(и) заявленного изобретения. Таким образом, не предусмотрено, что термин «состоящий по существу из» при использовании в формуле изобретения следует интерпретировать как эквивалент «содержащий».

[0085] «Необязательно» или «необязательно» означает, что впоследствии описанное событие или обстоятельство может произойти или может не произойти, и что описание включает в себя случаи, в которых происходит событие или обстоятельство, и случаи, в которых оно не происходит.

[0086] Обозначение диапазона значений включает в себя все целые числа в пределах диапазона или определяющие диапазон и все поддиапазоны, определенные целыми числами в пределах диапазона

[0087] Если иное не очевидно из контекста, термин «приблизительно» охватывает значения в пределах стандартного предела погрешности измерения (например, SEM) установленного значения.

[0088] Термин «и/или» относится и охватывает любые возможные комбинации одного или нескольких связанных перечисленных пунктов, а также отсутствие комбинаций при интерпретации в альтернативе («или»).

[0089] Термин «или» относится к любому одному представителю конкретного перечня, а также включает любую комбинацию представителей этого перечня.

[0090] Формы единственного числа включают в себя формы множественного числа, если контекст явно не предписывает иное. Например, термин «белок Cas» или «по меньшей мере один белок Cas» может включать в себя множество белков Cas, включая в себя их смеси.

[0091] Статистически значимый означает р ≤0,05.

Подробное раскрытие настоящего изобретения

I. Обзор

[0092] Система CRISPR/Cas9 представляет собой мощный инструмент для инженерии генома. Одним из ограничений системы in vivo является необходимость одновременного введения всех компонентов в живой организм. Типичный способ внедрения этих компонентов заключается в транзиентной трансфекции ДНК-конструктов в клетки, которые будут генерировать соответствующие РНК и белок. Хотя этот подход является эффективным, он имеет свойственный недостаток, поскольку клетки должны полагаться на конструкты плазмидной ДНК, чтобы сначала подвергнуться транскрипции, а затем трансляции, прежде чем белок Cas9 станет доступным для взаимодействия с компонентом sgPHК. Необходимы лучшие способы и инструменты для более эффективной оценки активности агентов CRISPR/Cas и для оценки различных способов и параметров доставки для нацеливания на конкретные ткани или типы клеток in vivo.

[0093] В настоящем документе предусмотрены способы и композиции для оценки активности CRISPR/Cas-опосредованного негомологичного соединения концов (NHEJ) и/или CRISPR/Cas-индуцированной рекомбинации целевого геномного локуса с экзогенной донорной нуклеиновой кислотой in vivo и ex vivo. В способах и композициях используют клетки и являющихся человеком животных, содержащих экспрессионную кассету Cas (например, геномно интегрированную Cas экспрессионную кассету), так что белок Cas может быть конститутивно доступным или, например, доступным тканеспецифическим или специфическим для конкретного периода времени образом.

[0094] Не являющиеся человеком животные, содержащие экспрессионные кассеты Cas, упрощают процесс испытания доставки и активности компонентов CRISPR/Cas in vivo, поскольку не являющемуся человеком животному необходимо вводить только гидовые РНК. Кроме того, экспрессионные кассеты Cas могут необязательно являться условными экспрессионными кассетами Cas, которые могут избирательно экспрессироваться в определенных тканях или на определенных стадиях развития, тем самым снижая риск опосредованной Cas токсичности in vivo, или могут быть конститутивно экспрессированы для обеспечения возможности испытания активности в любом и всех типах клеток, тканей и органов.

[0095] Кроме того, предусмотрены способы и композиции для получения и применения этих не являющихся человеком животных для испытания и измерения способности CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo. В некоторых таких способах испытания и измерения способности CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo, гидовую РНК можно доставить в организм эспрессирующего Cas не являющегося человеком животного посредством AAV-опосредованной доставки. Как показано в примере 1, AAV-опосредованная доставка гидовых РНК эспрессирующим Cas9 мышам и, в частности, AAV8-опосредованная доставка в печень, приводит к удивительно более высоким уровням нацеливания CRISPR/Cas, чем доставка гидовых РНК посредством LNP или HDD эспрессирующим Cas9 мышам или доставка как Cas9, так и гидовых РНК мышам дикого типа.

II. Не являющиеся человеком животные, содержащие экспрессионные кассеты Cas

[0096] В раскрытых в настоящем документе способах и композициях используют не являющихся человеком животных или клетки, содержащие экспрессионные кассеты Cas, для оценки способности систем сгруппированных регулярно перемежающихся коротких палиндромных повторов (CRISPR)/ассоциированных с CRISPR белков (Cas) или компонентов таких систем (например, гидовых РНК, введенных организм не являющегося человеком животного или клетки) модифицировать целевой геномный локус in vivo или ex vivo.

[0097] Системы CRISPR/Cas включают в себя транскрипты и другие элементы, участвующие в экспрессии или управлении активностью генов Cas. Система CRISPR/Cas может являться, например, системой типа I, типа II или типа III. Альтернативно, система CRISPR/Cas может представлять собой систему типа V (например, подтип V-A или подтип V-В). Системы CRISPR/Cas, используемые в композициях и способах, раскрытых в настоящем документе, могут являться не встречающимися в природе. «Не встречающаяся в природе» система включает в себя все, что указывает на участие человека, например, один или несколько компонентов системы изменены или мутированы от своего природного состояния, при этом они по меньшей мере по существу не содержат по меньшей мере один другой компонент, с которым они естественным образом ассоциированы в природе, или ассоциированы по меньшей мере с одним другим компонентом, с которым они не ассоциированы естественным образом. Например, не встречающиеся в природе системы CRISPR/Cas могут использовать комплексы CRISPR, содержащие гРНК и белок Cas, которые не встречаются в природе вместе, белок Cas, который не встречается в природе, или гРНК, которую не встречается в природе.

[0098] В раскрытых в настоящем документе способах и композициях используют системы CRISPR/Cas путем испытания способности комплексов CRISPR (содержащих гидовую РНК (гРНК) в комплексе с белком Cas) индуцировать события сайт-направленного расщепления в целевом геномном локусе in vivo, чтобы модифицировать целевой геномный локус посредством не гомологичного соединение концов (NHEJ), посредством гомологичной репарации в присутствии экзогенной донорной нуклеиновой кислоты или с помощью любых других способов репарации или рекомбинации.

А. Экспрессирующие Cas9 не являющиеся человеком животные

[0099] Раскрытые в настоящем документе клетки и не являющиеся человеком животные содержат экспрессионную кассету Cas. Белки Cas, как правило, содержат по меньшей мере один домен распознавания или связывания РНК, который может взаимодействовать с гидовыми РНК (гРНК, более подробно описанными ниже), и нуклеазные домены. Нуклеазный домен обладает каталитической активностью в отношении расщепления нуклеиновой кислоты, которое включает в себя разрыв ковалентных связей молекулы нуклеиновой кислоты. Расщепление может привести к образованию тупых концов или расположенных в шахматном порядке концов, и оно может являться одноцепочечным или двухцепочечным. Белок Cas может обладать активностью полного расщепления для создания двухцепочечного разрыва в целевой нуклеиновой кислоте (например, двухцепочечного разрыва с тупыми концами), или может представлять собой никазу, которая создает одноцепочечный разрыв в целевой нуклеиновой кислоте.

[00100] Клетки или не являющиеся человеком животные, содержащие экспрессионную кассету Cas, имеют то преимущество, что им требуется доставка только гидовых РНК для обнаружения CRISPR/Cas-опосредованной модификации целевого геномного локуса.

(1) Экспрессионные кассеты Cas

[00101] Клетки и не являющиеся человеком животные, описанные в настоящем документе, содержат экспрессионную кассету Cas. Экспрессионная кассета Cas может быть стабильно интегрирована в геном (т.е. в хромосому) клетки или не являющегося человеком животного, или она может быть расположена вне хромосомы (например, внехромосомно реплицирующейся ДНК). Необязательно, экспрессионная кассета Cas стабильно интегрирована в геном. Стабильно интегрированная экспрессионная кассета Cas может быть случайным образом интегрирована в геном не являющегося человеком животного (т.е. трансгенного), или она может быть интегрирована в предварительно определенную область генома не являющегося человеком животного (т.е. нокин). Необязательно, экспрессионная кассета Cas стабильно интегрирована в локус «безопасная гавань», как описано в другом месте в настоящем документе. Целевой геномный локус, в котором стабильно интегрирована экспрессионная кассета Cas, может являться гетерозиготным по экспрессионной кассете Cas или гомозиготным по экспрессионной кассете Cas.

[00102] Белок Cas, кодируемый экспрессионной кассетой Cas, может представлять собой любой белок Cas (например, белок Cas9), примеры которого описаны ниже. Кодированный белок Cas может дополнительно содержать один или несколько сигналов ядерной локализации (NLS) (например, N-концевой NLS и С-концевой NLS), и последовательность, кодирующая белок Cas, может являться кодон-оптимизированной для клетки или не являющегося человеком животного, как описано ниже. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка Cas9, представленной в SEQ ID NO: 19. Кодирующая последовательность может содержать, состоять по существу или состоять из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной кодирующей последовательности Cas9, представленной в SEQ ID NO: 30.

[00103] Пример экспрессионной кассеты Cas содержит кодирующую Cas последовательность ниже от сигнала полиаденилирования или терминатора транскрипции, фланкированную сайтами распознавания рекомбиназы, распознаваемыми сайт-специфической рекомбиназой. Сигнал полиаденилирования или терминатор транскрипции предотвращают транскрипцию и экспрессию белка Cas. Однако после воздействия сайт-специфической рекомбиназы сигнал полиаденилирования или терминатор транскрипции будут вырезаны, и белок Cas может быть экспрессирован.

[00104] Такая конфигурация для экспрессионной кассеты Cas может обеспечивать тканеспецифическую экспрессию или специфическую для стадии развития экспрессию у не являющихся человеком животных, содержащих экспрессионную кассету Cas, если сигнал полиаденилирования или терминатор транскрипции вырезан тканеспецифическим или специфическим для стадии развития образом. Это может снизить токсичность из-за пролонгированной экспрессии белка Cas в клетке или организме не являющегося человеком животного, или экспрессии белка Cas на нежелательных стадиях развития или в нежелательных типах клеток или тканей не являющегося человеком животного. Например, токсичность может возникнуть в результате расщепления и разрушения нецелевых участков. См., например, Parikh et at. (2015) PLoS One 10(1):e0116484. Индуцируемая экспрессия также может являться благоприятной, поскольку возможность редактирования некоторых генов в определенных тканях (например, таких как иммунные клетки) может являться вредной, а также потенциально вызывать иммунный ответ. Например, в некоторых случаях, если ген мутирован во всем организме индивидуума, это может быть летальным, но если он мутирует в конкретном типе ткани или клетки, это будет благоприятным. Вырезание сигнала полиаденилирования или терминатора транскрипции может быть достигнуто тканеспецифическим или специфическим для стадии развития способом, если не являющееся человеком животное, содержащее экспрессионную кассету Cas, дополнительно содержит сайт-специфическую рекомбиназу, функционально связанную с тканеспецифическим или специфическим для стадии развития специфический промотором (например, промотор альбумина для специфической в отношении печени экспрессии или промотор инсулина-2 для специфической в отношении поджелудочной железы экспрессии). Аналогичным образом, составы LNP, специфические в отношении печени или других тканей, можно использовать для доставки рекомбиназы, или же для доставки рекомбиназы можно использовать способы доставки AAV или серотипы AAV, специфические для конкретных тканей (например, AAV8 для печени или прямую инъекцию AAV для поджелудочной железы). Сигнал полиаденилирования или терминатор транскрипции затем вырезают только в этих тканях или на этих стадиях развития, что позволяет происходить тканеспецифической или специфической для стадии развития экспрессии белка Cas. В одном примере белок Cas может быть экспрессирован специфическим для печени образом. Примеры таких промоторов, которые были использованы для разработки таких линий не являющихся человеком животных, у которых вырезание участка ДНК осуществляется рекомбиназой ("recombinase deleter"), раскрыты в другом месте в настоящем документе.

[00105] Можно использовать любой терминатор транскрипции или сигнал полиаденилирования. Термин «терминатор транскрипции», используемый в настоящем документе, относится к последовательности ДНК, которая вызывает терминацию транскрипции. У эукариот терминаторы транскрипции распознаются белковыми факторами, а за терминацией следует полиаденилирование, процесс добавления поли(А)-хвоста к транскриптам мРНК в присутствии поли(А)-полимеразы. Сигнал поли(А) млекопитающего, как правило, состоит из сердцевинной последовательности длиной приблизительно 45 нуклеотидов, которая может быть фланкирована различными вспомогательными последовательностями, которые служат для усиления эффективности расщепления и полиаденилирования. Сердцевинная последовательность состоит из высококонсервативного вышележащего элемента (ААТААА или AAUAAA) в мРНК, называемого мотивом распознавания поли-А или последовательностью распознавания поли-А), распознаваемого специфическим в отношении расщепления и полиаденилирования фактором (CPSF), и плохо определенной нижележащей области (богатой Us или Gs и Us), связанной с фактором стимуляции расщепления (CstF). Примеры терминаторов транскрипции, которые можно использовать, включают в себя, например, сигнал полиаденилирования человеческого гормона роста (HGH), поздний сигнал полиаденилирования вируса обезьян 40 (SV40), сигнал полиаденилирования бета-глобина кролика, сигнал полиаденилирования гормона роста крупного рогатого скота (BGH), сигнал полиаденилирования фосфоглицераткиназы (PGK), последовательность терминации транскрипции АОХ1, последовательность терминации транскрипции CYC1 или любая последовательность терминации транскрипции, о которой известно, что она подходит для регуляции экспрессии генов в эукариотических клетках.

[00106] Сайт-специфические рекомбиназы включают в себя ферменты, которые могут облегчать рекомбинацию между сайтами распознавания рекомбиназы, где два сайта рекомбинации физически разделены в одной нуклеиновой кислоте или в отдельных нуклеиновых кислотах. Примеры рекомбиназ включают в себя рекомбиназы Cre, Flp и Dre. Одним примером гена Cre-рекомбиназы является Crei, в котором два экзона, кодирующие Cre-рекомбиназу, разделены интроном для предотвращения его экспрессии в прокариотической клетке. Такие рекомбиназы могут дополнительно содержать сигнал ядерной локализации для облегчения локализации в ядре (например, NLS-Crei). Сайты распознавания рекомбиназы включают в себя нуклеотидные последовательности, которые распознаются сайт-специфической рекомбиназой и могут служить в качестве субстрата для события рекомбинации. Примеры сайтов распознавания рекомбиназы включают в себя FRT, FRT11, FRT71, attp, att, rox и сайты lox, такие как loxP, lox511, lox2272, lox66, lox71, loxM2 и lox5171.

[00107] Экспрессионная кассета Cas может быть функционально связана с любым подходящим промотором для экспрессии in vivo в организме не являющегося человеком животного. Не являющееся человеком животное может представлять собой любое подходящее не являющееся человеком животное, как описано в настоящем документе в другом месте. В качестве одного примера, кассета экспрессии Cas может быть функционально связана с эндогенным промотором в целевом геномном локусе, таким как промотор Rosa26. Альтернативно, экспрессионная кассета Cas может быть функционально связана с экзогенным промотором, таким как конститутивно активный промотор (например, промотор CAG или промотор/энхансер бета-актина курицы в сочетании с немедленно ранним энхансером цитомегаловируса (CMV) (CAGG)), условным промотором, индуцируемым промотором, ограниченным по времени промотором (например, регулируемым стадией развития промотором) или пространственно ограниченным промотором (например, клеточноспецифическим или тканеспецифическим промотором). Такие промоторы хорошо известны и обсуждаются в настоящем документе в другом месте. Иллюстративный промотор CAGG представлен в SEQ ID NO: 38 или содержит, состоит по существу или состоит из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности, представленной в SEQ ID NO: 38.

[00108] Экспрессионные кассеты Cas, раскрытые в настоящем документе, могут также содержать другие компоненты. Экспрессионная кассета Cas может дополнительно содержать 3' последовательность сплайсинга на 5' конце экспрессионной кассеты Cas и/или второй сигнал полиаденилирования, следующий за кодирующей последовательностью для белка Cas на 3' конце экспрессионной кассеты Cas. Экспрессионная кассета Cas может дополнительно содержать селекционную кассету, содержащую, например, кодирующую последовательность для белка с устойчивостью лекарственному средству. Примеры подходящих маркеров селекции включают в себя неомицинфосфотрансферазу (neor), гигромицин В-фосфотрансферазу (hygr), пуромицин-N-ацетилтрансферазу (puror), бластицидин S-дезаминазу (bsrr), ксантин/гуанинфосфорибозилтрансферазу (gpt) и тимидинкиназу вируса простого герпеса (HSV-k). Необязательно, селекционная кассета может быть фланкирована сайтами распознавания рекомбиназы для сайт-специфической рекомбиназы. Если экспрессионная кассета Cas также содержит сайты распознавания рекомбиназы, фланкирующие сигнал полиаденилирования выше от кодирующей Cas последовательности, как описано выше, необязательно другой набор сайтов распознавания рекомбиназы, распознаваемых другой рекомбиназой, используют для фланкирования селекционной кассеты. Альтернативно, один и тот же набор сайтов распознавания рекомбиназы может фланкировать как сигнал полиаденилирования перед кодирующей Cas последовательностью, так и селекционную кассету. Иллюстративная последовательность neor-полиаденилирования представлена в SEQ ID NO: 37 или содержит, состоит по существу или состоит из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности, представленной в SEQ ID NO: 37.

[00109] Экспрессионная кассета Cas также может содержать нуклеиновую кислоту, кодирующую метку белка, такую как метка 3xFLAG. Пример такой метки представлен в SEQ ID NO: 23, которая необязательно кодируется SEQ ID NO: 34. Например, метка может находиться на N-конце белка Cas, на С-конце белок Cas или внутри белка Cas. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка 3xFLAG-Cas9, представленной в SEQ ID NO: 22, или последовательности белка 3xFLAG-Cas9-P2A-eGFP, представленной в SEQ ID NO: 16. Кодирующая последовательность может содержать, состоять по существу или состоять из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100%, идентичной кодирующей 3xFLAG-Cas9 Cas9 последовательности, представленной в SEQ ID NO: 31, или кодирующей 3xFLAG-Cas9-P2A-eGFP последовательности, представленной в SEQ ID NO: 29, соответственно.

[00110] Экспрессионная кассета Cas также может содержать нуклеиновую кислоту, кодирующую один или несколько репортерных белков, таких как флуоресцентный белок (например, зеленый флуоресцентный белок). Можно использовать любой подходящий репортерный белок. Например, можно использовать флуоресцентный репортерный белок, как определено в другом месте в настоящем документе, или не флуоресцентный репортерный белок. Примеры флуоресцентных репортерных белков представлены в другом месте в настоящем документе. Не флуоресцентные репортерные белки включают в себя, например, репортерные белки, которые можно использовать в гистохимических или биолюминесцентных анализах, такие как бета-галактозидаза, люцифераза (например, люцифераза Renilla, люцифераза светлячка и люцифераза NanoLuc) и бета-глюкуронидаза. Экспрессионная кассета Cas может включать в себя репортерный белок, который может быть обнаружен в анализе с помощью проточной цитометрии (например, флуоресцентный репортерный белок, такой как зеленый флуоресцентный белок) и/или репортерный белок, который может быть обнаружен в гистохимическом анализе (например, белок бета-галактозидаза). Одним из примеров такого гистохимического анализа является визуализация гистохимической экспрессии бета-галактозидазы in situ посредством гидролиза X-Gal (5-бром-4-хлор-3-индоил-b-D-галактопиранозида), который дает синий осадок, или с использованием флуорогенных субстратов, таких как бета-метил-умбеллиферилгалактозид (MUG) и флуоресцеиндигалактозид (FDG).

[00111] Экспрессионная кассета Cas в таких случаях может содержать мультицистронную нуклеиновую кислоту. Например, такие нуклеиновые кислоты могут являться кодирующей последовательностью белка Cas и кодирующей последовательностью репортерного белка (в любом порядке), разделенными промежуточным участком внутренней посадки рибосомы (IRES) или промежуточной кодирующей последовательностью пептида 2А. Мультицистронные экспрессионные конструкты одновременно экспрессируют два или более отдельных белков из одной и той же мРНК (т.е. транскрипт, полученный из одного и того же промотора). Подходящие стратегии для мультицистронной экспрессии белков включают в себя, например, использование пептида 2А и использование участка внутренней посадки рибосомы (IRES). Например, такие нуклеиновые кислоты могут содержать кодирующие последовательности для двух или более репортерных белков, разделенных промежуточным участком внутренней посадки рибосомы (IRES) или промежуточной кодирующей пептид 2А последовательностью. В качестве одного примера, такие мультицистронные векторы могут использовать один или несколько участков внутренней посадки рибосомы (IRES), чтобы позволить инициирование трансляции из внутренней области мРНК. В качестве другого примера, такие мультицистронные векторы могут использовать один или несколько пептидов 2А. Эти пептиды представляют собой небольшие «саморасщепляющиеся» пептиды, как правило, характеризующиеся длиной, составляющей 18-22 аминокислоты, и продуцирующие эквимолярные уровни нескольких генов из одной и той же мРНК. Рибосомы пропускают синтез глицил-пролилпептидной связи на С-конце пептида 2А, что приводит к «расщеплению» между пептидом 2А и пептидом, находящимся непосредственно ниже него. См., например, Kim et al. (2011) PLoS One 6(4): e18556, полностью включенный в настоящий документ посредством ссылки для всех целей. «Расщепление» происходит между остатками глицина и пролина, обнаруженными на С-конце, это означает, что находящемся выше цистроне будет добавлено несколько дополнительных остатков, в то время как находящийся ниже по ходу транскрипции цистрон будет начинаться с пролина. В результате «отщепленный» нижележащий пептид содержит пролин на своем N-конце. Опосредованное 2А расщепление является универсальным явлением во всех эукариотических клетках. Пептиды 2А были идентифицированы из пикорнавирусов, вирусов насекомых и ротавирусов типа С. См., например, Szymczak et al. (2005) Expert Opin Biol Ther 5:627-638, полностью включенный в настоящий документ посредством ссылки для всех целей. Примеры пептидов 2А, которые можно использовать, включают в себя 2А вируса Thosea asigna (Т2А); 2А свиного тешовируса-1 (Р2А); 2А вируса лошадиного ринита A (ERAV) (Е2А) и 2А FMDV (F2A). Иллюстративные последовательности Т2А, Р2А, Е2А и F2A включают в себя следующие: Т2А (EGRGSLLTCGDVEENPGP; SEQ ID NO: 2); Р2А (ATNFSLLKQAGDVEENPGP; SEQ ID NO: 3); Е2А (QCTNYALLKLAGDVESNPGP; SEQ ID NO: 4); и F2A (VKQTLNFDLLKLAGDVESNPGP; SEQ ID NO: 5). Остатки GSG могут быть добавлены к 5' концу любого из этих пептидов для улучшения эффективности расщепления. Иллюстративная кодирующая последовательность для Р2А с остатками GSG, добавленными на 5' конце, представлена в SEQ ID NO: 32 или содержит, состоит по существу или состоит из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности, представленной в SEQ ID NO: 32. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 91%, 98%о, 99% или 100% идентичной белковой последовательности Cas9-P2A-eGFP eGFP, представленной в SEQ ID NO: 13, или белковой последовательности 3xFLAG-Cas9-P2A-eGFP, представленной в SEQ ID NO: 16. Кодирующая последовательность может содержать, состоять по существу или состоять из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%) 95%, 96%, 97%, 98%, 99% или 100% идентичной кодирующей Cas9-P2A-eGFP последовательности, представленной в SEQ ID NO: 28, или кодирующей 3xFLAG-Cas9-P2A-eGFP последовательности, представленной в SEQ ID NO: 29, соответственно.

[00112] Экспрессионные кассеты Cas также могут содержать другие элементы, такие как посттранскрипционные регуляторные элементы или сигналы полиаденилирования, расположенные ниже относительно кодирующей Cas последовательности. Иллюстративный посттранскрипционный регуляторный элемент представляет собой посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE), который представлен в SEQ ID NO: 35 или содержит, состоит по существу или состоит из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 91%, 98%, 99% или 100% идентичной последовательности, представленной в SEQ ID NO: 35. Иллюстративный сигнал полиаденилирования представляет собой сигнал полиаденилирования гормона роста крупного рогатого скота, который представлен в SEQ ID NO: 36 или содержит, состоит по существу или состоит из последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 91%, 98%, 99% или 100% идентичной последовательности, представленной в SEQ ID NO: 36.

[00113]Одна иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) 3' последовательность сплайсинга; (b) сигнал полиаденилирования, фланкированный первым и вторым сайтами распознавания рекомбиназы для рекомбиназы (например, сайты loxP для Cre-рекомбиназы); (с) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце); (d) кодирующая белок 2А последовательность (например, кодирующая Р2А последовательность); и (е) кодирующая последовательность для репортерного белка (например, флуоресцентного репортерного белка, такого как зеленый флуоресцентный белок). См., например, фигуру 1 и MAID2599 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 1. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка Cas9-P2A-eGFP, представленной в SEQ ID NO: 13.

[00114] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) 3' последовательность сплайсинга; (b) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце); (с) кодирующая белок 2А последовательность (например, кодирующая Р2А последовательность); и (d) кодирующая последовательность для репортерного белка (например, флуоресцентного репортерного белка, такой как зеленый флуоресцентный белок). См., например, MAID2600 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 12. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка Cas9-P2A-eGFP, представленной в SEQ ID NO: 13.

[00115] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) 3' последовательность сплайсинга; (b) сигнал полиаденилирования, фланкированный первым и вторым сайтами распознавания рекомбиназы для рекомбиназы (например, сайты loxP для Cre-рекомбиназы); и (с) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце). См., например, MAID2660 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 17. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка Cas9, представленной в SEQ ID NO: 19.

[00116] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) 3' последовательность сплайсинга; и (b) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце). См., например, MAID2661 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 18. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 91%, 98%, 99% или 100% идентичной последовательности белка Cas9, представленной в SEQ ID NO: 19.

[00117] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) экзогенный промотор (например, конститутивный промотор, такой как промотор CAGG); (b) сигнал полиаденилирования, фланкированный первым и вторым сайтами распознавания рекомбиназы для рекомбиназы (например, сайты loxP для Cre-рекомбиназы); (с) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце, необязательно с меткой на N-концевом или С-концевом конце, такой как метка 3xFLAG на N-концевом конце); (d) кодирующая белок 2А последовательность (например, кодирующая Р2А последовательность); и (е) кодирующая последовательность для репортерного белка (например, флуоресцентного репортерного белка, такого как зеленый флуоресцентный белок). См., например, MAID2658 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 14. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка 3xFLAG-Cas9-P2A-eGFP, представленной в SEQ ГО NO: 16.

[00118] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) экзогенный промотор (например, конститутивный промотор, такой как промотор CAGG); (b) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце, необязательно с меткой на N-концевом или С-концевом конце, такой как метка 3xFLAG на N-концевом конце); (с) кодирующая белок 2А последовательность (например, кодирующая Р2А последовательность); и (d) кодирующая последовательность для репортерного белка (например, флуоресцентного репортерного белка, такого как зеленый флуоресцентный белок). См., например, MAID2659 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 15. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка 3xFLAG-Cas9-P2A-eGFP, представленной в SEQ ГО NO: 16.

[00119] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) экзогенный промотор (например, конститутивный промотор, такой как промотор CAGG); (b) сигнал полиаденилирования, фланкированный первым и вторым сайтами распознавания рекомбиназы для рекомбиназы (например, сайты loxP для Cre-рекомбиназы); и (с) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце, необязательно с меткой на N-концевом или С-концевом конце, такой как метка 3xFLAG на N-концевом конце). См., например, MAID2672 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 20. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка 3xFLAG-Cas9, представленной в SEQ ID NO: 22.

[00120] Другая иллюстративная экспрессионная кассета Cas содержит от 5' к 3' следующее: (а) экзогенный промотор (например, конститутивный промотор, такой как промотор CAGG); и (b) кодирующая белок Cas последовательность (например, кодирующая NLS-Cas9 последовательность, например, с NLS на N-концевом конце и NLS на С-концевом конце, необязательно с меткой на N-концевом или С-концевом конце, такой как метка 3xFLAG на N-концевом конце). См., например, MAID2673 на фигуре 14. Такая экспрессионная кассета может содержать, состоять по существу или состоять из последовательности, которая по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентична последовательности, представленной в SEQ ID NO: 21. Например, такая экспрессионная кассета может кодировать белок, содержащий, состоящий по существу или состоящий из аминокислотной последовательности, по меньшей мере на 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичной последовательности белка 3xFLAG-Cas9, представленной в SEQ ID NO: 22.

[00121] Описанные в настоящем документе экспрессионные кассеты Cas могут находиться в любой форме. Например, экспрессионная кассета Cas может находиться в векторе или плазмиде, такой как вирусный вектор. Экспрессионная кассета Cas может быть функционально связана с промотором в экспрессионной конструкте, способным направлять экспрессию белка Cas после удаления вышележащего сигнала полиаденилирования. Альтернативно, экспрессионная кассета Cas может находиться в нацеливающем векторе, как определено в настоящем документе в другом месте. Например, направляющий вектор может содержать гомологические плечи, фланкирующие экспрессиоиную кассету Cas, причем гомологические плечи подходят для направления рекомбинации с требуемым целевым геномным локусом для облегчения геномной интеграции.

[00122] Описанные в настоящем документе экспрессионные кассеты Cas могут находиться in vitro, они могут находиться внутри клетки (например, эмбриональной стволовой клетки) ex vivo (например, геномно интегрированы или внехромосомно) или они могут находиться в организме (например, не являющегося человеком животного) in vivo (например, геномно интегрированы или внехромосомно). В случае ex vivo экспрессионная кассета Cas может находиться в клетке любого типа из любого организма, такой как тотипотентная клетка, такая как эмбриональная стволовая клетка (например, эмбриональная стволовая клетка мыши или крысы) или индуцированная плюрипотентная стволовая клетка (например, индуцированная плюрипотентная стволовая клетка человека). В случае in vivo экспрессионная кассета Cas может находиться в организме любого типа (например, не являющееся человеком животное, как описано далее в другом месте в настоящем документе).

(2) Белки Cos и полинуклеотиды, кодирующие белки Cas

[00123] Белки Cas, как правило, содержат по меньшей мере один домен распознавания или связывания РНК, который может взаимодействовать с гидовыми РНК (гРНК, более подробно описанные ниже). Белки Cas также могут содержать нуклеазные домены (например, домены ДНКазы или РНКазы), ДНК-связывающие домены, геликазные домены, домены белок-белковых взаимодействий, домены димеризации и другие домены. Некоторые такие домены (например, домены ДНКазы) могут быть из нативного белка Cas. Другие такие домены могут быть добавлены для получения модифицированного белка Cas. Нуклеазный домен обладает каталитической активностью в отношении расщепления нуклеиновой кислоты, которое включает в себя разрыв ковалентных связей молекулы нуклеиновой кислоты. Расщепление может привести к образованию тупых концов или расположенных в шахматном порядке концов, и оно может являться одноцепочечным или двухцепочечным. Например, белок Cas9 дикого типа, как правило, создает продукт расщепления с тупым концом. Альтернативно, белок Cpf1 дикого типа (например, FnCpf1) может приводить к продукту расщепления с 5-нуклеотидным 5'-«свисающим» концом, причем расщепление происходит после 18-й пары оснований из последовательности РАМ на нецелевой цепи и после 23-го основания на целевой цепи. Белок Cas может обладать активностью полного расщепления для создания двухцепочечного разрыва в целевом геномном локусе (например, двухцепочечный разрыв с тупыми концами), или это может быть никаза, которая создает одноцепочечный разрыв в целевом геномном локусе.

[00124] Примеры белков Cas включают в себя Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 или Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 и Cu1966 и их гомологи или модифицированные версии.

[00125] Иллюстративный белок Cas представляет собой белок Cas9 или белок, полученный из Cas9. Белки Cas9 происходят из системы CRISPR/Cas II типа и, как правило, характеризуются общими четырьмя ключевыми мотивами с консервативной архитектурой. Мотивы 1, 2 и 4 представляют собой RuvC-подобные мотивы, и мотив 3 представляет собой мотив HNH. Иллюстративные белки Cas9 происходят из Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, Acaryochloris marina, Neisseria meningitidis или Campylobacter jejuni. Дополнительные примеры представителей семейства Cas9 описаны в международной патентной публикации WO 2014/131833, полностью включенной в настоящий документ посредством ссылки для всех целей. Cas9 из S. pyogenes (SpCas9) (присвоенный регистрационный номер SwissProt Q99ZW2) представляет собой иллюстративный белок Cas9. Cas9 из S. aureus (SaCas9) (присвоенный регистрационный номер UniProt J7RUA5) представляет собой другой иллюстративный белок Cas9. Cas9 из Campylobacter jejuni (CjCas9) (присвоенный регистрационный номер UniProt Q0P897) представляет собой еще один иллюстративный белок Cas9. См., например, Kim et al. (2017) Nat. Comm. 8:14500, полностью включенный в настоящий документ посредством ссылки для всех целей. SaCas9 меньше, чем SpCas9, a CjCas9 меньше, чем SaCas9 и SpCas9.

[00126] Другим примером белка Cas является белок Cpf1 (CRISPR из Prevotella и Francisella 1). Cpf1 представляет собой большой белок (приблизительно 1300 аминокислот), который содержит RuvC-подобный нуклеазный домен, гомологичный соответствующему домену Cas9, наряду с аналогом характерного богатого аргинином кластера Cas9. Однако в Cpf1 отсутствует нуклеазный домен HNH, который присутствует в белках Cas9, a RuvC-подобный домен является смежным в последовательности Cpf1, в отличие от Cas9, где он содержит длинные вставки, включая в себя домен HNH. См., например, Zetsche et al. (2015) Cell 163(3):759-771, полностью включенный в настоящий документ посредством ссылки для всех целей. Иллюстративные белки Cpf1 происходят из Francisella tularensis 1, Francisella tularensis subsp.novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, CandidatusMethanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae. Cpf1 из Francisella novicida U112 (FnCpf1; присвоенный регистрационный номер UniProt A0Q7Q2) представляет собой иллюстративный белок Cpf1.

[00127] Белки Cas могут представлять собой белки дикого типа (т.е. белки, которые встречаются в природе), модифицированные белки Cas (т.е. варианты белков Cas) или фрагменты белков дикого типа или модифицированных белков Cas. Белки Cas также могут являться активными вариантами или фрагментами в отношении каталитической активности белков Cas дикого типа или модифицированных белков Cas. Активные варианты или фрагменты в отношении каталитической активности могут характеризоваться по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности по отношению к белку Cas дикого типа или модифицированному белку Cas или его части, причем активные варианты сохраняют способность разрезать в требуемом сайте расщепления и, следовательно, сохраняют активность, индуцирующую о дно цепочечный разрыв или двухцепочечный разрыв. Анализы активности в отношении индукции одноцепочечных разрывов или индукции двухцепочечных разрывов являются известными, и, как правило, в них измеряют общую активность и специфичность белка Cas на ДНК-субстратах, содержащих сайт расщепления.

[00128] Белки Cas можно модифицировать для увеличения или уменьшения одного или нескольких из следующего: аффинность связывания нуклеиновой кислоты, специфичность связывания нуклеиновой кислоты и ферментативная активность. Белки Cas также можно модифицировать для изменения любой другой активности или свойства белка, такого как стабильность. Например, один или несколько нуклеазных доменов белка Cas можно модифицировать, удалить или инактивировать, или белок Cas может быть усечен для удаления доменов, которые не являются необходимыми для функции белка или для оптимизации (например, для усиления или снижения активности или свойства белка Cas.

[00129] Одним из примеров модифицированного белка Cas является модифицированный белок SpCas9-HF1, который представляет собой высокоточный вариант Cas9 Streptococcus pyogenes, несущий изменения (N497A/R661A/Q695A/Q926A), предназначенный для уменьшения неспецифических контактов ДНК. См., например, Kleinstiver et al. (2016) Nature 529(7587):490-495, полностью включенный в настоящий документ посредством ссылки для всех целей. Другим примером модифицированного белка Cas является модифицированный вариант eSpCas9 (K848A/K1003A/R1060A), предназначенный для уменьшения нежелательных эффектов. См., например, Slaymaker et al. (2016) Science 351(6268):84-88, полностью включенный в настоящий документ посредством ссылки для всех целей. Другие варианты SpCas9 включают в себя K855A и K810A/K1003A/R1060A.

[00130] Белки Cas могут содержать по меньшей мере один нуклеазный домен, такой как ДНКазный домен. Например, белок Cpf1 дикого типа, как правило, содержит RuvC-подобный домен, который расщепляет обе цепи целевой ДНК, возможно, в димерной конфигурации. Белки Cas также могут содержать по меньшей мере два нуклеазных домена, таких как ДНКазные домены. Например, белок Cas9 дикого типа, как правило, содержит RuvC-подобный нуклеазный домен и HNH-подобный нуклеазный домен. Каждый из доменов RuvC и HNH может разрезать разные нити двухцепочечной ДНК, чтобы сделать двухцепочечный разрыв в ДНК. См., например, Jinek et al. (2012) Science 337:816-821, полностью включенный в настоящий документ посредством ссылки для всех целей.

[00131] Один или несколько нуклеазных доменов могут быть удалены или мутированы, так что они больше не функционируют или характеризуются пониженной нуклеазной активностью. Например, если один из нуклеазных доменов удален или мутирован в белке Cas9, полученный белок Cas9 можно назвать никазой, и он может генерировать однонитевой разрыв в целевой последовательности для гидовой РНК в пределах двухцепочечной ДНК, но не двухцепочечный разрыв (т.е. он может расщеплять комплементарную цепь или не комплементарную цепь, но не обе). Примером мутации, которая превращает Cas9 в никазу, является мутация D10A (аспартат в аланин в положении 10 в Cas9) в RuvC-домене Cas9 из S. pyogenes. Аналогично, Н939А (гистидин в аланин в положении аминокислоты 839), Н840А (гистидин в аланин в положении аминокислоты 840) или N863 А (аспарагин в аланин в положении аминокислоты N863) в домене HNH Cas9 из S. pyogenes могут превращать Cas9 в никазу. Другие примеры мутаций, которые превращают Cas9 в никазу, включают в себя соответствующие мутации в Cas9 из S. thermophilics. См., например, Sapranauskas et al. (2011) Nucleic Acids Research 39:9275-9282 и международную патентную публикацию WO 2013/141680, причем каждый из документов полностью включен в настоящий документ посредством ссылки для всех целей. Такие мутации могут быть получены с использованием таких способов, как сайт-направленный мутагенез, ПЦР-опосредованный мутагенез или общий синтез генов. Примеры других мутаций, создающих никазы, можно найти, например, в международных патентных публикациях WO 2013/176772 и WO 2013/142578, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей.

[00132] Также известны примеры инактивирующих мутаций в каталитических доменах белков Cas9 Staphylococcus aureus. Например, фермент Cas9 Staphyloccocus aureus (SaCas9) может содержать замену в положении N580 (например, замену N580A) и замену в положении D10 (например, замену D10A) для создания белок Cas с неактивной нуклеазой. См., например, международную патентную публикацию WO 2016/106236, полностью включенную в настоящий документ посредством ссылки для всех целей.

[00133] Также известны примеры ин активирующих мутаций в каталитических доменах белков Cpf1. Что касается белков Cpf1 из U112 Francisella novicida (FnCpf1), BV3L6 Acidaminococcus sp. (AsCpf1), ND2006 Lachnospiraceae bacterium (LbCpf1) и 237 Moraxella bovoculi (MbCpf1 Cpf1), такие мутации могут включать в себя мутации в положениях 908, 993 или 1263 в AsCpf1 или в соответствующих положениях в ортологах Cpf1 или 832, 925, 947 или 1180 в LbCpf1 или соответствующих положениях в ортологах Cpf1. Такие мутации могут включать в себя, например, одну или несколько из мутаций D908A, Е993А, и D1263A в AsCpf1 или соответствующие мутации в ортологах Cpf1, или D832A, Е925А, D947A и D1180A в LbCpf1 или соответствующие мутации в ортологах Cpf1. См., например, US 2016/0208243, полностью включенную в настоящий документ посредством ссылки для всех целей.

[00134] Белки Cas также могут быть функционально связаны с гетерологичными полипептидами в качестве слитых белков. Например, белок Cas может быть слит с доменом расщепления или доменом эпигенетической модификации. См. международную патентную публикацию WO 2014/089290, полностью включенную в настоящий документ посредством ссылки для всех целей. Белки Cas также могут быть слиты с гетерологичным полипептидом, обеспечивающим повышенную или пониженную стабильность. Слитый домен или гетерологичный полипептид может быть расположен на N-конце, С-конце или внутри белка Cas.

[00135] В качестве одного примера, белок Cas может быть слит с одним или несколькими гетерологичными полипептидами, которые обеспечивают субклеточную локализацию. Такие гетерологичные полипептиды могут включать в себя, например, один или несколько сигналов ядерной локализации (NLS), таких как одинарный NLS SV40 и/или двойной NLS альфа-импортина для нацеливания на ядро, сигнал митохондриальной локализации для нацеливания на митохондрии, сигнал удерживания в ER и тому подобное. См., например, Lange et al. (2007) J. Biol. Chem. 282:5101-5105, полностью включенный в настоящий документ посредством ссылки для всех целей. Такие сигналы субклеточной локализации могут быть локализованы на N-конце, С-конце или в любом месте белка Cas. NLS может содержать участок основных аминокислот и может представлять собой одинарную последовательность или двойную последовательность. Необязательно белок Cas может содержать два или более NLS, включая в себя NLS (например, NLS альфа-импорта на или одинарный NLS) на N-конце и NLS (например, NLS SV40 или двойной NLS) на С-конце. Белок Cas также может содержать два или более NLS на N-конце и/или два или более NLS на С-конце.

[00136] Белки Cas также могут быть функционально связаны с проникающим в клетку доменом или доменом белковой трансдукции. Например, проникающий в клетку домен может быть получен из белка ТАТ ВИЧ-1, проникающего в клетки TLM мотива вируса гепатита В человека, MPG, Рер-1, VP22, проникающего в клетки пептида вируса простого герпеса или пептидной последовательности полиаргинина. См., например, международные патентные публикации WO 2014/089290 и WO 2013/176772, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Проникающий в клетку домен может быть расположен на N-конце, С-конце или в любом месте белка Cas.

[00137] Белки Cas также могут быть функционально связаны с гетерологичным полипептидом для простоты отслеживания или очистки, таким как флуоресцентный белок, метка очистки или метка эпитопа. Примеры флуоресцентных белков включают в себя зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, изумрудно-зеленый, Azami Green, мономерный Azami Green, CopGFP, AceGFP, ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, цитрин, Venus, YPet, PhiYFP, ZsYellowl), голубые флуоресцентные белки (например, eBFP, eBFP2, азурит, mKalamal, GFPuv, сапфир, Т-сапфир), голубые флуоресцентные белки (например, eCFP, лазурь, CyPet, AmCyanl, Midorii), красные флуоресцентные белки (например, mKate, mKate2, mPlum, DsRed-мономер, mCherry, mRFPl, DsRed-Express, DsRed2, DsRed-мономер, HcRed-Tandem, HcRed1, AsRed2, eqFP611, mRespberry, mStrawberry, Jred), оранжевые флуоресцентные белки (например, mOrange, mKO, Kusabira-Orange, мономерный Kusabira-Orange, mTangerine, tdTomato) и любой другой подходящий флуоресцентный белок. Примеры меток включают в себя глутатион-S-трансферазу (GST), хитин-связывающий белок (СВР), мальтозосвязывающий белок, тиоредоксин (TRX), nonn(NANP), метку тандемной аффинной очистки (ТАР), myc, AcV5, AU1, AU5, Е, ECS, Е2, FLAG, гемагглютинин (НА), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, SI, T7, V5, VSV-G, гистидин (His), белок-носитель биотин-карбоксила (BCCP) и кальмодулин.

[00138] Нуклеиновую кислоту, кодирующую белок Cas, можно оптимизировать по кодонам для эффективной трансляции в белок в конкретной клетке или организме. Например, нуклеиновую кислоту, кодирующую белок Cas, можно модифицировать для замены кодонов, характеризующихся более высокой частотой использования в клетке человека, не относящейся к человеку клетке, клетке млекопитающего, клетке грызуна, клетке мыши, клетке крысы или любой другой представляющей интерес клетке-хозяине по сравнению с встречающейся в природе полинуклеотидной последовательностью.

(3) Гидовые РНК

[00139] «Гидовая РНК» или «гРНК» представляет собой молекулу РНК, которая связывается с белком Cas (например, белком Cas9) и нацеливает белок Cas на специфическое местоположение в пределах целевой ДНК. Гидовые РНК могут содержать два сегмента: «нацеливающий на ДНК сегмент» и «связывающий белок сегмент». «Сегмент» включает в себя участок или область молекулы, такой как непрерывный участок нуклеотидов в РНК. Некоторые гРНК, такие как гРНК для Cas9, могут содержать две отдельные молекулы РНК: «активатор-РНК» (например, tracrPHK) и «targeter-РНК» (например, CRISPR РНК или сrРНК). Другие гРНК представляют собой единую молекулу РНК (полинуклеотид единой РНК), которая также может называться «одномолекулярная гРНК», «единая гидовая РНК» или «sgPHK». См., например, международные патентные публикации WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578 и WO 2014/131833, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Для Cas9, например, единая гидовая РНК может содержать сrРНК, слитую с tracrPHK (например, посредством линкера). Для Cpf1, например, только сrРНК необходима для достижения связывания и/или расщепления целевой последовательности. Термины «гидовая РНК» и «гРНК» включают в себя как двухмолекулярные (т.е. модульные) гРНК, так и одномолекулярные гРНК.

[00140] Типичная двухмолекулярная гРНК содержит молекулу, подобную сrРНК («CRISPR РНК», или «targeter-РНК», или «сrРНК», или «повтор сrРНК»), и соответствующую tracrPHK-подобную («транс-активная CRISPR РНК» или «активатор-РНК» или «tracrPHK») молекулу. сrРНК содержит как нацеливающий на ДНК сегмент (одноцепочечный) гРНК, так и участок нуклеотидов (т.е. хвост сrРНК), который образует одну половину дцРНК-дуплекса связывающего белок сегмента гРНК. Пример хвоста сrРНК, расположенного ниже (3') от сегмента, нацеливающего на ДНК, содержит, состоит по существу или состоит из GUUUUAGAGCUAUGCU (SEQ ID NO: 25). Любой из сегментов, нацеливающих на ДНК, раскрытых в настоящем документе, можно присоединить к 5' концу SEQ ID NO: 25 с образованием сrРРНК.

[00141] Соответствующая tracrPHK (активатор-РНК) содержит участок нуклеотидов, который образует другую половину дцРНК-дуплекса связывающего белок сегмента гРНК. Участок нуклеотидов сrРНК является комплементарным и гибридизуется с участком нуклеотидов tracrPHK с образованием дцРНК-дуплекса связывающего белок домена гРНК. Таким образом, можно сказать, что каждая сrРНК имеет соответствующую tracrPHK. Пример последовательности tracrPHK содержит, состоит по существу или состоит из AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGA GUCGGUGCUUU (SEQ ID NO: 26).

[00142] В системах, в которых необходимы как сrРНК, так и tracrPHK, сrРНК и соответствующая tracrPHK гибридизуются с образованием гРНК. В системах, в которых требуется только сrРНК, сrРНК может представлять собой гРНК. Кроме того, сrРНК обеспечивает одноцепочечный нацеливающий на ДНК сегмент, который нацеливается на целевую последовательность для гидовой РНК путем гибридизации с противоположной цепью (т.е. комплементарной цепью). При использовании для модификации внутри клетки точная последовательность данной молекулы сrРНК или tracrPHK может быть разработана так, чтобы она была специфической для видов, в которых будут использоваться молекулы РНК. См., например, Mali et al. (2013) Science 339:823-826; Jinek et al. (2012) Science 337:816-821; Hwang et al. (2013) Nat. Biotechnol. 31:227-229; Jiang et al. (2013) Nat. Biotechnol. 31:233-239; и Cong et al. (2013) Science 339:819-823, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей.

[00143] Нацеливающий на ДНК сегмент (сrРНК) данной гРНК содержит нуклеотидную последовательность, которая комплементарна последовательности (т.е. комплементарная цепь последовательности распознавания гидовой РНК на цепи, противоположной целевой последовательности для гидовой РНК) в целевой ДНК. Нацеливающий на ДНК сегмент гРНК взаимодействует с целевой ДНК специфическим для последовательности образом посредством гибридизации (т.е. спаривания оснований). Как таковая, нуклеотидная последовательность сегмента, нацеливающего на ДНК, может варьироваться и определять местоположение внутри целевой ДНК, с которым будут взаимодействовать гРНК и целевая ДНК. Нацеливающий на ДНК сегмент рассматриваемой гРНК может быть модифицирован для гибридизации с любой требуемой последовательностью в целевой ДНК. Встречающиеся в природе сrРНК различаются в зависимости от системы CRISPR/Cas и организма, но часто содержат нацеливающий сегмент длиной от 21 до 72 нуклеотидов, фланкированный двумя прямыми повторами (DR) длиной от 21 до 46 нуклеотидов (см., например, международную патентную публикацию WO 2014/131833, полностью включенную в настоящий документ посредством ссылки для всех целей). В случае S. pyogenes DR характеризуются длиной, составляющей 36 нуклеотидов, а нацеливающий сегмент составляет 30 нуклеотидов. 3'-расположенный DR является комплементарным и гибридизуется с соответствующей tracrPHK, которая, в свою очередь, связывается с белком Cas.

[00144] Нацеливающий на ДНК сегмент может характеризоваться длиной, составляющей по меньшей мере приблизительно 12 нуклеотидов, по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 17 нуклеотидов, по меньшей мере приблизительно 18 нуклеотидов, по меньшей мере приблизительно 19 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов, по меньшей мере приблизительно 30 нуклеотидов, по меньшей мере приблизительно 35 нуклеотидов или по меньшей мере приблизительно 40 нуклеотидов. Такие нацеливающие на ДНК сегменты могут характеризоваться длиной от приблизительно 12 нуклеотидов до приблизительно 100 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 80 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 50 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 40 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 30 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 25 нуклеотидов, или от приблизительно 12 нуклеотидов до приблизительно 20 нуклеотидов. Например, нацеливающий на ДНК сегмент может составлять от приблизительно 15 нуклеотидов до приблизительно 25 нуклеотидов (например, от приблизительно 17 нуклеотидов до приблизительно 20 нуклеотидов или приблизительно 17 нуклеотидов, приблизительно 18 нуклеотидов, приблизительно 19 нуклеотидов или приблизительно 20 нуклеотидов). См., например, US 2016/0024523, полностью включенную в настоящий документ посредством ссылки для всех целей. Для Cas9 из S. pyogenes типичный нацеливающий на ДНК сегмент составляет 16-20 нуклеотидов в длину или 17-20 нуклеотидов в длину. Для Cas9 из S. aureus типичный нацеливающий на ДНК сегмент составляет 21-23 нуклеотида в длину. Для Cpf1 типичный нацеливающий на ДНК сегмент составляет по меньшей мере 16 нуклеотидов в длину или по меньшей мере 18 нуклеотидов в длину.

[00145] tracrPHK могут находиться в любой форме (например, полноразмерные tracrPHK или активные частичные tracrPHK) и могут характеризоваться любой длиной. Они включают в себя первичные транскрипты или процессированные формы. Например, tracrPHK (как часть единой гидовой РНК или как отдельная молекула как часть двухмолекулярной гРНК) могут содержать, состоять по существу или состоять из всей или части последовательности tracrPHK дикого типа (например, приблизительно или больше чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или больше нуклеотидов последовательности tracrPHK дикого типа). Примеры последовательностей tracrPHK дикого типа из S. pyogenes включают в себя 171-нуклеотидные, 89-нуклеотидные, 75-нуклеотидные и 65-нуклеотидные версии. См., например, Deltcheva et al. (2011)Nature 471:602-607; международную патентную публикацию WO 2014/093661, причем каждый из этих документов полностью включен в настоящий документ посредством ссылки для всех целей. Примеры tracrPHK в пределах единых гидовых РНК (sgPHK) включают в себя сегменты tracrPHK, обнаруженные в пределах +48, +54, +67 и +85 версий sgPHK, где "+n" указывает на то, что вплоть до +n нуклеотид tracrPHK дикого типа включен в sgPHK. См. патент США №8697359, полностью включенный в настоящий документ посредством ссылки для всех целей.

[00146] Процентное отношение комплементарности между нацеливающей на ДНК последовательностью и комплементарной цепью последовательности распознавания гидовой РНК в пределах целевой ДНК может составлять по меньшей мере 60% (например, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%), по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 97%, по меньшей мере 98%), по меньшей мере 99% или 100%). Процентное отношение комплементарности между нацеливающей на ДНК последовательностью и комплементарной цепью последовательности распознавания гидовой РНК в пределах целевой ДНК может составлять по меньшей мере 60% по приблизительно 20 смежным нуклеотидам. В качестве примера процентное отношение комплементарности между нацеливающей на ДНК последовательностью и комплементарной цепью последовательности распознавания гидовой РНК в пределах целевой ДНК составляет 100% по 14 смежным нуклеотидам на 5' конце комплементарной цепи последовательности распознавания гидовой РНК в пределах комплементарной цепи целевой ДНК и всего 0% по остальной части. В таком случае может считаться, что нацеливающая на ДНК последовательность составляет 14 нуклеотидов в длину. В качестве другого примера процентное отношение комплементарности между нацеливающей на ДНК последовательностью и комплементарной цепью последовательности распознавания гидовой РНК в пределах целевой ДНК составляет 100% по семи смежным нуклеотидам на 5' конце комплементарной цепи последовательности распознавания гидовой РНК в пределах комплементарной цепи целевой ДНК и только 0% по остальной части. В таком случае может считаться, что нацеливающая на ДНК последовательность составляет 7 нуклеотидов в длину. В некоторых гидовых РНК по меньшей мере 17 нуклеотидов в пределах нацеливающей на ДНК последовательности являются комплементарными целевой ДНК. Например, нацеливающая на ДНК последовательность может составлять 20 нуклеотидов в длину и может содержать 1, 2 или 3 несовпадения с комплементарной цепью последовательности распознавания гидовой РНК. Необязательно несовпадения не являются смежными с последовательностью мотива, прилегающего к протоспейсеру (РАМ) (например, несовпадения находятся на 5' конце нацеливающей на ДНК последовательности или несовпадения находятся по меньшей мере на расстоянии 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 или 19 пар оснований от последовательности РАМ).

[00147] Связывающий белок сегмент гРНК может содержать два участка нуклеотидов, которые являются комплементарными друг Другу. Комплементарные нуклеотиды связывающего белок сегмента гибридизуются с образованием двухцепочечного РНК-дуплекса (дцРНК). Связывающий белок сегмент рассматриваемой гРНК взаимодействует с белком Cas, и гРНК направляет связанный белок Cas на конкретную нуклеотидную последовательность в пределах целевой ДНК посредством нацеливающего на ДНК сегмента.

[00148] Единые гидовые РНК содержат нацеливающий на ДНК сегмент и каркасную последовательность (т.е. связывающую белок или связывающую Cas последовательность гидовой РНК). Например, такие гидовые РНК содержат 5' нацеливающий на ДНК сегмент и 3' каркасную последовательность. Иллюстративные каркасные последовательности содержат, состоят по существу или состоят из следующего: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAA AAGUGGCACCGAGUCGGUGCU (версия 1; SEQ ID NO: 27); GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAAC UUGAAAAAGUGGCACCGAGUCGGUGC (версия 2; SEQ ID NO: 6); GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAA AAGUGGCACCGAGUCGGUGC (версия 3; SEQ ID NO: 7); и GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAU CAACUUGAAAAAGUGGCACCGAGUCGGUGC (версия 4; SEQ ID NO: 8). Гидовые РНК, нацеливающиеся на любую целевую последовательность для гидовой РНК, могут включать в себя, например, нацеливающий на ДНК сегмент на 5' конце гидовой РНК, слитый с любой из иллюстративных каркасных последовательностей гидовой РНК на 3' конце гидовой РНК. Иными словами, любой из нацеливающих на ДНК сегментов, раскрытых в настоящем документе, может быть соединен с 5' концом любой из SEQ ID NO: 27, 6, 7 или 8 с образованием единой гидовой РНК (химерной гидовой РНК). Версии 1, 2, 3 и 4 гидовой РНК, как раскрыто в другом месте в настоящем документе, носят название нацеливающие на ДНК сегменты, соединенные с каркасными версиями 1, 2, 3 и 4 соответственно.

[00149] Гидовые РНК могут включать в себя модификации или последовательности, которые обеспечивают дополнительные требуемые признаки (например, модифицированная или отрегулированная стабильность; субклеточное нацеливание; отслеживание с помощью флуоресцентной метки; сайт связывания для белка или белкового комплекса; и тому подобное). Примеры таких модификаций включают в себя, например, следующее: 5' кэп (например, 7-метилгуанилатный кэп (m7G)); 3' полиаденилированный хвост (т.е. а 3' поли(А)-хвост); последовательность РНК-переключателя (например, для обеспечения регулируемой стабильности и/или регулируемой доступности белков и/или белковых комплексов); последовательность контроля стабильности; последовательность, которая образует дцРНК дуплекс (т.е. шпилька); модификация или последовательность, которая направляет РНК в субклеточное местоположение (например, ядро, митохондрии, хлоропласты и тому подобное); модификация или последовательность, которая обеспечивает отслеживание (например, прямое конъюгирование с флуоресцентной молекулой, конъюгирование с фрагментом, который облегчает детектирование флуоресценции, последовательность, которая обеспечивает возможность детектирования флуоресценции и т.д.); модификация или последовательность, которая обеспечивает сайт связывания для белков (например, белков, которые действуют на ДНК, включая в себя ДНК-метилтрансферазы, ДНК-деметилазы, гистонацетилтрансферазы, гистондеацетилазы и тому подобное); и их комбинации. Другие примеры модификаций включают в себя сконструированные дуплексные структуры «петля-на-стебле», сконструированные области выпетливания, сконструированные шпильки 3' дуплексной структуры «петля-на-стебле» или любую их комбинацию. См., например, US 2015/0376586, полностью включенную в настоящий документ посредством ссылки для всех целей. Выпетливание может представлять собой неспаренную областью нуклеотидов в дуплексе, состоящей из crPHK-подобной области и минимальной tracrPHK-подобной области. Выпетливание может содержать на одной стороне дуплекса неспаренный 5'-XXXY-3', где X представляет собой любой пурин, a Y может представлять собой нуклеотид, который может образовывать неоднозначную пару с нуклеотидом на противоположной цепи, и неспаренную нуклеотидную область на другой стороне дуплекса

[00150] Немодифицированные нуклеиновые кислоты могут быть склонны к деградации. Экзогенные нуклеиновые кислоты также могут индуцировать врожденный иммунный ответ. Модификации могут помочь ввести стабильность и уменьшить иммуногенность. Гидовые РНК могут содержать модифицированные нуклеозиды и модифицированные нуклеотиды, включая в себя, например, один или несколько из следующего: (1) изменение или замена одного или обоих несвязывающих фосфатных кислородов и/или одного или нескольких связывающих фосфатных кислородов в фосфодиэфирной связи остова; (2) изменение или замена компонента рибозного сахара, например, изменение или замена 2' гидроксила на рибозном сахаре; (3) замена фосфатного фрагмента на дефосфолинкеры; (4) модификация или замена встречающегося в природе нуклеинового основания; (5) замена или модификация рибозофосфатного остова; (6) модификация 3' конца или 5' конца олигонуклеотида (например, удаление, модификация или замена концевой фосфатной группы или конъюгирование фрагмента); и (7) модификация сахара. Другие возможные модификации гидовой РНК включают в себя модификации или замену урацилов или полиурациловых путей. См., например, международную патентную публикацию WO 2015/048577 и US 2016/0237455, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Подобные модификации могут быть внесены в кодирующие Cas нуклеиновые кислоты, такие как мРНК Cas.

[00151] В качестве одного примера нуклеотиды на 5' или 3' конце гидовой РНК могут включать в себя фосфоротиоатные связи (например, основания могут содержать модифицированную фосфатную группу, которая является фосфоротиоатной группой). Например, гидовая РНК может включать в себя фосфоротиоатные связи между 2, 3 или 4 концевыми нуклеотидами на 5' или 3' конце гидовой РНК. В качестве другого примера нуклеотиды на 5' и/или 3' конце гидовой РНК могут содержать 2'-O-метильные модификации. Например, гидовая РНК может включать в себя 2'-O-метильные модификации на 2, 3 или 4 концевых нуклеотидах на 5' и/или 3' конце гидовой РНК (например, на 5' конце). См., например, WO 2017/173054 А1 и Finn et al. (2018) Cell Reports 22:1-9, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. В одном конкретном примере гидовая РНК содержит 2'-O-метильные аналоги и 3'-фосфоротиоатные межнуклеотидные связи на первых трех 5' и 3' концевых остатках РНК. В другом конкретном примере гидовая РНК модифицирована таким образом, что все группы 2'ОН, которые не взаимодействуют с белком Cas9, заменены 2'-O-метильными аналогами, а хвостовая область гидовой РНК, которая характеризуется минимальным взаимодействием с Cas9, модифицирована 5' и 3' фосфоротиоатными межнуклеотидными связями. См., например, Yin et al. (2017) Nat. Biotech. 3 5 (12): 1179-1187, полностью включенный в настоящий документ посредством ссылки для всех целей.

[00152] Гидовые РНК могут быть предусмотрены в любой форме. Например, гРНК может быть предусмотрена в форме РНК, либо в виде двух молекул (отдельная сrРНК и tracrPHK), либо в виде одной молекулы (sgPHK) и необязательно в форме комплекса с белком Cas. гРНК также может быть предусмотрена в форме ДНК, кодирующей гРНК. ДНК, кодирующая гРНК, может кодировать одну молекулу РНК (sgPHK) или отдельные молекулы РНК (например, отдельные сrРНК и tracrPHK). В последнем случае ДНК, кодирующая гРНК, может быть предусмотрена в виде одной молекулы ДНК или в виде отдельных молекул ДНК, кодирующих сrРНК и tracrPHK, соответственно.

[00153] Когда гРНК предусмотрена в форме ДНК, гРНК может транзиентно, условно или конститутивно экспрессироваться в клетке. ДНК, кодирующие гРНК, могут быть стабильно интегрированы в геном клетки и функционально связаны с активным в клетке промотором. Альтернативно, ДНК, кодирующие гРНК, могут быть функционально связаны с промотором в экспрессионного конструкта. Например, ДНК, кодирующая гРНК, может находиться в векторе, содержащем гетерологичную нуклеиновую кислоту, такую как нуклеиновая кислота, кодирующая белок Cas. Альтернативно, это может быть вектор или плазмида, которая отделена от вектора, содержащего нуклеиновую кислоту, кодирующую белок Cas. Промоторы, которые можно использовать в таких экспрессионных конструктах, включают в себя промоторы, активные, например, в одной или нескольких из следующего: эукариотическая клетка, клетка человека, не относящаяся к человеку клетка, клетка млекопитающего, клетка млекопитающего, не являющегося человеком, клетка грызуна, клетка крысы, клетка хомяка, клетка кролика, плюрипотентная клетка, эмбриональная клетка стволовая (ES) клетка, стволовая клетка взрослого человека, клетка-предшественник, ограниченная стадией развития, индуцированная плюрипотентная стволовая клетка (iPS) или эмбрион на стадии одной клетки. Такими промоторами могут являться, например, условные промоторы, индуцируемые промоторы, конститутивные промоторы или тканеспецифические промоторы. Такими промоторами также могут являться, например, двунаправленные промоторы. Конкретные примеры подходящих промоторов включают в себя промотор РНК-полимеразы III, такой как промотор U6 человека, промотор U6-полимеразы III крысы или промотор U6-полимеразы III мыши.

[00154] Альтернативно, гРНК можно получить различными другими способами. Например, гРНК можно получить путем транскрипции in vitro с использованием, например, РНК-полимеразы Т7 (см., например, международные патентные публикации WO 2014/089290 и WO 2014/065596, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей). Гидовые РНК также могут представлять собой синтетически полученную молекулу, полученную химическим синтезом.

(4) Последовательности распознавания гидовой РНК и целевые последовательности для гидовой РНК

[00155] Термин «последовательность распознавания гидовой РНК» включает в себя последовательности нуклеиновой кислоты, присутствующие в целевой ДНК, с которой будет связываться с нацеливающим на ДНК сегментом гРНК, при условии наличия достаточных условий для связывания. Используемый в настоящем документе термин «последовательность распознавания гидовой РНК» охватывает обе цепи двухцепочечной целевой ДНК (т.е. последовательность на комплементарной цепи, с которой гибридизуется гидовая РНК, и соответствующую последовательность на некомплементарной цепи, смежную с мотивом, прилегающим к протоспейсеру (РАМ)). Используемый в настоящем документе термин «целевая последовательность для гидовой РНК» относится, в частности, к последовательности на некомплементарной цепи, смежной с РАМ (т.е. выше или 5' от РАМ). То есть целевая последовательность для гидовой РНК относится к последовательности на некомплементарной цепи, соответствующей последовательности, с которой гидовая РНК гибридизуется на комплементарной цепи. Целевая последовательность для гидовой РНК эквивалентна нацеливающему на ДНК сегменту гидовой РНК, но с тиминами вместо урацилов. В качестве одного примера, целевая последовательность для гидовой РНК для фермента Cas9 может относиться к последовательности на некомплементарной цепи, смежной с 5'-NGG-3' РАМ. Последовательности распознавания гидовой РНК включают в себя последовательности, к которым гидовая РНК предназначена обеспечивать комплементарность, где гибридизация между комплементарной цепью последовательности распознавания гидовой РНК и нацеливающей на ДНК последовательностью гидовой РНК способствует образованию комплекса CRISPR. Полная комплементарность не обязательно необходима при условии, что существует достаточная комплементарность, чтобы вызвать гибридизацию и способствовать образованию комплекса CRISPR. Последовательности распознавания гидовой РНК или целевые последовательности для гидовой РНК также включают в себя сайты расщепления для белков Cas, более подробно описанные ниже. Последовательность распознавания гидовой РНК или целевые последовательности для гидовой РНК могут содержать любой полинуклеотид, который может быть расположен, например, в ядре или цитоплазме клетки или в органелле клетки, такой как митохондрия или хлоропласт.

[00156] На последовательность распознавания гидовой РНК в целевой ДНК может быть нацелен (т.е. связан, или может гибридизоваться, или являться комплементарным) белок Cas или гРНК. Подходящие условия связывания ДНК/РНК включают в себя физиологические условия, обычно присутствующие в клетке. Другие подходящие условия связывания ДНК/РНК (например, условия в бесклеточной системе) являются известными (см., например, Molecular Cloning: A Laboratory Manual, 3-е изд. (Sambrook et al., Harbor Laboratory Press 2001), полностью включенный в настоящий документ посредством ссылки для любых целей). Цепь целевой ДНК, которая комплементарна и гибридизуется с белком Cas или гРНК, можно назвать «комплементарной цепью», а цепь целевой ДНК, которая комплементарна «комплементарной цепи» (и, следовательно, не комплементарна белок Cas или гРНК) можно назвать «некомплементарной цепью» или «матричной цепью».

[00157] Белок Cas может расщеплять нуклеиновую кислоту на сайте в пределах или за пределами последовательности нуклеиновой кислоты, присутствующей в целевой ДНК, с которой будет связываться нацеливающий на ДНК сегмент гРНК. «Сайт расщепления» включает в себя положение нуклеиновой кислоты, в котором белок Cas вызывает одноцепочечный разрыв или двухцепочечный разрыв. Например, образование комплекса CRISPR (содержащего гРНК, гибридизованную с комплементарной цепью последовательности распознавания гидовой РНК и образовавшей комплекс с белком Cas), может привести к расщеплению одной или обеих цепей в или вблизи (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований из) последовательности нуклеиновой кислоты, присутствующей в целевой ДНК, с которой будет связываться с нацеливающим на ДНК сегментом гРНК. Если сайт расщепления находится за пределами последовательности нуклеиновой кислоты, с которой будет связываться нацеливающий на ДНК сегмент гРНК, сайт расщепления по-прежнему считается находящимся в «последовательности распознавания гидовой РНК» или целевой последовательности для гидовой РНК. Сайт расщепления может находиться только на одной цепи или на обеих цепях нуклеиновой кислоты. Сайты расщепления могут находиться в одном и том же положении на обеих цепях нуклеиновой кислоты (создавая тупые концы) или могут быть в разных сайтах на каждой цепи (создавая ступенчатые концы (т.е. свисающие концы)). Ступенчатые концы могут быть получены, например, с использованием двух белков Cas, каждый из которых вызывает одноцепочечный разрыв в другом сайте расщепления на другой цепи, тем самым создавая двухцепочечный разрыв. Например, первая никаза может создавать одноцепочечный разрыв на первой цепи двухцепочечной ДНК (дцДНК), а вторая никаза может создавать одноцепочечный разрыв на второй цепи дцДНК, так что создаются свисающие последовательности. В некоторых случаях последовательность распознавания гидовой РНК или целевая последовательность для гидовой РНК никазы на первой цепи отделена от последовательности распознавания гидовой РНК или целевой последовательности для гидовой РНК никазы на второй цепи по меньшей мере 2, 3, 4 г. 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 или 1000 парами оснований.

[00158] Сайт-специфическое связывание и/или расщепление целевой ДНК белками Cas может происходить в местах, определяемых как (i) комплементарностью спаривания оснований между гРНК и целевой ДНК, так и (ii) коротким мотивом, называемым мотив, прилегающий к протоспейсеру (РАМ), в целевой ДНК. РАМ может фланкировать целевую последовательность для гидовой РНК на некомплементарной цепи, противоположной цепи, с которой гибридизуется гидовая РНК. Необязательно, целевая последовательность для гидовой РНК может быть фланкирована на 3' конце РАМ. Альтернативно, целевая последовательность для гидовой РНК может быть фланкирована на 5' конце РАМ. Например, сайт расщепления белков Cas может составлять от приблизительно 1 до приблизительно 10 или от приблизительно 2 до приблизительно 5 пар оснований (например, 3 пары оснований) выше или ниже последовательности РАМ. В некоторых случаях (например, когда используют Cas9 из S. pyogenes или близкородственный Cas9), последовательность РАМ некомплементарной цепи может представлять собой 5'-NiGG-3', где Ni является любым нуклеотидом ДНК и расположен непосредственно 3' от последовательности распознавания гидовой РНК некомплементарной цепи целевой ДНК (т.е. непосредственно 3' от целевой последовательности для гидовой РНК). Таким образом, последовательность РАМ комплементарной цепи будет представлять собой 5'-CCN2-3', где N2 представляет собой любой нуклеотид ДНК и находится непосредственно 5' от последовательности распознавания гидовой РНК комплементарной цепи целевой ДНК. В некоторых таких случаях N1 и N2 могут являться комплементарными, и пара оснований N1-N2 может быть любой парой оснований (например, N1=C и N2=G; N1=G и N2=C; N1=A и N2=T; или N1=T и N2=А). В случае Cas9 из S. aureus РАМ может представлять собой NNGRRT или NNGRR, где N может представлять собой A, G, С или Т, a R может представлять собой G или А. В случае Cas9 из С. jejuni РАМ может представлять собой, например, NNNNACAC или NNNNRYAC, где N может представлять собой A, G, С или Т, a R может представлять собой G или А. В некоторых случаях (например, для FnCpf1) последовательность РАМ может находиться выше от 5' конца и характеризоваться последовательностью 5'-TTN-3'.

[00159] Примеры целевых последовательностей для гидовой РНК или целевых последовательностей для гидовой РНК в дополнение к последовательности РАМ представлены ниже. Например, целевая последовательность для гидовой РНК может представлять собой 20-нуклеотидную последовательность ДНК, непосредственно предшествующую мотиву NGG, распознаваемому белком Cas9. Примерами таких целевых последовательностей гидовой РНК вместе с последовательностью РАМ являются GN19NGG (SEQ ID NO: 9) или N20NGG (SEQ ID NO: 10). См., например, международную патентную публикацию WO 2014/165825, полностью включенную посредством ссылки для всех целей. Гуанин на 5' конце может облегчать транскрипцию РНК-полимеразой в клетках. Другие примеры целевых последовательностей для гидовой РНК вместе с последовательностью РАМ могут включать в себя два гуаниновых нуклеотида на 5' конце (например, GGN20NGG; SEQ ID NO: 11) для облегчения эффективной транскрипции с помощью Т7-полимеразы in vitro. См., например, международную патентную публикацию WO 2014/065596, полностью включенную посредством ссылки для всех целей. Другие целевые последовательности для гидовой РНК вместе с последовательностью РАМ могут содержать от 4 до 22 нуклеотидов в длину согласно SEQ ID NO: 9-11, включая в себя 5' G или GG и 3' GG или NGG. Еще одна целевая последовательность для гидовой РНК может содержать от 14 до 20 нуклеотидов в длину согласно SEQ ID NO: 9-11.

[00160] Последовательность распознавания гидовой РНК или целевая последовательность для гидовой РНК могут представлять собой любую последовательностью нуклеиновой кислоты, эндогенную или экзогенную для клетки. Последовательность распознавания гидовой РНК или целевая последовательность для гидовой РНК могут представлять собой последовательность, кодирующую продукт гена (например, белок), или некодирующую последовательность (например, регуляторную последовательность) или могут включать в себя обе.

В. Клетки и не являющиеся человеком животные, содержащие экспрессионные кассеты Cas

[00161] Кроме того, предусмотрены клетки и не являющиеся человеком животные, содержащие экспрессионные кассеты Cas, описанные в настоящем документе. Экспрессионная кассета Cas может быть стабильно интегрирована в геном (т.е. в хромосому) клетки или не являющегося человеком животного, или она может быть расположена вне хромосомы (например, внехромосомно реплицирующейся ДНК). Необязательно, экспрессионная кассета Cas стабильно интегрируется в геном. Стабильно интегрированная экспрессионная кассета Cas может быть случайным образом интегрирована в геном животного, не являющегося человеком (т.е. трансгенного), или она может быть интегрирована в предварительно определенную область генома животного, не являющегося человеком (т.е. нокин). Необязательно, экспрессионная кассета Cas стабильно интегрируется в предварительно определенную область генома, такую как локус «безопасная гавань». Целевой геномный локус, в котором стабильно интегрирована экспрессионная кассета Cas, может быть гетерозиготным по экспрессионной кассете Cas или гомозиготным по экспрессионной кассете Cas. Диплоидный организм имеет два аллеля в каждом генетическом локусе. Каждая пара аллелей представляет генотип определенного генетического локуса. Генотипы описаны как гомозиготные, если в конкретном локусе есть присутствуют идентичных аллеля, и как гетерозиготные, если два аллеля различаются.

[00162] Клетки, предусмотренные в настоящем документе, могут представлять собой, например, эукариотические клетки, которые включают в себя, например, клетки грибов (например, дрожжи), клетки растений, клетки животных, клетки млекопитающих, клетки млекопитающих, не являющихся человеком, и клетки человека. Термин «животное» включает в себя млекопитающих, рыб и птиц. Клеткой млекопитающего может являться, например, клетка млекопитающего, не являющегося человеком, клетка человека, клетка грызуна, клетка крысы, клетка мыши или клетка хомяка. Другие млекопитающие, не являющиеся человеком, включают в себя, например, не являющихся человеком приматов, низших обезьян, человекообразных обезьян, кошек, собак, кроликов, лошадей, быков, оленей, бизонов, домашний скот (например, виды крупного рогатого скота, такие как коровы, быки и т.д.; виды овечьих, такие как овцы, козы и т.д.; и виды свинообразных, такие как свиньи и кабаны). Птицы включают в себя, например, кур, индеек, страусов, гусей, уток и так далее. Домашние животные и сельскохозяйственные животные также предусмотрены. Термин «не являющийся человеком» исключает людей.

[00163] Клетки также могут находиться в недифференцированном или дифференцированном состоянии любого типа. Например, клетка может представлять собой тотипотентную клетку, плюрипотентную клетку (например, плюрипотентную клетку человека или плюрипотентную клетку, не относящуюся к человеку, такую как эмбриональная стволовая клетка мыши (ES) или ES клетка крысы), или не плюрипотентную клетку. Тотипотентные клетки включают в себя недифференцированные клетки, которые могут давать клетки любого типа, а плюрипотентные клетки включают в себя недифференцированные клетки, которые обладают способностью развиваться в более чем один тип дифференцированных клеток. Такими плюрипотентными и/или тотипотентными клетками могут являться, например, ES клетки или ES-подобные клетки, такие как индуцированные плюрипотентные стволовые (iPS) клетки. ES клетки включают в себя происходящие из эмбриона тотипотентные или плюрипотентные клетки, которые способны вносить вклад в любую ткань развивающегося эмбриона при введении в эмбрион. ЭС клетки могут быть получены из внутренней клеточной массы бластоцисты и способны дифференцироваться в клетки любого из трех зародышевых слоев позвоночных (энтодерма, эктодерма и мезодерма).

[00164] Примеры плюрипотентных клеток человека включают в себя ES клетки человека, взрослые стволовые клетки человека, ограниченные стадией развития человеческие клетки-предшественники и индуцированные плюрипотентные стволовые (iPS) клетки человека, такие как примированные iPS-клетки человека и наивные iPS-клетки человека. Индуцированные плюрипотентные стволовые клетки включают в себя плюрипотентные стволовые клетки, которые могут быть получены непосредственно из дифференцированной взрослой клетки. Клетки iPS человека могут быть получены путем введения в клетку специфических наборов факторов перепрограммирования, которые могут включать в себя, например, Oct3/4, факторы транскрипции семейства Sox (например, Sox1, Sox2, Sox3, Sox15), факторы транскрипции семейства Мус (например, с-Мус, 1-Мус, п-Мус), факторы транскрипции Krüppel-подобного семейства (KLF) (например, KLF1, KLF2, KLF4, KLF5) и/или родственные факторы транскрипции, такие как NANOG, LIN28 и/или Glis1. iPS клетки человека также могут быть получены, например, путем использования микроРНК, небольших молекул, которые имитируют действие факторов транскрипции или спецификаторов происхождения. iPS клетки человека характеризуются своей способностью дифференцироваться в любую клетку из трех зародышевых слоев позвоночных, например, энтодерму, эктодерму или мезодерму. iPS клетки человека также характеризуются своей способностью размножаться неограниченное время в подходящих условиях культивирования in vitro. См., например, Takahashi and Yamanaka (2006) Cell 126: 663-676, полностью включенный в настоящий документ посредством ссылки для всех целей. Примированные ES клетки человека и примированные iPS клетки человека включают в себя клетки, которые проявляют характеристики, сходные с характеристиками эпибластных клеток после имплантации, и предназначены для спецификации и дифференциации клонов. Наивные ES клетки человека и наивные iPS клетки человека включают в себя клетки, которые проявляют характеристики, сходные с характеристиками ES клеток внутренней клеточной массы предимплантационного эмбриона, и не являются обязательными для характеристики линии. См., например, Nichols and Smith (2009) Cell Stem Cell 4:487-492, полностью включенный в настоящий документ посредством ссылки для всех целей.

[00165] Клетки, предусмотренные в настоящем документе, также могут представлять собой половые клетки (например, сперматозоиды или ооциты). Клетки могут быть митотически компетентными клетками или митотически неактивными клетками, мейотически компетентными клетками или мейотически неактивными клетками. Аналогично, клетки также могут являться первичными соматическими клетками или клетками, которые не являются первичными соматическими клетками. Соматические клетки включают в себя любую клетку, которая не является гаметой, зародышевой клеткой, гаметоцитом или недифференцированной стволовой клеткой. Например, клетки могут представлять собой клетки печени, почек, кроветворные клетки, эндотелиальные клетки, эпителиальные клетки, фибробласты, мезенхимные клетки, кератиноциты, клетки крови, меланоциты, моноциты, мононуклеарные клетки, моноцитарные предшественники, В-клетки, эритроидно-мегакариоцитарные клетки, эозинофилы, макрофаги, Т-клетки, островковые бета-клетки, экзокринные клетки, панкреатические предшественники, эндокринные предшественники, адипоциты, преадипоциты, нейроны, глиальные клетки, нервные стволовые клетки, нейроны, гепатобласты, гепатоциты, кардиомиоциты, скелетные миобласты, клетки гладких мышц, протоковые клетки, ацинарные клетки, альфа-клетки, бета-клетки, дельта-клетки, РР-клетки, холангиоциты, белые или коричневые адипоциты или клетки глаза (например, клетки трабекулярной сети, пигментные эпителиальные клетки сетчатки, микрососудистые эндотелиальные клетки сетчатки, перициты сетчатки, эпителиальные клетки конъюнктивы, фибробласты конъюнктивы, эпителиальные клетки пигмента радужки, кератоциты, эпителиальные клетки хрусталика, непигментные цилиарные эпителиальные клетки, фибробласты глазной сосудистой оболочки, фоторецепторные клетки, ганглиозные клетки, биполярные клетки, горизонтальные клетки или амакринные клетки).

[00166] Подходящие клетки, предусмотренные в настоящем документе, также включают в себя первичные клетки. Первичные клетки включают в себя клетки или культуры клеток, которые были выделены непосредственно из организма, органа или ткани. Первичные клетки включают в себя клетки, которые не являются ни трансформированными, ни бессмертными. Они включают в себя любую клетку, полученную из организма, органа или ткани, которая ранее не была перенесена в культуру ткани или ранее была перенесена в культуру ткани, но не способна бесконечно переноситься в культуру ткани. Такие клетки могут быть выделены с помощью общепринятых техник и включают в себя, например, соматические клетки, кроветворные клетки, эндотелиальные клетки, эпителиальные клетки, фибробласты, мезенхимные клетки, кератиноциты, меланоциты, моноциты, мононуклеарные клетки, адипоциты, преадипоциты, нейроны, глиальные клетки, гепатоциты, скелетные миобласты и гладкомышечные клетки. Например, первичные клетки могут быть получены из соединительных тканей, мышечных тканей, тканей нервной системы или эпителиальных тканей.

[00167] Другие подходящие клетки, предусмотренные в настоящем документе, включают в себя иммортализованные клетки. К иммортализованным клеткам относятся клетки многоклеточного организма, которые в норме не размножаются бесконечно долго, но из-за мутации или изменения избежали нормального клеточного старения и вместо этого могут продолжать подвергаться делению. Такие мутации или изменения могут происходить естественным путем или быть преднамеренно вызванными. Примеры иммортализованных клеток включают в себя клетки яичника китайского хомячка (СНО), клетки эмбриональной почки человека (например, клетки НЕК 293 или клетки 293Т) и мышиные эмбриональные фибробласты (например, клетки 3Т3). Многочисленные типы иммортализованных клеток хорошо известны. Бессмертные или первичные клетки включают в себя клетки, которые, как правило, используют для культивирования или для экспрессии рекомбинантных генов или белков.

[00168] Клетки, предусмотренные в настоящем документе, также включают в себя эмбрионы на стадии одной клетки (т.е. оплодотворенные ооциты или зиготы). Такие одноклеточные эмбрионы могут происходить из любого генетического фона (например, BALB/c, C57BL/6, 129 или их комбинации для мышей), могут являться свежими или замороженными и могут быть получены в результате естественного разведения или оплодотворения in vitro.

[00169] Клетки, предусмотренные в настоящем документе, могут являться нормальными, здоровыми клетками или могут являться патологическими или содержащими мутации клетками.

[00170] Не являющиеся человеком животные, содержащие экспрессионную кассету Cas, как описано в настоящем документе, могут быть получены с помощью способов, описанных в другом месте в настоящем документе. Термин «животное» включает в себя млекопитающих, рыб и птиц. Млекопитающие включают в себя, например, людей, не являющихся человеком приматов, низших обезьян, человекообразных обезьян, кошек, собак, кроликов, лошадей, быков, оленей, бизонов, овец, кроликов, грызунов (например, мышей, крыс, хомяков и морских свинок) и домашний скот (например, виды крупного рогатого скота, такие как коровы и быки; виды овечьих, такие как овцы и козы; и виды свинообразных, такие как свиньи и кабаны). Птицы включают в себя, например, кур, индеек, страусов, гусей и уток. Домашние животные и сельскохозяйственные животные также предусмотрены. Термин «не являющийся человеком» исключает людей. Предпочтительные не являющиеся человеком животные включают в себя, например, грызунов, таких как мыши и крысы.

[00171] Не являющиеся человеком животные могут быть любого генетического происхождения. Например, подходящими мышами могут являться линия 129, линия C57BL/6, смесь 129 и C57BL/6, линия BALB/c или линия Swiss Webster. Примеры линий 129 включают в себя 129Р1, 129Р2, 129РЗ, 129X1, 129S1 (например, 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129Т1 и 129Т2. См., например, Festing et al. (1999)Mammalian Genome 10:836, полностью включенный в настоящий документ посредством ссылки для всех целей. Примеры линий C57BL включают в себя C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr и C57BL/01a. Подходящие мыши также могут быть из смеси вышеупомянутой линии 129 и вышеупомянутой линии C57BL/6 (например, 50% 129 и 50% C57BL/6). Аналогично, подходящие мыши могут быть из смеси вышеупомянутых линий 129 или смеси вышеупомянутых линий BL/6 (например, линия 129S6 (129/SvEvTac)).

[00172] Аналогичным образом, крысы могут быть из любой линии крыс, включая в себя, например, линию крыс ACI, линию крыс Dark Agouti (DA), линию крыс Wistar, линию крыс LEA, линию крыс Sprague Dawley (SD) или линию крыс Fischer, такой как Fisher F344 или Fisher F6. Крысы также могут быть получены из линии, полученного из смеси двух или более линий, указанных выше. Например, подходящая крыса может быть из линии DA или линии ACI. Линия крыс ACI характеризуется тем, что имеет окрас шерсти «черный агути», белый живот и лапы и гаплотип RT1av1. Такие линии доступны из различных источников, включая в себя Harlan Laboratories. Линия крыс Dark Agouti (DA) характеризуется тем, что имеет окрас шерсти «агути» и гаплотип RT1av1. Такие крысы доступны из различных источников, включая в себя Charles River и Harlan Laboratories. В некоторых случаях подходящими крысами могут являться инбредные крысы. См., например, US 2014/0235933, которая полностью включена в настоящий документ посредством ссылки для всех целей.

С. Целевые геномные локусы

[00173] Описанные в настоящем документе экспрессионные кассеты Cas могут являться геномно интегрированными в целевой геномный локус в клетке или организме не являющегося человеком животного. Можно использовать любой целевой геномный локус, способный экспрессировать ген.

[00174] Примером целевого геномного локуса, в который могут стабильно интегрироваться экспрессионные кассеты Cas, описанные в настоящем документе, является локус «безопасная гавань» в геноме не являющегося человеком животного. Взаимодействия между интегрированной экзогенной ДНК и геномом хозяина могут ограничивать надежность и безопасность интеграции и могут приводить к явным фенотипическим эффектам, которые не обусловлены целевой генетической модификацией, а вместо этого обусловлены непреднамеренными эффектами интеграции на окружающие эндогенные гены. Например, случайно вставленные трансгены могут подвергаться эффектам положения и сайленсингу, что делает их экспрессию ненадежной и непредсказуемой. Аналогично, интеграция экзогенной ДНК в хромосомный локус может влиять на окружающие эндогенные гены и хроматин, тем самым изменяя поведение и фенотипы клеток. Локусы «безопасная гавань» включают в себя хромосомные локусы, где трансгены или другие экзогенные вставки нуклеиновой кислоты могут стабильно и надежно экспрессироваться во всех представляющих интерес тканях без явного изменения поведения или фенотипа клетки (т.е. без каких-либо вредных воздействий на клетку-хозяина). См., например, Sadelain et al. (2012) Nat. Rev. Cancer 12:51-58, полностью включенный в настоящий документ посредством ссылки для всех целей. Необязательно, локусом «безопасная гавань» является тот, в котором экспрессия вставленной последовательности гена не нарушается какой-либо сквозной экспрессией от соседних генов. Например, локусы «безопасная гавань» могут включать в себя хромосомные локусы, где экзогенная ДНК может интегрироваться и функционировать предсказуемым образом, не оказывая неблагоприятного влияния на структуру или экспрессию эндогенных генов. Локусы «безопасная гавань» могут включать в себя экстрагенные области или интрагенные области, такие как, например, локусы в генах, которые не являются необходимыми, необязательными или могут быть нарушены без явных фенотипических последствий.

[00175] Например, локус Rosa26 и его эквивалент у человека обеспечивают открытую конфигурацию хроматина во всех тканях и повсеместно экспрессируется во время эмбрионального развития и у взрослых. См., например, Zambrowicz et al. (1997) Proc. Natl. Acad. Sci. USA 94:3789-3794, полностью включенный в настоящий документ посредством ссылки для всех целей. Кроме того, локус Rosa26 может подвергаться нацеленному воздействию с высокой эффективностью, и разрушение гена Rosa26 не дает явного фенотипа. Другие примеры локусов «безопасная гавань» включают в себя CCR5, HPRT, AAVS1 и альбумин. См., например, патенты США №№7888121; 7972854; 7914796; 7951925; 8110379; 8409861; 8586526; и патентные публикации США №№2003/0232410; 2005/0208489; 2005/0026157; 2006/0063231; 2008/0159996; 2010/00218264; 2012/0017290; 2011/0265198; 2013/0137104; 2013/0122591; 2013/0177983; 2013/0177960 и 2013/0122591, причем каждый документ полностью включен в настоящий документ посредством ссылки для всех целей. Двуаллельное нацеливание на локусы «безопасная гавань», такие как локус Rosa26, не имеет отрицательных последствий, поэтому разные гены или репортеры могут быть нацелены на два аллеля Rosa26. В одном примере экспрессионная кассета Cas интегрирована в интрон локуса Rosa26, такой как первый интрон локуса Rosa26.

D. Не являющиеся человеком животные, у которых вырезание участка ДНК осуществляется рекомбиназой

[00176] Клетки или не являющиеся человеком животные, содержащие экспрессионную кассету Cas, содержащую последовательность, кодирующую Cas, ниже от сигнала полиаденилирования или терминатора транскрипции, фланкированную сайтами распознавания рекомбиназы, распознаваемыми сайт-специфической рекомбиназой, как раскрыто в настоящем документе, могут дополнительно содержать экспрессионную кассету рекомбиназы, которая управляет экспрессией сайт-специфической рекомбиназы. Сайт-специфические рекомбиназы включают в себя ферменты, которые могут способствовать рекомбинации между сайтами распознавания рекомбиназы, где два сайта рекомбинации физически разделены в одной нуклеиновой кислоте или в отдельных нуклеиновых кислотах. Примеры рекомбиназ включают в себя рекомбиназы Cre, Flp и Dre. Одним примером гена Cre-рекомбиназы является Crei, в котором два экзона, кодирующие Cre-рекомбиназу, разделены интроном, чтобы предотвратить его экспрессию в прокариотической клетке. Такие рекомбиназы могут дополнительно содержать сигнал ядерной локализации для облегчения локализации в ядре (например, NLS-Crei). Сайты распознавания рекомбиназы включают в себя нуклеотидные последовательности, которые распознаются сайт-специфической рекомбиназой и могут служить в качестве субстрата для события рекомбинации. Примеры сайтов распознавания рекомбиназы включают в себя FRT, FRT11, FRT71, attp, att, rox и сайты lox, такие как loxP, lox511, lox2272, lox66, lox71, loxM2 и lox5171.

[00177] Экспрессионная кассета Cas и экспрессионная кассета рекомбиназы могут быть интегрированы в разные целевые геномные локусы, или они могут быть геномно интегрированы в один и тот же целевой локус (например, локус Rosa26, например, интегрированы в первый интрон локуса Rosa26). Например, клетка или не являющееся человеком животное могут являться гетерозиготными по каждой из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы, причем один аллель целевого геномного локуса содержит экспрессионную кассету Cas, а второй аллель целевого геномного локуса содержит экспрессионную кассету рекомбиназы.

[00178] Ген рекомбиназы в экспрессионной кассете рекомбиназы может быть функционально связан с любым подходящим промотором. Примеры промоторов раскрыты в другом месте в настоящем документе. Например, промотор может являться тканеспецифическим промотором (например, промотор альбумина для специфической для печени экспрессии или промотор инсулина 2 для специфической для поджелудочной железы экспрессии) или специфическим для стадии развития промотором. Преимущество, обеспечиваемое такими промоторами, состоит в том, что экспрессия Cas может активироваться избирательно в требуемой ткани или только на требуемой стадии развития, тем самым уменьшая возможность опосредованной Cas токсичности in vivo. Неограничивающий список иллюстративных промоторов для линий мышей, у которых вырезание участка ДНК осуществляется рекомбиназой, представлен в таблице 2.

[00179]

III. Способы оценки активности CRISPR/Cas in vivo

[00180] Предусмотрены различные способы оценки доставки CRISPR/Cas в ткани и органы живого животного и оценки активности CRISPR/Cas в тканях и органах живого животного. Согласно таким способам используют не являющихся человеком животных, содержащих экспрессионную кассету Cas, как описано в другом месте в настоящем документе.

А. Способы испытания способности CRISPR/Cas модифицировать целевой геномный локус in vivo или ex vivo

[00181] Предусмотрены различные способы оценки способности никазы или CRISPR/Cas-нуклеазы модифицировать целевой геномный локус in vivo с использованием не являющихся человеком животных, содержащих экспрессионную кассету Cas, как описано в настоящем документе. Такие способы могут предусматривать следующее: (а) введение не являющемуся человеком животному гидовой РНК, предназначенной для нацеливания на целевую последовательность для гидовой РНК в целевом геномном локусе; и (b) оценка модификации целевого локуса. Модификация целевого геномного локуса будет индуцирована, когда гидовая РНК образует комплекс с белком Cas и направит белок Cas к целевому геномному локусу, и комплекс Cas/гидовая РНК расщепит целевую последовательность для гидовой РНК, запуская репарацию клеткой (например, посредством негомологичного соединения концов (NHEJ), если отсутствует донорная последовательность).

[00182] Необязательно можно вводить две или больше гидовых РНК, причем каждая предназначена для нацеливания на разную целевую последовательность для гидовой РНК в пределах целевого геномного локуса. Например, две гидовые РНК могут быть предназначены для вырезания геномной последовательности между двумя целевыми последовательностями гидовой РНК. Модификация целевого геномного локуса будет индуцирована, когда первая гидовая РНК образует комплекс с белком Cas и направляет белок Cas к целевому геномному локусу, вторая гидовая РНК образует комплекс с белком Cas и направляет белок Cas к целевому геномному локусу, первый комплекс Cas/гидовая РНК расщепляет первую целевую последовательность для гидовой РНК, и второй комплекс Cas/гидовая РНК расщепляет вторую целевую последовательность для гидовой РНК, что приводит к вырезанию промежуточной последовательности. Альтернативно, можно вводить две или больше гидовых РНК, причем каждая предназначенной для нацеливания на разную целевую последовательность для гидовой РНК на разном целевом геномном локусе (т.е. мультиплексирование).

[00183] Необязательно экзогенная донорная нуклеиновая кислота, способная к рекомбинации и модификации целевого геномного локуса, также введена не являющемуся человеком животному. Необязательно белок Cas можно присоединить к экзогенной донорной нуклеиновой кислоте, как описано в другом месте в настоящем документе. Необязательно вводят две или больше экзогенные донорные нуклеиновые кислоты, каждая из которых способна к рекомбинации и модификации различного целевого геномного локуса. Модификация целевого геномного локуса будет индуцирована, например, когда гидовая РНК образует комплекс с белком Cas и направляет белок Cas к целевому геномному локусу, комплекс Cas/гидовая РНК расщепляет целевую последовательность для гидовой РНК, и целевой геномный локус рекомбинируется с экзогенной донорной нуклеиновой кислотой, чтобы модифицировать целевой геномный локус. Экзогенная донорная нуклеиновая кислота может рекомбинироваться с целевым геномным локусом, например, посредством гомологичной репарации (HDR) или посредством NHEJ-опосредованной вставки. Можно использовать любой тип экзогенной донорной нуклеиновой кислоты, примеры которых предусмотрены в другом месте в настоящем документе.

[00184] Аналогично, различные способы, предусмотренные выше для оценки активности CRISPR/Cas in vivo, также можно использовать для оценки активности CRISPR/Cas ex vivo с использованием клеток, содержащих экспрессионную кассету Cas, как описано в другом месте в настоящем документе.

[00185] Гидовые РНК и необязательно экзогенные донорные нуклеиновые кислоты можно вводить в клетку или не являющемуся человеком животному посредством любого способа доставки (например, AAV, LNP, или HDD) и любого пути введения, как раскрыто в другом месте в настоящем документе. Согласно конкретным способам гидовая РНК (или гидовые РНК) доставляют посредством AAV-опосредованной доставки. Например, AAV8 можно использовать, если печень является мишенью.

[00186] Способы оценки модификации целевого геномного локуса предусмотрены в другом месте в настоящем документе и являются хорошо известными. Оценку модификации целевого геномного локуса можно проводить в любом типе клеток, любом типе тканей или любом типе органов, как раскрыто в другом месте в настоящем документе. Согласно некоторым способам модификацию целевого геномного локуса оценивают в клетках печени (например, оценка содержаний в сыворотке секретированного белка, экспрессируемого целевым геномным локусом в клетках печени). Например, целевой геномный локус содержит целевой ген, и оценка может предусматривать измерение экспрессии целевого гена или активности белка, кодируемого целевым геном. Альтернативно или дополнительно, оценка может содержать секвенирование целевого геномного локуса в одной или нескольких клетках, выделенных из не являющегося человеком животного. Оценка может содержать выделение целевого органа или ткани из не являющегося человеком животного, и оценку модификации целевого геномного локуса в целевом органе или ткани. Оценка также может содержать оценку модификации целевого геномного локуса в двух или более различных типах клеток в пределах целевого органа или ткани. Аналогично, оценка может содержать выделение нецелевого органа или ткани (например, двух или больше нецелевых органов или тканей) из не являющегося человеком животного и оценку модификации целевого геномного локуса в нецелевом органе или ткани.

(1) Экзогенные донорные нуклеиновые кислоты

[00187] Согласно раскрытым в настоящем документе способам и композициям используют экзогенные донорные нуклеиновые кислоты, чтобы модифицировать целевой геномный локус после расщепления целевого геномного локуса с помощью белка Cas. В таких способах белок Cas расщепляет целевой геномный локус для создания одноцепочечного разрыва (ник) или двухцепочечного разрыва, и экзогенная донорная нуклеиновая кислота рекомбинируется с целевым геномным локусом посредством опосредованного негомологичным соединением концов (NHEJ) лигирования или посредством явления гомологичной репарации. Необязательно репарация с помощью экзогенной донорной нуклеиновой кислоты удаляет или разрушает целевую последовательность для гидовой РНК или сайт расщепления Cas, так что аллели, на которые осуществлялось нацеливание, не могут вновь подвергнуться нацеливанию с помощью белка Cas.

[00188] Экзогенные донорные нуклеиновые кислоты могут содержать дезоксирибонуклеиновую кислоту (ДНК) или рибонуклеиновую кислоту (РНК), они могут являться одноцепочечными или двухцепочечными, и они могут быть в линейной или кольцевой форме. Например, экзогенная донорная нуклеиновая кислота может представлять собой одноцепочечный олигодезоксинуклеотид (ssODN). См., например, Yoshimi et al. (2016) Nat. Commun. 7:10431, полностью включенный в настоящий документ посредством ссылки для всех целей. Иллюстративная экзогенная донорная нуклеиновая кислота составляет от приблизительно 50 нуклеотидов до приблизительно 5 т.п.н. в длину, от приблизительно 50 нуклеотидов до приблизительно 3 т.п.н. в длину или от приблизительно 50 до приблизительно 1000 нуклеотидов в длину. Другие иллюстративные экзогенные донорные нуклеиновые кислоты составляют от приблизительно 40 до приблизительно 200 нуклеотидов в длину. Например, экзогенная донорная нуклеиновая кислота может составлять приблизительно 50-60, 60-70, 70-80,80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190 или 190-200 нуклеотидов в длину. Альтернативно, экзогенная донорная нуклеиновая кислота может составлять приблизительно 50-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900 или 900-1000 нуклеотидов в длину. Альтернативно, экзогенная донорная нуклеиновая кислота может составлять приблизительно 1-1,5, 1,5-2, 2-2,5, 2,5-3, 3-3,5, 3,5-4, 4-4,5 или 4,5-5 т.п.н. в длину. Альтернативно, экзогенная донорная нуклеиновая кислота может составлять, например, не более чем 5 т.п.н., 4,5 т.п.н., 4 т.п.н., 3,5 т.п.н., 3 т.п.н., 2,5 т.п.н., 2 т.п.н., 1,5 т.п.н., 1 т.п.н., 900 нуклеотидов, 800 нуклеотидов, 700 нуклеотидов, 600 нуклеотидов, 500 нуклеотидов, 400 нуклеотидов, 300 нуклеотидов, 200 нуклеотидов, 100 нуклеотидов или 50 нуклеотидов в длину. Экзогенные донорные нуклеиновые кислоты (например, нацеливающие векторы) также могут быть длиннее.

[00189] Согласно одному примеру экзогенная донорная нуклеиновая кислота представляет собой ssODN, который составляет от приблизительно 80 нуклеотидов до приблизительно 200 нуклеотидов в длину. Согласно другому примеру экзогенные донорные нуклеиновые кислоты представляют собой ssODN, который составляет от приблизительно 80 нуклеотидов до приблизительно 3 т.п.н. в длину. Такой ssODN может содержать гомологичные плечи, например, каждое из которых составляет от приблизительно 40 нуклеотидов до приблизительно 60 нуклеотидов в длину. Такой ssODN также может содержать гомологичные плечи, например, каждое из которых составляет от приблизительно 30 нуклеотидов до 100 нуклеотидов в длину. Гомологичные плечи могут являться симметричными (например, каждое составляет 40 нуклеотидов или каждое составляет 60 нуклеотидов в длину), или они могут являться асимметричными (например, одно гомологичное плечо, которое составляет 36 нуклеотидов в длину, и одно гомологичное плечо, которое составляет 91 нуклеотид в длину).

[00190] Экзогенные донорные нуклеиновые кислоты могут включать в себя модификации или последовательности, которые обеспечивают дополнительные требуемые признаки (например, измененную или регулируемую стабильность; отслеживание или обнаружение с помощью флуоресцентной метки; сайт связывания для белка или белкового комплекса и т.д.). Экзогенные донорные нуклеиновые кислоты могут содержать одну или несколько флуоресцентных меток, меток очистки, меток эпитопов или их комбинацию. Например, экзогенная донорная нуклеиновая кислота может содержать одну или несколько флуоресцентных меток (например, флуоресцентных белков или других флуорофоров или красителей), таких как по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4 или по меньшей мере 5 флуоресцентных меток. Иллюстративные флуоресцентные метки включают в себя флуорофоры, такие как флуоресцеин (например, 6-карбоксифлуоресцеин (6-FAM)), Texas Red, HEX, Су3, Су5, Су5.5, Pacific Blue, 5-(и-6)-карбокситетраметилродамин (TAMRA) и Су7. Широкий ассортимент флуоресцентных красителей коммерчески доступен для мечения олигонуклеотидов (например, от Integrated DNA Technologies). Такие флуоресцентные метки (например, внутренние флуоресцентные метки) можно использовать, например, для обнаружения экзогенной донорной нуклеиновой кислоты, которая непосредственно интегрирована в расщепленную целевую нуклеиновую кислоту, содержащую выступающие концы, совместимые с концами экзогенной донорной нуклеиновой кислоты. Метка или тег могут находиться на 5' конце, 5' конце или внутри экзогенной донорной нуклеиновой кислоты. Например, экзогенная донорная нуклеиновая кислота может быть конъюгирована на 5' конце с флуорофором IR700 от Integrated DNA Technologies (5'IRDYE®700).

[00191] Экзогенные донорные нуклеиновые кислоты также могут содержать нуклеиновокислотные вставки, включая в себя сегменты ДНК, подлежащие интеграции в целевых геномных локусах. Интеграция нуклеиновокислотной вставки в целевом геномном локусе может привести к добавлению представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе, делеции представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе или замене представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе (т.е. делеция и вставка). Некоторые экзогенные донорные нуклеиновые кислоты предназначены для вставки нуклеиновокислотной вставки в целевом геномном локусе без какой-либо соответствующей делеции в целевом геномном локусе. Другие экзогенные донорные нуклеиновые кислоты предназначенной для делеции представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе без какой-либо соответствующей вставки нуклеиновокислотной вставки. Другие же экзогенные донорные нуклеиновые кислоты предназначены для делеции представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе и ее замены нуклеиновокислотной вставкой.

[00192] Нуклеиновокислотная вставка или соответствующая нуклеиновая кислота в целевом геномном локусе, подлежащая делеции и/или замене, может характеризоваться различной длиной. Иллюстративная нуклеиновокислотная вставка или соответствующая нуклеиновая кислота в целевом геномном локусе, подлежащая делеции и/или замене, составляет от приблизительно 1 нуклеотида до приблизительно 5 т.п.н. в длину или от приблизительно 1 нуклеотида до приблизительно 1000 нуклеотидов в длину. Например, нуклеиновокислотная вставка или соответствующая нуклеиновая кислота в целевом геномном локусе, подлежащая делеции и/или замене, может составлять приблизительно 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190 или 190-120 нуклеотидов в длину. Аналогично, нуклеиновокислотная вставка или соответствующая нуклеиновая кислота в целевом геномном локусе, подлежащая делеции и/или замене, может составлять 1-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900 или 900-1000 нуклеотидов в длину. Аналогично, нуклеиновокислотная вставка или соответствующая нуклеиновая кислота в целевом геномном локусе, подлежащая делеции и/или замене, может составлять приблизительно 1-1,5, 1,5-2, 2-2,5, 2,5-3, 3-3,5, 3,5-4, 4-4,5 или 4,5-5 т.п.н. в длину или больше.

[00193] Нуклеиновокислотная вставка может содержать последовательность, которая является гомологической или ортологической по отношению ко всей или части последовательности, нацеленной для замены. Например, нуклеиновокислотная вставка может содержать последовательность, которая содержит одну или несколько точечных мутаций (например, 1, 2, 3, 4, 5 или больше) по сравнению с последовательностью, нацеленной для замены в целевом геномном локусе. Необязательно такие точечные мутации могут приводить к консервативной аминокислотной замене (например, замена аспарагиновой кислоты [Asp, D] глутаминовой кислотой [Glu, Е]) в кодируемом полипептиде.

(2) Донорные нуклеиновые кислоты для вставки, опосредованной негомологичным соединением концов

[00194] Некоторые экзогенные донорные нуклеиновые кислоты содержат короткие одноцепочечные области на 5' конце и/или 3' конце, которые являются комплементарными одному или нескольким свисающим концам, созданным с помощью опосредованного белком Cas расщепления в целевом геномном локусе. Эти свисающие концы также могут называться 5' и 3' гомологичные плечи. Например, некоторые экзогенные донорные нуклеиновые кислоты содержат короткие одноцепочечные области на 5' конце и/или 3' конце, которые являются комплементарными одному или нескольким свисающим концам, созданным с помощью опосредованного белком Cas расщепления на 5' и/или 3' целевых последовательностях в целевом геномном локусе. Некоторые такие экзогенные донорные нуклеиновые кислоты содержат комплементарную область только на 5' конце или только на 3' конце. Например, некоторые такие экзогенные донорные нуклеиновые кислоты содержат комплементарную область только на 5' конце, комплементарную свисающему концу, созданному на 5' целевой последовательности в целевом геномном локусе или только на 3' конце, комплементарную свисающему концу, созданному на 3' целевой последовательности в целевом геномном локусе. Другие такие экзогенные донорные нуклеиновые кислоты содержат комплементарные области как на 5', так и на 3' концах. Например, другие такие экзогенные донорные нуклеиновые кислоты содержат комплементарные области как на 5', так и на 3' концах, например, комплементарные первому и второму свисающим концам соответственно, созданным с помощью опосредованного белком Cas расщепления в целевом геномном локусе. Например, если экзогенная донорная нуклеиновая кислота является двухцепочечной, одноцепочечные комплементарные области могут продолжаться от 5' конца верхней цепи донорной нуклеиновой кислоты и 5' конца нижней цепи донорной нуклеиновой кислоты, создавая 5' свисающие концы на каждом конце. Альтернативно, одноцепочечная комплементарная область может продолжаться от 3' конца верхней цепи донорной нуклеиновой кислоты и от 3' конца нижней цепи матрицы, создавая 3' свисающие концы.

[00195] Комплементарные области могут характеризоваться любой длиной, достаточной для стимуляции лигирования между экзогенной донорной нуклеиновой кислотой и целевой нуклеиновой кислотой. Иллюстративные комплементарные области составляют от приблизительно 1 до приблизительно 5 нуклеотидов в длину, между приблизительно 1 до приблизительно 25 нуклеотидов в длину или от приблизительно 5 до приблизительно 150 нуклеотидов в длину. Например, комплементарная область может составлять по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 нуклеотидов в длину. Альтернативно, комплементарная область может составлять приблизительно 5-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140 или 140-150 нуклеотидов в длину или больше.

[00196] Такие комплементарные области могут являться комплементарными свисающим концам, созданным с помощью двух пар никаз. Два двухцепочечных разрыва с расположенными в шахматном порядке концами можно создать с использованием первой и второй никаз, которые расщепляют противоположные цепи ДНК для создания первого двухцепочечного разрыва, и третей и четвертной никаз, которые расщепляют противоположные цепи ДНК для создания второго двухцепочечного разрыва. Например, белок Cas можно использовать для создания одноцепочечного разрыва в первой, второй, третьей и четвертой целевых последовательностях гидовой РНК, соответствующих первой, второй, третьей и четвертой гидовым РНК. Первая и вторая целевые последовательности для гидовой РНК можно расположить для создания первого сайта расщепления, так что одноцепочечные разрывы, созданные с помощью первой и второй никаз на первой и второй цепях ДНК, создают двухцепочечный разрыв (т.е. первый сайт расщепления содержит одноцепочечные разрывы в пределах первой и второй целевых последовательностей гидовой РНК). Аналогично, третья и четвертая целевые последовательности для гидовой РНК можно расположить для создания второго сайта расщепления, так что одноцепочечные разрывы, созданные с помощью третьей и четвертой никаз на первой и второй цепях ДНК, создают двухцепочечный разрыв (т.е. второй сайт расщепления содержит одноцепочечные разрывы в пределах третьей и четвертой целевых последовательностей гидовой РНК). Необязательно, одноцепочечные разрывы в пределах первой и второй целевых последовательностей гидовой РНК и/или третьей и четвертой целевых последовательностей гидовой РНК могут представлять собой смещенные одноцепочечные разрывы, которые создают свисающие концы. Окно смещения может составлять, например, по меньшей мере приблизительно 5 п.н., 10 п.н., 20 п.н., 30 п.н., 40 п.н., 50 п.н., 60 п.н., 70 п.н., 80 п.н., 90 п.н., 100 п.н. или больше. См. Ran et al. (2013) Cell 154:1380-1389; Mali et al. (2013) Nat. Biotech.31:833-838; и Shen et al. (2014) Nat. Methods 11:399-404, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. В таких случаях двухцепочечная экзогенная донорная нуклеиновая кислота может быть разработана с одноцепочечными комплементарными областями, которые являются комплементарными свисающим концам, созданным с помощью одноцепочечных разрывов в пределах первой и второй целевых последовательностей гидовой РНК и с помощью одноцепочечных разрывов в пределах третьей и четвертой целевых последовательностей гидовой РНК. Такая экзогенная донорная нуклеиновая кислота может быть вставлена с помощью лигирования, опосредованного негомологичным соединением концов.

(3) Донорные нуклеиновые кислоты для вставки с помощью гомологичной репарации [00197] Некоторые экзогенные донорные нуклеиновые кислоты содержат гомологичные плечи. Если экзогенная донорная нуклеиновая кислота также содержит нуклеиновокислотную вставку, гомологичные плечи могут фланкировать нуклеиновокислотную вставку. Для удобства пользования гомологичные плечи в настоящем документе называются 5' и 3' (т.е. вышележащие и нижележащие) гомологичные плечи. Эта терминология относится к относительному положению гомологичных плеч относительно нуклеиновокислотной вставки в пределах экзогенной донорной нуклеиновой кислоты. 5' и 3' гомологичные плечи соответствуют областям в пределах целевого геномного локуса, которые в настоящем документе называются "5' целевая последовательность" и "3' целевая последовательность" соответственно.

[00198] Гомологичное плечо и целевая последовательность "соответствуют" или являются "соответствующими" друг другу, когда две области характеризуются достаточным уровнем идентичности последовательности друг с другом, чтобы действовать в качестве субстратов для реакции гомологичной рекомбинации. Термин "гомология" включает в себя последовательности ДНК, которые либо являются идентичными, либо характеризуются идентичностью последовательности относительно соответствующей последовательности. Идентичность последовательности между данной целевой последовательностью и соответствующим гомологичным плечом, встречающимся в экзогенной донорной нуклеиновой кислоте, может представлять собой любую степень идентичности последовательности, которая позволяет происходить гомологичной рекомбинации. Например, количество идентичности последовательности, которой характеризуются гомологичное плечо экзогенной донорной нуклеиновой кислоты (или его фрагмент) и целевая последовательность (или ее фрагмент), может составлять по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 91%, 98%, 99% или 100% идентичности последовательности, так что последовательности подвергаются гомологичной рекомбинации. Более того, соответствующая область гомологии между гомологичным плечом и соответствующей целевой последовательностью может характеризоваться любой длиной, которая является достаточной для обеспечения гомологичной рекомбинации. Иллюстративные гомологичные плечи составляют от приблизительно 25 нуклеотидов до приблизительно 2,5 т.п.н. в длину, от приблизительно 25 нуклеотидов до приблизительно 1,5 т.п.н. в длину или от приблизительно 25 до приблизительно 500 нуклеотидов в длину. Например, данное гомологичное плечо (или каждое из гомологичных плеч) и/или соответствующая целевая последовательность могут содержать соответствующие области гомологии, которые составляют приблизительно 25-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450 или 450-500 нуклеотидов в длину, так что гомологичные плечи характеризуются достаточной гомологией, чтобы подвергаться гомологичной рекомбинации с соответствующими целевыми последовательностями в пределах целевой нуклеиновой кислоты. Альтернативно, данное гомологичное плечо (или каждое гомологичное плечо) и/или соответствующая целевая последовательность могут содержать соответствующие области гомологии, которые составляют от приблизительно 0,5 т.п.н. до приблизительно 1 т.п.н., от приблизительно 1 т.п.н. до приблизительно 1,5 т.п.н., от приблизительно 1,5 т.п.н. до приблизительно 2 т.п.н. или от приблизительно 2 т.п.н. до приблизительно 2,5 т.п.н. в длину. Например, каждое из гомологичных плеч может составлять приблизительно 750 нуклеотидов в длину. Гомологичные плечи могут являться симметричными (каждое приблизительно одинакового размера в длину) или они могут являться асимметричными (одно длиннее другого).

[00199] Когда систему CRISPR/Cas используют в комбинации с экзогенной донорной нуклеиновой кислотой, 5' и 3' целевые последовательности необязательно расположены в достаточной близости от сайта расщепления Cas (например, в достаточной близости от целевой последовательности для гидовой РНК), так чтобы способствовать возникновению события гомологичной рекомбинации между целевыми последовательностями и гомологичными плечами при одноцепочечном разрыве (ник) или двухцепочечном разрыве на сайте расщепления Cas. Термин "сайт расщепления Cas" включает в себя последовательность ДНК, на которой одноцепочечный разрыв или двухцепочечный разрыв создан с помощью фермента Cas (например, белка Cas9 в комплексе с гидовой РНК). Целевые последовательности в пределах нацеленного локуса, которые соответствуют 5' и 3' гомологичным плечам экзогенной донорной нуклеиновой кислоты, "расположены в достаточной близости" от сайта расщепления Cas, если расстояние является таким, чтобы способствовать возникновению события гомологичной рекомбинации между 5' и 3' целевыми последовательностями и гомологичными плечами при одноцепочечном разрыве или двухцепочечном разрыве на сайте расщепления Cas. Таким образом, целевые последовательности, соответствующие 5' и/или 3' гомологичным плечам экзогенной донорной нуклеиновой кислоты, могут находиться, например, в пределах по меньшей мере 1 нуклеотида от данного сайта расщепления Cas или в пределах по меньшей мере от 10 нуклеотидов до приблизительно 1000 нуклеотидов отданного сайта расщепления Cas. В качестве примера сайт расщепления Cas может являться непосредственно смежным по меньшей мере с одной или обеими целевыми последовательностями.

[00200] Пространственные отношения целевых последовательностей, которые соответствуют гомологичным плечам экзогенной донорной нуклеиновой кислоты, и сайта расщепления Cas могут варьироваться. Например, целевые последовательности могут быть расположены 5' относительно сайта расщепления Cas, целевые последовательности могут быть расположены 3' относительно сайта расщепления Cas, или целевые последовательности могут фланкировать сайт расщепления Cas.

В. Способы оптимизации способности CRISPR/Cas вырезать целевую геномную нуклеиновую кислоту in vivo или ex vivo

[00201] Предусмотрены различные способы оптимизации доставки CRISPR/Cas в клетку или не являющемуся человеком животному или оптимизации активности CRISPR/Cas in vivo. Такие способы могут предусматривать, например, следующее: (а) проведение способа испытания способности CRISPR/Cas модифицировать целевой геномный локус, как описано выше, в первый раз у первого не являющегося человеком животного или в первой клетке; (b) изменение переменной и проведение способа во второй раз у второго не являющегося человеком животного (т.е. того же вида) или во второй клетке с измененной переменной; и (с) сравнение модификации целевого геномного локуса на стадии (а) с модификацией целевого геномного локуса на стадии (b), и выбор способа, приводящего к более эффективной модификации целевого геномного локуса.

[00202] Более эффективная модификация целевого геномного локуса может означать различные вещи в зависимости от требуемого эффекта в пределах не являющегося человеком животного или клетки. Например, более эффективная модификация целевого геномного локуса может означать одно или несколько или все из следующего: повышенная эффективность, повышенная точность, повышенная согласованность или повышенная специфичность. Повышенная эффективность относится к повышенным уровням модификации целевого геномного локуса (например, повышенное процентное отношение клеток нацелено в пределах конкретного целевого типа клеток, в пределах конкретной целевой ткани или в пределах конкретного целевого органа). Повышенная точность относится к более точной модификации целевого геномного локуса (например, повышенное процентное отношение нацеленных клеток с одинаковой модификацией или с требуемой модификацией без избыточных непреднамеренных вставок и делеций (например, инделей NHEJ)). Повышенная согласованность относится к более согласованной модификации целевого геномного локуса среди различных типов нацеленных клеток, тканей или органов, если более одного типа клеток, тканей или органов подвергается нацеливанию (например, модификация большего количества типов клеток в пределах целевого органа). Если конкретный орган подвергается нацеливанию, повышенная согласованность также может относиться к более согласованной модификации во всех местах в пределах органа. Повышенная специфичность может относиться к повышенной специфичности по отношению к нацеленному геномному локусу или локусам, повышенная специфичность по отношению к нацеленному типу клеток, повышенная специфичность по отношению к нацеленному типу ткани или повышенная специфичность по отношению к нацеленному органу. Например, повышенная специфичность в отношении геномного локуса относится к меньшей модификации нецелевых геномных локусов (например, пониженное процентное отношение нацеленных клеток с модификациями на непреднамеренных, нецелевых геномных локусах вместо или в дополнение к модификации целевого геномного локуса). Аналогично, повышенная специфичность в отношении типа клеток, типа ткани или органа относится к меньшей модификации нецелевых типов клеток, типов тканей или типов органов, если конкретный тип клеток, тип тканей или тип органов подлежит нацеливанию (например, когда конкретный орган подлежит нацеливанию (например, печень), существует меньше модификации клеток в органах или тканях, которые не являются предусмотренными мишенями).

[00203] Переменная, которая изменяется, может представлять собой любой параметр. В качестве одного примера измененная переменная может представлять собой способ упаковки или доставки, с помощью которого одну или несколько или все из гидовой РНК (или гидовой РНК, упакованной в AAV) и экзогенной донорной нуклеиновой кислоты вводят в клетку или не являющемуся человеком животному. Примеры способов доставки, таких как LNP, HDD и AAV, раскрыты в настоящем документе в другом месте. Например, измененная переменная может представлять собой серотип AAV. В качестве другого примера измененная переменная может представлять собой путь введения для введения одной или нескольких или всех из гидовой РНК (например, упакованной в AAV) и экзогенной донорной нуклеиновой кислоты в клетку или не являющемуся человеком животному. Примеры способов введения, таких как внутривенный, интравитреальный, интрапаренхимальный способ и закапывание в нос, раскрыты в другом месте в настоящем документе.

[00204] В качестве другого примера измененной переменной может являться концентрация или количество одной или нескольких или всех из введенной гидовой РНК (например, упакованной в AAV) и введенной экзогенной донорной нуклеиновой кислоты. В качестве другого примера измененная переменная может представлять собой концентрацию или количество введенной гидовой РНК (например, упакованной в AAV) относительно концентрации или количества введенной экзогенной донорной нуклеиновой кислоты.

[00205] В качестве другого примера, измененная переменная может представлять собой время введения одной или нескольких или всех из гидовой РНК (например, упакованной в AAV) и экзогенной донорной нуклеиновой кислоты относительно времени измерения экспрессии или активности одного или нескольких репортерных белков. В качестве другого примера, измененной переменной может являться число раз или частота, с которой вводят одну или несколько или все из гидовой РНК (например, упакованной в AAV) и экзогенной донорной нуклеиновой кислоты. В качестве другого примера, измененная переменная может являться временем введения гидовой РНК относительно времени введения экзогенной донорной нуклеиновой кислоты.

[00206] В качестве другого примера измененная переменная может представлять собой форму, в которой вводят одну или несколько или все из гидовой РНК и экзогенной донорной нуклеиновой кислоты. Например, гидовую РНК можно вводить в форме ДНК или в форме РНК. Экзогенная донорная нуклеиновая кислота может являться ДНК, РНК, одноцепочечной, двухцепочечной, линейной, кольцевой и так далее. Аналогично, каждый из компонентов может содержать различные комбинации модификаций для стабильности, для уменьшения нецелевых эффектов, для облегчения доставки и так далее. В качестве другого примера измененная переменная может представлять собой одну или несколько или все из введенной гидовой РНК (например, введение другой гидовой РНК с другой последовательностью) и введенной экзогенной донорной нуклеиновой кислоты (например, введение другой экзогенной донорной нуклеиновой кислоты с другой последовательностью).

С. Введение гидовых РНК и других компонентов в клетки и организм не являющихся человеком животных

[00207] Раскрытые в настоящем документе способы предусматривают введение в клетку или животному, не являющему человеком, одной или нескольких или всех из гидовых РНК и экзогенных донорных нуклеиновых кислот. «Введение» включает в себя представление клетке или не являющемуся человеком животному нуклеиновой кислоты или белка таким образом, что нуклеиновая кислота или белок получает доступ к внутренней части клетки или к внутренней части клеток в организме животного, не являющегося человеком. Введение можно выполнить любыми способами, и два или больше компонентов (например, два из компонентов или все компоненты) можно вводить в клетку или животному, не являющемуся человеком, одновременно или последовательно в любой комбинации. Например, экзогенную донорную нуклеиновую кислоту можно вводить в клетку или животному, не являющемуся человеком, перед введением гидовой РНК, или ее можно вводить после введения гидовой РНК (например, экзогенную донорную нуклеиновую кислоту можно вводить приблизительно за 1, 2, 3, 4, 8, 12, 24, 36, 48 или 72 часа до или после введения гидовой РНК). См., например, US 2015/0240263 и US 2015/0110762, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Кроме того, два или более компонентов можно вводить в клетку или животному, не являющемуся человеком, одним и тем же способом доставки или разными способами доставки. Аналогично, два или более компонентов можно вводить животному, не являющемуся человеком, одним и тем же путем введения или различными способами введения.

[00208] Гидовую РНК можно вводить в клетку в форме РНК (например, транскрибированной РНК in vitro) или в форме ДНК, кодирующей гидовую РНК. При введении в форме ДНК кодирующая гидовую РНК ДНК может быть функционально связана с активным в клетке промотором. Например, гидовую РНК можно доставлять посредством AAV, и она может экспрессироваться in vivo под контролем промотора U6. Такие ДНК могут находиться в одной или нескольких экспрессионных конструктах. Например, такие экспрессирующие конструкты могут являться компонентами одной молекулы нуклеиновой кислоты. Альтернативно, они могут быть разделены в любой комбинации среди двух или более молекул нуклеиновой кислоты (т.е. ДНК, кодирующие одну или несколько РНК CRISPR, и ДНК, кодирующие одну или несколько tracrРНК, могут являться компонентами отдельных молекул нуклеиновой кислоты).

[00209] Нуклеиновые кислоты, кодирующие гидовые РНК, могут быть функционально связаны с промотором в экспрессионном конструкте. Экспрессионные конструкты включают в себя любые нуклеиновокислотные конструкты, способные направлять экспрессию гена или другой представляющей интерес последовательности нуклеиновой кислоты и которые могут переносить такую представляющую интерес последовательность нуклеиновой кислоты в целевую клетку. Подходящие промоторы, которые можно использовать в экспрессионном конструкте, включают в себя промоторы, активные, например, в одной или нескольких из следующего: эукариотическая клетка, клетка человека, не относящаяся к человеку клетка, клетка млекопитающего, клетке млекопитающего, не являющегося человеком, клетка грызуна, клетка мыши, клетка крысы, клетка хомяка, клетка кролика, плюрипотентная клетка, эмбриональная стволовая (ES) клетка, взрослая стволовая клетка, клетка-предшественник, ограниченная стадией развития, индуцированная плюрипотентная стволовая клетка (iPS) или эмбрион на стадии одной клетки. Такими промоторами могут являться, например, условные промоторы, индуцируемые промоторы, конститутивные промоторы или тканеспецифические промоторы. Необязательно, промотор может являться двунаправленным промотором, управляющим экспрессией как гидовой РНК в одном направлении, так и другого компонента в другом направлении. Такие двунаправленные промоторы могут состоять из (1) полного общепринятого однонаправленного промотора Pol III, который содержит 3 внешних элемента управления: элемент дистальной последовательности (DSE), элемент проксимальной последовательности (PSE) и ТАТА-бокс; и (2) второй основной промотор Pol III, который включает в себя PSE и ТАТА-бокс, слитый с 5'-концом DSE в обратной ориентации. Например, в промоторе HI DSE соседствует с PSE и ТАТА-боксом, и промотор можно сделать двунаправленным, создав гибридный промотор, в котором транскрипция в обратном направлении контролируется путем добавления PSE и ТАТА-бокса, полученных из промотора U6. См., например, US 2016/0074535, полностью включенную в настоящий документ посредством ссылки для всех целей. Использование двунаправленного промотора для экспрессии генов, кодирующих гидовую РНК и другой компонент одновременно, позволяет создавать компактные экспрессионные кассеты для облегчения доставки.

[00210] Экзогенные донорные нуклеиновые кислоты и гидовые РНК (или нуклеиновые кислоты, кодирующие гидовые РНК) могут быть представлены в композициях, содержащих носитель, повышающий стабильность экзогенной донорной нуклеиновой кислоты или гидовой РНК (например, продлевая период при данных условиях хранения (например, -20°С, 4°С или температура окружающей среды), для которых продукты разложения остаются ниже порогового значения, такого как ниже 0,5% по массе исходной нуклеиновой кислоты или белка, или увеличение стабильности in vivo). Неограничивающие примеры таких носителей включают в себя микросферы поли(молочной кислоты) (PLA), микросферы, микросферы сополимера D,L-молочной и гликолевой кислот (PLGA), липосомы, мицеллы, обратные мицеллы, липидные кохлеаты и липидные микротрубочки.

[00211] В настоящем документе предусмотрены различные способы и композиции, позволяющие вводить нуклеиновую кислоту или белок в клетку или животному, не являющемуся человеком. Способы введения нуклеиновых кислот в клетки различных типов известны в настоящей области техники и включают в себя, например, способы стабильной трансфекции, способы транзиентной трансфекции и способы, опосредованные вирусом.

[00212] Протоколы трансфекции, а также протоколы для введения последовательностей нуклеиновых кислот в клетки могут различаться. Неограничивающие способы трансфекции включают в себя химические способы трансфекции; способы с использованием липосом; наночастиц; фосфата кальция (Graham et al. (1973) Virology 52 (2): 456-67, Bacchetti et al. (1977) Proc. Natl. Acad. Set USA 1A (4): 1590-4, и Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company, pp. 96-97); дендримеров или катионных полимеров, таких как DEAE-декстран или полиэтиленимин. Нехимические способы включают в себя электропорацию, сонопорацию и оптическую трансфекцию. Трансфекция на основе частиц включает в себя использование генной пушки или магнитной трансфекции (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). Вирусные техники также можно использовать для трансфекции.

[00213] Введение нуклеиновых кислот или белков в клетку также может быть опосредовано электропорацией, внутрицитоплазматической инъекцией, вирусной инфекцией, аденовирусом, аденоассоциированным вирусом, лентивирусом, ретровирусом, трансфекцией, липид-опосредованной трансфекцией или нуклеофекцией. Нуклеофекция представляет собой усовершенствованную технологию электропорации, которая позволяет доставлять нуклеиновокислотные субстраты не только в цитоплазму, но также через ядерную мембрану и в ядро. Кроме того, использование нуклеофекции в раскрытых в настоящем документе способах, как правило, требует гораздо меньше клеток, чем обычная электропорация (например, только приблизительно 2 миллионов по сравнению с 7 миллионами при обычной электропорации). В одном примере нуклеофекцию выполняют с использованием системы LONZA® NUCLEOFECTOR™.

[00214] Введение нуклеиновых кислот или белков в клетку (например, зиготу) также можно осуществить путем микроинъекции. В зиготах (т.е. эмбрионах на одноклеточной стадии) микроинъекцию можно осуществлять в пронуклеус матери и/или отца или в цитоплазму. Если микроинъекция происходит только в одном пронуклеусе, отцовский пронуклеус предпочтительнее из-за его большего размера. Альтернативно, микроинъекцию можно осуществлять путем инъекции как в ядро/пронуклеус, так и в цитоплазму: сначала можно ввести иглу в ядро/пронуклеус и можно ввести первое количество, при удалении иглы из эмбриона на одноклеточной стадии второе количество может быть введено в цитоплазму. Способы проведения микроинъекции хорошо известны. См., например, Nagy et al. (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); см. также Meyer et al. (2010) Proc. Natl. Acad. Sci. USA 107:15022-15026 и Meyer et al. (2012) Proc. Natl. Acad. Sci. USA 109:9354-9359.

[00215] Другие способы введения нуклеиновой кислоты или белков в клетку или животному, не являющемуся человеком, могут включать в себя, например, векторную доставку, опосредованную частицами доставку, опосредованную экзосомами доставку, опосредованную липидными наночастицами доставку, опосредованную проникающим в клетку пептидом доставку или опосредованную имплантируемыми устройствами доставку. В качестве конкретных примеров, нуклеиновую кислоту или белок можно вводить в клетку или животному, не являющемуся человеком, в носителе, таком как микросфера поли(молочной кислоты) (PLA), микросфера сополимера D,L-молочной и гликолевой кислот) (PLGA), липосома, мицелла, обратная мицелла, липидный кохлеат или липидная микротрубочка. Некоторые конкретные примеры доставки животному, не являющемуся человеком, включают в себя гидродинамическую доставку, опосредованную вирусом доставку (например, опосредованную аденоассоциированным вирусом (AAV) доставку) и опосредованную липидными наночастицами доставку.

[00216] Введение нуклеиновых кислот и белков в клетки или организм животных, не являющихся человеком, можно осуществить с помощью гидродинамической доставки (HDD). Гидродинамическая доставка появилась как способ внутриклеточной доставки ДНК in vivo. Для доставки генов в паренхиматозные клетки через выбранный кровеносный сосуд необходимо вводить только необходимые последовательности ДНК, что устраняет проблемы безопасности, связанные с современными вирусными и синтетическими векторами. При введении в кровоток ДНК способна достигать клеток в различных тканях, доступных для крови. Гидродинамическая доставка использует силу, создаваемую быстрой инъекцией большого объема раствора в несжимаемую кровь в кровообращении, чтобы преодолеть физические барьеры эндотелия и клеточных мембран, которые препятствуют проникновению крупных и непроницаемых для мембран соединений в паренхиматозные клетки. В дополнение к доставке ДНК этот способ применим для эффективной внутриклеточной доставки РНК, белков и других небольших соединений in vivo. См., например, Bonamassa et al. (2011) Pharm. Res. 28(4):694-701, полностью включенный в настоящий документ посредством ссылки для всех целей.

[00217] Введение нуклеиновых кислот также можно осуществить путем опосредованной вирусом доставки, такой как AAV-опосредованная доставка или опосредованная лентивирусом доставка. Другие иллюстративные вирусы/вирусные векторы включают в себя ретровирусы, аденовирусы, вирусы коровьей оспы, поксвирусы и вирусы простого герпеса. Вирусы могут инфицировать делящиеся клетки, неделящиеся клетки или как делящиеся, так и неделящиеся клетки. Вирусы могут интегрироваться в геном хозяина или, альтернативно, не интегрироваться в геном хозяина. Такие вирусы также могут быть разработаны для снижения иммунитета. Вирусы могут являться способными к репликации или могут являться дефектными по репликации (например, дефектными в одном или нескольких генах, необходимых для дополнительных циклов репликации и/или упаковки вириона). Вирусы могут вызывать транзиентную экспрессию, длительную экспрессию (например, в течение по меньшей мере 1 недели, 2 недель, 1 месяца, 2 месяцев или 3 месяцев) или постоянную экспрессию (например, Cas9 и/или гРНК). Иллюстративные титры вирусов (например, титры AAV) включают в себя 1012, 1013, 1014, 1015 и 1016 векторных геномов/мл.

[00218] Геном оцДНК AAV состоит из двух открытых рамок считывания, Rep и Сар, фланкированных двумя инвертированными концевыми повторами, которые позволяют синтезировать цепь комплементарной ДНК. При конструировании переносящей плазмиды AAV трансген помещают между двумя ITR, и Rep и Сар могут поставляться в трансположениях. В дополнение к Rep и Cap, AAV может потребовать наличие плазмиды-помощника, содержащей гены аденовируса. Эти гены (Е4, Е2а и VA) опосредуют репликацию AAV. Например, переносящая плазмида, Rep/Cap, и плазмида-помощник могут быть трансфицированы в клетки HEK293, содержащие ген аденовируса Е1+, для получения инфекционных частиц AAV. Альтернативно, Rep, Сар и гены-помощники аденовируса могут быть объединены в одну плазмиду. Подобные упаковывающие клетки и способы можно использовать для других вирусов, таких как ретровирусы.

[00219] Идентифицированы многочисленные серотипы AAV. Эти серотипы различаются по типам клеток, которые они инфицируют (т.е. их тропизм), что позволяет осуществлять преимущественную трансдукцию определенных типов клеток. Серотипы ткани ЦНС включают в себя AAV1, AAV2, AAV4, AAV5, AAV8 и AAV9. Серотипы для ткани сердца включают в себя AAV1, AAV8 и AAV9. Серотипы почечной ткани включают в себя AAV2. Серотипы легочной ткани включают в себя AAV4, AAV5, AAV6 и AAV9. Серотипы ткани поджелудочной железы включают в себя AAV8. Серотипы для фоторецепторных клеток включают AAV2, AAV5 и AAV8. Серотипы ткани пигментного эпителия сетчатки включают в себя AAV1, AAV2, AAV4, AAV5 и AAV8. Серотипы скелетной мышечной ткани включают в себя AAV1, AAV6, AAV7, AAV8 и AAV9. Серотипы ткани печени включают в себя AAV7, AAV8 и AAV9 и, в частности, AAV8.

[00220] Тропизм можно дополнительно уточнить с помощью псевдотипирования, которое представляет собой смешивание капсида и генома из различных вирусных серотипов. Например, AAV2/5 указывает на вирус, содержащий геном серотипа 2, упакованный в капсид из серотипа 5. Использование псевдотипированных вирусов может повысить эффективность трансдукции, а также изменить тропизм. Гибридные капсиды, полученные из разных серотипов, также можно использовать для изменения вирусного тропизма. Например, AAV-DJ содержит гибридный капсид из восьми серотипов и демонстрирует высокую инфекционность в широком диапазоне типов клеток in vivo. AAV-DJ8 является еще одним примером, который проявляет свойства AAV-DJ, но с улучшенным поглощением тканями головного мозга. Серотипы AAV также можно модифицировать с помощью мутаций. Примеры мутационных модификаций AAV2 включают в себя Y444F, Y500F, Y730F и S662V. Примеры мутационных модификаций AAV3 включают в себя Y705F, Y731F и T492V. Примеры мутационных модификаций AAV6 включают в себя S663V и T492V. Другие псевдотипированные/модифицированные варианты AAV включают в себя AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2 и AAV/SASTG.

[00221] Для ускорения экспрессии трансгена можно использовать самокомплементарные варианты AAV (scAAV). Поскольку AAV зависит от механизма репликации ДНК клетки, чтобы синтезировать комплементарную цепь генома одноцепочечной ДНК AAV, экспрессия трансгена может быть отсрочена. Чтобы устранить эту задержку, можно использовать scAAV, содержащие комплементарные последовательности, которые способны к самопроизвольному отжигу при заражении, что устраняет необходимость синтеза ДНК клетки-хозяина. Однако также можно использовать одноцепочечные векторы AAV (ssAAV).

[00222] Чтобы увеличить емкость упаковки, более длинные трансгены можно разделить между двумя переносящими плазмидами AAV, первая с 3'-донорным сайтом сплайсинга, а вторая с 5'-акцепторным сайтом сплайсинга. При коинфекции клетки эти вирусы образуют конкатемеры, сплайсируются вместе, и можно экспрессировать полноразмерный трансген. Хотя это позволяет увеличить экспрессию трансгена, экспрессия является менее эффективной. В подобных способах увеличения емкости используют гомологичную рекомбинацию. Например, трансген может быть разделен между двумя переносящими плазмидами, но с существенным перекрытием последовательности, так что коэкспрессия индуцирует гомологичную рекомбинацию и экспрессию полноразмерного трансгена.

[00223] Введение нуклеиновых кислот и белков также можно осуществить путем доставки, опосредованной липидными наночастицами (LNP). Например, LNP-опосредованную доставку можно использовать для доставки гидовой РНК в форме РНК. Доставка посредством таких способов приводит к временному присутствию гидовой РНК, а биоразлагаемые липиды улучшают клиренс, улучшают переносимость и снижают иммуногенность. Липидные составы могут защищать биологические молекулы от разложения при одновременном улучшении их клеточного поглощения. Липидные наночастицы представляют собой частицы, содержащие множество молекул липидов, физически связанных друг с другом межмолекулярными силами. Они включают в себя микросферы (включая в себя однослойные и многослойные везикулы, например, липосомы), дисперсную фазу в эмульсии, мицеллы или внутреннюю фазу в суспензии. Такие липидные наночастицы можно использовать для инкапсуляции одной или нескольких нуклеиновых кислот или белков для доставки. Составы, которые содержат катионные липиды, являются применимыми для доставки полианионов, таких как нуклеиновые кислоты. Другими липидами, которые могут быть включены, являются нейтральные липиды (т.е. незаряженные или цвиттерионные липиды), анионные липиды, вспомогательные липиды, которые усиливают трансфекцию, и липиды-невидимки, которые увеличивают продолжительность времени, в течение которого наночастицы могут существовать in vivo. Примеры подходящих катионных липидов, нейтральных липидов, анионных липидов, вспомогательных липидов и липидов-невидимок можно найти в международной патентной публикации WO 2016/010840 А1, полностью включенной в настоящий документ посредством ссылки для всех целей. Иллюстративная липидная наночастица может содержать катионный липид и один или несколько других компонентов. В одном примере другой компонент может содержать вспомогательный липид, такой как холестерин. В другом примере другие компоненты могут содержать вспомогательный липид, такой как холестерин, и нейтральный липид, такой как DSPC. В другом примере другие компоненты могут содержать вспомогательный липид, такой как холестерин, необязательный нейтральный липид, такой как DSPC, и липид-невидимку, такой как S010, S024, S027, S031 или S033.

[00224] LNP может содержать одно или несколько или все из следующего: (i) липид для инкапсуляции и для эндосомального высвобождения; (ii) нейтральный липид для стабилизации; (iii) вспомогательный липид для стабилизации; и (iv) липид-невидимка. См., например, Finn et al. (2018) Cell Reports 22:1-9 и WO 2017/173054 Al, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. В некоторых LNP груз может включать в себя гидовую РНК или нуклеиновую кислоту, кодирующую гидовую РНК. В некоторых LNP груз может включать в себя гидовую РНК или нуклеиновую кислоту, кодирующую гидовую РНК и экзогенную донорную нуклеиновую кислоту.

[00225] Липид для инкапсуляции и эндосомального высвобождения может представлять собой катионный липид. Липид также может являться биоразлагаемым липидом, таким как биоразлагаемый ионизируемый липид. Одним примером подходящего липида является липид А или LP01, который представляет собой (9Z,12Z)-3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропилооктадека-9,12-диеноат, также называемый 3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропил(9Z,12Z)-октадека-9,12-диеноат. См., например, Finn et al. (2018) Cell Reports 22:1-9 и международную патентную публикацию WO 2017/173054 A1, причем каждый документ полностью включен в настоящее описание посредством ссылки для всех целей. Другим примером подходящего липида является липид В, который представляет собой ((5-((диметиламино)метил)-1,3-фенилен)бис(окси))бис(октан-8,1-диил)бис(деканоат), который также называется ((5-((диметиламино)метил)-1,3-фенилен)бис(окси))бис(октан-8,1-диил)бис(деканоат). Другим примером подходящего липида является липид С, который представляет собой 2-((4-(((3-(диметиламино)пропокси)карбонил)окси)гексадеканоил)окси)пропан-1,3-диил(9Z,9'Z,12Z,12'Z)-бис(октадека-9,12-диеноат). Другим примером подходящего липида является липид D, который представляет собой 3-(((3-(диметиламино)пропокси)карбонил)окси)-13-(октаноилокси)тридецил-3-октилундеканоат.Другие подходящие липиды включают в себя гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (также известный как Dlin-MC3-DMA (МС3))).

[00226] Некоторые такие липиды, подходящие для применения в описанных в настоящем документе LNP, являются биоразлагаемыми in vivo. Например, LNP, содержащие такой липид, включают в себя те, в которых по меньшей мере 75% липида выводится из плазмы в течение 8, 10, 12, 24 или 48 часов или 3, 4, 5, 6, 7 или 10 дней. В качестве другого примера по меньшей мере 50% LNP выводится от плазмы в течение 8, 10, 12, 24 или 48 часов или 3, 4, 5, 6, 7 или 10 дней.

[00227] Такие липиды могут являться ионизируемыми в зависимости от рН среды, в которой они находятся. Например, в слабокислой среде липиды могут протонироваться и, таким образом, нести положительный заряд. И наоборот, в слабоосновной среде, такой как, например, кровь, где рН составляет приблизительно 7,35, липиды могут не протонироваться и, следовательно, нести заряд. Согласно некоторым вариантам осуществления липиды могут протонироваться при рН, по меньшей мере приблизительно 9, 9,5 или 10. Способность такого липида нести заряд связана с его собственной pKa. Например, липид может независимо характеризоваться значением pKa в диапазоне от приблизительно 5,8 до приблизительно 6,2.

[00228] Нейтральные липиды функционируют для стабилизации и улучшения обработки LNP. Примеры подходящих нейтральных липидов включают в себя множество нейтральных, незаряженных или цвиттерионных липидов. Примеры нейтральных фосфолипидов, подходящих для использования в настоящем раскрытии, включают в себя без ограничения 5-гептадецилбензол-1,3-диол (резорцин), дипальмитоилфосфатидилхолин (DPPC), дистеароилфосфатидилхолин (DSPC), фосфохолин (DOPC), димиристоилфосфатидилхолин (DMPC), фосфатидилхолин (PLPC), 1,2-дистеароил-sn-глицеро-3-фосфохолин (DAPC), фосфатидилэтаноламин (РЕ), яичный фосфатидилхолин (РЕС), дилаурилоилфосфатидилхолин (DLPC), димиристоилфосфатидилхолин (DMPC), 1-миристоил-2-пальмитоилфосфатидилхолин (МРРС), 1-пальмитоил-2-миристоилфосфатидилхолин (РМРС), 1-пальмитоил-2-стеароилфосфатидилхолин (PSPC), 1,2-диарахидоил-sn-глицеро-3-фосфохолин (DBPC), 1-стеароил-2-пальмитоилфосфатидилхолин (SPPC), 1,2-диэйкозеноил-sn-глицеро-3-фосфохолин (DEPC), пальмитоилолеоилфосфатидилхолин (РОРС), лизофосфатидилхолин, диолеоилфосфатидилэтаноламин (DOPE), дилинолеоилфосфатидилхолин, дистеароилфосфатидилэтаноламин (DSPE), димиристоилфосфатидилэтаноламин (DMPE), дипальмитоилфосфатидилэтаноламин (DPPE), пальмитоилолеоилфосфатидилэтаноламин (POPE), лизофосфатидилэтаноламин и их комбинации. Например, нейтральный фосфолипид можно выбрать из группы, состоящей из дистеароилфосфатидилхолина (DSPC) и димиристоилфосфатидилэтаноламина (DMPE).

[00229] Вспомогательные липиды включают в себя липиды, которые усиливают трансфекцию. Механизм, с помощью которого вспомогательный липид усиливает трансфекцию, может включать в себя повышение стабильности частиц. В некоторых случаях вспомогательный липид может усиливать фузогенность мембран. Вспомогательные липиды включают в себя стероиды, стеролы и алкилрезорцины. Примеры подходящих вспомогательных липидов, подходящих для использования, включают в себя холестерин, 5-гептадецилрезорцин и холестерингемисукцинат. В одном примере вспомогательный липид может представлять собой холестерин или холестерингемисукцинат.

[00230] Липиды-невидимки включают в себя липиды, которые изменяют продолжительность времени, в течение которого наночастицы могут существовать in vivo. Липиды-невидимки могут содействовать процессу составления, например, путем снижения агрегации частиц и контроля размера частиц. Липиды-невидимки могут модулировать фармакокинетические свойства LNP. Подходящие липиды-невидимки включают в себя липиды с гидрофильной головкой, связанной с липидной частью.

[00231] Гидрофильная головка липида-невидимки может содержать, например, полимерный фрагмент, выбранный из полимеров на основе PEG (которые иногда называются поли(этиленоксид)), поли(оксазолин), поли(виниловый спирт), поли(глицерин), поли(N-винилпирролидон), полиаминокислоты и поли(N-(2-гидроксипропил)метакриламид). Термин PEG означает любой полиэтиленгликоль или другой полиалкиленэфирный полимер. В некоторых составах LNP PEG представляет собой PEG-2K, также называемый PEG 2000, который характеризуется средней молекулярной массой, составляющей приблизительно 2000 дальтон. См., например, международную патентную публикацию WO 2017/173054 А1, полностью включенную в настоящий документ посредством ссылки для всех целей.

[00232] Липидный фрагмент липида-невидимки можно получить, например, из диацилглицерина или диацилгликамида, включая в себя соединения, содержащие диалкилглицериновую или диалкилгликамидную группу с длиной алкильной цепи, независимо содержащей от приблизительно С4 до приблизительно С40 насыщенных или ненасыщенных атомов углерода, где цепь может содержать одну или несколько функциональных групп, таких как, например, амид или сложный эфир. Диалкилглицериновая или диалкилгликамидная группа может дополнительно содержать одну или несколько замещенных алкильных групп.

[00233] В качестве одного примера липид-невидимку можно выбрать из следующего: PEG-дилауроилглицерин, PEG-димиристоилглицерин (PEG-ДМГ), PEG-дипальмитоилглицерин, PEG-дистеароилглицерин (PEG-DSPE), PEG-дилаурилгликамид, PEG-димиристилглимидамид, PEG-дипальмитоилгликамид и PEG-дистеароилгликамид, PEG-холестерин (1-[8'-(холест-5-ен-3-бета-окси)карбоксамидо-3',6'-диоксаоктанил]карбамоил-[омега]-метил-поли(этиленгликоль), PEG-DMB (3,4-дитетрадекоксилбензил-[омега]-метил-поли(этиленгликоль)эфир), 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-N-[метокси(полиэтиленгликоль)-2000] (PEG2k-DMG), 1,2-дистеароил-sn-глицеро-3-фосфоэтаноламин-N-[метокси (полиэтиленгликоль)-2000] (PEG2k-DSPE), 1,2-дистеароил-sn-глицерин, метоксиполиэтиленгликоль (PEG2k-DSG), поли(этиленгликоль)-2000-диметакрилат (PEG2k-DMA) и 1,2-дистеарилоксипропил-3-амин-N-[метокси(полиэтиленгликоль)-2000] (PEG2k-DSA). В одном конкретном примере липид-невидимка может представлять собой PEG2k-DMG.

[00234] LNP могут содержать различные соответствующие молярные соотношения компонентов липидов в составе. Соотношение моль% липида CCD может составлять, например, от приблизительно 30 моль% до приблизительно 60 моль%, от приблизительно 35 моль% до приблизительно 55 моль%, от приблизительно 40 моль% до приблизительно 50 моль%, от приблизительно 42 моль% до приблизительно 47 моль% или приблизительно 45%. Соотношение моль% вспомогательного липида может составлять, например, от приблизительно 30 моль% до приблизительно 60 моль%, от приблизительно 35 моль% до приблизительно 55 моль%, от приблизительно 40 моль% до приблизительно 50 моль%, от приблизительно 41 моль% до приблизительно 46 моль%, или приблизительно 44 моль%. Соотношение моль% нейтрального липида может составлять, например, от приблизительно 1 моль% до приблизительно 20 моль%, от приблизительно 5 моль% до приблизительно 15 моль%, от приблизительно 7 моль% до приблизительно 12 моль% или приблизительно 9 моль%. Соотношение моль% липида-невидимки может составлять, например, от приблизительно 1 моль% до приблизительно 10 моль%, от приблизительно 1 моль% до приблизительно 5 моль%, от приблизительно 1 моль% до приблизительно 3 моль%, приблизительно 2 моль% или приблизительно 1 моль%.

[00235] LNP могут характеризоваться различными соотношениями между положительно заряженными аминными группами биоразлагаемого липида (N) и отрицательно заряженными фосфатными группами (Р) нуклеиновой кислоты, которая должна быть инкапсулирована. Это может быть математически представлено соотношением N/P. Например, соотношение N/P может составлять от приблизительно 0,5 до приблизительно 100, от приблизительно 1 до приблизительно 50, от приблизительно 1 до приблизительно 25, от приблизительно 1 до приблизительно 10, от приблизительно 1 до приблизительно 7, от приблизительно 3 до приблизительно 5, от приблизительно 4 до приблизительно 5, приблизительно 4, приблизительно 4,5 или приблизительно 5.

[00236] В некоторых LNP груз может содержать экзогенную донорную нуклеиновую кислоту и гРНК. Экзогенная донорная нуклеиновая кислота и гРНК могут находиться в различных соотношениях. Например, состав LNP может включать в себя соотношение экзогенной донорной нуклеиновой кислоты к нуклеиновой кислоте гРНК, находящееся в диапазоне от приблизительно 25:1 до приблизительно 1:25, находящееся в диапазоне от приблизительно 10:1 до приблизительно 1:10, находящееся в диапазоне от приблизительно 5:1 до приблизительно 1:5, или приблизительно 1:1. Альтернативно, состав LNP может включать в себя соотношение экзогенной донорной нуклеиновой кислоты к нуклеиновой кислоте гРНК от приблизительно 1:1 до приблизительно 1:5, приблизительно 5:1 до приблизительно 1:1, приблизительно 10:1 или приблизительно 1:10. Альтернативно, состав LNP может включать в себя соотношение экзогенной донорной нуклеиновой кислоты к нуклеиновой кислоте гРНК, составляющее приблизительно 1:10, 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10 или 1:25.

[00237] Конкретный пример подходящего LNP характеризуется соотношение азота к фосфату (N/P), составляющим 4,5, и содержит биоразлагаемый катионный липид, холестерин, DSPC и PEG2k-DMG в молярном соотношении 45:44:9:2. Биоразлагаемый катионный липид может представлять собой (9Z,12Z)-3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропилооктадека-9,12-диеноат, также называемый 3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропил-(9Z,12Z)-октадека-9,12-диеноат. См., например, Finn et al. (2018) Cell Reports 22:1-9, полностью включенный в настоящий документ посредством ссылки для всех целей. Другой конкретный пример подходящего LNP содержит Dlin-MC3-DMA (МС3), холестерин, DSPC и PEG-DMG в молярном соотношении 50:38,5:10:1,5.

[00238] Способ доставки можно выбрать для снижения иммуногенности. Например, гРНК и экзогенную донорную нуклеиновую кислоту можно доставлять разными способами (например, бимодальной доставкой). Эти различные способы могут придавать различные фармакодинамические или фармакокинетические свойства изучаемой доставляемой молекуле (например, кодирование гРНК или нуклеиновой кислоты или экзогенная донорная нуклеиновая кислота/матрица для репарации). Например, разные способы могут привести к разному распределению в ткани, разному периоду полужизни или разному распределению по времени. Некоторые способы доставки (например, доставка нуклеиновокислотного вектора, который сохраняется в клетке посредством автономной репликации или геномной интеграции) приводят к более постоянной экспрессии и присутствию молекулы, тогда как другие способы доставки являются временными и менее постоянными (например, доставка РНК или белка). Доставка компонентов более временным способом, например, в виде РНК или белка, может гарантировать, что комплекс Cas/гРНК присутствует и активен только в течение короткого периода времени, и может снизить иммуногенность. Такая временная доставка может также уменьшить вероятность нецелевых модификаций.

[00239] Введение in vivo можно осуществлять любым подходящим путем, включая в себя, например, парентеральный, внутривенный, пероральный, подкожный, внутриартериальный, внутричерепной, интратекальный, интраперитонеальный, местный, интраназальный или внутримышечный. Способы системного введения включают в себя, например, пероральный и парентеральный пути. Примеры парентеральных путей включают в себя внутривенный, внутриартериальный, внутрикостный, внутримышечный, внутрикожный, подкожный, интраназальный и интраперитонеальный пути. Конкретным примером является внутривенная инфузия. Способы местного введения включают в себя, например, интратекальный, интрацеребровентрикулярный, интрапаренхиматозный (например, локализованная интрапаренхиматозная доставку в следующее: стриатум (например, в хвостатое ядро или в путамен), кора головного мозга, прецентральная извилина, гиппокамп (например, зубчатая извилина или область САЗ), височная кора, миндалина, лобная кора, таламус, мозжечок, продолговатый мозг, гипоталамус, крыша среднего мозга, покрышка среднего мозга или черная субстанция), интраокулярный, интраорбитальный, субконъюктивальный, интравитреальный, субретинальный и транссклеральный пути. Значительно меньшие количества компонентов (по сравнению с системными подходами) могут оказывать эффект при местном введении (например, интрапаренхиматозном или интравитреальном) по сравнению с системным введением (например, введением внутривенно). Местные способы введения также могут уменьшать или устранять возникновение потенциально токсических побочных эффектов, которые могут возникнуть, когда терапевтически эффективные количества компонента вводятся системно.

[00240] Введение in vivo можно осуществлять любым подходящим путем, включая в себя, например, парентеральный, внутривенный, пероральный, подкожный, внутриартериальный, внутричерепной, интратекальный, интраперитонеальный, местный, интраназальный или внутримышечный. Конкретным примером является внутривенная инфузия. Закапывание в нос и интравитреальная инъекция являются другими конкретными примерами. Композиции, содержащие гидовые РНК (или нуклеиновые кислоты, кодирующие гидовые РНК), можно составить с использованием одного или нескольких физиологически и фармацевтически приемлемых носителей, разбавителей, вспомогательных веществ или добавок. Состав может зависеть от выбранного пути введения. Термин «фармацевтически приемлемый» означает, что носитель, разбавитель, вспомогательное вещество или добавка совместимы с другими ингредиентами состава и по существу не вредны для их реципиента.

[00241] Частота введения и количество дозировок могут зависеть от периода полужизни экзогенных донорных нуклеиновых кислот или гидовых РНК (или нуклеиновых кислот, кодирующих гидовые РНК) и пути введения среди других факторов. Введение нуклеиновых кислот или белков в клетку или животному, не являющемуся человеком, можно выполнить один раз или несколько раз в течение периода времени. Например, введение можно выполнить по меньшей мере два раза в течение периода времени, по меньшей мере три раза в течение периода времени, по меньшей мере четыре раза в течение периода времени, по меньшей мере пять раз в течение периода времени, по меньшей мере шесть раз в течение периода времени, по меньшей мере семь раз в течение периода времени, по меньшей мере восемь раз в течение периода времени, по меньшей мере девять раз в течение периода времени, по меньшей мере в десять раз в течение периода времени, по меньшей мере одиннадцать раз, по меньшей мере двенадцать раз в течение периода времени, по меньшей мере тринадцать раз в течение периода времени, по меньшей мере четырнадцать раз в течение периода времени, по меньшей мере пятнадцать раз в течение периода времени, по меньшей мере шестнадцать раз в течение периода времени, по меньшей мере семнадцать раз в течение периода времени, по меньшей мере восемнадцать раз в течение периода времени, по меньшей мере девятнадцать раз в течение периода времени или по меньшей мере двадцать раз в течение периода времени.

D. Измерение активности CRISPR/Cas in vivo и оценка модификации целевого геномного локуса

[00242] Раскрытые в настоящем документе способы могут дополнительно предусматривать оценку модификации целевого геномного локуса. Способы обнаружения или измерения экспрессии или активности будут зависеть от модифицируемого целевого геномного локуса.

[00243] Например, если целевой геномный локус содержит ген, кодирующий РНК или белок, и предусмотренная модификация заключается в изменении экспрессии кодируемой РНК или белка, способ оценки модификации целевого геномного локуса может предусматривать измерение экспрессии или активности кодируемой РНК или белка. Например, если кодируемый белок представляет собой белок, высвобождающийся в сыворотку, можно измерить содержания в сыворотке кодируемого белка. Анализы для измерения содержаний и активности РНК и белков являются хорошо известными.

[00244] Альтернативно, раскрытые в настоящем документе способы могут дополнительно предусматривать идентификацию клетки, содержащей модифицированный целевой геномный локус, в которой последовательность была модифицирована с помощью негомологичного соединения концов (например, присутствие небольших вставок или делеций (инделей)) после расщепления с помощью CRISPR/Cas, в которой последовательность в целевом геномном локусе между двумя целевыми последовательностями гидовой РНК была вырезана или в которой целевой геномный локус был модифицирован с помощью рекомбинации с экзогенной донорной нуклеиновой кислотой. Различные способы можно использовать для идентификации клеток с целевой генетической модификацией. Скрининг может включать в себя количественный анализ для оценки модификации аллеля (МОА) родительской хромосомы. Например, количественный анализ можно выполнить с помощью количественной ПЦР, такой как ПЦР в режиме реального времени (кПЦР). ПНР в режиме реального времени может использовать первый набор праймеров, который распознает целевой локус, и второй набор праймеров, который распознает нецелевой эталонный локус. Набор праймеров может содержать флуоресцентный зонд, который распознает амплифицированную последовательность. Другие примеры подходящих количественных анализов включают в себя флуоресцентно-опосредованную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным(и) зондом(ами), зонды INVADER®, зонды TAQMAN® Molecular Beacon или технологию зондов ECLIPSE™ (см., например, US 2005/0144655, полностью включенную в настоящий документ посредством ссылки для всех целей).

[00245] Секвенирование следующего поколения (NGS) также можно использовать для скрининга. Секвенирование следующего поколения может также носить название «NGS» или «массовое параллельное секвенирование» или «высокопроизводительное секвенирование». NGS можно использовать в качестве инструмента скрининга в дополнение к анализам МОА для определения точного характера целевой генетической модификации и того, является ли это согласованным по типам клеток или типов тканей или типов органов.

[00246] Оценить модификацию целевого геномного локуса у животного, не являющегося человеком, можно в любом типе клеток из любой ткани или органа. Например, модификацию целевого геномного локуса можно оценить в нескольких типах клеток из одной и той же ткани или органа или в клетках из нескольких мест в ткани или органе. Это может предоставить информацию о том, какие типы клеток в целевой ткани или органе модифицируются или какие участки ткани или органа достигаются CRISPR/Cas и модифицируются. В качестве другого примера модификацию целевого геномного локуса можно оценить в нескольких типах тканей или в нескольких органах. В способах, в которых нацеленное воздействие производят на конкретную ткань или орган, это может предоставить информацию о том, насколько эффективно происходит нацеленное воздействие на эту ткань или орган и есть ли нецелевые эффекты в других тканях или органах.

[00247] В некоторых конкретных примерах эспрессирующих Cas9 не являющихся человеком животных можно использовать для оценки частоты редактирования различных гидовых РНК. Гидовые РНК можно вводить либо в виде одной гидовой РНК (модифицированной и немодифицированной), либо дуплексной РНК или экспрессировать под контролем промотора U6 (например, посредством AAV). эспрессирующих Cas9 не являющихся человеком животных также можно скрещивать с не являющимися человеком животными, включая в себя не являющихся человеком животных с гуманизированными аллелями, экспрессирующих гидовые РНК, для оценки при моделировании заболеваний.

IV. Способы получения не являющихся человеком животных, содержащих экспрессионную кассету Cos и/или экспрессионную кассету рекомбиназы

[00248] Предусмотрены различные способы получения не являющегося человеком животного, содержащего одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы, как раскрыто в другом месте в настоящем документе. Любой общепринятый способ или протокол получения генетически модифицированного организма является подходящим для получения такого генетически модифицированного не являющегося человеком животного. См., например, Cho et al. (2009) Current Protocols in Cell Biology 42:19.11:19.11.1-19.11.22 и Gama Sosa et al. (2010) Brain Struct. Funct. 214(2-3):91-109, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. Такие генетически модифицированные не являющиеся человеком животные могут быть получены, например, посредством нокина гена в целевом локусе (например, локусе «безопасная гавань», таком как Rosa26) или посредством применения случайно интегрирующегося трансгена. См., например, международные патентные публикации WO 2014/093622 и WO 2013/176772, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Способы нацеливания конструкта на локус Rosa26 описаны, например, в US 2012/0017290, US 2011/0265198 и US 2013/0236946, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей.

[00249] Например, способ получения не являющегося человеком животного, содержащего одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы, как раскрыто в другом месте в настоящем документе, может предусматривать следующее: (1) модификация генома плюрипотентной клетки для включения одной или нескольких или всех из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы; (2) идентификация или отбор генетически модифицированной плюрипотентной клетки, содержащей одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы; (3) введение генетически модифицированной плюрипотентной клетки в эмбрион животного-хозяина, не являющегося человеком; и (4) имплантация и вынашивание эмбриона-хозяина в организме суррогатной матери. Необязательно, эмбрион-хозяин, содержащий модифицированную плюрипотентную клетку (например, ES клетку, не относящуюся к человеку), может быть инкубирован до стадии бластоцисты перед имплантацией и гестацией в организме суррогатной матери для получения не являющегося человеком животного F0. Затем суррогатная мать может произвести не являющееся человеком животное поколения F0, содержащее одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы.

[00250] Способы могут дополнительно предусматривать идентификацию клетки или животного с модифицированным целевым геномным локусом. Различные способы можно использовать для идентификации клеток и животных с целевой генетической модификацией.

[00251] Стадия скрининга может предусматривать, например, количественный анализ для оценки модификации аллеля (МОА) родительской хромосомы. Например, количественный анализ можно выполнить с помощью количественной ПЦР, такой как ПЦР в режиме реального времени (кПЦР). В ПЦР в режиме реального времени можно использовать первый набор праймеров, который распознает целевой локус, и второй набор праймеров, который распознает нецелевой эталонный локус. Набор праймеров может содержать флуоресцентный зонд, который распознает амплифицированную последовательность.

[00252] Другие примеры подходящих количественных анализов включают в себя флуоресцентно-опосредованную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным(и) зондом(ами), зонды INVADER®, зонды TAQMAN® Molecular Beacon или технологию зондов ECLIPSE™ (см., например, US 2005/0144655, полностью включенную в настоящий документ посредством ссылки для всех целей).

[00253] Примером подходящей плюрипотентной клетки является эмбриональная стволовая (ES) клетка (например, ES клетка мыши или ES клетка крысы). Модифицированную плюрипотентную клетку можно создать, например, путем следующего: (а) введение в клетку одного или нескольких нацеливающих векторов, содержащих нуклеиновую кислоту-вставку, фланкированную 5' и 3' гомологичными плечами, соответствующими 5' и 3' целевым сайтам, причем нуклеиновая кислота-вставка содержит одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы; и (b) идентификация по меньшей мере одной клетки, содержащей в своем геноме нуклеиновую кислоту-вставку, интегрированную в целевом геномном локусе. Альтернативно, модифицированную плюрипотентную клетку можно получить следующим образом: (а) введение в клетку следующего: (i) нуклеазный агент, причем нуклеазный агент индуцирует одноцепочечный разрыв или двухцепочечный разрыв на целевой последовательности в пределах целевого геномного локуса; и (ii) один или несколько нацеливающих векторов, содержащих нуклеиновую кислоту-вставку, фланкированную 5' и 3' гомологичными плечами, соответствующими 5' и 3' целевым сайтам, расположенным в достаточной близости от целевой последовательности, причем нуклеиновая кислота-вставка содержит одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы; и (с) идентификация по меньшей мере одной клетки, содержащей модификацию (например, интеграцию нуклеиновой кислоты-вставки) в целевом геномном локусе. Можно использовать любой нуклеазный агент, который вызывает одноцепочечный разрыв или разрыв двухцепочечной цепи в требуемой целевой последовательности. Примеры подходящих нуклеаз включают в себя эффекторную нуклеазу, подобную активатору транскрипции (TALEN), нуклеазу домена «цинковые пальцы» (ZFN), мегануклеазу и системы сгруппированных регулярно перемежающихся коротких палиндромных повторов (CRISPRyCRISPR-ассоциированных белков (Cas) или компоненты таких системы (например, CRISPR/Cas9). См., например, US 2013/0309670 и US 2015/0159175, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей.

[00254] Донорную клетку можно вводить в эмбрион-хозяин на любой стадии, такой как стадия бластоцисты или стадия предморула (т.е. стадия 4 клеток или стадия 8 клеток). Создается потомство, способное передавать генетическую модификацию через зародышевую линию. См., например, патент США №7294754, полностью включенный в настоящий документ посредством ссылки для всех целей.

[00255] Альтернативно, способ получения не являющихся человеком животных, описанных в другом месте в настоящем документе, может предусматривать следующее: (1) модификация генома эмбриона одноклеточной стадии для включения в него одной или нескольких или всех из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы с использованием способов, описанных выше, для модификации плюрипотентных клеток; (2) отбор генетически модифицированных эмбрионов; и (3) имплантация и вынашивание генетически модифицированного эмбриона в организме суррогатной матери. Создается потомство, способное передавать генетическую модификацию через зародышевую линию.

[00256] Техники ядерного переноса также можно использовать для получения млекопитающих, не являющихся человеком. Вкратце, способы переноса ядра могут предусматривать следующие стадии: (1) энуклеация ооцита или получение энуклеированного ооцита; (2) выделение или получение донорной клетки или ядра для объединения с энуклеированным ооцитом; (3) вставка клетки или ядра в энуклеированный ооцит с образованием реконструированной клетки; (4) имплантация реконструированной клетки в матку животного с образованием эмбриона; и (5) обеспечение развития эмбриона. В таких способах ооциты, как правило, извлекают у умерших животных, хотя они могут быть выделены также из яйцеводов и/или яичников живых животных. Ооциты могут созревать в различных хорошо известных средах до энуклеации. Энуклеацию яйцеклетки можно выполнить с помощью ряда хорошо известных способов. Вставку донорной клетки или ядра в энуклеированный ооцит с образованием реконструированной клетки можно осуществить путем микроинъекции донорной клетки под вителлиновый слой перед слиянием. Слияние может быть индуцировано приложением электрического импульса постоянного тока через плоскость контакта/слияния (электрослияние), воздействием на клетки химических веществ, способствующих слиянию, таких как полиэтиленгликоль, или посредством инактивированного вируса, такого как вирус Сендай. Реконструированная клетка может быть активирована электрическими и/или неэлектрическими способами до, во время и/или после слияния донора-ядра и ооцита-реципиента. Способы активации включают в себя электрические импульсы, химически индуцированный шок, проникновение с помощью сперматозоидов, повышение содержания двухвалентных катионов в ооците и снижение фосфорилирования клеточных белков (как с помощью ингибиторов киназы) в ооците. Активированные реконструированные клетки или эмбрионы можно культивировать в хорошо известных средах и затем переносить в матку животного. См., например, документы US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234 и патент США №7612250, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей.

[00257] Различные способы, предусмотренные в настоящем документе, позволяют создавать генетически модифицированное животное F0, не являющееся человеком, причем клетки генетически модифицированного животного F0 содержат одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы. Признано, что в зависимости от способа, используемого для получения животного F0, число клеток в животном F0, которые содержат одну или несколько или все из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы, будет варьироваться. Введение донорных ES клеток в эмбрион на стадии предморула из соответствующего организма (например, эмбриона мыши на стадии 8 клеток), например, с помощью способа VELOCLMOUSE® позволяет получать больший процент клеточной популяции животного F0, которое содержит клетки, содержащие представляющую интерес нуклеотидную последовательность, содержащую целевую генетическую модификацию. Например, по меньшей мере 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% клеточного вклада животного F0, не являющегося человеком, могут содержать клеточную популяцию, содержащую целевую модификацию

[00258] Клетки генетически модифицированного животного F0 могут являться гетерозиготными по одной или нескольким или всем из экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы или могут являться гомозиготными по одной или нескольким или всем экспрессионной кассеты Cas и экспрессионной кассеты рекомбиназы.

[00259] Все патентные заявки, веб-сайты, другие публикации, регистрационные номера и тому подобное, указанные выше или ниже, полностью включены посредством ссылки для всех целей в той же степени, как если бы было специально и индивидуально указано, что каждый отдельный элемент включен в него посредством ссылки. Если разные версии последовательности связаны с регистрационным номером в разное время, подразумевается версия, связанная с регистрационным номером на дату подачи настоящей заявки. Действительная дата подачи означает более раннюю из действительной даты подачи или даты подачи приоритетной заявки со ссылкой на регистрационный номер, если необходимо. Аналогичным образом, если разные версии публикации, веб-сайта или тому подобного публикуются в разное время, подразумевается последняя версия, опубликованная на действительную дату подачи, если не указано иное. Любой признак, стадию, элемент, вариант осуществления или аспект настоящего изобретения можно использовать в сочетании с любым другим, если специально не указано иное. Хотя настоящее изобретение было описано более подробно с помощью иллюстрации и примера для ясности и понимания, будет очевидно, что определенные изменения и модификации можно осуществить в рамках объема прилагаемой формулы изобретения.

Краткое описание последовательностей

[00260] Нуклеотидные и аминокислотные последовательности, перечисленные в прилагаемом перечне последовательностей, показаны с использованием стандартных буквенных сокращений для нуклеотидных оснований и трехбуквенного кода для аминокислот. Нуклеотидные последовательности следуют стандартному соглашению, начиная с 5' конца последовательности и продвигаясь вперед (т.е. слева направо в каждой строке) до 3' конца. Показана только одна цепь каждой нуклеотидной последовательности, но считается, что комплементарная цепь включена в любую ссылку на отображаемую цепь. Когда представлена нуклеотидная последовательность, кодирующая аминокислотную последовательность, подразумевается, что также представлены ее кодон-вырожденные варианты, которые кодируют ту же аминокислотную последовательность. Аминокислотные последовательности следуют стандартному соглашению, начиная с амино-конца последовательности и продвигаясь вперед (т.е. слева направо в каждой строке) до карбокси-конца.

[00261] Таблица 3. Описание последовательностей.

ПРИМЕРЫ

Пример 1. Валидация экспрессирующих Cas9 мышей

[00262] CRISPR/Cas9, ДНК-эндонуклеаза, направляемая РНК, катализирует создание двухцепочечного разрыва (DSB) ДНК в сайте связывания ее РНК-гида. Иллюстративный РНК-гид может состоять из РНК CRISPR из 42 нуклеотидов (сrРНК), которая соединяется с трансактивирующей РНК из 87 нуклеотидов (tracrРНК). tracrРНК комплементарна и спарена по основаниям с сrРНК, образуя функциональный crРНК/tracrРНК-гид. Эта дуплексная РНК становится связанной с белком Cas9 с образованием активного рибонуклеопротеина (RNP), который может детально исследовать геном на предмет комплементарности с 20-нуклеотидной гидовой частью сrРНК. Вторичным требованием для разрыва цепи является то, что белок Cas9 должен распознавать мотив, прилегающий к протоспейсеру (РАМ), непосредственно примыкающий к последовательности, комплементарной гидовой части кРНК (целевая последовательность сrРНК). Альтернативно, активный комплекс RNP также может быть образован путем замены дуплекса crPHК/tracrPHК единой гидовой РНК (sgPHК), образованной путем ковалентного соединения сrРНК и tracrPHК. Такая sgPHК может быть образована, например, путем слияния 20 нуклеотидной гидовой части сrРНК непосредственно с процессированной последовательностью tracrPHК. sgPHК может взаимодействовать как с белком Cas9, так и с ДНК таким же образом и с той же эффективностью, что и дуплекс crPHК/tracrPHК. Было показано, что механизм естественной защиты бактерий CRISPR эффективно функционирует в клетках млекопитающих и активирует пути эндогенной репарации, вызванные разрывом. Когда в геноме происходит разрыв двойной цепи, пути репарации будут пытаться починить ДНК либо каноническими, либо альтернативными путями негомологичного соединения концов (NHEJ) или гомологичной рекомбинацией, также называемой гомологичной репарацией (HDR), если соответствующая матрица доступна. Авторы настоящего изобретения могут использовать эти пути для облегчения сайт-специфической делеции геномных областей или вставки экзогенной ДНК или HDR в клетки млекопитающих.

[00263] Система CRISPR/Cas9 является мощным инструментом для инженерии генома. Тем не менее, одним из ограничений системы для использования in vivo является необходимость одновременного введения всех компонентов в живой организм. Типичный способ введения этих компонентов в клетки заключается во транзиентной трансфекции ДНК-конструктов в клетки, которые будут генерировать соответствующие РНК и белок. Хотя этот подход эффективен, он имеет свойственный недостаток, поскольку клетки должны полагаться на конструкты плазмидной ДНК, чтобы сначала подвергнуться транскрипции, а затем трансляции, прежде чем белок Cas9 станет доступным для взаимодействия с компонентом sgPHК. Авторы настоящего изобретения полагают, что частота мутаций, индуцированных Cas9, и частота рекомбинации могут быть значительно улучшены при наличии конститутивно доступного белка.

[00264] Кодирующая последовательность Cas9 дикого типа (CDS) оптимизировали по кодонам для экспрессии в организме мышей. Затем включали N-концевой одинарный сигнал ядерной локализации (NLS), С-концевой двойной NLS и С-концевой связанный с Р2А флуоресцентный репортер GFP. экспрессионная кассета Cas9 (MAID2599) изображена на фигурах 1 и 14 и SEQ ID NO: 1. P2A-GFP можно использовать для лучшего отслеживания экспрессии Cas9 in vivo. Эти компоненты сконструировали в первый интрон локуса Rosa26 генома мыши вместе с предшествующей фланкированной loxP кассетой устойчивости к неомицину (кассета neo) с соответствующими сигналами сплайсинга и сильным сигналом полиаденилирования (polyA). Компоненты экспрессионной кассеты Cas9 от 5' до 3' показаны в таблице 4, а компоненты аллеля Cas9 после удаления фланкированной 1охР неомициновой кассеты, показаны в таблице 5. Последовательность белка Cas9-P2A-eGFP, кодируемая аллелем, представлена в SEQ ID NO: 13.

[00265] Таблица 4. Компоненты аллеля MAID2599 Cas9.

[00266] Таблица 5. Компоненты аллеля MAID2600 Cas9.

[00267] Перед удалением кассеты под действием Cre-рекомбиназы ген устойчивости к неомицину, как правило, будет эффективно транскрибироваться и транслироваться; однако CDS Cas9 обычно не экспрессируется из-за присутствия сильной области поли(А), которая может эффективно блокировать сквозную транскрипцию. После удаления неомициновой кассеты под действием Cre-рекомбиназы гибридная мРНК для белков Cas9 и GFP, как правило, обычно конститутивно экспрессируется с помощью промотора Rosa26. Нацеленные клетки до и после удаления неомициновой кассеты сначала верифицировали скринингом в отношении потери аллелей для обнаружения единственной сайт-специфической интеграции нацеливающего вектора в локусе Rosa26. Экспрессию Cas9 и GFP валидировали путем выделения общей РНК из нацеленных mESC с последующей обратной транскрипцией для создания кДНК и кПЦР TAQMAN® для обнаружения обратно транскрибированной кДНК (ОТ-кПЦР). В целом, созданная система способна непрерывно или условно экспрессировать постоянные уровни белка Cas9 (требуя удаления кассеты устойчивости к неомицину) в mESC и организме мышей, полученных из них.

[00268] Другую версию разработали без P2A-eGFP (MAID2660). См. фигуру 14. Компоненты экспрессионной кассеты Cas9 от 5' до 3' показаны в таблице 6, а компоненты аллеля Cas9 после удаления фланкированной loxP-сайтами неомициновой кассеты показаны в таблице 7. Последовательность белка Cas9, кодируемая аллелем, представлена в SEQ ID NO: 19.

[00269] Таблица 6. Компоненты аллеля MAID2660 Cas9.

[00270] Таблица 7. Компоненты аллеля MAID2661 Cas9.

[00271] Кроме того, разработали две версии с экзогенными промоторами CAGG и последовательностями метки 3xFLAG. Первая версия включала в себя P2A-eGFP (MAID2658), а вторую версию разработали без P2A-eGFP (MAID2672). См. фигуру 14. Компоненты первой версии экспрессионной кассеты CAGG-Cas9 от 5' до 3' показаны в таблице 8, и компоненты первой версии аллеля CAGG-Cas9 после удаления фланкированной loxP-сайтами неомициновой кассеты показаны в таблице 9. Последовательность белка 3xFLAG-Cas9-P2A-eGFP, кодируемая этим аллелем, представлена в SEQ ID NO: 16. Компоненты второй версии экспрессионной кассеты CAGG-Cas9 от 5' до 3' показаны в таблице 10, и компоненты второй версии аллеля CAGG-Cas9 после удаления фланкированной loxP-сайтами кассеты неомицина показаны в таблице 11. Последовательность белка 3xFLAG-Cas9, кодируемая этим аллелем, представлена в SEQ ID NO: 22.

[00272] Таблица 8. Компоненты аллеля MAID2658 Cas9.

[00273] Таблица 9. Компоненты аллеля MAID2659 Cas9.

[00274] Таблица 10. Компоненты аллеля MAID2672 Cas9.

[00275] Таблица 11. Компоненты аллеля MAID2673 Cas9.

[00276] Для валидации системы MAID2599/MAID2600 mESC Cas9 с неомициновой кассетой и без нее (MAID2599 и MAID2600 соответственно) трансфицировали двумя sgPHК, нацеливающимися на области старт- и стоп-кодонов первого целевого гена. См. фигуру 2А. Эффективность расщепления Cas9 затем оценивали с помощью скрининга в отношении потери аллелей для оценки доли клонов mESC с мутациями вставки-делеции в сайтах расщепления Cas9, нацеленных с помощью гРНК. Также определили долю клонов mESC, в которых ДНК между сайтами расщепления Cas9 была удалена на одном или обоих целевых аллелях, вызывая нулевую мутацию. Cas9 был способен вызывать эти геномные изменения только тогда, когда были удалены неомициновая кассета и поли(А) (стоп-последовательность) (MAID2600). Чтобы лучше оценить возможности редактирования генома в отношении гомологичной репарации, вводили sgPHК, нацеленную на второй целевой ген, вместе с одноцепочечный олигодезоксинуклеотидом (ssODN) в качестве донора точечной мутации. См. фигуру 2 В. Описанную в настоящем документе конститутивную систему экспрессии Cas9 сравнивали с традиционными способами введения Cas9 и sgPHК через плазмиды вместе с ssODN. Описанная в настоящем документе система экспрессии Cas9, в сочетании с плазмидой, экспрессирующей sgPHК, была способна активировать индуцированные разрывом пути эндогенной репарации для включения требуемой точечной мутации с частотой, которая была равна той, когда и Cas9 и sgPHК экспрессировались из экзогенной плазмид. Тем не менее, когда описанную в настоящем документе систему экспрессии Cas9 объединяли с напрямую доставленной sgPHК, она индуцировала направляемый гомологией мутагенез методом микроинъекций почти в два раза эффективнее способов доставки с помощью плазмиды.

[00277] Для определения эффективности эндогенно экспрессируемого Cas9 у живых мышей, эти нацеленные mESC вводили с помощью микроинъекции в 8-клеточные эмбрионы мыши с использованием метода VELOCIMOUSE®. См., например, патенты США №№ US 7576259; US 7659442; US 7294754; заявку на выдачу патента США №2008/007800; и Poueymirou et al. (2007) Nature Biotech. 25(l):91-99, причем каждый из этих документов полностью включен в настоящий документ посредством ссылки для всех целей. В частности, в вителлиновом слое создавали небольшое отверстие для облегчения инъекции нацеленной mESC. Эти инъецированные 8-клеточные эмбрионы переносили суррогатным матерям для получения живых мышат, несущих трансген. После беременности у суррогатной матери инъецированные эмбрионы продуцировали мышей F0, которые не несут определяемого вклада эмбрионов хозяина. Мыши, полностью полученные из клеток ES, были нормальными, здоровыми и фертильными (с трансмиссией зародышевой линии). Ткань собирали у мышей F0 с удаленной кассетой (MAID2600) для визуализации GFP, экспрессии мРНК Cas9 и экспрессии белка Cas9. См. фигуры 3A-3F (светлопольная визуализация и визуализация GFP) и фигуры 4А-4С (экспрессия мРНК Cas9 на фигурах 4А и 4С и экспрессия белка на фигуре 4 В). На фигуре 3D показана экспрессия eGFP у гетерозиготных по Rosa26Cas9 мышей (MAID2600), но отсутствует соответствующая экспрессия eGFP у мышей дикого типа в печени. На фигуре 3F показана экспрессия eGFP у гетерозиготных по Rosa26Cas9 мышей, но отсутствует соответствующая экспрессия eGFP у мышей дикого типа в головном мозге. Аналогично, экспрессия мРНК Cas9, анализируемая с помощью ОТ-кПЦР, наблюдалась у гетерозиготных по Rosa26Cas9 мышей в головном мозге, сердце, почках, печени, легких, четырехглавых мышцах, селезенке и тимусе, но в соответствующих тканях из диких животных экспрессия мРНК Cas9 не наблюдалась, типа мышей. См. фигуры 4А и 4С. В экспериментах равные массовые количества РНК из каждой ткани анализировали с помощью ОТ-кПЦР. Данные показывают, что экспрессирующие Cas9 мыши экспрессируют мРНК Cas9 на легко обнаруживаемом уровне во всех тканях. Различные ткани собирали от экспрессирующих Cas9 мышей. Три ткани собирали у четырнадцати мышей и еще пять тканей собирали у четырех мышей для оценки различий от мыши к мыши, а также от ткани к ткани в пределах мыши. В каждой из этих тканей экстрагировали РНК. Геномную ДНК подвергали разложению таким образом, чтобы она не учитывалась в реакции кПЦР. РНК подвергали обратной транскрипции, а затем использовали анализ, специфический для Cas9, для обнаружения транскриптов Cas9. Как и ожидалось, мыши Cas9 показали значительную экспрессию (значения ct ниже 30), тогда как мыши WT показали значения ct 30 и выше, что указывает на отсутствие эндогенной экспрессии белка Cas9.

[00278] Аналогичным образом, экспрессия белка Cas9, определенная с помощью вестерн-блоттинга с использованием антитела ThermFisher Cas9 МА5-23519 в разведении 1:250 и использованием актина в качестве контроля, показала экспрессию белка Cas9 у гетерозиготных по Rosa26Cas9 мышей (MAID2600) в селезенке, печени и головном мозге, тогда как белок Cas9 не наблюдался в тех же тканях у мышей дикого типа. См. фигуру 4 В. Все три теста показали постоянный уровень экспрессии во всех исследуемых тканях.

[00279] Затем был проводили эксперимент по нокауту целевого гена 3, который кодирует белок, секретируемый печенью и обнаруживаемый в сыворотке, путем введения sgРНК в первичные гепатоциты, выделенные из мышей с удаленной кассетой Cas9 (MAID2600), посредством доставки липидными наночастицами (LNP). См. фигуру 5 В. В качестве контроля те же способы введения sgРНК спаривали с экзогенной экспрессией Cas9 в первичных гепатоцитах, выделенных у мышей дикого типа (WT). См. фигуру 5А. Негомологичное соединение концов затем оценивали секвенированием следующего поколения (NGS) для измерения частоты инделей в локусе целевого гена 3. В эксперименте было три условия: (1) опосредованная LNP доставка мРНК GFP и контрольной (т.е. мертвой) sgРНК; (2) опосредованная LNP доставка мРНК GFP и гРНК для целевого гена 3; и (3) опосредованная LNP доставка мРНК Cas9 и гРНК для целевого гена 3). Для каждого условия протестировали четыре концентрации мРНК: 15,6 нг/мл, 62,5 нг/мл, 250 нг/мл и 1000 нг/мл. В первичных гепатоцитах мыши дикого типа дозозависимое увеличение частоты вставок/делеций наблюдали только при введении как мРНК Cas9, так и гРНК для целевого гена 3. В противоположность этому, в первичных гепатоцитах экспрессирующие Cas9 мыши сходный дозозависимый эффект наблюдался при введении гидовой РНК для целевого гена 3 с контрольной мРНК GFP вместо мРНК Cas9, и уровень частоты вставки/делеции являлся по существу идентичным уровням, наблюдаемым, когда также вводят мРНК Cas9.

[00280] Затем проводили эксперимент по нокауту целевого гена 3 in vivo путем введения sgРНК мышам с удаленной кассетой Cas9 (MAID2600) посредством гидродинамической доставки ДНК (HDD), доставки липидными наночастицами (LNP) или введения аденоассоциированного вируса (AAV), несущего последовательность экспрессии sgРНК путем инъекции в хвостовую вену. См. фигуры 6A-6D. В качестве контроля те же способы введения sgРНК спаривали с экзогенной экспрессией Cas9 у мышей дикого типа (WT). Для доставки, опосредованной LNP, протестировали три группы мышей: (1) экспрессирующие Cas9 мыши (3 самца + 3 самки; 2 мг/кг контрольной sgРНК + GFP мРНК); (2) экспрессирующие Cas9 мыши (3 самца + 3 самки; 2 мг/кг sgРНК для целевого гена 3 + GFP мРНК); и (3) WT мыши (3 самца + 3 самки; 2 мг/кг sgРНК для целевого гена 3 + Cas9 мРНК). Для AAV-опосредованной доставки протестировали две группы мышей: (1) экспрессирующие Cas9 мыши (3 самца + 3 самки; AAV8-sgРНК для целевого гена 3); и (2) WT мыши (3 самца + 3 самки; AAV8-sgРНК для целевого гена 3 + AAV8-Cas9). Для HDD протестировали две группы мышей: (1) экспрессирующие Cas9 мыши (3 самца + 3 самки; sgРНК для целевого гена 3); и (2) WT мыши (3 самца + 3 самки; sgРНК для целевого гена 3 + Cas9). экспрессирующие Cas9 мыши характеризовались согласованно и значительно более нацеленной инактивацией гена, чем мыши WT с экзогенной экспрессией Cas9.

[00281] Неожиданно, AAV8-опосредованная доставка sgРНК целевого гена 3 эспрессирующим Cas9 мышам (MAID2600) являлась более эффективной, чем доставка, опосредованная LNP, или HDD при нацеливании на целевой ген 3 печени. См. фигуры 6A-6D. Кроме того, AAV8-опосредованная доставка sgРНК целевого гена 3 эспрессирующим Cas9 мышам, являлась более эффективной, чем AAV8-опосредованная доставка как sgРНК целевого гена, так и Cas9 мышам WT, тогда как между обоими условиями с использованием LNP-опосредованной доставки или HDD не наблюдалось значительного различия доставка. См. фигуры 6A-6D. Эти результаты показывают, что AAV-опосредованная доставка гидовых РНК эспрессирующим Cas9 мышам может быть особенно эффективным средством для испытания активности гРНК in vivo. Содержания в сыворотке белка, кодируемого целевым геном 3 (т.е. целевым белком 3), измеряли у самок и самцов мышей на 7 и 21 день после введения компонентов CRISPR/Cas. Среди испытанных мышей были экспрессирующие Cas9 мыши и мыши дикого типа. Контроли включали в себя экспрессирующих Cas9 мышей и мышей WT, которым не вводили ни sgРНК, ни Cas9, ни целевой ген 3. Гидродинамическая доставка гидовой РНК или комбинации Cas9 и гидовой РНК не снижала содержания в сыворотке целевого белка 3 в значительной степени по сравнению с контрольными мышами WT, которым не вводили ни Cas9, ни гидовую РНК. Для доставки, опосредованной LNP, введение sgРНК эспрессирующим Cas9 мышам приводило к аналогичным содержаниям в сыворотке целевого белка по сравнению с мышами WT, которым вводили как Cas9, так и sgРНК, и каждое из этих условий приводило к пониженным содержаниям в сыворотке целевого белка 3 приблизительно на 50% по сравнению с эспрессирующих Cas9 контрольными мышами, которым не вводили ни Cas9, ни гидовую РНК. Однако при AAV8-опосредованной доставке доставка sgРНК эспрессирующим Cas9 мышам приводила к снижению в несколько раз в содержаниях в сыворотке целевого белка 3 по сравнению с мышами WT, которым вводили и Cas9, и sgРНК, и еще более значительным снижением по сравнению с контрольными мышами WT, которым не вводили ни Cas9, ни гидовую РНК. К 21 дню содержания в сыворотке целевого белка 3 упали почти до предела обнаружения у экспрессирующих Cas9 мышей, которым sgРНК вводили посредством AAV8.

[00282] На фигуре 7 показано процентное отношение активности NHEJ (частота инделей) в целевом локусе гена 3 в печени у мышей дикого типа и у мышей с удаленной кассетой Cas9 (MAID2600) через один месяц после доставки sgРНК с помощью липидных наночастиц (LNP) отдельно или вместе с мРНК Cas9, гидродинамической доставки (HDD) плазмиды sgРНК отдельно или вместе с плазмидой Cas9 или AAV8-sgРНК отдельно или вместе с AAV8-Cas9. Процентное отношение клеток печени со вставками/делециями (инделами) в локусе измеряли с помощью NGS. Гидродинамическая доставка гидовой РНК или комбинации Cas9 и гидовой РНК приводила к низкому процентному отношению инделей. Для доставки, опосредованной LNP, введение sgРНК эспрессирующим Cas9 мышам приводило к аналогичному процентному отношению инделей по сравнению с мышами WT, которым вводили как Cas9, так и sgРНК, и каждое из этих условий приводило к уровню процентного отношения инделей, который составлял приблизительно 40%. Однако для доставки, опосредованной AAV8, доставка sgРНК эспрессирующим Cas9 мышам приводила к гораздо большему проценту инделей (~ 75%) по сравнению с мышами WT, которым вводили как Cas9, так и sgРНК (~ 35%), и еще более значительному увеличению по сравнению с контрольными мышами WT, которым не вводили ни Cas9, ни гидовую РНК.

[00283] Дальнейшее секвенирование следующего поколения (NGS) также выполняли в собранных тканях. Секвенирование ампликона затем использовали для оценки объема редактирования в собранных тканях. Целевые специфические праймеры предназначены для производства продукта ~ 300 п.н., который немного смещен от центра вокруг предполагаемого сайта разреза гида. Затем к праймерам добавляют последовательности «адаптера», которые позволяют штрих-кодировать отдельные образцы во вторичной реакции ПЦР. После добавления штрих-кодов образцы объединяют и загружают в MiSeq. Ожидается от пяти тысяч до десяти тысяч прочтений в представляющей интерес области. Затем запускают программы обработки данных для сопоставления прочтений, чтобы определить точную последовательность каждого редактирования. Затем программа подсчитывает количество WT (неотредактированных) прочтений и предоставляет разбивку типа редактирования, выполненного для всех отредактированных прочтений (оценка количества пар оснований, добавленных и/или удаленных в прогнозируемой области редактирования).

[00284] Затем проводили эксперимент по нокауту целевого гена 4, который кодирует связанный с мембраной гликопротеин II типа, путем введения Cas9 с sgРНК, нацеленной на экзона 2 целевого гена 4 в первичные гепатоциты, выделенные от мышей дикого типа (WT). Протестировали пять различных sgРНК (гиды 1-5). Рибонуклеопротеиновые комплексы Cas9/sgРНК (RNP) вводили в клетки с помощью липофектамина. Негомологичное соединение концов затем оценивали секвенированием следующего поколения (NGS) для измерения частот инделей в локусе целевого гена 4. Процентное редактирование является мерой общего количества событий NHEJ по отношению к общему количеству прочтений. События NHEJ считаются всеми редактированиями (вставка, удаление, изменение основания), которые происходят в 20 п. н. до и после сайта разреза. Процент редактирования для гидов с 1 по 5 являлся следующим: 35,4%, 37,4%, 43,8%, 51,2% и 55,8% соответственно (данные не показаны).

[00285] Затем проводили эксперимент по нокауту целевого гена 4 in vivo путем введения тех же пяти sgРНК отдельным мышам с удаленной кассетой Cas9 (MAID2600) посредством AAV8. В частности, отдельные гиды, экспрессируемые промотором U6, упаковывали в AAV8 и вводили 6-12-недельным мышам с удаленной кассетой Cas9 путем инъекции в хвостовую вену. Введенная вирусная нагрузка составляла 1×1011 - 1×1012, в приблизительном объеме, составляющем 50-100 мкл. Печень собирали через 3-4 недели после инъекции. Процентное редактирование рассчитывали так же, как в первичных гепатоцитах, и оно показано на фигуре 8А. Уровни редактирования соответствовали и фактически превышали уровни редактирования, наблюдаемые в первичных гепатоцитах. Кроме того, протестировали уровни экспрессии мРНК, транскрибированной из целевого гена 4. Как показано на фиг. 8В, каждая гРНК снижала относительные уровни мРНК, транскрибированной из целевого гена 4, в печени, собранной через 3-4 недели после инъекции.

[00286] Кроме того, провели эксперименты по исследованию процентного отношения редактирования в некоторых других целевых генах в печени. В каждом эксперименте возраст мышей составлял приблизительно 6-12 недель. Для каждого целевого гена разработали пять различных гидовых РНК по отношению к критически важным экзонам. Гидовые РНК доставляли посредством AAV8 путем инъекции в хвостовую вену с вирусными нагрузками, составляющими 1×1011 - 1×1012, в приблизительном объеме, составляющем 50-100 мкл. Печень собирали через 3-4 недели после инъекции. Процент редактирования определяли, как объяснено выше. Процент редактирования в печени у мышей с удаленной кассетой Cas9 (MAID2600) посредством доставки AAV8-rРНК показан в таблице 12. Наилучшая гРНК для каждого гена приводила к редактированию, составляющему 48%-70% в печени in vivo.

[00287] Таблица 12. Процентное отношение редактирования в печени.

Пример 2. Валидация индуцибельности экспрессирующих Cas9 мышей

[00288] Аллель LSL-Cas9, описанный в примере 1 (MAID2599), включает в себя фланкированную loxP-сайтами область poly(A) (lox-stop-lox, или LSL) выше кодирующей Cas9 последовательности. Перед удалением кассеты под действием Cre-рекомбиназы ген устойчивости к неомицину, как правило, будет эффективно транскрибироваться и транслироваться; однако CDS Cas9, как правило, не экспрессируется из-за присутствия сильной области poly(A), которая может эффективно блокировать сквозную транскрипцию. После удаления неомициновой кассеты под действием Cre-рекомбиназы гибридная мРНК для белков Cas9 и GFP, как правило, конститутивно экспрессируется промотором Rosa26. Это делает индуцируемым аллель Cas9. Это является благоприятным по ряду причин. Возможность редактирования некоторых генов в определенных тканях (например, иммунных клетках) может быть вредной, наряду с тем, что это потенциально вызывает иммунный ответ. Кроме того, в определенных обстоятельствах мутация гена во всем целевом индивидууме может быть летальной, тогда как мутация гена в конкретной ткани или типе клетки будет благоприятной. Индуцируемая природа аллеля MAID2599 обеспечивает большую специфичность в отношении того, какой тип ткани и клетки редактируется путем активации Cas9 только тканеспецифическим или клеточноспецифическим образом.

[00289] Для исследования индуцибельности экспрессии Cas9 в печени in vivo липидные наночастицы (LNP), содержащие мРНК Cre-рекомбиназы, составили на Precision Nanosystems Benchtop NanoAssmblr. мРНК Cre от Trilink (№ по кат. 7211) разбавляли в 10 мМ цитрате натрия и объединяли через кассету NanoAssemblr в соотношении 3:1 с липидной комбинацией катионного липида, DSPC, холестерина и PEG-DMG в молярном соотношении 50:10:38,5:1,5. Этот состав легко усваивается печенью. Полученный LNP-Cre вводили с помощью инъекции через хвостовую вену мышей LSL-Cas9 (MAID2599) в дозе, составляющей 1 мг/кг. Контрольным мышам LNP-Cre не вводили. Через 1 неделю мышей умерщвляли и извлекали органы для анализа вестерн-блоттинга с использованием моноклонального антитела к Cas9 (7А9) (Invitrogen, №по кат. МА5-23519) и моноклонального антитела к актину (С4) (Millipore Sigma, № по кат. МАВ1501). Органы от мышей с удаленной кассетой Cas9 (MAID2600) использовали в качестве положительного контроля. У этих мышей кассета LSL уже была удалена рекомбиназой Сге. Результаты показаны на фигуре 9, на которой показано экспериментальное подтверждение концепции специфической для печени активации Cas9 с доставкой LNP-Cre для редактирования специфичного для печени гена.

[00290] Затем индуцибельность Cas9-опосредованного редактирования генов тестировали in vivo. LNP-Cre составляли, как описано выше. Мышам вводили дозу LNP-Cre и AAV8-rРНК, нацеленную на целевой ген 3 (коинъекция посредством инъекции в хвостовую вену) в следующих группах: (1)3 мыши LSL-Cas9, получавшие лечение с помощью LNP-Cre и AAV8-rРНК; (2) 3 мыши LSL-Cas9, получавшие лечение с помощью LNP-Cre и PBS; (3) 3 мыши LSL-Cas9, получавшие лечение с помощью PBS и AAV8- гРНК; (4) 3 мыши LSL-Cas9, получавшие только PBS; (5) 3 мыши Cas9 с удаленной кассетой, получавшие лечение с помощью LNP-Cre; (6) 3 мыши Cas9 с удаленной кассетой, получавшие лечение с помощью AAV8- гРНК; (7) 3 мыши Cas9 с удаленной кассетой, получавшие лечение с помощью PBS; и (8) 3 мыши WT (не получавшие лечение). В группах, в которые был доставлен LNP-Cre, он был доставлен в концентрации, составляющей 1 мг/кг. В группах, в которые была доставлена AAV8- гРНК, она была доставлена при вирусной нагрузке, составляющей приблизительно 2×1011. Через одну и три недели после инъекции у мышей брали кровь для анализа химического состава сыворотки и для измерения содержаний циркулирующего в сыворотке целевого белка 3. Через три недели ткани также собирали для NGS и для анализа вестерн-блоттинга. Содержания в сыворотке целевого белка 3 измеряли с помощью ELISA. Результаты показаны на фигуре 10. Доставка LNP-Cre мышам LSL-Cas9 вместе с AAV8-rРНК приводила к снижению содержаний в сыворотке целевого белка 3, что согласуется со снижением, наблюдаемым у мышей Cas9 с удаленной кассетой, которым доставляли AAV8-rРНК. Эти результаты ELISA соответствовали результатам NGS в отношении процентного отношения редактирования в целевом гене 3 в печени, выделенной из мышей через 3 недели после инъекции. См. фигуру 11.

[00291] Затем мышей LSL-Cas9 скрещивали с мышами альбумин-Cre от Jax (3601-Tg(Alb-cre)21Mgn; MAID3601), в которых промотор альбумина функционально связан с кодирующей последовательностью Cre-рекомбиназы и управляет его экспрессией в печени. После скрещивания у мышей собирали несколько тканей для вестерн-блоттинга. Соответствующие ткани собирали от мышей LSL-Cas9, которых не скрещивали с мышами альбумина-Cre. Затем проводили вестерн-блоттинг для измерения экспрессии Cas9 в печени и головном мозге. Актин использовали в качестве контроля нагрузки. Предсказанный размер Cas9 составлял 150,48 кДа, а предсказанный размер актина составлял 41,25 кДа. Использовали 17,5 мкг лизатов белка печени и лизатов белка головного мозга. TruCut v2 Cas9 (17,5 мкг) использовали в качестве положительного контроля. Как показано на фигуре 12А, экспрессия Cas9 наблюдалась в печени мышей LSL-Cas9/Alb-Cre, но не в печени мышей LSL-Cas9. Экспрессия Cas9 не наблюдалась в тканях головного мозга ни у одной из мышей (см. фигуру 12 В), подтверждая, что экспрессия Cas9 индуцировалась специфически в печени.

[00292] Проводили эксперимент для испытания Cas9-опосредованного редактирования генов in vivo у этих мышей. Эксперимент включал в себя пять групп мышей в возрасте 8-12-недель, которым вводили инъекцию AAV8-rРНК, нацеленной на целевой ген 3, посредством инъекции в хвостовую вену: (1)3 мыши LSL-Cas9:Alb-Cre (MAID2599 Het (гетерозиготные), MAID3601 Het); (2) 3 мыши WT:Alb-Cre (MAID2599 WT, MAID3601 Het); (3) 3 мыши LSL-Cas9:WT (MAID2599 Het, MAID3601 WT); (4) 3 мыши Cas9 (MAID2600 Het или Horn (гомозиготные)); и (5) 3 мыши 75/25 (50500 WT). Мыши из каждой группы также служили в качестве контролей, которым не вводили инъекцию AAV8-rРНК. В группах, которым доставляли AAV8-rРНК, ее доставляли с вирусной нагрузкой, составляющей приблизительно 2×1011. Через одну неделю после инъекции у мышей проводили забор крови для анализа химического состава сыворотки и анализов ELISA. Через три недели после инъекции у мышей проводили забор крови и собирали ткани. Результаты показаны на фигуре 13. Скрещивание мышей LSL-Cas9 с мышами альбумин-Cre и затем введение с помощью инъекции AAV8-rРНК приводило к снижению содержаний в сыворотке целевого белка 3, что согласуется со снижением, наблюдаемым у мышей Cas9 с удаленной кассетой, которым доставляли AAV8-гРНК.

[00293] Описанная в настоящем документе система экспрессирующих Cas9 мышей способна вызывать более надежное редактирование генов, чем другие способы, основанные на экзогенном введении Cas9. Кроме того, система может условно экспрессировать Cas9 на основе делеции неомициновой кассеты. Комбинируя эту систему с различными линиями мышей, у которых вырезание участка ДНК обеспечивается Cre, можно контролировать время индуцированного Cas9 редактирования генома и обеспечивать тканеспецифическую экспрессию Cas9 in vivo.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110>Регенерон Фармасьютикалз, Инк.

<120>ЭКСПРЕССИРУЮЩИЕ CAS МЫШИНЫЕЭМБРИОНАЛЬНЫЕ СТВОЛОВЫЕ КЛЕТКИ И МЫШИ

И ИХ ПРИМЕНЕНИЯ

<130> 57766-516569

<150>US 62/539275

<151> 2017-07-31

<160> 38

<170>PatentIn версии 3.5

<210> 1

<211> 8628

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (424)..(2489)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (2517)..(2550)

<223> LoxP

<220>

<221> misc_feature

<222> (2599)..(2608)

<223> Kozak

<220>

<221> misc_feature

<222> (2605)..(6777)

<223> Cas9

<220>

<221> misc_feature

<222> (2614)..(2634)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (6730)..(6777)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (6778)..(6843)

<223> P2A

<220>

<221> misc_feature

<222> (6844)..(7557)

<223> eGFP

<220>

<221> misc_feature

<222> (7607)..(8203)

<223> WPRE

<220>

<221> misc_feature

<222> (8204)..(8419)

<223>сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (8479)..(8628)

<223>Нижележащая последовательность Rosa26 мыши

<400> 1

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctagttgaccag 180

ctcggcggtgacctgcacgtctagggcgcagtagtccagggtttccttgatgatgtcata 240

cttatcctgtcccttttttttccacagggcgcgccactagtggatccggaacccttaata 300

taacttcgtataatgtatgctatacgaagttattaggtccctcgacctgcaggaattgtt 360

gacaattaatcatcggcatagtatatcggcatagtataatacgacaaggtgaggaactaa 420

accatgggatcggccattgaacaagatggattgcacgcaggttctccggccgcttgggtg 480

gagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtg 540

ttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgcc 600

ctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgttcct 660

tgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaa 720

gtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatg 780

gctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaa 840

gcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggat 900

gatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcg 960

cgcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatc 1020

atggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggac 1080

cgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgg 1140

gctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttc 1200

tatcgccttcttgacgagttcttctgaggggatccgctgtaagtctgcagaaattgatga 1260

tctattaaacaataaagatgtccactaaaatggaagtttttcctgtcatactttgttaag 1320

aagggtgagaacagagtacctacattttgaatggaaggattggagctacgggggtggggg 1380

tggggtgggattagataaatgcctgctctttactgaaggctctttactattgctttatga 1440

taatgtttcatagttggatatcataatttaaacaagcaaaaccaaattaagggccagctc 1500

attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560

tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620

aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680

gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740

atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800

ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980

tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040

aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220

atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460

catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520

cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580

gcccgggaat tcgctagggc caccatggac aagcccaaga aaaagcggaa agtgaagtac 2640

agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac 2700

aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg acaggcacag catcaagaag 2760

aacctgatcg gcgccctgct gttcgacagc ggcgaaacag ccgaggccac cagactgaag 2820

agaaccgcca gaagaagata caccaggcgg aagaacagga tctgctatct gcaagagatc 2880

ttcagcaacg agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc 2940

ctggtggaag aggacaagaa gcacgagaga caccccatct tcggcaacat cgtggacgag 3000

gtggcctacc acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc 3060

accgacaagg ccgacctgag actgatctac ctggccctgg cccacatgat caagttcaga 3120

ggccacttcc tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc 3180

atccagctgg tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc 3240

gtggacgcca aggctatcct gtctgccaga ctgagcaaga gcagaaggct ggaaaatctg 3300

atcgcccagc tgcccggcga gaagaagaac ggcctgttcg gcaacctgat tgccctgagc 3360

ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag 3420

ctgagcaagg acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag 3480

tacgccgacc tgttcctggc cgccaagaac ctgtctgacg ccatcctgct gagcgacatc 3540

ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac 3600

gacgagcacc accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag 3660

aagtacaaag aaatcttctt cgaccagagc aagaacggct acgccggcta catcgatggc 3720

ggcgctagcc aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc 3780

accgaggaac tgctcgtgaa gctgaacaga gaggacctgc tgagaaagca gagaaccttc 3840

gacaacggca gcatccccca ccagatccac ctgggagagc tgcacgctat cctgagaagg 3900

caggaagatt tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc 3960

ttcaggatcc cctactacgt gggccccctg gccagaggca acagcagatt cgcctggatg 4020

accagaaaga gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc 4080

gccagcgccc agagcttcat cgagagaatg acaaacttcg ataagaacct gcccaacgag 4140

aaggtgctgc ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc 4200

aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 4260

aaggccatcg tggacctgct gttcaagacc aacagaaaag tgaccgtgaa gcagctgaaa 4320

gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat 4380

agattcaacg cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac 4440

ttcctggata acgaagagaa cgaggacatt ctggaagata tcgtgctgac cctgacactg 4500

tttgaggacc gcgagatgat cgaggaaagg ctgaaaacct acgctcacct gttcgacgac 4560

aaagtgatga agcagctgaa gagaaggcgg tacaccggct ggggcaggct gagcagaaag 4620

ctgatcaacg gcatcagaga caagcagagc ggcaagacaa tcctggattt cctgaagtcc 4680

gacggcttcg ccaaccggaa cttcatgcag ctgatccacg acgacagcct gacattcaaa 4740

gaggacatcc agaaagccca ggtgtccggc cagggcgact ctctgcacga gcatatcgct 4800

aacctggccg gcagccccgc tatcaagaag ggcatcctgc agacagtgaa ggtggtggac 4860

gagctcgtga aagtgatggg cagacacaag cccgagaaca tcgtgatcga gatggctaga 4920

gagaaccaga ccacccagaa gggacagaag aactcccgcg agaggatgaa gagaatcgaa 4980

gagggcatca aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag 5040

ctgcagaacg agaagctgta cctgtactac ctgcagaatg gccgggatat gtacgtggac 5100

caggaactgg acatcaacag actgtccgac tacgatgtgg accatatcgt gcctcagagc 5160

tttctgaagg acgactccat cgataacaaa gtgctgactc ggagcgacaa gaacagaggc 5220

aagagcgaca acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcgacag 5280

ctgctgaacg ccaagctgat tacccagagg aagttcgata acctgaccaa ggccgagaga 5340

ggcggcctga gcgagctgga taaggccggc ttcatcaaga ggcagctggt ggaaaccaga 5400

cagatcacaa agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgaa 5460

aacgataagc tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat 5520

ttccggaagg atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac 5580

gacgcctacc tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa 5640

agcgagttcg tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc 5700

gagcaggaaa tcggcaaggc taccgccaag tacttcttct acagcaacat catgaacttt 5760

ttcaagaccg aaatcaccct ggccaacggc gagatcagaa agcgccctct gatcgagaca 5820

aacggcgaaa ccggggagat cgtgtgggat aagggcagag acttcgccac agtgcgaaag 5880

gtgctgagca tgccccaagt gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc 5940

agcaaagagt ctatcctgcc caagaggaac agcgacaagc tgatcgccag aaagaaggac 6000

tgggacccca agaagtacgg cggcttcgac agccctaccg tggcctactc tgtgctggtg 6060

gtggctaagg tggaaaaggg caagtccaag aaactgaaga gtgtgaaaga gctgctgggg 6120

atcaccatca tggaaagaag cagctttgag aagaacccta tcgactttct ggaagccaag 6180

ggctacaaag aagtgaaaaa ggacctgatc atcaagctgc ctaagtactc cctgttcgag 6240

ctggaaaacg gcagaaagag aatgctggcc tctgccggcg aactgcagaa gggaaacgag 6300

ctggccctgc ctagcaaata tgtgaacttc ctgtacctgg cctcccacta tgagaagctg 6360

aagggcagcc ctgaggacaa cgaacagaaa cagctgtttg tggaacagca taagcactac 6420

ctggacgaga tcatcgagca gatcagcgag ttctccaaga gagtgatcct ggccgacgcc 6480

aatctggaca aggtgctgtc tgcctacaac aagcacaggg acaagcctat cagagagcag 6540

gccgagaata tcatccacct gttcaccctg acaaacctgg gcgctcctgc cgccttcaag 6600

tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt gctggacgcc 6660

accctgatcc accagagcat caccggcctg tacgagacaa gaatcgacct gtctcagctg 6720

ggaggcgaca agagacctgc cgccactaag aaggccggac aggccaaaaa gaagaaggga 6780

agcggagcca ctaacttctc cctgttgaaa caagcagggg atgtcgaaga gaatcccggg 6840

ccagtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 6900

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 6960

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 7020

ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 7080

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 7140

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 7200

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 7260

aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 7320

ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 7380

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 7440

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 7500

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 7560

acgcgtatgc atggccggcc ctgcaggaat tcgatatcaa gcttatcgat aatcaacctc 7620

tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 7680

tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 7740

ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 7800

tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 7860

ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 7920

cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 7980

acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 8040

ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 8100

accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 8160

ctcagacgag tcggatctcc ctttgggccg cctccccgca tcgcgacctc gacctcgact 8220

gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 8280

gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 8340

agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 8400

gaagacaatg gcaggcatgc tggggaacta gtggtgccag ggcgtgccct tgggctcccc 8460

gggcgcggcg gccatcgctc gagtaaaatt ggagggacaa gacttcccac agattttcgg 8520

ttttgtcggg aagtttttta ataggggcaa ataaggaaaa tgggaggata ggtagtcatc 8580

tggggtttta tgcagcaaaa ctacaggtta ttattgcttg tgatccgc 8628

<210> 2

<211> 18

<212> PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 2

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

GlyPro

<210> 3

<211> 19

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 3

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

ProGlyPro

<210> 4

<211> 20

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 4

GlnCysThrAsnTyrAlaLeuLeuLysLeuAlaGlyAspValGluSer

1 5 10 15

AsnProGlyPro

20

<210> 5

<211> 22

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 5

ValLysGlnThrLeuAsnPheAspLeuLeuLysLeuAlaGlyAspVal

1 5 10 15

Glu Ser Asn Pro Gly Pro

20

<210> 6

<211> 82

<212> RNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 6

guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60

aaaaguggcaccgagucggugc 82

<210> 7

<211> 76

<212>RNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 7

guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagu 60

ggcaccgagucggugc 76

<210> 8

<211> 86

<212>RNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 8

guuuaagagcuaugcuggaaacagcauagcaaguuuaaauaaggcuaguccguuaucaac 60

uugaaaaaguggcaccgagucggugc 86

<210> 9

<211> 23

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> misc_feature

<222> (2)..(21)

<223> n = A, T, Cили G

<400> 9

gnnnnnnnnnnnnnnnnnnnngg 23

<210> 10

<211> 23

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> misc_feature

<222> (1)..(21)

<223> n = A, T, Cили G

<400> 10

nnnnnnnnnnnnnnnnnnnnngg 23

<210> 11

<211> 25

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> misc_feature

<222> (3)..(23)

<223> n = A, T, Cили G

<400> 11

ggnnnnnnnnnnnnnnnnnnnnngg 25

<210> 12

<211> 6411

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (382)..(391)

<223> Kozak

<220>

<221> misc_feature

<222> (388)..(4560)

<223> Cas9

<220>

<221> misc_feature

<222> (397)..(417)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (4513)..(4560)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (4561)..(4626)

<223> P2A

<220>

<221> misc_feature

<222> (4627)..(5340)

<223> eGFP

<220>

<221> misc_feature

<222> (5390)..(5986)

<223> WPRE

<220>

<221> misc_feature

<222> (5987)..(6202)

<223>сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (6262)..(6411)

<223>Нижележащая последовательность Rosa26 мыши

<400> 12

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctagttgaccag 180

ctcggcggtgacctgcacgtctagggcgcagtagtccagggtttccttgatgatgtcata 240

cttatcctgtcccttttttttccacagggcgcgccactagtggatccggaacccttaata 300

taacttcgtataatgtatgctatacgaagttattaggtccctcgacctgcagcccaagct 360

agtgcccgggaattcgctagggccaccatggacaagcccaagaaaaagcggaaagtgaag 420

tacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatcaccgacgag 480

tacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgacaggcacagcatcaag 540

aagaacctgatcggcgccctgctgttcgacagcggcgaaacagccgaggccaccagactg 600

aagagaaccgccagaagaagatacaccaggcggaagaacaggatctgctatctgcaagag 660

atcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtcc 720

ttcctggtggaagaggacaagaagcacgagagacaccccatcttcggcaacatcgtggac 780

gaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggac 840

agcaccgacaaggccgacctgagactgatctacctggccctggcccacatgatcaagttc 900

agaggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctg 960

ttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagc 1020

ggcgtggacgccaaggctatcctgtctgccagactgagcaagagcagaaggctggaaaat 1080

ctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacctgattgccctg 1140

agcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactg 1200

cagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgac 1260

cagtacgccgacctgttcctggccgccaagaacctgtctgacgccatcctgctgagcgac 1320

atcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagaga 1380

tacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcct 1440

gagaagtacaaagaaatcttcttcgaccagagcaagaacggctacgccggctacatcgat 1500

ggcggcgctagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggac 1560

ggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgagaaagcagagaacc 1620

ttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgctatcctgaga 1680

aggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctg 1740

accttcaggatcccctactacgtgggccccctggccagaggcaacagcagattcgcctgg 1800

atgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaag 1860

ggcgccagcgcccagagcttcatcgagagaatgacaaacttcgataagaacctgcccaac 1920

gagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtacaacgagctg 1980

accaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcag 2040

aaaaaggccatcgtggacctgctgttcaagaccaacagaaaagtgaccgtgaagcagctg 2100

aaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaa 2160

gatagattcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaag 2220

gacttcctggataacgaagagaacgaggacattctggaagatatcgtgctgaccctgaca 2280

ctgtttgaggaccgcgagatgatcgaggaaaggctgaaaacctacgctcacctgttcgac 2340

gacaaagtgatgaagcagctgaagagaaggcggtacaccggctggggcaggctgagcaga 2400

aagctgatcaacggcatcagagacaagcagagcggcaagacaatcctggatttcctgaag 2460

tccgacggcttcgccaaccggaacttcatgcagctgatccacgacgacagcctgacattc 2520

aaagaggacatccagaaagcccaggtgtccggccagggcgactctctgcacgagcatatc 2580

gctaacctggccggcagccccgctatcaagaagggcatcctgcagacagtgaaggtggtg 2640

gacgagctcgtgaaagtgatgggcagacacaagcccgagaacatcgtgatcgagatggct 2700

agagagaaccagaccacccagaagggacagaagaactcccgcgagaggatgaagagaatc 2760

gaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacc 2820

cagctgcagaacgagaagctgtacctgtactacctgcagaatggccgggatatgtacgtg 2880

gaccaggaactggacatcaacagactgtccgactacgatgtggaccatatcgtgcctcag 2940

agctttctgaaggacgactccatcgataacaaagtgctgactcggagcgacaagaacaga 3000

ggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcga 3060

cagctgctgaacgccaagctgattacccagaggaagttcgataacctgaccaaggccgag 3120

agaggcggcctgagcgagctggataaggccggcttcatcaagaggcagctggtggaaacc 3180

agacagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgac 3240

gaaaacgataagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtcc 3300

gatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcc 3360

cacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctg 3420

gaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaag 3480

agcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaac 3540

tttttcaagaccgaaatcaccctggccaacggcgagatcagaaagcgccctctgatcgag 3600

acaaacggcgaaaccggggagatcgtgtgggataagggcagagacttcgccacagtgcga 3660

aaggtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggc 3720

ttcagcaaagagtctatcctgcccaagaggaacagcgacaagctgatcgccagaaagaag 3780

gactgggaccccaagaagtacggcggcttcgacagccctaccgtggcctactctgtgctg 3840

gtggtggctaaggtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctg 3900

gggatcaccatcatggaaagaagcagctttgagaagaaccctatcgactttctggaagcc 3960

aagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttc 4020

gagctggaaaacggcagaaagagaatgctggcctctgccggcgaactgcagaagggaaac 4080

gagctggccctgcctagcaaatatgtgaacttcctgtacctggcctcccactatgagaag 4140

ctgaagggcagccctgaggacaacgaacagaaacagctgtttgtggaacagcataagcac 4200

tacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgac 4260

gccaatctggacaaggtgctgtctgcctacaacaagcacagggacaagcctatcagagag 4320

caggccgagaatatcatccacctgttcaccctgacaaacctgggcgctcctgccgccttc 4380

aagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggac 4440

gccaccctgatccaccagagcatcaccggcctgtacgagacaagaatcgacctgtctcag 4500

ctgggaggcgacaagagacctgccgccactaagaaggccggacaggccaaaaagaagaag 4560

ggaagcggagccactaacttctccctgttgaaacaagcaggggatgtcgaagagaatccc 4620

gggccagtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctg 4680

gacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacc 4740

tacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggccc 4800

accctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatg 4860

aagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatc 4920

ttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacacc 4980

ctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctgggg 5040

cacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaag 5100

aacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctc 5160

gccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaac 5220

cactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatg 5280

gtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaag 5340

taaacgcgtatgcatggccggccctgcaggaattcgatatcaagcttatcgataatcaac 5400

ctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctcctttta 5460

cgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctt 5520

tcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccg 5580

ttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggg 5640

gcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgcca 5700

cggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggca 5760

ctgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtg 5820

ttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccag 5880

cggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttc 5940

gccctcagacgagtcggatctccctttgggccgcctccccgcatcgcgacctcgacctcg 6000

actgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgacc 6060

ctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgt 6120

ctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggat 6180

tgggaagacaatggcaggcatgctggggaactagtggtgccagggcgtgcccttgggctc 6240

cccgggcgcggcggccatcgctcgagtaaaattggagggacaagacttcccacagatttt 6300

cggttttgtcgggaagttttttaataggggcaaataaggaaaatgggaggataggtagtc 6360

atctggggttttatgcagcaaaactacaggttattattgcttgtgatccgc 6411

<210> 13

<211> 1651

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>MISC_FEATURE

<222> (1)..(1391)

<223> Cas9

<220>

<221> MISC_FEATURE

<222> (1392)..(1413)

<223> P2A

<220>

<221> MISC_FEATURE

<222> (1414)..(1651)

<223> eGFP

<400> 13

Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu

1 5 10 15

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

20 25 30

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

35 40 45

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

50 55 60

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

65 70 75 80

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

85 90 95

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

100 105 110

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

115 120 125

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

130 135 140

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

145 150 155 160

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

165 170 175

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

180 185 190

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

195 200 205

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

210 215 220

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

225 230 235 240

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

245 250 255

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

260 265 270

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

275 280 285

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

290 295 300

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

305 310 315 320

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

325 330 335

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

340 345 350

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

355 360 365

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

370 375 380

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

385 390 395 400

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

405 410 415

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

420 425 430

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

435 440 445

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

450 455 460

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

465 470 475 480

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

485 490 495

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

500 505 510

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

515 520 525

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

530 535 540

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

545 550 555 560

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

565 570 575

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

580 585 590

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

595 600 605

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

610 615 620

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

625 630 635 640

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

645 650 655

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

660 665 670

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

675 680 685

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

690 695 700

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

705 710 715 720

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

725 730 735

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

740 745 750

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

755 760 765

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

770 775 780

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

785 790 795 800

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

805 810 815

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

820 825 830

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

835 840 845

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

850 855 860

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

865 870 875 880

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

885 890 895

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

900 905 910

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

915 920 925

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

930 935 940

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

945 950 955 960

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

965 970 975

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His

980 985 990

Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

995 1000 1005

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr

1010 1015 1020

Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys

1025 1030 1035

Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe

1040 1045 1050

Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1055 1060 1065

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys

1070 1075 1080

Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln

1085 1090 1095

Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser

1100 1105 1110

Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1115 1120 1125

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1130 1135 1140

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys

1145 1150 1155

Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile

1160 1165 1170

Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1175 1180 1185

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile

1190 1195 1200

Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys

1205 1210 1215

Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu

1220 1225 1230

Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1235 1240 1245

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln

1250 1255 1260

Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu

1265 1270 1275

Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn

1280 1285 1290

Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1295 1300 1305

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr

1310 1315 1320

Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile

1325 1330 1335

Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr

1340 1345 1350

Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1355 1360 1365

Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys

1370 1375 1380

Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly Ala Thr Asn Phe

1385 1390 1395

Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

1400 1405 1410

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1415 1420 1425

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser

1430 1435 1440

Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys

1445 1450 1455

Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu

1460 1465 1470

Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro

1475 1480 1485

Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu

1490 1495 1500

Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn

1505 1510 1515

Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val

1520 1525 1530

Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn

1535 1540 1545

Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val

1550 1555 1560

Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe

1565 1570 1575

Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp

1580 1585 1590

His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu

1595 1600 1605

Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp

1610 1615 1620

Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr

1625 1630 1635

Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

1640 1645 1650

<210> 14

<211> 10439

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221>misc_feature

<222> (195)..(1913)

<223>Промотор CAGG

<220>

<221> misc_feature

<222> (1996)..(2029)

<223> LoxP

<220>

<221> misc_feature

<222> (2120)..(4185)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (4213)..(4246)

<223> LoxP

<220>

<221> misc_feature

<222> (4341)..(4350)

<223> Kozak

<220>

<221> misc_feature

<222> (4350)..(4415)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (4416)..(8588)

<223> Cas9

<220>

<221> misc_feature

<222> (4425)..(4445)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (8541)..(8588)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (8589)..(8654)

<223> P2A

<220>

<221> misc_feature

<222> (8655)..(9368)

<223> eGFP

<220>

<221> misc_feature

<222> (9418)..(10014)

<223> WPRE

<220>

<221> misc_feature

<222> (10015)..(10230)

<223>сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (10290)..(10439)

<223>Нижележащая последовательность Rosa26 мыши

<400> 14

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctccttaattaa 180

ggcctccaaggcctactagttattaatagtaatcaattacggggtcattagttcatagcc 240

catatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgccca 300

acgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaataggga 360

ctttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatc 420

aagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcct 480

ggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtat 540

tagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatct 600

cccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcga 660

tgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggg 720

gcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttc 780

cttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgg 840

ggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgccc 900

gccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcc 960

tccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgtggctgcgtga 1020

aagccttgaggggctccgggagggccctttgtgcggggggagcggctcggggggtgcgtg 1080

cgtgtgtgtgtgcgtggggagcgccgcgtgcggctccgcgctgcccggcggctgtgagcg 1140

ctgcgggcgcggcgcggggctttgtgcgctccgcagtgtgcgcgaggggagcgcggccgg 1200

gggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcgtgcggggtgt 1260

gtgcgtgggggggtgagcagggggtgtgggcgcgtcggtcgggctgcaaccccccctgca 1320

cccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtacggggcg 1380

tggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgggcggggc 1440

ggggccgcctcgggccggggagggctcgggggaggggcgcggcggcccccggagcgccgg 1500

cggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcgagagggc 1560

gcagggacttcctttgtcccaaatctgtgcggagccgaaatctgggaggcgccgccgcac 1620

cccctctagcgggcgcggggcgaagcggtgcggcgccggcaggaaggaaatgggcgggga 1680

gggccttcgtgcgtcgccgcgccgccgtccccttctccctctccagcctcggggctgtcc 1740

gcggggggacggctgccttcgggggggacggggcagggcggggttcggcttctggcgtgt 1800

gaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagct 1860

cctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattcgctaggag 1920

aattgatttgataccgcgggccctaagtcgacatttaaatcatttaaatccactagtgga 1980

tccggaacccttaatataacttcgtataatgtatgctatacgaagttattaggtccctcg 2040

acctgcaggaattgttgacaattaatcatcggcatagtatatcggcatagtataatacga 2100

caaggtgaggaactaaaccatgggatcggccattgaacaagatggattgcacgcaggttc 2160

tccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctg 2220

ctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagac 2280

cgacctgtccggtgccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggc 2340

cacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactg 2400

gctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccga 2460

gaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctg 2520

cccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccgg 2580

tcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgtt 2640

cgccaggctcaaggcgcgcatgcccgacggcgatgatctcgtcgtgacccatggcgatgc 2700

ctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccg 2760

gctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaaga 2820

gcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattc 2880

gcagcgcatcgccttctatcgccttcttgacgagttcttctgaggggatccgctgtaagt 2940

ctgcagaaattgatgatctattaaacaataaagatgtccactaaaatggaagtttttcct 3000

gtcatactttgttaagaagggtgagaacagagtacctacattttgaatggaaggattgga 3060

gctacgggggtgggggtggggtgggattagataaatgcctgctctttactgaaggctctt 3120

tactattgctttatgataatgtttcatagttggatatcataatttaaacaagcaaaacca 3180

aattaagggccagctcattcctcccactcatgatctatagatctatagatctctcgtggg 3240

atcattgtttttctcttgattcccactttgtggttctaagtactgtggtttccaaatgtg 3300

tcagtttcatagcctgaagaacgagatcagcagcctctgttccacatacacttcattctc 3360

agtattgttttgccaagttctaattccatcagaagcttgcagatctgcgactctagagga 3420

tctgcgactc tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt 3480

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 3540

taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 3600

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 3660

ttatcatgtc tggatctgcg actctagagg atcataatca gccataccac atttgtagag 3720

gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3780

gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3840

atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3900

ctcatcaatg tatcttatca tgtctggatc tgcgactcta gaggatcata atcagccata 3960

ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 4020

aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 4080

aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 4140

gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccccatc aagctgatcc 4200

ggaaccctta atataacttc gtataatgta tgctatacga agttattagg tccctcgacc 4260

tgcagcccaa gctagtgccc gggtaggtcc ctcgacctgc agcccaagct agatcgaatt 4320

cggccggcct tcgaacacgt gccaccatgg actataagga ccacgacgga gactacaagg 4380

atcatgatat tgattacaaa gacgatgacg ataagatgga caagcccaag aaaaagcgga 4440

aagtgaagta cagcatcggc ctggacatcg gcaccaactc tgtgggctgg gccgtgatca 4500

ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gacaggcaca 4560

gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag cggcgaaaca gccgaggcca 4620

ccagactgaa gagaaccgcc agaagaagat acaccaggcg gaagaacagg atctgctatc 4680

tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg 4740

aagagtcctt cctggtggaa gaggacaaga agcacgagag acaccccatc ttcggcaaca 4800

tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac 4860

tggtggacag caccgacaag gccgacctga gactgatcta cctggccctg gcccacatga 4920

tcaagttcag aggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg 4980

acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca 5040

acgccagcgg cgtggacgcc aaggctatcc tgtctgccag actgagcaag agcagaaggc 5100

tggaaaatct gatcgcccag ctgcccggcg agaagaagaa cggcctgttc ggcaacctga 5160

ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg 5220

ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga 5280

tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa cctgtctgac gccatcctgc 5340

tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga 5400

tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc 5460

agctgcctga gaagtacaaa gaaatcttct tcgaccagag caagaacggc tacgccggct 5520

acatcgatgg cggcgctagc caggaagagt tctacaagtt catcaagccc atcctggaaa 5580

agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgagaaagc 5640

agagaacctt cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcta 5700

tcctgagaag gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga 5760

agatcctgac cttcaggatc ccctactacg tgggccccct ggccagaggc aacagcagat 5820

tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg 5880

tggacaaggg cgccagcgcc cagagcttca tcgagagaat gacaaacttc gataagaacc 5940

tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtaca 6000

acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg 6060

gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caacagaaaa gtgaccgtga 6120

agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg 6180

gcgtggaaga tagattcaac gcctccctgg gcacatacca cgatctgctg aaaattatca 6240

aggacaagga cttcctggat aacgaagaga acgaggacat tctggaagat atcgtgctga 6300

ccctgacact gtttgaggac cgcgagatga tcgaggaaag gctgaaaacc tacgctcacc 6360

tgttcgacga caaagtgatg aagcagctga agagaaggcg gtacaccggc tggggcaggc 6420

tgagcagaaa gctgatcaac ggcatcagag acaagcagag cggcaagaca atcctggatt 6480

tcctgaagtc cgacggcttc gccaaccgga acttcatgca gctgatccac gacgacagcc 6540

tgacattcaa agaggacatc cagaaagccc aggtgtccgg ccagggcgac tctctgcacg 6600

agcatatcgc taacctggcc ggcagccccg ctatcaagaa gggcatcctg cagacagtga 6660

aggtggtgga cgagctcgtg aaagtgatgg gcagacacaa gcccgagaac atcgtgatcg 6720

agatggctag agagaaccag accacccaga agggacagaa gaactcccgc gagaggatga 6780

agagaatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg 6840

aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat ggccgggata 6900

tgtacgtgga ccaggaactg gacatcaaca gactgtccga ctacgatgtg gaccatatcg 6960

tgcctcagag ctttctgaag gacgactcca tcgataacaa agtgctgact cggagcgaca 7020

agaacagagg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact 7080

actggcgaca gctgctgaac gccaagctga ttacccagag gaagttcgat aacctgacca 7140

aggccgagag aggcggcctg agcgagctgg ataaggccgg cttcatcaag aggcagctgg 7200

tggaaaccag acagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta 7260

agtacgacga aaacgataag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc 7320

tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc 7380

accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc 7440

ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga 7500

tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca 7560

tcatgaactt tttcaagacc gaaatcaccc tggccaacgg cgagatcaga aagcgccctc 7620

tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggcaga gacttcgcca 7680

cagtgcgaaa ggtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga 7740

caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgacaag ctgatcgcca 7800

gaaagaagga ctgggacccc aagaagtacg gcggcttcga cagccctacc gtggcctact 7860

ctgtgctggt ggtggctaag gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag 7920

agctgctggg gatcaccatc atggaaagaa gcagctttga gaagaaccct atcgactttc 7980

tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact 8040

ccctgttcga gctggaaaac ggcagaaaga gaatgctggc ctctgccggc gaactgcaga 8100

agggaaacga gctggccctg cctagcaaat atgtgaactt cctgtacctg gcctcccact 8160

atgagaagct gaagggcagc cctgaggaca acgaacagaa acagctgttt gtggaacagc 8220

ataagcacta cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc 8280

tggccgacgc caatctggac aaggtgctgt ctgcctacaa caagcacagg gacaagccta 8340

tcagagagca ggccgagaat atcatccacc tgttcaccct gacaaacctg ggcgctcctg 8400

ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg 8460

tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca agaatcgacc 8520

tgtctcagct gggaggcgac aagagacctg ccgccactaa gaaggccgga caggccaaaa 8580

agaagaaggg aagcggagcc actaacttct ccctgttgaa acaagcaggg gatgtcgaag 8640

agaatcccgg gccagtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 8700

tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 8760

atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc 8820

cctggcccac cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg 8880

accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 8940

gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 9000

gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 9060

tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca 9120

agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg 9180

tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 9240

ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg 9300

atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 9360

tgtacaagta aacgcgtatg catggccggc cctgcaggaa ttcgatatca agcttatcga 9420

taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 9480

tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 9540

tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 9600

gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 9660

tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 9720

tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 9780

gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 9840

cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 9900

caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 9960

tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc atcgcgacct 10020

cgacctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 10080

ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 10140

cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 10200

gggaggattg ggaagacaat ggcaggcatg ctggggaact agtggtgcca gggcgtgccc 10260

ttgggctccc cgggcgcggc ggccatcgct cgagtaaaat tggagggaca agacttccca 10320

cagattttcg gttttgtcgg gaagtttttt aataggggca aataaggaaa atgggaggat 10380

aggtagtcat ctggggtttt atgcagcaaa actacaggtt attattgctt gtgatccgc 10439

<210> 15

<211> 8222

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221>misc_feature

<222> (195)..(1913)

<223>Промотор CAGG

<220>

<221> misc_feature

<222> (1996)..(2029)

<223> LoxP

<220>

<221> misc_feature

<222> (2124)..(2133)

<223> Kozak

<220>

<221> misc_feature

<222> (2133)..(2198)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (2199)..(6371)

<223> Cas9

<220>

<221> misc_feature

<222> (2208)..(2228)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (6324)..(6371)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (6372)..(6437)

<223> P2A

<220>

<221> misc_feature

<222> (6438)..(7151)

<223> eGFP

<220>

<221> misc_feature

<222> (7201)..(7797)

<223> WPRE

<220>

<221> misc_feature

<222> (7798)..(8013)

<223>сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (8073)..(8222)

<223>Нижележащая последовательность Rosa26 мыши

<400> 15

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctccttaattaa 180

ggcctccaaggcctactagttattaatagtaatcaattacggggtcattagttcatagcc 240

catatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgccca 300

acgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaataggga 360

ctttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatc 420

aagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcct 480

ggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtat 540

tagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatct 600

cccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcga 660

tgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggg 720

gcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttc 780

cttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgg 840

ggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgccc 900

gccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcc 960

tccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgtggctgcgtga 1020

aagccttgaggggctccgggagggccctttgtgcggggggagcggctcggggggtgcgtg 1080

cgtgtgtgtgtgcgtggggagcgccgcgtgcggctccgcgctgcccggcggctgtgagcg 1140

ctgcgggcgcggcgcggggctttgtgcgctccgcagtgtgcgcgaggggagcgcggccgg 1200

gggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcgtgcggggtgt 1260

gtgcgtgggggggtgagcagggggtgtgggcgcgtcggtcgggctgcaaccccccctgca 1320

cccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtacggggcg 1380

tggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgggcggggc 1440

ggggccgcctcgggccggggagggctcgggggaggggcgcggcggcccccggagcgccgg 1500

cggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcgagagggc 1560

gcagggacttcctttgtcccaaatctgtgcggagccgaaatctgggaggcgccgccgcac 1620

cccctctagcgggcgcggggcgaagcggtgcggcgccggcaggaaggaaatgggcgggga 1680

gggccttcgtgcgtcgccgcgccgccgtccccttctccctctccagcctcggggctgtcc 1740

gcggggggacggctgccttcgggggggacggggcagggcggggttcggcttctggcgtgt 1800

gaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagct 1860

cctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattcgctaggag 1920

aattgatttgataccgcgggccctaagtcgacatttaaatcatttaaatccactagtgga 1980

tccggaacccttaatataacttcgtataatgtatgctatacgaagttattaggtccctcg 2040

acctgcagcccaagctagtgcccgggtaggtccctcgacctgcagcccaagctagatcga 2100

attcggccggccttcgaacacgtgccaccatggactataaggaccacgacggagactaca 2160

aggatcatgatattgattacaaagacgatgacgataagatggacaagcccaagaaaaagc 2220

ggaaagtgaagtacagcatcggcctggacatcggcaccaactctgtgggctgggccgtga 2280

tcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgacaggc 2340

acagcatcaagaagaacctgatcggcgccctgctgttcgacagcggcgaaacagccgagg 2400

ccaccagactgaagagaaccgccagaagaagatacaccaggcggaagaacaggatctgct 2460

atctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagac 2520

tggaagagtccttcctggtggaagaggacaagaagcacgagagacaccccatcttcggca 2580

acatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaaga 2640

aactggtggacagcaccgacaaggccgacctgagactgatctacctggccctggcccaca 2700

tgatcaagttcagaggccacttcctgatcgagggcgacctgaaccccgacaacagcgacg 2760

tggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaacccca 2820

tcaacgccagcggcgtggacgccaaggctatcctgtctgccagactgagcaagagcagaa 2880

ggctggaaaatctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacc 2940

tgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgagg 3000

atgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggccc 3060

agatcggcgaccagtacgccgacctgttcctggccgccaagaacctgtctgacgccatcc 3120

tgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctcta 3180

tgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggc 3240

agcagctgcctgagaagtacaaagaaatcttcttcgaccagagcaagaacggctacgccg 3300

gctacatcgatggcggcgctagccaggaagagttctacaagttcatcaagcccatcctgg 3360

aaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgagaa 3420

agcagagaaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacg 3480

ctatcctgagaaggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcg 3540

agaagatcctgaccttcaggatcccctactacgtgggccccctggccagaggcaacagca 3600

gattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaag 3660

tggtggacaagggcgccagcgcccagagcttcatcgagagaatgacaaacttcgataaga 3720

acctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgt 3780

acaacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctga 3840

gcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaacagaaaagtgaccg 3900

tgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatct 3960

ccggcgtggaagatagattcaacgcctccctgggcacataccacgatctgctgaaaatta 4020

tcaaggacaaggacttcctggataacgaagagaacgaggacattctggaagatatcgtgc 4080

tgaccctgacactgtttgaggaccgcgagatgatcgaggaaaggctgaaaacctacgctc 4140

acctgttcgacgacaaagtgatgaagcagctgaagagaaggcggtacaccggctggggca 4200

ggctgagcagaaagctgatcaacggcatcagagacaagcagagcggcaagacaatcctgg 4260

atttcctgaagtccgacggcttcgccaaccggaacttcatgcagctgatccacgacgaca 4320

gcctgacattcaaagaggacatccagaaagcccaggtgtccggccagggcgactctctgc 4380

acgagcatatcgctaacctggccggcagccccgctatcaagaagggcatcctgcagacag 4440

tgaaggtggtggacgagctcgtgaaagtgatgggcagacacaagcccgagaacatcgtga 4500

tcgagatggctagagagaaccagaccacccagaagggacagaagaactcccgcgagagga 4560

tgaagagaatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccg 4620

tggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatggccggg 4680

atatgtacgtggaccaggaactggacatcaacagactgtccgactacgatgtggaccata 4740

tcgtgcctcagagctttctgaaggacgactccatcgataacaaagtgctgactcggagcg 4800

acaagaacagaggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaaga 4860

actactggcgacagctgctgaacgccaagctgattacccagaggaagttcgataacctga 4920

ccaaggccgagagaggcggcctgagcgagctggataaggccggcttcatcaagaggcagc 4980

tggtggaaaccagacagatcacaaagcacgtggcacagatcctggactcccggatgaaca 5040

ctaagtacgacgaaaacgataagctgatccgggaagtgaaagtgatcaccctgaagtcca 5100

agctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaact 5160

accaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagt 5220

accctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaaga 5280

tgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagca 5340

acatcatgaactttttcaagaccgaaatcaccctggccaacggcgagatcagaaagcgcc 5400

ctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggcagagacttcg 5460

ccacagtgcgaaaggtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgc 5520

agacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgacaagctgatcg 5580

ccagaaagaaggactgggaccccaagaagtacggcggcttcgacagccctaccgtggcct 5640

actctgtgctggtggtggctaaggtggaaaagggcaagtccaagaaactgaagagtgtga 5700

aagagctgctggggatcaccatcatggaaagaagcagctttgagaagaaccctatcgact 5760

ttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagt 5820

actccctgttcgagctggaaaacggcagaaagagaatgctggcctctgccggcgaactgc 5880

agaagggaaacgagctggccctgcctagcaaatatgtgaacttcctgtacctggcctccc 5940

actatgagaagctgaagggcagccctgaggacaacgaacagaaacagctgtttgtggaac 6000

agcataagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtga 6060

tcctggccgacgccaatctggacaaggtgctgtctgcctacaacaagcacagggacaagc 6120

ctatcagagagcaggccgagaatatcatccacctgttcaccctgacaaacctgggcgctc 6180

ctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaag 6240

aggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacaagaatcg 6300

acctgtctcagctgggaggcgacaagagacctgccgccactaagaaggccggacaggcca 6360

aaaagaagaagggaagcggagccactaacttctccctgttgaaacaagcaggggatgtcg 6420

aagagaatcccgggccagtgagcaagggcgaggagctgttcaccggggtggtgcccatcc 6480

tggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagg 6540

gcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccg 6600

tgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctacc 6660

ccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccagg 6720

agcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcg 6780

agggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggca 6840

acatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccg 6900

acaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggca 6960

gcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgc 7020

tgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagc 7080

gcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacg 7140

agctgtacaagtaaacgcgtatgcatggccggccctgcaggaattcgatatcaagcttat 7200

cgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgt 7260

tgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttc 7320

ccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagga 7380

gttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccc 7440

cactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccct 7500

ccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcg 7560

gctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggct 7620

gctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggc 7680

cctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcg 7740

tcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcatcgcga 7800

cctcgacctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgc 7860

cttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattg 7920

catcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagca 7980

agggggaggattgggaagacaatggcaggcatgctggggaactagtggtgccagggcgtg 8040

cccttgggctccccgggcgcggcggccatcgctcgagtaaaattggagggacaagacttc 8100

ccacagattttcggttttgtcgggaagttttttaataggggcaaataaggaaaatgggag 8160

gataggtagtcatctggggttttatgcagcaaaactacaggttattattgcttgtgatcc 8220

gc 8222

<210> 16

<211> 1673

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> MISC_FEATURE

<222> (1)..(22)

<223> 3xFLAG

<220>

<221> MISC_FEATURE

<222> (23)..(1413)

<223> Cas9

<220>

<221> MISC_FEATURE

<222> (1414)..(1435)

<223> P2A

<220>

<221> MISC_FEATURE

<222> (1436)..(1673)

<223> eGFP

<400> 16

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys Met Asp Lys Pro Lys Lys Lys Arg Lys Val

20 25 30

Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala

35 40 45

Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu

50 55 60

Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu

65 70 75 80

Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr

85 90 95

Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln

100 105 110

Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His

115 120 125

Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg

130 135 140

His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys

145 150 155 160

Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp

165 170 175

Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys

180 185 190

Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser

195 200 205

Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu

210 215 220

Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile

225 230 235 240

Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala

245 250 255

Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala

260 265 270

Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala

275 280 285

Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu

290 295 300

Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu

305 310 315 320

Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg

325 330 335

Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys

340 345 350

Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val

355 360 365

Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser

370 375 380

Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu

385 390 395 400

Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu

405 410 415

Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg

420 425 430

Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu

435 440 445

His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp

450 455 460

Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr

465 470 475 480

Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg

485 490 495

Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp

500 505 510

Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp

515 520 525

Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr

530 535 540

Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr

545 550 555 560

Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala

565 570 575

Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln

580 585 590

Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu

595 600 605

Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His

610 615 620

Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu

625 630 635 640

Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu

645 650 655

Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe

660 665 670

Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp

675 680 685

Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser

690 695 700

Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

705 710 715 720

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp

725 730 735

Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His

740 745 750

Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln

755 760 765

Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys

770 775 780

Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln

785 790 795 800

Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

805 810 815

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn

820 825 830

Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly

835 840 845

Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp

850 855 860

Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser

865 870 875 880

Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser

885 890 895

Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp

900 905 910

Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn

915 920 925

Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly

930 935 940

Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

945 950 955 960

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

965 970 975

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val

980 985 990

Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn

995 1000 1005

Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly

1010 1015 1020

Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

1025 1030 1035

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1040 1045 1050

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1055 1060 1065

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1070 1075 1080

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1085 1090 1095

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1100 1105 1110

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1115 1120 1125

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1130 1135 1140

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1145 1150 1155

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1160 1165 1170

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1175 1180 1185

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1190 1195 1200

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1205 1210 1215

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1220 1225 1230

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1235 1240 1245

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1250 1255 1260

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1265 1270 1275

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1280 1285 1290

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1295 1300 1305

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1310 1315 1320

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1325 1330 1335

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1340 1345 1350

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1355 1360 1365

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1370 1375 1380

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys

1385 1390 1395

Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1400 1405 1410

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp

1415 1420 1425

Val Glu Glu Asn Pro Gly Pro Val Ser Lys Gly Glu Glu Leu Phe

1430 1435 1440

Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn

1445 1450 1455

Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr

1460 1465 1470

Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu

1475 1480 1485

Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val

1490 1495 1500

Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe

1505 1510 1515

Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile

1520 1525 1530

Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys

1535 1540 1545

Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

1550 1555 1560

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

1565 1570 1575

Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys

1580 1585 1590

Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp

1595 1600 1605

Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile

1610 1615 1620

Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr

1625 1630 1635

Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met

1640 1645 1650

Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met

1655 1660 1665

Asp Glu Leu Tyr Lys

1670

<210> 17

<211> 7207

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221>misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (424)..(2489)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (2517)..(2550)

<223> LoxP

<220>

<221> misc_feature

<222> (2599)..(2608)

<223> Kozak

<220>

<221> misc_feature

<222> (2605)..(6777)

<223> Cas9

<220>

<221> misc_feature

<222> (2614)..(2634)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (6730)..(6777)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (6783)..(6998)

<223>сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (7058)..(7207)

<223>Нижележащая последовательность Rosa26 мыши

<400> 17

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctagttgaccag 180

ctcggcggtgacctgcacgtctagggcgcagtagtccagggtttccttgatgatgtcata 240

cttatcctgtcccttttttttccacagggcgcgccactagtggatccggaacccttaata 300

taacttcgtataatgtatgctatacgaagttattaggtccctcgacctgcaggaattgtt 360

gacaattaatcatcggcatagtatatcggcatagtataatacgacaaggtgaggaactaa 420

accatgggatcggccattgaacaagatggattgcacgcaggttctccggccgcttgggtg 480

gagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtg 540

ttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgcc 600

ctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgttcct 660

tgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaa 720

gtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatg 780

gctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaa 840

gcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggat 900

gatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcg 960

cgcatgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatc 1020

atggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggac 1080

cgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgg 1140

gctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttc 1200

tatcgccttcttgacgagttcttctgaggggatccgctgtaagtctgcagaaattgatga 1260

tctattaaacaataaagatgtccactaaaatggaagtttttcctgtcatactttgttaag 1320

aagggtgagaacagagtacctacattttgaatggaaggattggagctacgggggtggggg 1380

tggggtgggattagataaatgcctgctctttactgaaggctctttactattgctttatga 1440

taatgtttcatagttggatatcataatttaaacaagcaaaaccaaattaagggccagctc 1500

attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560

tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620

aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680

gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740

atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800

ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980

tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040

aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100

acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160

ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220

atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280

tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340

aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400

cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460

catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520

cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580

gcccgggaat tcgctagggc caccatggac aagcccaaga aaaagcggaa agtgaagtac 2640

agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac 2700

aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg acaggcacag catcaagaag 2760

aacctgatcg gcgccctgct gttcgacagc ggcgaaacag ccgaggccac cagactgaag 2820

agaaccgcca gaagaagata caccaggcgg aagaacagga tctgctatct gcaagagatc 2880

ttcagcaacg agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc 2940

ctggtggaag aggacaagaa gcacgagaga caccccatct tcggcaacat cgtggacgag 3000

gtggcctacc acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc 3060

accgacaagg ccgacctgag actgatctac ctggccctgg cccacatgat caagttcaga 3120

ggccacttcc tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc 3180

atccagctgg tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc 3240

gtggacgcca aggctatcct gtctgccaga ctgagcaaga gcagaaggct ggaaaatctg 3300

atcgcccagc tgcccggcga gaagaagaac ggcctgttcg gcaacctgat tgccctgagc 3360

ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag 3420

ctgagcaagg acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag 3480

tacgccgacc tgttcctggc cgccaagaac ctgtctgacg ccatcctgct gagcgacatc 3540

ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac 3600

gacgagcacc accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag 3660

aagtacaaag aaatcttctt cgaccagagc aagaacggct acgccggcta catcgatggc 3720

ggcgctagcc aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc 3780

accgaggaac tgctcgtgaa gctgaacaga gaggacctgc tgagaaagca gagaaccttc 3840

gacaacggca gcatccccca ccagatccac ctgggagagc tgcacgctat cctgagaagg 3900

caggaagatt tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc 3960

ttcaggatcc cctactacgt gggccccctg gccagaggca acagcagatt cgcctggatg 4020

accagaaaga gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc 4080

gccagcgccc agagcttcat cgagagaatg acaaacttcg ataagaacct gcccaacgag 4140

aaggtgctgc ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc 4200

aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 4260

aaggccatcg tggacctgct gttcaagacc aacagaaaag tgaccgtgaa gcagctgaaa 4320

gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat 4380

agattcaacg cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac 4440

ttcctggata acgaagagaa cgaggacatt ctggaagata tcgtgctgac cctgacactg 4500

tttgaggacc gcgagatgat cgaggaaagg ctgaaaacct acgctcacct gttcgacgac 4560

aaagtgatga agcagctgaa gagaaggcgg tacaccggct ggggcaggct gagcagaaag 4620

ctgatcaacg gcatcagaga caagcagagc ggcaagacaa tcctggattt cctgaagtcc 4680

gacggcttcg ccaaccggaa cttcatgcag ctgatccacg acgacagcct gacattcaaa 4740

gaggacatcc agaaagccca ggtgtccggc cagggcgact ctctgcacga gcatatcgct 4800

aacctggccg gcagccccgc tatcaagaag ggcatcctgc agacagtgaa ggtggtggac 4860

gagctcgtga aagtgatggg cagacacaag cccgagaaca tcgtgatcga gatggctaga 4920

gagaaccaga ccacccagaa gggacagaag aactcccgcg agaggatgaa gagaatcgaa 4980

gagggcatca aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag 5040

ctgcagaacg agaagctgta cctgtactac ctgcagaatg gccgggatat gtacgtggac 5100

caggaactgg acatcaacag actgtccgac tacgatgtgg accatatcgt gcctcagagc 5160

tttctgaagg acgactccat cgataacaaa gtgctgactc ggagcgacaa gaacagaggc 5220

aagagcgaca acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcgacag 5280

ctgctgaacg ccaagctgat tacccagagg aagttcgata acctgaccaa ggccgagaga 5340

ggcggcctga gcgagctgga taaggccggc ttcatcaaga ggcagctggt ggaaaccaga 5400

cagatcacaa agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgaa 5460

aacgataagc tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat 5520

ttccggaagg atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac 5580

gacgcctacc tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa 5640

agcgagttcg tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc 5700

gagcaggaaa tcggcaaggc taccgccaag tacttcttct acagcaacat catgaacttt 5760

ttcaagaccg aaatcaccct ggccaacggc gagatcagaa agcgccctct gatcgagaca 5820

aacggcgaaa ccggggagat cgtgtgggat aagggcagag acttcgccac agtgcgaaag 5880

gtgctgagca tgccccaagt gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc 5940

agcaaagagt ctatcctgcc caagaggaac agcgacaagc tgatcgccag aaagaaggac 6000

tgggacccca agaagtacgg cggcttcgac agccctaccg tggcctactc tgtgctggtg 6060

gtggctaagg tggaaaaggg caagtccaag aaactgaaga gtgtgaaaga gctgctgggg 6120

atcaccatca tggaaagaag cagctttgag aagaacccta tcgactttct ggaagccaag 6180

ggctacaaag aagtgaaaaa ggacctgatc atcaagctgc ctaagtactc cctgttcgag 6240

ctggaaaacg gcagaaagag aatgctggcc tctgccggcg aactgcagaa gggaaacgag 6300

ctggccctgc ctagcaaata tgtgaacttc ctgtacctgg cctcccacta tgagaagctg 6360

aagggcagcc ctgaggacaa cgaacagaaa cagctgtttg tggaacagca taagcactac 6420

ctggacgaga tcatcgagca gatcagcgag ttctccaaga gagtgatcct ggccgacgcc 6480

aatctggaca aggtgctgtc tgcctacaac aagcacaggg acaagcctat cagagagcag 6540

gccgagaata tcatccacct gttcaccctg acaaacctgg gcgctcctgc cgccttcaag 6600

tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt gctggacgcc 6660

accctgatcc accagagcat caccggcctg tacgagacaa gaatcgacct gtctcagctg 6720

ggaggcgaca agagacctgc cgccactaag aaggccggac aggccaaaaa gaagaagtga 6780

gtcgacctcg acctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 6840

cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 6900

aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 6960

cagcaagggg gaggattggg aagacaatgg caggcatgct ggggaactag tggtgccagg 7020

gcgtgccctt gggctccccg ggcgcggcgg ccatcgctcg agtaaaattg gagggacaag 7080

acttcccaca gattttcggt tttgtcggga agttttttaa taggggcaaa taaggaaaat 7140

gggaggatag gtagtcatct ggggttttat gcagcaaaac tacaggttat tattgcttgt 7200

gatccgc 7207

<210> 18

<211> 4990

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221> misc_feature

<222> (300)..(333)

<223> LoxP

<220>

<221> misc_feature

<222> (382)..(391)

<223> Kozak

<220>

<221> misc_feature

<222> (388)..(4560)

<223> Cas9

<220>

<221> misc_feature

<222> (397)..(417)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (4513)..(4560)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (4566)..(4781)

<223>Сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (4841)..(4990)

<223>Нижележащая последовательность Rosa26 мыши

<400> 18

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctagttgaccag 180

ctcggcggtgacctgcacgtctagggcgcagtagtccagggtttccttgatgatgtcata 240

cttatcctgtcccttttttttccacagggcgcgccactagtggatccggaacccttaata 300

taacttcgtataatgtatgctatacgaagttattaggtccctcgacctgcagcccaagct 360

agtgcccgggaattcgctagggccaccatggacaagcccaagaaaaagcggaaagtgaag 420

tacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatcaccgacgag 480

tacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgacaggcacagcatcaag 540

aagaacctgatcggcgccctgctgttcgacagcggcgaaacagccgaggccaccagactg 600

aagagaaccgccagaagaagatacaccaggcggaagaacaggatctgctatctgcaagag 660

atcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtcc 720

ttcctggtggaagaggacaagaagcacgagagacaccccatcttcggcaacatcgtggac 780

gaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggac 840

agcaccgacaaggccgacctgagactgatctacctggccctggcccacatgatcaagttc 900

agaggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctg 960

ttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagc 1020

ggcgtggacgccaaggctatcctgtctgccagactgagcaagagcagaaggctggaaaat 1080

ctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacctgattgccctg 1140

agcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactg 1200

cagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgac 1260

cagtacgccgacctgttcctggccgccaagaacctgtctgacgccatcctgctgagcgac 1320

atcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagaga 1380

tacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcct 1440

gagaagtacaaagaaatcttcttcgaccagagcaagaacggctacgccggctacatcgat 1500

ggcggcgctagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggac 1560

ggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgagaaagcagagaacc 1620

ttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgctatcctgaga 1680

aggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctg 1740

accttcaggatcccctactacgtgggccccctggccagaggcaacagcagattcgcctgg 1800

atgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaag 1860

ggcgccagcgcccagagcttcatcgagagaatgacaaacttcgataagaacctgcccaac 1920

gagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtacaacgagctg 1980

accaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcag 2040

aaaaaggccatcgtggacctgctgttcaagaccaacagaaaagtgaccgtgaagcagctg 2100

aaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaa 2160

gatagattcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaag 2220

gacttcctggataacgaagagaacgaggacattctggaagatatcgtgctgaccctgaca 2280

ctgtttgaggaccgcgagatgatcgaggaaaggctgaaaacctacgctcacctgttcgac 2340

gacaaagtgatgaagcagctgaagagaaggcggtacaccggctggggcaggctgagcaga 2400

aagctgatcaacggcatcagagacaagcagagcggcaagacaatcctggatttcctgaag 2460

tccgacggcttcgccaaccggaacttcatgcagctgatccacgacgacagcctgacattc 2520

aaagaggacatccagaaagcccaggtgtccggccagggcgactctctgcacgagcatatc 2580

gctaacctggccggcagccccgctatcaagaagggcatcctgcagacagtgaaggtggtg 2640

gacgagctcgtgaaagtgatgggcagacacaagcccgagaacatcgtgatcgagatggct 2700

agagagaaccagaccacccagaagggacagaagaactcccgcgagaggatgaagagaatc 2760

gaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacc 2820

cagctgcagaacgagaagctgtacctgtactacctgcagaatggccgggatatgtacgtg 2880

gaccaggaactggacatcaacagactgtccgactacgatgtggaccatatcgtgcctcag 2940

agctttctgaaggacgactccatcgataacaaagtgctgactcggagcgacaagaacaga 3000

ggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcga 3060

cagctgctgaacgccaagctgattacccagaggaagttcgataacctgaccaaggccgag 3120

agaggcggcctgagcgagctggataaggccggcttcatcaagaggcagctggtggaaacc 3180

agacagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgac 3240

gaaaacgataagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtcc 3300

gatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcc 3360

cacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctg 3420

gaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaag 3480

agcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaac 3540

tttttcaagaccgaaatcaccctggccaacggcgagatcagaaagcgccctctgatcgag 3600

acaaacggcgaaaccggggagatcgtgtgggataagggcagagacttcgccacagtgcga 3660

aaggtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggc 3720

ttcagcaaagagtctatcctgcccaagaggaacagcgacaagctgatcgccagaaagaag 3780

gactgggaccccaagaagtacggcggcttcgacagccctaccgtggcctactctgtgctg 3840

gtggtggctaaggtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctg 3900

gggatcaccatcatggaaagaagcagctttgagaagaaccctatcgactttctggaagcc 3960

aagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttc 4020

gagctggaaaacggcagaaagagaatgctggcctctgccggcgaactgcagaagggaaac 4080

gagctggccctgcctagcaaatatgtgaacttcctgtacctggcctcccactatgagaag 4140

ctgaagggcagccctgaggacaacgaacagaaacagctgtttgtggaacagcataagcac 4200

tacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgac 4260

gccaatctggacaaggtgctgtctgcctacaacaagcacagggacaagcctatcagagag 4320

caggccgagaatatcatccacctgttcaccctgacaaacctgggcgctcctgccgccttc 4380

aagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggac 4440

gccaccctgatccaccagagcatcaccggcctgtacgagacaagaatcgacctgtctcag 4500

ctgggaggcgacaagagacctgccgccactaagaaggccggacaggccaaaaagaagaag 4560

tgagtcgacctcgacctcgactgtgccttctagttgccagccatctgttgtttgcccctc 4620

ccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatga 4680

ggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggca 4740

ggacagcaagggggaggattgggaagacaatggcaggcatgctggggaactagtggtgcc 4800

agggcgtgcccttgggctccccgggcgcggcggccatcgctcgagtaaaattggagggac 4860

aagacttcccacagattttcggttttgtcgggaagttttttaataggggcaaataaggaa 4920

aatgggaggataggtagtcatctggggttttatgcagcaaaactacaggttattattgct 4980

tgtgatccgc 4990

<210> 19

<211> 1391

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 19

Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu

1 5 10 15

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

20 25 30

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

35 40 45

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

50 55 60

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

65 70 75 80

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

85 90 95

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

100 105 110

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

115 120 125

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

130 135 140

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

145 150 155 160

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

165 170 175

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

180 185 190

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

195 200 205

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

210 215 220

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

225 230 235 240

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

245 250 255

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

260 265 270

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

275 280 285

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

290 295 300

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

305 310 315 320

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

325 330 335

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

340 345 350

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

355 360 365

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

370 375 380

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

385 390 395 400

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

405 410 415

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

420 425 430

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

435 440 445

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

450 455 460

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

465 470 475 480

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

485 490 495

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

500 505 510

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

515 520 525

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

530 535 540

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

545 550 555 560

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

565 570 575

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

580 585 590

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

595 600 605

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

610 615 620

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

625 630 635 640

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

645 650 655

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

660 665 670

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

675 680 685

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

690 695 700

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

705 710 715 720

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

725 730 735

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

740 745 750

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

755 760 765

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

770 775 780

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

785 790 795 800

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

805 810 815

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

820 825 830

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

835 840 845

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

850 855 860

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

865 870 875 880

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

885 890 895

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

900 905 910

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

915 920 925

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

930 935 940

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

945 950 955 960

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

965 970 975

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His

980 985 990

Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

995 1000 1005

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr

1010 1015 1020

Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys

1025 1030 1035

Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe

1040 1045 1050

Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1055 1060 1065

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys

1070 1075 1080

Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln

1085 1090 1095

Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser

1100 1105 1110

Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1115 1120 1125

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1130 1135 1140

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys

1145 1150 1155

Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile

1160 1165 1170

Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1175 1180 1185

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile

1190 1195 1200

Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys

1205 1210 1215

Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu

1220 1225 1230

Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1235 1240 1245

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln

1250 1255 1260

Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu

1265 1270 1275

Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn

1280 1285 1290

Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1295 1300 1305

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr

1310 1315 1320

Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile

1325 1330 1335

Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr

1340 1345 1350

Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1355 1360 1365

Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys

1370 1375 1380

Ala Gly Gln Ala Lys Lys Lys Lys

1385 1390

<210> 20

<211> 9673

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221>misc_feature

<222> (205)..(1923)

<223>Промотор CAGG

<220>

<221> misc_feature

<222> (2006)..(2039)

<223> LoxP

<220>

<221> misc_feature

<222> (2130)..(4195)

<223> Neo-PolyA

<220>

<221> misc_feature

<222> (4223)..(4256)

<223> LoxP

<220>

<221> misc_feature

<222> (4351)..(4360)

<223> Kozak

<220>

<221> misc_feature

<222> (4360)..(4425)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (4426)..(8598)

<223> Cas9

<220>

<221> misc_feature

<222> (4435)..(4455)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (8551)..(8598)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (8645)..(9241)

<223> WPRE

<220>

<221> misc_feature

<222> (9249)..(9464)

<223>Сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (9524)..(9673)

<223>Нижележащая последовательность Rosa26 мыши

<400> 20

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctccttaattaa 180

acgcgtctggcctcgcgagtgtgtactagttattaatagtaatcaattacggggtcatta 240

gttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggc 300

tgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacg 360

ccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttg 420

gcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaa 480

tggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtac 540

atctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcact 600

ctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattt 660

tgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggc 720

gaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctc 780

cgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcg 840

cggcgggcggggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcct 900

cgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacg 960

gcccttctcctccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgt 1020

ggctgcgtgaaagccttgaggggctccgggagggccctttgtgcggggggagcggctcgg 1080

ggggtgcgtgcgtgtgtgtgtgcgtggggagcgccgcgtgcggctccgcgctgcccggcg 1140

gctgtgagcgctgcgggcgcggcgcggggctttgtgcgctccgcagtgtgcgcgagggga 1200

gcgcggccgggggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcg 1260

tgcggggtgtgtgcgtgggggggtgagcagggggtgtgggcgcgtcggtcgggctgcaac 1320

cccccctgcacccccctccccgagttgctgagcacggcccggcttcgggtgcggggctcc 1380

gtacggggcgtggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgc 1440

cgggcggggcggggccgcctcgggccggggagggctcgggggaggggcgcggcggccccc 1500

ggagcgccggcggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgt 1560

gcgagagggcgcagggacttcctttgtcccaaatctgtgcggagccgaaatctgggaggc 1620

gccgccgcaccccctctagcgggcgcggggcgaagcggtgcggcgccggcaggaaggaaa 1680

tgggcggggagggccttcgtgcgtcgccgcgccgccgtccccttctccctctccagcctc 1740

ggggctgtccgcggggggacggctgccttcgggggggacggggcagggcggggttcggct 1800

tctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttt 1860

tcctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaat 1920

tcgctaggagaattgatttgataccgcgggccctaagtcgacatttaaatcatttaaatc 1980

cactagtggatccggaacccttaatataacttcgtataatgtatgctatacgaagttatt 2040

aggtccctcgacctgcaggaattgttgacaattaatcatcggcatagtatatcggcatag 2100

tataatacgacaaggtgaggaactaaaccatgggatcggccattgaacaagatggattgc 2160

acgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacaga 2220

caatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttcttt 2280

ttgtcaagaccgacctgtccggtgccctgaatgaactgcaggacgaggcagcgcggctat 2340

cgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgg 2400

gaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttg 2460

ctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatc 2520

cggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcgga 2580

tggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccag 2640

ccgaactgttcgccaggctcaaggcgcgcatgcccgacggcgatgatctcgtcgtgaccc 2700

atggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcg 2760

actgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgata 2820

ttgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccg 2880

ctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgaggggatc 2940

cgctgtaagtctgcagaaattgatgatctattaaacaataaagatgtccactaaaatgga 3000

agtttttcctgtcatactttgttaagaagggtgagaacagagtacctacattttgaatgg 3060

aaggattggagctacgggggtgggggtggggtgggattagataaatgcctgctctttact 3120

gaaggctctttactattgctttatgataatgtttcatagttggatatcataatttaaaca 3180

agcaaaaccaaattaagggccagctcattcctcccactcatgatctatagatctatagat 3240

ctctcgtgggatcattgtttttctcttgattcccactttgtggttctaagtactgtggtt 3300

tccaaatgtgtcagtttcatagcctgaagaacgagatcagcagcctctgttccacataca 3360

cttcattctcagtattgttttgccaagttctaattccatcagaagcttgcagatctgcga 3420

ctctagagga tctgcgactc tagaggatca taatcagcca taccacattt gtagaggttt 3480

tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa 3540

ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 3600

caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 3660

tcaatgtatc ttatcatgtc tggatctgcg actctagagg atcataatca gccataccac 3720

atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca 3780

taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata 3840

aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 3900

tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tgcgactcta gaggatcata 3960

atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 4020

ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 4080

aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 4140

cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccccatc 4200

aagctgatcc ggaaccctta atataacttc gtataatgta tgctatacga agttattagg 4260

tccctcgacc tgcagcccaa gctagtgccc gggtaggtcc ctcgacctgc agcccaagct 4320

agatcgaatt cggccggcct tcgaacacgt gccaccatgg actataagga ccacgacgga 4380

gactacaagg atcatgatat tgattacaaa gacgatgacg ataagatgga caagcccaag 4440

aaaaagcgga aagtgaagta cagcatcggc ctggacatcg gcaccaactc tgtgggctgg 4500

gccgtgatca ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc 4560

gacaggcaca gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag cggcgaaaca 4620

gccgaggcca ccagactgaa gagaaccgcc agaagaagat acaccaggcg gaagaacagg 4680

atctgctatc tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc 4740

cacagactgg aagagtcctt cctggtggaa gaggacaaga agcacgagag acaccccatc 4800

ttcggcaaca tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg 4860

agaaagaaac tggtggacag caccgacaag gccgacctga gactgatcta cctggccctg 4920

gcccacatga tcaagttcag aggccacttc ctgatcgagg gcgacctgaa ccccgacaac 4980

agcgacgtgg acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa 5040

aaccccatca acgccagcgg cgtggacgcc aaggctatcc tgtctgccag actgagcaag 5100

agcagaaggc tggaaaatct gatcgcccag ctgcccggcg agaagaagaa cggcctgttc 5160

ggcaacctga ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg 5220

gccgaggatg ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg 5280

ctggcccaga tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa cctgtctgac 5340

gccatcctgc tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc 5400

gcctctatga tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc 5460

gtgcggcagc agctgcctga gaagtacaaa gaaatcttct tcgaccagag caagaacggc 5520

tacgccggct acatcgatgg cggcgctagc caggaagagt tctacaagtt catcaagccc 5580

atcctggaaa agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg 5640

ctgagaaagc agagaacctt cgacaacggc agcatccccc accagatcca cctgggagag 5700

ctgcacgcta tcctgagaag gcaggaagat ttttacccat tcctgaagga caaccgggaa 5760

aagatcgaga agatcctgac cttcaggatc ccctactacg tgggccccct ggccagaggc 5820

aacagcagat tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc 5880

gaggaagtgg tggacaaggg cgccagcgcc cagagcttca tcgagagaat gacaaacttc 5940

gataagaacc tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc 6000

accgtgtaca acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc 6060

ttcctgagcg gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caacagaaaa 6120

gtgaccgtga agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg 6180

gaaatctccg gcgtggaaga tagattcaac gcctccctgg gcacatacca cgatctgctg 6240

aaaattatca aggacaagga cttcctggat aacgaagaga acgaggacat tctggaagat 6300

atcgtgctga ccctgacact gtttgaggac cgcgagatga tcgaggaaag gctgaaaacc 6360

tacgctcacc tgttcgacga caaagtgatg aagcagctga agagaaggcg gtacaccggc 6420

tggggcaggc tgagcagaaa gctgatcaac ggcatcagag acaagcagag cggcaagaca 6480

atcctggatt tcctgaagtc cgacggcttc gccaaccgga acttcatgca gctgatccac 6540

gacgacagcc tgacattcaa agaggacatc cagaaagccc aggtgtccgg ccagggcgac 6600

tctctgcacg agcatatcgc taacctggcc ggcagccccg ctatcaagaa gggcatcctg 6660

cagacagtga aggtggtgga cgagctcgtg aaagtgatgg gcagacacaa gcccgagaac 6720

atcgtgatcg agatggctag agagaaccag accacccaga agggacagaa gaactcccgc 6780

gagaggatga agagaatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa 6840

caccccgtgg aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat 6900

ggccgggata tgtacgtgga ccaggaactg gacatcaaca gactgtccga ctacgatgtg 6960

gaccatatcg tgcctcagag ctttctgaag gacgactcca tcgataacaa agtgctgact 7020

cggagcgaca agaacagagg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag 7080

atgaagaact actggcgaca gctgctgaac gccaagctga ttacccagag gaagttcgat 7140

aacctgacca aggccgagag aggcggcctg agcgagctgg ataaggccgg cttcatcaag 7200

aggcagctgg tggaaaccag acagatcaca aagcacgtgg cacagatcct ggactcccgg 7260

atgaacacta agtacgacga aaacgataag ctgatccggg aagtgaaagt gatcaccctg 7320

aagtccaagc tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc 7380

aacaactacc accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc 7440

aaaaagtacc ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg 7500

cggaagatga tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc 7560

tacagcaaca tcatgaactt tttcaagacc gaaatcaccc tggccaacgg cgagatcaga 7620

aagcgccctc tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggcaga 7680

gacttcgcca cagtgcgaaa ggtgctgagc atgccccaag tgaatatcgt gaaaaagacc 7740

gaggtgcaga caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgacaag 7800

ctgatcgcca gaaagaagga ctgggacccc aagaagtacg gcggcttcga cagccctacc 7860

gtggcctact ctgtgctggt ggtggctaag gtggaaaagg gcaagtccaa gaaactgaag 7920

agtgtgaaag agctgctggg gatcaccatc atggaaagaa gcagctttga gaagaaccct 7980

atcgactttc tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg 8040

cctaagtact ccctgttcga gctggaaaac ggcagaaaga gaatgctggc ctctgccggc 8100

gaactgcaga agggaaacga gctggccctg cctagcaaat atgtgaactt cctgtacctg 8160

gcctcccact atgagaagct gaagggcagc cctgaggaca acgaacagaa acagctgttt 8220

gtggaacagc ataagcacta cctggacgag atcatcgagc agatcagcga gttctccaag 8280

agagtgatcc tggccgacgc caatctggac aaggtgctgt ctgcctacaa caagcacagg 8340

gacaagccta tcagagagca ggccgagaat atcatccacc tgttcaccct gacaaacctg 8400

ggcgctcctg ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc 8460

accaaagagg tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca 8520

agaatcgacc tgtctcagct gggaggcgac aagagacctg ccgccactaa gaaggccgga 8580

caggccaaaa agaagaagtg ataaatgcat ggccggccct gcaggaattc gatatcaagc 8640

ttatcgataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 8700

atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 8760

cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 8820

aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 8880

cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 8940

ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 9000

ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 9060

ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 9120

cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 9180

cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcatc 9240

gataccgtcg acctcgacct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 9300

ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 9360

tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 9420

gcaggacagc aagggggagg attgggaaga caatggcagg catgctgggg aactagtggt 9480

gccagggcgt gcccttgggc tccccgggcg cggcggccat cgctcgagta aaattggagg 9540

gacaagactt cccacagatt ttcggttttg tcgggaagtt ttttaatagg ggcaaataag 9600

gaaaatggga ggataggtag tcatctgggg ttttatgcag caaaactaca ggttattatt 9660

gcttgtgatccgc 9673

<210> 21

<211> 7456

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221>misc_feature

<222> (1)..(170)

<223>Вышележащая последовательность Rosa26 мыши

<220>

<221> misc_feature

<222> (205)..(1923)

<223>Промотор CAGG

<220>

<221> misc_feature

<222> (2006)..(2039)

<223> LoxP

<220>

<221> misc_feature

<222> (2134)..(2143)

<223> Kozak

<220>

<221> misc_feature

<222> (2143)..(2208)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (2209)..(6381)

<223> Cas9

<220>

<221> misc_feature

<222> (2218)..(2238)

<223>Одинарный NLS

<220>

<221> misc_feature

<222> (6334)..(6381)

<223>Двойной NLS

<220>

<221> misc_feature

<222> (6428)..(7024)

<223> WPRE

<220>

<221> misc_feature

<222> (7032)..(7247)

<223>Сигнал полиаденилирования bGH

<220>

<221>misc_feature

<222> (7307)..(7456)

<223>Нижележащая последовательность Rosa26 мыши

<400> 21

ctgcagtggagtaggcggggagaaggccgcacccttctccggaggggggaggggagtgtt 60

gcaatacctttctgggagttctctgctgcctcctggcttctgaggaccgccctgggcctg 120

ggagaatcccttccccctcttccctcgtgatctgcaactccagtctttctccttaattaa 180

acgcgtctggcctcgcgagtgtgtactagttattaatagtaatcaattacggggtcatta 240

gttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggc 300

tgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacg 360

ccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttg 420

gcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaa 480

tggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtac 540

atctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcact 600

ctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattt 660

tgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggggc 720

gaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctc 780

cgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcg 840

cggcgggcggggagtcgctgcgacgctgccttcgccccgtgccccgctccgccgccgcct 900

cgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacg 960

gcccttctcctccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgt 1020

ggctgcgtgaaagccttgaggggctccgggagggccctttgtgcggggggagcggctcgg 1080

ggggtgcgtgcgtgtgtgtgtgcgtggggagcgccgcgtgcggctccgcgctgcccggcg 1140

gctgtgagcgctgcgggcgcggcgcggggctttgtgcgctccgcagtgtgcgcgagggga 1200

gcgcggccgggggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcg 1260

tgcggggtgtgtgcgtgggggggtgagcagggggtgtgggcgcgtcggtcgggctgcaac 1320

cccccctgcacccccctccccgagttgctgagcacggcccggcttcgggtgcggggctcc 1380

gtacggggcgtggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgc 1440

cgggcggggcggggccgcctcgggccggggagggctcgggggaggggcgcggcggccccc 1500

ggagcgccggcggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgt 1560

gcgagagggcgcagggacttcctttgtcccaaatctgtgcggagccgaaatctgggaggc 1620

gccgccgcaccccctctagcgggcgcggggcgaagcggtgcggcgccggcaggaaggaaa 1680

tgggcggggagggccttcgtgcgtcgccgcgccgccgtccccttctccctctccagcctc 1740

ggggctgtccgcggggggacggctgccttcgggggggacggggcagggcggggttcggct 1800

tctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttt 1860

tcctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaat 1920

tcgctaggagaattgatttgataccgcgggccctaagtcgacatttaaatcatttaaatc 1980

cactagtggatccggaacccttaatataacttcgtataatgtatgctatacgaagttatt 2040

aggtccctcgacctgcagcccaagctagtgcccgggtaggtccctcgacctgcagcccaa 2100

gctagatcgaattcggccggccttcgaacacgtgccaccatggactataaggaccacgac 2160

ggagactacaaggatcatgatattgattacaaagacgatgacgataagatggacaagccc 2220

aagaaaaagcggaaagtgaagtacagcatcggcctggacatcggcaccaactctgtgggc 2280

tgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaac 2340

accgacaggcacagcatcaagaagaacctgatcggcgccctgctgttcgacagcggcgaa 2400

acagccgaggccaccagactgaagagaaccgccagaagaagatacaccaggcggaagaac 2460

aggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttc 2520

ttccacagactggaagagtccttcctggtggaagaggacaagaagcacgagagacacccc 2580

atcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccac 2640

ctgagaaagaaactggtggacagcaccgacaaggccgacctgagactgatctacctggcc 2700

ctggcccacatgatcaagttcagaggccacttcctgatcgagggcgacctgaaccccgac 2760

aacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgag 2820

gaaaaccccatcaacgccagcggcgtggacgccaaggctatcctgtctgccagactgagc 2880

aagagcagaaggctggaaaatctgatcgcccagctgcccggcgagaagaagaacggcctg 2940

ttcggcaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgac 3000

ctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaac 3060

ctgctggcccagatcggcgaccagtacgccgacctgttcctggccgccaagaacctgtct 3120

gacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctg 3180

agcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagct 3240

ctcgtgcggcagcagctgcctgagaagtacaaagaaatcttcttcgaccagagcaagaac 3300

ggctacgccggctacatcgatggcggcgctagccaggaagagttctacaagttcatcaag 3360

cccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggac 3420

ctgctgagaaagcagagaaccttcgacaacggcagcatcccccaccagatccacctggga 3480

gagctgcacgctatcctgagaaggcaggaagatttttacccattcctgaaggacaaccgg 3540

gaaaagatcgagaagatcctgaccttcaggatcccctactacgtgggccccctggccaga 3600

ggcaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaac 3660

ttcgaggaagtggtggacaagggcgccagcgcccagagcttcatcgagagaatgacaaac 3720

ttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtac 3780

ttcaccgtgtacaacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagccc 3840

gccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaacaga 3900

aaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactcc 3960

gtggaaatctccggcgtggaagatagattcaacgcctccctgggcacataccacgatctg 4020

ctgaaaattatcaaggacaaggacttcctggataacgaagagaacgaggacattctggaa 4080

gatatcgtgctgaccctgacactgtttgaggaccgcgagatgatcgaggaaaggctgaaa 4140

acctacgctcacctgttcgacgacaaagtgatgaagcagctgaagagaaggcggtacacc 4200

ggctggggcaggctgagcagaaagctgatcaacggcatcagagacaagcagagcggcaag 4260

acaatcctggatttcctgaagtccgacggcttcgccaaccggaacttcatgcagctgatc 4320

cacgacgacagcctgacattcaaagaggacatccagaaagcccaggtgtccggccagggc 4380

gactctctgcacgagcatatcgctaacctggccggcagccccgctatcaagaagggcatc 4440

ctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggcagacacaagcccgag 4500

aacatcgtgatcgagatggctagagagaaccagaccacccagaagggacagaagaactcc 4560

cgcgagaggatgaagagaatcgaagagggcatcaaagagctgggcagccagatcctgaaa 4620

gaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcag 4680

aatggccgggatatgtacgtggaccaggaactggacatcaacagactgtccgactacgat 4740

gtggaccatatcgtgcctcagagctttctgaaggacgactccatcgataacaaagtgctg 4800

actcggagcgacaagaacagaggcaagagcgacaacgtgccctccgaagaggtcgtgaag 4860

aagatgaagaactactggcgacagctgctgaacgccaagctgattacccagaggaagttc 4920

gataacctgaccaaggccgagagaggcggcctgagcgagctggataaggccggcttcatc 4980

aagaggcagctggtggaaaccagacagatcacaaagcacgtggcacagatcctggactcc 5040

cggatgaacactaagtacgacgaaaacgataagctgatccgggaagtgaaagtgatcacc 5100

ctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgag 5160

atcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctg 5220

atcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgac 5280

gtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttc 5340

ttctacagcaacatcatgaactttttcaagaccgaaatcaccctggccaacggcgagatc 5400

agaaagcgccctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggc 5460

agagacttcgccacagtgcgaaaggtgctgagcatgccccaagtgaatatcgtgaaaaag 5520

accgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgac 5580

aagctgatcgccagaaagaaggactgggaccccaagaagtacggcggcttcgacagccct 5640

accgtggcctactctgtgctggtggtggctaaggtggaaaagggcaagtccaagaaactg 5700

aagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagctttgagaagaac 5760

cctatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaag 5820

ctgcctaagtactccctgttcgagctggaaaacggcagaaagagaatgctggcctctgcc 5880

ggcgaactgcagaagggaaacgagctggccctgcctagcaaatatgtgaacttcctgtac 5940

ctggcctcccactatgagaagctgaagggcagccctgaggacaacgaacagaaacagctg 6000

tttgtggaacagcataagcactacctggacgagatcatcgagcagatcagcgagttctcc 6060

aagagagtgatcctggccgacgccaatctggacaaggtgctgtctgcctacaacaagcac 6120

agggacaagcctatcagagagcaggccgagaatatcatccacctgttcaccctgacaaac 6180

ctgggcgctcctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacacc 6240

agcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgag 6300

acaagaatcgacctgtctcagctgggaggcgacaagagacctgccgccactaagaaggcc 6360

ggacaggccaaaaagaagaagtgataaatgcatggccggccctgcaggaattcgatatca 6420

agcttatcgataatcaacctctggattacaaaatttgtgaaagattgactggtattctta 6480

actatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgcta 6540

ttgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctcttt 6600

atgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacg 6660

caacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctt 6720

tccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacag 6780

gggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttc 6840

cttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcc 6900

cttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctc 6960

ttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgc 7020

atcgataccgtcgacctcgacctcgactgtgccttctagttgccagccatctgttgtttg 7080

cccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaata 7140

aaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggt 7200

ggggcaggacagcaagggggaggattgggaagacaatggcaggcatgctggggaactagt 7260

ggtgccagggcgtgcccttgggctccccgggcgcggcggccatcgctcgagtaaaattgg 7320

agggacaagacttcccacagattttcggttttgtcgggaagttttttaataggggcaaat 7380

aaggaaaatgggaggataggtagtcatctggggttttatgcagcaaaactacaggttatt 7440

attgcttgtgatccgc 7456

<210> 22

<211> 1413

<212>PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> MISC_FEATURE

<222> (1)..(22)

<223> 3xFLAG

<220>

<221> MISC_FEATURE

<222> (23)..(1413)

<223> Cas9

<400> 22

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys Met Asp Lys Pro Lys Lys Lys Arg Lys Val

20 25 30

Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala

35 40 45

Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu

50 55 60

Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu

65 70 75 80

Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr

85 90 95

Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln

100 105 110

Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His

115 120 125

Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg

130 135 140

His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys

145 150 155 160

Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp

165 170 175

Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys

180 185 190

Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser

195 200 205

Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu

210 215 220

Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile

225 230 235 240

Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala

245 250 255

Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala

260 265 270

Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala

275 280 285

Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu

290 295 300

Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu

305 310 315 320

Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg

325 330 335

Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys

340 345 350

Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val

355 360 365

Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser

370 375 380

Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu

385 390 395 400

Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu

405 410 415

Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg

420 425 430

Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu

435 440 445

His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp

450 455 460

Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr

465 470 475 480

Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg

485 490 495

Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp

500 505 510

Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp

515 520 525

Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr

530 535 540

Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr

545 550 555 560

Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala

565 570 575

Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln

580 585 590

Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu

595 600 605

Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His

610 615 620

Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu

625 630 635 640

Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu

645 650 655

Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe

660 665 670

Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp

675 680 685

Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser

690 695 700

Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg

705 710 715 720

Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp

725 730 735

Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His

740 745 750

Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln

755 760 765

Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys

770 775 780

Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln

785 790 795 800

Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly

805 810 815

Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn

820 825 830

Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly

835 840 845

Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp

850 855 860

Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser

865 870 875 880

Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser

885 890 895

Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp

900 905 910

Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn

915 920 925

Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly

930 935 940

Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val

945 950 955 960

Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp

965 970 975

Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val

980 985 990

Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn

995 1000 1005

Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly

1010 1015 1020

Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

1025 1030 1035

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys

1040 1045 1050

Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr

1055 1060 1065

Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn

1070 1075 1080

Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1085 1090 1095

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg

1100 1105 1110

Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu

1115 1120 1125

Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg

1130 1135 1140

Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1145 1150 1155

Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu

1160 1165 1170

Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser

1175 1180 1185

Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe

1190 1195 1200

Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1205 1210 1215

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe

1220 1225 1230

Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu

1235 1240 1245

Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn

1250 1255 1260

Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1265 1270 1275

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His

1280 1285 1290

Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg

1295 1300 1305

Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr

1310 1315 1320

Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1325 1330 1335

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe

1340 1345 1350

Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr

1355 1360 1365

Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly

1370 1375 1380

Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys

1385 1390 1395

Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1400 1405 1410

<210> 23

<211> 22

<212> PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 23

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys

20

<210> 24

<211> 238

<212> PRT

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 24

Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val

1 5 10 15

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu

20 25 30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

35 40 45

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu

50 55 60

Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln

65 70 75 80

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg

85 90 95

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val

100 105 110

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

115 120 125

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn

130 135 140

Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly

145 150 155 160

Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val

165 170 175

Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

180 185 190

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser

195 200 205

Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val

210 215 220

Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 25

<211> 16

<212>RNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 25

guuuuagagcuaugcu 16

<210> 26

<211> 67

<212>RNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 26

agcauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucg 60

gugcuuu 67

<210> 27

<211> 77

<212>RNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 27

guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagu 60

ggcaccgagucggugcu 77

<210> 28

<211> 4953

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> misc_feature

<222> (1)..(4173)

<223> Cas9

<220>

<221> misc_feature

<222> (4174)..(4239)

<223> P2A

<220>

<221> misc_feature

<222> (4240)..(4953)

<223> eGFP

<400> 28

atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60

aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120

gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180

gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240

aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300

gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360

gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420

accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480

atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540

ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600

cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660

gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720

aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780

agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840

gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900

aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960

aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020

ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080

cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140

aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200

aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260

atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320

aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380

cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440

accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500

agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560

ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620

atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680

aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740

tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800

taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860

gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920

gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980

aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040

cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100

atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160

tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220

aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280

cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340

cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400

cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460

tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520

tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580

aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640

gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700

cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760

gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820

atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880

aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940

aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000

ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060

aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120

gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180

aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240

tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300

atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360

aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420

ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480

tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540

tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600

ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660

ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720

aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780

cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840

agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900

tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960

accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020

aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080

ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140

actaagaagg ccggacaggc caaaaagaag aagggaagcg gagccactaa cttctccctg 4200

ttgaaacaag caggggatgt cgaagagaat cccgggccag tgagcaaggg cgaggagctg 4260

ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 4320

agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 4380

tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 4440

gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 4500

atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 4560

acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 4620

atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 4680

cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 4740

cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 4800

atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 4860

agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 4920

gggatcactc tcggcatgga cgagctgtac aag 4953

<210> 29

<211> 5019

<212> DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> misc_feature

<222> (1)..(66)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (67)..(4239)

<223> Cas9

<220>

<221> misc_feature

<222> (4240)..(4305)

<223> P2A

<220>

<221> misc_feature

<222> (4306)..(5019)

<223> eGFP

<400> 29

gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60

gataagatgg acaagcccaa gaaaaagcgg aaagtgaagt acagcatcgg cctggacatc 120

ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 180

ttcaaggtgc tgggcaacac cgacaggcac agcatcaaga agaacctgat cggcgccctg 240

ctgttcgaca gcggcgaaac agccgaggcc accagactga agagaaccgc cagaagaaga 300

tacaccaggc ggaagaacag gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 360

aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggacaag 420

aagcacgaga gacaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480

taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 540

agactgatct acctggccct ggcccacatg atcaagttca gaggccactt cctgatcgag 600

ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660

tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggctatc 720

ctgtctgcca gactgagcaa gagcagaagg ctggaaaatc tgatcgccca gctgcccggc 780

gagaagaaga acggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 840

ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 900

gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960

gccgccaaga acctgtctga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1020

atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1080

ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agaaatcttc 1140

ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggcgctag ccaggaagag 1200

ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1260

aagctgaaca gagaggacct gctgagaaag cagagaacct tcgacaacgg cagcatcccc 1320

caccagatcc acctgggaga gctgcacgct atcctgagaa ggcaggaaga tttttaccca 1380

ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttcaggat cccctactac 1440

gtgggccccc tggccagagg caacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1500

accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc ccagagcttc 1560

atcgagagaa tgacaaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1620

agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa atacgtgacc 1680

gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1740

ctgttcaaga ccaacagaaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 1800

atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atagattcaa cgcctccctg 1860

ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga taacgaagag 1920

aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga ccgcgagatg 1980

atcgaggaaa ggctgaaaac ctacgctcac ctgttcgacg acaaagtgat gaagcagctg 2040

aagagaaggc ggtacaccgg ctggggcagg ctgagcagaa agctgatcaa cggcatcaga 2100

gacaagcaga gcggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaaccgg 2160

aacttcatgc agctgatcca cgacgacagc ctgacattca aagaggacat ccagaaagcc 2220

caggtgtccg gccagggcga ctctctgcac gagcatatcg ctaacctggc cggcagcccc 2280

gctatcaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2340

ggcagacaca agcccgagaa catcgtgatc gagatggcta gagagaacca gaccacccag 2400

aagggacaga agaactcccg cgagaggatg aagagaatcg aagagggcat caaagagctg 2460

ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2520

tacctgtact acctgcagaa tggccgggat atgtacgtgg accaggaact ggacatcaac 2580

agactgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2640

atcgataaca aagtgctgac tcggagcgac aagaacagag gcaagagcga caacgtgccc 2700

tccgaagagg tcgtgaagaa gatgaagaac tactggcgac agctgctgaa cgccaagctg 2760

attacccaga ggaagttcga taacctgacc aaggccgaga gaggcggcct gagcgagctg 2820

gataaggccg gcttcatcaa gaggcagctg gtggaaacca gacagatcac aaagcacgtg 2880

gcacagatcc tggactcccg gatgaacact aagtacgacg aaaacgataa gctgatccgg 2940

gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3000

ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3060

gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3120

gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3180

gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgaaatcacc 3240

ctggccaacg gcgagatcag aaagcgccct ctgatcgaga caaacggcga aaccggggag 3300

atcgtgtggg ataagggcag agacttcgcc acagtgcgaa aggtgctgag catgccccaa 3360

gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3420

cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc caagaagtac 3480

ggcggcttcg acagccctac cgtggcctac tctgtgctgg tggtggctaa ggtggaaaag 3540

ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3600

agcagctttg agaagaaccc tatcgacttt ctggaagcca agggctacaa agaagtgaaa 3660

aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggcagaaag 3720

agaatgctgg cctctgccgg cgaactgcag aagggaaacg agctggccct gcctagcaaa 3780

tatgtgaact tcctgtacct ggcctcccac tatgagaagc tgaagggcag ccctgaggac 3840

aacgaacaga aacagctgtt tgtggaacag cataagcact acctggacga gatcatcgag 3900

cagatcagcg agttctccaa gagagtgatc ctggccgacg ccaatctgga caaggtgctg 3960

tctgcctaca acaagcacag ggacaagcct atcagagagc aggccgagaa tatcatccac 4020

ctgttcaccc tgacaaacct gggcgctcct gccgccttca agtactttga caccaccatc 4080

gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4140

atcaccggcc tgtacgagac aagaatcgac ctgtctcagc tgggaggcga caagagacct 4200

gccgccacta agaaggccgg acaggccaaa aagaagaagg gaagcggagc cactaacttc 4260

tccctgttga aacaagcagg ggatgtcgaa gagaatcccg ggccagtgag caagggcgag 4320

gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 4380

aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 4440

ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 4500

tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 4560

tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 4620

tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 4680

aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 4740

aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 4800

aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 4860

acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 4920

gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 4980

gccgccggga tcactctcgg catggacgag ctgtacaag 5019

<210> 30

<211> 4173

<212> DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 30

atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60

aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120

gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180

gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240

aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300

gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360

gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420

accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480

atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540

ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600

cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660

gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720

aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780

agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840

gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900

aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960

aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020

ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080

cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140

aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200

aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260

atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320

aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380

cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440

accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500

agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560

ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620

atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680

aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740

tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800

taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860

gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920

gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980

aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040

cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100

atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160

tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220

aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280

cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340

cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400

cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460

tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520

tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580

aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640

gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700

cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760

gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820

atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880

aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940

aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000

ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060

aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120

gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180

aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240

tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300

atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360

aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420

ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480

tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540

tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600

ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660

ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720

aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780

cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840

agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900

tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960

accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020

aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080

ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140

actaagaagg ccggacaggc caaaaagaag aag 4173

<210> 31

<211> 4239

<212> DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<220>

<221> misc_feature

<222> (1)..(66)

<223> 3xFLAG

<220>

<221> misc_feature

<222> (67)..(4239)

<223> Cas9

<400> 31

gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60

gataagatgg acaagcccaa gaaaaagcgg aaagtgaagt acagcatcgg cctggacatc 120

ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 180

ttcaaggtgc tgggcaacac cgacaggcac agcatcaaga agaacctgat cggcgccctg 240

ctgttcgaca gcggcgaaac agccgaggcc accagactga agagaaccgc cagaagaaga 300

tacaccaggc ggaagaacag gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 360

aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggacaag 420

aagcacgaga gacaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480

taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 540

agactgatct acctggccct ggcccacatg atcaagttca gaggccactt cctgatcgag 600

ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660

tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggctatc 720

ctgtctgcca gactgagcaa gagcagaagg ctggaaaatc tgatcgccca gctgcccggc 780

gagaagaaga acggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 840

ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 900

gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960

gccgccaaga acctgtctga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1020

atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1080

ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agaaatcttc 1140

ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggcgctag ccaggaagag 1200

ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1260

aagctgaaca gagaggacct gctgagaaag cagagaacct tcgacaacgg cagcatcccc 1320

caccagatcc acctgggaga gctgcacgct atcctgagaa ggcaggaaga tttttaccca 1380

ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttcaggat cccctactac 1440

gtgggccccc tggccagagg caacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1500

accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc ccagagcttc 1560

atcgagagaa tgacaaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1620

agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa atacgtgacc 1680

gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1740

ctgttcaaga ccaacagaaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 1800

atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atagattcaa cgcctccctg 1860

ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga taacgaagag 1920

aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga ccgcgagatg 1980

atcgaggaaa ggctgaaaac ctacgctcac ctgttcgacg acaaagtgat gaagcagctg 2040

aagagaaggc ggtacaccgg ctggggcagg ctgagcagaa agctgatcaa cggcatcaga 2100

gacaagcaga gcggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaaccgg 2160

aacttcatgc agctgatcca cgacgacagc ctgacattca aagaggacat ccagaaagcc 2220

caggtgtccg gccagggcga ctctctgcac gagcatatcg ctaacctggc cggcagcccc 2280

gctatcaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2340

ggcagacaca agcccgagaa catcgtgatc gagatggcta gagagaacca gaccacccag 2400

aagggacaga agaactcccg cgagaggatg aagagaatcg aagagggcat caaagagctg 2460

ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2520

tacctgtact acctgcagaa tggccgggat atgtacgtgg accaggaact ggacatcaac 2580

agactgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2640

atcgataaca aagtgctgac tcggagcgac aagaacagag gcaagagcga caacgtgccc 2700

tccgaagagg tcgtgaagaa gatgaagaac tactggcgac agctgctgaa cgccaagctg 2760

attacccaga ggaagttcga taacctgacc aaggccgaga gaggcggcct gagcgagctg 2820

gataaggccg gcttcatcaa gaggcagctg gtggaaacca gacagatcac aaagcacgtg 2880

gcacagatcc tggactcccg gatgaacact aagtacgacg aaaacgataa gctgatccgg 2940

gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3000

ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3060

gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3120

gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3180

gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgaaatcacc 3240

ctggccaacg gcgagatcag aaagcgccct ctgatcgaga caaacggcga aaccggggag 3300

atcgtgtggg ataagggcag agacttcgcc acagtgcgaa aggtgctgag catgccccaa 3360

gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3420

cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc caagaagtac 3480

ggcggcttcg acagccctac cgtggcctac tctgtgctgg tggtggctaa ggtggaaaag 3540

ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3600

agcagctttg agaagaaccc tatcgacttt ctggaagcca agggctacaa agaagtgaaa 3660

aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggcagaaag 3720

agaatgctgg cctctgccgg cgaactgcag aagggaaacg agctggccct gcctagcaaa 3780

tatgtgaact tcctgtacct ggcctcccac tatgagaagc tgaagggcag ccctgaggac 3840

aacgaacaga aacagctgtt tgtggaacag cataagcact acctggacga gatcatcgag 3900

cagatcagcg agttctccaa gagagtgatc ctggccgacg ccaatctgga caaggtgctg 3960

tctgcctaca acaagcacag ggacaagcct atcagagagc aggccgagaa tatcatccac 4020

ctgttcaccc tgacaaacct gggcgctcct gccgccttca agtactttga caccaccatc 4080

gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4140

atcaccggcc tgtacgagac aagaatcgac ctgtctcagc tgggaggcga caagagacct 4200

gccgccacta agaaggccgg acaggccaaa aagaagaag 4239

<210> 32

<211> 66

<212> DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 32

ggaagcggag ccactaactt ctccctgttg aaacaagcag gggatgtcga agagaatccc 60

gggcca 66

<210> 33

<211> 714

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 33

gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggc 60

gacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggc 120

aagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctc 180

gtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcag 240

cacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttc 300

aaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtg 360

aaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaag 420

ctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggc 480

atcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgac 540

cactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactac 600

ctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctg 660

ctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaag 714

<210> 34

<211> 66

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 34

gactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgac 60

gataag 66

<210> 35

<211> 597

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 35

cgataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgt 60

tgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttc 120

ccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagga 180

gttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccc 240

cactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccct 300

ccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcg 360

gctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggct 420

gctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggc 480

cctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcg 540

tcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcatcg 597

<210> 36

<211> 216

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 36

cgacctcgacctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccg 60

tgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaa 120

ttgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggaca 180

gcaagggggaggattgggaagacaatggcaggcatg 216

<210> 37

<211> 2066

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 37

atgggatcggccattgaacaagatggattgcacgcaggttctccggccgcttgggtggag 60

aggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttc 120

cggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctg 180

aatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgc 240

gcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtg 300

ccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggct 360

gatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcg 420

aaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgat 480

ctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcgc 540

atgcccgacggcgatgatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatg 600

gtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgc 660

tatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggct 720

gaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctat 780

cgccttcttgacgagttcttctgaggggatccgctgtaagtctgcagaaattgatgatct 840

attaaacaataaagatgtccactaaaatggaagtttttcctgtcatactttgttaagaag 900

ggtgagaacagagtacctacattttgaatggaaggattggagctacgggggtgggggtgg 960

ggtgggattagataaatgcctgctctttactgaaggctctttactattgctttatgataa 1020

tgtttcatagttggatatcataatttaaacaagcaaaaccaaattaagggccagctcatt 1080

cctcccactcatgatctatagatctatagatctctcgtgggatcattgtttttctcttga 1140

ttcccactttgtggttctaagtactgtggtttccaaatgtgtcagtttcatagcctgaag 1200

aacgagatcagcagcctctgttccacatacacttcattctcagtattgttttgccaagtt 1260

ctaattccatcagaagcttgcagatctgcgactctagaggatctgcgactctagaggatc 1320

ataatcagccataccacatttgtagaggttttacttgctttaaaaaacctcccacacctc 1380

cccctgaacctgaaacataaaatgaatgcaattgttgttgttaacttgtttattgcagct 1440

tataatggttacaaataaagcaatagcatcacaaatttcacaaataaagcatttttttca 1500

ctgcattctagttgtggtttgtccaaactcatcaatgtatcttatcatgtctggatctgc 1560

gactctagaggatcataatcagccataccacatttgtagaggttttacttgctttaaaaa 1620

acctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttaact 1680

tgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcacaaata 1740

aagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatc 1800

atgtctggat ctgcgactct agaggatcat aatcagccat accacatttg tagaggtttt 1860

acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 1920

tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 1980

aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 2040

caatgtatcttatcatgtctggatcc 2066

<210> 38

<211> 1719

<212>DNA

<213>Искусственная последовательность

<220>

<223>Синтетическая

<400> 38

actagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttc 60

cgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgccca 120

ttgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgt 180

caatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatg 240

ccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccag 300

tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 360

accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 420

cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 480

gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 540

agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 600

cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcggggag tcgctgcgac 660

gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 720

tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 780

agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc 840

tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg 900

tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg 960

cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc 1020

ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt 1080

gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc cctccccgag 1140

ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg 1200

ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg 1260

ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg 1320

cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt 1380

tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc 1440

gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc cttcgtgcgt 1500

cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg ggggacggct 1560

gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc ggcggctcta 1620

gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg ggcaacgtgc 1680

tggttattgt gctgtctcat cattttggca aagaattcg 1719

<---

1. Способ испытания способности CRISPR/Cas9-нуклеазы, содержащей белок Cas9 и гидовую РНК, модифицировать целевой геномный локус in vivo, предусматривающий:

(a) введение мыши гидовой РНК, предназначенной для нацеливания на целевую последовательность для гидовой РНК в целевом геномном локусе,

причем мышь в своей зародышевой линии содержит геномно интегрированную экспрессионную кассету Cas9 в локусе Rosa26,

причем экспрессионная кассета Cas9 содержит кодирующую последовательность для белка Cas9, при этом белок Cas9 экспрессируется и содержит полную последовательность, представленную в SEQ ID NO: 19, и

причем гидовую РНК вводят посредством опосредованной аденоассоциированным вирусом (AAV) доставки; и

(b) оценку модификации целевого геномного локуса при помощи CRISPR/Cas9 нуклеазы.

2. Способ по п. 1, в котором AAV представляет собой AAV7, AAV8 или AAV9, и стадия (b) предусматривает оценку модификации целевого геномного локуса в печени.

3. Способ по п. 2, в котором AAV представляет собой AAV8.

4. Способ по любому из предыдущих пунктов, в котором путь введения AAV мыши представляет собой внутривенную инъекцию, интрапаренхиматозную инъекцию, интраперитонеальную инъекцию, закапывание в нос или интравитреальную инъекцию.

5. Способ по любому из предыдущих пунктов, в котором экзогенную донорную нуклеиновую кислоту вводят на стадии (а), причем экзогенная донорная нуклеиновая кислота предназначена для рекомбинации с целевым геномным локусом.

6. Способ по п. 5, в котором экзогенная донорная нуклеиновая кислота представляет собой одноцепочечный олигодезоксинуклеотид (ssODN).

7. Способ по любому из предыдущих пунктов, в котором целевой геномный локус содержит целевой ген, и стадия (b) предусматривает измерение экспрессии целевого гена или активности белка, кодируемого целевым геном.

8. Способ по любому из предыдущих пунктов, в котором стадия (b) предусматривает секвенирование целевого геномного локуса в одной или нескольких клетках, выделенных из мыши.

9. Способ по любому из предыдущих пунктов, в котором стадия (b) предусматривает выделение из мыши целевого органа или ткани и оценку модификации целевого геномного локуса в целевом органе или ткани.

10. Способ по п. 9, в котором стадия (b) предусматривает оценку модификации целевого геномного локуса в двух или более различных типах клеток в пределах целевого органа или ткани.

11. Способ по любому из предыдущих пунктов, в котором стадия (b) предусматривает выделение из мыши нецелевого органа или ткани и оценку модификации целевого геномного локуса в нецелевом органе или ткани.

12. Способ по любому из предыдущих пунктов, в котором экспрессионная кассета Cas9 дополнительно содержит сигнал полиаденилирования выше кодирующей последовательности для белка Cas9, причем сигнал полиаденилирования фланкирован сайтами распознавания рекомбиназы, и причем сигнал полиаденилирования в экспрессионной кассете Cas9 был вырезан тканеспецифическим образом.

13. Способ по п. 12, в котором сигнал полиаденилирования выше кодирующей последовательности для белка Cas9 был вырезан в печени.

14. Способ по п. 12 или 13, в котором рекомбиназа, которая распознает сайты распознавания рекомбиназы в экспрессионной кассете Cas9, представляет собой Cre-рекомбиназу.

15. Способ по п. 14, в котором мышь дополнительно содержит геномно интегрированную экспрессионную кассету Cre-рекомбиназы, содержащую кодирующую Cre-рекомбиназу последовательность, функционально связанную с тканеспецифическим промотором.

16. Способ по п. 14 или 15, в котором ген Cre-рекомбиназы функционально связан с промотором альбумина.

17. Способ по любому из пп. 1-11, в котором экспрессионная кассета Cas9 дополнительно содержит сигнал полиаденилирования выше кодирующей последовательности для белка Cas9, причем сигнал полиаденилирования фланкирован сайтами распознавания рекомбиназы, и причем способ дополнительно предусматривает введение рекомбиназы мыши тканеспецифическим образом.

18. Способ по п. 17, в котором рекомбиназу вводят посредством опосредованной аденоассоциированным вирусом (AAV) доставки или опосредованной липидными наночастицами (LNP) доставки.

19. Способ по любому из предыдущих пунктов, в котором экспрессионная кассета Cas9 дополнительно содержит кодирующую флуоресцентный белок последовательность.

20. Способ по п. 19, в котором экспрессионная кассета Cas9 содержит мультицистронную нуклеиновую кислоту, содержащую кодирующую последовательность для белка Cas9 и кодирующую флуоресцентный белок последовательность, разделенные с помощью промежуточного участка внутренней посадки рибосомы (IRES) или промежуточной кодирующей пептид 2А последовательности.

21. Способ по п. 20, в котором мультицистронная нуклеиновая кислота в экспрессионной кассете Cas9 содержит кодирующую последовательность для белка Cas9 и кодирующую зеленый флуоресцентный белок последовательность, разделенные с помощью промежуточной кодирующей пептид Р2А последовательности.

22. Способ по любому из пп. 1-18, в котором экспрессионная кассета Cas9 дополнительно не содержит кодирующую флуоресцентный белок последовательность.

23. Способ по любому из предыдущих пунктов, в котором белок Cas9 содержит метку белка.

24. Способ по любому из предыдущих пунктов, в котором 5' конец экспрессионной кассеты Cas9 дополнительно содержит 3' последовательность сплайсинга.

25. Способ по любому из предыдущих пунктов, в котором экспрессионная кассета Cas9 функционально связана с эндогенным промотором.

26. Способ по любому из пп. 1-24, в котором экспрессионная кассета Cas9 функционально связана с экзогенным, конститутивным промотором.

27. Способ по любому предыдущему пункту, в котором экспрессионная кассета Cas9 кодирует белок, содержащий последовательность, представленную в SEQ ID NO: 13, 16 или 22.

28. Способ по п. 27, в котором экспрессионная кассета Cas9 содержит последовательность, представленную в SEQ ID NO: 28, 29, 30 или 31.

29. Способ по п. 28, в котором экспрессионная кассета Cas9 содержит последовательность, представленную в SEQ ID NO: 1, 12, 14, 15, 17, 18, 20 или 21.

30. Способ по любому из предыдущих пунктов, в котором экспрессионная кассета Cas9 интегрирована в первый интрон локуса Rosa26.

31. Способ по любому из предыдущих пунктов, в котором мышь является гетерозиготной в отношении экспрессионной кассеты Cas9.

32. Способ по любому из пп. 1-30, в котором мышь является гомозиготной в отношении экспрессионной кассеты Cas9.

33. Способ по любому из предыдущих пунктов,

причем AAV представляет собой AAV8, доставленный в мышь с помощью внутривенной инъекции,

причем экспрессионная кассета Cas9 функционально связана с эндогенным промотором Rosa26, вставлена в первый интрон локуса Rosa26 и содержит от 5' к 3' следующее:

(i) 3' последовательность сплайсинга; и

(ii) кодирующую последовательность для белка Cas9, и

причем стадия (b) предусматривает оценку модификации целевого геномного локуса в печени мыши.

34. Способ оптимизации способности CRISPR/Cas9-нуклеазы модифицировать целевой геномный локус in vivo, предусматривающий:

(I) проведение способа по любому из предыдущих пунктов в первый раз у первой мыши;

(II) изменение переменной и проведение способа согласно стадии (I) во второй раз с измененной переменной у второй мыши; причем:

(А) измененная переменная представляет собой:

(i) серотип AAV;

(ii) путь введения гидовой РНК, вводимой мыши;

(iii) концентрацию или количество гидовой РНК, введенной мыши; или

(iv) последовательность гидовой РНК, введенную мыши, или

(В) стадия (а) дополнительно предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная представляет собой:

(i) способ доставки или путь введения для введения в мышь экзогенной донорной нуклеиновой кислоты;

(ii) концентрацию или количество экзогенной донорной нуклеиновой кислоты, введенной мыши;

(iii) концентрацию или количество гидовой РНК, введенной мыши, по отношению к концентрации или количеству экзогенной донорной нуклеиновой кислоты, введенной мыши; или

(iv) последовательность экзогенной донорной нуклеиновой кислоты, введенную мыши; и

(III) сравнение модификации целевого геномного локуса на стадии (I) с модификацией целевого геномного локуса на стадии (II), и выбор способа, приводящего к модификации целевого геномного локуса, характеризующейся одним или несколькими из следующего: повышенная эффективность, повышенная точность, повышенная согласованность или повышенная специфичность.

35. Способ по п. 34, в котором измененная переменная на стадии (II) представляет собой серотип AAV.

36. Способ по п. 34, в котором измененная переменная на стадии (II) представляет собой путь введения гидовой РНК, вводимой мыши.

37. Способ по п. 34, в котором измененная переменная на стадии (II) представляет собой концентрацию или количество гидовой РНК, введенной мыши.

38. Способ по п. 34, в котором измененная переменная на стадии (II) представляет собой гидовую РНК, введенную мыши.

39. Способ по п. 34, причем способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и причем измененная переменная на стадии (II) представляет собой способ доставки для введения экзогенной донорной нуклеиновой кислоты мыши.

40. Способ по п. 34, причем способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная на стадии (II) представляет собой путь введения экзогенной донорной нуклеиновой кислоты, вводимой мыши.

41. Способ по п. 34, причем способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная на стадии (II) представляет собой концентрацию или количество экзогенной донорной нуклеиновой кислоты, введенной мыши.

42. Способ по п. 34, причем способ предусматривает введение экзогенной донорной нуклеиновой кислоты, и измененная переменная на стадии (II) представляет собой концентрацию или количество гидовой РНК, введенной мыши, по отношению к концентрации или количеству экзогенной донорной нуклеиновой кислоты, введенной мыши.

43. Способ по п. 34, в котором измененная переменная на стадии (II) представляет собой экзогенную донорную нуклеиновую кислоту, введенную мыши.

44. Мышь для испытания способности CRISPR/Cas9-нуклеазы модифицировать целевой геномный локус in vivo, содержащая экспрессионную кассету Cas9, геномно интегрированную в локус Rosa26, причем экспрессионная кассета Cas9 содержит кодирующую последовательность для белка Cas9, причем белок Cas9 экспрессируется и содержит полную последовательность, представленную в SEQ ID NO: 19.

45. Мышь по п. 44, где экспрессионная кассета Cas9 дополнительно содержит сигнал полиаденилирования выше кодирующей последовательности для белка Cas9, причем сигнал полиаденилирования фланкирован сайтами распознавания рекомбиназы, и причем сигнал полиаденилирования в экспрессионной кассете Cas9 был вырезан тканеспецифическим образом.

46. Мышь по п. 45, где сигнал полиаденилирования выше кодирующей последовательности для белка Cas9 был вырезан в печени.

47. Мышь по п. 45 или 46, где рекомбиназа, которая распознает сайты распознавания рекомбиназы в экспрессионной кассете Cas9, представляет собой Cre-рекомбиназу.

48. Мышь по п. 47, которая дополнительно содержит геномно интегрированную экспрессионную кассету Cre-рекомбиназы, содержащую кодирующую Cre-рекомбиназу последовательность, функционально связанную с тканеспецифическим промотором.

49. Мышь по п. 47 или 48, где ген Cre-рекомбиназы функционально связан с промотором альбумина.

50. Мышь по любому из пп. 44-49, где экспрессионная кассета Cas9 дополнительно содержит кодирующую флуоресцентный белок последовательность.

51. Мышь по п. 50, где экспрессионная кассета Cas9 содержит мультицистронную нуклеиновую кислоту, содержащую кодирующую последовательность для белка Cas9 и кодирующую флуоресцентный белок последовательность, разделенные с помощью промежуточного участка внутренней посадки рибосомы (IRES) или промежуточной кодирующей пептид 2А последовательности.

52. Мышь по п. 51, где мультицистронная нуклеиновая кислота в экспрессионной кассете Cas9 содержит кодирующую последовательность для белка Cas9 и кодирующую зеленый флуоресцентный белок последовательность, разделенные с помощью промежуточной кодирующей пептид Р2А последовательности.

53. Мышь по любому из пп. 44-49, где экспрессионная кассета Cas9 дополнительно не содержит кодирующую флуоресцентный белок последовательность.

54. Мышь по любому из пунктов 44-53, где белок Cas9 содержит метку белка.

55. Мышь по любому из пунктов 44-54, где 5' конец экспрессионной кассеты Cas9 дополнительно содержит 3' последовательность сплайсинга.

56. Мышь по любому из пунктов 44-55, где экспрессионная кассета Cas9 функционально связана с эндогенным промотором.

57. Мышь по любому из пп. 44-55, где экспрессионная кассета Cas9 функционально связана с экзогенным, конститутивным промотором.

58. Мышь по любому из пп. 44-57, где экспрессионная кассета Cas9 кодирует белок, содержащий последовательность, представленную в SEQ ID NO: 13, 16 или 22.

59. Мышь по п. 58, где экспрессионная кассета Cas9 содержит последовательность, представленную в SEQ ID NO: 28, 29, 30 или 31.

60. Мышь по п. 59, где экспрессионная кассета Cas9 содержит последовательность, представленную в SEQ ID NO: 1, 12, 14, 15, 17, 18, 20 или 21.

61. Мышь по любому из пп. 44-60, где экспрессионная кассета Cas9 интегрирована в первый интрон локуса Rosa26.

62. Мышь по любому из пунктов 44-61, которая является гетерозиготной в отношении экспрессионной кассеты Cas9.

63. Мышь по любому из пп. 44-61, которая является гомозиготной в отношении экспрессионной кассеты Cas9.

64. Мышь по любому из пп. 44-63, где экспрессионная кассета Cas9 функционально связана с эндогенным промотором Rosa26, вставлена в первый интрон локуса Rosa26 и содержит от 5' к 3' следующее:

(i) 3' последовательность сплайсинга; и

(ii) кодирующую последовательность для белка Cas9.

65. Клетка мыши для испытания способности CRISPR/Cas9-нуклеазы модифицировать целевой геномный локус, содержащая экспрессионную кассету Cas9, геномно интегрированную в локус Rosa26, причем экспрессионная кассета Cas9 содержит кодирующую последовательность для белка Cas9, и причем белок Cas9 экспрессируется и содержит полную последовательность, представленную в SEQ ID NO: 19.

66. Способ получения мыши по любому из пп. 44-64, предусматривающий:

(a) модификацию генома мышиной эмбриональной стволовой (ES) клетки для содержания экспрессионной кассеты Cas9 геномно интегрированной в локус Rosa26, причем экспрессионная кассета Cas9 содержит кодирующую последовательность для белка Cas9, и причем белок Cas9 экспрессируется и содержит полную последовательность, представленную в SEQ ID NO: 19;

(b) идентификацию или выбор генетически модифицированной мышиной ES клетки, содержащей экспрессионную кассету Cas9;

(c) введение генетически модифицированной мышиной ES клетки в эмбрион-хозяин мыши; и

(d) имплантацию и вынашивание мышиного эмбриона-хозяина в организме суррогатной матери-мыши.

67. Способ получения мыши по любому из пп. 44-64, предусматривающий:

(a) модификацию генома эмбриона мыши на стадии одной клетки для содержания экспрессионной кассеты Cas9 геномно интегрированной в локус Rosa26, причем экспрессионная кассета Cas9 содержит кодирующую последовательность для белка Cas9, и причем белок Cas9 экспрессируется и содержит полную последовательность, представленную в SEQ ID NO: 19;

(b) выбор генетически модифицированного эмбриона мыши на стадии одной клетки, содержащего экспрессионную кассету Cas9; и

(c) имплантацию и вынашивание генетически модифицированного эмбриона мыши на стадии одной клетки в организме суррогатной матери-мыши.



 

Похожие патенты:
Изобретение относится к области биотехнологии, в частности к мыши или крысе с репортером CRISPR, интегрированным в целевой геномный локус, способный экспрессировать ген, и который содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета.

Изобретение относится к биотехнологии. Описан способ для исследования микробиоты толстого кишечника путём определения ДНК микроорганизмов кишечника методом ПЦР, включающий взаимодействие образца микробиоты с набором олигонуклеотидных праймеров, определением для каждого олигонуклеотида в указанном наборе праймеров количества его нуклеотидных последовательностей-мишеней, которая присутствует в указанном образце, и получении профиля микробиоты из относительных количеств нуклеотидных последовательностей-мишеней, присутствующих в образце.

Изобретение относится к области биотехнологии, а именно к получению препарата рибонуклеопротеинового комплекса CRISPR/CAS, а также к препарату рибонуклеопротеинового комплекса CRISPR-Cas для выявления гена антибиотикоустойчивости mecA Staphylococcus aureus, полученному вышеуказанным способом. Изобретение обеспечивает выявление единичных копий гена антибиотикоустойчивости mecA Staphylococcus aureus in vitro.

Изобретение относится к области генной инженерии и биотехнологии, а именно к направляющим РНК рибонуклеопротеиновых комплексов системы CRISPR-Cas, содержащих направляющие РНК, и наборам, содержащим рибонуклеопротеиновые комплексы системы CRISPR-Cas и специфические олигонуклеотиды для предварительной амплификации высоко консервативного участка гена антибиотикоустойчивости mecA Staphylococcus aureus.

Изобретение относится к медицине, а именно к медицинской диагностике, и может быть использовано для прогнозирования риска развития язвенной болезни двенадцатиперстной кишки у неродственных русских индивидуумов, уроженцев Центрально-Черноземного региона РФ. Осуществляют забор венозной крови, выделение ДНК из периферической венозной крови и анализ полиморфных локусов rs17576-rs3787268-rs2250889 гена ММР-9.

Изобретение относится к меченому нуклеотиду для секвенирования нуклеиновых кислот, к способу секвенирования нуклеиновых кислот с его использованием и к набору для секвенирования нуклеиновых кислот. Предлагаемый меченый нуклеотид содержит нуклеотид, связывающую группу, присоединенную к фосфатной группе указанного нуклеотида, и редокс-активную зарядную метку, присоединенную к связывающей группе, причем указанная редокс-активная зарядная метка подлежит окислению или восстановлению посредством токопроводящего канала при удерживании вблизи чувствительной зоны токопроводящего канала.

Изобретение относится к биотехнологии и представляет собой способ выявления аутоантител в сыворотке крови, характерных для аутоиммунного полигландулярного синдрома 1 типа (АПС-1). Способ предназначен для мультиплексного обнаружения специфичных для АПС-1 аутоантител.
Изобретение относится к микробиологии. Описан способ исследования микробиоты толстого кишечника путем определения ДНК микроорганизмов кишечника методом полимеразной цепной реакции.
Изобретение относится к области медицины и предназначено для диагностики иммунной нейтропении новорожденного. Проводят исследование аутоантител к HNA в сыворотке матери и антител, фиксированных на HNA, у ребенка методом проточной цитометрии.

Изобретение относится к области молекулярной биологии и медицинской генетики. Разработаны высокочувствительные гибридизационные зонды к девяти кодирующим экзонам гена LAMP2 для проведения множественной лигазной реакции с последующей амплификацией (MLPA).
Изобретение относится к области биотехнологии, в частности к мыши или крысе с репортером CRISPR, интегрированным в целевой геномный локус, способный экспрессировать ген, и который содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета.
Наверх