Способы и композиции для оценки опосредованного crispr/cas разрушения или вырезания и индуцированной crispr/cas рекомбинации с экзогенной донорской нуклеиновой кислотой in vivo
Изобретение относится к области биотехнологии, в частности к мыши или крысе с репортером CRISPR, интегрированным в целевой геномный локус, способный экспрессировать ген, и который содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета. При этом репортер CRISPR функционально связан с промотором, подходящим для экспрессии в отличном от человека животном. Также раскрыта клетка вышеуказанного животного, а также способ его получения. Изобретение эффективно для исследования способности нуклеазы CRISPR/Cas, содержащей белок Cas9 и направляющую РНК, вырезать геномную нуклеиновую кислоту in vivo, а также для оптимизации способности нуклеазы CRISPR/Cas вырезать геномную нуклеиновую кислоту in vivo. 8 н. и 64 з.п. ф-лы, 11 ил., 5 табл., 1 пр.
Ссылка на родственные заявки
По настоящей заявке испрашивается приоритет в соответствии с предварительной заявкой на патент США №62/539279, поданной 31 июля 2017 г., которая полностью включена в настоящий документ посредством ссылки для всех целей.
Ссылка на перечень последовательностей, представленный в виде текстового файла из EFS-Web
Перечень последовательностей, написанный в файле 516565SEQLIST.txt, составляет 72,7 килобайта, был создан 31 июля 2018 г. и включен в настоящий документ посредством ссылки.
Предшествующий уровень техники настоящего изобретения
Технология CRISPR/Cas представляет собой новое многообещающее терапевтическое средство. Однако существует необходимость в более эффективных средствах оценки эффективности образования мутаций или целевой модификации генов посредством введенного средства CRISPR/Cas in vivo. Оценка такой активности in vivo в настоящее время основана на сложных молекулярных анализах, таких как анализы чувствительности одноцепочечной ДНКазы, цифровая ПЦР или секвенирование следующего поколения. Более эффективные способы и инструменты необходимы для более эффективной оценки активности введенных средств CRISPR/Cas и для оценки различных способов и параметров доставки для нацеливания на конкретные ткани или типы клеток in vivo.
Краткое раскрытие настоящего изобретения
Предусмотрены способы и композиции для оценки опосредованной CRISPR/Cas активности негомологичного соединения концов и/или индуцированной CRISPR/Cas активности рекомбинации in vivo. Согласно одному аспекту предусмотрены отличные от человека животные, содержащие репортер CRISPR для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК, причем репортер CRISPR интегрирован в целевой геномный локус и содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета, содержащая кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка в любом порядке, причем первый репортерный белок и второй репортерный белок являются разными.
У некоторых таких отличных от человека животных, репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой. Необязательно, первый репортерный белок содержит третью целевую последовательность направляющей РНК, причем рекомбинация репортера CRISPR с экзогенной донорской нуклеиновой кислотой изменяет кодирующую последовательность для первого репортерного белка в кодирующую последовательность для третьего репортерного белка. Необязательно, кодирующая последовательность для первого репортерного белка заменяется кодирующей последовательностью для третьего репортерного белка путем замены одного кодона. Необязательно, третья целевая последовательность направляющей РНК перекрывается с частью кодирующей последовательности для первого репортерного белка, модифицированного экзогенной донорской нуклеиновой кислотой.
У некоторых таких отличных от человека животных один из первого и второго репортерных белков содержит флуоресцентный репортерный белок. Необязательно, флуоресцентный репортерный белок содержит усиленный зеленый флуоресцентный белок (eGFP) или усиленный синий флуоресцентный белок (eBFP). Необязательно, первый и второй репортерные белки содержат флуоресцентный репортерный белок и нефлуоресцентный репортерный белок. Необязательно, флуоресцентный репортерный белок может быть обнаружен в анализе с помощью проточной цитометрии, а нефлуоресцентный белок может быть обнаружен в гистохимическом анализе. У некоторых таких отличных от человека животных один из первого и второго репортерных белков содержит белок бета-галактозидазу.
У некоторых таких отличных от человека животных первый сигнал полиаденилирования также фланкирован сайтами узнавания рекомбиназы для первой рекомбиназы. Необязательно, сайты узнавания рекомбиназы для первой рекомбиназы представляют собой последовательности loxP.
У некоторых таких отличных от человека животных репортерная кассета содержит мультицистронную нуклеиновую кислоту, содержащую кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка, разделенных промежуточным участком внутренней посадки рибосомы (IRES) или промежуточной кодирующей последовательностью пептида 2А. Необязательно, мультицистронная нуклеиновая кислота содержит кодирующую последовательность бета-галактозидазы и кодирующую последовательность усиленного синего флуоресцентного белка (eBFP) или кодирующую последовательность усиленного зеленого флуоресцентного белка (eGFP), разделенную промежуточной кодирующей последовательностью пептида Р2А.
У некоторых таких отличных от человека животных репортер CRISPR функционально связан с эндогенным промотором в целевом геномном локусе.
У некоторых таких отличных от человека животных 5'-конец репортера CRISPR дополнительно содержит 3'-последовательность сплайсинга.
У некоторых таких отличных от человека животных репортер CRISPR не содержит кассету селекции. У некоторых таких отличных от человека животных репортер CRISPR дополнительно содержит кассету селекции. Необязательно, кассета селекции фланкирована сайтами узнавания рекомбиназы для второй рекомбиназы. Необязательно, кассета селекции содержит ген лекарственной устойчивости.
У некоторых таких отличных от человека животных расстояние между первой целевой последовательностью направляющей РНК и второй целевой последовательностью направляющей РНК составляет менее чем приблизительно 500 пар нуклеотидов.
У некоторых таких отличных от человека животных первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК являются идентичными, и каждая из них содержит SEQ ID NO: 41.
У некоторых таких отличных от человека животных отличное от человека животное представляет собой крысу или мышь. Необязательно, отличное от человека животное представляет собой мышь.
У некоторых таких отличных от человека животных целевой геномный локус представляет собой локус «безопасной гавани». Необязательно, локус «безопасной гавани» представляет собой локус Rosa26. Необязательно репортер CRISPR вставляется в первый интрон локуса Rosa26.
У некоторых таких отличных от человека животных отличное от человека животное представляет собой мышь, целевой геномный локус представляет собой локус Rosa26 и репортер CRISPR, функционально связанный с эндогенным промотором Rosa26, вставлен в первый интрон Rosa26 и содержит от 5' к 3': (а) 3' последовательность сплайсинга; (b) первый сигнал полиаденилирования, фланкированный: (i) первым и вторым сайтами loxP и (ii) первой и второй целевыми последовательностями направляющих РНК, причем первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны, и каждая содержит SEQ ID NO: 41, 43, 44, 45, 46 или 47; и (с) репортерную кассету, содержащую от 5' к 3': (i) кодирующую последовательность бета-галактозидазы; (ii) кодирующую последовательность Р2А; (iii) кодирующую последовательность усиленного синего флуоресцентного белка (eBFP), причем кодирующая последовательность eBFP содержит третью целевую последовательность направляющей РНК, содержащую SEQ ID NO: 42; и (iv) второй сигнал полиаденилирования, причем первый сигнал полиаденилирования и второй сигнал полиаденилирования различны. Необязательно, репортер CRISPR дополнительно содержит: (d) кассету селекции 3' репортерной кассеты, причем кассета селекции фланкирована сайтами FRT и содержит от 5' к 3': (i) кодирующую последовательность неомицин-фосфотрансферазы, функционально связанную с промотором убиквитина человека; и (ii) третий сигнал полиаденилирования.
У некоторых таких отличных от человека животных отличное от человека животное является гетерозиготным по отношению к репортеру CRISPR в целевом геномном локусе. У некоторых таких отличных от человека животных отличное от человека животное является гомозиготным по отношению к репортеру CRISPR в целевом геномном локусе.
Согласно другому аспекту предусмотрены способы исследования способности нуклеазы CRISPR/Cas вырезать геномную нуклеиновую кислоту in vivo. Некоторые такие способы предусматривают: (а) введение любому из указанных выше отличных от человека животных: (i) первой направляющей РНК, предназначенной для гибридизации с первой целевой последовательностью направляющей РНК в репортере CRISPR; (ii) второй направляющей РНК, предназначенной для гибридизации со второй целевой последовательностью направляющей РНК в репортере CRISPR; и (iii) белка Cas; и (b) измерение активности или экспрессии по меньшей мере одного из первого и второго репортерных белков.
В некоторых таких способах белок Cas представляет собой белок Cas9. В некоторых таких способах белок Cas вводят отличному от человека животному в форме белка. В некоторых таких способах белок Cas вводят отличному от человека животному в форме информационной РНК, кодирующей белок Cas. В некоторых таких способах белок Cas вводят отличному от человека животному в форме ДНК, кодирующей белок Cas, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток отличного от человека животного.
В некоторых таких способах первая направляющая РНК и вторая направляющая РНК являются идентичными, и каждая содержит последовательность, представленную в SEQ ID NO: 2.
В некоторых таких способах репортерный белок, измеренный на стадии (b), представляет собой флуоресцентный репортерный белок, и стадия (b) предусматривает анализ с помощью проточной цитометрии. В некоторых таких способах репортерный белок, измеренный на стадии (b), представляет собой белок бета-галактозидазу, и стадия (b) предусматривает анализ гистохимического окрашивания.
В некоторых таких способах направляющие РНК на стадии (а) вводят в форме РНК. В некоторых таких способах каждую из направляющих РНК на стадии (а) вводят отличному от человека животному в форме ДНК, кодирующей направляющую РНК, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток отличного от человека животного.
В некоторых таких способах введение предусматривает опосредованную аденоассоциированным вирусом (AAV) доставку, опосредованную липидными наночастицами доставку или гидродинамическую доставку. Необязательно, введение предусматривает опосредованную AAV доставку. Необязательно, введение предусматривает опосредованную AAV8 доставку, и стадия (b) предусматривает измерение активности репортерного белка в печени отличного от человека животного.
Согласно другому аспекту предусмотрены способы оптимизации способности нуклеазы CRISPR/Cas вырезать геномную нуклеиновую кислоту in vivo. Некоторые такие способы предусматривают: (I) выполнение любого из указанных выше способов исследования способности нуклеазы CRISPR/Cas вырезать геномную нуклеиновую кислоту in vivo в первый раз у первого отличного от человека животного; (II) изменение переменной и выполнение способа стадии (I) во второй раз с измененной переменной у второго отличного от человека животного; и (III) сравнение активности или экспрессии репортерного белка на стадии (I) с активностью или экспрессией по меньшей мере одного репортерного белка на стадии (II) и выбор способа, приводящего к более высокой активности или экспрессии репортерного белка.
В некоторых таких способах измененная переменная на стадии (II) представляет собой способ доставки. В некоторых таких способах измененная переменная на стадии (II) представляет собой способ доставки путем введения направляющих РНК и/или белка Cas отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой путь введения. В некоторых таких способах измененная переменная на стадии (II) представляет собой путь введения вставляемых направляющих РНК и/или белка Cas отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой концентрацию или количество направляющих РНК, введенных отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой концентрацию или количество направляющих РНК и/или белка Cas, введенных отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой концентрацию или количество направляющих РНК, введенных отличному от человека животному, относительно концентрации или количества белка Cas, введенного отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой направляющие РНК (например, форму направляющих РНК или последовательность направляющих РНК), введенные отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой белок Cas (например, форма белка Cas), введенный отличному от человека животному.
Согласно другому аспекту предусмотрены способы исследования индуцированной CRISPR/Cas рекомбинации геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo. Некоторые такие способы предусматривают: (а) предоставление любого из указанных выше отличных от человека животных, причем репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой, причем первый сигнал полиаденилирования был удален из репортера CRISPR, и причем кодирующая последовательность для первого репортерного белка содержит третью целевую последовательность направляющей РНК, и введение отличному от человека животному: (i) направляющей РНК, предназначенной для гибридизации с третьей целевой последовательностью направляющей РНК, в репортер CRISPR; (ii) белка Cas и (iii) экзогенной донорской нуклеиновой кислоты, способной рекомбинировать с репортером CRISPR и изменять кодирующую последовательность для первого репортерного белка в кодирующую последовательность для третьего репортерного белка; и (b) измерение активности или экспрессии третьего репортерного белка.
В некоторых таких способах белок Cas представляет собой белок Cas9. В некоторых таких способах белок Cas вводится отличному от человека животному в форме белка. В некоторых таких способах белок Cas вводится отличному от человека животному в форме информационной РНК, кодирующей белок Cas. В некоторых таких способах белок Cas вводится отличному от человека животному в форме ДНК, кодирующей белок Cas, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток отличного от человека животного.
В некоторых таких способах третий репортерный белок, измеренный на стадии (b), представляет собой флуоресцентный репортерный белок, и стадия (b) предусматривает анализ с помощью проточной цитометрии. В некоторых таких способах первый репортерный белок представляет собой усиленный синий флуоресцентный белок (eBFP), а третья направляющая РНК содержит последовательность, представленную в SEQ ID NO: 14. В некоторых таких способах первый репортерный белок представляет собой усиленный синий флуоресцентный белок (eBFP), а третий репортерный белок представляет собой усиленный зеленый флуоресцентный белок (eGFP).
В некоторых таких способах экзогенная донорская нуклеиновая кислота содержит последовательность, представленную в SEQ ID NO: 15 или SEQ ID NO: 16. В некоторых таких способах экзогенная донорская нуклеиновая кислота представляет собой одноцепочечный дезоксинуклеотид.
В некоторых таких способах направляющая РНК на стадии (а) вводится в форме РНК. В некоторых таких способах направляющая РНК на стадии (а) вводится отличному от человека животному в форме ДНК, кодирующей направляющую РНК, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток отличного от человека животного.
В некоторых таких способах введение предусматривает опосредованную аденоассоциированным вирусом (AAV) доставку, опосредованную липидными наночастицами доставку или гидродинамическую доставку. Необязательно, введение предусматривает опосредованную AAV доставку. Необязательно, введение предусматривает опосредованную AAV8 доставку, и стадия (b) предусматривает измерение активности репортерного белка в печени отличного от человека животного.
Согласно другому аспекту предусмотрены способы оптимизации способности CRISPR/Cas индуцировать рекомбинацию геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo. Некоторые такие способы предусматривают: (I) выполнение любого из указанных выше способов исследования индуцированной CRISPR/Cas рекомбинации геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo в первый раз у первого отличного от человека животного; (II) изменение переменной и выполнение способа стадии (I) во второй раз с измененной переменной у второго отличного от человека животного и (III) сравнение активности или экспрессии третьего репортерного белка на стадии (I) с активностью или экспрессией третьего репортерного белка на стадии (II) и выбор способа, приводящего к более высокой активности или экспрессии третьего репортера, белка.
В некоторых таких способах измененная переменная на стадии (II) представляет собой способ доставки. В некоторых таких способах измененная переменная на стадии (II) представляет собой способ доставки путем введения одного или нескольких из направляющей РНК, белка Cas и экзогенной донорской нуклеиновой кислоты отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой путь введения. В некоторых таких способах измененная переменная на стадии (II) представляет собой способ введения одного или нескольких из направляющей РНК, белка Cas и экзогенной донорской нуклеиновой кислоты отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой концентрацию или количество одного или нескольких из направляющей РНК, белка Cas и экзогенной донорской нуклеиновой кислоты, введенной отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой экзогенную донорскую нуклеиновую кислоту (например, форму или последовательность экзогенной донорской нуклеиновой кислоты), введенную отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой концентрацию или количество направляющей РНК, введенной отличному от человека животному, относительно концентрации или количества белка Cas, введенного отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой направляющую РНК (например, форму или последовательность направляющей РНК), введенную отличному от человека животному. В некоторых таких способах измененная переменная на стадии (II) представляет собой белок Cas (например, форму или последовательность белка Cas), введенный отличному от человека животному.
Краткое описание графических материалов
На фиг. 1А показан репортерный аллель CRISPR LSL-LacZ:eBFP (MAID2634; не в масштабе), содержащий от 5' к 3': последовательность 3' сплайсинга; первый сайт loxP; первую целевую последовательность направляющей РНК; первый сигнал полиаденилирования Pgk; вторую целевую последовательность направляющей РНК; второй сайт loxP; ген lacZ; кодирующую последовательность Р2А; кодирующую последовательность усиленного синего флуоресцентного белка (eBFP); сигнал полиаденилирования SV40; первый сайт Frt; промоторы убиквитина и Em7 человека, функционально связанные с кодирующей последовательностью гена устойчивости к неомицину; второй сигнал полиаденилирования Pgk и второй сайт Frt.
На фиг. 1В показаны положения различных целевых последовательностей направляющих РНК на схеме области репортерного аллеля CRISPR LSL-LacZ:eBFP, содержащего первый сайт loxP, первый сигнал полиаденилирования Pgk и второй сайт loxP (не в масштабе).
На фиг. 2 показана общая схема нацеливания трансгена в первый интрон локуса Rosa26.
На фиг. 3 показан репортерный аллель CRISPR LSL-eBFP (MAID2652; не в масштабе), содержащий от 5' к 3': последовательность 3' сплайсинга; первый сайт loxP; промотор Em7; кодирующую последовательность гена устойчивости к неомицину; сигнал тройного полиаденилирования; второй сайт loxP; кодирующую последовательность усиленного синего флуоресцентного белка (eBFP) и сигнал полиаденилирования SV40.
На фиг. 4А-4Е показаны окрашенные lacZ эмбриональные стволовые клетки мыши (mESC), содержащие репортерный аллель CRISPR LSL-LacZ:eBFP. Клетки на фиг. 4А не обработаны, клетки на фиг. 4В подвергали электропорации с плазмидой рекомбиназы Cre для вырезания первого сигнала полиаденилирования Pgk, клетки на фиг. 4С электропорировали с комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс вместе с синтетическими sgRNA gU3 и gD1 для нацеливания на первый сигнал полиаденилирования Pgk для вырезания, клетки на фиг. 4D электропорировали с комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс вместе с синтетическими sgRNA gU3 и gD2 для нацеливания на первый сигнал полиаденилирования Pgk для вырезания, и клетки на фиг. 4Е электропорировали с комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс с синтетическими sgRNA gU2 и gD1, для нацеливания на первый сигнал полиаденилирования Pgk для вырезания.
На фиг. 5 показаны окрашенные lacZ эмбриональные стволовые клетки мыши (mESC), содержащие репортерный аллель CRISPR LSL-LacZ:eBFP через три дня после электропорации. Клетки электропорировали с комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс вместе с синтетическими sgRNA cGM4 и cGM5, комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс вместе с синтетическими sgRNA cGM4 и cGM, комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс вместе с синтетическими sgRNA cGM4 и cGM3, комплексом рибонуклеопротеинов, содержащим белок Cas9, образующий комплекс вместе с синтетической sgRNA 9172 (нережущая контрольная направляющая РНК), только белок Cas9 или плазмиду Cre рекомбиназы.
На фиг. 6 показаны окрашенные lacZ эмбриональные стволовые клетки мыши (mESC), содержащие репортерный аллель CRISPR LSL-LacZ:eBFP, через три дня после электропорации. Клетки либо не обрабатывали, либо электропорировали с помощью плазмиды Cas9 и плазмиды sgRNA #16, либо электропорировали с помощью плазмиды Cre рекомбиназы.
На фиг. 7 показаны окрашенные lacZ печени, выделенные от мышей LSL-LacZ:eBFP через 1 неделю после инъекции липидными наночастицами, содержащими направляющую РНК, mRNA Cas9 и направляющую РНК или mRNA Cre рекомбиназы. Условия воздействия предусматривали Cas9 плюс sgRNA для удаления рА (sgRNA #16), Cas9 вместе с sgRNA gU2 и gD1, Cas9 вместе с контрольной нережущей sgRNA и рекомбиназой Cre.
На фиг. 8 показана иммуногистохимия lacZ образцов печени от мышей с репортером CRISPR LSL-LacZ:eBFP, обработанных Cas9 плюс sgRNA для удаления рА (sgRNA #16), Cas9 вместе с sgRNA gU2 и gD1 или рекомбиназой LNP-Cre. Образцы печени от необработанных мышей использовали в качестве контроля. Окрашенные в коричневый цвет клетки указывают на экспрессию белка LACZ.
На фиг. 9 показаны изображения светлопольной микроскопии и флуоресцентной микроскопии (eGFP) мышиных эмбриональных стволовых клеток (mESC), содержащих репортерный аллель CRISPR eBFP (репортерный аллель CRISPR LSL-eBFP после обработки рекомбиназой Cre для получения MAID20090) после обработки CRISPR/Cas9 и матрицу репарации ssODN для преобразования eBFP в eGFP. В верхнем ряду показаны изображения светлопольной микроскопии, а в нижнем - изображения флуоресцентной микроскопии (eGFP).
На фиг. 10А показаны изображения светлопольной микроскопии и флуоресцентной микроскопии (eGFP) гемопоэтических стволовых клеток и клеток-предшественников (HSPC), выделенных от мышей, содержащих репортерный аллель CRISPR eBFP (репортерный аллель CRISPR LSL-eBFP после обработки рекомбиназой Cre для получения MAID20090), геномно интегрированной в локусе Rosa26 после обработки рибонуклеопротеиновыми комплексами CRISPR/Cas9 и матрицей репарации ssODN (FW или REV) посредством электропорации для превращения eBFP в eGFP. В верхнем ряду показаны изображения светлопольной микроскопии, а в нижнем - изображения флуоресцентной микроскопии (eGFP) через 48 часов после электропорации.
На фиг. 10В показаны изображения светлопольной микроскопии и флуоресцентной микроскопии (eGFP) гемопоэтических стволовых клеток и клеток-предшественников (HSPC), выделенных от мышей, содержащих репортерный аллель CRSPR eBFP (репортерный аллель CRISPR LSL-eBFP после обработки рекомбиназой Cre для получения MAID20090), геномно интегрированный в локус Rosa26 после обработки комплексами рибонуклеопротеинов CRISPR/Cas9 и матрицей репарации ssODN FW посредством электропорации для превращения eBFP в eGFP. В верхнем ряду показаны необработанные контрольные клетки, а в нижнем ряду показаны обработанные клетки. В первом столбце показаны изображения светлопольной микроскопии, а во втором и третьем столбцах показаны изображения флуоресцентной микроскопии (eGFP) через 7 дней после электропорации.
На фиг. 11 показана эффективность негомологичного соединения концов (количество считываний), как определено посредством секвенирования следующего поколения в клетках, выделенных из печени, собранной у мышей, содержащих репортерный аллель CRISPR LSL-LacZ:eBFP, интегрированный в локус Rosa26, через одну неделю после инъекции указанных компонентов CRISPR/Cas9 или рекомбиназы Cre.
Определения
Термины «белок», «полипептид» и «пептид», используемые в настоящем документе взаимозаменяемо, включают в себя полимерные формы аминокислот любой длины, включая в себя кодированные и некодированные аминокислоты и химически или биохимически модифицированные или дериватизированные аминокислоты. Термины также включают в себя полимеры, которые были модифицированы, такие как полипептиды, содержащие модифицированные пептидные остовы.
Говорят, что у белков есть «N-конец» и «С-конец». Термин «N-конец» относится к началу белка или полипептида, оканчивающемуся аминокислотой со свободной аминогруппой (-NH2). Термин «С-конец» относится к концу аминокислотной цепи (белка или полипептида), оканчивающемуся свободной карбоксильной группой (-СООН).
Термины «нуклеиновая кислота» и «полинуклеотид», используемые в настоящем документе взаимозаменяемо, включают в себя полимерные формы нуклеотидов любой длины, включая в себя рибонуклеотиды, дезоксирибонуклеотиды или их аналоги или модифицированные версии. Они включают в себя одно-, двух- и многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК и полимеры, содержащие пуриновые основания, пиримидиновые основания или другие природные, химически модифицированные, биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.
Считается, что у нуклеиновых кислот есть «5'-концы» и «3'-концы », потому что мононуклеотиды реагируют с образованием олигонуклеотидов таким образом, что 5'-фосфат одного мононуклеотидпентозного кольца присоединяется к 3'-кислороду его соседа в одном направлении через фосфодиэфирную связь. Конец олигонуклеотида называют «5'-концом», если его 5'-фосфат не связан с 3'-кислородом мононуклеотидного пентозного кольца. Конец олигонуклеотида называют «3'-концом», если его 3'-кислород не связан с 5'-фосфатом другого мононуклеотидного пентозного кольца. Можно сказать, что последовательность нуклеиновой кислоты, даже если она находится внутри более крупного олигонуклеотида, имеет 5' и 3' концы. В линейной или круговой молекуле ДНК дискретные элементы называются «находящимися выше против хода транскрипции» от 5' или «ниже по ходу транскрипции» от 3' элементов.
Термин «геномно интегрированный» относится к нуклеиновой кислоте, которая была введена в клетку так, что нуклеотидная последовательность интегрируется в геном клетки. Любой протокол может быть использован для стабильного включения нуклеиновой кислоты в геном клетки.
Термин «экспрессионный вектор» или «экспрессионная конструкция» относится к рекомбинантной нуклеиновой кислоте, содержащей желаемую кодирующую последовательность, функционально связанную с соответствующими последовательностями нуклеиновой кислоты, необходимыми для экспрессии функционально связанной кодирующей последовательности в конкретной клетке-хозяине или организме-хозяине. Последовательности нуклеиновых кислот, необходимые для экспрессии в прокариотах, как правило, включают в себя промотор, оператор (необязательно) и сайт связывания рибосомы, а также другие последовательности. Как известно, эукариотические клетки используют промоторы, энхансеры и сигналы терминации и полиаденилирования, хотя некоторые элементы могут быть удалены, а другие элементы могут быть добавлены без ущерба для необходимой экспрессии.
Термин «нацеливающий вектор» относится к рекомбинантной нуклеиновой кислоте, которая может быть введена путем гомологичной рекомбинации, лигирования, опосредованного негомологичным соединением концов, или любым другим способом рекомбинации в целевое положение в геноме клетки.
Термин «вирусный вектор» относится к рекомбинантной нуклеиновой кислоте, которая включает в себя по меньшей мере один элемент вирусного происхождения и включает в себя элементы, достаточные для упаковки в частицу вирусного вектора или разрешающие это. Вектор и/или частица могут быть использованы с целью переноса ДНК, РНК или других нуклеиновых кислот в клетки ex vivo или in vivo. Известны многочисленные формы вирусных векторов.
Термин «выделенный» в отношении белков, нуклеиновых кислот и клеток включает в себя белки, нуклеиновые кислоты и клетки, которые относительно очищены по отношению к другим клеточным компонентам или компонентам организма, которые, как правило, могут присутствовать in situ, вплоть до и включая в себя по существу чистый препарат белка, нуклеиновой кислоты или клетки. Термин «выделенный» также включает в себя белки и нуклеиновые кислоты, которые не имеют встречающегося в природе аналога, или белки или нуклеиновые кислоты, которые были химически синтезированы и, таким образом, по существу не загрязнены другими белками или нуклеиновыми кислотами. Термин «выделенный» также включает в себя белки, нуклеиновые кислоты или клетки, которые были отделены или очищены от большинства других клеточных компонентов или компонентов организма, которые их естественным образом сопровождают (например, другие клеточные белки, нуклеиновые кислоты или клеточные или внеклеточные компоненты).
Термин «дикий тип» включает в себя объекты, характеризующиеся структурой и/или активностью, обнаруживаемой в нормальном (в отличие от мутантного, патологического, измененного и т.д.) состоянии или контексте. Гены и полипептиды дикого типа часто существуют в нескольких различных формах (например, аллели).
Термин «эндогенная последовательность» относится к последовательности нуклеиновой кислоты, которая встречается в природе внутри клетки или отличного от человека животного. Например, эндогенная последовательность Rosa26 отличного от человека животного относится к нативной последовательности Rosa26, которая естественным образом встречается в локусе Rosa26 отличного от человека животного.
«Экзогенные» молекулы или последовательности включают в себя молекулы или последовательности, которые, как правило, не присутствуют в клетке в этой форме. Нормальное присутствие включает в себя присутствие относительно конкретной стадии развития и условий окружающей среды клетки. Например, экзогенная молекула или последовательность может включать в себя мутантную версию соответствующей эндогенной последовательности в клетке, такую как гуманизированная версия эндогенной последовательности, или может включать в себя последовательность, соответствующую эндогенной последовательности в клетке, но в другой форма (т.е. не в пределах хромосомы). Напротив, эндогенные молекулы или последовательности включают в себя молекулы или последовательности, которые обычно присутствуют в такой форме в конкретной клетке на определенной стадии развития в определенных условиях окружающей среды.
Термин «гетерологичный» при использовании в контексте нуклеиновой кислоты или белка указывает на то, что нуклеиновая кислота или белок содержит по меньшей мере два сегмента, которые в природе не встречаются вместе в одной и той же молекуле. Например, термин «гетерологичный», при использовании в отношении сегментов нуклеиновой кислоты или сегментов белка, указывает на то, что нуклеиновая кислота или белок содержит две или более подпоследовательности, которые не находятся в одинаковом отношении друг к другу (например, объединены) в природе. В качестве одного примера, «гетерологичная» область вектора нуклеиновой кислоты представляет собой сегмент нуклеиновой кислоты внутри или присоединенный к другой молекуле нуклеиновой кислоты, которая не обнаружена в связи с другой молекулой в природе. Например, гетерологичная область вектора нуклеиновой кислоты может включать в себя кодирующую последовательность, фланкированную последовательностями, которые не обнаружены в природе в связи с кодирующей последовательностью. Аналогично, «гетерологичная» область белка представляет собой сегмент аминокислот внутри или присоединенный к другой пептидной молекуле, который не обнаружен в природе в связи с другой пептидной молекулой (например, слитым белком или белком с тэгом). Подобным образом, нуклеиновая кислота или белок могут содержать гетерологичную метку или гетерологичную последовательность секрецию или локализации.
«Оптимизация кодонов» использует преимущества вырожденности кодонов, что проявляется в множественности комбинаций кодонов с тремя парами оснований, которые определяют аминокислоту, и, как правило, включает в себя процесс модификации последовательности нуклеиновой кислоты для усиления экспрессии в конкретной клетке-хозяине путем замены по меньшей мере одного кодона нативной последовательности на кодон, который чаще или наиболее часто используется в генах клетки-хозяина при сохранении нативной аминокислотной последовательности. Например, нуклеиновую кислоту, кодирующую белок Cas9, можно модифицировать для замены кодонов, характеризующихся более высокой частотой использования в данной прокариотической или эукариотической клетке, включая в себя бактериальную клетку, дрожжевую клетку, клетку человека, отличную от человеческой клетку, клетку млекопитающего, клетку грызуна, клетку мыши, клетку крысы, клетку хомяка или любую другую клетку-хозяина по сравнению с природной последовательностью нуклеиновой кислоты. Таблицы частоты использования кодонов легкодоступны, например, в «Базе данных частоты использования кодонов». Эти таблицы можно адаптировать несколькими способами. Смотрите, публикацию Nakamura et al. (2000) Nucleic Acids Research 28:292, полностью включенную в настоящий документ посредством ссылки для всех целей. Также доступны компьютерные алгоритмы для оптимизации кодонов конкретной последовательности для экспрессии в конкретном хозяине (смотрите, например, Gene Forge).
«Промотор» представляет собой регуляторную область ДНК, как правило, содержащую ТАТА-бокс, способный направлять РНК-полимеразу II для инициации синтеза РНК в соответствующем сайте инициации транскрипции для конкретной полинуклеотидной последовательности. Промотор может дополнительно содержать другие области, которые влияют на скорость инициации транскрипции. Описанные в настоящем документе промоторные последовательности модулируют транскрипцию функционально связанного полинуклеотида. Промотор может быть активным в одном или нескольких типах клеток, раскрытых в настоящем документе (например, эукариотическая клетка, клетка отличного от человека млекопитающего, клетка человека, клетка грызуна, плюрипотентная клетка, эмбрион одноклеточной стадии, дифференцированная клетка или их комбинация). Промотор может быть, например, конститутивно активным промотором, условным промотором, индуцибельным промотором, ограниченным во времени промотором (например, регулируемым развитием промотором) или пространственно ограниченным промотором (например, клеточно-специфическим или тканеспецифическим промотором). Примеры промоторов можно найти, например, в публикации международной заявки WO 2013/176772, полностью включенной в настоящий документ посредством ссылки для всех целей.
Конститутивный промотор представляет собой промотор, который активен во всех тканях или конкретных тканях на всех стадиях развития. Примеры конститутивных промоторов включают в себя немедленно-ранний промотор цитомегаловируса человека (hCMV), немедленно-ранний промотор цитомегаловируса мыши (mCMV), фактор элонгации 1 альфа человека (hEF1α), фактор элонгации 1 альфа мыши (mEF1α), фосфоглицераткиназа мыши (PGK), гибридный промотор бета-актина кур (CAG или CBh), ранний промотор SV40 и промотор бета 2 тубулина.
Примеры индуцибельных промоторов включают в себя, например, химически регулируемые промоторы и физически регулируемые промоторы. Химически регулируемые промоторы включают в себя, например, алкоголь-регулируемые промоторы (например, промотор гена алкогольдегидрогеназы (alcA)), тетрациклин-регулируемые промоторы (например, чувствительный к тетрациклину промотор, последовательность оператора тетрациклина (tetO), промотор tet-On или промотор tet-Off), регулируемые стероидами промоторы (например, глюкокортикоидный рецептор крысы, промотор рецептора эстрогена или промотор рецептора экдизона) или регулируемые металлом промоторы (например, промотор металлопротеина). Физически регулируемые промоторы включают в себя, например, регулируемые температурой промоторы (например, промотор теплового шока) и регулируемые светом промоторы (например, светоиндуцируемый промотор или репрессуемый светом промотор).
Тканеспецифические промоторы могут представлять собой, например, нейрон-специфические промоторы, глиа-специфические промоторы, специфические для мышечных клеток промоторы, специфические для клеток сердца промоторы, специфические для клеток почек промоторы, специфические для костных клеток промоторы, специфические для эндотелиальных клеток промоторы или специфические для иммунных клеток промоторы (например, промотор В-клеток или промотор Т-клеток).
Регулируемые развитием промоторы включают в себя, например, промоторы, активные только во время эмбриональной стадии развития или только во взрослой клетке.
Термин «функциональная связь» или «функционально связанный» включает в себя наложение двух или более компонентов (например, промотора и другого элемента последовательности) таким образом, что оба компонента функционируют нормально и допускают возможность того, что по меньшей мере один из компонентов может опосредовать функцию, которая действует по меньшей мере на один из других компонентов. Например, промотор может быть функционально связан с кодирующей последовательностью, если промотор контролирует уровень транскрипции кодирующей последовательности в ответ на присутствие или отсутствие одного или нескольких регуляторных факторов транскрипции. Функциональная связь может включать в себя такие последовательности, которые являются смежными друг с другом или действуют в транс-положении (например, регуляторная последовательность может действовать на расстоянии для управления транскрипцией кодирующей последовательности).
Термин «комплементарность» нуклеиновых кислот означает, что нуклеотидная последовательность в одной цепи нуклеиновой кислоты вследствие ориентации ее групп нуклеиновых оснований образует водородные связи с другой последовательностью на противоположной цепи нуклеиновой кислоты. Комплементарными основаниями в ДНК, как правило, являются А с Т и С с G. В РНК они, как правило, С с G и U с А. Комплементарность может быть совершенной или существенной/достаточной. Совершенная комплементарность между двумя нуклеиновыми кислотами означает, что две нуклеиновые кислоты могут образовывать дуплекс, в котором каждое основание в дуплексе связано с комплементарным основанием спариванием Уотсона-Крика. «По существу» или «достаточно» комплементарный означает, что последовательность в одной цепи не является полностью и/или совершенно комплементарной последовательности в противоположной цепи, но что между основаниями на двух цепях происходит достаточное связывание для образования стабильного гибридного комплекса в наборе условий гибридизации (например, концентрация соли и температура). Такие условия могут быть предсказаны с использованием последовательностей и стандартных математических расчетов для прогнозирования Tm (температуры плавления) гибридизированных цепей или путем эмпирического определения Tm с использованием рутинных способов. Tm включает в себя температуру, при которой популяция гибридизационных комплексов, образованных между двумя цепями нуклеиновой кислоты, денатурирует на 50% (т.е. популяция двухцепочечных молекул нуклеиновой кислоты становится наполовину диссоциированной на отдельные цепи). При температуре ниже Tm образование гибридизационного комплекса является предпочтительным, тогда как при температуре выше Tm плавление или разделение цепей в гибридизационном комплексе является предпочтительным. Tm можно оценить для нуклеиновой кислоты, имеющей известное содержание G+C в водном растворе NaCl в концентрации 1М, с использованием, например, Tm=81,5+0,41 (% G+C), хотя другие известные вычисления Tm учитывают структурные характеристики нуклеиновой кислоты.
«Условие гибридизации» включает в себя кумулятивную среду, в которой одна цепь нуклеиновой кислоты связывается со второй цепью нуклеиновой кислоты посредством комплементарных взаимодействий цепей и водородной связи с образованием комплекса гибридизации. Такие условия включают в себя химические компоненты и их концентрации (например, соли, хелатирующие средства, формамид) водного или органического раствора, содержащего нуклеиновые кислоты, и температуру смеси. Другие факторы, такие как продолжительность инкубации или размеры реакционной камеры, могут влиять на окружающую среду. Смотрите, например, публикацию Sambrook et al,, Molecular Cloning, A Laboratory Manual, 2. sup.nd ed., pp. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989), которая полностью включена в настоящий документ посредством ссылки для всех целей.
Гибридизация требует, чтобы две нуклеиновые кислоты содержали комплементарные последовательности, хотя возможны несоответствия между основаниями. Условия, подходящие для гибридизации между двумя нуклеиновыми кислотами, зависят от длины нуклеиновых кислот и степени комплементации, переменные, которые хорошо известны. Чем больше степень комплементации между двумя нуклеотидными последовательностями, тем больше значение температуры плавления (Tm) для гибридов нуклеиновых кислот, имеющих эти последовательности.
Для гибридизации между нуклеиновыми кислотами с короткими участками комплементарности (например, комплементарность более чем 35 или менее чем 30 или менее чем 25, или менее чем 22, или менее чем 20, или менее чем 18 или менее нуклеотидов) положение несоответствий становится важным (смотрите Sambrook et al., выше, 11.7-11.8). Как правило, длина гибридизуемой нуклеиновой кислоты составляет по меньшей мере приблизительно 10 нуклеотидов. Иллюстративные минимальные длины для гибридизуемой нуклеиновой кислоты включают в себя по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 22 нуклеотида, по меньшей мере приблизительно 25 нуклеотидов и по меньшей мере приблизительно 30 нуклеотидов. Кроме того, температура и концентрация соли в промывочном растворе могут корректироваться по мере необходимости в соответствии с такими факторами, как длина области комплементации и степень комплементации.
Последовательность полинуклеотида не обязательно должна быть на 100% комплементарна последовательности его целевой нуклеиновой кислоты, чтобы быть специфически гибридизуемой. Кроме того, полинуклеотид может гибридизоваться с одним или несколькими сегментами, так что промежуточные или смежные сегменты не участвуют в событии гибридизации (например, структура петли или структура шпильки). Полинуклеотид (например, gRNA) может характеризоваться комплементарностью последовательности, составляющей по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 99% или 100% к целевой области в целевой последовательности нуклеиновой кислоты, на которые они нацелены. Например, gRNA, в которой 18 из 20 нуклеотидов являются комплементарными целевой области и, следовательно, будут специфически гибридизоваться, будет характеризоваться комплементарность, составляющей 90%. В этом примере оставшиеся некомплементарные нуклеотиды могут быть кластеризованы или перемежены с комплементарными нуклеотидами и не должны быть смежными друг с другом или с комплементарными нуклеотидами.
Процент комплементарности между отдельными участками последовательностей нуклеиновых кислот в нуклеиновых кислотах может быть определен обычным образом с использованием программ BLAST (базовые инструменты поиска локального выравнивания) и программ PowerBLAST (Altschul et al. (1990) J. Mol Biol. 215:403-410; Zhang and Madden (1997) Genome Res. 7:649-656) или с использование программы Gap (пакет анализа последовательности в Висконсине, версия 8 для Unix, Genetics Computer Group, Университетский исследовательский парк, Мэдисон, Висконсин) с использованием настроек по умолчанию, который использует алгоритм Смита и Уотермана (Adv. Appl. Math., 1981, 2, 482-489).
Способы и композиции, представленные в настоящем документе, используют множество различных компонентов. Некоторые компоненты по всему описанию могут иметь активные варианты и фрагменты. Такие компоненты включают в себя, например, белки Cas, РНК CRISPR, tracrRNA и направляющие РНК. Биологическая активность для каждого из этих компонентов описана в настоящем документе в другом месте. Термин «функциональный» относится к врожденной способности белка или нуклеиновой кислоты (или их фрагмента или варианта) проявлять биологическую активность или функцию. Такие биологические активности или функции могут включать в себя, например, способность белка Cas связываться с направляющей РНК и с целевой последовательностью ДНК. Биологические функции функциональных фрагментов или вариантов могут быть одинаковыми или могут фактически изменяться (например, в отношении их специфичности, селективности или эффективности) по сравнению с исходными, но с сохранением основной биологической функции.
Термин «вариант» относится к нуклеотидной последовательности, отличающейся от последовательности, наиболее распространенной в популяции (например, одним нуклеотидом), или последовательности белка, отличающейся от последовательности, наиболее распространенной в популяции (например, одной аминокислотой).
Термин «фрагмент» применительно к белку означает белок, который короче или содержит меньше аминокислот, чем полноразмерный белок. Термин «фрагмент» при ссылке на нуклеиновую кислоту означает нуклеиновую кислоту, которая короче или содержит меньше нуклеотидов, чем полноразмерная нуклеиновая кислота. Фрагмент может представлять собой, например, N-концевой фрагмент (т.е. удаление части С-концевого конца белка), С-концевой фрагмент (т.е. удаление части N-концевого конца белок) или внутренний фрагмент.
Термин «идентичность последовательности» или «идентичность» в контексте двух полинуклеотидных или полипептидных последовательностей относится к остаткам в двух последовательностях, которые являются одинаковыми при выравнивании для максимального соответствия в указанном окне сравнения. Когда процент идентичности последовательности используется в отношении белков, положения остатков, которые не являются идентичными, часто отличаются консервативными аминокислотными заменами, где аминокислотные остатки заменены другими аминокислотными остатками со сходными химическими свойствами (например, заряд или гидрофобность) и, следовательно, не меняют функциональные свойства молекулы. Когда последовательности отличаются по консервативным заменам, процентная идентичность последовательности может быть повышена для корректировки консервативного характера замены. Говорят, что последовательности, которые отличаются такими консервативными заменами, характеризуются «сходством последовательностей» или «сходством». Средства для такой корректировки хорошо известны. Как правило, это включает в себя оценку консервативной замены скорее частичного, а не полного несоответствия, что увеличивает процент идентичности последовательности. Таким образом, например, когда идентичная аминокислота получает оценку 1, а неконсервативная замена получает оценку 0, консервативная замена получает оценку от 0 до 1. Рассчитывается оценка консервативных замен, например, как это реализовано в программе PC/GENE (Intelligenetics, Mountain View, California).
«Процент идентичности последовательности» включает в себя значение, определенное путем сравнения двух оптимально выровненных последовательностей (наибольшее количество идеально совпадающих остатков) в окне сравнения, причем часть полинуклеотидной последовательности в окне сравнения может содержать добавления или удаления (т.е. гэпы) по сравнению с эталонной последовательностью (которая не содержит добавления или удаления) для оптимального выравнивания двух последовательностей. Процент рассчитывается путем определения количества положений, в которых идентичное основание нуклеиновой кислоты или аминокислотный остаток встречается в обеих последовательностях, для получения числа совпадающих положений, деления количества совпадающих положений на общее количество положений в окне сравнения и умножения результата на 100, чтобы получить процент идентичности последовательности. Если не указано иное (например, более короткая последовательность включает в себя связанную гетерологичную последовательность), окно сравнения представляет собой полную длину более короткой из двух сравниваемых последовательностей.
Если не указано иное, значения идентичности/сходства последовательности включают в себя значение, полученное с использованием GAP версии 10 с использованием следующих параметров: % идентичности и % сходства для нуклеотидной последовательности с использованием штрафа за открытие гэпа 50 и штрафа за удлинение гэпа 3 и матрицы замен nwsgapdna.cmp; % идентичности и % сходства для аминокислотной последовательности с использованием штрафа за открытие гэпа 8 и штрафа за удлинение гэпа 2 и матрицы замен BLOSUM62; или любая эквивалентная программа этого. «Эквивалентная программа» включает в себя любую программу сравнения последовательностей, которая для любых двух рассматриваемых последовательностей производит выравнивание, имеющее идентичные совпадения нуклеотидных или аминокислотных остатков и идентичную процентную идентичность последовательности по сравнению с соответствующим выравниванием, полученным с помощью GAP версии 10.
Термин «консервативная аминокислотная замена» относится к замене аминокислоты, которая обычно присутствует в последовательности, на другую аминокислоту схожего размера, заряда или полярности. Примеры консервативных замен включают в себя замену неполярного (гидрофобного) остатка, такого как изолейцин, валин или лейцин, на другой неполярный остаток. Аналогичным образом, примеры консервативных замен включают в себя замену одного полярного (гидрофильного) остатка на другой, например, аргинина на лизин, глутамина и аспарагин или глицина на серин. Кроме того, замена основного остатка, такого как лизин, аргинин или гистидин, на другой, или замена одного кислотного остатка, такого как аспарагиновая кислота или глутаминовая кислота, на другой кислотный остаток являются дополнительными примерами консервативных замен. Примеры неконсервативных замен включают в себя замену неполярного (гидрофобного) аминокислотного остатка, такого как изолейцин, валин, лейцин, аланин или метионин, на полярный (гидрофильный) остаток, такой как цистеин, глутамин, глутаминовая кислота или лизин, и/или полярный остаток на неполярный остаток. Типичные классификации аминокислот приведены в таблице 1 ниже.
Термин «in vitro» включает в себя искусственную среду и процессы или реакции, которые происходят в искусственной среде (например, в пробирке). Термин «in vivo» включает в себя природную среду (например, клетку, организм или тело) и процессы или реакции, которые происходят в естественной среде. Термин «ех vivo» включает в себя клетки, которые были удалены из организма индивидуума, а также процессы или реакции, которые происходят внутри таких клеток.
Термин «репортерный ген» относится к нуклеиновой кислоте, характеризующейся последовательностью, кодирующей продукт гена (как правило, фермент), который легко и количественно анализируется, когда конструкция, содержащая последовательность репортерного гена, функционально связана с эндогенным или гетерологичным промотором и/или энхансерный элемент вводится в клетки, содержащие (или которые могут содержать) факторы, необходимые для активации промоторных и/или энхансерных элементов. Примеры репортерных генов включают в себя, без ограничения, гены, кодирующие бета-галактозидазу (lacZ), гены бактериальной хлорамфениколацетилтрансферазы (cat), гены люциферазы светлячка, гены, кодирующие бета-глюкуронидазу (GUS), и гены, кодирующие флуоресцентные белки. «Репортерный белок» относится к белку, кодируемому репортерным геном.
Используемый в настоящем документе термин «флуоресцентный репортерный белок» означает репортерный белок, который можно обнаружить на основе флуоресценции, причем флуоресценция может быть либо непосредственно от репортерного белка, активности репортерного белка на флуорогенном субстрате, либо белка с аффинностью для связывания с флуоресцентным меченым соединением. Примеры флуоресцентных белков включают в себя зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, мономерный Azami Green, CopGFP, AceGFP и ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, Citrine, Venus, YPet, PhiYFP и ZsYellowl), синие флуоресцентные белки (например, BFP, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire и T-sapphire), голубые флуоресцентные белки (например, CFP, eCFP, Cerulean, CyPet, AmCyanl и Midoriishi-Cyan), красные флуоресцентные белки (например, RFP, mKate, mKate2, mPlum, мономер DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-мономер, HcRed-тандем, AscRed6, E6R6, mRaspberry, mStrawberry и Jred), оранжевые флуоресцентные белки (например, mOrange, mKO, Kusabira-Orange, мономерный Kusabira-Orange, mTangerine и tdTomato) и любой другой подходящий флуоресцентный белок, присутствие которого в клетках можно обнаружить с помощью способов проточной цитометрии.
Репарация в ответ на двухцепочечные разрывы (DSB) происходит главным образом посредством двух консервативных путей восстановления ДНК: гомологичной рекомбинации (HR) и негомологичного соединения концов (NHEJ). Смотрите публикацию Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897, полностью включенную в настоящий документ посредством ссылки для всех целей. Аналогичным образом, репарация целевой нуклеиновой кислоты, опосредованной экзогенной донорской нуклеиновой кислотой, может включать в себя любой процесс обмена генетической информацией между двумя полинуклеотидами.
Термин «рекомбинация» включает в себя любой процесс обмена генетической информацией между двумя полинуклеотидами и может происходить по любому механизму. Рекомбинация может происходить посредством направляемой гомологией репарации (HDR) или гомологичной рекомбинации (HR). HDR или HR включают в себя форму восстановления нуклеиновой кислоты, которая может требовать гомологии нуклеотидной последовательности, использует «донорскую» молекулу в качестве матрицы для восстановления «целевой» молекулы (т.е. той, которая испытала разрыв двухцепочечной цепи) и приводит к передаче генетической информации от донора к мишени. Без ограничения какой-либо конкретной теорией такой перенос может включать в себя коррекцию несоответствия гетеродуплексной ДНК, которая образуется между поврежденной мишенью и донором, и/или зависимый от синтеза отжиг цепей, при котором донор используется для повторного синтеза генетической информации, которая будет становиться частью мишени и/или связанных процессов. В некоторых случаях донорский полинуклеотид, часть донорского полинуклеотида, копия донорского полинуклеотида или часть копии донорского полинуклеотида интегрируется в целевую ДНК. Смотрите публикации Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) PLOS ONE 7:e45768:1-9 и Wang et al. (2013) Nat Biotechnol. 31:530-532, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей.
NHEJ включает в себя репарацию двухцепочечных разрывов в нуклеиновой кислоте путем прямого лигирования концов разрывов друг с другом или с экзогенной последовательностью без необходимости в гомологичной матрице. Лигирование несмежных последовательностей с помощью NHEJ часто может приводить к делециям, вставкам или транслокациям вблизи сайта двухцепочечного разрыва. Например, NHEJ также может приводить к целенаправленной интеграции экзогенной донорской нуклеиновой кислоты посредством прямого лигирования концов разрыва с концами экзогенной донорской нуклеиновой кислоты (т.е. захват на основе NHEJ). Такая NHEJ-опосредованная целевая интеграция может быть предпочтительной для вставки экзогенной донорской нуклеиновой кислоты, когда пути направляемой гомологией репарации (HDR) нелегко использовать (например, в неделящихся клетках, первичных клетках и клетках, которые плохо выполняют основанную на гомологии репарацию ДНК). Кроме того, в отличие от направляемой гомологией репарации, не требуется знание относительно больших областей идентичности последовательностей, фланкирующих сайт расщепления (за пределами выступов, создаваемых Cas-опосредованным расщеплением), что может быть применимым при попытке целенаправленной вставки в организмы, имеющие геномы, для которых есть ограниченные знания о геномной последовательности. Интеграция может происходить посредством лигирования тупых концов между экзогенной донорской нуклеиновой кислотой и расщепленной геномной последовательностью или посредством лигирования липких концов (т.е. имеющих 5' или 3' выступы) с использованием экзогенной донорской нуклеиновой кислоты, которая окружена выступами, которые совместимы с таковыми, производимыми белком Cas в расщепленной геномной последовательности. Смотрите, например, US 2011/020722, WO 2014/033644, WO 2014/089290 и публикацию Maresca et al. (2013) Genome Res. 23(3):539-546, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Если тупые концы лигированы, может потребоваться резекция мишени и/или донора для получения областей микрогомологии, необходимых для соединения фрагментов, что может привести к нежелательным изменениям в целевой последовательности.
Композиции или способы, «содержащие» или «включающие в себя» один или несколько перечисленных элементов, могут включать в себя другие элементы, которые конкретно не указаны. Например, композиция, которая «содержит» или «включает в себя» белок, может содержать белок отдельно или в комбинации с другими ингредиентами. Переходная фраза «состоящий по существу из» означает, что объем формулы изобретения следует интерпретировать как охватывающий указанные элементы, перечисленные в формуле изобретения, и элементы, которые не оказывают существенного влияния на основную и новую характеристику(и) заявленного изобретения. Таким образом, термин «состоящий по существу из» при использовании в формуле изобретения не предназначен для того, чтобы быть интерпретированным как эквивалент «содержащий».
«Необязательный» или «необязательно» означает, что впоследствии описанное событие или обстоятельство могут произойти или могут не произойти, и что настоящее описание включает в себя случаи, в которых происходит событие или обстоятельство, и случаи, в которых это не происходит.
Обозначение диапазона значений включает в себя все целые числа в пределах диапазона или определяющие диапазон и все поддиапазоны, определенные целыми числами в пределах диапазона.
Если иное не очевидно из контекста, термин «приблизительно» охватывает значения в пределах стандартного предела погрешности измерения (например, SEM) заявленного значения.
Термин «и/или» относится и охватывает любые возможные комбинации одного или нескольких связанных перечисленных элементов, а также отсутствие комбинаций при интерпретации в альтернативе («или»).
Термин «или» относится к любому одному представителю конкретного перечня, а также включает в себя любую комбинацию представителей этого перечня.
Единственные формы включают в себя множественные ссылки, если контекст явно не предписывает иное. Например, термин «белок Cas» или «по меньшей мере один белок Cas» может включать в себя множество белков Cas, включая в себя их смеси.
Статистически значимое значение р≤0,05.
ПОДРОБНОЕ ОПИСАНИЕ
I. Обзор
Оценка эффективности доставки и эффективности получения мутаций или нацеленной модификации генов введенным средством CRISPR/Cas in vivo в настоящее время основывается на сложных молекулярных анализах, таких как анализы чувствительности одноцепочечной ДНКазы, цифровая ПЦР или секвенирование следующего поколения. Необходимы лучшие способы и инструменты для более эффективной оценки активности средств CRISPR/Cas и для оценки различных способов и параметров доставки для нацеливания на конкретные ткани или типы клеток in vivo.
Предусмотрены способы и композиции для оценки опосредованной CRISPR/Cas активности негомологичного соединения концов (NHEJ) и/или индуцированной CRISPR/Cas рекомбинации целевой геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo и ex vivo. В способах и композициях используются клетки и отличные от человека животные, содержащие репортер CRISPR (например, интегрированный в геном репортер CRISPR), для обнаружения и измерения целевого вырезания последовательности между двумя сайтами расщепления нуклеазой CRISPR/Cas или разрушения последовательности возле сайта расщепления нуклеазой CRISPR/Cas, и/или обнаружения и измерения индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой для преобразования кодирующей последовательности для первого репортерного белка в кодирующую последовательность для другого второго репортерного белка. Некоторые такие репортеры CRISPR могут представлять собой многофункциональные репортеры, содержащие два или более различных типов репортерных генов. Эти репортеры являются улучшением по сравнению с репортерами CRISPR с одним типом репортерного гена, поскольку они позволяют использовать различные способы обнаружения и измерения активности CRISPR/Cas in vivo и ex vivo, такие как визуализация in vivo отличного от человека животного, обнаружение флуоресценции в клетках, выделенных от животного, с помощью проточной цитометрии, или других способов, или гистохимического окрашивания тканей, выделенных от отличного от человека животного. Таким образом, ограничения одного репортерного белка могут быть компенсированы преимуществами другого репортерного белка. Например, бета-галактозидаза (кодируемая геном lacZ) и флуоресцентные белки используются в комбинации в некоторых репортерах. LacZ позволяет получать фрагменты ткани, чтобы визуализировать точные границы индуцированной CRISPR/Cas репарации. Окрашивание LacZ является постоянным и может быть визуализировано невооруженным глазом или стандартным увеличением светлопольной микроскопии. Флуоресцентные репортерные белки, такие как eBFP или eGFP, позволяют точно подсчитывать правильно отредактированные, неотредактированные и альтернативно отредактированные клетки. Флуоресцентные репортерные белки позволяют анализировать ткани на основе отдельных клеток (например, с помощью анализа FACS) для точных соотношений отредактированных клеток.
Описанные в настоящем документе репортеры CRISPR, которые содержат ген lacZ, характеризуются дополнительными преимуществами по сравнению с другими репортерами, такими как репортеры-«светофоры», которые сообщают об изменении с красного флуоресцентного белка на зеленый флуоресцентный белок при действии CRISPR/Cas. Ген lacZ через его закодированную бета-галактозидазу является наиболее тщательно установленным и надежным из всех репортеров. Описанные в настоящем документе репортеры, которые содержат ген lacZ, предназначены для получения гистологического считывания цвета при действии CRISPR/Cas. Поскольку бета-галактозидаза является ферментом с многократным превращением, который превращает субстрат в видимый синий краситель, он обладает потенциалом быть более чувствительным, чем флуоресцентные репортерные белки, которые требуют десятки тысяч белков на клетку для обнаруживаемого флуоресцентного сигнала. По сравнению с флуоресцентными белками бета-галактозидаза вырабатывает сигнал более высокого разрешения, который может выявить тонкие паттерны экспрессии, специфические для типа клеток. Флуоресцентные репортеры-светофоры требуют индуцированных CRISPR/Cas мутаций, которые приводят к случайной смене рамки считывания. Напротив, описанные в настоящем документе репортеры lacZ не зависят от рамок считывания; скорее, им требуется только простая делеция между сайтами расщепления CRIPSR/Cas для удаления или инактивации сигнала терминации транскрипционного полиаденилирования, что позволяет экспрессировать ниже по ходу транскрипции последовательность, кодирующую бета-галактозидазу. В отличие от светофора и аналогичных репортерных систем с двумя флуоресцентными белками, которые требуют анализа и интерпретации соотношения двух разных флуоресцентных сигналов, репортерные системы lacZ переходят от отсутствия сигнала в неизмененном состоянии к сильному репортерному сигналу после активации аллеля CRISPR/Cas.
Кроме того, некоторые из описанных в настоящем документе репортеров CRISPR представляют собой многофункциональные репортеры в том смысле, что они позволяют исследовать не только активность NHEJ CRISPR/Cas in vivo и ex vivo, но также позволяют исследовать индуцированную CRISPR/Cas активность HDR in vivo и ex vivo через разные считывания. Поскольку некоторые такие репортеры для исследования индуцированной CRISPR рекомбинации требуют замены только одного кодона в гене, кодирующем репортерный белок, для превращения этого репортерного белка в другой репортерный белок можно использовать меньшие экзогенные донорские нуклеиновые кислоты, чем если бы полную кодирующую последовательность для репортерного белка необходимо было бы удалить и заменить последовательностью для другого репортерного белка. В некоторых таких репортерах флуоресцентный репортерный белок превращается в другой флуоресцентный репортерный белок (например, eBFP в eGFP или наоборот). Такое преобразование позволяет точно подсчитывать правильно отредактированные, отредактированные и альтернативно отредактированные клетки и позволяет анализировать ткани на основе отдельных клеток с помощью анализа FAC для точного соотношения отредактированных клеток.
Также предусмотрены способы и композиции для получения и применения этих отличных от человека животных для исследования и измерения способности нуклеазы CRISPR/Cas вырезать или разрушать геномно интегрированную нуклеиновую кислоту и/или облегчать рекомбинацию целевой геномной нуклеиновой кислоты с экзогенным донором in vivo и для оптимизации способности нуклеазы CRISPR/Cas вырезать или нарушать геномно интегрированную нуклеиновую кислоту и/или облегчать рекомбинацию целевого геномного локуса с экзогенным донором in vivo.
II. Отличные от человека животные, содержащие репортеров CRISPR
В раскрытых в настоящем документе способах и композициях используют репортер CRISPR для оценки способности введенных коротких палиндромных повторов, регулярно расположенных группами (CRISPR)/CRISPR-ассоциированных (Cas) систем или компонентов таких систем модифицировать репортер CRISPR in vivo или ex vivo.
Раскрытые в настоящем документе способы и композиции используют системы CRISPR/Cas путем исследования способности комплексов CRISPR (содержащих направляющую РНК (gRNA) в комплексе с белком Cas) индуцировать два события сайт-направленного расщепления в репортере CRISPR in vivo или ex vivo и вырезать промежуточную последовательность между двумя сайтами расщепления посредством негомологичного соединения концов (NHEJ) или индуцировать сайт-направленное событие расщепления в репортере CRISPR in vivo или ex vivo и нарушать соседнюю последовательность посредством опосредованных NHEJ малых вставок и делеций (вставка/делеция). Раскрытые в настоящем документе способы и композиции также используют системы CRISPR/Cas путем исследования способности комплексов CRISPR (содержащих направляющую РНК (gRNA) в комплексе с белком Cas) индуцировать рекомбинацию между репортером CRISPR и экзогенной донорской нуклеиновой кислотой in vivo или ex vivo для восстановления кодирующей последовательности для первого репортерного белка с целью превращения ее в кодирующую последовательность для другого второго репортерного белка.
А. Репортеры CRISPR для измерения опосредованного CRISPR/Cas разрушения или опосредованного CRISPR/Cas вырезания с использованием спаренных gRNA и/или для измерения индуцированной CRISPR/Cas рекомбинации целевой геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой
В настоящем документе предусмотрены репортеры CRISPR для обнаружения и измерения целевого вырезания последовательности между двумя сайтами расщепления нуклеазой CRISPR/Cas или целевого разрушения последовательности вблизи сайта расщепления нуклеазой CRISPR/Cas и/или для обнаружения и измерения индуцированной CRISPR/Cas рекомбинации целевой нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой. Предусмотренные в настоящем документе репортеры CRISPR могут содержать сигнал полиаденилирования или терминатор транскрипции, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета, содержащая кодирующую последовательность для одного или нескольких репортерных белков. Альтернативно или дополнительно, сигнал полиаденилирования или терминатор транскрипции может содержать третью целевую последовательность направляющей РНК в каноническом гексамере полиаденилирования (ААТААА, называемый мотивом распознавания поли А или последовательностью распознавания поли А) или рядом с ним. Примеры целевых последовательностей направляющей РНК вблизи канонического гексамера полиаденилирования в сигнале полиаденилирования Pgk включают в себя SEQ ID NO: 48-52. Однако любая желаемая целевая последовательность направляющей РНК может быть включена в репортер CRISPR или сконструирована таким образом, чтобы можно было исследовать любую направляющую РНК или комбинацию направляющих РНК. Альтернативно или дополнительно, сигнал полиаденилирования или терминатор транскрипции могут быть фланкированы первым и вторым сайтами узнавания рекомбиназы. Сигнал полиаденилирования или терминатор транскрипции предотвращают транскрипцию и экспрессию одного или нескольких репортерных белков. Однако после расщепления первой и второй целевых последовательностей направляющих РНК с помощью нуклеазы CRISPR/Cas и вырезания промежуточной последовательности, включающей в себя терминатор транскрипции или сигнал полиаденилирования, транскрипция может проходить через кодирующую последовательность для одного или нескольких репортерных белков, что позволяет их экспрессию. Альтернативно, после расщепления целевой последовательности направляющей РНК в мотиве распознавания поли А (каноническом гексамере ААТААА полиаденилирования) или рядом с ним и нарушения мотива распознавания поли А через опосредованные NHEJ небольшие вставки и делеции (вставка/делеция) транскрипция может проходить через кодирование последовательности для одного или нескольких репортерных белков, обеспечивая их экспрессию.
Может использоваться любой терминатор транскрипции или сигнал полиаденилирования. Используемый в настоящем документе термин «терминатор транскрипции» относится к последовательности ДНК, которая вызывает терминацию транскрипции. У эукариот терминаторы транскрипции распознаются белковыми факторами, а за завершением следует полиаденилирование, процесс добавления поли(А)-хвоста к транскриптам mRNA в присутствии поли(А)-полимеразы. Сигнал поли(А) млекопитающего, как правило, состоит из коровой последовательности длиной приблизительно 45 нуклеотидов, которая может быть фланкирована различными вспомогательными последовательностями, которые служат для повышения эффективности расщепления и полиаденилирования. Коровая последовательность состоит из высококонсервативного и необходимого элемента выше против хода транскрипции (мотив распознавания поли А ААТААА или AAUAAA в mRNA), распознаваемого с помощью фактора специфичности расщепления и полиаденилирования (CPSF), и плохо определенной области ниже по ходу транскрипции (богатой U или G и U), связанной фактором стимуляции расщепления (CstF). Примеры терминаторов транскрипции, которые можно использовать, включают в себя, например, сигнал полиаденилирования человеческого гормона роста (HGH), сигнал позднего полиаденилирования обезьяньего вируса 40 (SV40), сигнал полиаденилирования бета-глобина кролика, сигнал полиаденилирования бычьего гормона роста (BGH), сигнал полиаденилирования фосфоглицераткиназы (PGK), последовательность терминации транскрипции АОХ1, последовательность терминации транскрипции CYC1 или любую последовательность терминации транскрипции, о которой известно, что она подходит для регуляции экспрессии генов в эукариотических клетках.
Необязательно, сигнал полиаденилирования также может быть фланкирован сайтами узнавания рекомбиназы для сайт-специфической рекомбиназы. Рекомбиназа может быть использована в качестве положительного контроля для вырезания сигнала полиаденилирования. Сайт-специфические рекомбиназы включают в себя ферменты, которые могут способствовать рекомбинации между сайтами узнавания рекомбиназы, где два сайта рекомбинации физически разделены в одной нуклеиновой кислоте или в отдельных нуклеиновых кислотах. Примеры рекомбиназ включают в себя рекомбиназы Cre, Flp и Dre. Одним примером гена рекомбиназы Cre является Crei, в котором два экзона, кодирующие рекомбиназу Cre, разделены интроном, чтобы предотвратить его экспрессию в прокариотической клетке. Такие рекомбиназы могут дополнительно содержать сигнал ядерной локализации для облегчения локализации в ядре (например, NLS-Crei). Сайты распознавания рекомбиназы включают в себя нуклеотидные последовательности, которые распознаются сайт-специфической рекомбиназой и могут служить в качестве субстрата для события рекомбинации. Примеры сайтов узнавания рекомбиназы включают в себя сайты FRT, FRT11, FRT71, attp, att, rox и lox, такие как loxP, lox511, lox2272, lox66, lox71, loxM2 и lox5171.
Первая и вторая целевые последовательности направляющих РНК могут быть одинаковыми или разными, и можно использовать любую подходящую целевую последовательность направляющей РНК. Любая желаемая целевая последовательность направляющей РНК может быть включена в репортер CRISPR или сконструирована в репортер CRISPR таким образом, чтобы можно было исследовать любую направляющую РНК или комбинацию направляющих РНК. Целевые последовательности направляющих РНК описаны более подробно в другом месте настоящего документа. В качестве одного примера, первая целевая последовательность направляющей РНК может содержать последовательность, представленную в SEQ ID NO: 41, 43, 44 или 45, и вторая целевая последовательность направляющей РНК может содержать последовательность, представленную в SEQ ID NO: 41, 46 или 47. Первая и вторая целевые последовательности направляющих РНК (или первый и второй сайты расщепления Cas в пределах первой и второй целевых последовательностей направляющих РНК, соответственно) могут быть разделены на любое желаемое расстояние, которое должно быть исследовано. Например, они могут быть разделены по меньшей мере 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600 или 1000 парами нуклеотидов (п.н.), не более чем 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600 или 1000 п. н. или 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-1000, 6-100, 6-200, 6-300, 6-400, 6-500, 6-600, 6-1000, 10-100, 10-200, 10-300, 10-400, 10-500, 10-600, 10-1000, 50-100, 50-200, 50-300, 50-400, 50-500, 50-600, 50-1000, 100-1000, 200-1000, 300-1000, 400-1000 или 500-1000 п.н. В конкретном примере целевые последовательности направляющей РНК или сайты расщепления Cas могут быть разделены менее чем приблизительно 1000, менее чем приблизительно 600, менее чем приблизительно 500, менее чем приблизительно 200 или менее чем приблизительно 100 парами нуклеотидов. Альтернативно, они могут быть разделены по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 или 100 т.п.н. или более, или могут быть разделены приблизительно 1-10, 1-20, 1-30, 1-40, 1-50, 1-100, 10-20, 10-30, 10-40, 10-50, 10-100, 20-30, 20- 40, 20-50, 20-100, 30-40, 30-50, 30-100, 40-50, 40-100 или 50-100 т.п.н. Например, первая и вторая целевые последовательности направляющих РНК или первый и второй сайты расщепления Cas могут быть разделены приблизительно от 5 п.н. до 10 т.п.н., от 6 п. н. до 10 т.п.н., от 10 п.н. до 10 т.п.н., от 10 п. н. до 50 т.п.н., от 100 п. н. до 10 т.п.н., от 200 п. н. до 10 т.п.н., от 300 п.н. до 10 т.п.н., от 400 п. н. до 10 т.п.н. или от 500 п. н. до 10 т.п.н.
Первая и вторая целевые последовательности направляющих РНК (или первый и второй сайты расщепления Cas) необязательно находятся в мотиве распознавания поли А (канонический гексамер сигнала полиаденилирования ААТААА) (т.е. перекрываются) или вблизи него. Например, одна или обе из первой и второй целевых последовательностей направляющих РНК или первого и второго сайтов расщепления Cas могут находиться в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600 или 1000 п.н. или 1-100, 1-200, 1-300, 1-400, 1-500, 1-600, 1- 1000, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-1000, 10-100, 10-200, 10-300, 10-400, 10-500, 10-600, 10-1000, 50-100, 50-200, 50-300, 50-400, 50-500, 50-600, 50-1000, 100-1000, 200-1000, 300-1000, 400-1000 или 500-1000 п.н. из канонического гексамера сигнала полиаденилирования. Необязательно, третья целевая последовательность направляющей РНК (или сайт расщепления Cas) находится в мотиве распознавания поли А (канонический гексамер сигнала полиаденилирования ААТААА) (т.е. перекрываются) или вблизи него. Например, третья целевая последовательность направляющей РНК или третий сайт расщепления Cas могут находиться в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600 или 1000 п. н. или 1-10, 1-20, 1-30, 1-40, 1-50, 1-60, 1-70, 1-80, 1-90, 1-100, 1-200, 1-300, 1-400, 1-500, 1-600, 1-1000, 5-10, 5-20, 5-30, 5-40, 5-50, 5-60, 5-70, 5-80, 5-90, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-1000, 10-10, 10-20, 10-30, 10-40, 10-50, 10-60, 10-70, 10-80, 10-90, 10-100, 10-200, 10-300, 10-400, 10-500, 10-600, 10-1000, 50-100, 50-200, 50-300, 50-400, 50-500, 50-600, 50-1000, 100-1000, 200-1000, 300-1000, 400-1000 или 500-1000 п.н. из канонического гексамера сигнала полиаденилирования. Например, третья целевая последовательность направляющей РНК или третий сайт расщепления Cas могут находиться в пределах приблизительно 10-220, 20-200, 20-40, 29, 65-85, 76, 185-205 или 195 п.н. от канонического гексамера сигнала полиаденилирования.
Первая и вторая целевые последовательности направляющих РНК могут быть где угодно относительно первого и второго сайтов узнавания рекомбиназы, соответственно. Первая целевая последовательность направляющей РНК может быть выше против хода транскрипции или ниже по ходу транскрипции от первого сайта узнавания рекомбиназы или может перекрываться с первым сайтом узнавания рекомбиназы. Аналогично, вторая целевая последовательность направляющей РНК может быть выше против хода транскрипции или ниже по ходу транскрипции от сайта узнавания рекомбиназы или может перекрываться со вторым сайтом узнавания рекомбиназы. Кроме того, первая целевая последовательность направляющей РНК может быть выше против хода транскрипции от фланкированного терминатора транскрипции или сигнала полиаденилирования или может перекрываться с терминатором транскрипции или сигналом полиаденилирования. Аналогично, вторая целевая последовательность направляющей РНК может быть выше против хода транскрипции от фланкированного терминатора транскрипции или сигнала полиаденилирования или может перекрываться с сигналом терминатора транскрипции или полиаденилирования.
Можно использовать любые подходящие репортерные белки. У некоторых репортеров один или несколько репортерных белков содержат белок бета-галактозидазу. У других репортеров есть два или более различных репортерных белка. Необязательно, два или более репортерных белка могут представлять собой различные типы репортерных белков. Например, два или более различных репортерных белка могут включать в себя по меньшей мере один флуоресцентный репортерный белок, как определено в настоящем документе, и по меньшей мере один нефлуоресцентный репортерный белок. Примеры флуоресцентных репортерных белков представлены в другом месте настоящего документа. Нефлуоресцентные репортерные белки включают в себя, например, репортерные белки, которые можно использовать в гистохимических или биолюминесцентных анализах, такие как бета-галактозидаза, люцифераза (например, люцифераза Renilla, люцифераза светлячка и люцифераза NanoLuc) и бета-глюкуронидаза. Некоторые репортеры включают в себя как репортерный белок, который можно обнаружить в анализе с помощью проточной цитометрии (например, флуоресцентный репортерный белок, такой как синий флуоресцентный белок (BFP), усиленный BFP (eBFP), зеленый флуоресцентный белок (GFP) или усиленный GFP (eGFP)) и репортерный белок, который может быть обнаружен в гистохимическом анализе (например, белок бета-галактозидаза), чтобы обеспечить дополнительную функциональность и сделать возможным проведение различных типов анализов для обнаружения и измерения активности CRISPR in vivo. Одним из примеров такого гистохимического анализа является визуализация гистохимической экспрессии бета-галактозидазы in situ посредством гидролиза X-Gal (5-бром-4-хлор-3-индоил-bD-галактопиранозида), который дает синий осадок, или с использованием флуорогенных субстратов, таких как бета-метил-умбеллиферилгалактозид (MUG) и дигалактозид флуоресцеина (FDG).
Когда два или более репортерных белка включены в репортер CRISPR, кодирующая последовательность для двух или более репортерных белков может содержать мультицистронную нуклеиновую кислоту. Мультицистронные экспрессионные конструкции одновременно экспрессируют два или более отдельных белка из одной и той же mRNA (т.е. транскрипт, полученный из одного и того же промотора). Подходящие стратегии для мультицистронной экспрессии белков включают в себя, например, использование пептида 2А и использование участка внутренней посадки рибосомы (IRES). Например, такие нуклеиновые кислоты могут содержать кодирующие последовательности для двух или более репортерных белков, разделенных промежуточным участком внутренней посадки рибосомы (IRES) или промежуточной кодирующей последовательностью пептида 2А. В качестве одного примера, такие мультицистронные векторы могут использовать один или несколько участков внутренней посадки рибосомы (IRES), чтобы позволить инициирование трансляции из внутренней области mRNA. В качестве другого примера, такие мультицистронные векторы могут использовать один или несколько пептидов 2А. Эти пептиды представляют собой небольшие «саморасщепляющиеся» пептиды, как правило, составляющие в длину 18-22 аминокислоты и производящие эквимолярные уровни нескольких генов из одной и той же mRNA. Рибосомы пропускают синтез пептидной связи глицил-пролил на С-конце 2А-пептида, что приводит к «расщеплению» между 2А-пептидом и его ближайшим пептидом ниже по ходу транскрипции. Смотрите, например, публикацию Kim et al. (2011) PLoS One 6(4): e 18556, полностью включенную в настоящий документ посредством ссылки для всех целей. «Расщепление» происходит между остатками глицина и пролина, обнаруженными на С-конце, это означает, что в цистроне выше против хода транскрипции будет добавлено несколько дополнительных остатков, в то время как цистрон ниже по ходу транскрипции будет начинаться с пролина. В результате «отщепленный» пептид ниже по ходу транскрипции содержит пролин на своем N-конце. 2А-опосредованное расщепление является универсальным явлением во всех эукариотических клетках. Пептиды 2А были идентифицированы из пикорнавирусов, вирусов насекомых и ротавирусов типа С. Смотрите, например, публикацию Szymczak et al. (2005) Expert Opin Biol Ther 5:627-638, полностью включенную в настоящий документ посредством ссылки для всех целей. Примеры пептидов 2А, которые могут быть использованы, включают в себя 2А вируса Thosea asigna (Т2А); 2А свиного тешовируса-1 (Р2А); 2А вируса лошадиного ринита А (ERAV) (Е2А) и 2А FMDV (F2A). Иллюстративные последовательности Т2А, Р2А, Е2А и F2A включают в себя следующие: Т2А (EGRGSLLTCGDVEENPGP; SEQ ID NO: 3); Р2А (ATNFSLLKQAGDVEENPGP; SEQ ID NO: 4); E2A (QCTNYALLKLAGDVESNPGP; SEQ ID NO: 5) и F2A (VKQTLNFDLLKLAGDVESNPGP; SEQ ID NO: 6). Остатки GSG могут быть добавлены к 5'-концу любого из этих пептидов для улучшения эффективности расщепления.
Репортер CRISPR может быть функционально связан с любым подходящим промотором для экспрессии in vivo внутри отличного от человека животного. Отличное от человека животное может представлять собой любое подходящее отличное от человека животное, как описано в настоящем документе в другом месте. В качестве одного примера, репортер CRISPR может быть функционально связан с эндогенным промотором в целевом геномном локусе, таким как промотор Rosa26 в эндогенном локусе Rosa26. Альтернативно, репортер CRISPR может быть функционально связан с экзогенным промотором. Промотор может представлять собой, например, конститутивно активный промотор, условный промотор, индуцибельный промотор, ограниченный во времени промотор (например, промотор, регулируемый развитием) или пространственно ограниченный промотор (например, клеточно-специфический или тканеспецифический) промотор). Такие промоторы хорошо известны и обсуждаются в настоящем документе в другом месте.
Представленные в настоящем документе репортеры CRISPR также могут содержать другие компоненты. Некоторые репортеры CRISPR дополнительно содержат 3'-последовательность сплайсинга на 5'-конце репортера CRISPR и/или второй сигнал полиаденилирования, следующий за кодирующими последовательностями репортерных белков на 3'-конце репортера CRISPR. Некоторые репортеры CRISPR могут дополнительно содержать кассету селекции, содержащую, например, кодирующую последовательность для белка с лекарственной устойчивостью. Альтернативно, некоторые раскрытые в настоящем документе репортеры CRISPR не содержат кассету селекции. Примеры подходящих маркеров селекции включают в себя неомицин-фосфотрансферазу (neor), гигромицин-В-фосфотрансферазу (hygr), пуромицин-N-ацетилтрансферазу (puror), бластицидин-S-дезаминазу (bsrr), ксантин/гуанин-фосфорибозилтрансферазу (gpt) и вирус простого герпеса тимидинкиназу (HSV-k). Необязательно, кассета селекции может быть фланкирована сайтами узнавания рекомбиназы для сайт-специфической рекомбиназы. Если репортер CRISPR также содержит сайты узнавания рекомбиназы, фланкирующие сигнал полиаденилирования, для использования в качестве положительного контроля, как описано выше, необязательно, другой набор сайтов узнавания рекомбиназы, распознаваемый другой рекомбиназой используется для фланкирования кассеты селекции.
Репортеры CRISPR также могут содержать терминатор транскрипции или сигнал полиаденилирования в репортерной кассете (т.е. после или ниже по ходу транскрипции от кодирующей последовательности для одного или нескольких репортерных белков). У некоторых репортеров CRISPR сигнал терминатора транскрипции или сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК перед репортерной кассетой, содержащей кодирующую последовательность для одного или нескольких репортерных белков, отличается от сигнала терминатора транскрипции или сигнала полиаденилирования, следующего за кодирующей последовательностью для одного или нескольких репортерных белков. У других репортеров CRISPR сигнал терминатора транскрипции или сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК перед репортерной кассетой, содержащей кодирующую последовательность для одного или нескольких репортерных белков, такой же, как у сигнала терминатора транскрипции или сигнала полиаденилирования, следующего за кодирующей последовательностью для одного или нескольких репортерных белков.
Альтернативно или в дополнение к описанным выше репортерным элементам CRISPR представленные в настоящем документе репортеры CRISPR могут содержать целевую последовательность направляющей РНК и кодирующую последовательность для репортерного белка, которая может быть преобразована в кодирующую последовательность для другого репортерного белка. После расщепления целевой последовательности направляющей РНК нуклеазой CRISPR/Cas и репарации кодирующей последовательности репортерного белка экзогенной донорской нуклеиновой кислотой кодирующая последовательность для репортерного белка преобразуется в кодирующую последовательность для другого репортерного белка. Необязательно, кодирующая последовательность для исходного репортерного белка может быть изменена на кодирующую последовательность для другого репортерного белка путем замены одного кодона. Например, некоторые такие репортеры CRISPR не содержат сигнал полиаденилирования или терминатор транскрипции выше против хода транскрипции от кодирующей последовательностью для репортерного белка. Другие такие репортеры CRISPR содержат сигнал полиаденилирования или терминатор транскрипции выше против хода транскрипции от кодирующей последовательности для репортерного белка, как описано выше. Некоторые такие репортеры CRISPR содержат одну кодирующую последовательность репортерного белка. Смотрите, например, фиг. 3 и SEQ ID NO: 18, 57 и 60. Другие такие репортеры CRISPR содержат кодирующие последовательности для двух или более репортерных белков, как описано выше. Смотрите, например, фиг. 1А и SEQ ID NO: 17, 58 и 59. Некоторые из таких репортеров CRISPR могут дополнительно содержать кассету селекции, содержащую, например, кодирующую последовательность для белка с лекарственной устойчивостью. Альтернативно, некоторые такие репортеры CRISPR не содержат кассету селекции.
Любая подходящая целевая последовательность направляющей РНК может быть использована, как описано в другом месте настоящего документа. В качестве одного примера, целевая последовательность направляющей РНК может содержать последовательность, представленную в SEQ ID NO: 42 или 56. Последовательность направляющей РНК может находиться в кодирующей последовательности для репортерного белка, необязательно, в пределах определенного расстояния от области, кодирующей последовательность, подлежащей изменению при рекомбинации с экзогенной донорской последовательностью, для преобразования кодирующей последовательности в кодирующую последовательность для другого репортерного белка.
Альтернативно, последовательность направляющей РНК может находиться снаружи и рядом с кодирующей последовательностью для репортерного белка. Например, целевая последовательность направляющей РНК может находиться в пределах 1, 5, 10, 50, 100, 200, 300, 400, 500 или 1000 пар нуклеотидов (п.н.) или 1-100, 1-200, 1-300 1-400, 1-500, 1-1000, 5-1000, 10-5000, 50-1000, 100-1000, 200-1000, 300-1000, 400-1000 или 500-1000 п. н. от 5' или 3'-конца кодирующей последовательности для репортерного белка или от подлежащей изменению области кодирующей последовательности. В конкретном примере целевая последовательность направляющей РНК может находиться в пределах приблизительно 1000 или в пределах приблизительно 500 пар нуклеотидов от подлежащей изменению области или может перекрываться с подлежащей изменению областью. Альтернативно, целевая последовательность направляющей РНК может находиться в пределах приблизительно 1, 2, 3, 4, 5 или 10 т.п.н. или приблизительно 1-2, 1-3, 1-4, 1-5 или 1-10 т.п.н. от 5' или 3' конца кодирующей последовательности для репортерного белка или от области подлежащей изменению кодирующей последовательности. Например, целевая последовательность направляющей РНК может находиться от 1 п.н. до 1 т.п.н., от 1 п. н. до 2 т.п.н., от 1 п.н. до 4 т.п.н., от 1 п.н. до 5 т.п.н. или от 1 п.н. до 10 т.п.н. от 5' или 3' конца кодирующей последовательности для репортерного белка или области подлежащей изменению кодирующей последовательности.
Может быть использован любой подходящий репортерный белок, как описано в настоящем документе в другом месте, такой как флуоресцентный репортерный белок. В конкретном примере репортерный белок может быть преобразован в другой репортерный белок путем замены одного кодона. Например, усиленный GFP (eGFP) испускает зеленую флуоресценцию, но единственное аминокислотное замещение гистидина на тирозин в положении 66 (Y66H) приводит к спектральному сдвигу в синюю флуоресценцию (т.е. преобразованию из eGFP в eBFP). Аналогично, обратная замена в eBFP (H66Y) может преобразовать eBFP в eGFP. Другие примеры мутаций в eGFP, которые могут приводить к спектральным сдвигам, включают в себя T203Y (желтые производные) и Y66W (голубые производные). Еще другие примеры мутаций в eGFP могут преобразовывать eGFP в BFP (например, мутируя LTYG в положениях 64-67 eGFP в FX). В одном конкретном примере исходный репортерный белок представляет собой GFP или eGFP и превращается в BFP или eBFP или наоборот. В другом конкретном примере исходный репортерный белок представляет собой GFP или eGFP и преобразуется в CFP или eCFP или наоборот. В другом конкретном примере исходный репортерный белок представляет собой GFP или eGFP и преобразуется в YFP или eYFP или наоборот.
Один иллюстративный репортер CRISPR содержит от 5' к 3': (а) последовательность 3' сплайсинга; (b) первый сигнал полиаденилирования, фланкированный: (i) первым и вторым сайтами распознавания рекомбиназы для первой рекомбиназы (например, сайтами loxP для рекомбиназы Cre); и (ii) первой и второй целевыми последовательностями направляющих РНК (например, целевыми последовательности направляющих РНК, каждая из которых содержит SEQ ID NO: 41); (с) репортерную кассету, содержащую от 5' к 3': (i) кодирующую последовательность бета-галактозидазы; (ii) кодирующую последовательность Р2А; (iii) кодирующую последовательность флуоресцентного белка (например, зеленого флуоресцентного белка (GFP), синего флуоресцентного белка (BFP), усиленного GFP (eGFP) или усиленного BFP (eBFP)) (необязательно содержащую третью целевую последовательность направляющей РНК) и (iv) второй сигнал полиаденилирования. Необязательно, репортер CRISPR содержит целевые последовательности направляющих РНК, содержащие SEQ ID NOS: 41, 43, 44, 45, 46 и 47. Первая и вторая целевые последовательности направляющих РНК могут содержать, например, SEQ ID NOS: 43 и 46, SEQ ID NOS: 43 и 47, SEQ ID NOS: 44 и 46, SEQ ID NOS: 44 и 47, SEQ ID NOS: 45 и 46, SEQ ID NOS: 45 и 47, SEQ ID NOS: 43 и 41, SEQ ID NOS: 44 и 41, SEQ ID NOS: 45 и 41, SEQ ID NOS: 41 и 46 или SEQ ID NOS: 41 и 47. Альтернативно, каждая может содержать SEQ ID NO: 41. По желанию репортер CRISPR дополнительно содержит одну или несколько целевых последовательностей направляющей РНК в первом сигнале полиаденилирования. Примеры таких целевых последовательностей направляющей РНК включают в себя SEQ ID NO: 48-52. Необязательно, первый сигнал полиаденилирования и второй сигнал полиаденилирования различны. Необязательно, репортер CRISPR может дополнительно содержать кассету селекции (например, 3' репортерной кассеты), причем кассета селекции фланкирована сайтами распознавания рекомбиназы для второй рекомбиназы (например, сайтами FRT для рекомбиназы Flp). Кассета селекции может содержать, например, от 5' к 3': (i) третий сигнал полиаденилирования (например, в антисмысловой ориентации) и (ii) кодирующую последовательность для гена устойчивости к лекарственным средствам (например, в антисмысловой ориентации), функционально связанную с промотором (например, кодирующую последовательность гена устойчивости к неомицину (неомицин-фосфотрансфераза), функционально связанную с конститутивным промотором, таким как промотор убиквитина человека). Альтернативно, кассета селекции может быть фланкирована сайтами распознавания рекомбиназы для второй рекомбиназы (например, сайтами FRT для рекомбиназы Flp) и содержит от 5' к 3': (i) кодирующую последовательность для гена устойчивости к лекарственному средству (например, в смысловой ориентации), функционально связанную с промотором (например, кодирующую последовательность гена устойчивости к неомицину (неомицин-фосфотрансфераза), функционально связанную с конститутивным промотором, таким как промотор убиквитина человека и промотор ЕМ7); и (ii) третий сигнал полиаденилирования (например, сигнал полиаденилирования Pgk в смысловой ориентации). Смотрите, например, фиг. 1А и SEQ ID NO: 17. Необязательно, репортер CRISPR может представлять собой репортер CRISPR, содержащий кассету селекции после обработки рекомбиназой и удаления кассеты селекции. Смотрите, например, фиг. 1А и SEQ ID NO: 17 после обработки рекомбиназой Flp и вырезания кассеты селекции неомицина. Необязательно, репортер CRISPR может представлять собой репортер CRISPR (с кассетой селекции или без нее) после обработки рекомбиназой и вырезания первого сигнала полиаденилирования. Смотрите, например, фиг. 1А и SEQ ID NO: 17 после обработки рекомбиназой Cre и вырезания сигнала полиаденилирования Pgk, что приводит к SEQ ID NO: 58 (или SEQ ID NO: 59 при преобразовании из eBFP в eGFP).
Другой иллюстративный репортер CRISPR содержит от 5' к 3': (а) последовательность 3' сплайсинга; (b) первый сигнал полиаденилирования, содержащий целевую последовательность направляющей РНК (например, SEQ ID NO: 48, 49, 50, 51 или 52), фланкированную первым и вторым сайтами узнавания рекомбиназы для первой рекомбиназы (например, сайты loxP для Cre рекомбиназы); (с) репортерную кассету, содержащую от 5' к 3': (i) кодирующую последовательность бета-галактозидазы; (ii) кодирующую последовательность Р2А; (iii) кодирующую последовательность флуоресцентного белка (например, зеленого флуоресцентного белка (GFP), синего флуоресцентного белка (BFP), усиленного GFP (eGFP) или усиленного BFP (eBFP)) (необязательно содержащую вторую целевую последовательность направляющей РНК) и (iv) второй сигнал полиаденилирования. Необязательно, первый сигнал полиаденилирования и второй сигнал полиаденилирования различны. Необязательно, репортер CRISPR может дополнительно содержать кассету селекции (например, 3' репортерную кассету), причем кассета селекции фланкирована сайтами распознавания рекомбиназы для второй рекомбиназы (например, сайтами FRT для рекомбиназы Flp). Кассета селекции может содержать, например, от 5' к 3': (i) третий сигнал полиаденилирования (например, в антисмысловой ориентации) и (ii) кодирующую последовательность для гена устойчивости к лекарственным средствам (например, в антисмысловой ориентации), функционально связанную с промотором (например, кодирующую последовательность гена устойчивости к неомицину (неомицин-фосфотрансфераза), функционально связанную с конститутивным промотором, таким как промотор убиквитина человека). Альтернативно, кассета селекции может быть фланкирована сайтами распознавания рекомбиназы для второй рекомбиназы (например, сайтами FRT для рекомбиназы Flp) и содержит от 5' к 3': (i) кодирующую последовательность для гена устойчивости к лекарственному средству (например, в смысловой ориентации), функционально связанную с промотором (например, кодирующую последовательность гена устойчивости к неомицину (неомицин-фосфотрансфераза), функционально связанную с конститутивным промотором, таким как промотор убиквитина человека и промотор ЕМ7); и (ii) третий сигнал полиаденилирования (например, сигнал полиаденилирования Pgk в смысловой ориентации). Смотрите, например, фиг. 1А и SEQ ID NO: 17. Необязательно, репортер CRISPR может представлять собой репортер CRISPR, содержащий кассету селекции после обработки рекомбиназой и удаления кассеты селекции. Смотрите, например, фиг. 1А и SEQ ID NO: 17 после обработки рекомбиназой Flp и удаления кассеты селекции неомицина. Необязательно, репортер CRISPR может представлять собой репортер CRISPR (с кассетой селекции или без нее) после обработки рекомбиназой и удаления первого сигнала полиаденилирования. Смотрите, например, фиг. 1А и SEQ ID NO: 17 после обработки рекомбиназой Cre и удаления сигнала полиаденилирования Pgk, что приводит к SEQ ID NO: 58 (или SEQ ID NO: 59 при преобразовании из eBFP в eGFP).
Иллюстративный репортер CRISPR для исследования только индуцированной CRISPR/Cas рекомбинации содержит от 5' к 3': (а) 3' последовательность сплайсинга; (b) первый сайт узнавания рекомбиназы (например, сайт loxP для рекомбиназы Cre): (с) первый сигнал полиаденилирования (например, тройной сигнал полиаденилирования); (d) ген лекарственной устойчивости, функционально связанный с промотором (например, ген устойчивости к неомицину, функционально связанный с промотором ЕМ7); (е) второй сайт узнавания рекомбиназы; (f) последовательность, кодирующую флуоресцентный белок (например, зеленый флуоресцентный белок (GFP), синий флуоресцентный белок (BFP), усиленный GFP (eGFP) или улучшенный BFP (eBFP)), содержащую целевую последовательность для направляющей РНК; и (g) второй сигнал полиаденилирования (например, сигнал полиаденилирования SV40). Смотрите, например, фиг. 3 и SEQ ID NO: 18. Необязательно, репортер CRISPR может представлять собой репортер CRISPR после обработки рекомбиназой и удаления кассеты селекции и первого сигнала полиаденилирования. Смотрите, например, фиг. 3 и SEQ ID NO: 18 после обработки рекомбиназой Cre и удаления кассеты селекции неомицина и тройного сигнала полиаденилирования, что приводит к SEQ ID NO: 57 (или SEQ ID NO: 60 при преобразовании из eBFP в eGFP).
Описанные в настоящем документе репортеры CRISPR могут быть в любой форме. Например, репортер CRISPR может находиться в плазмиде или векторе, таком как вирусный вектор. Аналогично, репортер CRISPR может быть функционально связан с промотором в экспрессионной конструкции, способной направлять экспрессию репортерных белков при удалении сигнала полиаденилирования выше против хода транскрипции. Аналогично, репортер CRISPR может находиться в нацеливающем векторе, как определено в настоящем документе в другом месте. Например, нацеливающий вектор может содержать плечи гомологии, фланкирующие репортер CRISPR, причем плечи гомологии пригодны для направления рекомбинации с желаемым целевым геномным локусом для облегчения геномной интеграции.
Аналогично, описанные в настоящем документе репортеры CRISPR могут находиться in vitro, они могут находиться внутри клетки (например, эмбриональной стволовой клетки) ex vivo (например, геномно интегрировано или внехромосомно) или они могут находиться в организме (например, отличного от человека животного) in vivo (например, геномно интегрировано или внехромосомно). Если ex vivo, репортер CRISPR может находиться в клетке любого типа из любого организма, такого как тотипотентная клетка, такая как эмбриональная стволовая клетка (например, эмбриональная стволовая клетка мыши или крысы) или индуцированная плюрипотентная стволовая клетка (например, индуцированная плюрипотентная стволовая клетка человека). В случае in vivo репортер CRISPR может находиться в организме любого типа (например, отличном от человека животном, как описано дополнительно ниже).
В. Клетки и отличные от человека животные, содержащие репортеры CRISPR
Также предусмотрены клетки и отличные от человека животные, содержащие описанные в настоящем документе репортеры CRISPR. Репортер CRISPR может быть стабильно интегрирован в геном (т.е. в хромосому) клетки или отличного от человека животного, или он может быть расположен вне хромосомы (например, внехромосомно реплицирующаяся ДНК). Необязательно, репортер CRISPR стабильно интегрирован в геном. Стабильно интегрированный репортер CRISPR может быть случайным образом интегрирован в геном отличного от человека животного (т.е. трансгенного), или он может быть интегрирован в предварительно определенную область генома отличного от человека животного (т.е., нокин). Необязательно, репортер CRISPR стабильно интегрируется в заданную область генома, такую как локус «безопасной гавани». Целевой геномный локус, в котором стабильно интегрирован репортер CRISPR, может быть гетерозиготным для репортера CRISPR или гомозиготным для репортера CRISPR. Диплоидный организм содержит два аллеля в каждом генетическом локусе. Каждая пара аллелей представляет генотип определенного генетического локуса. Генотипы описаны как гомозиготные, если в конкретном локусе есть два идентичных аллеля, и как гетерозиготные, если эти два аллеля различаются.
Клетки, представленные в настоящем документе, могут представлять собой, например, эукариотические клетки, которые включают в себя, например, клетки грибов (например, дрожжей), клетки растений, клетки животных, клетки млекопитающих, отличные от человеческих клетки млекопитающих и клетки человека. Термин «животное» включает в себя млекопитающих, рыб и птиц. Клеткой млекопитающего может быть, например, клетка отличного от человека млекопитающего, клетка человека, клетка грызуна, клетка крысы, клетка мыши или клетка хомяка. Другие отличные от человека млекопитающие включают в себя, например, нечеловекообразных приматов, мартышек, обезьян, кошек, собак, кроликов, лошадей, быков, оленей, бизонов, домашний скот (например, виды крупного рогатого скота, такие как коровы, быки и т.д.; виды овец, такие как овцы, козы и т.д.; и виды свиней, такие как свиньи и кабаны). Птицы включают в себя, например, кур, индеек, страусов, гусей, уток и т.д. Домашние животные и сельскохозяйственные животные также включены. Термин «отличный от человека» исключает людей.
Клетки также могут быть любого типа в недифференцированном или дифференцированном состоянии. Например, клетка может представлять собой тотипотентную клетку, плюрипотентную клетку (например, человеческую плюрипотентную клетку или отличную от человеческой плюрипотентную клетку, такую как эмбриональная стволовая клетка мыши (ES) или клетка ES крысы), или не плюрипотентная клетка. Тотипотентные клетки включают в себя недифференцированные клетки, которые могут давать клетки любого типа, а плюрипотентные клетки включают в себя недифференцированные клетки, которые обладают способностью развиваться в более чем один тип дифференцированных клеток. Такими плюрипотентными и/или тотипотентными клетками могут быть, например, ES-клетки или ES-подобные клетки, такие как индуцированные плюрипотентные стволовые (iPS) клетки. ES-клетки включают в себя эмбриональные тотипотентные или плюрипотентные клетки, которые способны вносить вклад в любую ткань развивающегося эмбриона при введении в эмбрион. ES-клетки могут быть получены из внутренней клеточной массы бластоцисты и способны дифференцироваться в клетки любого из трех слоев зародышей позвоночных (энтодерма, эктодерма и мезодерма).
Примеры плюрипотентных клеток человека включают в себя ES-клетки человека, взрослые стволовые клетки человека, ограниченные в развитии клетки-предшественники человека и индуцированные плюрипотентные стволовые (iPS) клетки человека, такие как примированные iPS-клетки человека и наивные iPS-клетки человека. Индуцированные плюрипотентные стволовые клетки включают в себя плюрипотентные стволовые клетки, которые могут быть получены непосредственно из дифференцированной взрослой клетки. Клетки iPS человека могут быть получены путем введения в клетку специфических наборов факторов перепрограммирования, которые могут включать в себя, например, Oct3/4, факторы транскрипции семейства Sox (например, Sox1, Sox2, Sox3, Sox15), факторы транскрипции семейства Мус (например, с-Мус, l-Мус, n-Мус), факторы транскрипции семейства (KLF) (например, KLF1, KLF2, KLF4, KLF5) и/или родственные факторы транскрипции, такие как NANOG, LIN28 и/или Glis1. Клетки iPS человека также могут быть получены, например, путем использования miRNA, небольших молекул, которые имитируют действие факторов транскрипции или спецификаторов происхождения. Клетки iPS человека характеризуются своей способностью дифференцироваться в любую клетку из трех зародышевых слоев позвоночных, например, энтодерму, эктодерму или мезодерму. Клетки iPS человека также характеризуются своей способностью размножаться неограниченное время в подходящих условиях культивирования in vitro. Смотрите, например, публикацию Takahashi and Yamanaka (2006) Cell 126.663-616, которая полностью включена в настоящий документ посредством ссылки для всех целей. Примированные ES-клетки человека и примированные iPS-клетки человека включают в себя клетки, которые проявляют характеристики, сходные с характеристиками эпибластных клеток после имплантации, и предназначены для спецификации и дифференциации клонов. Наивные ES-клетки человека и наивные iPS-клетки человека включают в себя клетки, которые проявляют характеристики, сходные с характеристиками ES-клеток внутренней клеточной массы предимплантациоиного эмбриона, и не являются обязательными для спецификации линии. Смотрите, например, публикацию Nichols and Smith (2009) Cell Stem Cell 4:487-492, полностью включенную в настоящий документ посредством ссылки для всех целей.
Клетки, представленные в настоящем документе, также могут представлять собой половые клетки (например, сперматозоиды или ооциты). Клетки могут быть митотически компетентными клетками или митотически неактивными клетками, мейотически компетентными клетками или мейотически неактивными клетками. Подобным образом, клетки также могут представлять собой первичные соматические клетки или клетки, которые не являются первичными соматическими клетками. Соматические клетки включают в себя любую клетку, которая не является гаметой, зародышевой клеткой, гаметоцитом или недифференцированной стволовой клеткой. Например, клетки могут представлять собой клетки печени, почек, кроветворные клетки, эндотелиальные клетки, эпителиальные клетки, фибробласты, мезенхимные клетки, кератиноциты, клетки крови, меланоциты, моноциты, мононуклеарные клетки, моноцитарные предшественники, В-клетки, эритроидно-мегакариоцитарные клетки, эозинофилы, макрофаги, Т-клетки, островковые бета-клетки, экзокринные клетки, панкреатические предшественники, эндокринные предшественники, адипоциты, преадипоциты, нейроны, глиальные клетки, нервные стволовые клетки, нейроны, гепатобласты, гепатоциты, кардиомиоциты, скелетные миобласты, клетки гладких мышц, дуктальные клетки, ацинарные клетки, альфа-клетки, бета-клетки, дельта-клетки, РР-клетки, холангиоциты, белые или коричневые адипоциты или глазные клетки (например, клетки трабекулярной сети, пигментные эпителиальные клетки сетчатки, эндотелиальные клетки сетчатки, клетки перицита сетчатки, эпителиальные клетки конъюнктивы, фибробласты конъюнктивы, эпителиальные клетки пигмента радужки, кератоциты, эпителиальные клетки хрусталика, непигментные цилиарные эпителиальные клетки, глазные хороидные фибробласты, фоторецепторные клетки, ганглиозные клетки, биполярные клетки, горизонтальные клетки или амакринные клетки).
Подходящие клетки, представленные в настоящем документе, также включают в себя первичные клетки. Первичные клетки включают в себя клетки или культуры клеток, которые были выделены непосредственно из организма, органа или ткани. Первичные клетки включают в себя клетки, которые не являются ни трансформированными, ни бессмертными. Они включают в себя любую клетку, полученную из организма, органа или ткани, которая ранее не пассировали в культуре ткани или ранее пассировали в культуре ткани, но она не способна бесконечно пассироваться в культуре ткани. Такие клетки могут быть выделены общепринятыми способами и включают в себя, например, соматические клетки, кроветворные клетки, эндотелиальные клетки, эпителиальные клетки, фибробласты, мезенхимные клетки, кератиноциты, меланоциты, моноциты, мононуклеарные клетки, адипоциты, преадипоциты, нейроны, глиальные клетки, гепатоциты, скелетные миобласты и гладкомышечные клетки. Например, первичные клетки могут быть получены из соединительных тканей, мышечных тканей, тканей нервной системы или эпителиальных тканей.
Другие подходящие клетки, представленные в настоящем документе, включают в себя иммортализованные клетки. К иммортализованным клеткам относятся клетки многоклеточного организма, которые, как правило, не размножались бы бесконечно долго, но из-за мутации или изменения избежали нормального клеточного старения и вместо этого могут продолжать подвергаться делению. Такие мутации или изменения могут происходить естественным путем или быть преднамеренно вызванными. Примеры иммортализованных клеток включают в себя клетки яичника китайского хомячка (СНО), клетки эмбриональной почки человека (например, клетки HEK 293 или клетки 293Т) и клетки фибробластов эмбриона мыши (например, клетки 3Т3). Многочисленные типы иммортализованных клеток хорошо известны. Иммортализованные или первичные клетки включают в себя клетки, которые, как правило, используются для культивирования или для экспрессии рекомбинантных генов или белков.
Представленные в настоящем документе клетки также включают в себя эмбрионы одноклеточной стадии (т.е. оплодотворенные ооциты или зиготы). Такие одноклеточные эмбрионы могут происходить из любого генетического фона (например, BALB/c, C57BL/6, 129 или их комбинации для мышей), могут быть свежими или замороженными и могут быть получены в результате естественного разведения или экстракорпорального оплодотворения.
Представленные в настоящем документе клетки могут представлять собой нормальные, здоровые клетки или они могут быть больными или мутантсодержащими клетками.
Отличные от человека животные, содержащие репортер CRISPR, как описано в настоящем документе, могут быть получены способами, описанными в другом месте в настоящем документе. Термин «животное» включает в себя млекопитающих, рыб и птиц. Млекопитающие включают в себя, например, людей, нечеловекообразных приматов, мартышек, обезьян, кошек, собак, лошадей, быков, оленей, бизонов, овец, кроликов, грызунов (например, мышей, крыс, хомяков и морских свинок) и скот (например, виды крупного рогатого скота, такие как коровы и быки; виды овец, такие как овцы и козы; и виды свиней, такие как свиньи и кабаны). Птицы включают в себя, например, кур, индеек, страусов, гусей и уток. Домашние животные и сельскохозяйственные животные также включены. Термин «отличное от человека животное» исключает людей. Предпочтительные отличные от человека животные включают в себя, например, грызунов, таких как мыши и крысы.
Отличные от человека животные могут быть любого генетического происхождения. Например, подходящие мыши могут быть из линии 129, линии C57BL/6, смеси 129 и C57BL/6, линии BALB/c или линии Swiss Webster. Примеры линий 129 включают в себя 129Р1, 129Р2, 129Р3, 129X1, 129S1 (например, 129S1/SV, 129Sl/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129Т1 и 129Т2. Смотрите, например, публикацию Festing et al. (1999) Mammalian Genome 10:836, полностью включенную в настоящий документ посредством ссылки для всех целей. Примеры линий C57BL включают в себя C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr и C57BL/Ola. Подходящие мыши также могут быть из смеси вышеуказанной линии 129 и вышеуказанной линии C57BL/6 (например, 50% 129 и 50% C57BL/6). Аналогично, подходящие мыши могут быть из смеси вышеуказанных линий 129 или смеси вышеуказанных линий BL/6 (например, линия 129S6 (129/SvEvTac)).
Аналогичным образом, крысы могут быть из любой линии крыс, включая в себя, например, линию крыс ACI, линию крыс Dark Agouti (DA), линию крыс Wistar, линию крыс LEA, линию крыс Sprague Dawley (SD) или линию крыс Fischer, такую как Fisher F344 или Fisher F6. Крысы также могут быть получены из линии, полученной из смеси двух или более линий, указанных выше. Например, подходящая крыса может быть линии DA или линии ACI. Крысиная линия ACI характеризуется тем, что имеет окрас черный агути, белый живот и ноги и гаплотип RTlavl. Такие линии доступны из различных источников, включая в себя Harlan Laboratories. Крысиная линия Dark Agouti (DA) характеризуется тем, что имеет покров агути и гаплотип RTlavl. Такие крысы доступны из различных источников, включая в себя Charles River и Harlan Laboratories. В некоторых случаях подходящими крысами могут быть инбредные крысы. Смотрите, например, US 2014/0235933, полностью включенный в настоящий документ посредством ссылки для всех целей.
С. Целевые геномные локусы
Описанные в настоящем документе репортеры CRISPR могут быть геномно интегрированы в целевой геномный локус в клетке или отличном от человека животном. Можно использовать любой целевой геномный локус, способный экспрессировать ген.
Примером целевого геномного локуса, в который описанные в настоящем документе репортеры CRISPR могут быть стабильно интегрированы, является локус «безопасной гавани» в геноме отличного от человека животного. Взаимодействия между интегрированной экзогенной ДНК и геномом хозяина могут ограничивать надежность и безопасность интеграции и могут приводить к явным фенотипическим эффектам, которые не обусловлены целевой генетической модификацией, а вместо этого обусловлены непреднамеренными эффектами интеграции на окружающие эндогенные гены. Например, случайно вставленные трансгены могут подвергаться эффектам положения и сайленсинга, что делает их экспрессию ненадежной и непредсказуемой. Аналогично, интеграция экзогенной ДНК в хромосомный локус может влиять на окружающие эндогенные гены и хроматин, тем самым изменяя поведение и фенотипы клеток. Локусы «безопасной гавани» включают в себя хромосомные локусы, где трансгены или другие экзогенные вставки нуклеиновой кислоты могут стабильно и надежно экспрессироваться во всех представляющих интерес тканях без явного изменения поведения или фенотипа клетки (т.е. без каких-либо вредных воздействий на клетку-хозяина). Смотрите, например, публикацию Sadelain et al. (2012) Nat. Rev. Cancer 12:51-58, полностью включенную в настоящий документ посредством ссылки для всех целей. Необязательно, локусом «безопасной гавани» является тот, в котором экспрессия вставленной последовательности гена не нарушается какой-либо экспрессией сквозным прохождением от соседних генов. Например, локусы «безопасной гавани» могут включать в себя хромосомные локусы, где экзогенная ДНК может интегрироваться и функционировать предсказуемым образом, не оказывая неблагоприятного влияния на структуру или экспрессию эндогенных генов. Локусы «безопасной гавани» могут включать в себя экстрагенные области или внутригенные области, такие как, например, локусы в генах, которые не являются необходимыми, необязательными или могут быть нарушены без явных фенотипических последствий.
Например, локус Rosa26 и его эквивалент у человека обеспечивают открытую конфигурацию хроматина во всех тканях и повсеместно экспрессируется во время эмбрионального развития и у взрослых. Смотрите, например, публикацию Zambrowicz et al. (1997) Proc. Natl. Acad. Sci. USA 94:3789-3794, полностью включенную в настоящий документ посредством ссылки для всех целей. Кроме того, локус Rosa26 может быть нацелен с высокой эффективностью, и разрушение гена Rosa26 не дает явного фенотипа. Другие примеры локусов «безопасной гавани» включают в себя CCR5, HPRT, AAVS1 и альбумин. Смотрите, например, патенты США №7888821; 7972854; 7914796; 7951925; 8110379; 8409861; 8586526 и патентные публикации США №2003/0232410; 2005/0208489; 2005/0026157; 2006/0063231; 2008/0159996; 2010/00218264; 2012/0017290; 2011/0265198; 2013/0137104; 2013/0122591; 2013/0177983; 2013/0177960 и 2013/0122591, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Двуаллельное нацеливание на локусы «безопасной гавани», такие как локус Rosa26, не имеет отрицательных последствий, поэтому разные гены или репортеры могут быть нацелены на два аллеля Rosa26. В одном примере репортер CRISPR интегрирован в интрон локуса Rosa26, такой как первый интрон локуса Rosa26.
D. Системы CRISPR/Cas
Системы CRISPR/Cas включают в себя транскрипты и другие элементы, участвующие в экспрессии или направлении активности генов Cas. Система CRISPR/Cas может представлять собой, например, систему типа I, типа II или типа III. Альтернативно, система CRISPR/Cas может представлять собой систему типа V (например, подтип V-A или подтип V-B). Системы CRISPR/Cas, используемые в раскрытых в настоящем документе композициях и способах, могут быть не встречающимися в природе. «Не встречающаяся в природе» система включает в себя все, что указывает на участие руки человека, например, один или несколько компонентов системы изменяются или видоизменяются от своего естественного состояния, будучи по меньшей мере по существу свободными по меньшей мере от одного другого компонента с которые они естественным образом связаны в природе или будучи связанными по меньшей мере с одним другим компонентом, с которым они не связаны естественным образом. Например, не встречающиеся в природе системы CRISPR/Cas могут использовать комплексы CRISPR, содержащие gRNA и белок Cas, которые не встречаются в природе вместе, белок Cas, который не встречается в природе, или gRNA, которая не встречается в природе.
(1) Белки Cas и полипуклеотиды, кодирующие белки Cas
Белки Cas, как правило, содержат по меньшей мере один домен распознавания или связывания РНК, который может взаимодействовать с направляющими РНК (gRNA, более подробно описанными ниже). Белки Cas также могут содержать домены нуклеазы (например, домены ДНКазы или РНКазы), ДНК-связывающие домены, геликазные домены, домены белок-белковых взаимодействий, домены димеризации и другие домены. Некоторые такие домены (например, домены ДНКазы) могут быть из нативного белка Cas. Другие такие домены могут быть добавлены для получения модифицированного белка Cas. Нуклеазный домен обладает каталитической активностью в отношении расщепления нуклеиновой кислоты, которое включает в себя разрыв ковалентных связей молекулы нуклеиновой кислоты. Расщепление может привести к тупым концам или ступенчатым концам, и оно может быть одноцепочечным или двухцепочечным. Например, белок Cas9 дикого типа, как правило, создает тупой продукт расщепления. Альтернативно, белок Cpf1 дикого типа (например, FnCpf1) может приводить к продукту расщепления с 5-нуклеотидным 5'-выступом, причем расщепление происходит после 18-й пары нуклеотидов от последовательности РАМ на нецелевой цепи и после 23-й пары нуклеотидов на целевой цепи. Белок Cas может обладать активностью полного расщепления для создания двухцепочечного разрыва в целевом геномном локусе (например, двухцепочечного разрыва с тупыми концами), или он может представлять собой никазу, которая создает одноцепочечный разрыв в целевом геноме локус.
Примеры белков Cas включают в себя Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 или Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 и Cu1966 и его гомологи или модифицированные версии.
Иллюстративным белком Cas является белок Cas9 или белок, полученный из Cas9. Белки Cas9 происходят из системы CRISPR/Cas типа II и, как правило, имеют четыре ключевых мотива с консервативной архитектурой. Мотивы 1, 2 и 4 представляют собой RuvC-подобные мотивы, а мотив 3 представляет собой мотив HNH. Иллюстративные белки Cas9 происходят из Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, Acaryochloris marina, Neisseria meningitidis или Campylobacter jejuni. Дополнительные примеры представителей семейства Cas9 описаны в публикации международной заявки WO 2014/131833, полностью включенной в настоящий документ посредством ссылки для всех целей. Cas9 из S. pyogenes (SpCas9) (присвоенный регистрационный номер SwissProt Q99ZW2) представляет собой иллюстративный белок Cas9. Cas9 из S. aureus (SaCas9) (присвоенный регистрационный номер UniProt J7RUA5) представляет собой другой иллюстративный белок Cas9. Cas9 из Campylobacter jejuni (CjCas9) (присвоенный регистрационный номер UniProt Q0P897) представляет собой еще один иллюстративный белок Cas9. Смотрите, например, публикацию Kim et al. (2017) Nat. Comm. 8:14500, полностью включенную в настоящий документ посредством ссылки для всех целей. SaCas9 меньше, чем SpCas9, a CjCas9 меньше, чем SaCas9 и SpCas9. Иллюстративный белок Cas9 представлен в SEQ ID NO: 53 (кодируется SEQ ID NO: 54).
Другим примером белка Cas является белок Cpf1 (CRISPR из Prevotella и Francisella 1). Cpf1 представляет собой большой белок (приблизительно 1300 аминокислот), который содержит RuvC-подобный нуклеазный домен, гомологичный соответствующему домену Cas9, наряду с аналогом характерного богатого аргинином кластера Cas9. Однако в Cpf1 отсутствует нуклеазный домен HNH, который присутствует в белках Cas9, а RuvC-подобный домен является смежным в последовательности Cpf1, в отличие от Cas9, где он содержит длинные вставки, включающие в себя домен HNH. Смотрите, например, публикацию Zetsche et al. (2015) Cell 163(3):759-771, полностью включенную в настоящий документ посредством ссылки для всех целей. Иллюстративные белки Cpf1 происходят из Francisella tularentis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae. Cpf1 из U112 Francisella novicida (FnCpf1; присвоенный регистрационный номер UniProt A0Q7Q2) представляет собой иллюстративный белок Cpf1.
Белки Cas могут представлять собой белки дикого типа (т.е. те, которые встречаются в природе), модифицированные белки Cas (т.е. варианты белков Cas) или фрагменты белков дикого типа или модифицированных белков Cas. Белки Cas также могут представлять собой активные варианты или фрагменты в отношении каталитической активности белков Cas дикого типа или модифицированных белков Cas. Активные варианты или фрагменты в отношении каталитической активности могут характеризоваться идентичностью последовательности по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более по отношению к белку Cas дикого типа или модифицированному белку Cas или его части, причем активные варианты сохраняют способность разрезать в желаемом сайте расщепления и, следовательно, сохраняют активность, индуцирующую одноцепочечный или двухцепочечный разрыв. Анализы на активность в отношении индукции одноцепочечного разрыва или индукции двухцепочечного разрыва известны и, как правило, измеряют общую активность и специфичность белка Cas на ДНК-субстратах, содержащих сайт расщепления.
Белки Cas могут быть модифицированы для увеличения или уменьшения одного или нескольких из аффинности связывания нуклеиновой кислоты, специфичности связывания нуклеиновой кислоты и ферментативной активности. Белки Cas также могут быть модифицированы для изменения любой другой активности или свойства белка, такого как стабильность. Например, один или несколько нуклеазных доменов белка Cas могут быть модифицированы, удалены или инактивированы, или белок Cas может быть усечен для удаления доменов, которые не являются необходимыми для функции белка или для оптимизации (например, для усиления или уменьшения) активности или свойства белка Cas.
Одним из примеров модифицированного белка Cas является модифицированный белок SpCas9-HF1, который представляет собой высокоточный вариант Cas9 Streptococcus pyogenes, несущий изменения (N497A/R661A/Q695A/Q926A), предназначенные для уменьшения неспецифических контактов ДНК. Смотрите, например, публикацию Kleinstiver et al. (2016) Nature 529(7587):490-495, полностью включенную в настоящий документ посредством ссылки для всех целей. Другим примером модифицированного белка Cas является модифицированный вариант eSpCas9 (K848A/K1003A/R1060A), предназначенный для уменьшения нежелательных эффектов. Смотрите, например, публикацию Slaymaker et al. (2016) Science 351(6268): 84-88, полностью включенную в настоящий документ посредством ссылки для всех целей. Другие варианты SpCas9 включают в себя K855A и K810A/K1003A/R1060A.
Белки Cas могут содержать по меньшей мере один нуклеазный домен, такой как домен ДНКазы. Например, белок Cpf1 дикого типа, как правило, содержит RuvC-подобный домен, который расщепляет обе цепи целевой ДНК, возможно, в димерной конфигурации. Белки Cas также могут содержать по меньшей мере два нуклеазных домена, таких как домены ДНКазы. Например, белок Cas9 дикого типа, как правило, содержит RuvC-подобный нуклеазный домен и HNH-подобный нуклеазный домен. Каждый из доменов RuvC и HNH может разрезать разные цепи двухцепочечной ДНК, чтобы сделать двухцепочечный разрыв в ДНК. Смотрите, например, публикацию Jinek et al. (2012) Science 337:816-821, полностью включенную в настоящий документ посредством ссылки для всех целей.
Один или несколько из нуклеазных доменов могут быть удалены или мутированы, так что они больше не функционируют или характеризуются сниженной нуклеазной активностью. Например, если один из нуклеазных доменов удален или мутирован в белке Cas9, полученный белок Cas9 можно назвать никазой и он может производить одноцепочечный разрыв в целевой последовательности направляющей РНК в двухцепочечной ДНК, но не двухцепочечный разрыв (т.е. он может расщеплять комплементарную цепь или некомплементарную цепь, но не обе). Примером мутации, которая превращает Cas9 в никазу, является мутация D10A (аспартат в аланин в положении 10 в Cas9) в домене RuvC Cas9 из S. pyogenes. Аналогично, Н939А (гистидин в аланин в положении аминокислоты 839), Н840А (гистидин в аланин в положении аминокислоты 840) или N863A (аспарагин в аланин в положении аминокислоты N863) в домене HNH Cas9 из S. pyogenes могут превращаться Cas9 в никазу. Другие примеры мутаций, которые превращают Cas9 в никазу, включают в себя соответствующие мутации в Cas9 из S. thermophilus. Смотрите, например, публикацию Sapranauskas et al. (2011) Nucleic Acids Research 39:9275-9282 и публикацию международной заявки WO 2013/141680, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Такие мутации могут быть получены с использованием таких способов, как сайт-направленный мутагенез, ПЦР-опосредованный мутагенез или синтез общего гена. Примеры других мутаций, создающих никазы, можно найти, например, в публикациях международных заявок WO 2013/176772 и WO 2013/142578, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей.
Известны также примеры инактивирующих мутаций в каталитических доменах белков Cas9 Staphylococcus aureus. Например, фермент Cas9 Staphyloccocus aureus (SaCas9) может содержать замену в положении N580 (например, замену N580A) и замену в положении D10 (например, замену D10A), чтобы производить нуклеазно неактивный белок Cas. Смотрите, например, публикацию международной заявки WO 2016/106236, полностью включенную в настоящий документ посредством ссылки для всех целей.
Примеры инактивирующих мутаций в каталитических доменах белков Cpf1 также известны. Что касается белков Cpf1 из U112 Francisella novicida (FnCpf1), BV3L6 Acidaminococcus sp. (AsCpf1), ND2006 Lachnospiraceae bacterium (LbCpf1) и 237 Moraxella bovoculi (MbCpf1 Cpf1), такие мутации могут включать в себя мутации в положениях 908, 993 или 1263 AsCpf1 или в соответствующих положениях в ортологах Cpf1 или положениях 832, 925, 947 или 1180 в LbCpf1 или в соответствующих положениях в ортологах Cpf1. Такие мутации могут включать в себя, например, одну или несколько из мутаций D908A, Е993А и D1263A в AsCpf1 или соответствующих мутаций в ортологах Cpf1, или D832A, Е925А, D947A и D1180A в LbCpf1 или соответствующих мутаций в ортологах Cpf1. Смотрите, например, US 2016/0208243, полностью включенный в настоящий документ посредством ссылки для всех целей.
Белки Cas также могут быть функционально связаны с гетерологичными полипептидами в качестве слитых белков. Например, белок Cas может быть слит с доменом расщепления или доменом эпигенетической модификации. Смотрите публикацию международной заявки WO 2014/089290, полностью включенную в настоящий документ посредством ссылки для всех целей. Белки Cas также могут быть слиты с гетерологичным полипептидом, обеспечивающим повышенную или пониженную стабильность. Слитый домен или гетерологичный полипептид может быть расположен на N-конце, С-конце или внутри белка Cas.
В качестве одного примера, белок Cas может быть слит с одним или несколькими гетерологичными полипептидами, которые обеспечивают субклеточную локализацию. Такие гетерологичные полипептиды могут включать в себя, например, один или несколько сигналов ядерной локализации (NLS), таких как одинарный NLS SV40 и/или двойной NLS альфа-импортина для нацеливания на ядро, сигнал локализации митохондрий для нацеливания на митохондрии, ER задерживающий сигнал и тому подобное. Смотрите, например, публикацию Lange et al. (2007) J. Biol. Chem. 282:5101-5105, полностью включенную в настоящий документ посредством ссылки для всех целей. Такие субклеточные сигналы локализации могут быть локализованы на N-конце, С-конце или в любом месте белка Cas. NLS может содержать участок основных аминокислот и может представлять собой одинарную последовательность или двойную последовательность. Необязательно, белок Cas может содержать два или более NLS, в том числе NLS (например, NLS альфа-импортина или одинарный NLS) на N-конце и NLS (например, NLS SV40 или двойной NLS) на С-конце. Белок Cas также может содержать два или более NLS на N-конце и/или два или более NLS на С-конце.
Белки Cas также могут быть функционально связаны с проникающим в клетку доменом или доменом белковой трансдукции. Например, проникающий в клетку домен может быть получен из белка TAT HIV-1, проникающего в клетки TLM мотива вируса гепатита В человека, MPG, Рер-1, VP22, пептида, проникающего в клетки вируса простого герпеса или пептидной последовательности полиаргинина. Смотрите, например, публикации международных заявок WO 2014/089290 и WO 2013/176772, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Проникающий в клетку домен может быть локализован на N-конце, С-конце или в любом месте белка Cas.
Белки Cas также могут быть функционально связаны с гетерологичным полипептидом для простоты отслеживания или очистки, таким как флуоресцентный белок, метка очистки или метка эпитопа. Примеры флуоресцентных белков включают в себя зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, мономерный Azami Green, CopGFP, AceGFP, ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, Citrine, Venus YPet, PhiYFP, ZsYellowl), синие флуоресцентные белки (например, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), голубые флуоресцентные белки (например, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), красные флуоресцентные белки (например, mKate, mKate2, mPlum, мономер DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-мономер, HcRed-тандем, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), оранжевые флуоресцентные белки (например, mOrange, mKO, Kusabira-Orange, мономерный Kusabira-Orange, mTangerine, tdTomato) и любой другой подходящий флуоресцентный белок. Примеры меток включают в себя глутатион-S-трансферазу (GST), хитин-связывающий белок (СВР), мальтозосвязывающий белок, тиоредоксин (TRX), поли(NANP), метку тандемной аффинной очистки (ТАР), myc, AcV5, AU1, AU5, Е, ECS, Е2, FLAG, гемагглютинин (НА), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, гистидин (His), биотин-карбоксильный белок-носитель (BCCP) и кальмодулин.
Белки Cas также могут быть связаны с экзогенными донорскими нуклеиновыми кислотами или мечеными нуклеиновыми кислотами. Такое закрепление (т.е. физическое связывание) может быть достигнуто посредством ковалентных взаимодействий или нековалентных взаимодействий, и закрепление может быть прямым (например, посредством прямого слияния или химического конъюгирования, что может быть достигнуто путем модификации остатков цистеина или лизина в белке или модификации интеина), или может быть достигнуто с помощью одного или нескольких промежуточных линкеров или адаптерных молекул, таких как стрептавидин или аптамеры. Смотрите, например, публикации Pierce et al. (2005) Mini Rev. Med. Chem. 5(l):41-55; Duckworth et al. (2007) Angew. Chem. Int. Ed. Engl. 46(46):8819-8822; Schaeffer and Dixon (2009) Australian J. Chem. 62(10): 1328-1332; Goodman et al. (2009) Chembiochem. 10(9): 1551-1557 и Khatwani et al. (2012) Bioorg. Med. Chem. 20(14):4532-4539, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Нековалентные стратегии синтеза конъюгатов белок-нуклеиновая кислота включают в себя биотин-стрептавидиновый и никель-гистидиновый способы. Ковалентные конъюгаты белок-нуклеиновая кислота могут быть синтезированы путем соединения подходящим образом функционализированных нуклеиновых кислот и белков с использованием широкого спектра способов химии. Некоторые из этих способов химии предусматривают прямое присоединение олигонуклеотида к аминокислотному остатку на поверхности белка (например, амин лизина или тиол цистеина), в то время как другие более сложные схемы требуют посттрансляционной модификации белка или участия каталитического домена или домена реактивного белка. Способы ковалентного присоединения белков к нуклеиновым кислотам могут предусматривать, например, химическое сшивание олигонуклеотидов с остатками лизина или цистеина белка, экспрессию лигирования белка, хемоферментные способы и использование фотоаптамеров. Экзогенная донорская нуклеиновая кислота или меченая нуклеиновая кислота могут быть связаны с С-концом, N-концом или с внутренней областью внутри белка Cas. Необязательно, экзогенная донорская нуклеиновая кислота или меченая нуклеиновая кислота связана с С-концом или N-концом белка Cas9. Аналогично, белок Cas может быть связан с 5'-концом, 3'-концом или внутренней областью внутри экзогенной донорской нуклеиновой кислоты или меченой нуклеиновой кислоты. То есть экзогенная донорская нуклеиновая кислота или меченая нуклеиновая кислота могут быть связаны в любой ориентации и полярности. Необязательно, белок Cas связан с 5'-концом или 3'-концом экзогенной донорской нуклеиновой кислоты или меченой нуклеиновой кислоты.
Белки Cas могут быть представлены в любой форме. Например, белок Cas может быть представлен в форме белка, такого как белок Cas, образующий комплекс с gRNA. Альтернативно, белок Cas может быть представлен в форме нуклеиновой кислоты, кодирующей белок Cas, такой как РНК (например, информационная РНК (mRNA)) или ДНК. Необязательно, кодирующая белок Cas нуклеиновая кислота может быть кодон-оптимизированной для эффективной трансляции в белок в конкретной клетке или организме. Например, кодирующая белок Cas нуклеиновая кислота может быть модифицирована для замены кодонов, имеющих более высокую частоту использования в клетке человека, отличной от человеческой клетке, клетке млекопитающего, клетке грызунов, клетке мыши, клетке крысы или любой другой представляющей интерес клетке-хозяине по сравнению с природной полинуклеотидной последовательностью. Когда кодирующую белок Cas нуклеиновую кислоту вводят в клетку, белок Cas может временно, условно или конститутивно экспрессироваться в клетке.
Белки Cas, представленные в виде mRNA, могут быть модифицированы для улучшения стабильности и/или свойств иммуногенности. Модификации могут быть внесены в один или несколько нуклеозидов в mRNA. Примеры химических модификаций нуклеиновых оснований mRNA включают в себя псевдоуридин, 1-метил-псевдоуридин и 5-метил-цитидин. Например, может быть использована кэпированная и полиаденилированная mRNA Cas, содержащая N1-метилпсевдоуридин. Аналогично, mRNA Cas может быть модифицирована путем истощения уридина с использованием синонимичных кодонов.
Нуклеиновые кислоты, кодирующие белки Cas, могут быть функционально связаны с промотором в экспрессионной конструкции. Экспрессионные конструкции включают в себя любые конструкции нуклеиновых кислот, способные направлять экспрессию гена или другой представляющей интерес последовательности нуклеиновой кислоты (например, гена Cas) и которые могут переносить такую представляющую интерес последовательность нуклеиновой кислоты в целевую клетку. Например, нуклеиновая кислота, кодирующая белок Cas, может находиться в векторе, содержащем ДНК, кодирующую gRNA. Альтернативно, это может быть вектор или плазмида, которая отделена от вектора, содержащего ДНК, кодирующую эту gRNA. Промоторы, которые можно использовать в экспрессионной конструкции, включают в себя промоторы, активные, например, в одной или нескольких клетках эукариот, клетке человека, отличной от человеческой клетке, клетке млекопитающего, клетке отличного от человека млекопитающего, клетке грызуна, клетке мыши, клетке крысы, плюрипотентной клетке, эмбриональной стволовой (ES) клетке, взрослой стволовой клетке, ограниченной в развитии клетке-предшественнике, индуцированной плюрипотентной стволовой клетке (iPS) или эмбрионе одноклеточной стадии. Такими промоторами могут быть, например, условные промоторы, индуцибельные промоторы, конститутивные промоторы или тканеспецифические промоторы. Необязательно, промотор может представлять собой двунаправленный промотор, управляющий экспрессией как белка Cas в одном направлении, так и направляющей РНК в другом направлении. Такие двунаправленные промоторы могут состоять из (1) полного традиционного однонаправленного промотора Pol III, который содержит 3 внешних элемента управления: элемент дистальной последовательности (DSE), элемент проксимальной последовательности (PSE) и блок TATA; и (2) второго основного промотора Pol III, который включает в себя PSE и блок TATA, слитый с 5'-концом DSE в обратной ориентации. Например, в промоторе H1 DSE соседствует с PSE и блоком TATA, и промотор можно сделать двунаправленным, создав гибридный промотор, в котором транскрипция в обратном направлении контролируется путем добавления блока PSE и TATA, полученного из промотора U6. Смотрите, например, US 2016/0074535, полностью включенный в настоящий документ посредством ссылки для всех целей. Использование двунаправленного промотора для экспрессии генов, кодирующих белок Cas и направляющую РНК, одновременно позволяет создавать компактные кассеты экспрессии для облегчения доставки.
(2) Направляющие РНК
«Направляющая РНК» или «gRNA» представляет собой молекулу РНК, которая связывается с белком Cas (например, белком Cas9) и направляет белок Cas в определенное место в целевой ДНК. Направляющие РНК могут содержать два сегмента: «нацеленный на ДНК» и «белок-связывающий сегмент». «Сегмент» включает в себя участок или область молекулы, например, непрерывный участок нуклеотидов в РНК. Некоторые gRNA, такие как для Cas9, могут содержать две отдельные молекулы РНК: «РНК-активатор» (например, tracrRNA) и «РНК-нацеливатель» (например, CRISPR RNA или crRNA). Другие gRNA представляют собой одну молекулу РНК (один полинуклеотид РНК), которую также можно назвать «одномолекулярной gRNA», «одиночная направляющая РНК» или «sgRNA». Смотрите, например, публикации международных заявок WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578 и WO 2014/131833, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Например, для Cas9 одиночная направляющая РНК может содержать crRNA, слитую с tracrRNA (например, через линкер). Например, для Cpf1 необходима только crRNA для достижения связывания и/или расщепления целевой последовательности. Термины «направляющая РНК» и «gRNA» включают в себя как двухмолекулярные (т.е. модульные) gRNA, так и одномолекулярные gRNA.
Иллюстративная двухмолекулярная gRNA содержит молекулу, подобную gRNA («CRISPR RNA», или «РНК-нацеливатель», или «crRNA», или «повтор crRNA»), и соответствующую tracrRNA-подобную («транс-активационную CRISPR RNA») или «РНК-активатор» или «tracrRNA») молекулу. crRNA содержит как нацеленный на ДНК сегмент (одноцепочечный) crRNA, так и участок нуклеотидов (т.е. хвост crRNA), который образует одну половину dsRNA-дуплекса белок-связывающего сегмента gRNA. Пример хвоста crRNA, расположенного ниже по ходу транскрипции (3') от нацеленного на ДНК сегмента, содержит, состоит по существу из или состоит из GUUUUAGAGCUAUGCU (SEQ ID NO: 37). Любой из нацеленных на ДНК сегментов (т.е. направляющих последовательностей или направляющих), раскрытых в настоящем документе (например, SEQ ID NO: 2, 14, 20, 22, 24, 26, 28, 29, 30, 31, 35, 36 или 55) может быть присоединен к 5' концу SEQ ID NO: 37 с образованием crRNA.
Соответствующая tracrRNA (РНК-активатор) содержит участок нуклеотидов, который образует другую половину дуплекса dsRNA белок-связывающего сегмента gRNA. Участок нуклеотидов crRNA комплементарен участку нуклеотидов tracrRNA и гибридизуется с ним, образуя дуплекс dsRNA белок-связывающего домена gRNA. Таким образом, можно сказать, что каждая crRNA имеет соответствующую tracrRNA. Пример последовательности tracrRNA содержит, состоит по существу или состоит из AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU (SEQ ID NO: 38).
В системах, в которых необходимы как crRNA, так и tracrRNA, crRNA и соответствующая tracrRNA гибридизуются с образованием gRNA. В системах, в которых требуется только crRNA, crRNA может представлять собой gRNA. Кроме того, crRNA обеспечивает одноцепочечный нацеленный на ДНК сегмент, который нацеливается на целевую последовательность направляющей РНК путем гибридизации с противоположной цепью (т.е. комплементарной цепью). Если используется для модификации внутри клетки, точная последовательность данной молекулы crRNA или tracrRNA может быть разработана так, чтобы она была специфической для видов, в которых будут использоваться молекулы РНК. Смотрите, например, публикации Mali et al. (2013) Science 339:823-826; Jinek et al. (2012) Science 337:816-821; Hwang et al. (2013) Nat. Biotechnol. 31:227-229; Jiang et al. (2013) Nat. Biotechnol. 31:233-239 и Cong et al. (2013) Science 339:819-823, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей.
Нацеленный на ДНК сегмент (crRNA) данной gRNA содержит нуклеотидную последовательность, которая комплементарна последовательности (т.е. комплементарной цепи последовательности распознавания направляющей РНК на цепи, противоположной целевой последовательности направляющей РНК) в целевой ДНК. Нацеленный на ДНК сегмент gRNA взаимодействует с целевой ДНК специфическим по отношению к последовательности образом посредством гибридизации (т.е. спаривания оснований). Как таковая, нуклеотидная последовательность нацеленного на ДНК сегмента может варьировать и определять местоположение внутри целевой ДНК, с которым будут взаимодействовать gRNA и целевая ДНК. Нацеленный на ДНК сегмент рассматриваемой gRNA может быть модифицирован для гибридизации с любой желаемой последовательностью в целевой ДНК. Встречающиеся в природе crRNA различаются в зависимости от системы CRISPR/Cas и организма, но часто содержат нацеливающий сегмент длиной от 21 до 72 нуклеотидов, фланкированный двумя прямыми повторами (DR) длиной от 21 до 46 нуклеотидов (смотрите, например, публикацию международной заявки WO 2014/131833, полностью включенную в настоящий документ посредством ссылки для всех целей). В случае S. pyogenes DR составляет в длину 36 нуклеотидов, а нацеливающий сегмент составляет в длину 30 нуклеотидов. 3'-расположенный DR является комплементарным и гибридизуется с соответствующей tracrRNA, которая, в свою очередь, связывается с белком Cas.
Нацеленный на ДНК сегмент может составлять в длину по меньшей мере приблизительно 12 нуклеотидов, по меньшей мере приблизительно 15 нуклеотидов, по меньшей мере приблизительно 17 нуклеотидов, по меньшей мере приблизительно 18 нуклеотидов, по меньшей мере приблизительно 19 нуклеотидов, по меньшей мере приблизительно 20 нуклеотидов, по меньшей мере приблизительно 25 нуклеотидов, по меньшей мере приблизительно 30 нуклеотидов, по меньшей мере приблизительно 35 нуклеотидов или по меньшей мере приблизительно 40 нуклеотидов. Такие нацеленные на ДНК сегменты могут составлять в длину от приблизительно 12 нуклеотидов до приблизительно 100 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 80 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 50 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 40 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 30 нуклеотидов, от приблизительно 12 нуклеотидов до приблизительно 25 нуклеотидов или от приблизительно 12 нуклеотидов до приблизительно 20 нуклеотидов. Например, нацеленный на ДНК сегмент может составлять от приблизительно 15 нуклеотидов до приблизительно 25 нуклеотидов (например, от приблизительно 17 нуклеотидов до приблизительно 20 нуклеотидов или приблизительно 17 нуклеотидов, приблизительно 18 нуклеотидов, приблизительно 19 нуклеотидов или приблизительно 20 нуклеотидов). Смотрите, например, US 2016/0024523, полностью включенный в настоящий документ посредством ссылки для всех целей. Для Cas9 из S. pyogenes типичный нацеленный на ДНК сегмент составляет в длину от 16 до 20 нуклеотидов или от 17 до 20 нуклеотидов. Для Cas9 из S. aureus типичный нацеленный на ДНК сегмент составляет в длину от 21 до 23 нуклеотидов. Для Cpf1 типичный нацеленный на ДНК сегмент составляет в длину по меньшей мере 16 нуклеотидов или по меньшей мере 18 нуклеотидов.
TracrRNA могут быть в любой форме (например, полноразмерные tracrRNAs или активные частичные tracrRNA) и различной длины. Они могут включать в себя первичные транскрипты или процессированные формы. Например, tracrRNA (как часть одиночной направляющей РНК или как отдельная молекула как часть двухмолекулярной gRNA) могут содержать, состоять по существу или состоять из всей или части последовательности tracrRNA дикого типа (например, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов последовательности tracrRNA дикого типа). Примеры последовательностей tracrRNA дикого типа из S. pyogenes включают в себя 171-нуклеотидную, 89-нуклеотидную, 75-нуклеотидную и 65-нуклеотидную версии. Смотрите, например, публикации Deltcheva et al. (2011) Nature 471:602-607; WO 2014/093661, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Примеры tracrRNA в одиночных направляющих РНК (sgRNA) включают в себя сегменты tracrRNA, обнаруженные в версиях +48, +54, +67 и +85 sgRNA, где «+n» указывает на то, что вплоть до +n нуклеотида tracrRNA дикого типа входит в cgRNA. Смотрите US 8697359, полностью включенный в настоящий документ посредством ссылки для всех целей.
Процент комплементарности между нацеленным на ДНК сегментом и комплементарной цепью последовательности распознавания направляющей РНК в целевой ДНК может составлять по меньшей мере 60% (например, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100%). Процент комплементарности между нацеленным на ДНК сегментом и комплементарной цепью последовательности распознавания направляющей РНК в целевой ДНК может составлять по меньшей мере 60% на протяжении приблизительно 20 смежных нуклеотидов. В качестве примера, процент комплементарности между нацеленным на ДНК сегментом и комплементарной цепью последовательности распознавания направляющей РНК в целевой ДНК составляет 100% на протяжении 14 смежных нуклеотидов на 5'-конце комплементарной цепи последовательности распознавания направляющей РНК в комплементарной цепи целевой ДНК и всего 0% на протяжении остальной части. В таком случае нацеленный на ДНК сегмент можно считать длиной 14 нуклеотидов. В качестве другого примера, процент комплементарности между нацеленным на ДНК сегментом и комплементарной цепью последовательности распознавания направляющей РНК в целевой ДНК составляет 100% на протяжении семи смежных нуклеотидов на 5'-конце комплементарной цепи последовательности распознавания направляющей РНК в комплементарной цепи целевой ДНК и всего 0% на протяжении остальной части. В таком случае нацеленный на ДНК сегмент можно считать длиной 7 нуклеотидов. В некоторых направляющих РНК по меньшей мере 17 нуклеотидов в пределах нацеленного на ДНК сегмента являются комплементарными целевой ДНК. Например, нацеленный на ДНК сегмент может составлять в длину 20 нуклеотидов и может содержать 1, 2 или 3 несовпадения с комплементарной цепью последовательности распознавания направляющей РНК. Необязательно, несовпадения не являются примыкающими к последовательности примыкающего к протоспейсеру мотива (РАМ) (например, несовпадения находятся на 5'-конце нацеленного на ДНК сегмента или несовпадения составляют по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 или 19 пар нуклеотидов вдали от последовательности РАМ).
Белок-связывающий сегмент gRNA может содержать два участка нуклеотидов, которые комплементарны друг другу. Комплементарные нуклеотиды белок-связывающего сегмента гибридизуются с образованием двухцепочечного РНК-дуплекса (dsRNA). Белок-связывающий сегмент рассматриваемой gRNA взаимодействует с белком Cas, и gRNA направляет связанный белок Cas к специфической нуклеотидной последовательности в целевой ДНК через нацеленный на ДНК сегмент.
Одиночная направляющая РНК содержит нацеленный на ДНК сегмент и каркасную последовательность (т.е. белок-связывающую или Cas-связывающую последовательность направляющей РНК). Например, такие направляющие РНК содержат 5'-нацеленный на ДНК сегмент и 3'-последовательность каркаса. Иллюстративные каркасные последовательности содержат, состоят по существу или состоят из: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU (версия 1; SEQ ID NO: 39); GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (версия 2; SEQ ID NO: 7); GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (версия 3; SEQ ID NO: 8) и GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (версия 4; SEQ ID NO: 9). Направляющие РНК, нацеленные на любую целевую последовательность направляющей РНК, могут включать в себя, например, нацеленный на ДНК сегмент на 5'-конце направляющей РНК, слитый с любой из иллюстративных каркасных последовательностей направляющих РНК на 3'-конце направляющей РНК. То есть любой из нацеленных на ДНК сегментов (т.е. направляющие последовательности или направляющие), раскрытых в настоящем документе (например, SEQ ID NO: 2, 14, 20, 22, 24, 26, 28, 29, 30, 31, 35, 36 или 55) может быть присоединен к 5'-концу любой из SEQ ID NO: 39, 7, 8 или 9 для образования одиночной направляющей РНК (химерной направляющей РНК). Версии 1, 2, 3 и 4 направляющей РНК, как раскрыто в другом месте в настоящем документе, относятся к нацеленным на ДНК сегментам (т.е. направляющим последовательностям или направляющим), соединенным с версиями 1, 2, 3 и 4 каркасов, соответственно.
Направляющие РНК могут включать в себя модификации или последовательности, которые обеспечивают дополнительные желательные признаки (например, измененную или регулируемую стабильность; субклеточное нацеливание; отслеживание с помощью флуоресцентной метки; сайт связывания для белка или белкового комплекса и т.п.). Примеры таких модификаций включают в себя, например, 5'-кэп (например, 7-метилгуанилатный кэп (m7G)); 3'полиаденилированный хвост (то есть 3' поли(А) хвост); последовательность рибосвитча (например, для обеспечения регулируемой стабильности и/или регулируемой доступности белками и/или белковыми комплексами); последовательность контроля стабильности; последовательность, которая образует dsRNA-дуплекс (т.е. шпилька); модификацию или последовательность, которая нацеливает РНК в субклеточное местоположение (например, ядро, митохондрии, хлоропласта и т.п.); модификацию или последовательность, которая обеспечивает отслеживание (например, прямое конъюгирование с флуоресцентной молекулой, конъюгирование с фрагментом, который облегчает обнаружение флуоресценции, последовательность, которая позволяет обнаружение флуоресценции и т.д.); модификацию или последовательность, которая обеспечивает сайт связывания для белков (например, белков, которые действуют на ДНК, включая в себя ДНК-метилтрансферазы, ДНК-деметилазы, гистонацетилтрансферазы, гистондеацетилазы и т.п.) и их комбинации. Другие примеры модификаций включают в себя сконструированные дуплексные структуры петля-на-стебле, сконструированные выпуклые области, сконструированные шпильки 3'-дуплексной структуры петля-на-стебле или любую их комбинацию. Смотрите, например, US 2015/0376586, полностью включенный в настоящий документ посредством ссылки для всех целей. Выпуклость может представлять собой неспаренную область нуклеотидов в дуплексе, состоящей из crRNA-подобной области и минимальной tracrRNA-подобной области. Выпуклость может содержать на одной стороне дуплекса непарный 5'-XXXY-3', где X представляет собой любой пурин, a Y может представлять собой нуклеотид, который может образовывать неоднозначную пару с нуклеотидом на противоположной цепи, и область неспаренных нуклеотидов на другой стороне дуплекса.
Немодифицированные нуклеиновые кислоты могут быть склонны к деградации. Экзогенные нуклеиновые кислоты также могут индуцировать врожденный иммунный ответ. Модификации могут помочь ввести стабильность и уменьшить иммуногенность. Направляющие РНК могут содержать модифицированные нуклеозиды и модифицированные нуклеотиды, включая в себя, например, один или несколько из следующих: (1) изменение или замещение одного или обоих несвязывающих фосфатных кислородов и/или одного или нескольких связывающих фосфатных кислородов в фосфодиэфирной связи остова; (2) изменение или замещение компонента рибозного сахара, например, изменение или замещение 2'-гидроксила на рибозном сахаре; (3) замещение фосфатного фрагмента на дефосфо-линкерах; (4) модификация или замещение встречающегося в природе нуклеотидного основания; (5) замещение или модификация рибозофосфатного остова; (6) модификация 3'-конца или 5'-конца олигонуклеотида (например, удаление, модификация или замещение концевой фосфатной группы или конъюгирование фрагмента) и (7) модификация сахара. Другие возможные модификации направляющих РНК включают в себя модификации или замещение урацилов или полиурациловых путей. Смотрите, например, WO 2015/048577 и US 2016/0237455, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. Аналогичные модификации могут быть внесены в Cas-кодирующие нуклеиновые кислоты, такие как mRNA Cas.
В качестве одного примера, нуклеотиды на 5'- или 3'-конце направляющей РНК могут содержать фосфоротиоатные связи (например, основания могут содержать модифицированную фосфатную группу, которая представляет собой фосфоротиоатную группу). Например, направляющая РНК может содержать фосфоротиоатные связи между 2, 3 или 4 концевыми нуклеотидами на 5'- или 3'-конце направляющей РНК. В качестве другого примера, нуклеотиды на 5'- и/или 3'-конце направляющей РНК могут содержать 2'-O-метильные модификации. Например, направляющая РНК может содержать 2'-O-метильные модификации на 2, 3 или 4 концевых нуклеотидах на 5'- и/или 3'-конце направляющей РНК (например, на 5'-конце). Смотрите, например, WO 2017/173054 А1 и Finn et al. (2018) Cell Reports 22: 1-9, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. В одном конкретном примере направляющая РНК содержит 2'-O-метильные аналоги и 3'-фосфоротиоатные межнуклеотидные связи в первых трех 5'- и 3'-концевых остатках РНК. В другом конкретном примере направляющая РНК модифицирована таким образом, что все 2'ОН группы, которые не взаимодействуют с белком Cas9, замещены 2'-O-метильными аналогами, а хвостовая область направляющей РНК, которая характеризуется минимальным взаимодействием с Cas9, модифицирована 5' и 3' фосфоротиоатными межнуклеотидными связями. Смотрите, например, публикацию Yin et al. (2017) Nat. Biotech. 35(12): 1179-1187, полностью включенную в настоящий документ посредством ссылки для всех целей.
Направляющие РНК могут быть представлены в любой форме. Например, gRNA может быть предоставлена в форме РНК, либо в виде двух молекул (отдельная crRNA и tracrRNA), либо в виде одной молекулы (sgRNA) и, необязательно, в форме комплекса с белком Cas. gRNA также может быть представлена в форме ДНК, кодирующей gRNA. ДНК, кодирующая gRNA, может кодировать одну молекулу РНК (sgRNA) или отдельные молекулы РНК (например, отдельные crRNA и tracrRNA). В последнем случае ДНК, кодирующая gRNA, может быть представлена в виде одной молекулы ДНК или в виде отдельных молекул ДНК, кодирующих crRNA и tracrRNA, соответственно.
Когда gRNA представлена в форме ДНК, gRNA может временно, условно или конститутивно экспрессироваться в клетке. ДНК, кодирующие gRNA, могут быть функционально связаны с промотором в экспрессионной конструкции. Например, ДНК, кодирующая gRNA, может находиться в векторе, содержащем гетерологичную нуклеиновую кислоту, такую как нуклеиновая кислота, кодирующая белок Cas. Альтернативно, это может быть вектор или плазмида, которая отделена от вектора, содержащего нуклеиновую кислоту, кодирующую белок Cas. Промоторы, которые можно использовать в таких экспрессионных конструкциях, включают в себя промоторы, активные, например, в одной или нескольких клетках эукариот, клетке человека, отличной от человеческой клетке, клетке млекопитающего, клетке отличного от человека млекопитающего, клетке грызуна, клетке мыши, клетке крысы, клетке хомяка, клетке кролика, плюрипотентной клетке, эмбриональной стволовой (ES) клетке, стволовой клетке взрослого человека, клетке-предшественнике с ограниченным развитием, индуцированной плюрипотентной стволовой клетке (iPS) или одноклеточном эмбрионе. Такими промоторами могут быть, например, условные промоторы, индуцибельные промоторы, конститутивные промоторы или тканеспецифические промоторы. Такими промоторами также могут быть, например, двунаправленные промоторы. Конкретные примеры подходящих промоторов включают в себя промотор РНК-полимеразы III, такой как промотор U6 человека, промотор III-полимеразы III крысы или промотор U6-полимеразы III мыши.
Альтернативно, gRNA могут быть получены различными другими способами. Например, gRNA могут быть получены транскрипцией in vitro с использованием, например, РНК-полимеразы Т7 (смотрите, например, публикации международных заявок WO 2014/089290 и WO 2014/065596, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей). Направляющие РНК также могут представлять собой синтетически полученную молекулу, полученную химическим синтезом.
(3) Последовательности распознавания направляющей РНК и целевые последовательности направляющей РНК
Термин «последовательность распознавания направляющей РНК» включает в себя последовательности нуклеиновой кислоты, присутствующие в целевой ДНК, с которой будет связываться нацеленный на ДНК сегмент gRNA, при условии наличия достаточных условий для связывания. Используемый в настоящем документе термин «последовательность распознавания направляющей РНК» охватывает обе цепи двухцепочечной целевой ДНК (т.е. последовательность на комплементарной цепи, с которой гибридизуется направляющая РНК, и соответствующую последовательность на некомплементарной цепи, смежную с примыкающим к протоспейсеру мотивом (РАМ)). Используемый в настоящем документе термин «целевая последовательность направляющей РНК» относится, в частности, к последовательности на некомплементарной цепи, примыкающей к РАМ (т.е. выше против хода транскрипции или 5' от РАМ). То есть целевая последовательность направляющей РНК относится к последовательности на некомплементарной цепи, соответствующей последовательности, с которой направляющая РНК гибридизуется на комплементарной цепи. Целевая последовательность направляющей РНК эквивалентна нацеленному на ДНК сегменту направляющей РНК, но с тиминами вместо урацилов. В качестве одного примера, целевая последовательность направляющей РНК для фермента Cas9 может относиться к последовательности на некомплементарной цепи, примыкающей к 5'-NGG-3' РАМ. Последовательности распознавания направляющей РНК включают в себя последовательности, к которым предназначено, чтобы направляющая РНК характеризовалась комплементарностью, где гибридизация между комплементарной цепью последовательности распознавания направляющей РНК и нацеленным на ДНК сегментом направляющей РНК способствует образованию комплекса CRISPR. Полная комплементарность не обязательно требуется при условии, что существует достаточная комплементарность, чтобы вызвать гибридизацию и способствовать образованию комплекса CRISPR. Последовательности распознавания направляющей РНК или целевые последовательности направляющей РНК также включают в себя сайты расщепления для белков Cas, более подробно описанные ниже. Последовательность распознавания направляющей РНК или целевая последовательность направляющей РНК могут содержать любой полинуклеотид, который может быть расположен, например, в ядре или цитоплазме клетки или в органелле клетки, такой как митохондрия или хлоропласт.
Последовательность распознавания направляющей РНК в целевой ДНК может быть нацелена (т.е. связана, гибридизована или комплементарна) с Cas-белком или gRNA. Подходящие условия связывания ДНК/РНК включают в себя физиологические условия, как правило, присутствующие в клетке. Другие подходящие условия связывания ДНК/РНК (например, условия в бесклеточной системе) известны (смотрите, например, публикацию Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001), полностью включенную в настоящий документ посредством ссылки для любых целей). Цепь целевой ДНК, которая комплементарна и гибридизуется с белком Cas или gRNA, можно назвать «комплементарной цепью», а цепь целевой ДНК, которая комплементарна «комплементарной цепи» (и, следовательно, не комплементарна белку Cas или gRNA) можно назвать «некомплементарной цепью» или «матричной цепью».
Белок Cas может расщеплять нуклеиновую кислоту в месте внутри или снаружи последовательности нуклеиновой кислоты, присутствующей в целевой ДНК, с которой будет связываться нацеленный на ДНК сегмент gRNA. «Сайт расщепления» включает в себя положение нуклеиновой кислоты, в которой белок Cas вызывает разрыв одной цепи или разрыв двойной цепи. Например, образование комплекса CRISPR (содержащего gRNA, гибридизованную с комплементарной цепью последовательности распознавания направляющей РНК и образовавшей комплекс с белком Cas), может привести к расщеплению одной или обеих цепей в или вблизи (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар нуклеотидов от) последовательности нуклеиновой кислоты, присутствующей в целевой ДНК, с которой будет связываться нацеленный на ДНК сегмент gRNA. Если сайт расщепления находится за пределами последовательности нуклеиновой кислоты, с которой будет связываться нацеленный на ДНК сегмент gRNA, сайт расщепления по-прежнему считается находящимся в «последовательности распознавания направляющей РНК» или целевой последовательности направляющей РНК. Сайт расщепления может находиться только на одной цепи или на обеих цепях нуклеиновой кислоты. Сайты расщепления могут находиться в одном и том же положении на обеих цепях нуклеиновой кислоты (создавая тупые концы) или могут быть в разных сайтах на каждой цепи (производя ступенчатые концы (т.е. выступы)). Ступенчатые концы могут быть получены, например, с использованием двух белков Cas, каждый из которых вызывает разрыв одной цепи в другом сайте расщепления на другой цепи, тем самым создавая разрыв двойной цепи. Например, первая никаза может создавать одноцепочечный разрыв на первой цепи двухцепочечной ДНК (dsDNA), а вторая никаза может создавать одноцепочечный разрыв на второй цепи dsDNA, так что создаются выступающие последовательности. В некоторых случаях последовательность распознавания направляющей РНК или целевая последовательность направляющей РНК никазы на первой цепи отделяется от последовательности распознавания направляющей РНК или целевой последовательности направляющей РНК никазы на второй цепи по меньшей мере на 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 или 1000 пар нуклеотидов.
Сайт-специфическое связывание и/или расщепление целевой ДНК белками Cas может происходить в местах, определяемых как (i) комплементарностью спаривания оснований между gRNA и целевой ДНК, так и (ii) коротким мотивом, называемым примыкающим к протоспейсеру мотивом (РАМ), в целевой ДНК. РАМ может фланкировать целевую последовательность направляющей РНК на некомплементарной цепи, противоположной цепи, с которой гибридизуется направляющая РНК. Необязательно, целевая последовательность направляющей РНК может быть фланкирована РАМ на 3'-конце. Альтернативно, целевая последовательность направляющей РНК может быть фланкирована РАМ на 5'-конце. Например, сайт расщепления белков Cas может находиться от приблизительно 1 до приблизительно 10 или от приблизительно 2 до приблизительно 5 пар нуклеотидов (например, 3 пары нуклеотидов) выше против хода транскрипции или ниже по ходу транскрипции от последовательности РАМ. В некоторых случаях (например, когда используется Cas9 из S. pyogenes или близкородственный Cas9), последовательность РАМ некомплементарной цепи может быть 5'-N1GG-3', где N1 представляет собой любой нуклеотид ДНК и расположен непосредственно 3' от последовательности распознавания направляющей РНК некомплементарной цепи целевой ДНК (т.е. непосредственно 3' от целевой последовательности направляющей РНК). Таким образом, последовательность РАМ комплементарной цепи будет представлять собой 5'-CCN2-3', где N2 представляет собой любой нуклеотид ДНК и расположен непосредственно 5' от последовательности распознавания направляющей РНК комплементарной цепи целевой ДНК. В некоторых таких случаях N1 и N2 могут быть комплементарными, и пара нуклеотидов N1-N2 может представлять собой любую пару оснований (например, N1=C и N2=G; N1=G и N2=C; N1=A и N2=T или N1=T и N2=А). В случае Cas9 из S. aureus РАМ может представлять собой NNGRRT или NNGRR, где N может быть A, G, С или Т, a R может быть G или А. В случае Cas9 из С. jejuni РАМ может представлять собой, например, NNNNACAC или NNNNRYAC, где N может быть A, G, С или Т, a R может быть G или А. В некоторых случаях (например, для FnCpf1) последовательность РАМ может находиться выше против хода транскрипции от 5' конца и характеризоваться последовательностью 5'-TTN-3'.
Примеры целевых последовательностей направляющих РНК или целевых последовательностей направляющих РНК в дополнение к последовательности РАМ представлены ниже. Например, целевая последовательность направляющей РНК может представлять собой 20-нуклеотидную последовательность ДНК, непосредственно предшествующую мотиву NGG, распознаваемому белком Cas9. Примерами таких целевых последовательностей направляющей РНК плюс последовательность РАМ являются GN19NGG (SEQ ID NO: 10) или N20NGG (SEQ ID NO: 11). Смотрите, например, публикацию международной заявки WO 2014/165825, полностью включенную в настоящий документ посредством ссылки для всех целей. Гуанин на 5'-конце может способствовать транскрипции РНК-полимеразой в клетках. Другие примеры целевых последовательностей направляющих РНК плюс последовательность РАМ могут включать в себя два гуаниновых нуклеотида на 5'-конце (например, GGN20NGG; SEQ ID NO: 12) для облегчения эффективной транскрипции с помощью Т7-полимеразы in vitro. Смотрите, например, публикацию международной заявки WO 2014/065596, полностью включенную в настоящий документ посредством ссылки для всех целей. Другие целевые последовательности направляющей РНК плюс последовательность РАМ могут составлять от 4 до 22 нуклеотидов в длину SEQ ID NO: 10-12, включая в себя 5' G или GG и 3' GG или NGG. Тем не менее другие целевые последовательности направляющей РНК могут составлять от 14 до 20 нуклеотидов в длину SEQ ID NO: 10-12.
Последовательность распознавания направляющей РНК или целевая последовательность направляющей РНК могут представлять собой любую последовательность нуклеиновой кислоты, эндогенную или экзогенную для клетки. Последовательность распознавания направляющей РНК или целевая последовательность направляющей РНК могут представлять собой последовательность, кодирующую продукт гена (например, белок), или некодирующую последовательность (например, регуляторную последовательность) или могут включать в себя и то и другое.
III. Способы оценки активности CRISPR/Cas In Vivo
Представлены различные способы оценки доставки CRISPR/Cas и оценки активности CRISPR/Cas в тканях и органах живого животного. Такие способы используют отличных от человека животных, содержащих репортер CRISPR, как описано в настоящем документе в другом месте.
А. Способы исследования способности CRISPR/Cas вырезать или разрушать целевую геномную нуклеиновую кислоту in vivo или ex vivo
Представлены различные способы оценки CREPR/Cas-индуцированной активности NHEJ in vivo с использованием отличных от человека животных, содержащих репортер CRISPR, как описано в другом месте настоящего документа. Такие способы могут предусматривать введение отличному от человека животному (i) первой направляющей РНК, предназначенной для нацеливания первой целевой последовательности направляющей РНК в репортере CRISPR; (ii) второй направляющей РНК, предназначенной для нацеливания второй целевой последовательности направляющей РНК в репортере CRISPR; и (iii) белка Cas (например, белка Cas9); и (b) измерение активности или экспрессии по меньшей мере одного из одного или нескольких различных репортерных белков. Необязательно, первая направляющая РНК и вторая направляющая РНК могут быть идентичными, и первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК могут быть идентичными. Альтернативно, первая направляющая РНК и вторая направляющая РНК могут быть разными, и первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК могут быть разными. Активность или экспрессия репортерных белков будет индуцирована, когда первая направляющая РНК образует комплекс с белком Cas и направляет белок Cas к репортеру CRISPR, вторая направляющая РНК образует комплекс с белком Cas и направляет белок Cas к репортеру CRISPR, первый комплекс Cas/направляющая РНК расщепляет первую целевую последовательность направляющей РНК, а второй комплекс Cas/направляющая РНК расщепляет вторую целевую последовательность направляющей РНК, что приводит к вырезанию сигнала полиаденилирования или терминатора транскрипции выше против хода транскрипции от одного или нескольких репортерных белков. Альтернативно, если первая или вторая целевая последовательность направляющей РНК или третья целевая последовательность направляющей РНК находятся в мотиве распознавания поли-А (каноническом гексамере полиаденилирования ААТААА) или вблизи него, может быть введена одиночная направляющая РНК вместо пары из первой и второй направляющих РНК, и одиночная направляющая РНК образуют комплекс с белком Cas и направляет белок Cas к репортеру CRISPR, а комплекс Cas/направляющая РНК расщепляет целевую последовательность направляющей РНК в каноническом гексамере полиаденилирования или вблизи него, что приводит к разрушению канонического гексамера полиаденилирования и, следовательно, нарушению сигнала полиаденилирования или терминатора транскрипции выше против хода транскрипции от одного или нескольких репортерных белков.
Аналогичным образом, представленные выше различные способы оценки активности CRISPR/Cas in vivo также можно использовать для оценки активности CRISPR/Cas ex vivo с использованием клеток, содержащих репортер CRISPR, как описано в другом месте настоящего документа.
Направляющие РНК и белки Cas могут быть введены в клетку или отличное от человека животное любым способом доставки (например, AAV, LNP или HDD) и любым путем введения, как описано в другом месте настоящего документа. В определенных способах направляющая РНК (или направляющие РНК) доставляется посредством опосредованной AAV доставки. Например, AAV8 может использоваться, если мишенью является печень. В одном конкретном примере Cas9, gRNA и необязательно экзогенная донорская нуклеиновая кислота (например, ssODN) доставляются через AAV8, как описано в другом месте настоящего документа. В другом конкретном примере mRNA и gRNA Cas9 (в форме РНК) и необязательно экзогенная донорская нуклеиновая кислота доставляются через LNP, как описано в другом месте настоящего документа.
Способы оценки модификации целевого геномного локуса представлены в другом месте настоящего документа и хорошо известны. Оценка модификации целевого геномного локуса может быть в любом типе клеток, любом типе ткани или любом типе органа, как раскрыто в другом месте настоящего документа. В некоторых способах модификация целевого геномного локуса оценивается в клетках печени.
В. Способы оптимизации способности CRISPR/Cas вырезать целевую геномную нуклеиновую кислоту in vivo или ex vivo
Представлены различные способы оптимизации доставки CRISPR/Cas в клетку или отличное от человека животное или оптимизации индуцированной CRISPR/Cas активности NHEJ in vivo или ex vivo. Такие способы могут предусматривать, например: (а) выполнение способа исследования способности CRISPR/Cas вырезать сигнал полиаденилирования или терминатор транскрипции в репортере CRISPR, как описано в другом месте настоящего документа, в первый раз у первого отличного от человека животного; (b) изменение переменной и выполнение способа во второй раз с измененной переменной у второго отличного от человека животного (т.е. того же вида) и (с) сравнение активности или экспрессии по меньшей мере одного из одного или нескольких репортерных белков на стадии (а) с активностью или экспрессией по меньшей мере одного из одного или нескольких разных белков на стадии (b) и выбор способа, приводящего к более высокой активности или экспрессии по меньшей мере одного из одного или нескольких различных репортерных белков (т.е. способа, приводящего к более высокой эффективности).
Альтернативно, способ, выбранный на стадии (с), может представлять собой способ, приводящий к нацеленной модификации репортера CRISPR или повышенной активности или экспрессии по меньшей мере одного из одного или нескольких различных репортерных белков с более высокой эффективностью, более высокой точностью, более высокой стабильностью или более высокой специфичностью. Более высокая эффективность относится к более высоким уровням модификации целевого локуса в репортере CRISPR (например, более высокий процент клеток нацелен в конкретном типе целевых клеток, в конкретной целевой ткани или в конкретном целевом органе). Более высокая точность относится к более точной модификации целевого локуса в репортере CRISPR (например, более высокий процент нацеленных клеток, характеризующихся такой же модификацией или характеризующихся желаемой модификацией без дополнительных непреднамеренных вставок и делеций (например, вставки/делеции NHEJ)). Более высокая стабильность означает более стабильную модификацию целевого локуса в репортере CRISPR среди различных типов нацеленных клеток, тканей или органов, если нацеленно воздействуют на более чем один тип клеток, тканей или органов (например, модификация большего числа типов клеток в целевом органе). Если нацеленно воздействуют на конкретный орган, более высокая стабильность может также относиться к более стабильной модификации во всех местоположениях внутри органа. Более высокая специфичность может относиться к более высокой специфичности в отношении нацеленного локуса в репортере CRISPR, более высокой специфичности в отношении нацеленного типа клеток, более высокой специфичности в отношении нацеленного типа ткани или более высокой специфичности в отношении нацеленного органа. Например, повышенная специфичность локуса относится к меньшей модификации нецелевых геномных локусов (например, более низкий процент нацеленных клеток, характеризующихся модификациями в непреднамеренных, нецелевых геномных локусах вместо или в дополнение к модификации целевого локуса в репортере CRISPR). Аналогично, повышенная специфичность к типу клеток, ткани или типу органа относится к меньшей модификации нецелевых типов клеток, типов тканей или типов органов, если нацеленно воздействуют на конкретный тип клеток, тип ткани или тип органа (например, когда нацеленно воздействуют на конкретный целевой орган (например, печень), наблюдается меньше модификаций клеток в органах или тканях, которые не являются мишенями).
Переменная, которая изменяется, может представлять собой любой параметр. В качестве одного примера, измененная переменная может представлять собой упаковку или способ доставки, с помощью которого одна или несколько или все из направляющих РНК и белка Cas вводятся в клетку или отличное от человека животное. Примеры способов доставки, такие как LNP, HDD и AAV, раскрыты в настоящем документе в другом месте. В качестве другого примера, измененная переменная может представлять собой путь введения для введения одной или нескольких или всех направляющих РНК и белка Cas отличному от человека животному. Примеры путей введения, таких как внутривенное, интравитреальное, интрапаренхимальное введение и назальная инсталляция, раскрыты в другом месте настоящего документа.
В качестве другого примера, измененная переменная может представлять собой концентрацию или количество одной или нескольких или всех введенных направляющих РНК и введенного белка Cas. В качестве другого примера, измененная переменная может представлять собой концентрацию или количество введенных направляющих РНК относительно концентрации или количества введенного белка Cas.
В качестве другого примера измененная переменная может представлять собой время введения одной или нескольких или всех из направляющих РНК и белка Cas относительно времени измерения экспрессии или активности одного или нескольких репортерных белков. В качестве другого примера, измененная переменная может представлять собой число раз или частоту, с которой вводится одна или несколько или все из направляющих РНК и белка Cas. В качестве другого примера, измененная переменная может представлять собой время введения направляющих РНК относительно времени введения белка Cas.
В качестве другого примера, измененная переменная может представлять собой форму, в которой вводится одна или несколько или все из направляющих РНК и белка Cas. Например, направляющие РНК могут быть введены в форме ДНК или в форме РНК. Белок Cas может быть введен в форме ДНК, РНК или белка. Точно так же каждый из компонентов может содержать различные комбинации модификаций для стабильности, для уменьшения нецелевых эффектов, для облегчения доставки и так далее. В качестве другого примера, измененная переменная может представлять собой одну или несколько или все из введенных направляющих РНК (например, введение другой направляющей РНК с другой последовательностью) и введенного белка Cas (например, введение другого белка Cas с другой последовательностью или нуклеиновой кислоты с другой последовательностью, но кодирующей ту же аминокислотную последовательность белка Cas).
С. Способы исследования способности CRISPR/Cas индуцировать рекомбинацию целевой геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo или ex vivo
Для оценки индуцированной CRISPR/Cas активности рекомбинации in vivo предусмотрены различные способы с использованием отличных от человека животных, содержащих репортер CRISPR, как описано в другом месте настоящего документа. Если репортер CRISPR представляет собой репортер CRISPR, содержащий сигнал полиаденилирования выше против хода транскрипции от кодирующих последовательностей для репортерного белка(ов), возможно, сигнал полиаденилирования был удален посредством опосредованного CRISPR/Cas вырезания или опосредованного рекомбиназой вырезания. Такие способы могут предусматривать введение отличному от человека животному: (i) направляющей РНК, предназначенной для нацеливания целевой последовательности направляющей РНК в репортере CRISPR; (ii) белка Cas (например, белка Cas9) и (iii) экзогенной донорской нуклеиновой кислоты, способной рекомбинировать с репортером CRISPR и изменять кодирующую последовательность для репортерного белка внутри репортера CRISPR в кодирующую последовательность для другого репортерного белка; и (b) измерение активности или экспрессии другого репортерного белка. Целевая последовательность направляющей РНК может находиться, например, в кодирующей последовательности модифицируемого репортерного белка. Необязательно, белок Cas может быть связан с экзогенной донорской нуклеиновой кислотой, как описано в другом месте настоящего документа. Активность или экспрессия репортерных белков будет индуцирована, когда направляющая РНК образует комплекс с белком Cas и направляет белок Cas к репортеру CRISPR, комплекс Cas/направляющая РНК расщепляет целевую последовательность направляющей РНК, а репортер CRISPR рекомбинирует с экзогенной донорской нуклеиновой кислотой для преобразования кодирующей последовательности для репортерного белка в репортере CRISPR в кодирующую последовательность для другого репортерного белка. Экзогенная донорская нуклеиновая кислота может рекомбинировать с репортером CRISPR, например, посредством направляемой гомологией репарации (HDR) или посредством NHEJ-опосредованной вставки. Можно использовать любой тип экзогенной донорской нуклеиновой кислоты, примеры которой приведены в другом месте в настоящем документе.
Аналогичным образом, различные способы, представленные выше для оценки активности CRISPR/Cas in vivo, также можно использовать для оценки активности CRISPR/Cas ex vivo с использованием клеток, содержащих репортер CRISPR, как описано в другом месте настоящего документа.
В одном примере репортерный белок представляет собой BFP или eBFP, а экзогенная донорская нуклеиновая кислота содержит мутации для превращения кодирующей последовательности BFP или eBFP в кодирующую последовательность GFP или eGFP путем изменения одного кодона. Иллюстративная направляющая РНК, нацеленная на эту область кодирующей последовательности BFP или eBFP, содержит последовательность нацеливания, представленную в SEQ ID NO: 42. Последовательность для иллюстративной экзогенной донорской нуклеиновой кислоты представлена в SEQ ID NO: 15 или SEQ ID NO: 16. В другом примере репортерный белок представляет собой GFP или eGFP, а экзогенная донорская нуклеиновая кислота содержит мутации для преобразования кодирующей последовательности GFP или eGFP в кодирующую последовательность BFP или eBFP путем изменения одного кодона.
Направляющие РНК, Cas-белки и экзогенные донорские нуклеиновые кислоты могут быть введены в клетку или отличное от человека животное любым способом доставки (например, AAV, LNP или HDD) и любым путем введения, как описано в другом месте настоящего документа. В определенных способах направляющая РНК (или направляющие РНК) доставляется посредством AAV-опосредованной доставки. Например, AAV8 может использоваться, если нацеленно воздействуют на печень.
Способы оценки модификации целевого геномного локуса представлены в другом месте настоящего документа и хорошо известны. Оценка модификации целевого геномного локуса может быть в любом типе клеток, любом типе ткани или любом типе органа, как раскрыто в другом месте в настоящем документе. В некоторых способах модификация целевого геномного локуса оценивается в клетках печени.
(1) Экзогенные донорские нуклеиновые кислоты
Раскрытые в настоящем документе способы и композиции используют экзогенные донорские нуклеиновые кислоты для модификации репортера CRISPR (т.е. целевого геномного локуса) после расщепления репортера CRISPR белком Cas. В таких способах белок Cas расщепляет репортер CRISPR для создания одноцепочечного разрыва (nick) или двухцепочечного разрыва, а экзогенная донорская нуклеиновая кислота рекомбинирует целевую нуклеиновую кислоту посредством опосредованного негомологичным соединением концов (NHEJ) лигирования или через событие направляемой гомологией репарации. Необязательно, репарация с использованием экзогенной донорской нуклеиновой кислоты удаляет или нарушает целевую последовательность направляющей РНК или сайт расщепления Cas, так что на целевые аллели нельзя повторно нацеленно воздействовать белком Cas.
Экзогенные донорские нуклеиновые кислоты могут содержать дезоксирибонуклеиновую кислоту (ДНК) или рибонуклеиновую кислоту (РНК), они могут быть одноцепочечными или двухцепочечными, и они могут быть в линейной или круглой форме. Например, экзогенная донорская нуклеиновая кислота может представлять собой одноцепочечный олигодезоксинуклеотид (ssODN). Смотрите, например, публикацию Yoshimi et al. (2016) Nat. Commun. 7:10431, полностью включенную в настоящий документ посредством ссылки для всех целей. Иллюстративная экзогенная донорская нуклеиновая кислота составляет в длину от приблизительно 50 нуклеотидов до приблизительно 5 т.п.н., от приблизительно 50 нуклеотидов до приблизительно 3 т.п.н. или от приблизительно 50 до приблизительно 1000 нуклеотидов. Другие иллюстративные экзогенные донорские нуклеиновые кислоты составляют в длину от приблизительно 40 до приблизительно 200 нуклеотидов. Например, экзогенная донорская нуклеиновая кислота может составлять в длину приблизительно 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190 или 190-200 нуклеотидов. Альтернативно, экзогенная донорская нуклеиновая кислота может составлять в длину приблизительно 50-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900 или 900-1000 нуклеотидов. Альтернативно, длина экзогенной донорской нуклеиновой кислоты может составлять приблизительно 1-1,5, 1,5-2, 2-2,5, 2,5-3, 3-3,5, 3,5-4, 4-4,5 или 4,5-5 т.п.н. Альтернативно, экзогенная донорская нуклеиновая кислота может составлять, например, не более чем 5 т.п.н., 4,5 т.п.н., 4 т.п.н., 3,5 т.п.н., 3 т.п.н., 2,5 т.п.н., 2 т.п.н., 1,5 т.п.н., 1 т.п.н., 900 нуклеотидов, 800 нуклеотидов, 700 нуклеотидов, 600 нуклеотидов, 500 нуклеотидов, 400 нуклеотидов, 300 нуклеотидов, 200 нуклеотидов, 100 нуклеотидов или 50 нуклеотидов в длину. Экзогенные донорские нуклеиновые кислоты (например, нацеливающие векторы) также могут быть длиннее.
В одном примере экзогенная донорская нуклеиновая кислота представляет собой ssODN, длина которого составляет от приблизительно 80 нуклеотидов до приблизительно 200 нуклеотидов. В другом примере экзогенная донорская нуклеиновая кислота представляет собой ssODN, длина которого составляет от приблизительно 80 нуклеотидов до приблизительно 3 т.п.н. Такой ssODN может содержать, например, плечи гомологии, каждое из которых составляет в длину от приблизительно 40 нуклеотидов до приблизительно 60 нуклеотидов. Такой ssODN может также содержать плечи гомологии, например, каждое из которых составляет в длину приблизительно от 30 до 100 нуклеотидов. Плечи гомологии могут быть симметричными (например, каждое 40 нуклеотидов или каждое 60 нуклеотидов в длину), или они могут быть асимметричными (например, одно плечо гомологии, которое составляет в длину 36 нуклеотидов, и одно плечо гомологии, которое составляет в длину 91 нуклеотид).
Экзогенные донорские нуклеиновые кислоты могут включать в себя модификации или последовательности, которые обеспечивают дополнительные желательные признаки (например, модифицированную или регулируемую стабильность; отслеживание или обнаружение с помощью флуоресцентной метки; сайт связывания для белка или белкового комплекса и т.д.). Экзогенные донорские нуклеиновые кислоты могут содержать одну или несколько флуоресцентных меток, тэгов для очистки, тэгов эпитопов или их комбинации. Например, экзогенная донорская нуклеиновая кислота может содержать одну или несколько флуоресцентных меток (например, флуоресцентных белков или других флуорофоров или красителей), таких как по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4 или по меньшей мере 5 флуоресцентных меток. Иллюстративные флуоресцентные метки включают в себя флуорофоры, такие как флуоресцеин (например, 6-карбоксифлуоресцеин (6-FAM)), Texas Red, HEX, Су3, Су5, Су5.5, Pacific Blue, 5-(и-6)-карбокситетраметилродамин (TAMRA) и Су7. Широкий ассортимент флуоресцентных красителей коммерчески доступен для мечения олигонуклеотидов (например, от Integrated DNA Technologies). Такие флуоресцентные метки (например, внутренние флуоресцентные метки) можно использовать, например, для обнаружения экзогенной донорской нуклеиновой кислоты, которая непосредственно интегрирована в расщепленную целевую нуклеиновую кислоту, имеющую выступающие концы, совместимые с концами экзогенной донорской нуклеиновой кислоты. Метка или тэг могут находиться на 5'-конце, 3'-конце или внутри экзогенной донорской нуклеиновой кислоты. Например, экзогенная донорская нуклеиновая кислота может быть конъюгирована на 5'-конце с флуорофором IR700 от Integrated DNA Technologies (5'IRDYE®700).
Экзогенные донорские нуклеиновые кислоты также могут содержать вставки нуклеиновых кислот, включающие в себя сегменты ДНК, которые должны быть интегрированы в целевые геномные локусы. Интеграция вставки нуклеиновой кислоты в целевой геномный локус может привести к добавлению представляющей интерес последовательности нуклеиновой кислоты к целевому геномному локусу, делеций представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе или замещению представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе (т.е. делеция и вставка). Некоторые экзогенные донорские нуклеиновые кислоты предназначены для введения вставки нуклеиновой кислоты в целевой геномный локус без какой-либо соответствующей делеций в целевом геномном локусе. Другие экзогенные донорские нуклеиновые кислоты предназначены для удаления представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе без какой-либо соответствующего введения вставки нуклеиновой кислоты. Тем не менее другие экзогенные донорские нуклеиновые кислоты предназначены для удаления представляющей интерес последовательности нуклеиновой кислоты в целевом геномном локусе и замещения ее вставкой нуклеиновой кислоты.
Вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в целевом геномном локусе, которые удаляются и/или замещаются, могут характеризоваться различной длиной. Иллюстративная вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в целевом геномном локусе, который удаляется и/или замещается, составляет в длину от приблизительно 1 нуклеотида до приблизительно 5 т.п.н. или от приблизительно 1 нуклеотида до приблизительно 1000 нуклеотидов. Например, вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в целевом геномном локусе, который удаляется и/или замещается, может составлять приблизительно 1-10, 10-20, 20-30, 30-40, 40-50, 50-60 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190 или 190-120 нуклеотидов в длину. Аналогично, вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в целевом геномном локусе, который удаляется и/или замещается, может находиться в пределах 1-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900 или 900-1000 нуклеотидов в длину. Аналогично, вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в целевом геномном локусе, который удаляется и/или замещается, может находиться в пределах приблизительно 1-1,5, 1,5-2, 2-2,5, 2,5-3, 3-3,5, 3,5-4, 4-4,5 или 4,5-5 т.п.н. в длину или более.
Вставка нуклеиновой кислоты может содержать последовательность, которая гомологична или ортологична всей или части последовательности, нацеленной на замещение. Например, вставка нуклеиновой кислоты может содержать последовательность, которая содержит одну или несколько точечных мутаций (например, 1, 2, 3, 4, 5 или более) по сравнению с последовательностью, предназначенной для замены в целевом геномном локусе. Необязательно, такие точечные мутации могут приводить к консервативной аминокислотной замене (например, замене аспарагиновой кислоты [Asp, D] глутаминовой кислотой [Glu, Е]) в кодируемом полипептиде.
(2) Донорские нуклеиновые кислоты для опосредованной негомологичным соединением концов вставки
Некоторые экзогенные донорские нуклеиновые кислоты содержат короткие одноцепочечные области на 5'-конце и/или 3'-конце, которые комплементарны одному или нескольким выступам, создаваемым опосредованным Cas-белком расщеплением в целевом геномном локусе. Эти выступы также могут называться 5' и 3' плечами гомологии. Например, некоторые экзогенные донорские нуклеиновые кислоты содержат короткие одноцепочечные области на 5' конце и/или 3' конце, которые комплементарны одному или нескольким выступам, создаваемым опосредованным Cas-белком расщеплением на 5' и/или 3' целевых последовательностях в целевом геномном локусе. Некоторые такие экзогенные донорские нуклеиновые кислоты содержат комплементарную область только на 5' конце или только на 3' конце. Например, некоторые такие экзогенные донорские нуклеиновые кислоты содержат комплементарную область только на 5'-конце, комплементарном выступу, созданному на 5' целевой последовательности в целевом геномном локусе, или только на 3'-конце, комплементарном выступу, созданному на 3' целевой последовательность в целевом геномном локусе. Другие такие экзогенные донорские нуклеиновые кислоты содержат комплементарные области как на 5'- так и на 3'-концах. Например, другие такие экзогенные донорские нуклеиновые кислоты содержат комплементарные области как на 5'-, так и на 3'-концах, например, комплементарные первому и второму выступам, соответственно, производимым Cas-опосредованным расщеплением в целевом геномном локусе. Например, если экзогенная донорская нуклеиновая кислота является двухцепочечной, одноцепочечные комплементарные области могут простираться от 5'-конца верхней цепи донорской нуклеиновой кислоты и 5'-конца нижней цепи донорской нуклеиновой кислоты, создавая 5' выступы на каждом конце. Альтернативно, одноцепочечная комплементарная область может простираться от 3'-конца верхней цепи донорской нуклеиновой кислоты и от 3'-конца нижней цепи матрицы, создавая 3'-выступы.
Комплементарные области могут характеризоваться любой длиной, достаточной для стимулирования лигирования между экзогенной донорской нуклеиновой кислотой и целевой нуклеиновой кислотой. Иллюстративные комплементарные области составляют в длину от приблизительно 1 до приблизительно 5 нуклеотидов, от приблизительно 1 до приблизительно 25 нуклеотидов или от приблизительно 5 до приблизительно 150 нуклеотидов. Например, комплементарная область может составлять в длину по меньшей мере приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 нуклеотидов. Альтернативно, комплементарная область может составлять в длину приблизительно 5-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140 или 140-150 нуклеотидов или более.
Такие комплементарные области могут быть комплементарными выступам, создаваемым двумя парами никаз. Два двухцепочечных разрыва со ступенчатыми концами могут быть созданы с помощью первой и второй никаз, которые расщепляют противоположные цепи ДНК, чтобы создать первый двухцепочечный разрыв, и третьей и четвертой никаз, которые расщепляют противоположные цепи ДНК, чтобы создать второй двухцепочечный разрыв. Например, белок Cas может быть использован для обозначения первой, второй, третьей и четвертой целевых последовательностей направляющих РНК, соответствующих первой, второй, третьей и четвертой направляющим РНК. Первую и вторую целевые последовательности направляющих РНК можно расположить так, чтобы создать первый сайт расщепления так, чтобы одноцепочечные разрывы, созданные первыми и вторыми никазами на первой и второй цепях ДНК, создавали двухцепочечный разрыв (т.е. первый сайт расщепления содержит одноцепочечные разрывы в первой и второй целевых последовательностях направляющих РНК). Аналогично, третья и четвертая целевые последовательности направляющих РНК могут быть расположены для создания второго сайта расщепления, так что одноцепочечные разрывы, созданные третьей и четвертой никазами на первой и второй цепях ДНК, создают двухцепочечный разрыв (т.е. второй сайт расщепления содержит одноцепочечные разрывы в третьей и четвертой целевых последовательностях направляющих РНК). Необязательно, одноцепочечные разрывы в первой и второй целевых последовательностях направляющих РНК и/или в третьей и четвертой целевых последовательностях направляющих РНК могут представлять собой смещенные одноцепочечные разрывы, которые создают выступы. Окно смещения может составлять, например, по меньшей мере приблизительно 5 п.н., 10 п.н., 20 п.н., 30 п.н., 40 п.н., 50 п.н., 60 п.н., 70 п.н., 80 п.н., 90 п.н., 100 п.н. или более. Смотрите публикации Ran et al. (2013) Cell 154:1380-1389; Mali et al. (2013) Nat. Biotech.31:833-838 и Shen et al. (2014) Nat. Methods 11:399-404, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. В таких случаях может быть сконструирована двухцепочечная экзогенная донорская нуклеиновая кислота с одноцепочечными комплементарными областями, которые комплементарны выступам, создаваемым одноцепочечными разрывами в первой и второй целевых последовательностях направляющих РНК, и одноцепочечными разрывами в третьей и четвертой целевых последовательностях направляющих РНК. Такую экзогенную донорскую нуклеиновую кислоту затем можно вставить путем лигирования, опосредованного присоединением не гомологичного конца.
(3) Донорские нуклеиновые кислоты для вставки с помощью направляемой гомологией репарации
Некоторые экзогенные донорские нуклеиновые кислоты содержат плечи гомологии. Если экзогенная донорская нуклеиновая кислота также содержит вставку нуклеиновой кислоты, плечи гомологии могут фланкировать вставку нуклеиновой кислоты. Для простоты ссылки плечи гомологии упоминаются в настоящем документе как 5' и 3' (т.е. выше против хода транскрипции и ниже по ходу транскрипции) плечи гомологии. Эта терминология относится к относительному положению плечей гомологии относительно вставки нуклеиновой кислоты внутри экзогенной донорской нуклеиновой кислоты. 5' и 3' плечи гомологии соответствуют областям в пределах целевого геномного локуса, которые в настоящем документе обозначаются как «5' целевая последовательность» и «3' целевая последовательность», соответственно.
Плечо гомологии и целевая последовательность «соответствуют» или являются «соответствующими» друг другу, когда две области характеризуются достаточным уровнем идентичности последовательности друг с другом, чтобы действовать в качестве субстратов для гомологичной реакции рекомбинации. Термин «гомология» включает в себя последовательности ДНК, которые либо идентичны, либо характеризуются идентичностью последовательности по отношению к соответствующей последовательности. Идентичность последовательности между данной целевой последовательностью и соответствующим плечом гомологии, обнаруженным в экзогенной донорской нуклеиновой кислоте, может представлять собой любую степень идентичности последовательности, которая обеспечивает возможность гомологичной рекомбинации. Например, идентичность последовательности между плечом гомологии экзогенной донорской нуклеиновой кислоты (или ее фрагмента) и целевой последовательностью (или ее фрагментом), может составлять по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности последовательностей, так что последовательности подвергаются гомологичной рекомбинации. Кроме того, соответствующая область гомологии между плечом гомологии и соответствующей целевой последовательностью может характеризоваться любой длиной, достаточной для обеспечения гомологичной рекомбинации. Иллюстративные плечи гомологии составляют в длину от приблизительно 25 нуклеотидов до приблизительно 2,5 т.п.н., от приблизительно 25 нуклеотидов до приблизительно 1,5 т.п.н. или от приблизительно 25 до приблизительно 500 нуклеотидов. Например, данное плечо гомологии (или каждое из плечей гомологии) и/или соответствующая целевая последовательность могут содержать соответствующие области гомологии, которые составляют в длину от 25 до 30, от 30 до 40, от 40 до 50, от 50 до 60, от 60 до 70, от 70 до 80, от 80 до 90, от 90 до 100, от 100 до 150, от 150 до 200, от 200 до 250, от 250 до 300, от 300 до 350, от 350 до 400, от 400 до 450 или от 450 до 500 нуклеотидов, например, плечи гомологии характеризуются достаточной гомологией для того, чтобы подвергаться гомологичной рекомбинации с соответствующими целевыми последовательностями в целевой нуклеиновой кислоте. Альтернативно, данное плечо гомологии (или каждое плечо гомологии) и/или соответствующая целевая последовательность могут содержать соответствующие области гомологии, которые находятся в диапазоне от приблизительно 0,5 до приблизительно 1 т.п.н., от приблизительно 1 до приблизительно 1,5 т.п.н., от приблизительно 1,5 до приблизительно 2 т.п.н. или приблизительно от 2 до 2,5 т.п.н. в длину. Например, каждое из плечей гомологии может составлять в длину приблизительно 750 нуклеотидов. Плечи гомологии могут быть симметричными (каждое приблизительно одинакового размера в длину), или они могут быть асимметричными (одно длиннее другого).
Когда система CRISPR/Cas используется в комбинации с экзогенной донорской нуклеиновой кислотой, 5' и 3' целевые последовательности необязательно расположены в достаточной близости от сайта расщепления Cas (например, в достаточной близости от целевой последовательности направляющей РНК), чтобы способствовать возникновению события гомологичной рекомбинации между целевыми последовательностями и плечами гомологии при одноцепочечном разрыве (nick) или двухцепочечном разрыве в сайте расщепления Cas. Термин «сайт расщепления Cas» включает в себя последовательность ДНК, в которой происходит одноцепочечный разрыв или двухцепочечный разрыв фермента Cas (например, белка Cas9 в комплексе с направляющей РНК). Целевые последовательности в пределах целевого локуса, которые соответствуют 5' и 3' плечам гомологии экзогенной донорской нуклеиновой кислоты, «расположены в достаточной близости» к сайту расщепления Cas, если расстояние такое, чтобы способствовать возникновению события гомологичной рекомбинации между 5' и 3' целевыми последовательностями и плечами гомологии при одноцепочечном разрыве или двухцепочечном разрыве в месте расщепления Cas. Таким образом, целевые последовательности, соответствующие 5' и/или 3' плечам гомологии экзогенной донорской нуклеиновой кислоты, могут находиться, например, в пределах по меньшей мере 1 нуклеотида от данного сайта расщепления Cas или в пределах по меньшей мере от 10 нуклеотидов до приблизительно 1000 нуклеотидов от данного сайта расщепления Cas. В качестве примера, сайт расщепления Cas может непосредственно примыкать по меньшей мере к одной или обеим целевым последовательностям.
Пространственные отношения целевых последовательностей, которые соответствуют плечам гомологии экзогенной донорской нуклеиновой кислоты и сайта расщепления Cas, могут варьировать. Например, целевые последовательности могут быть расположены 5' от сайта расщепления Cas, целевые последовательности могут быть расположены 3' от сайта расщепления Cas или целевые последовательности могут фланкировать сайт расщепления Cas.
D. Способы оптимизации способности CRISPR/Cas индуцировать рекомбинацию целевой геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo или ex vivo
Представлены различные способы оптимизации доставки CRISPR/Cas к клетке или отличному от человека животному или оптимизации индуцированной CRISPR/Cas активности рекомбинации in vivo или ex vivo. Такие способы могут предусматривать, например: (а) выполнение способа исследования индуцированной CRISPR/Cas рекомбинации целевого геномного локуса с экзогенной донорской нуклеиновой кислотой, как описано в другом месте настоящего документа, в первый раз у первого отличного от человека животного; (b) изменение переменной и выполнение способа во второй раз с измененной переменной у второго отличного от человека животного (т.е. того же вида) и (с) сравнение активности или экспрессии репортерного белка на стадии (а) с активностью или экспрессией репортерного белка на стадии (b) и выбор способа, приводящего к более высокой активности или экспрессии репортерного белка (т.е. выбор способа, который приводит к повышению эффективности).
Альтернативно, способ, выбранный на стадии (с), может представлять собой способ, приводящий к целевой модификации репортера CRISPR или повышенной активности или экспрессии репортерного белка с более высокой эффективностью, более высокой точностью, более высокой стабильностью или более высокой специфичностью. Более высокая эффективность относится к более высоким уровням модификации целевого локуса в репортере CRISPR (например, на более высокий процент клеток нацеленно воздействуют в конкретном типе целевых клеток, в конкретной целевой ткани или в конкретном целевом органе). Более высокая точность относится к более точной модификации целевого локуса в репортере CRISPR (например, более высокий процент нацеленных клеток, характеризующихся такой же модификацией или имеющих желаемую модификацию без дополнительных непреднамеренных вставок и делеций (например, вставки/делеции NHEJ)). Более высокая стабильность означает более стабильную модификацию целевого локуса в репортере CRISPR среди различных типов нацеленных клеток, тканей или органов, если нацеленно воздействуют на более чем один тип клеток, тканей или органов (например, модификация большего числа типов клеток в целевом органе). Если нацеленно воздействуют на конкретный орган, более высокая стабильность может также относиться к более стабильной модификации во всех местах внутри органа. Более высокая специфичность может относиться к более высокой специфичности в отношении нацеленного локуса в репортере CRISPR, более высокой специфичности в отношении нацеленного типа клеток, более высокой специфичности в отношении нацеленного типа ткани или более высокой специфичности в отношении нацеленного органа. Например, повышенная специфичность локуса относится к меньшей модификации нецелевых геномных локусов (например, более низкий процент нацеленных клеток, имеющих модификации в непреднамеренных, нецелевых геномных локусах вместо или в дополнение к модификации целевого локуса в репортере CRISPR). Аналогично, повышенная специфичность к типу клеток, ткани или типу органа относится к меньшей модификации нецелевых типов клеток, типов тканей или типов органов, если нацеленно воздействуют на конкретный тип клеток, тип ткани или тип органа (например, когда нацеленно воздействуют на конкретный орган (например, печень), в органах или тканях меньше модификаций клеток, которые не являются мишенями).
Переменная, которая изменяется, может представлять собой любой параметр. В качестве одного примера, измененная переменная может представлять собой упаковку или способ доставки, с помощью которого одну или несколько или все из направляющей РНК, экзогенной донорской нуклеиновой кислоты и белка Cas вводят в клетку или отличное от человека животное. Примеры способов доставки, таких как LNP, HDD и AAV, раскрыты в настоящем документе в другом месте. В качестве другого примера измененная переменная может представлять собой путь введения для введения одной или нескольких или всех из направляющей РНК, экзогенной донорской нуклеиновой кислоты и белка Cas отличному от человека животному. Примеры способов введения, таких как внутривенная, интравитреальная, интрапаренхимальная и назальная инстилляция, раскрыты в другом месте настоящего документа.
В качестве другого примера, измененная переменная может представлять собой концентрацию или количество одного или нескольких или всех из введенной направляющей РНК, введенного белка Cas и введенной экзогенной донорской нуклеиновой кислоты. В качестве другого примера, измененная переменная может представлять собой концентрацию или количество введенной направляющей РНК по отношению к концентрации или количеству введенного белка Cas, концентрацию или количество введенной направляющей РНК по отношению к концентрации или количеству введенной экзогенной донорской нуклеиновой кислоты или концентрацию или количество введенной экзогенной донорской нуклеиновой кислоты по отношению к концентрации или количеству введенного белка Cas.
В качестве другого примера, измененная переменная может представлять собой время введения одного или нескольких или всех из направляющей РНК, экзогенной донорской нуклеиновой кислоты и белка Cas относительно времени измерения экспрессии или активности одного или нескольких репортерных белков. В качестве другого примера, измененная переменная может представлять собой число раз или частоту, с которой вводится одно или несколько или все из направляющей РНК, экзогенной донорской нуклеиновой кислоты и белка Cas. В качестве другого примера измененная переменная может представлять собой время введения направляющей РНК относительно времени введения белка Cas, время введения направляющей РНК относительно времени введения экзогенной донорской нуклеиновой кислоты или время введения экзогенной донорской нуклеиновой кислоты относительно времени введения белка Cas.
В качестве другого примера, измененная переменная может представлять собой форму, в которой вводится одно или несколько или все из направляющей РНК, экзогенной донорской нуклеиновой кислоты и белка Cas. Например, направляющая РНК может быть введена в форме ДНК или в форме РНК. Белок Cas может быть введен в форме ДНК, РНК или белка. Экзогенная донорская нуклеиновая кислота может представлять собой ДНК, РНК, быть одноцепочечной, двухцепочечной, линейной, круговой и так далее. Точно так же каждый из компонентов может содержать различные комбинации модификаций для стабильности, для уменьшения нецелевых эффектов, для облегчения доставки и так далее. В качестве другого примера, измененная переменная может представлять собой одно или несколько или все из введенной направляющей РНК (например, путем введения другой направляющей РНК с другой последовательностью), введенной экзогенной донорской нуклеиновой кислотой (например, путем введения другой экзогенной донорской нуклеиновой кислоты с другой последовательностью) и введенного белка Cas (например, путем введения другого белка Cas с другой последовательностью или нуклеиновой кислоты с другой последовательностью, но кодирующей ту же аминокислотную последовательность белка Cas).
Е. Введение направляющих РНК и белков Cas в клетки и отличным от человека животным
Раскрытые в настоящем документе способы предусматривают введение в клетку или отличное от человека животное одного или нескольких или всех из направляющих РНК, экзогенных донорских нуклеиновых кислот и белков Cas. «Введение» предусматривает презентацию клетке или отличному от человека животному нуклеиновой кислоты или белка таким образом, что нуклеиновая кислота или белок получают доступ к внутренней части клетки или к внутренней части клеток отличного от человека животного. Введение может быть выполнено любыми способами, и два или более компонентов (например, два компонента или все компоненты) могут быть введены в клетку или отличное от человека животное одновременно или последовательно в любой комбинации. Например, белок Cas может быть введен в клетку или отличное от человека животное перед введением направляющей РНК или он может быть введен после введения направляющей РНК. В качестве другого примера, экзогенная донорская нуклеиновая кислота может быть введена до введения белка Cas и направляющей РНК или она может быть введена после введения белка Cas и направляющей РНК (например, экзогенная донорская нуклеиновая кислота может быть введена приблизительно за 1, 2, 3, 4, 8, 12, 24, 36, 48 или 72 часа до или после введения белка Cas и направляющей РНК). Смотрите, например, US 2015/0240263 и US 2015/0110762, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. Кроме того, два или более компонентов могут быть введены в клетку или отличное от человека животное одним и тем же способом доставки или разными способами доставки. Аналогично, два или более компонентов могут быть введены отличному от человека животному одним и тем же путем введения или различными путями введения.
Направляющую РНК можно вводить в клетку в форме РНК (например, транскрибированной РНК in vitro) или в форме ДНК, кодирующей направляющую РНК. При введении в форме ДНК кодирующая направляющую РНК ДНК может быть функционально связана с активным в клетке промотором. Например, направляющая РНК может доставляться через AAV и экспрессироваться in vivo под промотором U6. Такие ДНК могут находиться в одной или нескольких экспрессионных конструкциях. Например, такие экспрессионные конструкции могут представлять собой компоненты одной молекулы нуклеиновой кислоты. Альтернативно, они могут быть разделены в любой комбинации среди двух или более молекул нуклеиновой кислоты (т.е. ДНК, кодирующие одну или несколько РНК CRISPR, и ДНК, кодирующие одну или несколько tracrRNA, могут быть компонентами отдельных молекул нуклеиновой кислоты).
Аналогично, белки Cas могут быть представлены в любой форме. Например, белок Cas может быть представлен в форме белка, такого как белок Cas, образующий комплекс с gRNA. Альтернативно, белок Cas может быть представлен в форме нуклеиновой кислоты, кодирующей белок Cas, такой как РНК (например, информационной РНК (mRNA)) или ДНК. Необязательно, нуклеиновая кислота, кодирующая белок Cas, может быть оптимизирована по кодонам для эффективной трансляции в белок в конкретной клетке или организме. Например, нуклеиновую кислоту, кодирующую белок Cas, можно модифицировать для замены кодонов, имеющих более высокую частоту использования, в бактериальной клетке, дрожжевой клетке, клетке человека, отличной от человеческой клетке, клетке млекопитающего, клетке грызуна, клетке мыши, клетке крысы или любой другой представляющей интерес клетке-хозяине по сравнению с природной полинуклеотидной последовательностью. Когда нуклеиновую кислоту, кодирующую белок Cas, вводят в клетку, белок Cas может временно, условно или конститутивно экспрессироваться в клетке.
Нуклеиновые кислоты, кодирующие белки Cas или направляющие РНК, могут быть функционально связаны с промотором в экспрессионной конструкции. Экспрессионные конструкции включают в себя любые конструкции нуклеиновых кислот, способные направлять экспрессию гена или другой представляющей интерес последовательности нуклеиновой кислоты (например, гена Cas) и которые могут переносить такую представляющую интерес последовательность нуклеиновой кислоты в целевую клетку. Например, кодирующая белок Cas нуклеиновая кислота может находиться в векторе, содержащем ДНК, кодирующую одну или несколько gRNA. Альтернативно, это может быть вектор или плазмида, которая отделена от вектора, содержащего ДНК, кодирующую одну или несколько gRNA. Подходящие промоторы, которые можно использовать в экспрессионной конструкции, включают в себя промоторы, активные, например, в одной или нескольких клетках эукариот, клетке человека, отличной от человеческой клетке, клетке млекопитающего, клетке отличного от человека млекопитающего, клетке грызуна, клетке мыши, клетке крысы, клетке хомячка, клетке кролика, плюрипотентной клетке, эмбриональной стволовой (ES) клетке, взрослой стволовой клетке, ограниченной в развитии клетке-предшественнике, индуцированной плюрипотентной стволовой клетке (iPS) или одноклеточном эмбрионе. Такими промоторами могут быть, например, условные промоторы, индуцибельные промоторы, конститутивные промоторы или тканеспецифические промоторы. Необязательно, промотор может представлять собой двунаправленный промотор, управляющий экспрессией как белка Cas в одном направлении, так и направляющей РНК в другом направлении. Такие двунаправленные промоторы могут состоять из (1) полного традиционного однонаправленного промотора Pol III, который содержит 3 внешних элемента управления: элемент дистальной последовательности (DSE), элемент проксимальной последовательности (PSE) и блок ТАТА; и (2) второго основного промотора Pol III, который включает в себя PSE и блок ТАТА, слитый с 5'-концом DSE в обратной ориентации. Например, в промоторе H1 DSE примыкает к PSE и блоку ТАТА, и промотор можно сделать двунаправленным, создав гибридный промотор, в котором транскрипция в обратном направлении контролируется путем добавления блока PSE и ТАТА, полученного из промотора U6. Смотрите, например, US 2016/0074535, полностью включенный в настоящем документе посредством ссылки для всех целей. Использование двунаправленного промотора для экспрессии генов, кодирующих белок Cas и направляющую РНК одновременно, позволяет создавать компактные экспрессионные кассеты для облегчения доставки.
Экзогенные донорские нуклеиновые кислоты, направляющие РНК и белки Cas (или нуклеиновые кислоты, кодирующие направляющие РНК или белки Cas) могут быть представлены в композициях, содержащих носитель, повышающий стабильность экзогенной донорской нуклеиновой кислоты, направляющей РНК или белка Cas (например, продление периода при данных условиях хранения (например, температуре -20°С, 4°С или температуре окружающей среды), для которых продукты разложения остаются ниже порогового значения, такого как ниже 0,5% по массе исходной нуклеиновой кислоты или белка, или повышение стабильности in vivo). Неограничивающие примеры таких носителей включают в себя микросферы из поли(молочной кислоты) (PLA), микросферы из сополимера D,L-молочной и гликолевой кислот (PLGA), липосомы, мицеллы, обратные мицеллы, липидные кохлеаты и липидные микротрубочки.
В настоящем документе представлены различные способы и композиции, позволяющие вводить нуклеиновую кислоту или белок в клетку или отличное от человека животное. Способы введения нуклеиновых кислот в клетки различных типов известны в настоящей области техники и включают в себя, например, способы стабильной трансфекции, способы временной трансфекции и опосредованные вирусом способы.
Протоколы трансфекции, а также протоколы для введения последовательностей нуклеиновых кислот в клетки могут варьировать. Неограничивающие способы трансфекции включают в себя химические способы трансфекции с использованием липосом; наночастиц; фосфата кальция (Graham et al. (1973) Virology 52 (2): 456-67, Bacchetti et al. (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590-4 и Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company, pp. 96-97); дендримеров или катионных полимеров, таких как DEAE-декстран или полиэтиленимин. Нехимические способы включают в себя электропорацию, сонопорацию и оптическую трансфекцию. Трансфекция на основе частиц включает в себя использование генной пушки или магнитной трансфекции (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277 28). Вирусные способы также могут быть использованы для трансфекции.
Введение нуклеиновых кислот или белков в клетку также может быть опосредовано электропорацией, внутрицитоплазматической инъекцией, вирусной инфекцией, аденовирусом, аденоассоциированным вирусом, лентивирусом, ретровирусом, трансфекцией, липид-опосредованной трансфекцией или нуклеофекцией. Нуклеофекция представляет собой усовершенствованную технологию электропорации, которая позволяет доставлять субстраты нуклеиновых кислот не только в цитоплазму, но также через ядерную мембрану и в ядро. Кроме того, использование нуклеофекции в раскрытых в настоящем документе способах, как правило, требует гораздо меньше клеток, чем обычная электропорация (например, только приблизительно 2 миллиона по сравнению с 7 миллионами при обычной электропорации). В одном примере нуклеофекция выполняется с использованием системы LONZA® NUCLEOFECTOR™.
Введение нуклеиновых кислот или белков в клетку (например, зиготу) также может быть достигнуто путем микроинъекции. В зиготах (т.е. эмбрионах одноклеточной стадии) микроинъекция может осуществляться в пронуклеус матери и/или отца или в цитоплазму. Если микроинъекция происходит только в один пронуклеус, отцовский пронуклеус предпочтительнее из-за его большего размера. Микроинъекция mRNA предпочтительно осуществляется в цитоплазму (например, для доставки mRNA непосредственно в механизм трансляции), тогда как микроинъекция белка Cas или полинуклеотида, кодирующего белок Cas или кодирующего РНК, является предпочтительной в ядро/пронуклеус. Альтернативно, микроинъекция может быть осуществлена путем инъекции как в ядро/пронуклеус, так и в цитоплазму: сначала можно ввести иглу в ядро/пронуклеус, и можно ввести первое количество, и при удалении иглы из одноклеточной стадии зародыша второе количество может быть введено в цитоплазму. Если белок Cas вводится в цитоплазму, белок Cas необязательно содержит сигнал ядерной локализации для обеспечения доставки в ядро/пронуклеус. Способы проведения микроинъекции хорошо известны. Смотрите, например, Nagy et al. (Nagy A., Gertsenstein M., Vintersten K., Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); смотрите также Meyer et al. (2010) Proc. Natl. Acad. Sci. USA 107:15022-15026 и Meyer et al. (2012) Proc. Natl. Acad. Sci. USA 109:9354-9359.
Другие способы введения нуклеиновой кислоты или белков в клетку или отличное от человека животное могут предусматривать, например, векторную доставку, опосредованную частицами доставку, опосредованную экзосомами доставку, опосредованную липидными наночастицами доставку, опосредованную проникающим в клетку пептидом доставку или опосредованную имплантируемым устройством доставку. В качестве конкретных примеров, нуклеиновую кислоту или белок можно вводить в клетку или отличное от человека животное в носителе, таком как микросфера полимолочной кислоты (PLA), микросфера сополимера D,L-молочной и когликолевой кислот (PLGA), липосома, мицелла, обратная мицелла, липидный кохлеат или липидная микротрубочка. Некоторые конкретные примеры доставки отличному от человека животному включают в себя гидродинамическую доставку, опосредованную вирусом доставку (например, опосредованную аденоассоциированным вирусом (AAV) доставку) и опосредованную липидными наночастицами доставку.
Введение нуклеиновых кислот и белков в клетки или отличным от человека животным может быть достигнуто гидродинамической доставкой (HDD). Гидродинамическая доставка появилась как способ внутриклеточной доставки ДНК in vivo. Для доставки генов в паренхиматозные клетки через выбранный кровеносный сосуд необходимо вводить только необходимые последовательности ДНК, что устраняет проблемы безопасности, связанные с современными вирусными и синтетическими векторами. При введении в кровоток ДНК способна достигать клеток в различных тканях, доступных для крови. Гидродинамическая доставка использует силу, создаваемую быстрой инъекцией большого объема раствора в несжимаемую кровь в кровообращении, чтобы преодолеть физические барьеры эндотелия и клеточных мембран, которые препятствуют проникновению крупных и непроницаемых для мембран соединений в паренхиматозные клетки. В дополнение к доставке ДНК этот способ применим для эффективной внутриклеточной доставки РНК, белков и других небольших соединений in vivo. Смотрите, например, публикацию Bonamassa et al. (2011) Pharm. Res. 28(4):694-701, полностью включенную в настоящий документ посредством ссылки для всех целей.
Введение нуклеиновых кислот также может быть достигнуто путем опосредованной вирусом доставки, такой как опосредованная AAV доставка или опосредованная лентивирусом доставка. Другие иллюстративные вирусы/вирусные векторы включают в себя ретровирусы, аденовирусы, вирусы коровьей оспы, поксвирусы и вирусы простого герпеса. Вирусы могут инфицировать делящиеся клетки, неделящиеся клетки или как делящиеся, так и неделящиеся клетки. Такие вирусы также могут быть разработаны для снижения иммунитета. Вирусы могут быть способными к репликации или могут быть дефектными по репликации (например, дефектными в одном или нескольких генах, необходимых для дополнительных циклов репликации и/или упаковки вириона). Вирусы могут вызывать временную экспрессию, длительную экспрессию (например, по меньшей мере 1 неделю, 2 недели, 1 месяц, 2 месяца или 3 месяца) или постоянную экспрессию (например, Cas9 и/или gRNA). Иллюстративные вирусные титры (например, титры AAV) включают в себя 1012, 1013, 1014, 1015 и 1016 векторных геномов/мл.
Геном ssDNA AAV состоит из двух открытых рамок считывания, Rep и Cap, фланкированных двумя инвертированными концевыми повторами, которые позволяют синтезировать комплементарную цепь ДНК. При конструировании плазмиды для переноса AAV трансген помещают между двумя ITR, и Rep и Cap могут поставляться in trans. В дополнение к Rep и Cap, AAV может потребоваться хелперная плазмида, содержащая гены аденовируса. Эти гены (Е4, Е2а и VA) опосредуют репликацию AAV. Например, переносящая плазмида, Rep/Cap и хелперная плазмида могут быть трансфицированы в клетки HEK293, содержащие ген аденовируса Е1+, для получения инфекционных частиц AAV. Альтернативно, Rep, Cap и хелперные гены аденовируса могут быть объединены в одну плазмиду. Подобные упаковочные клетки и способы можно использовать для других вирусов, таких как ретровирусы.
Были идентифицированы множественные серотипы AAV. Эти серотипы различаются по типам клеток, которые они заражают (т.е. их тропизм), что позволяет преимущественную трансдукцию определенных типов клеток. Серотипы для ткани ЦНС включают в себя AAV1, AAV2, AAV4, AAV5, AAV8 и AAV9. Серотипы для сердечной ткани включают в себя AAV1, AAV8 и AAV9. Серотипы для почечной ткани включают в себя AAV2. Серотипы для легочной ткани включают в себя AAV4, AAV5, AAV6 и AAV9. Серотипы для ткани поджелудочной железы включают в себя AAV8. Серотипы для фоторецепторных клеток включают в себя AAV2, AAV5 и AAV8. Серотипы для ткани пигментного эпителия сетчатки включают в себя AAV1, AAV2, AAV4, AAV5 и AAV8. Серотипы для скелетной мышечной ткани включают в себя AAV1, AAV6, AAV7, AAV8 и AAV9. Серотипы для ткани печени включают в себя AAV7, AAV8 и AAV9 и, в частности, AAV8.
Тропизм можно дополнительно уточнить с помощью псевдотипирования, которое представляет собой смешивание капсида и генома из различных вирусных серотипов. Например, AAV2/5 указывает на вирус, содержащий геном серотипа 2, упакованный в капсид из серотипа 5. Использование псевдотипированных вирусов может повысить эффективность трансдукции, а также изменить тропизм. Гибридные капсиды, полученные из разных серотипов, также могут быть использованы для изменения вирусного тропизма. Например, AAV-DJ содержит гибридный капсид из восьми серотипов и демонстрирует высокую инфекционность в широком диапазоне типов клеток in vivo. AAV-DJ8 является еще одним примером, который отображает свойства AAV-DJ, но с улучшенным поглощением головным мозгом. Серотипы AAV также могут быть модифицированы с помощью мутаций. Примеры мутационных модификаций AAV2 включают в себя Y444F, Y500F, Y730F и S662V. Примеры мутационных модификаций AAV3 включают в себя Y705F, Y731F и T492V. Примеры мутационных модификаций AAV6 включают в себя S663V и T492V. Другие псевдотипированные/модифицированные варианты AAV включают в себя AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2 и AAV/SASTG.
Для ускорения экспрессии трансгена могут использоваться самокомплементарные варианты AAV (scAAV). Поскольку AAV зависит от механизма репликации ДНК клетки, чтобы синтезировать комплементарную цепь генома одноцепочечной ДНК AAV, экспрессия трансгена может быть отсрочена. Чтобы устранить эту задержку, можно использовать комплементарные последовательности, содержащие scAAV, которые способны к самопроизвольному отжигу при заражении, что устраняет необходимость синтеза ДНК клетки-хозяина. Однако также можно использовать одноцепочечные векторы AAV (ssAAV).
Чтобы увеличить емкость упаковки, более длинные трансгены могут быть разделены между двумя плазмидами для переноса AAV, первая с 3' донором сплайсированного фрагмента, а вторая с 5' акцептором сплайсированного фрагмента. При коинфекции клетки эти вирусы образуют конкатемеры, сплайсируют и может быть экспрессирован трансген полной длины. Хотя это позволяет увеличить экспрессию трансгена, экспрессия менее эффективна. Подобные способы увеличения емкости используют гомологичную рекомбинацию. Например, трансген может быть разделен между двумя переносящими плазмидами, но с существенным перекрытием последовательности, так что коэкспрессия индуцирует гомологичную рекомбинацию и экспрессию полноразмерного трансгена.
Введение нуклеиновых кислот и белков также можно осуществить путем доставки, опосредованной липидными наночастицами (LNP). Например, опосредованная LNP доставка может использоваться для доставки комбинации mRNA Cas и направляющей РНК или комбинации белка Cas и направляющей РНК. Доставка такими способами приводит к кратковременной экспрессии Cas, а биоразлагаемые липиды улучшают клиренс, улучшают переносимость и снижают иммуногенность. Липидные составы могут защищать биологические молекулы от деградации при одновременном улучшении их клеточного поглощения. Липидные наночастицы представляют собой частицы, содержащие множество молекул липидов, физически связанных друг с другом межмолекулярными силами. Они включают в себя микросферы (включая в себя однослойные и многослойные везикулы, например, липосомы), дисперсную фазу в эмульсии, мицеллы или внутреннюю фазу в суспензии. Такие липидные наночастицы могут быть использованы для инкапсуляции одной или нескольких нуклеиновых кислот или белков для доставки. Композиции, которые содержат катионные липиды, применимы для доставки полианионов, таких как нуклеиновые кислоты. Другими липидами, которые могут быть включены, являются нейтральные липиды (т.е. незаряженные или цвиттерионные липиды), анионные липиды, вспомогательные липиды, которые усиливают трансфекцию, и липиды-невидимки, которые увеличивают продолжительность времени, в течение которого наночастицы могут существовать in vivo. Примеры подходящих катионных липидов, нейтральных липидов, анионных липидов, вспомогательных липидов и липидов-невидимок можно найти в публикации международной заявки WO 2016/010840 А1, полностью включенной в настоящий документ посредством ссылки для всех целей. Иллюстративная липидная наночастица может содержать катионный липид и один или несколько других компонентов. В одном примере другой компонент может содержать вспомогательный липид, такой как холестерин. В другом примере другие компоненты могут содержать вспомогательный липид, такой как холестерин, и нейтральный липид, такой как DSPC. В другом примере другие компоненты могут содержать вспомогательный липид, такой как холестерин, необязательный нейтральный липид, такой как DSPC, и липид-невидимку, такой как S010, S024, S027, S031 или S033.
LNP может содержать одно или несколько или все из следующего: (i) липид для инкапсуляции и для эндосомального выхода; (ii) нейтральный липид для стабилизации; (iii) вспомогательный липид для стабилизации и (iv) липид-невидимку. Смотрите, например, публикацию Finn et al. (2018) Cell Reports 22:1-9 и публикацию международной заявки WO 2017/173054 A1, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. В некоторых LNP груз может включать в себя направляющую РНК или нуклеиновую кислоту, кодирующую направляющую РНК. В некоторых LNP груз может включать в себя экзогенную донорскую нуклеиновую кислоту. В некоторых LNP груз может включать в себя направляющую РНК или нуклеиновую кислоту, кодирующую направляющую РНК, и белок Cas или нуклеиновую кислоту, кодирующую белок Cas. В некоторых LNP груз может включать в себя направляющую РНК или нуклеиновую кислоту, кодирующую направляющую РНК, белок Cas или нуклеиновую кислоту, кодирующую белок Cas, и экзогенную донорскую нуклеиновую кислоту.
Липид для инкапсуляции и эндосомального выхода может представлять собой катионный липид. Липид также может представлять собой биоразлагаемый липид, такой как биоразлагаемый ионизируемый липид. Одним примером подходящего липида является Lipid А или LP01, который представляет собой (9Z,12Z)-3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропилооктадека-9,12-диеноат, также называемый 3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропил(9Z,12Z)-октадека-9,12-диеноат. Смотрите, например, публикацию Finn et al. (2018) Cell Reports 22:1-9 и публикацию международной заявки WO 2017/173054 A1, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Другим примером подходящего липида является Lipid В, который представляет собой ((5-((диметиламино)метил)-1,3-фенилен)бис(окси))бис(октан-8,1-диил)бис(деканоат), также называемый ((5-((диметиламино)метил)-1,3-фенилен)бис(окси))бис(октан-8,1-диил)бис(деканоат). Другим примером подходящего липида является Lipid С, который представляет собой 2-((4-(((3-(диметиламино)пропокси)карбонил)окси)гексадеканоил)окси)пропан-1,3-диил(9Z,9'Z,12Z,12'Z)-бис(октадек-9,12-диеноат). Другим примером подходящего липида является Lipid D, который представляет собой 3-(((3-(диметиламино)пропокси)карбонил)окси)-13-(октаноилокси)тридецил-3-октилундеканоат. Другие подходящие липиды включают в себя гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (также известный как Dlin-MC3-DMA (MC3))).
Некоторые такие липиды, подходящие для использования в описанных в настоящем документе LNP, являются биоразлагаемыми in vivo. Например, LNP, содержащие такой липид, включают в себя те, в которых по меньшей мере 75% липида очищается из плазмы в течение 8, 10, 12, 24 или 48 часов или 3, 4, 5, 6, 7 или 10 дней. В качестве другого примера по меньшей мере 50% LNP очищается из плазмы в течение 8, 10, 12, 24 или 48 часов или 3, 4, 5, 6, 7 или 10 дней.
Такие липиды могут быть ионизируемыми в зависимости от рН среды, в которой они находятся. Например, в слабокислой среде липиды могут протонироваться и, таким образом, нести положительный заряд. И наоборот, в слабоосновной среде, такой как, например, кровь, где рН составляет приблизительно 7,35, липиды могут не протонироваться и, следовательно, нести заряд. Согласно некоторым вариантам осуществления липиды могут быть протонированы при рН по меньшей мере приблизительно 9, 9,5 или 10. Способность такого липида нести заряд связана с его собственной pKa. Например, липид может независимо характеризоваться pKa в диапазоне от приблизительно 5,8 до приблизительно 6,2.
Нейтральные липиды функционируют для стабилизации и улучшения процессинга LNP. Примеры подходящих нейтральных липидов включают в себя множество нейтральных, незаряженных или цвиттерионных липидов. Примеры нейтральных фосфолипидов, подходящих для применения в настоящем раскрытии, включают в себя, без ограничения, 5-гептадецилбензол-1,3-диол(резорцин), дипальмитоилфосфатидилхолин (DPPC), дистеароилфосфатидилхолин (DSPC), фосфохолин (DOPC), димиристоилфосфатидилхолин (DMPC), фосфатидилхолин (PLPC), 1,2-дистеароил-sn-глицеро-3-фосфохолин (DAPC), фосфатидилэтаноламин (РЕ), яичный фосфатидилхолин (ЕРС), дилаурилоилфосфатидилхолин (DLPC), димиристоилфосфатидилхолин (DMPC), 1-миристоил-2-пальмитоилфосфатидилхолин (МРРС), 1-пальмитоил-2-миристоилфосфатидилхолин (РМРС), 1-пальмитоил-2-стеароилфосфатидилхолин (PSPC), 1,2-диарахидоил-sn-глицеро-3-фосфохолин (DBPC), 1-стеароил-2-пальмитоилфосфатидилхолин (SPPC), 1,2-диэйкозеноил-sn-глицеро-3-фосфохолин (DEPC), пальмитоилолеилфосфатидилхолин (РОРС), лизофосфатидилхолин, диолеоилфосфатидилэтаноламин (DOPE), дилинолеоилфосфатидилхолин, дистеароилфосфатидилэтаноламин (DSPE), димиристоилфосфатидилэтаноламин (DMPE), дипальмитоилфосфатидилэтаноламин (DPPE), пальмитоилолеоилфосфатидилэтаноламин (POPE), лизофосфатидилэтаноламин и их комбинации. Например, нейтральный фосфолипид может быть выбран из группы, состоящей из дистеароилфосфатидилхолина (DSPC) и димиристоилфосфатидилэтаноламина (DMPE).
Вспомогательные липиды включают в себя липиды, которые усиливают трансфекцию. Механизм, с помощью которого вспомогательный липид усиливает трансфекцию, может включать в себя повышение стабильности частиц. В некоторых случаях вспомогательный липид может усиливать фузогенность мембран. Вспомогательные липиды включают в себя стероиды, стеролы и алкилрезорцины. Примеры подходящих вспомогательных липидов, подходящих для применения, включают в себя холестерин, 5-гептадецилрезорцин и гемисукцинат холестерина. В одном примере вспомогательный липид может представлять собой холестерин или гемисукцинат холестерина.
Липиды-невидимки включают в себя липиды, которые изменяют продолжительность времени, в течение которого наночастицы могут существовать in vivo. Липиды-невидимки могут помочь в процессе составления, например, путем снижения агрегации частиц и контроля размера частиц. Липиды-невидимки могут модулировать фармакокинетические свойства LNP. Подходящие липиды-невидимки включают в себя липиды, имеющие гидрофильную головную группу, связанную с липидной частью.
Гидрофильная головная группа липида-невидимки может включать в себя, например, полимерный фрагмент, выбранный из полимеров на основе PEG (иногда называемых поли(этиленоксид)), поли(оксазолин), поли(виниловый спирт), поли(глицерин), поли(N-винилпирролидон), полиаминокислоты и поли-N-(2-гидроксипропил)метакриламид. Термин «PEG» означает любой полиэтиленгликоль или другой полиалкиленэфирный полимер. В некоторых составах LNP PEG представляет собой PEG-2K, также называемый PEG 2000, который характеризуется средней молекулярной массой приблизительно 2000 дальтон. Смотрите, например, публикацию международной заявки WO 2017/173054 А1, полностью включенную в настоящий документ посредством ссылки для всех целей.
Липидный фрагмент липида-невидимки может быть получен, например, из диацилглицерина или диацилгликамида, включая в себя те, что содержат диалкилглицериновую или диалкилгликамидную группу, имеющую длину алкильной цепи, независимо содержащую от приблизительно С4 до приблизительно С40 насыщенных или ненасыщенных атомов углерода, причем цепь может содержать одну или несколько функциональных групп, таких как, например, амид или сложный эфир. Диалкилглицериновая или диалкилгликамидная группа может дополнительно содержать одну или несколько замещенных алкильных групп.
В качестве одного примера, липид-невидимка может быть выбран из PEG-дилауроилглицерина, PEG-димиристоилглицерина (PEG-DMG), PEG-дипальмитоилглицерина, PEG-дистеароилглицерина (PEG-DSPE), PEG-дилаурилгликамида, PEG-димиристилгликамида, PEG-дипальмитоилгликамида и PEG-дистеароилгликамида, PEG-холестерина (1-[8'-(холест-5-ен-3-бета-окси)карбоксамидо-3',6'-диоксаоктанил]карбамоил-[омега]-метил-поли(этиленгликоль), PEG-DMB (3,4-дитетрадекоксилбензил-[омега]-метил-поли(этиленгликоль)эфир), 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-N-[метокси(полиэтиленгликоля)-2000] (PEG2k-DMG), 1,2-дистеароил-sn-глицеро-3-фосфоэтаноламин-N-[метокси(полиэтиленгликоля)-2000] (PEG2k-DSPE), 1,2-дистеароил-sn-глицерина, метоксинолиэтиленгликоля (PEG2k-DSG), поли(этиленгликоль)-2000-диметакрилата (PEG2k-DMA) и 1,2-дистеарилоксипропил-3-амин-N-[метокси(полиэтиленгликоля)-2000] (PEG2k-DSA). В одном конкретном примере PEG-DMB может представлять собой PEG2k-DMG.
LNP могут содержать различные соответствующие молярные соотношения компонентов липидов в составе. Мол. % липида CCD может составлять, например, от приблизительно 30 мол. % до приблизительно 60 мол. %, от приблизительно 35 мол. % до приблизительно 55 мол. %, от приблизительно 40 мол. % до приблизительно 50 мол. %, от приблизительно 42 мол. % до приблизительно 47 мол. % или приблизительно 45%. Мол. % вспомогательного липида может составлять, например, от приблизительно 30 мол. % до приблизительно 60 мол. %, от приблизительно 35 мол. % до приблизительно 55 мол. %, от приблизительно 40 мол. % до приблизительно 50 мол. %, от приблизительно 41 мол. % до приблизительно 46 мол. % или приблизительно 44 мол. %. Мол. % нейтрального липида может составлять, например, от приблизительно 1 мол. % до приблизительно 20 мол. %, от приблизительно 5 мол. % до приблизительно 15 мол. %, от приблизительно 7 мол. % до приблизительно 12 мол. % или приблизительно 9 мол. %. Мол. % липида-невидимки может составлять, например, от приблизительно 1 мол. % до приблизительно 10 мол. %, от приблизительно 1 мол. % до приблизительно 5 мол. %, от приблизительно 1 мол. % до приблизительно 3 мол. %, приблизительно 2 мол. % или приблизительно 1 мол. %.
LNP могут характеризоваться различными соотношениями между положительно заряженными аминными группами биоразлагаемого липида (N) и отрицательно заряженными фосфатными группами (Р) нуклеиновой кислоты, которая должна быть инкапсулирована. Это может быть математически представлено уравнением N/P. Например, отношение N/P может составлять от приблизительно 0,5 до приблизительно 100, от приблизительно 1 до приблизительно 50, от приблизительно 1 до приблизительно 25, от приблизительно 1 до приблизительно 10, от приблизительно 1 до приблизительно 7, от приблизительно 3 до приблизительно 5, от приблизительно 4 до приблизительно 5, приблизительно 4, приблизительно 4,5 или приблизительно 5.
В некоторых LNP груз может содержать mRNA Cas и gRNA. mRNA Cas и gRNA могут быть в разных соотношениях. Например, состав LNP может включать в себя отношение mRNA Cas к нуклеиновой кислоте gRNA в диапазоне от приблизительно 25:1 до приблизительно 1:25, в диапазоне от приблизительно 10:1 до приблизительно 1:10, в диапазоне от приблизительно 5:1 до приблизительно 1:5 или приблизительно 1:1. Альтернативно, состав LNP может включать в себя соотношение mRNA Cas к нуклеиновой кислоте gRNA от приблизительно 1:1 до приблизительно 1:5 или приблизительно 10:1. Альтернативно, состав LNP может включать в себя соотношение mRNA Cas к нуклеиновой кислоте gRNA приблизительно 1:10, 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1: 5, 1:10 или 1:25.
В некоторых LNP груз может содержать экзогенную донорскую нуклеиновую кислоту и gRNA. Экзогенная донорская нуклеиновая кислота и gRNA могут иметь различные соотношения. Например, состав LNP может включать в себя отношение экзогенной донорской нуклеиновой кислоты к нуклеиновой кислоте gRNA в диапазоне от приблизительно 25:1 до приблизительно 1:25, в диапазоне от приблизительно 10:1 до приблизительно 1:10, в диапазоне от приблизительно 5:1 до приблизительно 1:5 или приблизительно 1:1. Альтернативно, состав LNP может включать в себя соотношение экзогенной донорской нуклеиновой кислоты к нуклеиновой кислоте gRNA от приблизительно 1:1 до приблизительно 1:5, от приблизительно 5:1 до приблизительно 1:1, приблизительно 10:1 или приблизительно 1:10. Альтернативно, состав LNP может включать в себя отношение экзогенной донорской нуклеиновой кислоты к нуклеиновой кислоте gRNA приблизительно 1:10, 25:1, 10:1,5:1,3:1, 1:1, 1:3, 1:5, 1:10 или 1:25.
Конкретный пример подходящего LNP имеет отношение азота к фосфату (N/P) 4,5 и содержит биоразлагаемый катионный липид, холестерин, DSPC и PEG2k-DMG в молярном соотношении 45:44:9:2. Биоразлагаемый катионный липид может представлять собой (9Z,12Z)-3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропилооктадека-9,12-диеноат, также называемый 3-((4,4-бис(октилокси)бутаноил)окси)-2-((((3-(диэтиламино)пропокси)карбонил)окси)метил)пропил(9Z,12Z)-октадека-9,12-диеноат.
Смотрите, например, публикацию Finn et al. (2018) Cell Reports 22:1-9, полностью включенную в настоящий документ посредством ссылки для всех целей. Другой конкретный пример подходящего LNP содержит Dlin-MC3-DMA (МС3), холестерин, DSPC и PEG-DMG в молярном соотношении 50:38, 5:10:1,5.
Способ доставки может быть выбран для снижения иммуногенности. Например, белок Cas и gRNA могут быть доставлены различными способами (например, бимодальной доставкой). Эти различные способы могут придавать различные фармакодинамические или фармакокинетические свойства доставляемым субъекту молекулам (например, кодирование Cas или нуклеиновой кислоты, кодирование gRNA или нуклеиновой кислоты или матрица экзогенной донорской нуклеиновой кислоты/репарации). Например, разные режимы могут привести к разному распределению в тканях, разному периоду полураспада или разному временному распределению. Некоторые способы доставки приводят к более постоянной экспрессии и присутствию молекулы, тогда как другие способы доставки являются временными и менее постоянными (например, доставка РНК или белка). Доставка белков Cas более кратковременным способом, например, в виде mRNA или белка, может гарантировать, что комплекс Cas/gRNA присутствует и активен только в течение короткого периода времени, и может снизить иммуногенность, вызванную пептидами из бактериального фермента Cas, отображаемую на поверхности клетки молекулами МНС. Такая кратковременная доставка может также уменьшить возможность нецелевых модификаций.
Введение in vivo может осуществляться любым подходящим путем, включая в себя, например, парентеральный, внутривенный, пероральный, подкожный, внутриартериальный, внутричерепной, интратекальный, внутрибрюшинный, местный, интраназальный или внутримышечный. Системные способы введения включают в себя, например, пероральный и парентеральный пути. Примеры парентеральных путей включают в себя внутривенные, внутриартериальные, внутрикостные, внутримышечные, внутрикожные, подкожные, интраназальные и внутрибрюшинные пути. Конкретным примером является внутривенная инфузия. Носовая инстилляция и интравитреальная инъекция являются другими конкретными примерами. Местные способы введения включают в себя, например, интратекальный, интрацеребровентрикулярный, интрапаренхиматозный (например, локализованную интрапаренхиматозную доставку в стриатум (например, в хвостатое ядро или в путамен), кору головного мозга, прецентральную извилину, гиппокамп (например, в зубчатую извилину или область СА3), височную кору, миндалину, лобную кору, таламус, мозжечок, мозговое вещество, гипоталамус, тектум, сегментум или черную субстанцию), интраокулярный, интраорбитальный, субконъюктивальный, интравитреальный, субретинальный и транссклеральный пути. Значительно меньшие количества компонентов (по сравнению с системными подходами) могут оказывать эффект при местном введении (например, интрапаренхиматозном или интравитреальном) по сравнению с системным введением (например, внутривенно). Местные способы введения также могут уменьшать или исключать частоту потенциально токсических побочных эффектов, которые могут возникнуть, когда терапевтически эффективные количества компонента вводятся системно.
Введение in vivo может осуществляться любым подходящим путем, включая в себя, например, парентеральный, внутривенный, пероральный, подкожный, внутриартериальный, внутричерепной, интратекальный, внутрибрюшинный, местный, интраназальный или внутримышечный. Конкретным примером является внутривенная инфузия. Композиции, содержащие направляющие РНК и/или белки Cas (или нуклеиновые кислоты, кодирующие направляющие РНК и/или белки Cas), могут быть составлены с использованием одного или нескольких физиологически и фармацевтически приемлемых носителей, разбавителей, наполнителей или вспомогательных веществ. Состав может зависеть от выбранного пути введения. Термин «фармацевтически приемлемый» означает, что носитель, разбавитель, наполнитель или вспомогательное вещество совместимы с другими ингредиентами состава и по существу не вредны для их реципиента.
Частота введения и количество доз могут зависеть от периода полураспада экзогенных донорских нуклеиновых кислот, направляющих РНК или белков Cas (или нуклеиновых кислот, кодирующих направляющие РНК или белки Cas) и пути введения среди других факторов. Введение нуклеиновых кислот или белков в клетку или отличное от человека животное может быть выполнено один раз или несколько раз за период времени. Например, введение может быть выполнено по меньшей мере два раза за период времени, по меньшей мере три раза за период времени, по меньшей мере четыре раза за период времени, по меньшей мере пять раз за период времени, по меньшей мере шесть раз за период времени, по меньшей мере семь раз за период времени, по меньшей мере восемь раз за период времени, по меньшей мере девять раз за период времени, по меньшей мере десять раз за период времени, по меньшей мере одиннадцать раз, по меньшей мере двенадцать раз за период времени, по меньшей мере тринадцать раз за период времени, по меньшей мере четырнадцать раз за период времени, по меньшей мере пятнадцать раз за период времени, по меньшей мере шестнадцать раз за период времени, по меньшей мере семнадцать раз за период времени, по меньшей мере восемнадцать раз за период времени, по меньшей мере девятнадцать раз за период времени или по меньшей мере двадцать раз за период времени.
F. Измерение активности CRISPR/Cas in vivo
Раскрытые в настоящем документе способы могут дополнительно предусматривать обнаружение или измерение экспрессии или активности одного или нескольких репортерных белков, кодируемых репортером CRISPR. Способы обнаружения или измерения экспрессии или активности будут зависеть от репортерного белка.
Например, для флуоресцентных репортерных белков обнаружение или измерение могут предусматривать спектрофотометрические или проточные цитометрические анализы или флуоресцентную микроскопию клеток, выделенных из отличного от человека животного или анализов макрофотографий, или визуализации in vivo самого отличного от человека животного.
Для репортерных белков люциферазы анализ может предусматривать анализ репортера люциферазы, предусматривающий разрушение открытых клеток, выделенных от отличного от человека животного, для высвобождения всех белков (включая в себя люциферазу), добавление люциферина (для люциферазы светлячка) или коэлентеразина (для люциферазы Renilla) и всех необходимых кофакторов, а также измерения ферментативной активности с помощью люминометра. Люциферин превращается в оксилюциферин ферментом люцифераза. Часть энергии, выделяющейся в результате этой реакции, находится в форме света. Альтернативно, биолюминесцентная визуализация отличного от человека животного может быть выполнена после инъекции субстрата люциферазы (например, люциферина или коэлентеразина) отличному от человека животному. Такие анализы позволяют получать неинвазивные оптические изображения живых животных с высокой чувствительностью.
Для репортерных белков бета-галактозидазы анализ может предусматривать гистохимическое окрашивание клеток или тканей, выделенных от отличного от человека животного. Бета-галактозидаза катализирует гидролиз X-Gal с образованием синего осадка, который можно легко визуализировать под микроскопом, обеспечивая тем самым простой и удобный способ визуального обнаружения экспрессии LacZ в клетках или тканях.
Другие репортерные белки и анализы для выявления или измерения экспрессии или активности таких репортерных белков хорошо известны.
Альтернативно, раскрытые в настоящем документе способы могут дополнительно предусматривать идентификацию клетки, содержащей модифицированный репортер CRISPR, в котором вырезан сигнал полиаденилирования или терминатор транскрипции, или идентификацию клетки, содержащей модифицированный репортер CRISPR, в котором кодирующая последовательность для одного репортерного белка была изменена и преобразована в кодирующую последовательность для другого репортерного белка. Различные способы могут быть использованы для идентификации клеток, имеющих целевую генетическую модификацию. Скрининг может предусматривать количественный анализ для оценки модификации аллеля (МОА) исходной хромосомы. Например, количественный анализ может быть выполнен с помощью количественной ПЦР, такой как ПЦР в реальном времени (кПЦР). ПЦР в реальном времени может использовать первый набор праймеров, который распознает целевой локус, и второй набор праймеров, который распознает нецелевой эталонный локус. Набор праймеров может содержать флуоресцентный зонд, который распознает амплифицированную последовательность. Другие примеры подходящих количественных анализов включают в себя флуоресцентно-опосредованную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным зондом(ами), зонды INVADER®, зонды Molecular Beacon TAQMAN® или зондовую технологию ECLIPSE™ (смотрите, например, патент US 2005/0144655, полностью включенный в настоящий документ посредством ссылки для всех целей).
Секвенирование следующего поколения (NGS) также можно использовать для скрининга. Секвенирование следующего поколения может также упоминаться как «NGS» или «массивно-параллельное секвенирование» или «высокопроизводительное секвенирование». NGS может использоваться в качестве инструмента скрининга в дополнение к анализам МОА для определения точного характера целевой генетической модификации и является ли она одинаковой для разных типов клеток, типов тканей или органов.
Оценить модификацию целевого геномного локуса у отличного от человека животного можно в любом типе клеток из любой ткани или органа. Например, обнаружение или измерение экспрессии или активности одного или нескольких репортерных белков, кодируемых репортером CRISPR, можно оценивать во множестве типов клеток из одной и той же ткани или органа или в клетках из нескольких мест внутри ткани или органа. Это может предоставить информацию о том, какие типы клеток в целевой ткани или органе модифицируются или какие участки ткани или органа достигаются CRISPR/Cas и модифицируются. В качестве другого примера, обнаружение или измерение экспрессии или активности одного или нескольких репортерных белков, кодируемых репортером CRISPR, можно оценивать в разных типах тканей или во многих органах. В способах, в которых нацеленно воздействуют на конкретную ткань или орган, это может предоставить информацию о том, насколько эффективно нацеленно воздействуют на эту ткань или орган и есть ли нецелевые эффекты в других тканях или органах.
В качестве одного примера, раскрытые в настоящем документе репортеры CRISPR могут представлять собой репортер CRISPR, содержащий как ген lacZ, так и ген, кодирующий флуоресцентный репортерный белок, и могут использоваться для обнаружения как NHEJ, так и направляемой гомологией репарации (HDR). Например, первичные гепатоциты можно собирать у отличных от человека животных, включая в себя репортеров CRISPR, для оценки стратегий индукции NHEJ и HDR в клетках этого типа. Cas9 может быть введен, например, в виде AAV, mRNA или белка, a gRNA может быть введена как одиночная направляющая РНК (модифицированная и немодифицированная), так и модульная (дуплексная) РНК. Матрицы репарации ДНК могут быть введены в виде симметричной или асимметричной одноцепочечной, симметричной или асимметричной двухцепочечной или в виде вектора AAV. В качестве конкретного примера можно провести окрашивание lacZ для оценки успеха NHEJ, а затем можно использовать флуоресцентную микроскопию и анализ FAC для оценки эффективности HDR. Информация, собранная ex vivo, может затем применяться к взрослому отличному от человека животному (например, мыши). Cas9, направляющая РНК и матрица репарации могут быть введены в любом из перечисленных выше состояний.
IV. Способы получения отличных от человека животных, содержащих репортер CRISPR
Предложены различные способы получения отличного от человека животного, содержащего репортер CRISPR, как раскрыто в другом месте настоящего документа. Любой удобный способ или протокол для получения генетически модифицированного организма является подходящим для получения такого генетически модифицированного отличного от человека животного. Смотрите, например, публикации Cho et al. (2009) Current Protocols in Cell Biology 42:19.11:19.11.1-19.11.22 и Gama Sosa et al. (2010) Brain Struct. Funct. 214(2-3):91-109, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Такие генетически модифицированные отличные от человека животные могут быть получены, например, путем включения гена в целевой локус (например, в локус «безопасной гавани», такой как Rosa26) или путем использования случайно интегрируемого трансгена. Смотрите, например, публикации международной заявки WO 2014/093622 и WO 2013/176772, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. Способы нацеливания конструкции на локус Rosa26 описаны, например, в патентах US 2012/0017290, US 2011/0265198 и US 2013/0236946, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей.
Например, способ получения отличного от человека животного, содержащего репортер CRISPR, как раскрыто в другом месте настоящего документа, может предусматривать: (1) модификацию генома плюрипотентной клетки для включения репортера CRISPR; (2) идентификацию или отбор генетически модифицированной плюрипотентной клетки, содержащей репортер CRISPR; (3) введение генетически модифицированной плюрипотентной клетки в эмбрион-хозяина отличного от человека животного и (4) имплантация и гестация эмбриона-хозяина в суррогатной матери. Необязательно, эмбрион-хозяин, содержащий модифицированную плюрипотентную клетку (например, отличную от человеческой ES-клетку), может быть инкубирован до стадии бластоцисты перед имплантацией и гестацией в суррогатной матери для получения отличного от человека животного F0. Затем суррогатная мать может произвести отличное от человека животное поколения F0, содержащего репортер CRISPR.
Способы могут дополнительно предусматривать идентификацию клетки или животного, характеризующегося модифицированным целевым геномным локусом. Различные способы могут быть использованы для идентификации клеток и животных, характеризующихся целевой генетической модификацией.
Стадия скрининга может включать в себя, например, количественный анализ для оценки модификации аллеля (МОА) исходной хромосомы. Например, количественный анализ может быть выполнен с помощью количественной ПЦР, такой как ПЦР в реальном времени (кПЦР). ПЦР в реальном времени может использовать первый набор праймеров, который распознает целевой локус, и второй набор праймеров, который распознает нецелевой эталонный локус. Набор праймеров может содержать флуоресцентный зонд, который распознает амплифицированную последовательность.
Другие примеры подходящих количественных анализов включают в себя флуоресцентно-опосредованную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным зондом(ами), зонды INVADER®, зонды Molecular Beacon TAQMAN® или технологию зондов ECLIPSE™ (смотрите, например, патент US 2005/0144655, полностью включенный в настоящий документ посредством ссылки для любых целей).
Примером подходящей плюрипотентной клетки является эмбриональная стволовая (ES) клетка (например, ES-клетка мыши или ES-клетка крысы). Модифицированную плюрипотентную клетку можно получить, например, путем (а) введения в клетку одного или нескольких нацеливающих векторов, содержащих нуклеиновую кислоту-вставку, фланкированную 5' и 3' плечами гомологии, соответствующими 5' и 3' целевым сайтам, причем нуклеиновая кислота-вставка содержит репортер CRISPR; и (b) идентификации по меньшей мере одной клетки, содержащей в своем геноме нуклеиновую кислоту-вставку, интегрированную в целевой геномный локус. Альтернативно, модифицированная плюрипотентная клетка может быть получена путем (а) введения в клетку: (i) нуклеазного средства, причем нуклеазное средство индуцирует одноцепочечный или двухцепочечный разрыв в целевой последовательности в пределах целевого геномного локуса; и (ii) одного или нескольких нацеливающих векторов, содержащих нуклеиновую кислоту-вставку, фланкированную 5' и 3' плечами гомологии, соответствующими 5' и 3' целевым сайтам, расположенным в достаточной близости от целевой последовательности, причем нуклеиновая кислота-вставка содержит репортер CRISPR; и (с) идентификации по меньшей мере одной клетки, содержащей модификацию (например, интеграцию нуклеиновой кислоты-вставки) в целевом геномном локусе. Можно использовать любое нуклеазное средство, которое вызывает одноцепочечный или двухцепочечный разрыв в желаемой целевой последовательности. Примеры подходящих нуклеаз включают в себя эффекторную нуклеазу, подобную активаторам транскрипции (TALEN), нуклеазу цинкового пальца (ZFN), мегануклеазу и короткие палиндромные повторы, регулярно расположенные группами (CRISPR)/CRISPR-ассоциированные (Cas) системы или компоненты таких системы (например, CRISPR/Cas9). Смотрите, например, патенты US 2013/0309670 и US 2015/0159175, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей.
Донорская клетка может быть введена в эмбрион-хозяина на любой стадии, такой как стадия бластоцисты или стадия преморула (т.е. стадия 4 клеток или стадия 8 клеток). Получают потомство, способное передавать генетическую модификацию через зародышевую линию. Смотрите, например, патент США №7294754, полностью включенный в настоящий документ посредством ссылки для всех целей.
Альтернативно, описанный в настоящем документе в другом месте способ получения отличных от человека животных может предусматривать: (1) модификацию генома эмбриона одноклеточной стадии для включения репортера CRISPR с использованием описанных выше способов для модификации плюрипотентных клеток; (2) отбор генетически модифицированных эмбрионов и (3) имплантацию и гестацию генетически модифицированного эмбриона у суррогатной матери. Получают потомство, способное передавать генетическую модификацию через зародышевую линию.
Техники ядерной передачи также могут быть использованы для получения отличных от человека млекопитающих животных. Вкратце, способы ядерной передачи могут включать в себя следующие стадии: (1) энуклеация ооцита или обеспечение энуклеированного ооцита; (2) выделение или обеспечение донорской клетки или ядра для объединения с энуклеированным ооцитом; (3) вставка клетки или ядра в энуклеированный ооцит с образованием восстановленной клетки; (4) имплантация восстановленной клетки в матку животного с образованием зародыша и (5) обеспечение развития эмбриона. В таких способах ооциты, как правило, извлекают у умерших животных, хотя они могут быть выделены также из яйцеводов и/или яичников живых животных. Ооциты могут созревать в различных известных средах до энуклеации. Энуклеация яйцеклетки может быть выполнена рядом известных способов. Введение донорской клетки или ядра в энуклеированный ооцит с образованием восстановленной клетки может быть осуществлено путем микроинъекции донорской клетки под вителлиновым слоем перед слиянием. Слияние может быть вызвано применением электрического импульса постоянного тока через плоскость контакта/слияния (электрофузия), воздействием на клетки химических веществ, способствующих слиянию, таких как полиэтиленгликоль, или посредством инактивированного вируса, такого как вирус Sendai. Восстановленная клетка может быть активирована электрическими и/или неэлектрическими способами до, во время и/или после слияния ядра донора и ооцита реципиента. Способы активации предусматривают электрические импульсы, химически индуцированный шок, проникновение сперматозоидов, повышение уровня двухвалентных катионов в ооците и снижение фосфорилирования клеточных белков (как с помощью ингибиторов киназы) в ооците. Активированные реконструированные клетки или эмбрионы можно культивировать в хорошо известных средах и затем переносить в матку животного. Смотрите, например, US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234 и патент США №7612250, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей.
Различные способы, представленные в настоящем документе, позволяют получать генетически модифицированное отличное от человека животное F0, причем клетки генетически модифицированного животного F0 содержат репортер CRISPR. Признано, что в зависимости от способа, использованного для получения животного F0, количество клеток в животном F0, имеющих репортер CRISPR, будет варьировать. Введение донорских ES-клеток в эмбрион на стадии преморулы из соответствующего организма (например, эмбриона мыши с 8 клетками), например, с помощью способа VELOCIMOUSE® позволяет получать больший процент клеточной популяции животного F0, содержащей клетки, имеющие представляющую интерес нуклеотидную последовательность, содержащую целевую генетическую модификацию. Например, по меньшей мере 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% клеточного вклада отличного от человека животного F0 могут включать клеточную популяцию, характеризующуюся целевой модификацией.
Клетки генетически модифицированного животного F0 могут быть гетерозиготными для репортера CRISPR или могут быть гомозиготными для репортера CRISPR.
Все патентные заявки, веб-сайты, другие публикации, регистрационные номера и тому подобное, указанные выше или ниже, полностью включены посредством ссылки для всех целей в той же степени, как если бы каждый отдельный элемент был специально и индивидуально указан для включения в него посредством ссылка. Если разные версии последовательности связаны с регистрационным номером в разное время, подразумевается версия, связанная с регистрационным номером на дату подачи настоящей заявки. Дата вступления в силу означает более раннюю из фактической даты подачи или даты подачи приоритетной заявки со ссылкой на регистрационный номер, если применимо. Аналогичным образом, если разные версии публикации, веб-сайта или тому подобного публикуются в разное время, подразумевается последняя версия, опубликованная на дату подачи заявки, если не указано иное. Любой признак, стадия, элемент, вариант осуществления или аспект настоящего изобретения можно использовать в сочетании с любым другим, если специально не указано иное. Хотя настоящее изобретение было описано более подробно с помощью иллюстрации и примера для ясности и понимания, будет очевидно, что определенные изменения и модификации могут быть осуществлены в рамках объема прилагаемой формулы изобретения.
Краткое описание последовательностей
Нуклеотидные и аминокислотные последовательности, перечисленные в прилагаемом перечне последовательностей, показаны с использованием стандартных буквенных сокращений для нуклеотидных оснований и трехбуквенного кода для аминокислот. Нуклеотидные последовательности следуют стандартному соглашению, начиная с 5'-конца последовательности и продвигаясь вперед (т.е. слева направо в каждой строке) до 3'-конца. Показана только одна цепь каждой нуклеотидной последовательности, но считается, что комплементарная цепь включена в любую ссылку на отображаемую цепь. Когда предоставляется нуклеотидная последовательность, кодирующая аминокислотную последовательность, подразумевается, что ее кодон-вырожденные варианты, которые кодируют ту же аминокислотную последовательность, также предоставляются. Аминокислотные последовательности следуют стандартному соглашению, начиная с амино-конца последовательности и продвигаясь вперед (т.е. слева направо в каждой строке) до карбокси-конца.
ПРИМЕРЫ
Пример 1. Проверка репортеров CRISPR
Технология CRISPR/Cas9 является многообещающей новой терапевтической модальностью. Оценка эффективности получения мутаций или направленной модификации генов введенным средством CRISPR/Cas9 in vivo в настоящее время основывается на сложных молекулярных анализах, таких как анализы чувствительности одноцепочечной ДНКазы, цифровая ПЦР или секвенирование следующего поколения.
CRISPR/Cas9, РНК-направленная ДНК-эндонуклеаза, катализирует двухцепочечный разрыв (DSB) ДНК в сайте связывания ее направляющей РНК. Направляющая РНК может состоять из РНК CRISPR размером 42 нуклеотида (crRNA), которая соединяется с транс-активирующей РНК размером 87 нуклеотидов (tracrRNA). TracrRNA комплементарна и образует пары оснований с crRNA, образуя функциональную направляющую crRNA/tracrRNA. Эта дуплексная РНК становится связанной с белком Cas9 с образованием активного рибонуклеопротеина (RNP), который может исследовать геном в отношении определенной затравочной последовательности. Вторичное требование для разрыва цепи состоит в том, что белок Cas9 должен распознавать примыкающий к протоспейсеру мотив (РАМ), непосредственно примыкающий к 3'-целевой последовательностью CRISPR. Альтернативно, активный комплекс RNP также может быть образован путем замещения дуплекса crRNA/tracrRNA одинарной химерной РНК (sgRNA). Эта sgRNA может быть образована путем слияния затравочной последовательности из 20 нуклеотидов непосредственно с процессированной последовательностью tracrRNA. sgRNA может взаимодействовать как с белком Cas9, так и с ДНК таким же образом и с той же эффективностью, что и дуплекс crRNA/tracrRNA. Было показано, что этот бактериальный природный защитный механизм эффективно функционирует в клетках млекопитающих и активирует индуцированные разрывом пути эндогенной репарации. Когда в геноме происходит двухцепочечный разрыв, пути репарации будут пытаться ремонтировать ДНК либо путем подверженного ошибкам негомологичного соединения концов (NHEJ), либо направляемой гомологией репарацией (HDR), если доступна соответствующая матрица. Авторы настоящего изобретения могут использовать эти пути для облегчения сайт-специфической делеции геномных областей или HDR в клетках млекопитающих.
Для обеспечения лучшего анализа доставки CRISPR/Cas9 и активности в тканях и органах живого животного были разработаны мыши, несущие генетические аллели, которые обладают способностью сообщать об индуцированном CRISPR/Cas9 негомологическом соединении концов (NHEJ) (например, Cas9-опосредованное вырезание, вызванное парой Cas9-опосредованных событий расщепления) и/или индуцированной CRISPR/Cas9 направляемой гомологией репарации (HDR) с использованием донорской последовательности для преобразования eBFP в eGFP (или eGFP в eBFP) после опосредованного Cas9 одноцепочечного или двухцепочечного события расщепления. Описанные в этом примере репортерные аллели CRISPR основаны на модификации локуса Gt(ROSA)26S или (Rosa26) мыши. Локус Rosa26 демонстрирует сильную и повсеместную экспрессию длинной некодирующей РНК неизвестной функции. Мыши с гомозиготной делецией Rosa26 жизнеспособны, здоровы и плодовиты. Первое общее свойство первого репортерного аллеля CRISPR, описанного в настоящем документе, заключается в том, что индуцированное CRISPR/Cas9 вырезание сигнала полиаденилирования будет активировать экспрессию репортерных белков, экспрессируемых с промотора Rosa26, и затем репортерные белки могут быть обнаружены с помощью ферментативной активности или путем флуоресценции (или иммунного анализа или других средств). Второе общее свойство первого репортерного аллеля CRISPR, описанного в настоящем документе, (и свойство второго репортерного аллеля CRISPR, описанного в настоящем документе), заключается в том, что индуцированная CRISPR/Cas9 рекомбинация гена, кодирующего первый флуоресцентный репортерный белок с донорской последовательностью, будет преобразовывать первый флуоресцентный репортерный белок, который экспрессируется из промотора Rosa26 в другой второй флуоресцентный репортерный белок, который затем может быть обнаружен посредством флуоресценции. Репортерные аллели CRISPR, описанные в этом примере, нацелены на первый интрон локуса Rosa26 (смотрите фиг. 2) и используют сильную универсальную экспрессию локуса Rosa26 и легкость нацеливания на локус Rosa26.
Первый репортерный аллель CRISPR (т.е. репортерный аллель CRISPR LSL-LacZ:eBFP) изображен на фиг. 1А и в SEQ ID NO: 17. Он использует lacZ в качестве гистологического репортера высокой четкости и eBFP (или, альтернативно, eGFP) в качестве флуоресцентного репортера степени и местоположения опосредованного CRISPR/Cas9 действия NHEJ (например, удаления целевой последовательности) в печени или других целевых органах и использует eGFP (или, альтернативно, eBFP) в качестве флуоресцентного репортера степени и местоположения доставленного индуцированного CRISPR/Cas9 HDR после рекомбинации с донорской нуклеиновой кислотой в печени или других целевых органах. Кроме того, если нацеленно воздействуют только на один орган, репортерный аллель CRISPR также можно использовать для оценки нецелевых эффектов в других органах и тканях. Соответственно, репортерный аллель CRISPR можно использовать для исследования и оптимизации способов доставки CRISPR/Cas9 in vivo. Компоненты первого репортерного аллеля CRISPR от 5' к 3' показаны в таблице 3 и в SEQ ID NO: 17. Последовательность первого репортерного аллеля CRISPR после обработки рекомбиназой Cre для удаления первого сигнала полиаденилирования Pgk представлена в SEQ ID NO: 58. Последовательность обработанного Cre репортерного аллеля после превращения eBFP в eGFP (например, после обработки ssODN, как более подробно описано ниже) представлена в SEQ ID NO: 59.
Альтернативные целевые последовательности направляющей РНК, фланкирующие первый сигнал полиаденилирования Pgk, также могут быть использованы. Таблица, в которой суммированы различные целевые последовательности направляющих РНК в первом репортере CRISPR, их нуклеотидные положения в первом репортере CRISPR и направляющие последовательности в соответствующих направляющих РНК, нацеленных на эти целевые последовательности направляющих РНК, представлена в таблице 4. В таблице 4 также представлены положения первого и второго сайтов loxP, первого сигнала полиаденилирования Pgk и кодирующей последовательности eBFP для эталона.
Первый сигнал полиаденилирования Pgk, как правило, блокирует экспрессию белка бета-галактозидазы из гена lacZ и белка eBFP. При вырезании первого сигнала полиаденилирования Pgk после расщепления целевых последовательностей направляющей РНК, фланкирующих первый сигнал полиаденилирования Pgk (SEQ ID NO: 41 для каждого, или SEQ ID NO: 41, 43, 44 или 45 для первой целевой последовательности направляющей РНК и SEQ ID NO: 41, 46 или 47 для второй целевой последовательности направляющей РНК) с помощью нуклеазы Cas9, ген lacZ и кодирующая последовательности eBFP, как правило, экспрессируются. Белок бета-галактозидаза и белок eBFP затем экспрессируются и могут быть использованы для количественного определения клеток, модифицированных индуцированным CRISPR/Cas9 вырезанием через NHEJ.
После распознавания и расщепления целевой последовательности направляющей РНК в кодирующей последовательности eBFP (SEQ ID NO: 42) посредством нуклеазы Cas9 и индукции репарации с помощью донорской последовательности кодирующую последовательность eBFP в репортерном аллеле CRISPR можно восстановить путем гомологичной репарации, чтобы превратить его в кодирующую последовательность eGFP. Белок eGFP затем экспрессируется и может использоваться для количественного определения клеток, модифицированных комбинацией CRISPR/Cas9 и донорской последовательности с помощью HDR. Направляющая последовательность направляющей РНК, используемая для нацеливания на кодирующую последовательность eBFP, содержит последовательность, представленную в SEQ ID NO: 14, и донорская нуклеиновая кислота, которую можно использовать для восстановления кодирующей последовательности eBFP и преобразования ее в кодирующую последовательность eGFP, представлена в SEQ ID NO: 15 или SEQ ID NO: 16.
Второй репортерный аллель CRISPR (т.е. репортерный аллель CRISPR LSL-eBFP) изображен на фиг. 3 и SEQ ID NO: 18 и может быть использован для непосредственной оценки индуцированного CRRPR/Cas9 HDR. Он использует eGFP (или альтернативно eBFP) в качестве флуоресцентного репортера степени и положения индуцированного CRISPR/Cas9 HDR после рекомбинации с донорской нуклеиновой кислотой в печени или других целевых органах. Кроме того, если нацеленно воздействуют только на один орган, репортерный аллель CRISPR также можно использовать для оценки нецелевых эффектов в других органах и тканях. Соответственно, репортерный аллель CRISPR можно использовать для исследования и оптимизации способов доставки CRISPR/Cas9 in vivo. Компоненты второго репортерного аллеля CRISPR от 5' к 3' показаны в таблице 5 и SEQ ID NO: 18. Последовательность второго репортерного аллеля CRISPR после обработки рекомбиназой Cre для удаления кассеты селекции представлена в SEQ ID NO: 57. Последовательность обработанного Cre репортерного аллеля после преобразования eBFP в eGFP (например, после обработки ssODN, как более подробно описано ниже) представлена в SEQ ID NO: 60.
Тройной сигнал полиаденилирования блокирует экспрессию белка eBFP. После вырезания сигнала полиаденилирования с помощью Cre-рекомбиназы экспрессирующая последовательность eBFP будет экспрессироваться. После распознавания и расщепления целевой последовательности направляющей РНК в кодирующей последовательности eBFP (SEQ ID NO: 42) посредством нуклеазы Cas9 и индукции репарации с помощью донорской последовательности кодирующую последовательность eBFP в репортерном аллеле CRISPR можно восстановить с помощью направляемой гомологией репарации, чтобы преобразовать его в кодирующую последовательность eGFP. Белок eGFP затем экспрессируется и может использоваться для количественного определения клеток, модифицированных комбинацией CRISPR/Cas9 и донорской последовательности с помощью HDR. Направляющая последовательность направляющей РНК, используемая для нацеливания на кодирующую последовательность eBFP, содержит последовательность, представленную в SEQ ID NO: 14, и донорскую нуклеиновую кислоту, которую можно использовать для восстановления кодирующей последовательности eBFP и преобразования ее в кодирующую последовательность eGFP, представлена в SEQ ID NO: 15 или SEQ ID NO: 16.
LacZ представляет собой встречающийся в природе ген в E.coli, который кодирует белок бета-галактозидазу. Этот белок отвечает за распад лактозы путем расщепления связи между двумя углеродными кольцами в лактозе с образованием глюкозы и галактозы. Первоначально используемый в E.coli lacZ является важным геном в исследованиях, так как он может использоваться в качестве гистохимического репортера. В присутствии аналога лактозы X-Gal бета-галактозидаза будет гидролизовать субстрат с образованием синего цвета, который легко визуализируется под микроскопом.
Улучшенный зеленый флуоресцентный белок (eGFP) представляет собой белок, который испускает зеленую флуоресценцию при воздействии света в диапазоне от синего до ультрафиолетового. eGFP был получен из GFP, первоначально выделенного из медузы Aequorea victoria. Разработаны мутации, которые увеличивали флуоресценцию и фотостабильность, а также позволяли правильно складываться при температуре 37°С для применения в клетках млекопитающих. Основной пик возбуждения составляет 488 нанометров (нм) с пиком излучения при 509 нм. Одна мутация, Y66H, превращает eGFP в усиленный синий флуоресцентный белок (eBFP) с основным пиком возбуждения, смещенным к 380 нм с пиком излучения при 448 нм. Авторы настоящего изобретения сконструировали экспрессию lacZ и связанного с Р2А eBFP в первом интроне локуса Rosa26 мыши с предшествующей фланкированной loxP последовательностью поли(А) и соответствующими сигналами сплайсинга. До вытеснения фланкированной loxP поли(А) кодирующие последовательности lacZ и eBFP не будут экспрессироваться, поскольку область поли(А) будет блокировать транскрипцию. После вытеснения фланкированной loxP поли(А) белки бета-галактозидаза и eBFP будут конститутивно экспрессироваться промотором Rosa26. Альтернативно, поли(А) может быть удалена с использованием системы Cas9 для удаления области путем включения двух сайтов sgRNA, фланкирующих последовательность. Нацеленные клетки до и после фланкирования loxP сначала проверяются количественной полимеразной цепной реакцией TAQMAN® (кПЦР) для выявления единственной сайт-специфической интеграции целевого вектора в Rosa26.
Аллель LacZ-2A-eBFP Lox-Stop-Lox (LSL), как изображено на фиг. 1А (или альтернативно, аллель LacZ-2A-eGFP LSL), может представлять собой эффективный репортер NHEJ и HDR в эмбриональных стволовых клетках мыши (mESC), а также в ткани взрослой мыши. Путем включения этого аллеля в Rosa26, lacZ или eBFP, как правило, не будут экспрессироваться в клетках и тканях. Введение sgRNA для выпадения поли(А) вместе с белком Cas9 может включить экспрессию lacZ и eBFP. Если матрица репарации не предоставляется, это удаление может происходить с использованием пути NHEJ. Таким образом, этот аллель можно использовать для указания того, когда и где произошло NHEJ у взрослой мыши. Кроме того, может быть введена направляющая РНК для индукции двухцепочечного разрыва в eBFP и донор-репаратор, содержащий мутацию H66Y, для превращения eBFP в eGFP (или, альтернативно, для аллеля LacZ-2A-eGFP LSL, донор-репаратор, содержащий мутацию Y66H для преобразования eGFP в eBFP).
LacZ может быть включен в mESC, на которые нацелен аллель CRISPR, как показано на фиг. 1А, путем удаления области поли(А) с помощью системы Cre-Lox или индуцированного Cas9 NHEJ. Чтобы исследовать способность CRISPR/Cas9 удалять область поли(А) в репортерном аллеле CRISPR LSL-LacZ:eBFP, эмбриональные стволовые клетки, содержащие репортерный аллель, подвергали электропорации с помощью рибонуклеопротеиновых комплексов Cas9 и различных направляющих РНК, предназначенных для нацеливания выше против хода транскрипции и ниже по ходу транскрипции от области поли(А). Клетки высевали на 6-луночные планшеты (3×105 клеток) и окрашивали на LacZ в течение двух часов через 3 дня после электропорации. Результаты показаны на фиг. 4А-4Е. На фигурах показаны необработанные клетки (фиг. 4А), клетки, электропорированные с помощью плазмиды, кодирующей рекомбиназу Cre (фиг. 4В), и клетки, электропорированные рибонуклеопротеиновыми комплексами, содержащими белок Cas9, образующий комплекс вместе с синтетическими sgRNA, нацеленно воздействующими на целевые последовательности направляющих РНК, фланкирующие сигнал полиаденилирования Pgk выше против хода транскрипции от гена lacZ (фиг. 4С-4Е). Как показано на фиг. 4В, по сравнению с фиг. 4А, обработка плазмидой рекомбиназы Сrе активировала экспрессию lacZ. Аналогично, как показано на фиг. 4С-4Е по сравнению с фиг. 4А, обработка CRISPR/Cas9 активировала экспрессию lacZ, подтверждая, что сигнал полиаденилирования выше против хода транскрипции был вырезан. На клетки на фиг. 4С нацеленно воздействовали с помощью sgRNA gG3 и gD1, нацеленных на целевые последовательности направляющих РНК v3 и v6 вырезания поли(А) Pgk (SEQ ID NO: 44 и 47, соответственно). Эти направляющие РНК включали в себя последовательности, представленные в SEQ ID NO: 22 и 28, соответственно. На клетки на фиг. 4D нацеленно воздействовали с помощью sgRNA gU3 и gD2, нацеленных на целевые последовательности направляющих РНК v3 и v5 вырезания поли(А) Pgk (SEQ ID NO: 44 и 46, соответственно). Эти направляющие РНК включали в себя последовательности, представленные в SEQ ID NO: 22 и 26, соответственно. На клетки на фиг. 4Е нацеленно воздействовали с помощью sgRNA gU2 и gD1, нацеленных на целевые последовательности направляющих РНК v2 и v6 вырезания поли(А) Pgk (SEQ ID NO: 43 и 47, соответственно). Эти направляющие РНК включали в себя последовательности, представленные в SEQ ID NO: 20 и 28, соответственно. Аналогичные результаты получали для комбинации sgRNA gU1 и gD1, комбинации sgRNA gU1 и gD2 и sgRNA gU2 и gD2 (данные не представлены).
Аналогичные эксперименты проводили на ES-клетках мыши, содержащих репортерный аллель CRISPR LSL-LacZ:eBFP, путем обработки тремя другими комбинациями направляющих РНК, которые нацеленно воздействовали в сигнале полиаденилирования Pgk (смотрите фиг. 1В): cGM4 + cGM5, cGM4 + cGM и cGM4 + cGM3. Целевые последовательности направляющих РНК для cGM, cGM3, cGM4 и cGM5 представлены в SEQ ID NO: 49, 50, 51 и 52, соответственно, а направляющие последовательности направляющих РНК представлены в SEQ ID NO: 30, 31 35 и 36, соответственно. Результаты показаны на фиг. 5. Cre использовали в качестве положительного контроля, а только Cas9 или Cas9 + нережущая направляющая РНК (9172) использовали в качестве отрицательного контроля. Воздействие Cas9 и каждой из трех комбинаций направляющих РНК активировало экспрессию lacZ, подтверждая, что сигнал полиаденилирования выше против хода транскрипции был вырезан. Аналогичным образом, аналогичный эксперимент проводили с направляющей РНК #16, которая содержит целевые последовательности как выше против хода транскрипции, так и ниже по ходу транскрипции от сигнала полиаденилирования. Целевая последовательность направляющей РНК для gRNA#16 представлена в SEQ ID NO: 41, а направляющая последовательность направляющей РНК представлена в SEQ ID NO: 2. Как показано на фиг. 6, воздействие Cas9 и направляющей РНК #16 активировало экспрессию lacZ, подтверждая, что сигнал полиаденилирования выше против хода транскрипции был вырезан.
Для определения эффективности lacZ в качестве считывания NHEJ у взрослых мышей, mESC, на которые нацелен репортерный аллель CRISPR, показанный на фиг. 1А, микроинъецировали в 8-клеточные эмбрионы мыши с использованием способа VELOCIMOUSE®. Смотрите, например, US 7576259; US 7659442; US 7294754; US 2008/007800 и Poueymirou et al. (2007) Nature Biotech 25(1):91-99, каждый из которых полностью включен в настоящий документ посредством ссылки для всех целей. В частности, в вителлиновом слое создавали небольшое отверстие для облегчения инъекции целевых mESC. Эти инъецированные 8-клеточные эмбрионы переносили суррогатным матерям для получения живых детенышей, несущих трансген. После гестации у суррогатной матери инъецированные эмбрионы производили мышей F0, которые не несут определяемого вклада эмбриона-хозяина. Мыши, полностью полученные из клеток ES, были нормальными, здоровыми и фертильными (с передачей зародышевой линии). Этот аллель можно использовать для оценки нецелевого потенциала редактирования системы Cas9. Когда Cas9 и sgRNA вводятся мыши через инъекцию в хвостовую вену липидных наночастиц (LNP) или аденоассоциированного вируса (AAV), они могут редактировать печень. Оценка редактирования в других тканях также может быть предпринята с использованием этих способов доставки. После инъекции собирают различные ткани мыши и окрашивают lacZ. Все ткани, отредактированные с помощью введенной Cas9 и sgRNA, экспрессируют lacZ, что позволяет определить, не затрагиваются ли какие-либо неожиданные ткани редактированием Cas9. Эту систему можно использоваться для оценки дополнительных способов доставки, а также возможности редактирования различных серотипов AAV.
Мышей, содержащих репортерный аллель CRISPR LSL-LacZ:eBFP, интегрированный в локус Rosa26, распределяли на следующие группы: (1) направляющая РНК удаления полиА (gRNA #16) + липидная наночастица Cas9 (LNP) (4 мыши); (2) направляющая РНК gU2 + направляющая РНК gD1 + LNP Cas9 (4 мыши); (3) нережущая направляющая РНК + LNP Cas9 (2 мыши) и (4) LNP рекомбиназы Cre (1 мышь). Животным вводили 2 мг/кг LNP в 200 мкл трисолевого сахарозного буфера путем инъекции в хвостовую вену. Cas9 был в форме mRNA, gRNA была в форме РНК, а рекомбиназа Cre была в форме mRNA. Через неделю после инъекции животных умерщвляли и собирали ткани для визуализации всего препарата/окрашивания lacZ, для фиксации в 10% формалине для гистологии/иммуногистохимии и для секвенирования следующего поколения (NGS). Ткани, которые были собраны, включали печень, селезенку, поджелудочную железу, почку, скелетные мышцы, гонаду, сердце, легкое и головной мозг. Результаты окрашивания всего препарата печени lacZ через 72 часа в бета-галактозидазе показаны на фиг. 7. Вкратце, печень фиксировали в PFA в течение 30 минут на льду и затем трижды промывали в течение 20 минут на льду. Окрашивание X-Gal проводили в течение 72 часов на льду с перемешиванием и промывкой в PBS. Печени фиксировали в формалине в течение ночи при температуре 4°С и затем промывали PBS. Мыши, получавшие Cre, демонстрировали обильное окрашивание lacZ, в то время как мыши, получавшие нережущую направляющую РНК, не обнаруживали окрашивания. Обе группы исследуемых мышей - получавшие направляющую РНК удаления полиА или комбинацию направляющих РНК gU2 и gD1 - демонстрировали окрашивание lacZ, что указывает на то, что сигнал полиаденилирования выше против хода транскрипции был удален в печени мышей in vivo. Эти результаты согласуются с результатами иммуногистохимии lacZ, показанными на фиг. 8. Вкратце, фиксированные формалином погруженные в парафин срезы печени депарафинизировали с последующим извлечением антигена и затем блокировали. Затем предметные стекла инкубировали с антителом против LACZ и связывали со вторичным антителом, конъюгированным с HRP (пероксидазой хрена). Эти ткани затем инкубировали в DAB до тех пор, пока положительные клетки не проявили коричневый цвет. Предметные стекла затем сканировали и идентифицировали положительные клетки. Неудивительно, что окрашивание было ниже, чем таковое для рекомбиназы Сrе, поскольку рекомбиназа Cre обеспечивает более легкое вырезание рА pgk, в то время как направляющие РНК полагаются на эффективность NHEJ и совпадение образования комплекса gRNA + Cas9 в двух разных местах, чтобы произошло разрушение. Точно так же эти результаты также согласуются с результатами секвенирования следующего поколения печени, отобранной от различных мышей, как показано на фиг. 11. Как показано на фиг. 11, эффективность редактирования (т.е. количество считываний с удалением между целевыми последовательностями gRNA) была выше для мышей gU2+gD1+Cas9 и мышей с направляющей РНК удаления поли A+Cas9, чем у мышей с отрицательным контролем (нережущая направляющая РНК плюс Cas9, или gU2+ gD1 без Cas9). Аналогично окрашиванию всего препарата и иммуногистохимии, обработка рекомбиназой Cre приводила к еще более высоким уровням редактирования. Эти результаты полного окрашивания, иммуногистохимия и результаты NGS указывают на то, что репортер CRISPR LSL-LacZ:eBFP может эффективно использоваться в качестве репортера для опосредованной CRISPR/Cas активности NHEJ in vivo. Различные целевые последовательности направляющей РНК могут быть встроены в репортер для исследования различных направляющих РНК.
Для исследования способности CRISPR/Cas9 превращать eBFP в eGFP посредством направляемой гомологией репарации в репортерном аллеле CRISPR LSL-LacZ:eBFP, эмбриональные стволовые клетки, содержащие обработанный рекомбиназой Cre репортерный аллель, геномно интегрированный в локусе Rosa26 (т.е. репортерный аллель CRISPR L-LacZ:eBFP с сигналом полиаденилирования выше против хода транскрипции был удален) электропорировали с помощью Cas9 (20 мкг) и направляющей РНК, которая нацелена на целевую последовательность в eBFP (2,5 мкг) в форме рибонуклеопротеинового комплекса и ssODN (35 мкг), предназначенного для преобразования eBFP в eGFP. Целевая последовательность направляющей РНК представлена в SEQ ID NO: 42, а направляющая последовательность направляющей РНК представлена в SEQ ID NO: 14. Используется любой из двух ssODN (F и R, обозначающие «прямую» и «обратную» комплементарные одинарные цепи; SEQ ID NO: 15 и 16, соответственно).
Аллель eBFP/eGFP Lox-Stop-Lox (LSL), как изображено на фиг. 3, также может представлять собой эффективный репортер HDR в эмбриональных стволовых клетках мыши (mESC), а также в ткани взрослой мыши. При включении аллеля LSL-eBFP в Rosa26, eBFP, как правило, не экспрессируется в клетках и тканях. Если неомициновая кассета тройного сигнала полиаденилирования удаляется с помощью Cre, eBFP может экспрессировать. Может быть введена направляющая РНК, чтобы вызвать разрыв двойной цепи в eBFP, а донор-репаратор, содержащий мутацию H66Y, может быть введен для преобразования eBFP в eGFP (или, в качестве альтернативы, для репортера LSL-eGFP, индуцировать разрыв двойной цепи в eGFP и представить донора-репаратора, содержащего мутацию Y66H для преобразования eGFP в eBFP).
Для исследования способности CRISPR/Cas9 преобразовывать eBFP в eGFP посредством направляемой гомологией репарации в репортерном аллеле CRISPR LSL-eBFP, в котором сигнал полиаденилирования выше против хода транскрипции был удален рекомбиназой Cre (репортерный аллель CRISPR L-eBFP), эмбриональные стволовые клетки, содержащие репортерный аллель, подвергали электр операции с помощью Cas9 (20 мкг) и направляющей РНК, которая нацелена на целевую последовательность в eBFP (2,5 мкг) в форме рибонуклеопротеинового комплекса и ssODN (35 мкг), предназначенных для превращения eBFP в eGFP. Целевая последовательность направляющей РНК представлена в SEQ ID NO: 42, а направляющая последовательность направляющей РНК представлена в SEQ ID NO: 14. Два sSODN (F и R, представляющие «прямую» и «обратную» комплементарную одинарную цепь; SEQ ID NO: 15 и 16, соответственно) использовали в отдельных экспериментах. Как показано на фиг. 9, CRISPR/Cas9 и ssODN F успешно преобразовывали eBFP в eGFP, и eGFP экспрессировался. В верхнем ряду на фиг. 9 показаны изображения светлопольной микроскопии, а в нижнем ряду - изображения флуоресцентной микроскопии (eGFP).
Подобные эксперименты выполняли в гемопоэтических стволовых клетках и клетках-предшественниках ex vivo. Чтобы исследовать способность CRISPR/Cas9 преобразовывать eBFP в eGFP посредством направляемой гомологией репарации в репортерном аллеле CRISPR LSL-eBFP, в котором был удален сигнал полиаденилирования выше против хода транскрипции (репортерный аллель CRISPR L-eBFP), клетки костного мозга выделяли из мышей, содержащих репортер, интегрированный в локус Rosa26. Вкратце, у мышей собирали бедра и голени и извлекали костный мозг. Гемопоэтические клетки и клетки-предшественники (HSPC) дополнительно выделяли с использованием набора EasySep от STEMCELL. Клетки высевали в 24-луночные планшеты с плотностью от 250000 до 1000000 клеток на лунку в среде StemSpan SFEM (STEM cell # 09650), содержащей SCF в концентрации 100 нг/мл, ТРО в концентрации 100 нг/мл, Flt3L в концентрации 100 нг/мл, IL-6 в концентрации 50 нг/мл и IL-3 в концентрации 30 нг/мл. Клетки подвергали электропорации с помощью Cas9, направляющей РНК, которая нацелена на целевую последовательность в eBFP, и ssODN, предназначенного для преобразования eBFP в eGFP. Целевая последовательность направляющей РНК представлена в SEQ ID NO: 42, а направляющая последовательность направляющей РНК представлена в SEQ ID NO: 14. Последовательности используемых ssODN представлены в SEQ ID NO: 15 и 16.
В частности, использовали RNP Cas9-sgRNA, которые получали путем инкубации от 200 нг до 1 мкг sgRNA с 1 мкг белка Cas9 (PNA Bio) в течение 10-15 минут при комнатной температуре, а затем электропорации в 10000 мышиных кроветворных стволовых клеток и клеток-предшественников (HSPC) через 1-3 часа в культуре. Оптимизированные условия электропорации для мышиных HSPC составляют 1700 В, 20 мс и 1 импульс с использованием системы трансфекции Neon (Thermo Fisher Scientific). Следующие условия ЕР исследовали с использованием 10 нМ ssODN + RNP Cas9 + sgRNA: (1) 1720 В, ширина импульса 10, 2 импульса и плотность клеток: 5е6; (2) 1680 В, ширина импульса 20, 1 импульс и плотность клеток: 6е7; и (3) 1700 В, ширина импульса 20, 1 импульс и плотность клеток: 1е8. Изображения светлопольной и флуоресцентной микроскопии через 48 часов после электропорации (1720 В, ширина импульса 10, 2 импульса, плотность клеток: 5е6) с использованием RNP Cas9/sgRNA и RNP ssODN FW или RNP Cas9/sgRNA и ssODN REV показаны на фиг. 10А. Необработанные клетки использовали в качестве отрицательного контроля. Изображения светлопольной микроскопии отображаются в верхнем ряду, а изображения флуоресцентной микроскопии (eGFP) - в нижнем ряду. Изображения клеток через 7 дней после электропорации показаны на фиг. 10В. В первом столбце показаны изображения светлопольной микроскопии, а во втором и третьем столбцах показаны изображения флуоресцентной микроскопии (eGFP). Флуоресценция особенно отчетлива в некоторых более крупных дифференцированных клетках. Как показано на фиг. 10А и 10В, CRISPR/Cas9 и ssODN успешно преобразовывали eBFP в eGFP ex vivo в первичных клетках, выделенных от мышей-репортеров L-eBFP, и eGFP экспрессируется.
Чтобы определить эффективность eGFP в качестве считывания HDR у взрослых мышей in vivo, mESC, на которые нацелен репортерный аллель CRISPR, показанный на фиг. 1А или 3, или обработанные рекомбиназой Cre версии этих аллелей микроинъецировали в 8-клеточные эмбрионы мыши с использованием способа VELOCIMOUSE®. Смотрите, например, US 7576259; US 7659442; US 7294754; US 2008/007800 и публикацию Poueymirou et al. (2007) Nature Вiotech. 25(1):91-99, каждая из которых полностью включена в настоящий документ посредством ссылки для всех целей. В частности, в вителлиновом слое создавали небольшое отверстие для облегчения инъекции нацеленных mESC. Эти инъецированные 8-клеточные эмбрионы переносили суррогатным матерям для получения живых детенышей, несущих трансген. После гестации у суррогатной матери инъецированные эмбрионы производили мышей F0, которые не несут обнаруживаемого вклада эмбриона-хозяина. Мыши, полностью полученные из клеток ES, были нормальными, здоровыми и фертильными (с передачей зародышевой линии). Мышей можно использовать для оценки возможности исправления мутации в печени взрослых мышей с использованием системы Cas9. С этой целью первичные гепатоциты собирают от нацеленных LSL-eBFP/eGFP мышей и используют для оценки способов коррекции точечной мутации в этих неделящихся клетках. Может быть определен наиболее эффективный подход. Все материалы затем вводят в мышь посредством инъекции липидных наночастиц или аденоассоциированного вируса в хвостовую вену или другим подходящим способом доставки. Собирают печень или другие ткани этих мышей и проводят оценку экспрессии eGFP для поиска правильно модифицированных клеток. Секвенирование следующего поколения также выполняют для поиска правильно модифицированных клеток. Секвенирование следующего поколения и RNAseq могут предоставить информацию о типах клеток в печени или других тканях, в которых активен CRISPR/Cas9.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110>Ридженеронфармасьютикалс, Инк.
<120>СПОСОБЫ И КОМПОЗИЦИИДЛЯ ОЦЕНКИ ОПОСРЕДОВАННОГО CRISPR/CAS
РАЗРУШЕНИЯИЛИ ВЫРЕЗАНИЯИ ИНДУЦИРОВАННОЙ CRISPR/CAS РЕКОМБИНАЦИИ С
ЭКЗОГЕННОЙ ДОНОРСКОЙ НУКЛЕИНОВОЙ КИСЛОТОЙ IN VIVO
<130> 57766-516565
<150> US 62/539,279
<151> 2017-07-31
<160> 60
<170> PatentIn версия 3.5
<210> 1
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 1
gctggactac gtcgtgtgcc 20
<210> 2
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 2
cgaccugaug cagcucucgg 20
<210> 3
<211> 18
<212> PRT
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 3
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 4
<211> 19
<212> PRT
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 4
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 5
<211> 20
<212> PRT
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 5
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 6
<211> 22
<212> PRT
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 6
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 7
<211> 82
<212>РНК
<213>Искусственнаяпоследовательность
<220>
<223>Синтетическая
<400> 7
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 8
<211> 76
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 8
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 9
<211> 86
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 9
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 10
<211> 23
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (2)..(21)
<223> n = A, T, C или G
<400> 10
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 11
<211> 23
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(21)
<223> n = A, T, C или G
<400> 11
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 12
<211> 25
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (3)..(23)
<223> n = A, T, C или G
<400> 12
ggnnnnnnnn nnnnnnnnnn nnngg 25
<210> 13
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 13
cgacttcgtg acgtgcggta 20
<210> 14
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 14
gcugaagcac ugcacgccau 20
<210> 15
<211> 123
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 15
ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 60
tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 120
tcc 123
<210> 16
<211> 123
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 16
ggacttgaag aagtcgtgct gcttcatgtg gtcggggtag cggctgaagc actgcacgcc 60
gtaggtcagg gtggtcacga gggtgggcca gggcacgggc agcttgccgg tggtgcagat 120
gaa 123
<210> 17
<211> 7807
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(120)
<223>Последовательность мыши выше против хода транскрипции
<220>
<221> misc_feature
<222> (215)..(234)
<223>Целевой сайт v2 sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (243)..(262)
<223>Целевой сайт v4 sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (248)..(281)
<223> LoxP
<220>
<221> misc_feature
<222> (263)..(282)
<223>Целевой сайт v3 sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (305)..(327)
<223>Целевой сайт v1А sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (336)..(796)
<223>Поли(A) Pgk
<220>
<221> misc_feature
<222> (337)..(356)
<223>Целевойсайт v4 sgRNA (cGM4) разрушения Pgk
<220>
<221> misc_feature
<222> (371)..(376)
<223>Мотив распознавания поли(А) Pgk
<220>
<221> misc_feature
<222> (385)..(404)
<223>Целевой сайт v5 sgRNA (cGM5) разрушения Pgk
<220>
<221> misc_feature
<222> (405)..(424)
<223>Целевой сайт v1 sgRNA (cGM2) разрушения Pgk
<220>
<221> misc_feature
<222> (452)..(471)
<223>Целевой сайт v2 sgRNA (cGM) разрушения Pgk
<220>
<221> misc_feature
<222> (571)..(590)
<223>Целевой сайт v3 sgRNA (cGM3) разрушения Pgk
<220>
<221> misc_feature
<222> (794)..(813)
<223>Целевой сайт v5 sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (797)..(819)
<223>Целевой сайт v1В sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (803)..(822)
<223>Целевой сайт v6 sgRNA вырезания Pgk
<220>
<221> misc_feature
<222> (820)..(853)
<223> LoxP
<220>
<221> misc_feature
<222> (862)..(3930)
<223> LacZ
<220>
<221> misc_feature
<222> (3931)..(3996)
<223> P2A
<220>
<221> misc_feature
<222> (3997)..(4713)
<223> eBFP
<220>
<221> misc_feature
<222> (4193)..(4212)
<223>Целевойсайт sgRNA eBFP
<220>
<221> misc_feature
<222> (4748)..(4969)
<223>Поли(A) SV40
<220>
<221> misc_feature
<222> (4976)..(5023)
<223> Frt
<220>
<221> misc_feature
<222> (5030)..(6242)
<223>Промотор убиквитина С человека
<220>
<221> misc_feature
<222> (6243)..(6309)
<223>Промотор EM7
<220>
<221> misc_feature
<222> (6310)..(7113)
<223>Неомицин-фосфотрансфераза
<220>
<221> misc_feature
<222> (7122)..(7598)
<223>Поли(A) Pgk
<220>
<221> misc_feature
<222> (7609)..(7656)
<223> Frt
<220>
<221> misc_feature
<222> (7663)..(7807)
<223>Последовательность мыши ниже по ходу транскрипции
<400> 17
ggagtgttgc aatacctttc tgggagttct ctgctgcctc ctggcttctg aggaccgccc 60
tgggcctggg agaatccctt ccccctcttc cctcgtgatc tgcaactcca gtctttctag 120
ttgaccagct cggcggtgac ctgcacgtct agggcgcagt agtccagggt ttccttgatg 180
atgtcatact tatcctgtcc cttttttttc cacagggcgc gccactagtg gatccggaac 240
ccttaatata acttcgtata atgtatgcta tacgaagtta ttaggtccct cgacctgcag 300
gaatcgacct gatgcagctc tcggaggggg gatccgctgt aagtctgcag aaattgatga 360
tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata ctttgttaag 420
aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg ggggtggggg 480
tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat tgctttatga 540
taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa gggccagctc 600
attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 660
tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 720
aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 780
gttctaattc catcagcgac ctgatgcagc tctcggagga taacttcgta taatgtatgc 840
tatacgaagt tatccgccac catgggtacc gatttaaatg atccagtggt cctgcagagg 900
agagattggg agaatcccgg tgtgacacag ctgaacagac tagccgccca ccctcccttt 960
gcttcttgga gaaacagtga ggaagctagg acagacagac caagccagca actcagatct 1020
ttgaacgggg agtggagatt tgcctggttt ccggcaccag aagcggtgcc ggaaagctgg 1080
ctggagtgcg atcttcctga ggccgatact gtcgtcgtcc cctcaaactg gcagatgcac 1140
ggttacgatg cgcccatcta caccaacgtg acctatccca ttacggtcaa tccgccgttt 1200
gttcccacgg agaatccgac gggttgttac tcgctcacat ttaatgttga tgaaagctgg 1260
ctacaggaag gccagacgcg aattattttt gatggcgtta actcggcgtt tcatctgtgg 1320
tgcaacgggc gctgggtcgg ttacggccag gacagtcgtt tgccgtctga atttgacctg 1380
agcgcatttt tacgcgccgg agaaaaccgc ctcgcggtga tggtgctgcg ctggagtgac 1440
ggcagttatc tggaagatca ggatatgtgg cggatgagcg gcattttccg tgacgtctcg 1500
ttgctgcata aaccgactac acaaatcagc gatttccatg ttgccactcg ctttaatgat 1560
gatttcagcc gcgctgtact ggaggctgaa gttcagatgt gcggcgagtt gcgtgactac 1620
ctacgggtaa cagtttcttt atggcagggt gaaacgcagg tcgccagcgg caccgcgcct 1680
ttcggcggtg aaattatcga tgagcgtggt ggttatgccg atcgcgtcac actacgtctg 1740
aacgtcgaaa acccgaaact gtggagcgcc gaaatcccga atctctatcg tgcggtggtt 1800
gaactgcaca ccgccgacgg cacgctgatt gaagcagaag cctgcgatgt cggtttccgc 1860
gaggtgcgga ttgaaaatgg tctgctgctg ctgaacggca agccgttgct gattcgaggc 1920
gttaaccgtc acgagcatca tcctctgcat ggtcaggtca tggatgagca gacgatggtg 1980
caggatatcc tgctgatgaa gcagaacaac tttaacgccg tgcgctgttc gcattatccg 2040
aaccatccgc tgtggtacac gctgtgcgac cgctacggcc tgtatgtggt ggatgaagcc 2100
aatattgaaa cccacggcat ggtgccaatg aatcgtctga ccgatgatcc gcgctggcta 2160
ccggcgatga gcgaacgcgt aacgcgaatg gtgcagcgcg atcgtaatca cccgagtgtg 2220
atcatctggt cgctggggaa tgaatcaggc cacggcgcta atcacgacgc gctgtatcgc 2280
tggatcaaat ctgtcgatcc ttcccgcccg gtgcagtatg aaggcggcgg agccgacacc 2340
acggccaccg atattatttg cccgatgtac gcgcgcgtgg atgaagacca gcccttcccg 2400
gctgtgccga aatggtccat caaaaaatgg ctttcgctac ctggagagac gcgcccgctg 2460
atcctttgcg aatacgccca cgcgatgggt aacagtcttg gcggtttcgc taaatactgg 2520
caggcgtttc gtcagtatcc ccgtttacag ggcggcttcg tctgggactg ggtggatcag 2580
tcgctgatta aatatgatga aaacggcaac ccgtggtcgg cttacggcgg tgattttggc 2640
gatacgccga acgatcgcca gttctgtatg aacggtctgg tctttgccga ccgcacgccg 2700
catccagcgc tgacggaagc aaaacaccag cagcagtttt tccagttccg tttatccggg 2760
caaaccatcg aagtgaccag cgaatacctg ttccgtcata gcgataacga gctcctgcac 2820
tggatggtgg cgctggatgg taagccgctg gcaagcggtg aagtgcctct ggatgtcgct 2880
ccacaaggta aacagttgat tgaactgcct gaactaccgc agccggagag cgccgggcaa 2940
ctctggctca cagtacgcgt agtgcaaccg aacgcgaccg catggtcaga agccgggcac 3000
atcagcgcct ggcagcagtg gcgtctggcg gaaaacctca gtgtgacgct ccccgccgcg 3060
tcccacgcca tcccgcatct gaccaccagc gaaatggatt tttgcatcga gctgggtaat 3120
aagcgttggc aatttaaccg ccagtcaggc tttctttcac agatgtggat tggcgataaa 3180
aaacaactgc tgacgccgct gcgcgatcag ttcacccgtg caccgctgga taacgacatt 3240
ggcgtaagtg aagcgacccg cattgaccct aacgcctggg tcgaacgctg gaaggcggcg 3300
ggccattacc aggccgaagc agcgttgttg cagtgcacgg cagatacact tgctgatgcg 3360
gtgctgatta cgaccgctca cgcgtggcag catcagggga aaaccttatt tatcagccgg 3420
aaaacctacc ggattgatgg tagtggtcaa atggcgatta ccgttgatgt tgaagtggcg 3480
agcgatacac cgcatccggc gcggattggc ctgaactgcc agctggcgca ggtagcagag 3540
cgggtaaact ggctcggatt agggccgcaa gaaaactatc ccgaccgcct tactgccgcc 3600
tgttttgacc gctgggatct gccattgtca gacatgtata ccccgtacgt cttcccgagc 3660
gaaaacggtc tgcgctgcgg gacgcgcgaa ttgaattatg gcccacacca gtggcgcggc 3720
gacttccagt tcaacatcag ccgctacagt caacagcaac tgatggaaac cagccatcgc 3780
catctgctgc acgcggaaga aggcacatgg ctgaatatcg acggtttcca tatggggatt 3840
ggtggcgacg actcctggag cccgtcagta tcggcggaat tccagctgag cgccggtcgc 3900
taccattacc agttggtctg gtgtcaaaaa ggaagcggag ctactaactt cagcctgctg 3960
aagcaggctg gagacgtgga ggagaaccct ggacctgtga gcaagggcga ggagctgttc 4020
accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 4080
gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc 4140
accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac ccatggcgtg 4200
cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 4260
cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 4320
cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 4380
gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 4440
aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc 4500
cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc 4560
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc 4620
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 4680
atcactctcg gcatggacga gctgtacaag taataattct agagtcgggg cggccggccg 4740
cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4800
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4860
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4920
gaggtgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtac tcgaggaagt 4980
tcctattccg aagttcctat tctctagaaa gtataggaac ttcatgcatg gcctccgcgc 5040
cgggttttgg cgcctcccgc gggcgccccc ctcctcacgg cgagcgctgc cacgtcagac 5100
gaagggcgca gcgagcgtcc tgatccttcc gcccggacgc tcaggacagc ggcccgctgc 5160
tcataagact cggccttaga accccagtat cagcagaagg acattttagg acgggacttg 5220
ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga aaagtagtcc 5280
cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg attatataag 5340
gacgcgccgg gtgtggcaca gctagttccg tcgcagccgg gatttgggtc gcggttcttg 5400
tttgtggatc gctgtgatcg tcacttggtg agtagcgggc tgctgggctg gccggggctt 5460
tcgtggccgc cgggccgctc ggtgggacgg aagcgtgtgg agagaccgcc aagggctgta 5520
gtctgggtcc gcgagcaagg ttgccctgaa ctgggggttg gggggagcgc agcaaaatgg 5580
cggctgttcc cgagtcttga atggaagacg cttgtgaggc gggctgtgag gtcgttgaaa 5640
caaggtgggg ggcatggtgg gcggcaagaa cccaaggtct tgaggccttc gctaatgcgg 5700
gaaagctctt attcgggtga gatgggctgg ggcaccatct ggggaccctg acgtgaagtt 5760
tgtcactgac tggagaactc ggtttgtcgt ctgttgcggg ggcggcagtt atggcggtgc 5820
cgttgggcag tgcacccgta cctttgggag cgcgcgccct cgtcgtgtcg tgacgtcacc 5880
cgttctgttg gcttataatg cagggtgggg ccacctgccg gtaggtgtgc ggtaggcttt 5940
tctccgtcgc aggacgcagg gttcgggcct agggtaggct ctcctgaatc gacaggcgcc 6000
ggacctctgg tgaggggagg gataagtgag gcgtcagttt ctttggtcgg ttttatgtac 6060
ctatcttctt aagtagctga agctccggtt ttgaactatg cgctcggggt tggcgagtgt 6120
gttttgtgaa gttttttagg caccttttga aatgtaatca tttgggtcaa tatgtaattt 6180
tcagtgttag actagtaaat tgtccgctaa attctggccg tttttggctt ttttgttaga 6240
cgtgttgaca attaatcatc ggcatagtat atcggcatag tataatacga caaggtgagg 6300
aactaaacca tgggatcggc cattgaacaa gatggattgc acgcaggttc tccggccgct 6360
tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 6420
gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 6480
ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 6540
gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 6600
ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 6660
atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 6720
caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 6780
caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 6840
aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc ctgcttgccg 6900
aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 6960
gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 7020
gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 7080
gccttctatc gccttcttga cgagttcttc tgaggggatc cgctgtaagt ctgcagaaat 7140
tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct gtcatacttt 7200
gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga gctacggggg 7260
tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt tactattgct 7320
ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca aattaagggc 7380
cagctcattc ctcccactca tgatctatag atctatagat ctctcgtggg atcattgttt 7440
ttctcttgat tcccactttg tggttctaag tactgtggtt tccaaatgtg tcagtttcat 7500
agcctgaaga acgagatcag cagcctctgt tccacataca cttcattctc agtattgttt 7560
tgccaagttc taattccatc agacctcgac ctgcagcccc tagtcgacga agttcctatt 7620
ccgaagttcc tattctctag aaagtatagg aacttcgcta gctaaaattg gagggacaag 7680
acttcccaca gattttcggt tttgtcggga agttttttaa taggggcaaa taaggaaaat 7740
gggaggatag gtagtcatct ggggttttat gcagcaaaac tacaggttat tattgcttgt 7800
gatccgc 7807
<210> 18
<211> 3716
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(172)
<223>Последовательность мыши выше против хода транскрипции
<220>
<221> misc_feature
<222> (226)..(259)
<223> LoxP
<220>
<221> misc_feature
<222> (357)..(423)
<223>Промотор EM7
<220>
<221> misc_feature
<222> (424)..(1227)
<223>Неомицин-фосфотрансфераза
<220>
<221> misc_feature
<222> (1236)..(2489)
<223>Тройной поли(A)
<220>
<221> misc_feature
<222> (2517)..(2550)
<223> LoxP
<220>
<221> misc_feature
<222> (2596)..(3315)
<223> eBFP
<220>
<221> misc_feature
<222> (2795)..(2814)
<223>Целевой сайт sgRNAeBFP
<220>
<221> misc_feature
<222> (3350)..(3571)
<223>Поли(A) SV40
<220>
<221> misc_feature
<222> (3572)..(3716)
<223>Последовательность мыши ниже по ходу транскрипции
<400> 18
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc aggaattgtt 360
gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa 420
accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 480
gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 540
ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 600
ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 660
tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 720
gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 780
gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 840
gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 900
gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 960
cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 1020
atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 1080
cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 1140
gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 1200
tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag aaattgatga 1260
tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata ctttgttaag 1320
aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg ggggtggggg 1380
tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat tgctttatga 1440
taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa gggccagctc 1500
attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560
tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620
aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680
gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740
atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980
tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040
aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220
atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460
catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520
cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580
gcccgggccg ccaccatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc 2640
ctggttgagc tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag 2700
ggcgatgcca cctacggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc 2760
gtgccctggc ccaccctcgt gaccaccctg acccatggcg tgcagtgctt cagccgctac 2820
cccgaccaca tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag 2880
gagcgcacca tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc 2940
gagggcgaca ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc 3000
aacatcctgg ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcatggcc 3060
gacaagcaga agaacggcat caaggtgaac ttcaagatcc gccacaacat cgaggacggc 3120
agcgtgcagc tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg 3180
ctgcccgaca accactacct gagcacccag tccgccctga gcaaagaccc caacgagaag 3240
cgcgatcaca tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac 3300
gagctgtaca agtaataatt ctagagtcgg ggcggccggc cgcttcgagc agacatgata 3360
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 3420
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 3480
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 3540
taaagcaagt aaaacctcta caaatgtggt actcgagtaa aattggaggg acaagacttc 3600
ccacagattt tcggttttgt cgggaagttt tttaataggg gcaaataagg aaaatgggag 3660
gataggtagt catctggggt tttatgcagc aaaactacag gttattattg cttgtg 3716
<210> 19
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 19
cccgcgcggt gatcacctag 20
<210> 20
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 20
gggcgcgcca cuaguggauc 20
<210> 21
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 21
catacgatat gcttcaataa 20
<210> 22
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 22
guaugcuaua cgaaguuauu 20
<210> 23
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 23
taatatgctt caatataatt 20
<210> 24
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 24
auuauacgaa guuauauuaa 20
<210> 25
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 25
gtcgctggac tacgtcgaga 20
<210> 26
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 26
cagcgaccug augcagcucu 20
<210> 27
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 27
ataggaggct ctcgacgtag 20
<210> 28
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 28
uauccuccga gagcugcauc 20
<210> 29
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 29
ccuucuuaac aaaguaugac 20
<210> 30
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 30
uggaaggauu ggagcuacgg 20
<210> 31
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 31
aacaagcaaa accaaauuaa 20
<210> 32
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 32
ggaagaattg tttcatactg 20
<210> 33
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 33
accttcctaa cctcgatgcc 20
<210> 34
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 34
ttgttcgttt tggtttaatt 20
<210> 35
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 35
caauuucugc agacuuacag 20
<210> 36
<211> 20
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 36
aggaaaaacu uccauuuuag 20
<210> 37
<211> 16
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 37
guuuuagagc uaugcu 16
<210> 38
<211> 67
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 38
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 39
<211> 77
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 39
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 40
<211> 1053
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 40
augcccaaga agaagaggaa gguguccaau uuacugaccg uacaccaaaa uuugccugca 60
uuaccggucg augcaacgag ugaugagguu cgcaagaacc ugauggacau guucagggau 120
cgccaggcgu uuucugagca uaccuggaaa augcuucugu ccguuugccg gucgugggcg 180
gcauggugca aguugaauaa ccggaaaugg uuucccgcag aaccugaaga uguucgcgau 240
uaucuucuau aucuucaggc gcgcggucug gcaguaaaaa cuauccagca acauuugggc 300
cagcuaaaca ugcuucaucg ucgguccggg cugccacgac caagugacag caaugcuguu 360
ucacugguua ugcggcggau ccgaaaagaa aacguugaug ccggugaacg ugcaaaacag 420
gcucuagcgu ucgaacgcac ugauuucgac cagguucguu cacucaugga aaauagcgau 480
cgcugccagg auauacguaa ucuggcauuu cuggggauug cuuauaacac ccuguuacgu 540
auagccgaaa uugccaggau caggguuaaa gauaucucac guacugacgg ugggagaaug 600
uuaauccaua uuggcagaac gaaaacgcug guuagcaccg cagguguaga gaaggcacuu 660
agccuggggg uaacuaaacu ggucgagcga uggauuuccg ucucuggugu agcugaugau 720
ccgaauaacu accuguuuug ccgggucaga aaaaauggug uugccgcgcc aucugccacc 780
agccagcuau caacucgcgc ccuggaaggg auuuuugaag caacucaucg auugauuuac 840
ggcgcuaagg augacucugg ucagagauac cuggccuggu cuggacacag ugcccguguc 900
ggagccgcgc gagauauggc ccgcgcugga guuucaauac cggagaucau gcaagcuggu 960
ggcuggacca auguaaauau ugucaugaac uauauccgua accuggauag ugaaacaggg 1020
gcaauggugc gccugcugga agauggcgau uag 1053
<210> 41
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 41
cgacctgatg cagctctcgg 20
<210> 42
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 42
gctgaagcac tgcacgccat 20
<210> 43
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 43
gggcgcgcca ctagtggatc 20
<210> 44
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 44
gtatgctata cgaagttatt 20
<210> 45
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 45
attatacgaa gttatattaa 20
<210> 46
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 46
cagcgacctg atgcagctct 20
<210> 47
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 47
tatcctccga gagctgcatc 20
<210> 48
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 48
ccttcttaac aaagtatgac 20
<210> 49
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 49
tggaaggatt ggagctacgg 20
<210> 50
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 50
aacaagcaaa accaaattaa 20
<210> 51
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 51
caatttctgc agacttacag 20
<210> 52
<211> 20
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 52
aggaaaaact tccattttag 20
<210> 53
<211> 1391
<212> PRT
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 53
Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
20 25 30
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
35 40 45
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
50 55 60
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
65 70 75 80
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
85 90 95
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
100 105 110
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
115 120 125
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
130 135 140
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
145 150 155 160
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
165 170 175
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
180 185 190
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
195 200 205
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
210 215 220
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
225 230 235 240
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
245 250 255
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
260 265 270
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
275 280 285
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
290 295 300
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
305 310 315 320
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
325 330 335
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
340 345 350
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
355 360 365
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
370 375 380
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
385 390 395 400
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
405 410 415
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
420 425 430
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
435 440 445
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
450 455 460
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
465 470 475 480
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
485 490 495
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
500 505 510
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
515 520 525
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
530 535 540
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
545 550 555 560
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
565 570 575
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
580 585 590
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
595 600 605
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
610 615 620
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
625 630 635 640
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
645 650 655
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
660 665 670
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
675 680 685
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
690 695 700
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
705 710 715 720
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
725 730 735
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
740 745 750
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
755 760 765
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
770 775 780
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
785 790 795 800
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
805 810 815
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
820 825 830
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
835 840 845
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
850 855 860
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
865 870 875 880
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
885 890 895
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
930 935 940
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
945 950 955 960
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
965 970 975
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1010 1015 1020
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1025 1030 1035
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1040 1045 1050
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1055 1060 1065
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1070 1075 1080
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1085 1090 1095
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1100 1105 1110
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1115 1120 1125
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1130 1135 1140
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1145 1150 1155
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1160 1165 1170
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1175 1180 1185
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1190 1195 1200
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1205 1210 1215
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1220 1225 1230
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1235 1240 1245
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1250 1255 1260
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1265 1270 1275
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1280 1285 1290
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1295 1300 1305
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1310 1315 1320
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1325 1330 1335
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1340 1345 1350
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1355 1360 1365
Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1370 1375 1380
Ala Gly Gln Ala Lys Lys Lys Lys
1385 1390
<210> 54
<211> 4173
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 54
atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60
aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120
gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180
gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240
aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300
gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360
gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420
accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480
atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540
ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600
cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660
gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720
aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780
agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840
gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900
aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960
aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020
ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080
cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140
aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200
aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260
atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320
aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380
cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440
accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500
agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560
ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620
atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680
aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740
tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800
taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860
gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920
gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980
aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040
cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100
atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160
tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220
aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280
cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340
cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400
cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460
tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520
tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580
aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640
gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700
cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760
gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820
atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880
aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940
aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000
ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060
aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120
gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180
aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240
tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300
atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360
aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420
ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480
tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540
tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600
ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660
ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720
aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780
cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840
agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900
tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960
accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020
aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080
ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140
actaagaagg ccggacaggc caaaaagaag aag 4173
<210> 55
<211> 23
<212>РНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 55
gcugaagcac ugcacgccau ggg 23
<210> 56
<211> 23
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<400> 56
gctgaagcac tgcacgccat ggg 23
<210> 57
<211> 1499
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(172)
<223>Последовательность мыши выше против хода транскрипции
<220>
<221> misc_feature
<222> (300)..(333)
<223> LoxP
<220>
<221> misc_feature
<222> (379)..(1098)
<223> eBFP
<220>
<221> misc_feature
<222> (1133)..(1354)
<223>Поли(A) SV40
<220>
<221> misc_feature
<222> (1355)..(1499)
<223>Последовательность мыши ниже по ходу транскрипции
<400> 57
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc agcccaagct 360
agtgcccggg ccgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 420
atcctggttg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 480
gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 540
cccgtgccct ggcccaccct cgtgaccacc ctgacccatg gcgtgcagtg cttcagccgc 600
taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 660
caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 720
ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 780
ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 840
gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 900
ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 960
ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 1020
aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 1080
gacgagctgt acaagtaata attctagagt cggggcggcc ggccgcttcg agcagacatg 1140
ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 1200
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 1260
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 1320
ttttaaagca agtaaaacct ctacaaatgt ggtactcgag taaaattgga gggacaagac 1380
ttcccacaga ttttcggttt tgtcgggaag ttttttaata ggggcaaata aggaaaatgg 1440
gaggataggt agtcatctgg ggttttatgc agcaaaacta caggttatta ttgcttgtg 1499
<210> 58
<211> 7235
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(120)
<223>Последовательность мыши выше против хода транскрипции
<220>
<221> misc_feature
<222> (248)..(281)
<223> LoxP
<220>
<221> misc_feature
<222> (290)..(3358)
<223> LacZ
<220>
<221> misc_feature
<222> (3359)..(3424)
<223> P2A
<220>
<221> misc_feature
<222> (3425)..(4141)
<223> eBFP
<220>
<221> misc_feature
<222> (4176)..(4397)
<223>Поли(A) SV40
<220>
<221> misc_feature
<222> (4404)..(4451)
<223> Frt
<220>
<221> misc_feature
<222> (4458)..(5670)
<223>Промотор убиквитина
<220>
<221> misc_feature
<222> (5671)..(5737)
<223>Промотор EM7
<220>
<221> misc_feature
<222> (5738)..(6541)
<223>Неомицин-фосфотрансфераза
<220>
<221> misc_feature
<222> (6550)..(7026)
<223>Поли(A) Pgk
<220>
<221> misc_feature
<222> (7037)..(7084)
<223> Frt
<220>
<221> misc_feature
<222> (7091)..(7235)
<223>Последовательность мыши ниже по ходу транскрипции
<400> 58
ggagtgttgc aatacctttc tgggagttct ctgctgcctc ctggcttctg aggaccgccc 60
tgggcctggg agaatccctt ccccctcttc cctcgtgatc tgcaactcca gtctttctag 120
ttgaccagct cggcggtgac ctgcacgtct agggcgcagt agtccagggt ttccttgatg 180
atgtcatact tatcctgtcc cttttttttc cacagggcgc gccactagtg gatccggaac 240
ccttaatata acttcgtata atgtatgcta tacgaagtta tccgccacca tgggtaccga 300
tttaaatgat ccagtggtcc tgcagaggag agattgggag aatcccggtg tgacacagct 360
gaacagacta gccgcccacc ctccctttgc ttcttggaga aacagtgagg aagctaggac 420
agacagacca agccagcaac tcagatcttt gaacggggag tggagatttg cctggtttcc 480
ggcaccagaa gcggtgccgg aaagctggct ggagtgcgat cttcctgagg ccgatactgt 540
cgtcgtcccc tcaaactggc agatgcacgg ttacgatgcg cccatctaca ccaacgtgac 600
ctatcccatt acggtcaatc cgccgtttgt tcccacggag aatccgacgg gttgttactc 660
gctcacattt aatgttgatg aaagctggct acaggaaggc cagacgcgaa ttatttttga 720
tggcgttaac tcggcgtttc atctgtggtg caacgggcgc tgggtcggtt acggccagga 780
cagtcgtttg ccgtctgaat ttgacctgag cgcattttta cgcgccggag aaaaccgcct 840
cgcggtgatg gtgctgcgct ggagtgacgg cagttatctg gaagatcagg atatgtggcg 900
gatgagcggc attttccgtg acgtctcgtt gctgcataaa ccgactacac aaatcagcga 960
tttccatgtt gccactcgct ttaatgatga tttcagccgc gctgtactgg aggctgaagt 1020
tcagatgtgc ggcgagttgc gtgactacct acgggtaaca gtttctttat ggcagggtga 1080
aacgcaggtc gccagcggca ccgcgccttt cggcggtgaa attatcgatg agcgtggtgg 1140
ttatgccgat cgcgtcacac tacgtctgaa cgtcgaaaac ccgaaactgt ggagcgccga 1200
aatcccgaat ctctatcgtg cggtggttga actgcacacc gccgacggca cgctgattga 1260
agcagaagcc tgcgatgtcg gtttccgcga ggtgcggatt gaaaatggtc tgctgctgct 1320
gaacggcaag ccgttgctga ttcgaggcgt taaccgtcac gagcatcatc ctctgcatgg 1380
tcaggtcatg gatgagcaga cgatggtgca ggatatcctg ctgatgaagc agaacaactt 1440
taacgccgtg cgctgttcgc attatccgaa ccatccgctg tggtacacgc tgtgcgaccg 1500
ctacggcctg tatgtggtgg atgaagccaa tattgaaacc cacggcatgg tgccaatgaa 1560
tcgtctgacc gatgatccgc gctggctacc ggcgatgagc gaacgcgtaa cgcgaatggt 1620
gcagcgcgat cgtaatcacc cgagtgtgat catctggtcg ctggggaatg aatcaggcca 1680
cggcgctaat cacgacgcgc tgtatcgctg gatcaaatct gtcgatcctt cccgcccggt 1740
gcagtatgaa ggcggcggag ccgacaccac ggccaccgat attatttgcc cgatgtacgc 1800
gcgcgtggat gaagaccagc ccttcccggc tgtgccgaaa tggtccatca aaaaatggct 1860
ttcgctacct ggagagacgc gcccgctgat cctttgcgaa tacgcccacg cgatgggtaa 1920
cagtcttggc ggtttcgcta aatactggca ggcgtttcgt cagtatcccc gtttacaggg 1980
cggcttcgtc tgggactggg tggatcagtc gctgattaaa tatgatgaaa acggcaaccc 2040
gtggtcggct tacggcggtg attttggcga tacgccgaac gatcgccagt tctgtatgaa 2100
cggtctggtc tttgccgacc gcacgccgca tccagcgctg acggaagcaa aacaccagca 2160
gcagtttttc cagttccgtt tatccgggca aaccatcgaa gtgaccagcg aatacctgtt 2220
ccgtcatagc gataacgagc tcctgcactg gatggtggcg ctggatggta agccgctggc 2280
aagcggtgaa gtgcctctgg atgtcgctcc acaaggtaaa cagttgattg aactgcctga 2340
actaccgcag ccggagagcg ccgggcaact ctggctcaca gtacgcgtag tgcaaccgaa 2400
cgcgaccgca tggtcagaag ccgggcacat cagcgcctgg cagcagtggc gtctggcgga 2460
aaacctcagt gtgacgctcc ccgccgcgtc ccacgccatc ccgcatctga ccaccagcga 2520
aatggatttt tgcatcgagc tgggtaataa gcgttggcaa tttaaccgcc agtcaggctt 2580
tctttcacag atgtggattg gcgataaaaa acaactgctg acgccgctgc gcgatcagtt 2640
cacccgtgca ccgctggata acgacattgg cgtaagtgaa gcgacccgca ttgaccctaa 2700
cgcctgggtc gaacgctgga aggcggcggg ccattaccag gccgaagcag cgttgttgca 2760
gtgcacggca gatacacttg ctgatgcggt gctgattacg accgctcacg cgtggcagca 2820
tcaggggaaa accttattta tcagccggaa aacctaccgg attgatggta gtggtcaaat 2880
ggcgattacc gttgatgttg aagtggcgag cgatacaccg catccggcgc ggattggcct 2940
gaactgccag ctggcgcagg tagcagagcg ggtaaactgg ctcggattag ggccgcaaga 3000
aaactatccc gaccgcctta ctgccgcctg ttttgaccgc tgggatctgc cattgtcaga 3060
catgtatacc ccgtacgtct tcccgagcga aaacggtctg cgctgcggga cgcgcgaatt 3120
gaattatggc ccacaccagt ggcgcggcga cttccagttc aacatcagcc gctacagtca 3180
acagcaactg atggaaacca gccatcgcca tctgctgcac gcggaagaag gcacatggct 3240
gaatatcgac ggtttccata tggggattgg tggcgacgac tcctggagcc cgtcagtatc 3300
ggcggaattc cagctgagcg ccggtcgcta ccattaccag ttggtctggt gtcaaaaagg 3360
aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 3420
acctgtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga 3480
cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta 3540
cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac 3600
cctcgtgacc accctgaccc atggcgtgca gtgcttcagc cgctaccccg accacatgaa 3660
gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt 3720
cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct 3780
ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca 3840
caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa 3900
cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc 3960
cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca 4020
ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt 4080
cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta 4140
ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4200
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4260
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4320
cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4380
cctctacaaa tgtggtactc gaggaagttc ctattccgaa gttcctattc tctagaaagt 4440
ataggaactt catgcatggc ctccgcgccg ggttttggcg cctcccgcgg gcgcccccct 4500
cctcacggcg agcgctgcca cgtcagacga agggcgcagc gagcgtcctg atccttccgc 4560
ccggacgctc aggacagcgg cccgctgctc ataagactcg gccttagaac cccagtatca 4620
gcagaaggac attttaggac gggacttggg tgactctagg gcactggttt tctttccaga 4680
gagcggaaca ggcgaggaaa agtagtccct tctcggcgat tctgcggagg gatctccgtg 4740
gggcggtgaa cgccgatgat tatataagga cgcgccgggt gtggcacagc tagttccgtc 4800
gcagccggga tttgggtcgc ggttcttgtt tgtggatcgc tgtgatcgtc acttggtgag 4860
tagcgggctg ctgggctggc cggggctttc gtggccgccg ggccgctcgg tgggacggaa 4920
gcgtgtggag agaccgccaa gggctgtagt ctgggtccgc gagcaaggtt gccctgaact 4980
gggggttggg gggagcgcag caaaatggcg gctgttcccg agtcttgaat ggaagacgct 5040
tgtgaggcgg gctgtgaggt cgttgaaaca aggtgggggg catggtgggc ggcaagaacc 5100
caaggtcttg aggccttcgc taatgcggga aagctcttat tcgggtgaga tgggctgggg 5160
caccatctgg ggaccctgac gtgaagtttg tcactgactg gagaactcgg tttgtcgtct 5220
gttgcggggg cggcagttat ggcggtgccg ttgggcagtg cacccgtacc tttgggagcg 5280
cgcgccctcg tcgtgtcgtg acgtcacccg ttctgttggc ttataatgca gggtggggcc 5340
acctgccggt aggtgtgcgg taggcttttc tccgtcgcag gacgcagggt tcgggcctag 5400
ggtaggctct cctgaatcga caggcgccgg acctctggtg aggggaggga taagtgaggc 5460
gtcagtttct ttggtcggtt ttatgtacct atcttcttaa gtagctgaag ctccggtttt 5520
gaactatgcg ctcggggttg gcgagtgtgt tttgtgaagt tttttaggca ccttttgaaa 5580
tgtaatcatt tgggtcaata tgtaattttc agtgttagac tagtaaattg tccgctaaat 5640
tctggccgtt tttggctttt ttgttagacg tgttgacaat taatcatcgg catagtatat 5700
cggcatagta taatacgaca aggtgaggaa ctaaaccatg ggatcggcca ttgaacaaga 5760
tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc 5820
acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc 5880
ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg acgaggcagc 5940
gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac 6000
tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc 6060
tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac 6120
gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg 6180
tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct 6240
cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg atgatctcgt 6300
cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 6360
attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 6420
ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 6480
tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 6540
aggggatccg ctgtaagtct gcagaaattg atgatctatt aaacaataaa gatgtccact 6600
aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag tacctacatt 6660
ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat aaatgcctgc 6720
tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg gatatcataa 6780
tttaaacaag caaaaccaaa ttaagggcca gctcattcct cccactcatg atctatagat 6840
ctatagatct ctcgtgggat cattgttttt ctcttgattc ccactttgtg gttctaagta 6900
ctgtggtttc caaatgtgtc agtttcatag cctgaagaac gagatcagca gcctctgttc 6960
cacatacact tcattctcag tattgttttg ccaagttcta attccatcag acctcgacct 7020
gcagccccta gtcgacgaag ttcctattcc gaagttccta ttctctagaa agtataggaa 7080
cttcgctagc taaaattgga gggacaagac ttcccacaga ttttcggttt tgtcgggaag 7140
ttttttaata ggggcaaata aggaaaatgg gaggataggt agtcatctgg ggttttatgc 7200
agcaaaacta caggttatta ttgcttgtga tccgc 7235
<210> 59
<211> 7235
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(120)
<223>Последовательнось мыши выше против хода транскрипции
<220>
<221> misc_feature
<222> (248)..(281)
<223> LoxP
<220>
<221> misc_feature
<222> (290)..(3358)
<223> LacZ
<220>
<221> misc_feature
<222> (3359)..(3424)
<223> P2A
<220>
<221> misc_feature
<222> (3425)..(4141)
<223> eGFP
<220>
<221> misc_feature
<222> (4176)..(4397)
<223>Поли(A) SV40
<220>
<221> misc_feature
<222> (4404)..(4451)
<223> Frt
<220>
<221> misc_feature
<222> (4458)..(5670)
<223>Промотор убиквитина
<220>
<221> misc_feature
<222> (5671)..(5737)
<223>Промотор EM7
<220>
<221> misc_feature
<222> (5738)..(6541)
<223>Неомицин-фосфотрансфераза
<220>
<221> misc_feature
<222> (6550)..(7026)
<223>Поли(A)Pgk
<220>
<221> misc_feature
<222> (7037)..(7084)
<223> Frt
<220>
<221> misc_feature
<222> (7091)..(7235)
<223>Последовательность мыши ниже по ходу транскрипции
<400> 59
ggagtgttgc aatacctttc tgggagttct ctgctgcctc ctggcttctg aggaccgccc 60
tgggcctggg agaatccctt ccccctcttc cctcgtgatc tgcaactcca gtctttctag 120
ttgaccagct cggcggtgac ctgcacgtct agggcgcagt agtccagggt ttccttgatg 180
atgtcatact tatcctgtcc cttttttttc cacagggcgc gccactagtg gatccggaac 240
ccttaatata acttcgtata atgtatgcta tacgaagtta tccgccacca tgggtaccga 300
tttaaatgat ccagtggtcc tgcagaggag agattgggag aatcccggtg tgacacagct 360
gaacagacta gccgcccacc ctccctttgc ttcttggaga aacagtgagg aagctaggac 420
agacagacca agccagcaac tcagatcttt gaacggggag tggagatttg cctggtttcc 480
ggcaccagaa gcggtgccgg aaagctggct ggagtgcgat cttcctgagg ccgatactgt 540
cgtcgtcccc tcaaactggc agatgcacgg ttacgatgcg cccatctaca ccaacgtgac 600
ctatcccatt acggtcaatc cgccgtttgt tcccacggag aatccgacgg gttgttactc 660
gctcacattt aatgttgatg aaagctggct acaggaaggc cagacgcgaa ttatttttga 720
tggcgttaac tcggcgtttc atctgtggtg caacgggcgc tgggtcggtt acggccagga 780
cagtcgtttg ccgtctgaat ttgacctgag cgcattttta cgcgccggag aaaaccgcct 840
cgcggtgatg gtgctgcgct ggagtgacgg cagttatctg gaagatcagg atatgtggcg 900
gatgagcggc attttccgtg acgtctcgtt gctgcataaa ccgactacac aaatcagcga 960
tttccatgtt gccactcgct ttaatgatga tttcagccgc gctgtactgg aggctgaagt 1020
tcagatgtgc ggcgagttgc gtgactacct acgggtaaca gtttctttat ggcagggtga 1080
aacgcaggtc gccagcggca ccgcgccttt cggcggtgaa attatcgatg agcgtggtgg 1140
ttatgccgat cgcgtcacac tacgtctgaa cgtcgaaaac ccgaaactgt ggagcgccga 1200
aatcccgaat ctctatcgtg cggtggttga actgcacacc gccgacggca cgctgattga 1260
agcagaagcc tgcgatgtcg gtttccgcga ggtgcggatt gaaaatggtc tgctgctgct 1320
gaacggcaag ccgttgctga ttcgaggcgt taaccgtcac gagcatcatc ctctgcatgg 1380
tcaggtcatg gatgagcaga cgatggtgca ggatatcctg ctgatgaagc agaacaactt 1440
taacgccgtg cgctgttcgc attatccgaa ccatccgctg tggtacacgc tgtgcgaccg 1500
ctacggcctg tatgtggtgg atgaagccaa tattgaaacc cacggcatgg tgccaatgaa 1560
tcgtctgacc gatgatccgc gctggctacc ggcgatgagc gaacgcgtaa cgcgaatggt 1620
gcagcgcgat cgtaatcacc cgagtgtgat catctggtcg ctggggaatg aatcaggcca 1680
cggcgctaat cacgacgcgc tgtatcgctg gatcaaatct gtcgatcctt cccgcccggt 1740
gcagtatgaa ggcggcggag ccgacaccac ggccaccgat attatttgcc cgatgtacgc 1800
gcgcgtggat gaagaccagc ccttcccggc tgtgccgaaa tggtccatca aaaaatggct 1860
ttcgctacct ggagagacgc gcccgctgat cctttgcgaa tacgcccacg cgatgggtaa 1920
cagtcttggc ggtttcgcta aatactggca ggcgtttcgt cagtatcccc gtttacaggg 1980
cggcttcgtc tgggactggg tggatcagtc gctgattaaa tatgatgaaa acggcaaccc 2040
gtggtcggct tacggcggtg attttggcga tacgccgaac gatcgccagt tctgtatgaa 2100
cggtctggtc tttgccgacc gcacgccgca tccagcgctg acggaagcaa aacaccagca 2160
gcagtttttc cagttccgtt tatccgggca aaccatcgaa gtgaccagcg aatacctgtt 2220
ccgtcatagc gataacgagc tcctgcactg gatggtggcg ctggatggta agccgctggc 2280
aagcggtgaa gtgcctctgg atgtcgctcc acaaggtaaa cagttgattg aactgcctga 2340
actaccgcag ccggagagcg ccgggcaact ctggctcaca gtacgcgtag tgcaaccgaa 2400
cgcgaccgca tggtcagaag ccgggcacat cagcgcctgg cagcagtggc gtctggcgga 2460
aaacctcagt gtgacgctcc ccgccgcgtc ccacgccatc ccgcatctga ccaccagcga 2520
aatggatttt tgcatcgagc tgggtaataa gcgttggcaa tttaaccgcc agtcaggctt 2580
tctttcacag atgtggattg gcgataaaaa acaactgctg acgccgctgc gcgatcagtt 2640
cacccgtgca ccgctggata acgacattgg cgtaagtgaa gcgacccgca ttgaccctaa 2700
cgcctgggtc gaacgctgga aggcggcggg ccattaccag gccgaagcag cgttgttgca 2760
gtgcacggca gatacacttg ctgatgcggt gctgattacg accgctcacg cgtggcagca 2820
tcaggggaaa accttattta tcagccggaa aacctaccgg attgatggta gtggtcaaat 2880
ggcgattacc gttgatgttg aagtggcgag cgatacaccg catccggcgc ggattggcct 2940
gaactgccag ctggcgcagg tagcagagcg ggtaaactgg ctcggattag ggccgcaaga 3000
aaactatccc gaccgcctta ctgccgcctg ttttgaccgc tgggatctgc cattgtcaga 3060
catgtatacc ccgtacgtct tcccgagcga aaacggtctg cgctgcggga cgcgcgaatt 3120
gaattatggc ccacaccagt ggcgcggcga cttccagttc aacatcagcc gctacagtca 3180
acagcaactg atggaaacca gccatcgcca tctgctgcac gcggaagaag gcacatggct 3240
gaatatcgac ggtttccata tggggattgg tggcgacgac tcctggagcc cgtcagtatc 3300
ggcggaattc cagctgagcg ccggtcgcta ccattaccag ttggtctggt gtcaaaaagg 3360
aagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 3420
acctgtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga 3480
cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta 3540
cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac 3600
cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa 3660
gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt 3720
cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct 3780
ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca 3840
caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa 3900
cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc 3960
cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca 4020
ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt 4080
cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta 4140
ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4200
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4260
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4320
cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4380
cctctacaaa tgtggtactc gaggaagttc ctattccgaa gttcctattc tctagaaagt 4440
ataggaactt catgcatggc ctccgcgccg ggttttggcg cctcccgcgg gcgcccccct 4500
cctcacggcg agcgctgcca cgtcagacga agggcgcagc gagcgtcctg atccttccgc 4560
ccggacgctc aggacagcgg cccgctgctc ataagactcg gccttagaac cccagtatca 4620
gcagaaggac attttaggac gggacttggg tgactctagg gcactggttt tctttccaga 4680
gagcggaaca ggcgaggaaa agtagtccct tctcggcgat tctgcggagg gatctccgtg 4740
gggcggtgaa cgccgatgat tatataagga cgcgccgggt gtggcacagc tagttccgtc 4800
gcagccggga tttgggtcgc ggttcttgtt tgtggatcgc tgtgatcgtc acttggtgag 4860
tagcgggctg ctgggctggc cggggctttc gtggccgccg ggccgctcgg tgggacggaa 4920
gcgtgtggag agaccgccaa gggctgtagt ctgggtccgc gagcaaggtt gccctgaact 4980
gggggttggg gggagcgcag caaaatggcg gctgttcccg agtcttgaat ggaagacgct 5040
tgtgaggcgg gctgtgaggt cgttgaaaca aggtgggggg catggtgggc ggcaagaacc 5100
caaggtcttg aggccttcgc taatgcggga aagctcttat tcgggtgaga tgggctgggg 5160
caccatctgg ggaccctgac gtgaagtttg tcactgactg gagaactcgg tttgtcgtct 5220
gttgcggggg cggcagttat ggcggtgccg ttgggcagtg cacccgtacc tttgggagcg 5280
cgcgccctcg tcgtgtcgtg acgtcacccg ttctgttggc ttataatgca gggtggggcc 5340
acctgccggt aggtgtgcgg taggcttttc tccgtcgcag gacgcagggt tcgggcctag 5400
ggtaggctct cctgaatcga caggcgccgg acctctggtg aggggaggga taagtgaggc 5460
gtcagtttct ttggtcggtt ttatgtacct atcttcttaa gtagctgaag ctccggtttt 5520
gaactatgcg ctcggggttg gcgagtgtgt tttgtgaagt tttttaggca ccttttgaaa 5580
tgtaatcatt tgggtcaata tgtaattttc agtgttagac tagtaaattg tccgctaaat 5640
tctggccgtt tttggctttt ttgttagacg tgttgacaat taatcatcgg catagtatat 5700
cggcatagta taatacgaca aggtgaggaa ctaaaccatg ggatcggcca ttgaacaaga 5760
tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc 5820
acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc 5880
ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg acgaggcagc 5940
gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac 6000
tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc 6060
tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac 6120
gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg 6180
tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct 6240
cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg atgatctcgt 6300
cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 6360
attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 6420
ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 6480
tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 6540
aggggatccg ctgtaagtct gcagaaattg atgatctatt aaacaataaa gatgtccact 6600
aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag tacctacatt 6660
ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat aaatgcctgc 6720
tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg gatatcataa 6780
tttaaacaag caaaaccaaa ttaagggcca gctcattcct cccactcatg atctatagat 6840
ctatagatct ctcgtgggat cattgttttt ctcttgattc ccactttgtg gttctaagta 6900
ctgtggtttc caaatgtgtc agtttcatag cctgaagaac gagatcagca gcctctgttc 6960
cacatacact tcattctcag tattgttttg ccaagttcta attccatcag acctcgacct 7020
gcagccccta gtcgacgaag ttcctattcc gaagttccta ttctctagaa agtataggaa 7080
cttcgctagc taaaattgga gggacaagac ttcccacaga ttttcggttt tgtcgggaag 7140
ttttttaata ggggcaaata aggaaaatgg gaggataggt agtcatctgg ggttttatgc 7200
agcaaaacta caggttatta ttgcttgtga tccgc 7235
<210> 60
<211> 1499
<212>ДНК
<213>Искусственная последовательность
<220>
<223>Синтетическая
<220>
<221> misc_feature
<222> (1)..(172)
<223>Последовательность мыши выше против хода транскрипции
<220>
<221> misc_feature
<222> (300)..(333)
<223> LoxP
<220>
<221> misc_feature
<222> (379)..(1098)
<223> eGFP
<220>
<221> misc_feature
<222> (1133)..(1354)
<223>Поли(A)SV40
<220>
<221> misc_feature
<222> (1355)..(1499)
<223>Последовательность мыши ниже по ходу транскрипции
<400> 60
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc agcccaagct 360
agtgcccggg ccgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 420
atcctggttg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 480
gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 540
cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc 600
taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 660
caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 720
ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 780
ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 840
gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 900
ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 960
ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 1020
aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 1080
gacgagctgt acaagtaata attctagagt cggggcggcc ggccgcttcg agcagacatg 1140
ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 1200
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 1260
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 1320
ttttaaagca agtaaaacct ctacaaatgt ggtactcgag taaaattgga gggacaagac 1380
ttcccacaga ttttcggttt tgtcgggaag ttttttaata ggggcaaata aggaaaatgg 1440
gaggataggt agtcatctgg ggttttatgc agcaaaacta caggttatta ttgcttgtg 1499
<---
1. Отличное от человека животное, предназначенное для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК, содержащее репортер CRISPR, подходящий для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК,
причем отличное от человека животное представляет собой мышь или крысу,
причем репортер CRISPR интегрирован в целевой геномный локус, способный экспрессировать ген, и содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета, содержащая кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка в любом порядке,
причем репортер CRISPR функционально связан с промотором, подходящим для экспрессии в отличном от человека животном,
причем первый сигнал полиаденилирования предотвращает транскрипцию и экспрессию первого репортерного белка и второго репортерного белка, при этом транскрипция может проходить через кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка при расщеплении первой и второй целевых последовательностей направляющих РНК и вырезании промежуточной последовательности, включающей первый сигнал полиаденилирования,
причем первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны и примыкают к последовательности примыкающего к протоспейсеру мотива (РАМ), где РАМ представляет собой 5'-NGG-3',
причем первый репортерный белок и второй репортерный белок различны, и
причем репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой, причем первый репортерный белок содержит третью целевую последовательность направляющей РНК, причем рекомбинация репортера CRISPR с экзогенной донорской нуклеиновой кислотой изменяет кодирующую последовательность для первого репортерного белка на кодирующую последовательность для третьего репортерного белка, причем необязательно, третья целевая последовательность направляющей РНК перекрывается с частью кодирующей последовательности для первого репортерного белка, модифицированного экзогенной донорской нуклеиновой кислотой.
2. Отличное от человека животное по п. 1, в котором кодирующая последовательность для первого репортерного белка изменяется на кодирующую последовательность для третьего репортерного белка путем замены одного кодона.
3. Отличное от человека животное по п. 1 или 2, в котором третья целевая последовательность направляющей РНК перекрывается с частью кодирующей последовательности для первого репортерного белка, модифицированного экзогенной донорской нуклеиновой кислотой.
4. Отличное от человека животное по любому из предшествующих пунктов, в котором один из первого и второго репортерных белков содержит флуоресцентный репортерный белок.
5. Отличное от человека животное по п. 4, в котором флуоресцентный репортерный белок содержит усиленный зеленый флуоресцентный белок (eGFP) или усиленный синий флуоресцентный белок (eBFP).
6. Отличное от человека животное по п. 4 или 5, в котором первый и второй репортерные белки содержат флуоресцентный репортерный белок и нефлуоресцентный репортерный белок.
7. Отличное от человека животное по п. 6, в котором флуоресцентный репортерный белок может быть обнаружен в анализе с помощью проточной цитометрии, а нефлуоресцентный белок может быть обнаружен в гистохимическом анализе.
8. Отличное от человека животное по любому из предшествующих пунктов, в котором один из первого и второго репортерных белков содержит белок бета-галактозидазу.
9. Отличное от человека животное по любому из предшествующих пунктов, в котором первый сигнал полиаденилирования также фланкирован сайтами узнавания рекомбиназы для первой рекомбиназы.
10. Отличное от человека животное по п. 9, в котором сайты узнавания рекомбиназы для первой рекомбиназы представляют собой последовательности loxP.
11. Отличное от человека животное по любому из предшествующих пунктов, в котором репортерная кассета содержит мультицистронную нуклеиновую кислоту, содержащую кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка, разделенных промежуточным участком внутренней посадки рибосомы (IRES) или промежуточной кодирующей последовательностью пептида 2А.
12. Отличное от человека животное по п. 11, в котором мультицистронная нуклеиновая кислота содержит кодирующую последовательность бета-галактозидазы и кодирующую последовательность усиленного синего флуоресцентного белка (eBFP) или кодирующую последовательность усиленного зеленого флуоресцентного белка (eGFP), разделенную промежуточной кодирующей последовательностью пептида Р2А.
13. Отличное от человека животное по любому из предшествующих пунктов, в котором репортер CRISPR функционально связан с эндогенным промотором в целевом геномном локусе.
14. Отличное от человека животное по любому из предшествующих пунктов, в котором 5'-конец репортера CRISPR дополнительно содержит 3'-последовательность сплайсинга.
15. Отличное от человека животное по любому из предшествующих пунктов, в котором репортер CRISPR дополнительно содержит кассету селекции.
16. Отличное от человека животное по п. 15, в котором кассета селекции фланкирована сайтами узнавания рекомбиназы для второй рекомбиназы.
17. Отличное от человека животное по п. 15 или 16, в котором кассета селекции содержит ген лекарственной устойчивости.
18. Отличное от человека животное по любому из предшествующих пунктов, в котором расстояние между первой целевой последовательностью направляющей РНК и второй целевой последовательностью направляющей РНК составляет менее чем приблизительно 500 пар нуклеотидов.
19. Отличное от человека животное по любому из предшествующих пунктов, в котором первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны, и каждая из них содержит SEQ ID NO: 41.
20. Отличное от человека животное по любому из предшествующих пунктов, причем отличное от человека животное представляет собой крысу.
21. Отличное от человека животное по любому из предшествующих пунктов, причем отличное от человека животное представляет собой мышь.
22. Отличное от человека животное по любому из предшествующих пунктов, в котором целевой геномный локус представляет собой локус «безопасной гавани».
23. Отличное от человека животное по п. 22, в котором локус «безопасной гавани» представляет собой локус Rosa26.
24. Отличное от человека животное по п. 23, в котором репортер CRISPR вставлен в первый интрон локуса Rosa26.
25. Отличное от человека животное по любому из предшествующих пунктов, причем отличное от человека животное представляет собой мышь, и
причем целевой геномный локус представляет собой локус Rosa26, и
причем репортер CRISPR функционально связан с эндогенным промотором Rosa26, вставлен в первый интрон локуса Rosa26 и содержит от 5' к 3':
(a) 3' последовательность сплайсинга;
(b) первый сигнал полиаденилирования, фланкированный:
(i) первым и вторым сайтами loxP и
(ii) первой и второй целевыми последовательностями направляющих РНК, причем первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны, и каждая из них содержит SEQ ID NO: 41; и
(c) репортерную кассету, содержащую от 5' к 3':
(i) кодирующую последовательность бета-галактозидазы;
(ii) кодирующую последовательность Р2А;
(iii) кодирующую последовательность усиленного синего флуоресцентного белка (eBFP), причем кодирующая последовательность eBFP содержит третью целевую последовательность направляющей РНК, содержащую SEQ ID NO: 42; и
(iv) второй сигнал полиаденилирования, причем первый сигнал полиаденилирования и второй сигнал полиаденилирования различны.
26. Отличное от человека животное по п. 25, в котором репортер CRISPR дополнительно содержит:
(d) кассету селекции 3' репортерной кассеты, причем кассета селекции фланкирована сайтами FRT и содержит от 5' к 3':
(i) кодирующую последовательность неомицин-фосфотрансферазы, функционально связанную с промотором убиквитина человека; и
(ii) третий сигнал полиаденилирования.
27. Отличное от человека животное по любому из предшествующих пунктов, причем отличное от человека животное является гетерозиготным по отношению к репортеру CRISPR в целевом геномном локусе.
28. Отличное от человека животное по любому из пп. 1-26, причем отличное от человека животное является гомозиготным по отношению к репортеру CRISPR в целевом геномном локусе.
29. Способ исследования способности нуклеазы CRISPR/Cas, содержащей белок Cas9 и направляющую РНК, вырезать геномную нуклеиновую кислоту in vivo, предусматривающий:
(а) введение отличному от человека животному по любому из пп. 1-28:
(i) первой направляющей РНК или ДНК, кодирующей первую направляющую РНК, причем первая направляющая РНК предназначена для гибридизации с первой целевой последовательностью направляющей РНК в репортере CRISPR;
(ii) второй направляющей РНК или ДНК, кодирующей вторую направляющую РНК, причем вторая направляющая РНК предназначена для гибридизации со второй целевой последовательностью направляющей РНК в репортере CRISPR; и
(iii) белка Cas9 или нуклеиновой кислоты, кодирующей белок Cas9; и
(b) измерение активности или экспрессии по меньшей мере одного из первого и второго репортерных белков, где активность или экспрессия по меньшей мере одного из первого и второго репортерных белков свидетельствует о вырезании геномной нуклеиновой кислоты in vivo.
30. Способ по п. 29, при котором белок Cas9 вводят отличному от человека животному в форме белка.
31. Способ по п. 29, при котором белок Cas9 вводят отличному от человека животному в форме информационной РНК, кодирующей белок Cas9.
32. Способ по п. 29, при котором белок Cas9 вводят отличному от человека животному в форме ДНК, кодирующей белок Cas9, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток в отличном от человека животном.
33. Способ по любому из пп. 29-32, при котором первая направляющая РНК и вторая направляющая РНК идентичны и каждая содержит последовательность, представленную в SEQ ID NO: 2.
34. Способ по любому из пп. 29-33, при котором репортерный белок, измеренный на стадии (b), представляет собой флуоресцентный репортерный белок, а стадия (b) предусматривает анализ с помощью проточной цитометрии.
35. Способ по любому из пп. 29-33, при котором репортерный белок, измеренный на стадии (b), представляет собой белок бета-галактозидазу, а стадия (b) предусматривает анализ гистохимическим окрашиванием.
36. Способ по любому из пп. 29-35, при котором направляющие РНК на стадии (а) вводят в форме РНК.
37. Способ по любому из пп. 29-35, при котором каждая из направляющих РНК на стадии (а) вводится отличному от человека животному в форме ДНК, кодирующей направляющую РНК, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток у отличного от человека животного.
38. Способ по любому из пп. 29-37, при котором введение предусматривает опосредованную аденоассоциированным вирусом (AAV) доставку, опосредованную липидными наночастицами доставку или гидродинамическую доставку.
39. Способ по п. 38, при котором введение предусматривает опосредованную AAV доставку.
40. Способ по п. 39, при котором введение предусматривает опосредованную AAV8 доставку, и стадия (b) предусматривает измерение активности репортерного белка в печени отличного от человека животного.
41. Способ оптимизации способности нуклеазы CRISPR/Cas вырезать геномную нуклеиновую кислоту in vivo, предусматривающий:
(I) выполнение способа по любому из пп. 29-40 в первый раз у первого отличного от человека животного;
(II) изменение переменной и выполнение способа стадии (I) во второй раз с измененной переменной у второго отличного от человека животного, причем измененная переменная представляет собой:
(a) способ доставки вводимых направляющих РНК и/или белка Cas9 отличному от человека животному;
(b) путь введения направляющих РНК и/или белка Cas9, вводимых отличному от человека животному;
(c) концентрацию или количество направляющих РНК и/или белка Cas9, введенных отличному от человека животному;
(d) концентрацию или количество направляющих РНК, введенных отличному от человека животному, относительно концентрации или количества белка Cas9, введенного отличному от человека животному;
(e) направляющие РНК, введенные отличному от человека животному; или
(f) белок Cas9, введенный отличному от человека животному; и
(III) сравнение активности или экспрессии репортерного белка на стадии (I) с активностью или экспрессией по меньшей мере одного репортерного белка на стадии (II) и выбор способа, приводящего к более высокой активности или экспрессии репортерного белка.
42. Способ по п. 41, при котором измененная переменная на стадии (II) представляет собой способ доставки вводимых направляющих РНК и/или белка Cas9 отличному от человека животному.
43. Способ по п. 41, при котором измененная переменная на стадии (II) представляет собой путь введения направляющих РНК и/или белка Cas9, вводимых отличному от человека животному.
44. Способ по п. 41, при котором измененная переменная на стадии (II) представляет собой концентрацию или количество направляющих РНК и/или белка Cas9, введенных отличному от человека животному.
45. Способ по п. 41, при котором измененная переменная на стадии (II) представляет собой концентрацию или количество направляющих РНК, введенных отличному от человека животному, относительно концентрации или количества белка Cas9, введенного отличному от человека животному.
46. Способ по п. 41, при котором измененная переменная на стадии (II) представляет собой направляющие РНК, введенные отличному от человека животному.
47. Способ по п. 41, при котором измененная переменная на стадии (II) представляет собой белок Cas9, введенный отличному от человека животному.
48. Способ исследования индуцированной CRISPR/Cas рекомбинации геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo, предусматривающий:
(а) предоставление отличного от человека животного по любому из пп. 1-28, в котором репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой, причем первый сигнал полиаденилирования был удален из репортера CRISPR и причем кодирующая последовательность для первого репортерного белка содержит третью целевую последовательность направляющей РНК, и введение отличному от человека животному:
(i) направляющей РНК или ДНК, кодирующей направляющую РНК, причем направляющая РНК предназначена для гибридизации с третьей целевой последовательностью направляющей РНК в репортере CRISPR;
(ii) белка Cas9 или нуклеиновой кислоты, кодирующей белок Cas9; и
(iii) экзогенной донорской нуклеиновой кислоты, способной рекомбинировать с репортером CRISPR и изменять кодирующую последовательность для первого репортерного белка на кодирующую последовательность для третьего репортерного белка; и
(b) измерение активности или экспрессии третьего репортерного белка, причем активность или экспрессия третьего репортерного белка свидетельствует о CRISPR/Cas-индуцированной рекомбинации геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo.
49. Способ по п. 48, при котором белок Cas9 вводят отличному от человека животному в форме белка.
50. Способ по п. 48, при котором белок Cas9 вводят отличному от человека животному в форме информационной РНК, кодирующей белок Cas9.
51. Способ по п. 48, при котором белок Cas9 вводят отличному от человека животному в форме ДНК, кодирующей белок Cas9, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток отличного от человека животного.
52. Способ по любому из пп. 48-51, при котором третий репортерный белок, измеренный на стадии (b), представляет собой флуоресцентный репортерный белок, а стадия (b) предусматривает анализ с помощью проточной цитометрии.
53. Способ по любому из пп. 48-52, при котором первый репортерный белок представляет собой усиленный синий флуоресцентный белок (eBFP), а третья направляющая РНК содержит последовательность, представленную в SEQ ID NO: 14.
54. Способ по любому из пп. 48-53, при котором первый репортерный белок представляет собой усиленный синий флуоресцентный белок (eBFP), а третий репортерный белок представляет собой усиленный зеленый флуоресцентный белок (eGFP).
55. Способ по п. 54, при котором экзогенная донорская нуклеиновая кислота содержит последовательность, представленную в SEQ ID NO: 15 или SEQ ID NO: 16.
56. Способ по любому из пп. 48-55, при котором экзогенная донорская нуклеиновая кислота представляет собой одноцепочечный дезоксинуклеотид.
57. Способ по любому из пп. 48-56, при котором направляющую РНК на стадии (а) вводят в форме РНК.
58. Способ по любому из пп. 48-56, при котором направляющую РНК на стадии (а) вводят отличному от человека животному в форме ДНК, кодирующей направляющую РНК, причем ДНК функционально связана с промотором, активным в одном или нескольких типах клеток отличного от человека животного.
59. Способ по любому из пп. 48-58, при котором введение предусматривает опосредованную аденоассоциированным вирусом (AAV) доставку, опосредованную липидными наночастицами доставку или гидродинамическую доставку.
60. Способ по п. 59, при котором введение предусматривает опосредованную доставку AAV.
61. Способ по п. 60, при котором введение предусматривает опосредованную доставку AAV8, а стадия (b) предусматривает измерение активности репортерного белка в печени отличного от человека животного.
62. Способ оптимизации способности CRISPR/Cas индуцировать рекомбинацию геномной нуклеиновой кислоты с экзогенной донорской нуклеиновой кислотой in vivo, предусматривающий:
(I) выполнение способа по любому из пп. 48-61 в первый раз у первого отличного от человека животного, причем измененная переменная представляет собой:
(a) способ доставки путем введения одного или нескольких из направляющей РНК, белка Cas9 и экзогенной донорской нуклеиновой кислоты отличному от человека животному;
(b) путь введения одного или нескольких из направляющей РНК, белка Cas9 и экзогенной донорской нуклеиновой кислоты, вводимых отличному от человека животному;
(c) концентрацию или количество одного или нескольких из направляющей РНК, белка Cas9 и экзогенной донорской нуклеиновой кислоты, введенной отличному от человека животному;
(d) экзогенную донорскую нуклеиновую кислоту, введенную отличному от человека животному;
(e) концентрацию или количество направляющей РНК, введенной отличному от человека животному, относительно концентрации или количества белка Cas9, введенного отличному от человека животному;
(f) направляющую РНК, введенную отличному от человека животному; или
(g) белок Cas9, введенный отличному от человека животному;
(II) изменение переменной и выполнение способа стадии (I) во второй раз с измененной переменной у второго отличного от человека животного и
(III) сравнение активности или экспрессии третьего репортерного белка на стадии (I) с активностью или экспрессией третьего репортерного белка на стадии (II) и выбор способа, приводящего к более высокой активности или экспрессии третьего репортерного белка.
63. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой способ доставки путем введения одного или нескольких из направляющей РНК, белка Cas9 и экзогенной донорской нуклеиновой кислоты отличному от человека животному.
64. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой путь введения одного или нескольких из направляющей РНК, белка Cas9 и экзогенной донорской нуклеиновой кислоты, вводимых отличному от человека животному.
65. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой концентрацию или количество одного или нескольких из направляющей РНК, белка Cas9 и экзогенной донорской нуклеиновой кислоты, введенной отличному от человека животному.
66. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой экзогенную донорскую нуклеиновую кислоту, введенную отличному от человека животному.
67. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой концентрацию или количество направляющей РНК, введенной отличному от человека животному, относительно концентрации или количества белка Cas9, введенного отличному от человека животному.
68. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой направляющую РНК, введенную отличному от человека животному.
69. Способ по п. 62, при котором измененная переменная на стадии (II) представляет собой белок Cas9, введенный отличному от человека животному.
70. Клетка отличного от человека животного, предназначенная для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК, содержащая репортер CRISPR для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК,
причем отличное от человека животное представляет собой мышь или крысу, причем репортер CRISPR интегрирован в целевой геномный локус, способный экспрессировать ген, и содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета, содержащая кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка в любом порядке,
причем репортер CRISPR функционально связан с промотором, подходящим для экспрессии в отличном от человека животном,
причем первый сигнал полиаденилирования предотвращает транскрипцию и экспрессию первого репортерного белка и второго репортерного белка, при этом транскрипция может проходить через кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка при расщеплении первой и второй целевых последовательностей направляющих РНК и вырезании промежуточной последовательности, включающей первый сигнал полиаденилирования,
причем первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны и примыкают к последовательности примыкающего к протоспейсеру мотива (РАМ), где РАМ представляет собой 5'-NGG-3',
причем первый репортерный белок и второй репортерный белок различны, и
причем репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой, причем первый репортерный белок содержит третью целевую последовательность направляющей РНК, причем рекомбинация репортера CRISPR с экзогенной донорской нуклеиновой кислотой изменяет кодирующую последовательность для первого репортерного белка на кодирующую последовательность для третьего репортерного белка, причем необязательно, третья целевая последовательность направляющей РНК перекрывается с частью кодирующей последовательности для первого репортерного белка, модифицированного экзогенной донорской нуклеиновой кислотой.
71. Способ получения отличного от человека животного по любому из пп. 1-28, предусматривающий:
(а) модификацию генома эмбриональной стволовой (ES) клетки мыши или крысы для включения репортера CRISPR,
причем репортер CRISPR интегрирован в целевой геномный локус, способный экспрессировать ген, и содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета, содержащая кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка в любом порядке,
причем репортер CRISPR функционально связан с промотором, подходящим для экспрессии у мыши или крысы,
причем первый сигнал полиаденилирования предотвращает транскрипцию и экспрессию первого репортерного белка и второго репортерного белка, при этом транскрипция может проходить через кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка при расщеплении первой и второй целевых последовательностей направляющих РНК и вырезании промежуточной последовательности, включающей первый сигнал полиаденилирования,
причем первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны и примыкают к последовательности примыкающего к протоспейсеру мотива (РАМ), где РАМ представляет собой 5'-NGG-3',
причем первый репортерный белок и второй репортерный белок различны,
причем репортер CRISPR предназначен для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК, и
причем репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой, причем первый репортерный белок содержит третью целевую последовательность направляющей РНК, причем рекомбинация репортера CRISPR с экзогенной донорской нуклеиновой кислотой изменяет кодирующую последовательность для первого репортерного белка на кодирующую последовательность для третьего репортерного белка, причем необязательно, третья целевая последовательность направляющей РНК перекрывается с частью кодирующей последовательности для первого репортерного белка, модифицированного экзогенной донорской нуклеиновой кислотой;
(b) идентификацию или отбор генетически модифицированной ES клетки мыши или крысы, содержащей репортер CRISPR;
(c) введение генетически модифицированной ES клетки мыши или крысы в эмбрион-хозяина мыши или крысы и
(d) имплантацию и гестацию эмбриона-хозяина мыши или крысы в суррогатной матери.
72. Способ получения отличного от человека животного по любому из пп. 1-28, предусматривающий:
(а) изменение генома эмбриона одноклеточной стадии мыши или крысы для включения репортера CRISPR,
причем репортер CRISPR интегрирован в целевой геномный локус, способный экспрессировать ген, и содержит первый сигнал полиаденилирования, фланкированный первой и второй целевыми последовательностями направляющих РНК, за которыми следует репортерная кассета, содержащая кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка в любом порядке,
причем репортер CRISPR функционально связан с промотором, подходящим для экспрессии у мыши или крысы,
причем первый сигнал полиаденилирования предотвращает транскрипцию и экспрессию первого репортерного белка и второго репортерного белка, при этом транскрипция может проходить через кодирующую последовательность для первого репортерного белка и кодирующую последовательность для второго репортерного белка при расщеплении первой и второй целевых последовательностей направляющих РНК и вырезании промежуточной последовательности, включающей первый сигнал полиаденилирования,
причем первая целевая последовательность направляющей РНК и вторая целевая последовательность направляющей РНК идентичны и примыкают к последовательности примыкающего к протоспейсеру мотива (РАМ), где РАМ представляет собой 5'-NGG-3',
причем первый репортерный белок и второй репортерный белок различны,
причем репортер CRISPR предназначен для оценки индуцированного CRISPR/Cas вырезания нуклеиновой кислоты между первой и второй целевыми последовательностями направляющих РНК, и
причем репортер CRISPR также предназначен для оценки индуцированной CRISPR/Cas рекомбинации репортера CRISPR с экзогенной донорской нуклеиновой кислотой, причем первый репортерный белок содержит третью целевую последовательность направляющей РНК, причем рекомбинация репортера CRISPR с экзогенной донорской нуклеиновой кислотой изменяет кодирующую последовательность для первого репортерного белка на кодирующую последовательность для третьего репортерного белка, причем необязательно, третья целевая последовательность направляющей РНК перекрывается с частью кодирующей последовательности для первого репортерного белка, модифицированного экзогенной донорской нуклеиновой кислотой;
(b) отбор генетически модифицированного эмбриона одноклеточной стадии мыши или крысы и
(c) имплантацию и гестацию генетически модифицированного эмбриона одноклеточной стадии мыши или крысы в суррогатной матери.