Мутации фермента crispr, уменьшающие нецелевые эффекты

Изобретение относится к биотехнологии. Раскрыты и заявлены мутация(мутации) или модификация(модификации) фермента CRISPR, например фермента Cas, такого как Cas9. Также раскрыты и заявлены способы получения и применения и варианты применения такого мутированного или модифицированного Cas, или фермента CRISPR, или Cas9, и систем или комплексов, содержащих вышеуказанное, и продукты, полученные в результате таких способов. Изобретение позволяет снижать нецелевые эффекты фермента CRISPR-Cas, или фермента CRISPR, или системы или комплекса CRISPR-Cas9, содержащих или включающих такой мутированный или модифицированный Cas, или фермент CRISPR или Cas9. 16 н. и 65 з.п. ф-лы, 23 табл., 19 пр., 81 ил.

 

Перекрестные ссылки/включение посредством ссылки

Ссылаются на предварительную заявку на патент США с порядковым № 62/181453, поданную 18 июня 2015 года, предварительную заявку на патент США с порядковым № 62/207312, поданную 19 августа 2015 года, предварительную заявку на патент США с порядковым № 62/237360, поданную 5 октября 2015 года, предварительную заявку на патент США с порядковым № 62/255256, поданную 13 ноября 2015 года и предварительную заявку на патент США с порядковым № 62/269876, поданную 18 декабря 2015 года.

Вышеупомянутая заявка (заявки) и все документы, цитируемые или приводимые в качестве ссылки в данном документе ("документы, цитируемые в данном документе"), и все документы, цитируемые или приводимые в качестве ссылки в документах, цитируемых в данном документе, вместе с любыми инструкциями производителя, описаниями, спецификациями продукта и технологическими картами для любых продуктов, упомянутых в данном документе или в любом документе, включенном в данный документ посредством ссылки, настоящим включены в данный документ посредством ссылки и могут быть использованы при осуществлении настоящего изобретения на практике. Более конкретно, все документы, приводимые в качестве ссылки, включены посредством ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен посредством ссылки.

Заявление в отношении финансируемого из федерального бюджета исследования

Настоящее изобретение было выполнено при поддержке правительства в рамках грантов под номером MH100706 и MH110049, выданных Национальными институтами здоровья. Правительство обладает определенными правами на настоящее изобретение.

Область изобретения

Настоящее изобретение в целом относится к коротким палиндромным повторам, регулярно расположенным группами (CRISPR), ферменту CRISPR (например, Cas или Cas9), CRISPR-Cas или системе CRISPR или комплексу CRISPR-Cas, их компонентам, молекулам нуклеиновой кислоты, например, векторам, включающим их, а также вариантам применения всего из вышеупомянутого, среди прочих аспектов.

Предпосылки изобретения

Первой публикацией с достаточным раскрытием того, как получать и применять систему CRISPR-Cas в эукариотических клетках, является Cong et al., Science 2013; 339:819-823 (опубликована онлайн 3 января 2013 года). Первой подачей заявки на патент с достаточным раскрытием того, как получать и применять систему CRISPR-Cas в эукариотических клетках, является Zhang et al., предварительная заявка на патент США с порядковым № 61/736527, поданная 12 декабря 2012 года, на основании которой многие патентные заявки заявляют приоритет, включая те, которые перешли в фундаментальные патенты США №№ 8999641, 8993233, 8945839, 8932814, 8906616, 8895308, 8889418, 8889356, 8871445, 8865406, 8795965, 8771945 и 8697359.

Краткое описание изобретения

С учетом обеспечения революционных достижений, которые обеспечили возможность применения системы CRISPR-Cas в эукариотических клетках, лаборатория Zhang и соавт. из института Броуда понимала, что остается потребность в улучшенных ферментах CRISPR для применения в осуществлении модификаций в целевых локусах, которые при этом снижают или исключают активность в направлении нецелевых локусов. Существует актуальная потребность в альтернативных и надежных системах и методиках снижения нецелевой активности ферментов CRISPR, находящихся в комплексе с направляющими РНК. Также существует актуальная потребность в альтернативных и надежных системах и методиках повышения активности ферментов CRISPR, находящихся в комплексе с направляющими РНК.

Было разработано несколько стратегий усиления специфичности Cas9, включая уменьшение количества Cas9 в клетке, применение мутантных никаз Cas9 для создания пары накладываемых однонитевых надрезов ДНК, усечения направляющей последовательности на 5'-конце и применение пары каталитически неактивных нуклеаз Cas9, каждая из которых слита с нуклеазным доменом FokI.

Авторы настоящего изобретения неожиданно установили, что можно проводить модификации ферментов CRISPR, что обеспечивает сниженную нецелевую активность по сравнению с немодифицированными ферментами CRISPR и/или повышенную целевую активность по сравнению с немодифицированными ферментами CRISPR. Таким образом, в данном документ предусмотрены улучшенные ферменты CRISPR, которые можно применять в целом ряде применений, связанных с модификациями генов. Также в данном документе предусмотрены комплексы, композиции и системы CRISPR, а также способы и варианты применения, все из которых предусматривают модифицированные ферменты CRISPR, раскрытые в данном документе. Предпочтительным является CRISPR-Cas9, включая без ограничения SaCas9, SpCas9 и ортологи.

В одном аспекте предусмотрен сконструированный белок CRISPR, где белок объединяется в комплекс с молекулой нуклеиновой кислоты, предусматривающей РНК, с образованием комплекса CRISPR, при этом находясь в комплексе CRISPR, молекула нуклеиновой кислоты нацеливается на один или несколько целевых полинуклеотидных локусов, причем белок содержит по меньшей мере одну модификацию по сравнению с немодифицированным CRISPR, и где комплекс CRISPR, содержащий модифицированный белок, характеризуется измененной активностью в сравнении с комплексом, содержащим немодифицированный белок CRISPR. Предпочтительным является CRISPR-Cas9, включая без ограничения SaCas9, SpCas9 и ортологи. Белки CRISPR включают белки с ферментативной активностью, например, нуклеазной активностью.

В одном аспекте измененная активность сконструированного белка CRISPR предусматривает измененное свойство связывания в отношении молекулы нуклеиновой кислоты, предусматривающей РНК, или целевых полинуклеотидных локусов, измененную кинетику связывания в отношении молекулы нуклеиновой кислоты, предусматривающей РНК, или целевых полинуклеотидных локусов, или измененную специфичность связывания в отношении молекулы нуклеиновой кислоты, предусматривающей РНК, или целевых полинуклеотидных локусов в сравнении с нецелевыми полинуклеотидными локусами.

В определенных вариантах осуществления измененная активность сконструированного белка CRISPR предусматривает повышенную эффективность нацеливания или сниженное нецелевое связывание. В определенных вариантах осуществления измененная активность сконструированного белка CRISPR предусматривает модифицированную активность расщепления.

В определенных вариантах осуществления измененная активность предусматривает повышенную активность расщепления в отношении целевых полинуклеотидных локусов. В определенных вариантах осуществления измененная активность предусматривает сниженную активность расщепления в отношении целевых полинуклеотидных локусов. В определенных вариантах осуществления измененная активность предусматривает сниженную активность расщепления в отношении нецелевых полинуклеотидных локусов. В определенных вариантах осуществления измененная активность предусматривает повышенную активность расщепления в отношении нецелевых полинуклеотидных локусов. В соответствии с этим, в определенных вариантах осуществления наблюдается повышенная специфичность в отношении целевых полинуклеотидных локусов по сравнению с нецелевыми полинуклеотидными локусами. В других вариантах осуществления наблюдается сниженная специфичность в отношении целевых полинуклеотидных локусов по сравнению с нецелевыми полинуклеотидными локусами.

В одном аспекте настоящего изобретения измененная активность сконструированного белка CRISPR предусматривает измененные кинетические свойства хеликазы.

В одном аспекте настоящего изобретения сконструированный белок CRISPR содержит модификацию, которая изменяет связывание белка с молекулой нуклеиновой кислоты, предусматривающей РНК, или нитью, содержащей целевые полинуклеотидные локусы, или нитью, содержащей нецелевые полинуклеотидные локусы. В одном аспекте настоящего изобретения сконструированный белок CRISPR содержит модификацию, которая изменяет образование комплекса CRISPR.

В настоящем изобретении предусмотрен:

не встречающийся в природе фермент CRISPR, где:

фермент объединяется в комплекс с направляющей РНК с образованием комплекса CRISPR,

при этом находясь в комплексе CRISPR, направляющая РНК нацеливается на один или несколько целевых полинуклеотидных локусов, и фермент изменяет полинуклеотидные локусы, и

фермент содержит по меньшей мере одну модификацию,

в результате чего фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.

В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков фермента.

В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, расположенных в участке, который содержит остатки, которые являются положительно заряженными в немодифицированном ферменте.

В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются положительно заряженными в немодифицированном ферменте.

В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые не являются положительно заряженными в немодифицированном ферменте.

Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются незаряженными в немодифицированном ферменте.

Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются отрицательно заряженными в немодифицированном ферменте.

Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются гидрофобными в немодифицированном ферменте.

Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются полярными в немодифицированном ферменте.

В случае любого из описанных выше не встречающихся в природе ферментов CRISPR фермент может предусматривать фермент CRISPR II типа. Фермент может предусматривать фермент Cas9.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация может предусматривать модификацию одного или нескольких остатков, расположенных в участке между доменом RuvC и доменом HNH. Домен RuvC может предусматривать домен RuvCII или домен RuvCIII. Модификация может предусматривать модификацию одного или нескольких остатков, расположенных в бороздке.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация может предусматривать модификацию одного или нескольких остатков, расположенные за пределами участка между доменом RuvC и доменом HNH, или за пределами бороздки.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация может предусматривать модификацию одного или нескольких остатков в участке, который включает:

остатки R63-K1325 или K775-K1325 из Cas9 (SpCas9) Streptococcus pyogenes или соответствующий участок в другом ортологе Cas9; или

остатки K37-K736 из Cas9 (SaCas9) Staphylococcus aureus или соответствующий участок в другом ортологе Cas9.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация предусматривает модификацию одного или нескольких остатков, где один или несколько остатков предусматривают аргинин, гистидин или лизин.

В случае любого из описанных выше не встречающихся в природе ферментов CRISPR фермент может быть модифицирован с помощью мутации указанного одного или нескольких остатков.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аланиновый остаток.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аспарагиновую кислоту или глутаминовую кислоту.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на серин, треонин, аспарагин или глутамин.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аланин, глицин, изолейцин, лейцин, метионин, фенилаланин, триптофан, тирозин или валин.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на полярный аминокислотный остаток.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является полярным аминокислотным остатком.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на отрицательно заряженный аминокислотный остаток.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является отрицательно заряженным аминокислотным остатком.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на незаряженный аминокислотный остаток

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является незаряженным аминокислотным остатком.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на гидрофобный аминокислотный остаток.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является гидрофобным аминокислотным остатком.

Не встречающийся в природе фермент CRISPR может представлять собой SpCas9 или ортолог SpCas9, и при этом:

фермент модифицирован с помощью модификации или содержит ее, например, содержит, состоит, по сути, из или состоит из модификации с помощью мутации любого из остатков SpCas9 или SaCas9, перечисленных в любой из таблиц 1-7, или соответствующего остатка в ортологе Cas9; или

фермент содержит, состоит, по сути, из или состоит из модификации в любом одном (одиночная), двух (двойная), трех (тройная), четырех (четверная) или более положениях в соответствии с настоящим изобретением по всей настоящей заявке, включая без ограничения в данном кратком описании, и/или в кратком описании графических материалов, и/или в подробном описании, и/или в любом из примеров и/или на любой из фигур, или по соответствующему остатку или положению в ортологе Cas9, например, фермент содержит, состоит, по сути, из или состоит из модификации по любому из остатков Cas9, упомянутому в любом из данного краткого описания, и/или в кратком описании графических материалов, и/или в подробном описании, и/или в любом из примеров, и/или на любой из фигур или в других разделах данного документа, или по соответствующему остатку или положению в ортологе Cas9. В таком ферменте каждый остаток может быть модифицирован с помощью замены на аланиновый остаток.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации одного или нескольких остатков, включающих без ограничения положения 12, 13, 63, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 и 1325 в соответствии с нумерацией аминокислотных положений SpCas9.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит одну или несколько замен на аланин по остаткам, включающим без ограничения положения 63, 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 или 1325 в соответствии с нумерацией аминокислотных положений SpCas9.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит одну или несколько замен K775A, E779L, Q807A, R780A, K810A, R832A, K848A, K855A, K862A, K866A, K961A, K968A, K974A, R976A, H982A, H983A, K1000A, K1014A, K1047A, K1060A, K1003A, K1107A, S1109A, H1240A, K1289A, K1296A, H1297A, K1300A, H1311A или K1325A.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит две или более замен, где две или более замен включают без ограничения R783A и A1322T, или R780A и K810A, или ER780A и K855A, или R780A и R976A, или K848A и R976A, или K855A и R976A, и R780A и K848A, или K810A и K848A, или K848A и K855A, или K810A и K855A, или H982A и R1060A, или H982A и R1003A, или K1003A и R1060A, или R780A и H982A, или K810A и H982A, или K848A и H982A, или K855A и H982A, или R780A и K1003A, или K810A и R1003A, или K848A и K1003A, или K848A и K1007A, или R780A и R1060A, или K810A и R1060A, или K848A и R1060A, или R780A и R1114A, или K848A и R1114A, или R63A и K855A, или R63A и H982A, или H415A и R780A, или H415A и K848A, или K848A и E1108A, или K810A и K1003A, или R780A и R1060A, K810A и R1060A, или K848A и R1060A.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит три или более замен, где три или более замен включают без ограничения H982A, K1003A и K1129E, или R780A, K1003A и R1060A, или K810A, K1003A и R1060A, или K848A, K1003A и R1060A, или K855A, K1003A и R1060A, или H982A, K1003A и R1060A, или R63A, K848A и R1060A, или T13I, R63A и K810A, или G12D, R63A и R1060A.

В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит четыре или более замен, где четыре или более замен включают без ограничения R63A, E610G, K855A и R1060A, или R63A, K855A, R1060A и E610G.

В одном предпочтительном варианте осуществления мутация в не встречающемся в природе ферменте CRISPR не является мутацией, перечисленной в таблице B. В дополнительном предпочтительном варианте осуществления мутация в не встречающемся в природе ферменте CRISPR не является R63A, K866A, H982A, H983A, K1107A, K1107A, KES1107-1109AG или KES1107-1109GG в соответствии с нумерацией аминокислотных положений SpCas9. В дополнительном предпочтительном варианте осуществления не встречающийся в природе фермент CRISPR не является ферментом, модифицированным с помощью одиночной мутации, выбранной из R63A, K866A, H982A, H983A, K1107A и K1107A, или ферментом, модифицированным с помощью мутации, выбранной из KES1107-1109AG и KES1107-1109GG в соответствии с нумерацией аминокислотных положений SpCas9.

В предпочтительном варианте осуществления описанный выше не встречающийся в природе фермент CRISPR модифицирован с помощью мутации одного или нескольких остатков, включающих без ограничения положения 12, 13, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 961, 968, 974, 976, 1000, 1003, 1014, 1047, 1060, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 и 1325 в соответствии с нумерацией аминокислотных положений SpCas9.

В дополнительном предпочтительном варианте осуществления описанный выше не встречающийся в природе фермент CRISPR модифицирован с помощью мутации и содержит одну или несколько замен на аланин по остаткам, включающим без ограничения положения 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 961, 968, 974, 976, 1000, 1003, 1014, 1047, 1060, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 или 1325 в соответствии с нумерацией аминокислотных положений SpCas9.

В дополнительном предпочтительном варианте осуществления описанный выше не встречающийся в природе фермент CRISPR модифицирован с помощью мутации и содержит одну или несколько замен K775A, E779L, Q807A, R780A, K810A, R832A, K848A, K855A, K862A, K961A, K968A, K974A, R976A, K1000A, K1014A, K1047A, K1060A, K1003A, S1109A, H1240A, K1289A, K1296A, H1297A, K1300A, H1311A или K1325A.

В любом из не встречающихся в природе ферментов CRISPR:

одиночное несовпадение может находиться между целевой и соответствующей последовательностью одного или нескольких нецелевых локусов; и/или

два, три или четыре или более несовпадений могут находиться между целевой и соответствующей последовательностью одного или нескольких нецелевых локусов, и/или

где (ii) указанные два, три или четыре или более несовпадения являются смежными.

В случае любого из не встречающихся в природе ферментов CRISPR фермент в комплексе CRISPR может характеризоваться сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и при этом фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать указанные целевые локусы по сравнению с немодифицированным ферментом.

В случае любого из не встречающихся в природе ферментов CRISPR, когда он находится в комплексе CRISPR, относительная разница модифицирующей способности фермента в отношении целевого и по меньшей мере одного нецелевого локуса может быть увеличена по сравнению с относительной разницей для немодифицированного фермента.

В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может содержать одну или несколько дополнительный мутаций, где одна или несколько дополнительных мутаций находятся в одном или нескольких каталитически активных доменах.

В случае таких не встречающихся в природе ферментов CRISPR фермент CRISPR может характеризоваться сниженной или отмененной нуклеазной активностью в сравнении с ферментом, у которого отсутствует указанная одна или несколько дополнительных мутаций.

В случае некоторых таких не встречающихся в природе ферментов CRISPR фермент CRISPR не управляет расщеплением одной или другой нити ДНК в определенном положении целевой последовательности.

В случае некоторых таких не встречающихся в природе ферментов CRISPR одна или несколько дополнительных мутаций предусматривают мутацию D10 из SpCas9, E762 из SpCas9, H840 из SpCas9, N854 из SpCas9, N863 из SpCas9 и/или D986 из SpCas9 или соответствующие остатки из других ортологов Cas9.

В случае некоторых таких не встречающихся в природе ферментов CRISPR одна или несколько дополнительных мутаций предусматривают D10A, E762A, H840A, N854A, N863A и/или D986A из SpCas9 или соответствующие остатки из других ортологов Cas9.

В случае некоторых таких не встречающихся в природе ферментов CRISPR одна или несколько дополнительных мутаций предусматривают две дополнительные мутации. Две дополнительные мутации могут предусматривать D10A SpCas9 и H840A SpCas9 или соответствующие остатки из другого ортолога Cas9. В случае некоторых таких не встречающихся в природе ферментов CRISPR фермент CRISPR может не управлять расщеплением одной из нитей ДНК в определенном положении целевой последовательности.

Если фермент CRISPR содержит одну или несколько дополнительных мутаций в одном или нескольких каталитически активных доменах, одна или несколько дополнительных мутаций может находиться в каталитически активном домене фермента CRISPR, содержащего RuvCI, RuvCII или RuvCIII.

Без ограничения теорией, в одном аспекте настоящего изобретения описаны способы и мутации, предусмотренные для улучшения конформационной перегруппировки доменов Cas9 в положения, которые обеспечивают расщепление в целевых сайтах, и избегание таких конформационных состояний в случае нецелевых сайтов. Cas9 расщепляет целевую ДНК с помощью целого ряда координированных стадий. Вначале PAM-взаимодействующий домен распознает PAM-последовательность на 5'-конце целевой ДНК. После связывания PAM первые 10-12 нуклеотидов целевой последовательности (затравочная последовательность) проверяется на комплементарность sgRNA:ДНК, причем данный процесс обусловлен разделением ДНК-дуплекса. Если нуклеотиды затравочной последовательности комплементарны sgRNA, остальная ДНК раскручивается, и sgRNA по всей длине гибридизируется с целевой нитью ДНК. nt-Бороздка между доменами RuvC и HNH стабилизирует не подвергаемую нацеливанию нить ДНК и облегчает раскручивание благодаря неспецифическим взаимодействиям с положительными зарядами фосфатного остова ДНК. Взаимодействия РНК:cDNA и Cas9:ncDNA управляют раскручиванием ДНК, конкурирующим с повторной гибридизацией cDNA:ncDNA. Другие домены cas9 также влияют на конформацию нуклеазных доменов, например, линкеры, соединяющие HNH с RuvCII и RuvCIII. В соответствии с этим, предусмотренные способы и мутации охватывают без ограничения домены RuvCI, RuvCIII, RuvCIII и HNH и линкеры. Конформационные изменения в Cas9, вызванные связыванием целевой ДНК, включая взаимодействия с затравочной последовательностью и взаимодействия с целевой и не подвергаемой нацеливанию нитью ДНК, определяют, будут ли домены расположены так, чтобы запустить нуклеазную активность. Таким образом, мутации и способы, предусмотренные в данном документе, демонстрируют и обеспечивают модификации, которые выходят за пределы распознавания PAM и образования пар оснований между РНК-ДНК.

В одном аспекте настоящего изобретения предусмотрены нуклеазы Cas9, которые предусматривают улучшенное равновесие, смещенное в направлении конформаций, ассоциированных с активностью расщепления, при вовлечении в целевые взаимодействия, и/или улучшенное равновесие, смещенное в обратную сторону от конформаций, ассоциированных с активностью расщепления, при вовлечении в нецелевые взаимодействия. В одном аспекте настоящего изобретения предусмотрены нуклеазы Cas9 с улучшенной функцией редактирования, т.е. нуклеаза Cas9, которая принимает конформацию, предусматривающую нуклеазную активность в отношении целевого сайта, и при этом такая конформация характеризуется повышенной невыгодностью в отношении нецелевого сайта. Sternberg et al., Nature 527(7576):110-3, doi: 10.1038/nature15544, опубликована онлайн 28 октября 2015 года. В Epub 2015 Oct 28, применяли эксперименты c Ферстеровским резонансным переносом энергии (FRET) для обнаружения относительной ориентации каталитических доменов Cas9 при ассоциации с целевой и нецелевой ДНК.

В настоящем изобретении также предусмотрены способы и мутации для модулирования нуклеазной активности и/или специфичности с применением модифицированных направляющих РНК. Как уже обсуждалось, целевая нуклеазная активность может быть повышенной или сниженной. Также, нецелевая нуклеазная активность может быть повышенной или сниженной. Кроме того, может быть повышена или снижена специфичность в отношении целевой активности в сравнении с нецелевой активностью. Модифицированные направляющие РНК включают без ограничения усеченные направляющие РНК, нефункциональные направляющие РНК, химически модифицированные направляющие РНК, направляющие РНК, ассоциированные с функциональными доменами, модифицированные направляющие РНК, содержащие функциональные домены, модифицированные направляющие РНК, содержащие аптамеры, модифицированные направляющие РНК, содержащие адапторные белки, и направляющие РНК, содержащие добавленные или модифицированные петли.

В одном аспекте настоящего изобретения также предусмотрены способы и мутации для модулирования активности связывания и/или специфичности связывания Cas9. В определенных вариантах осуществления применяют белки Cas9, у которых отсутствует нуклеазная активность. В определенных вариантах осуществления используют модифицированные направляющие РНК, которые содействуют связыванию, но не нуклеазной активности нуклеазы Cas9. В таких вариантах осуществления целевое связывание может быть повышенным или сниженным. Также, в таких вариантах осуществления нецелевое связывание может быть повышенным или сниженным. Более того, может быть повышена или снижена специфичность в отношении целевого связывания в сравнении с нецелевым связыванием.

Способы и мутации, которые можно использовать в различных комбинациях для повышения или снижения активности и/или специфичности целевой в сравнении с нецелевой активностью, или повышения или снижения связывания и/или специфичности целевого в сравнении с нецелевым связыванием, можно применять, чтобы компенсировать или усилить влияние мутаций или модификаций, выполненных для содействия другим эффектам. Такие мутации или модификации, выполненные для содействия другим эффектам, включают мутации или модификацию в Cas9 и/или мутацию или модификацию, выполненную в направляющей РНК. В определенных вариантах осуществления способы и мутации применяют с химически модифицированными направляющими РНК. Примеры химических модификаций направляющих РНК включают без ограничения введение 2′-O-метила (M), 2′-O-метил-3′-фосфоротиоата (MS) или 2′-O-метил-3′-тио-PACE (MSP) в один или несколько концевых нуклеотидов. Такие химически модифицированные направляющие РНК могут предусматривать повышенную стабильность и повышенную активность по сравнению с немодифицированными направляющими РНК, хотя целевая в сравнении с нецелевой специфичность не является прогнозируемой. (См. Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, опубликована онлайн 29 июня 2015 года). Химически модифицированные направляющие РНК также включают без ограничения РНК с фосфоротиоатными связями и нуклеотиды закрытых нуклеиновых кислот (LNA), содержащие метиленовый мостик между атомами углерода 2′ и 4′ в кольце рибозы. Способы и мутации по настоящему изобретению применяют для модулирования нуклеазной активности и/или связывания Cas9 с химически модифицированными направляющими РНК.

В одном аспекте настоящего изобретения предусмотрены способы и мутации для модулирования связывания и/или специфичности связывания белков Cas9, содержащих функциональные домены, такие нуклеазы, активаторы транскрипции, репрессоры транскрипции и т.п. К примеру, можно сделать белок Cas9 с отсутствием нуклеазной активности путем введения мутаций, таких как D10A, D839A, H840A и N863A в нуклеазные домены RuvC и HNH. Белки Cas9, лишенные нуклеазной активности, пригодны для РНК-направляемой зависимой от целевой последовательности доставки функциональных доменов. В настоящем изобретении предусмотрены способы и мутации для модулирования связывания белков Cas9. В одном варианте осуществления функциональный домен предусматривает VP64, обеспечивающий РНК-направляемый фактор транскрипции. В другом варианте осуществления функциональный домен предусматривает Fok I, обеспечивающий РНК-направляемую нуклеазную активность. Здесь следует упомянуть публикацию заявки на патент США 2014/0356959, публикацию заявки на патент США 2014/0342456, публикацию заявки на патент США 2015/0031132, и Mali, P. et al., 2013, Science 339(6121):823-6, doi: 10.1126/science.1232033, опубликованную онлайн 3 января 2013 года, и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В определенных вариантах осуществления целевое связывание является повышенным. В определенных вариантах осуществления нецелевое связывание является сниженным. В определенных вариантах осуществления целевое связывание является сниженным. В определенных вариантах осуществления нецелевое связывание является повышенным. В соответствии с этим, в настоящем изобретении также предусмотрено повышение или снижение специфичности целевого связывания в сравнении с нецелевым связыванием у функционализированных связывающих белков Cas9.

Применение Cas9 в качестве РНК-направляемого связывающего белка не ограничивается Cas9 с отсутствием нуклеазной активности Ферменты Cas9, предусматривающие нуклеазную активность, также могут функционировать как РНК-направляемые связывающие белки, при применении с определенными направляющими РНК. Например, короткие направляющие РНК и направляющие РНК, содержащие нуклеотиды, несовпадающие с мишенью, могут содействовать управляемому РНК связыванию Cas9 с целевой последовательностью с небольшим или отсутствием расщепления целевой последовательности. (См., например, Dahlman, 2015, Nat Biotechnol. 33(11):1159-1161, doi: 10.1038/nbt.3390, опубликованный онлайн 05 октября 2015 года). В одном аспекте настоящего изобретения предусмотрены способы и мутации для модулирования связывания белков Cas9, которые предусматривают нуклеазную активность. В определенных вариантах осуществления целевое связывание является повышенным. В определенных вариантах осуществления нецелевое связывание является сниженным. В определенных вариантах осуществления целевое связывание является сниженным. В определенных вариантах осуществления нецелевое связывание является повышенным. В определенных вариантах осуществления имеется повышенная или сниженная специфичность целевого связывания в сравнении с нецелевым связыванием. В определенных вариантах осуществления нуклеазная активность направляющей РНК-фермента Cas9 также модулирована.

Для активности и специфичности расщепления является важным образование гетеродуплекса РНК-ДНК на протяжении всего целевого участка, а не только участка затравочной последовательности, ближайшего к PAM. Так, усеченные направляющие РНК проявляют сниженную активность и специфичность расщепления. В одном аспекте настоящего изобретения предусмотрены способ и мутации для повышения активности и специфичности расщепления с применением измененных направляющих РНК.

В настоящем изобретении также продемонстрировано, что модификации специфичности нуклеазы Cas9 могут быть выполнены в сочетании с модификациями в отношении диапазона нацеливания. Могут быть разработаны мутанты Cas9, которые характеризуются повышенной специфичностью в отношении мишени, а также имеют модификации, обеспечивающие распознавание PAM, например, путем выбора мутаций, который изменяют специфичность в отношении PAM и комбинирования этих мутаций с мутациями nt-бороздки, которые повышают (или, в случае необходимости, снижают) специфичность в отношении целевых последовательностей в сравнении с нецелевыми последовательностями. В одном таком варианте осуществления остаток домена PI подвергают мутированию для обеспечения распознавания требуемой последовательности PAM, при этом одну или несколько аминокислот nt-бороздки подвергают мутированию для изменения специфичности в отношении мишени. Kleinstiver приводит нуклеазы SpCas9 и SaCas9, в которых определенные остатки домена PI мутированы и распознают альтернативные последовательности PAM (см. Kleinstiver et al., Nature 523(7561):481-5 doi: 10.1038/nature14592, опубликована онлайн 22 июня 2015 года; Kleinstiver et al., Nature Biotechnology, doi: 10.1038/nbt.3404, опубликована онлайн 2 ноября 2015 года). Способы и модификации Cas9, описанные в данном документе, можно применять для противодействия потере специфичности, происходящей в результате изменения распознавания PAM, усиления возрастания специфичности, происходящего в результате изменения распознавания PAM, противодействия возрастанию специфичности, происходящему в результате изменения распознавания PAM, или усиления потери специфичности, происходящей в результате изменения распознавания PAM.

Способы и мутации можно применять в отношении любого фермента Cas9 с измененным распознаванием PAM. Неограничивающие примеры PAM включают NGG, NNGRRT, NN[A/C/T]RRT, NGAN, NGCG, NGAG, NGNG, NGC и NGA.

В дополнительных вариантах осуществления способов и мутаций применяют модифицированные белки.

В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может содержать один или несколько гетерологичных функциональных доменов.

Один или несколько гетерологичных функциональных доменов могут предусматривать один или несколько доменов, представляющих собой сигнал ядерной локализации (NLS). Один или несколько гетерологичных функциональных доменов могут предусматривать по меньшей мере два или более NLS.

В определенных вариантах осуществления настоящего изобретения по меньшей мере один сигнал ядерной локализации (NLS) прикреплен к последовательностям нуклеиновой кислоты, кодирующим эффекторные белки Cas9. В предпочтительных вариантах осуществления прикреплены по меньшей мере один или несколько C-концевых или N-концевых NLS (и, следовательно, молекула(молекулы) нуклеиновой кислоты, кодирующая(кодирующие) эффекторный белок Cas9, может предусматривать кодирование NLS, вследствие чего экспрессированный продукт имеет прикрепленный(прикрепленные) или присоединенный(присоединенные) NLS). В предпочтительном варианте осуществления C-концевой NLS прикреплен для оптимальной экспрессии и нацеливания в ядро в эукариотических клетках, предпочтительно клетках человека. В предпочтительном варианте осуществления кодон-оптимизированный эффекторный белок представляет собой SpCas9 или SaCas9, а длина спейсера направляющей РНК составляет от 15 до 35 нуклеотидов. В определенных вариантах осуществления длина спейсера направляющей РНК составляет по меньшей мере 16 нуклеотидов, как, например, по меньшей мере 17 нуклеотидов. В определенных вариантах осуществления длина спейсера составляет от 15 до 17 нуклеотидов, от 17 до 20 нуклеотидов, от 20 до 24 нуклеотидов, например, 20, 21, 22, 23 или 24 нуклеотида, от 23 до 25 нуклеотидов, например, 23, 24 или 25 нуклеотидов, от 24 до 27 нуклеотидов, 27-30 нуклеотидов, 30-35 нуклеотидов, или 35 нуклеотидов или больше. В определенных вариантах осуществления настоящего изобретения кодон-оптимизированный эффекторный белок представляет собой SpCas9 или SaCas9, а длина прямого повтора направляющей РНК составляет по меньшей мере 16 нуклеотидов. В определенных вариантах осуществления кодон-оптимизированный эффекторный белок представляет собой FnCpf1p, а длина прямого повтора направляющей РНК составляет от 16 до 20 нуклеотидов, например, 16, 17, 18, 19 или 20 нуклеотидов. В определенных предпочтительных вариантах осуществления длина прямого повтора направляющей РНК составляет 19 нуклеотидов.

Один или несколько гетерологичных функциональных доменов предусматривают один или несколько доменов активации транскрипции. Домен активации транскрипции может предусматривать VP64.

Один или несколько гетерологичных функциональных доменов предусматривают один или несколько доменов репрессии транскрипции. Домен репрессии транскрипции может предусматривать домен KRAB или домен SID.

Один или несколько гетерологичных функциональных доменов могут предусматривать один или несколько нуклеазных доменов. Один или несколько нуклеазных доменов могут предусматривать Fok1.

Один или несколько гетерологичных функциональных доменов могут характеризоваться одной или несколькими из следующих видов активности: метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, нуклеазной активностью, активностью расщепления однонитевой РНК, активностью расщепления двухнитевой РНК, активностью расщепления однонитевой ДНК, активностью расщепления двухнитевой ДНК и активностью связывания нуклеиновой кислоты.

По меньшей мере один или несколько гетерологичных функциональных доменов могут быть расположены на амино-конце фермента или вблизи него и/или на карбокси-конце фермента или вблизи него.

Один или несколько гетерологичных функциональных доменов могут быть слиты с ферментом CRISPR, или связаны с ферментом CRISPR, или присоединены к ферменту CRISPR с помощью линкерного фрагмента.

В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может предусматривать фермент CRISPR от организма из рода, включающего Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.

В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может предусматривать химерный фермент Cas9, содержащий первый фрагмент от первого ортолога Cas9 и второй фрагмент от второго ортолога Cas9, и при этом первый и второй ортологи Cas9 являются различными. По меньшей мере один из первого и второго ортологов Cas9 может предусматривать Cas9 от организма, включающего Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.

В случае любого из не встречающихся в природе ферментов CRISPR нуклеотидная последовательность, кодирующая фермент CRISPR может быть подвергнута кодон-оптимизации для экспрессии в эукариотическом организме.

В случае любого из не встречающихся в природе ферментов CRISPR клетка может представлять собой эукариотическую клетку или прокариотическую клетку; причем комплекс CRISPR является функциональным в клетке, и при этом фермент комплекса CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов в клетке по сравнению с немодифицированным ферментом, и/или при этом фермент в комплексе CRISPR характеризуется усиленной способностью модифицировать один или нескольких целевых локусов по сравнению с немодифицированным ферментом.

В настоящем изобретении также предусмотрена не встречающаяся в природе, сконструированная композиция, содержащая комплекс CRISPR-Cas, содержащий любой не встречающийся в природе фермент CRISPR, описанный выше.

В настоящем изобретении также предусмотрена не встречающаяся в природе, сконструированная композиция, содержащая:

систему доставки, функционально сконфигурированную с возможностью доставки компонентов комплекса CRISPR-Cas или одной или нескольких полинуклеотидных последовательностей, предусматривающих или кодирующих указанные компоненты, в клетку, и где указанный комплекс CRISPR-Cas является функциональным в клетке,

компоненты комплекса CRISPR-Cas или одну или несколько кодирующих полинуклеотидных последовательностей для транскрипции и/или трансляции в клетке, причем компоненты комплекса CRISPR-Cas предусматривают:

(I) не встречающийся в природе фермент CRISPR в соответствии с любым из предыдущих пунктов;

(II) РНК комплекса CRISPR-Cas, содержащую:

направляющую последовательность,

парную tracr-последовательность, и

tracr-последовательность,

где

в клетке

парная tracr-последовательность гибридизируется с tracr-последовательностью;

образуется комплекс CRISPR;

направляющая РНК нацеливается на целевые полинуклеотидные локусы и фермент изменяет полинуклеотидные локусы, и

фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.

В случае любой такой композиции система доставки может предусматривать дрожжевую систему, систему на основе липофекции, систему на основе микроинъекции, систему на основе биолистики, виросомы, липосомы, иммунолипосомы, поликатионы, конъюгаты липид:нуклеиновая кислота или искусственные вирионы.

В случае любых таких композиций система доставки может предусматривать векторную систему, содержащую один или несколько векторов, и где компонент (II) содержит первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, которая содержит направляющую последовательность, парную tracr-последовательность и tracr-последовательность, и где компонент (I) содержит второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR. В случае таких композиций направляющая РНК или РНК комплекса CRISPR-Cas может предусматривать химерную РНК.

В случае любых таких композиций система доставки может предусматривать векторную систему, содержащую один или несколько векторов, и где компонент (II) содержит первый регуляторный элемент, функционально связанный с направляющей последовательностью и парной tracr-последовательностью, и третий регуляторный элемент, функционально связанный с tracr-последовательностью, и где компонент (I) содержит второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR.

В случае любых таких композиций композиция может предусматривать более одной направляющей РНК, и каждая направляющая РНК имеет свою мишень, в результате чего происходит мультиплексирование.

В случае любых таких композиций полинуклеотидная(полинуклеотидные) последовательность(последовательности) может(могут) находиться на одном векторе.

В настоящем изобретении также предусмотрена векторная система на основе сконструированного, не встречающегося в природе фермента Cas, ассоциированного с короткими палиндромными повторами, регулярно расположенными группами (CRISPR)-CRISPR-ассоциированного (Cas) (CRISPR-Cas), содержащая один или несколько векторов, содержащих:

a) первый регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей не встречающийся в природе фермент CRISPR любой из конструкций по настоящему изобретению, изложенных в данном документе; и

b) второй регуляторный элемент, функционально связанный с одной или несколькими нуклеотидными последовательностями, кодирующими одну или несколько направляющих РНК, причем направляющая РНК предусматривает направляющую последовательность, tracr-последовательность и парную tracr-последовательность,

где

компоненты (a) и (b) находятся в одном и том же или разных векторах,

парная tracr-последовательность гибридизируется с tracr-последовательностью;

образуется комплекс CRISPR;

направляющая РНК нацеливается на целевые полинуклеотидные локусы и фермент изменяет полинуклеотидные локусы, и

фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.

В случае такой системы компонент (II) может содержать первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, которая содержит направляющую последовательность, парную tracr-последовательность и tracr-последовательность, и где компонент (II) может содержать второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR. В случае такой системы направляющая РНК может предусматривать химерную РНК.

В случае такой системы компонент (I) может содержать первый регуляторный элемент, функционально связанный с направляющей последовательностью и парной tracr-последовательностью, и третий регуляторный элемент, функционально связанный с tracr-последовательностью, и где компонент (II) может содержать второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR. Такая система может содержать более одной направляющей РНК, и каждая направляющая РНК имеет свою мишень, в результате чего происходит мультиплексирование. Компоненты (a) и (b) могут быть расположены на одном и том же векторе.

В случае любой из таких систем, содержащих векторы, один или несколько векторов могут предусматривать один или несколько вирусных векторов, таких как один или несколько ретровирусных, лентивирусных, аденовирусных векторов, векторов на основе аденоассоциированного вируса или вируса простого герпеса.

В случае любой из таких систем, содержащих регуляторные элементы, по меньшей мере один из указанных регуляторных элементов может предусматривать тканеспецифичный промотор. Тканеспецифичный промотор может управлять экспрессией в клетке крови млекопитающего, в клетке печени млекопитающего или в глазу млекопитающего.

В случае любой из описанных выше композиций или систем tracr-последовательность может предусматривать один или несколько РНК-аптамеров, взаимодействующих с белком. Один или несколько аптамеров могут находиться в тетрапетле и/или структуре "петля-на-стебле" 2 tracr-последовательности. Один или несколько аптамеров могут быть способны связывать белок оболочки бактериофага MS2.

В случае любой из описанных выше композиций или систем tracr-последовательность может иметь длину 30 или более нуклеотидов.

В случае любой из описанных выше композиций или систем клетка может представлять собой эукариотическую клетку или прокариотическую клетку; где комплекс CRISPR является функциональным в клетке, и в результате этого фермент комплекса CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов в клетке по сравнению с немодифицированным ферментом и/или в результате этого фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.

В настоящем изобретении также предусмотрен комплекс CRISPR любой из описанных выше композиций или из любой из описанных выше систем.

В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в терапии.

В настоящем изобретении также предусмотрен способ модифицирования представляющего интерес локуса в клетке, включающий приведение клетки в контакт с любой из описанных выше композиций или любой из описанных выше систем, или где клетка содержит любой из описанных выше комплексов CRISPR, присутствующих в клетке. В случае таких способов клетка может представлять собой эукариотическую клетку. В случае таких способов организм может содержать клетку. В случае таких способов организм может не представлять собой человека или другое животное. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании представляющего интерес локуса в клетке. Такое модифицирование предпочтительно предусматривает приведение клетки в контакт с любой из описанных выше композиций или любой из описанных выше систем. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток в соответствии с настоящим изобретением в получении лекарственного препарата для модифицирования представляющего интерес локуса в клетке.

Любой такой способ может осуществляться ex vivo или in vitro.

Любой такой способ указанного модифицирования может предусматривать модулирование экспрессия гена. Указанное модулирование экспрессии гена может предусматривать активацию экспрессии гена и/или репрессию экспрессии гена.

В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании представляющего интерес локуса в клетке. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток в соответствии с настоящим изобретением в получении лекарственного препарата для модифицирования представляющего интерес локуса в клетке. Указанное модифицирование предпочтительно предусматривает приведение клетки в контакт с любой из описанных выше композиций или любой из описанных выше систем. В настоящем изобретении также предусмотрен способ лечения заболевания, нарушения или инфекции у индивидуума, нуждающегося в этом, включающий введение эффективного количества любой из композиций, систем или комплексов CRISPR, описанных выше. Заболевание, нарушение или инфекция могут предусматривать вирусную инфекцию. Вирусная инфекция может представлять собой инфекцию, вызванную HBV.

В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в лечении заболевания, нарушения или инфекции у индивидуума, нуждающегося в этом. Заболевание, нарушение или инфекция могут предусматривать вирусную инфекцию. Вирусная инфекция может представлять собой инфекцию, вызванную HBV. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток в соответствии с настоящим изобретением в получении лекарственного препарата для лечения заболевания, нарушения или инфекции у индивидуума, нуждающегося в этом. Заболевание, нарушение или инфекция могут предусматривать вирусную инфекцию.

В настоящем изобретении также предусмотрено применение любой из композиций, систем или комплексов CRISPR, описанных выше в отношении редактирования гена или генома.

В настоящем изобретении также предусмотрена любая из композиций, систем или комплексов CRISPR, описанных выше, для применения в качестве терапевтического средства. Терапевтическое средство может предназначаться для редактирования гена или генома, или генной терапии.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, включающий:

доставку в HSC, например, путем приведения HSC в контакт с частицей, содержащей не встречающуюся в природе или сконструированную композицию, содержащую:

I. полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-Cas, содержащую:

(a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в HSC,

(b) парную tracr-последовательность и

(c) tracr-последовательность, и

II. фермент CRISPR, необязательно содержащий по меньшей мере одну или несколько последовательностей ядерной локализации,

где парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и

где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью; и

способ может необязательно также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и

необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы (частиц) с HSC c получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека.

В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC. Указанное модифицирование предпочтительно предусматривает

доставку в HSC, например, путем приведения HSC в контакт с частицей, содержащей не встречающуюся в природе или сконструированную композицию, содержащую:

I. полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-Cas, содержащую:

(a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в HSC,

(b) парную tracr-последовательность и

(c) tracr-последовательность, и

II. фермент CRISPR, необязательно содержащий по меньшей мере одну или несколько последовательностей ядерной локализации,

где парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и

где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью. Указанное модифицирование также необязательно включает доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния. Указанное модифицирование также необязательно включает выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, включающий: доставку в HSC, например, путем приведения HSC в контакт с частицей, содержащей не встречающуюся в природе или сконструированную композицию, содержащую: I. (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в HSC, и (b) по меньшей мере одну или несколько парных tracr-последовательностей, II. фермент CRISPR необязательно с одним или несколькими NLS и III. полинуклеотидную последовательность, содержащую tracr-последовательность, где парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью; и

способ может необязательно также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и

необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы (частиц) с HSC c получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания.

Доставка может представлять собой доставку одного или нескольких полинуклеотидов, кодирующих какой-либо один или несколько или все из CRISPR-комплексов, преимущественно связанных с одним или несколькими регуляторными элементами для экспрессии in vivo, например, посредством частицы (частиц), (содержащей) содержащих вектор, содержащий полинуклеотид(полинуклеотиды), функционально связанный (связанные) с регуляторным (регуляторными) элементом(элементами). Любая или все из полинуклеотидной последовательности, кодирующей фермент CRISPR, направляющей последовательности, парной tracr-последовательности или tracr-последовательности могут представлять собой РНК. Следует иметь в виду, что если ссылаются на полинуклеотид, который представляет собой РНК, и, как говорят, "содержит" элемент, такой как парная tracr-последовательность, то последовательность РНК включает данный элемент. Если полинуклеотид представляет собой ДНК и, как говорят, содержит элемент, такой как парная tracr-последовательность, то последовательность ДНК транскрибируется или может быть транскрибирована в РНК, содержащую элемент, о котором идет речь. Если элемент представляет собой белок, как, например, фермент CRISPR, то упоминаемая последовательность ДНК или РНК транслируется или может быть транслирована (а в случае ДНК сначала транскрибируется).

В определенных вариантах осуществления настоящего изобретения предусмотрен способ модифицирования организма, например, млекопитающего, включая человека, или отличного от человека млекопитающего или организма путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, включающий доставку, например, путем приведения не встречающейся в природе или сконструированной композиция в контакт с HSC, где композиция содержит одну или несколько частиц, содержащих вирусный, плазмидный вектор (векторы) или вектор (векторы) на основе молекул нуклеиновой кислоты (например, РНК), функционально кодирующие композицию для их экспрессии, где композиция содержит: (A) I. первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью химерной РНК (chiRNA) системы CRISPR-Cas, где полинуклеотидная последовательность содержит (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (b) парную tracr-последовательность и (c) tracr-последовательность, и II. второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей фермент CRISPR, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации (или необязательно по меньшей мере одну или несколько последовательностей ядерной локализации, поскольку в некоторых вариантах осуществления может не предусматриваться NLS), где (a), (b) и (c) расположены в 5'-3'-ориентации, где компоненты I и II находятся в одном и том же или разных векторах системы, где будучи транскрибированными, парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфическим к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, или (B) не встречающуюся в природе или сконструированную композицию, содержащую векторную систему, содержащую один или несколько векторов, содержащих I. первый регуляторный элемент, функционально связанный с (a) направляющей последовательностью, способной гибридизироваться с целевой последовательностью в эукариотической клетке, (b) по меньшей мере одной или несколькими парными tracr-последовательностями, II. второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей фермент CRISPR, и III. третий регуляторный элемент, функционально связанный с tracr-последовательностью, где компоненты I, II и III находятся на одном и том же или разных векторах системы, где будучи транскрибированными, парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью; причем способ необязательно может включать также доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и необязательно способ может включать выделение или получение HSC от организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы (частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В некоторых вариантах осуществления компоненты I, II и III находятся на одном и том же векторе. В других вариантах осуществления компоненты I и II находятся в одном и том же векторе, тогда как компонент III находится в другом векторе. В других вариантах осуществления компоненты I и III находятся в одном и том же векторе, тогда как компонент II находится в другом векторе. В других вариантах осуществления компоненты II и III находятся в одном и том же векторе, тогда как компонент I находится в другом векторе. В других вариантах осуществления каждый из компонентов I, II и III находится в отдельных векторах. В настоящем изобретении также предусмотрена вирусная или плазмидная векторная система, описанная в данном документе. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма, например, млекопитающего, включая человека или отличного от человека млекопитающего или организма, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения не встречающейся в природе или сконструированной композиции в контакт с HSC.

Под манипуляцией с целевой последовательностью заявители также подразумевают эпигенетическую манипуляцию с целевой последовательностью. Она может осуществляться в отношении состояния хроматина целевой последовательности, как, например, путем модификации состояния метилирования целевой последовательности (т.е. добавление или устранение метилирования, или паттернов метилирования, или CpG-островков), модификации гистонов, повышения или снижения доступности целевой последовательности или путем активации укладки в 3D-структуру. Следует иметь в виду, что если ссылаются на способ модифицирования организма или млекопитающего, включая человека или отличного от человека млекопитающего или организма, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома, то он может применяться в отношении организма (или млекопитающего) в целом или всего лишь одной клетки или популяции клеток из этого организма (если организм является многоклеточным). К примеру, в случае человека заявители предусматривают, inter alia, одну клетку или популяцию клеток, и их предпочтительно можно модифицировать ex vivo и затем вводить обратно. В этом случае может быть необходим биоптат или другой образец ткани или биологической жидкости. Стволовые клетки также являются особенно предпочтительными в этом отношении. Но, разумеется, также предусматриваются варианты осуществления in vivo. И настоящее изобретение является особенно преимущественным в отношении HSC.

В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), (содержащей)содержащими не встречающуюся в природе или сконструированную композицию, содержащую:

I. первую полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-Cas, где первая полинуклеотидная последовательность содержит:

(a) первую направляющую последовательность, способную гибридизироваться с первой целевой последовательностью,

(b) первую парную tracr-последовательность и

(c) первую tracr-последовательность,

II. вторую полинуклеотидную последовательность chiRNA системы CRISPR-Cas, где вторая полинуклеотидная последовательность содержит:

(a) вторую направляющую последовательность, способную гибридизироваться со второй целевой последовательностью,

(b) вторую парную tracr-последовательность и

(c) вторую tracr-последовательность, и

III. полинуклеотидную последовательность, кодирующую фермент CRISPR, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации и содержащий одну или несколько мутаций, где (a), (b) и (c) расположены в 5'-3'-ориентации; или

IV. продукт(продукты) экспрессии одной или нескольких из I. - III., например, первую и вторую парные tracr-последовательности, фермент CRISPR;

где будучи транскрибированными, первая и вторая парная tracr-последовательности гибридизируются с первой и второй tracr-последовательностями соответственно, а первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплексов CRISPR с первой и второй целевыми последовательностями соответственно, где первый комплекс CRISPR содержит фермент CRISPR в комплексе с (1) первой направляющей последовательностью, которая гибридизирована с первой целевой последовательностью, и (2) первой парной tracr-последовательностью, которая гибридизирована с первой tracr-последовательностью, где второй комплекс CRISPR содержит фермент CRISPR в комплексе с (1) второй направляющей последовательностью, которая гибридизирована с второй целевой последовательностью, и (2) второй парной tracr-последовательностью, которая гибридизирована с второй tracr-последовательностью, где полинуклеотидная последовательность, кодирующая фермент CRISPR, представляет собой ДНК или РНК, и где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, а вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, индуцируя двухнитевой разрыв, за счет чего обеспечивается модифицирование организма или организма, отличного от человека; и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В некоторых способах по настоящему изобретению любая или все из полинуклеотидной последовательности, кодирующей фермент CRISPR, первой и второй направляющих последовательностей, первой и второй парных tracr-последовательностей или первой и второй tracr-последовательностей представляет собой/представляют собой РНК. В дополнительных вариантах осуществления настоящего изобретения полинуклеотиды, кодирующие последовательность, кодирующую фермент CRISPR, первую и вторую направляющие последовательности, первую и вторую парные tracr-последовательности или первую и вторую tracr-последовательности, представляют собой/представляют собой РНК и доставляются с помощью липосом, наночастиц, экзосом, микровезикул или генной пушки; но преимущественно, чтобы доставка осуществлялась посредством частицы. В определенных вариантах осуществления настоящего изобретения первая и вторая парные tracr-последовательности обладают 100% идентичностью, и/или первая и вторая tracr-последовательности обладают 100% идентичностью. В некоторых вариантах осуществления полинуклеотиды могут содержаться в векторной системе, содержащей один или несколько векторов. В предпочтительных вариантах осуществления настоящего изобретения фермент CRISPR представляет собой фермент Cas9, например SpCas9. В одном аспекте настоящего изобретения фермент CRISPR содержит одну или несколько мутаций в каталитическом домене, где одна или несколько мутаций по сравнению с SpCas9 выбраны из группы, состоящей из мутации D10A, E762A, H840A, N854A, N863A и D986A, например, мутацию D10A. В предпочтительных вариантах осуществления первый фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в комплементарную нить, а второй фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в некомплементарную нить. Альтернативно первый фермент может являться ферментом, вносящим однонитевой разрыв в некомплементарную нить, а второй фермент может являться ферментом, вносящим однонитевой разрыв в комплементарную нить. В предпочтительных способах по настоящему изобретению первая направляющая последовательность, управляющая расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность, управляющая расщеплением другой нити возле второй целевой последовательности, приводят к образованию "липкого" 5'-конца. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит не более 200 пар оснований, предпочтительно не более 100 пар оснований или более предпочтительно не более 50 пар оснований. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит по меньшей мере 26 пар оснований, предпочтительно по меньшей мере 30 пар оснований или более предпочтительно 34-50 пар оснований. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома у HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), содержащей(содержащими) не встречающуюся в природе или сконструированную композицию.

В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), (содержащей)содержащими не встречающуюся в природе или сконструированную композицию, содержащую:

I. первый регуляторный элемент, функционально связанный с

(a) первой направляющей последовательностью, способной гибридизироваться с первой целевой последовательностью и

(b) по меньшей мере одной или несколькими парными tracr-последовательностями,

II. второй регуляторный элемент, функционально связанный с

(a) второй направляющей последовательностью, способной гибридизироваться с второй целевой последовательностью, и

(b) по меньшей мере одной или несколькими парными tracr-последовательностями,

III. третий регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей фермент CRISPR, и

IV. четвертый регуляторный элемент, функционально связанный с tracr-последовательностью,

V. продукт (продукты) экспрессии одной или нескольких из I. - IV., например, первую и вторую парные tracr-последовательности, фермент CRISPR;

где компоненты I, II, III и IV расположены в одном и том же или разных векторах системы, при этом будучи транскрибированными, парная tracr-последовательность гибридизируется с tracr-последовательностью, а первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплексов CRISPR с первой и второй целевыми последовательностями соответственно, где первый комплекс CRISPR содержит фермент CRISPR в комплексе с (1) первой направляющей последовательностью, которая гибридизирована с первой целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, где второй комплекс CRISPR содержит фермент CRISPR в комплексе с (1) второй направляющей последовательностью, которая гибридизирована с второй целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, где полинуклеотидная последовательность, кодирующая фермент CRISPR, представляет собой ДНК или РНК, и где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, а вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, индуцируя двухнитевой разрыв, за счет чего обеспечивается модифицирование организма или организма, отличного от человека; и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы (частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома у HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей (частицами), содержащей (содержащими) не встречающуюся в природе или сконструированную композицию.

В настоящем изобретении также предусмотрена векторная система, описанная в данном документе. Система может содержать один, два, три или четыре различных вектора. Компоненты I, II, III и IV таким образом могут находиться в одном, двух, трех или четырех разных векторах, и в данном документе предусмотрены все комбинации возможных местоположений компонентов, например: компоненты I, II, III и IV могут находиться в одном и том же векторе; каждый из компонентов I, II, III и IV может находиться в отдельных векторах; компоненты I, II, III и IV могут находиться в общей сложности в двух или трех разных векторах, при этом предусмотрены все комбинации местоположений и т.п. В некоторых способах по настоящему изобретению любая или все полинуклеотидные последовательности, кодирующие фермент CRISPR, первую и вторую направляющие последовательности, первую и вторую парные tracr-последовательности или первую и вторую tracr-последовательности, представляет собой/представляют собой РНК. В дополнительных вариантах осуществления настоящего изобретения первая и вторая парные tracr-последовательности обладают 100% идентичностью, и/или первая и вторая tracr-последовательности обладают 100% идентичностью. В предпочтительных вариантах осуществления настоящего изобретения фермент CRISPR представляет собой фермент Cas9, например SpCas9. В одном аспекте настоящего изобретения фермент CRISPR содержит одну или несколько мутаций в каталитическом домене, где одна или несколько мутаций по сравнению с SpCas9 выбраны из группы, состоящей из D10A, E762A, H840A, N854A, N863A и D986A; например, мутацию D10A. В предпочтительных вариантах осуществления первый фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в комплементарную нить, а второй фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в некомплементарную нить. Альтернативно первый фермент может являться ферментом, вносящим однонитевой разрыв в некомплементарную нить, а второй фермент может являться ферментом, вносящим однонитевой разрыв в комплементарную нить. В дополнительном варианте осуществления настоящего изобретения один или несколько вирусных векторов доставляются посредством липосом, наночастиц, экзосом, микровезикул или генной пушки; но доставка с помощью частиц является преимущественной.

В предпочтительных способах по настоящему изобретению первая направляющая последовательность, управляющая расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность, управляющая расщеплением другой нити возле второй целевой последовательности, обуславливают образование "липкого" 5'-выступающего конца. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит не более 200 пар оснований, предпочтительно не более 100 пар оснований или более предпочтительно не более 50 пар оснований. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит по меньшей мере 26 пар оснований, предпочтительно по меньшей мере 30 пар оснований или более предпочтительно 34-50 пар оснований.

В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования представляющего интерес локуса генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, путем введения в HSC, например, путем приведения HSC в контакт с частицей (частицами), содержащей (содержащими) белок Cas с одной или несколькими мутациями и две направляющие РНК, которые нацеливаются на первую нить и вторую нить молекулы ДНК соответственно в HSC, в результате чего направляющие РНК нацеливаются на молекулу ДНК, а белок Cas вносит однонитевой разрыв в каждую из первой нити и второй нити молекулы ДНК, в результате чего мишень в HSC изменяется; и, где белок Cas и две направляющие РНК не встречаются в природе вместе, и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы (частиц) с HSC получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В предпочтительных способах по настоящему изобретению белок Cas вносит однонитевой разрыв в каждую из первой нити и второй нити молекулы ДНК, что приводит к образованию "липкого" 5'-конца. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит не более 200 пар оснований, предпочтительно не более 100 пар оснований или более предпочтительно не более 50 пар оснований. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит по меньшей мере 26 пар оснований, предпочтительно по меньшей мере 30 пар оснований или более предпочтительно 34-50 пар оснований. Варианты осуществления настоящего изобретения также охватывают направляющие РНК, предусматривающие направляющую последовательность, слитую с парной tracr-последовательностью и tracr-последовательностью. В одном аспекте настоящего изобретения белок Cas является кодон-оптимизированным для экспрессии в эукариотической клетке, предпочтительно в клетке млекопитающего или клетке человека. В дополнительных вариантах осуществления настоящего изобретения белок Cas представляет собой белок системы CRISPR-Cas II типа, например белок Cas 9. В особенно предпочтительном варианте осуществления белок Cas представляет собой белок Cas9, например, SpCas9 или SaCas9. В аспектах настоящего изобретения белок Cas имеет одну или несколько мутаций по сравнению с SpCas9, выбранных из группы, состоящей из D10A, E762A, H840A, N854A, N863A и D986A; например, мутацию D10A. Аспекты настоящего изобретения относятся к снижению экспрессии продукта гена, или к дополнительному введению полинуклеотидной матрицы в молекулу ДНК, кодирующую продукт гена, или к точному вырезанию вставочной последовательности путем обеспечения повторной гибридизации и лигирования двух "липких" 5’-концов, или к изменению активности или функционирования продукта гена, или к повышению экспрессии продукта гена. В одном варианте осуществления настоящего изобретения продукт гена представляет собой белок.

В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования представляющего интерес локуса генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, путем введения в HSC, например, путем приведения HSC в контакт с частицей (частицами), содержащей (содержащими):

a) первый регуляторный элемент, функционально связанный с каждой из двух направляющих РНК системы CRISPR-Cas, которые нацеливаются на первую нить и вторую нить соответственно двухнитевой молекулы ДНК HSC, и

b) второй регуляторный элемент, функционально связанный с белком Cas, или

c) продукт экспрессии (продукты экспрессии) a) или b),

где компоненты (a) и (b) находятся в одном и том же или разных векторах системы, в результате чего направляющие РНК нацеливаются на молекулу ДНК HSC, а белок Cas вносит однонитевой разрыв в каждую из первой нити и второй нити молекулы ДНК HSC; и где белок Cas и две направляющие РНК не встречаются в природе вместе; и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В аспектах настоящего изобретения направляющие РНК могут предусматривать направляющую последовательность, слитую с парной tracr-последовательностью и tracr-последовательностью. В одном варианте осуществления настоящего изобретения белок Cas представляет собой белок системы CRISPR-Cas II типа. В одном аспекте настоящего изобретения белок Cas является кодон-оптимизированным для экспрессии в эукариотической клетке, предпочтительно в клетке млекопитающего или клетке человека. В дополнительных вариантах осуществления настоящего изобретения белок Cas представляет собой белок системы CRISPR-Cas II типа, например белок Cas 9. В особенно предпочтительном варианте осуществления белок Cas представляет собой белок Cas9, например, SpCas9 или SaCas9. В аспектах настоящего изобретения белок Cas имеет одну или несколько мутаций по сравнению с SpCas9, выбранных из группы, состоящей из D10A, E762A, H840A, N854A, N863A и D986A; например, мутацию D10A. Аспекты настоящего изобретения относятся к снижению экспрессии продукта гена, или к дополнительному введению полинуклеотидной матрицы в молекулу ДНК, кодирующую продукт гена, или к точному вырезанию вставочной последовательности путем обеспечения повторной гибридизации и лигирования двух "липких" 5’-концов, или к изменению активности или функционирования продукта гена, или к повышению экспрессии продукта гена. В одном варианте осуществления настоящего изобретения продукт гена представляет собой белок. В предпочтительных вариантах осуществления настоящего изобретения векторы системы являются вирусными векторами. В дополнительном варианте осуществления векторы системы доставляют посредством липосом, наночастиц, экзосом, микровезикул или генной пушки; причем частицы являются предпочтительными. В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в HSC. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов или продукта(продуктов) их экспрессии, например, посредством частицы(частиц), в указанную HSC, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности. В некоторых вариантах осуществления указанные векторы доставляются в HSC, находящуюся в организме субъекта. В некоторых вариантах осуществления указанное модифицирование происходит в указанной HSC, находящей в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной HSC из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанных HSC и/или клеток, происходящих из них, указанному субъекту.

В одном аспекте настоящего изобретения предусмотрен способ получения HSC, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, является любым геном, ассоциированным с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов или продукта (продуктов) их экспрессии, например, посредством частицы(частиц) в HSC, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, с получением тем самым HSC, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность. В некоторых вариантах осуществления модифицированную HSC вводят животному с получением тем самым животной модели.

В одном аспекте настоящего изобретения предусмотрены способы модифицирования целевого полинуклеотида в HSC. Также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании целевого полинуклеотида в HSC. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модифицированием тем самым целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизирована с tracr-последовательностью. В других вариантах осуществления настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке, которая происходит из HSC. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью применения комплекса CRISPR, который связывается с полинуклеотидом в HSC; преимущественно комплекс CRISPR доставляется посредством частицы (частиц).

В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модифицирования экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа.

В некоторых вариантах осуществления РНК из системы CRISPR-Cas, например, направляющая или sgRNA, может быть модифицирована; к примеру, включать аптамер или функциональный домен. Аптамер представляет собой синтетический олигонуклеотид, который связывается со специфической целевой молекулой; к примеру, молекулой нуклеиновой кислоты, которая была сконструирована благодаря повторным раундам in vitro отбора или SELEX (систематическая эволюция лигандов с помощью экспоненциального обогащения) для связывания с различными молекулярными мишенями, такими как малые молекулы, белки, нуклеиновые кислоты и даже клетки, ткани и организмы. Аптамеры являются пригодными в том, что они обеспечивают свойства молекулярного распознавания, что делает их конкурентами антител. В дополнение к их способности дифференциального распознавания, аптамеры предоставляют преимущества в сравнении с антителами, включая то, что при применении в терапевтических целях они вызывают небольшую иммуногенность или не вызывают ее. В соответствии с этим, при осуществлении настоящего изобретения на практике, любое или оба из фермента или РНК могут включать функциональный домен.

В некоторых вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65. В некоторых вариантах осуществления функциональный домен предусматривает нуклеазную активность. В одном таком варианте осуществления функциональный домен предусматривает Fok1.

В настоящем изобретении также предусмотрена in vitro или ex vivo клетка, содержащая любое из модифицированных ферментов CRISPR, композиций, систем или комплексов, описанных выше, или из любого из способов, описанных выше. Клетка может быть эукариотической клеткой или прокариотической клеткой. В настоящем изобретении также предусмотрено потомство таких клеток. В настоящем изобретении также предусмотрен продукт любой такой клетки или любого такого потомства, где продукт представляет собой продукт указанного одного или нескольких целевых локусов, модифицированных с помощью модифицированного фермента CRISPR из комплекса CRISPR. Продукт может представлять собой пептид, полипептид или белок. Некоторые такие продукты могут быть модифицированы с помощью модифицированного фермента CRISPR из комплекса CRISPR. В случае некоторых таких модифицированных продуктов продукт целевого локуса физически отличается от продукта указанного целевого локуса, который не был модифицирован с помощью указанного модифицированного фермента CRISPR.

В настоящем изобретении также предусмотрена полинуклеотидная молекула, содержащая полинуклеотидную последовательность, кодирующую любой из не встречающихся в природе ферментов CRISPR, описанный выше.

Любой такой полинуклеотид может дополнительно содержать один или несколько регуляторных элементов, которые функционально связаны с полинуклеотидной последовательностью, кодирующей не встречающийся в природе фермент CRISPR.

В случае любого такого полинуклеотида, который содержит один или несколько регуляторных элементов, один или несколько регуляторных элементов могут быть функционально сконфигурированы с возможностью экспрессии не встречающегося в природе фермента CRISPR в эукариотической клетке. Эукариотическая клетка может представлять собой клетку человека. Эукариотическая клетка может представлять собой клетку грызуна, необязательно клетку мыши. Эукариотическая клетка может представлять собой клетку дрожжей. Эукариотическая клетка может представлять собой клетку яичника китайского хомячка (CHO). Эукариотическая клетка может представлять собой клетку насекомого.

В случае любого такого полинуклеотида, который содержит один или несколько регуляторных элементов, один или несколько регуляторных элементов могут быть функционально сконфигурированы с возможностью экспрессии не встречающегося в природе фермента CRISPR в прокариотической клетке.

В случае любого такого полинуклеотида, который содержит один или несколько регуляторных элементов, один или несколько регуляторных элементов могут быть функционально сконфигурированы с возможностью экспрессии не встречающегося в природе фермента CRISPR в in vitro системе.

В настоящем изобретении также предусмотрен вектор экспрессии, содержащий любую из описанных выше полинуклеотидных молекул. В настоящем изобретении также предусмотрена такая полинуклеотидная молекула (молекулы), к примеру, такие полинуклеотидные молекулы, функционально сконфигурированные для обеспечения экспрессии белка и/или компонента (компонентов) на основе нуклеиновой кислоты, а также такой вектор (векторы).

В настоящем изобретении дополнительно предусмотрен способ получения мутаций в Cas9 или мутированного или модифицированного Cas9, который является ортологом SaCas9 и/или SpCas9, включающий определение аминокислоты (аминокислот), которые в таком ортологе могут находиться в непосредственной близости или могут касаться молекулы нуклеиновой кислоты, например, ДНК, РНК, sgRNA и т.д., и/или аминокислоты (аминокислот), аналогичных или соответствующих идентифицированной в данном документе аминокислоте (аминокислотам) в SaCas9 и/или SpCas9, для осуществления модификации и/или мутации, и синтеза, или получения, или экспрессии ортолога, содержащего, состоящего из или состоящего, по сути, из модификации (модификаций) и/или мутации (мутаций), или осуществления мутирования, как обсуждается в данном документе, например, путем модифицирования, например, изменения или мутирования, нейтральной аминокислоты в заряженную, например положительно заряженную аминокислоту, например, из аланина, например, в лизин. Модифицированный таким образом ортолог можно применять в системах CRISPR-Cas; и молекулу (молекулы) нуклеиновой кислоты, экспрессирующую (экспрессирующие) его, можно применять в векторе или других системах доставки, которые доставляют молекулы или кодируют компоненты системы CRISPR-Cas, как обсуждается в данном документе.

В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в получении мутаций в Cas9 или мутированного или модифицированного Cas9, который является ортологом SaCas9 и/или SpCas9, включающий определение аминокислоты (аминокислот), которые в таком ортологе могут находиться в непосредственной близости или могут касаться молекулы нуклеиновой кислоты, например, ДНК, РНК, sgRNA, и/или аминокислоты (аминокислот), аналогичных или соответствующих идентифицированной в данном документе аминокислоте(аминокислотам) в SaCas9 и/или SpCas9, для осуществления модификации и/или мутации, и синтеза, или получения, или экспрессии ортолога, содержащего, состоящего из или состоящего, по сути, из модификации (модификаций) и/или мутации (мутаций), или осуществления мутирования, как обсуждается в данном документе, например, путем модифицирования, например, изменения или мутирования, нейтральной аминокислоты в заряженную, например, положительно заряженную аминокислоту, например, из аланина, например, в лизин.

В одном аспекте настоящего изобретения предусмотрены эффективная целевая активность и сведенная к минимуму нецелевая активность. В одном аспекте настоящего изобретения предусмотрено эффективное целевое расщепление с помощью белка CRISPR и сведенное к минимуму нецелевое расщепление под действием белка CRISPR. В одном аспекте настоящего изобретения предусмотрено направленно-специфичное связывание белка CRISPR в генном локусе без расщепления ДНК. В одном аспекте настоящего изобретения предусмотрены эффективное управляемое направляющей последовательностью целевое связывание белка CRISPR в генном локусе и сведенное к минимуму нецелевое связывание белка CRISPR. В соответствии с этим, в одном аспекте настоящего изобретения предусмотрена специфичная к мишени генная регуляция. В одном аспекте настоящего изобретения предусмотрено направленно-специфичное связывание фермента CRISPR в генном локусе без расщепления ДНК. В соответствии с этим, в одном аспекте настоящего изобретения предусмотрено расщепление в одном генном локусе и генная регуляция в другом генном локусе с применением одного фермента CRISPR. В одном аспекте настоящего изобретения предусмотрена ортогональная активация и/или ингибирование и/или расщепление нескольких мишеней с применением одного или нескольких белков и/или ферментов CRISPR.

В другом аспекте настоящего изобретения предусмотрен способ функционального скрининга генов в геноме в пуле клеток ex vivo или in vivo, включающий введение или экспрессию библиотеки, содержащей несколько направляющих РНК системы CRISPR-Cas (sgRNA), и где скрининг дополнительно предусматривает применение фермента CRISPR, где комплекс CRISPR является модифицированным, чтобы содержать гетерологичный функциональный домен. В одном аспекте настоящего изобретения предусмотрен способ скрининга генома, включающий введение хозяину библиотеки или ее экспрессию у хозяина in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий активатор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где активатор прикреплен к белку CRISPR. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где активатор прикреплен к N-концу или C-концу белка CRISPR. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где активатор прикреплен к петле sgRNA. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий репрессор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где скрининг предусматривает воздействие на активацию гена, ингибирование гена или расщепление в локусе, и выявление указанного.

В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где хозяином является эукариотическая клетка. В одном аспекте настоящего изобретения предусмотрен способ или применение, обсуждаемые в данном документе, где хозяином является клетка млекопитающего. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где хозяином является клетка эукариотического организма, отличного от человека. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где клеткой эукариотического организма, отличного от человека, является клетка млекопитающего, отличного от человека. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где клетка млекопитающего, отличного от человека, может представлять собой, включая без ограничения клетку представителя приматов, бычьих, овечьих, свиньих, псовых, грызунов, Leporidae, как, например, обезьяны, коровы, овцы, свиньи, собаки, кролика, крысы или мыши. В одном аспекте настоящего изобретения предусмотрен способ или применение, обсуждаемые в данном документе, причем клетка может представлять собой эукариотическую клетку от организма, отличного от млекопитающего, как, например, клетку домашней птицы (например, курицы), позвоночной рыбы (например, лосося) или моллюсков и ракообразных (например, устрицы, двустворчатых моллюсков, омара, креветки). В одном аспекте настоящего изобретения предусмотрен способ или применение, обсуждаемые в данном документе, причем клеткой эукариотического организма, отличного от человека, является растительная клетка. Растительная клетка может быть получена от однодольного или двудольного растения, или от сельскохозяйственного или зернового растения, такого как маниока, кукуруза, сорго, соя, пшеница, овес или рис. Растительная клетка также может быть получена от водоросли, дерева или продуктивного растения, фрукта или овоща (например, деревьев, таких как цитрусовые деревья, например, деревья апельсина, грейпфрута или лимона; деревья персика или нектарина; деревья яблони или груши; орехоплодные деревья, такие как деревья миндаля, или грецкого ореха, или фисташки; пасленовых растений; растений из рода Brassica; растений из рода Lactuca; растений из рода Spinacia; растений из рода Capsicum; хлопчатника, табака, спаржи, моркови, капусты кочанной, брокколи, цветной капусты, томата, баклажана, перца, салата, шпината, земляники, черники, малины, ежевики, винограда, кофе, какао и т.д.).

В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, включающий доставку комплексов CRISPR-Cas, или их компонента(компонентов), или молекулы(молекул) нуклеиновой кислоты, кодирующей их, где указанная молекула(молекулы) нуклеиновой кислоты функционально связаны с регуляторной последовательностью(последовательностями) и экспрессируются in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где экспрессия in vivo осуществляется с помощью лентивируса, аденовируса или AAV. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где доставка осуществляется с помощью частицы, наночастицы, липида или пептида, проникающих в клетку (CPP).

В одном аспекте настоящего изобретения предусмотрена пара комплексов CRISPR-Cas, при этом каждый из них содержит направляющую РНК (sgRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где по меньшей мере одна петля каждой sgRNA является модифицированной путем вставки отличающейся последовательности (последовательностей) РНК, которая связывается с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами, где каждая sgRNA из каждого CRISPR-Cas содержит функциональный домен, характеризующийся активностью расщепления ДНК. В одном аспекте настоящего изобретения предусмотрены парные комплексы CRISPR-Cas, обсуждаемые в данном документе, где активность расщепления ДНК обусловлена нуклеазой Fok1.

В одном аспекте настоящего изобретения предусмотрен способ разрезания целевой последовательности в представляющем интерес локусе генома, включающий доставку в клетку комплексов CRISPR-Cas, или их компонента (компонентов), или молекулы (молекул) нуклеиновой кислоты, кодирующей их, где указанная молекула (молекулы) нуклеиновой кислоты функционально связаны с регуляторной последовательностью(последовательностями) и экспрессируются in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где доставка осуществляется с помощью лентивируса, аденовируса или AAV. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, или парные комплексы CRISPR-Cas, обсуждаемые в данном документе, где целевая последовательность для первого комплекса из пары находится на первой нити двухнитевой ДНК, а целевая последовательность для второго комплекса из пары находится на второй нити двухнитевой ДНК. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, или парные комплексы CRISPR-Cas, обсуждаемые в данном документе, где целевые последовательности первого и второго комплексов расположены близко друг от друга, так что ДНК разрезается таким способом, который облегчает гомологичную репарацию. В одном аспекте способ, изложенный в данном документе, может дополнительно включать введение в клетку ДНК-матрицы. В одном аспекте способа, изложенного в данном документе, могут подразумеваться парные комплексы CRISPR-Cas, изложенные в данном документе, где каждый комплекс CRISPR-Cas имеет фермент CRISPR, который является мутированным, так что он характеризуется не более, чем приблизительно 5% нуклеазной активности фермента CRISPR, который не является мутированным.

В одном аспекте настоящего изобретения предусмотрена библиотека, способ или комплекс, обсуждаемые в данном документе, где sgRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю, например, где по меньшей мере одна некодирующая функциональная петля является репрессорной; к примеру, где по меньшей мере одна некодирующая функциональная петля содержит Alu.

В одном аспекте настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии продукта гена. Указанный способ может включать введение в клетку, содержащую и экспрессирующую молекулу ДНК, кодирующую продукт гена, сконструированной, не встречающейся в природе системы CRISPR-Cas, содержащей белок Cas и направляющую РНК, которая нацеливается на молекулу ДНК, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена является измененной; и где белок Cas и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, слитую с tracr-последовательностью. Настоящее изобретение дополнительно охватывает белок Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток, определяемые в данном документе, для применения в изменении экспрессии представляющего интерес локуса генома в клетке млекопитающего. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток для получения лекарственного препарата для изменения экспрессии представляющего интерес локуса генома в клетке млекопитающего. Указанное изменение предпочтительно предусматривает приведение клетки в контакт со сконструированным белком CRISPR, комплексом, композицией, системой, вектором, клеткой или линией клеток по настоящему изобретению, за счет чего осуществляется доставка вектора и обеспечивается образование комплекса CRISPR-Cas и его связывания с мишенью. Указанное изменение также предпочтительно предусматривает определение того, была ли экспрессия локуса генома изменена.

В одном аспекте настоящего изобретения предусмотрены измененные клетки и потомство таких клеток, а также продукты, производимые клетками. Белки и системы CRISPR-Cas9 по настоящему изобретению применяют для получения клеток, содержащих модифицированный целевой локус. В некоторых вариантах осуществления способ может включать обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с целевой ДНК или РНК для осуществления расщепления указанной целевой ДНК или РНК, с модифицированием тем самым целевой ДНК или РНК, где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК, гибридизированной с целевой последовательностью в пределах указанной целевой ДНК или РНК. В одном аспекте настоящего изобретения предусмотрен способ репарации локуса гена в клетке. В другом аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии ДНК или РНК в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с ДНК или РНК, так что указанное связывание приводит к повышенной или сниженной экспрессии указанной ДНК или РНК; где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК. Аналогичные соображения и условия распространяются на способы модифицирования целевой ДНК или РНК, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения. В одном аспекте настоящего изобретения предусмотрены способы модифицирования целевой ДНК или РНК в эукариотической клетке, которые могут осуществляться in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Такие клетки могут представлять собой без ограничения растительные клетки, клетки животного, конкретные типы клеток любого организма, в том числе стволовые клетки, иммунные клетки, T-клетку, B-клетки, дендритные клетки, клетки сердечно-сосудистой системы, эпителиальные клетки, стволовые клетки и т.п. Клетки могут быть модифицированными в соответствии с настоящим изобретением для получения продуктов гена, например, в контролируемых количествах, которые могут быть повышенными или сниженными, в зависимости от применения, и/или мутированными. В определенных вариантах осуществления локус гена в клетке является репарированным. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, может быть предпочтительным, чтобы эти клетки являлись стволовыми клетками.

В одном аспекте настоящего изобретения предусмотрены клетки, которые временно содержат системы CRISPR или их компоненты. Например, белки или ферменты CRISPR, а также нуклеиновые кислоты, временно обеспечиваются в клетке, и локус гена изменяется, после чего происходит снижение количества одного или нескольких компонентов системы CRISPR. Впоследствии клетки, потомство клеток и организмы, которые содержат клетки, которые приобрели генетическое изменение, опосредованное CRISPR, содержат сниженные количества одного или нескольких компонентов системы CRISPR, или более не содержат один или несколько компонентов системы CRISPR. Одним неограничивающим примером является самоинактивирующаяся система CRISPR-Cas, такая как дополнительно описанная в данном документе. Таким образом, в настоящем изобретении предусмотрены клетки, и организмы, и потомство клеток и организмов, которые содержат один или несколько генетических локусов, измененных под действием системы CRISPR-Cas, но, по сути, не содержащие один или несколько компонентов системы CRISPR. В определенных вариантах осуществления компоненты системы CRISPR фактически отсутствуют. Такие клетки, ткани и организмы преимущественно содержат требуемое или выбранное генетическое изменение, но утратили компоненты CRISPR-Cas или их остатки, которые потенциально могли бы действовать неспецифически, что привело бы к вопросам, касающимся безопасности, или затрудняло бы разрешение регуляторного органа. Помимо прочего, в настоящем изобретении предусмотрены продукты, производимые клетками, организмами и потомство клеток и организмов.

В настоящем изобретении также предусмотрен способ улучшения специфичности системы CRISPR путем обеспечения сконструированного белка CRISPR в соответствии с настоящим изобретением. Предпочтительно предусмотрен сконструированный белок CRISPR, где

белок объединяется в комплекс с молекулой нуклеиновой кислоты, предусматривающей РНК, с образованием комплекса CRISPR,

где, находясь в комплексе CRISPR, молекула нуклеиновой кислоты нацеливается на один или несколько целевых полинуклеотидных локусов,

причем белок содержит по меньшей мере одну модификацию по сравнению с немодифицированным белком,

где комплекс CRISPR, содержащий модифицированный белок, характеризуется измененной активностью по сравнению с комплексом, содержащим немодифицированный белок. Указанная по меньшей мере одна модификация предпочтительно находится в доменах RuvC и/или HNH, как описано в данном документе, или в связывающей бороздке между доменами HNH и RuvC. Предпочтительные модификации представляют собой мутации, описанные в данном документе.

В настоящем изобретении дополнительно предусмотрено применение сконструированного белка CRISPR в соответствии с настоящим изобретением для улучшения специфичности системы CRISPR. Предпочтительно предусмотрен сконструированный белок CRISPR,

где белок объединяется в комплекс с молекулой нуклеиновой кислоты, предусматривающей РНК, с образованием комплекса CRISPR,

где, находясь в комплексе CRISPR, молекула нуклеиновой кислоты нацеливается на один или несколько целевых полинуклеотидных локусов,

где белок является модифицированным, чтобы содержать по меньшей мере одну модификацию по сравнению с немодифицированным белком,

где комплекс CRISPR, содержащий модифицированный белок, характеризуется измененной активностью по сравнению с комплексом, содержащим немодифицированный белок. Указанная по меньшей мере одна модификация предпочтительно находится в доменах RuvC и/или HNH, как описано в данном документе, или в связывающей бороздке между доменами HNH и RuvC. Предпочтительные модификации представляют собой мутации, описанные в данном документе.

Краткое описание графических материалов

Новые признаки настоящего изобретения изложены с характерными особенностями в прилагаемой формуле изобретения. Лучшее понимание признаков и преимуществ настоящего изобретения будет получено при ссылке на следующее подробное описание, в котором изложены иллюстративные варианты осуществления, в которых используются принципы настоящего изобретения, и на сопутствующие графические материалы.

На фигуре 1A-1B представлена краткая схема, при этом понятно, что заявитель(заявители)/изобретатель(изобретатели) не обязательно вдаются в какую-либо конкретную теорию, изложенную в данном документе или на какой-либо конкретной фигуре, включая фигуру 1. На фигуре рассмотрена мутация положительно заряженных остатков, влияющая на связывание с не подвергаемой нацеливанию нитью gDNA, в результате чего специфичность улучшается. Данные в таблице на краткой схеме являются следующими, и касаются мутаций SpCas9:

В соответствии с нумерацией SpCas9 на фигуре 1A проиллюстрированы аланиновые мутации, которые улучшают специфичность, расположенные вдоль бороздки для не подвергаемой нацеливанию нити, например, Arg780, Lys810, Lys855, Lys848, Lys1003, Arg1060, Arg976, His982. Не вдаваясь в какую-либо конкретную теорию, предложенный механизм состоит в том, что нуклеазная активность является инактивированной до тех пор, пока не подвергаемая нацеливанию нить ДНК не запускает стерически изменение конформации HNH; при этом связывание не подвергаемой нацеливанию нити с бороздкой между HNH и RuvC зависит от образования пар РНК:ДНК; причем мутировавшие остатки для связывания ДНК в бороздке требуют больше энергии для правильного образования пар РНК:ДНК (фигура 1B). Применяя информацию из данного документа, включая информацию на фигуре 1, специалист может легко получить мутантов других Cas9 (например, отличных от SpCas9), которые проявляют усиленные или сниженные нецелевые эффекты. К примеру, в документах, процитированных в данном документе, представлена информация о многочисленных ортологах SpCas9 и SaCas9, которые приведены в данном документе в качестве примера. Исходя из такой информации, включая информацию о последовательности таких других Cas9, специалист в данной области, на основании информации из настоящего изобретения, легко сможет получить аналогичных мутантов со сниженными нецелевыми эффектами у ортологов Cas9, в дополнение к SpCas9 и SaCas9, которые приведены в данном документе в качестве примера. Кроме того, в документах, упомянутых в данном документе, предоставлена информация о кристаллической структуре Cas9, например SpCas9; и можно легко провести структурные сравнения между кристаллическими структурами, например, между кристаллической структурой SpCas9 и кристаллической структурой его ортолога, чтобы также легко, без неоправданных экспериментов, получить аналогичных мутантов, характеризующихся сниженными нецелевыми эффектами, у ортологов Cas9 в дополнение к SpCas9. В соответствии с этим настоящее изобретение широко применимо в отношении модификации (модификациям) или мутации(мутациям), направленных на снижение нецелевых эффектов у различных ортологов Cas9, включая без ограничения SpCas9 и SaCas9. Как дополнительно обсуждается в данном документе, можно легко обеспечить дополнительную или дальнейшую модификацию описанных выше ферментов Cas9, в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.

На фигуре 2A показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 49 точечных мутантов SpCas9. Целевая последовательность EMX1.3 представляет собой последовательность гена EMX1, а активность сравнивают с активностью в отношении родственной нецелевой последовательности (OT 46).

На фигуре 2B показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 49 точечных мутантов SpCas9. Целевая последовательность представляет собой последовательность гена VEGFA, а активность сравнивают с активностью в отношении двух родственных нецелевых последовательностей (OT 1 и OT 2).

На фигуре 2C показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Целевая последовательность представляет собой последовательность гена VEGFA, а активность сравнивают с активностью в отношении трех родственных нецелевых последовательностей (OT 1, OT 4 и OT 18).

На фигуре 3 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены точечные мутанты, демонстрирующие специфичность в отношении нецелевых последовательностей. Целевые последовательности представляют собой последовательности из генов EMX1 и VEGFA, а активность сравнивают с активностью в отношении девяти родственных нецелевых последовательностей.

На фигуре 4A показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены двойные мутанты SpCas9. Целевая последовательность представляет собой последовательность гена EMX1, а активность сравнивают с активностью в отношении двух родственных нецелевых последовательностей.

На фигуре 4B показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены двойные мутанты SpCas9. Целевая последовательность представляет собой последовательность генов VEGFA, а активность сравнивают с активностью в отношении трех родственных нецелевых последовательностей.

На фигуре 5 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 14 тройных мутантов SpCas9. Целевые последовательности представляют собой последовательности из генов EMX1 и VEGFA, а активность сравнивают с активностью в отношении четырех родственных нецелевых последовательностей (OT 46, OT 1, OT 4 и OT 18).

На фигуре 6 показана активность модифицированных ферментов SaCas9, измеряемая по % образования вставок/делеций. Целевая последовательность EMX101 представляет собой последовательность гена EMX1, а активность сравнивают с активностью в отношении трех родственных нецелевых последовательностей (OT1, OT2 и OT3).

На фигуре 7 показана активность модифицированных ферментов SaCas9, измеряемая по % образования вставок/делеций. Целевая последовательность EMX101 представляет собой последовательность из EMX1, а активность сравнивают с активностью в отношении родственной нецелевой последовательности (OT3).

На фигуре 8A-8D показано филогенетическое дерево генов Cas; на основании сведений из данного документа и знаний из уровня техники мутацию(мутации) или модификацию(модификации) SpCas9 и SaCas9, приведенных в качестве примера, можно применять в отношении других Cas9.

На фигуре 9A-9F показан филогенетический анализ, который позволил выявить пять семейств Cas9, включая три группы крупных Cas9 (~1400 аминокислот) и две группы малых Cas9 (~1100 аминокислот); на основании сведений из данного документа и знаний из уровня техники мутацию (мутации) или модификацию (модификации) SpCas9 и SaCas9, приведенных в качестве примера, можно применять в отношении других Cas9 (и, таким образом, настоящее изобретение охватывает модификацию (модификации) или мутацию (мутации), которые в данном документе приведены в качестве примера в отношении SpCas9 и SaCas9, в отношении всех Cas9 и семейств и групп Cas9, изображенных на фигуре 9).

На фигуре 10A-10D показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. На фигуре 10A-C показана активность в отношении целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. На фигуре 10D показана активность в отношении VEGFA3 в сравнении с активностью в отношении нецелевой последовательности OT4.

На фигуре 11A-11D показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. На фигуре 11A-C показана активность в отношении целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. На фигуре 11D показана активность в отношении VEGFA3 в сравнении с активностью в отношении нецелевой последовательности OT4.

На фигуре 12 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Целевая последовательность представляет собой VEGFA3, а активность сравнивают с активностью в отношении четырех родственных нецелевых последовательностей (OT1, OT2, OT4 и OT18).

На фигуре 13 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Целевая последовательность представляет собой VEGFA3, а активность сравнивают с активностью в отношении четырех родственных нецелевых последовательностей (OT1, OT2, OT4 и OT18).

На фигуре 14 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 14 точечных мутантов SpCas9. Целевая последовательность представляет собой EMX1.3, а активность сравнивают с активностью в отношении пяти родственных нецелевых последовательностей (OT14, OT23, OE35, OT46 и OT53).

На фигуре 15A-15F показаны аспекты структуры SpCas9 и улучшенная специфичность. Панель A представляет собой модель раскручивания целевой последовательности. nt-Бороздка между доменами RuvC (бирюзовый) и HNH (пурпурный) стабилизирует раскручивание ДНК благодаря неспецифичным взаимодействиям с некомплементарной нитью ДНК. Взаимодействия РНК:cDNA и Cas9:ncDNA управляют раскручиванием ДНК (верхняя стрелка), конкурирующим с регибридизацией cDNA:ncDNA (нижняя стрелка). Панель B: структура SpCas9 (PDB ID 4UN3), на которой показана nt-бороздка, расположенная между доменами HNH (пурпурный) и RuvC (бирюзовый). Не подвергаемая нацеливанию нить ДНК (красный) была смоделирована внутри nt-бороздки (врезка) в ручном режиме. Панель C: скрининг точечных мутантов с аланиновыми мутациями в отношении улучшения специфичности. Панель D: оценка лучших точечных мутантов в отношении дополнительных нецелевых локусов. Пять лучших мутантов, обеспечивающих специфичность, выделены красным цветом. Панель E: у комбинационных мутантов улучшена специфичность по сравнению с мутантами с одиночными точечными мутациями. eSpCas9(1.0) и eSpCas9(1.1) выделены красным цветом. Панель F: скрининг лучших точечных мутантов и комбинационных мутантов для 10 целевых локусов в отношении эффективности целевого расщепления. SpCas9(K855A), eSpCas9(1.0) и eSpCas9(1.1) выделены красным цветом.

На фигуре 16A-16C показано сохранение целевой эффективности у мутантов spCas9. На панели A показана оценка эффективности целевого разрезания у мутантов SpCas9 по сравнению с SpCas9 в случае с 24 sgRNA, нацеленных на 9 локусов генома. Панель B представляет собой диаграмму Тьюки с нормализованными значениями образования целевых вставок/делеций для мутантов SpCas9(K855A), eSpCas9(1.0) и eSpCas9(1.1). Панель C представляет собой результаты вестерн-блоттинга SpCas9 и мутантов с применением антитела к SpCas9.

На фигуре 17A-17C показана чувствительность spCas9 и мутантов K855A, eSpCas9(1.0) и eSpCas9(1.1) к одиночным и двойным несовпадениям оснований между направляющей РНК и целевой ДНК. На панели A изображены направляющие последовательности с несовпадениями в сравнении с мишенью VEGFA. На панели B представлены тепловые карты для spCas9 и трех мутантов, показывающие % вставок /делеций в случае направляющих последовательностей с несовпадением одиночного основания. На панели C показано образование вставок/делеций в случае направляющих последовательностей, содержащих последовательные пересекающиеся несовпадения. По сравнению с ферментом дикого типа: eSpCas9(1.0) содержит K810A, K1003A, R1060A; eSpCas9(1.1) содержит K848A, K1003A, R1060A.

На фигуре 18A-18F показаны несмещенные полногеномные профили нецелевой активности мутантов SpCas9(K855A) и eSpCas9(1.1). Панель A представляет собой схематический обзор технологии BLESS (прямое in situ мечение разрывов, обогащение на стрептавидине и секвенирование нового поколения). На панели B показано типичное секвенирование BLESS для прямых (красные) и обратных (синие) ридов, картированных в геноме. Картирование ридов в сайтах разреза Cas9 отличается по форме от горячих точек DSB. На панелях C и D показаны Манхэттенские графики полногеномных кластеров DSB, полученные при воздействии каждого мутанта SpCas9 с применением направляющих, нацеливающихся на EMX1(1) (панель C) и VEGFA(1) (панель D). На панели E и F изображена валидация с помощью нацеленного глубокого секвенирования нецелевых сайтов, идентифицированных в BLESS. Нецелевые сайты распределяли по баллу DSB (синяя тепловая карта). Зеленые тепловые карты указывают на сходство последовательности у целевой и нецелевой последовательностей.

На фигуре 19 показана схема sgRNA-направленного нацеливания и раскручивания ДНК. Cas9 расщепляет целевую ДНК с помощью целого ряда координированных стадий. Вначале PAM-взаимодействующий домен распознает последовательность NGG на 5'-конце целевой ДНК. После связывания PAM первые 10-12 нуклеотидов целевой последовательности (затравочная последовательность) проверяется на комплементарность sgRNA:ДНК, причем данный процесс обусловлен разделением ДНК-дуплекса. Если нуклеотиды затравочной последовательности комплементарны sgRNA, остальная ДНК раскручивается, и sgRNA по всей длине гибридизируется с целевой нитью ДНК. Согласно данной модели nt-бороздка между доменами RuvC (бирюзовый) и HNH (пурпурный) стабилизирует не подвергаемую нацеливанию нить ДНК и облегчает раскручивание благодаря неспецифическим взаимодействиям с положительными зарядами фосфатного остова ДНК. Взаимодействия РНК:cDNA и Cas9:ncDNA управляют раскручиванием ДНК (верхняя стрелка), конкурирующим с регибридизацией cDNA:ncDNA (нижняя стрелка).

На фигуре 20 изображены электростатические свойства SpCas9, выявляющие бороздку для не подвергаемой нацеливанию нити. (A) Кристаллическая структура (4UN3) SpCas9, образующего пару с sgRNA и целевой ДНК, окрашена в соответствии с электростатическим потенциалом, чтобы выделить положительно заряженные участки. На шкале представлен диапазон от -10 до 1 кэВ. (B) Структура, идентичная таковой на панели (A), за исключением того, что домен HNH удален для выявления гетеродуплекса sgRNA:ДНК. (C) Кристаллическая структура (в той же ориентации, что и (A)), окрашенная в соответствии с доменом: HNH (пурпурный), RuvC (бирюзовый) и PAM-взаимодействующий (PI) (бежевый).

На фигурах 21A-21D показан анализ нецелевого связывания полученных мутантов. Получили двадцать девять SpCas9 точечных мутантов и тестировали их в отношении специфичности для (A) целевого сайта EMX1 и (B) двух целевых сайтов VEGFA. Мутантов, в которых скомбинированы лучшие остатки, которые улучшают специфичность, дополнительно тестировали на (C) EMX1 и (D) VEGFA.

На фигуре 22A-22C представлена аннотированная аминокислотная последовательность SpCas9. Мутации SpCas9, которые изменяют заряды в бороздке для не подвергаемой нацеливанию нити, располагались преимущественно в доменах RuvC и HNH (выделены желтым). Домены RuvC (голубой), мостиковая спираль (BH, зеленый), REC (серый), HNH (пурпурный) и PI (бежевый) аннотированы как в Nishmasu et al.

На фигуре 23 показано сравнение специфичности K855A, eSpCas9(1.0) и eSpCas9(1.1) при применении усеченных sgRNA и отмечено, что SpCas9(1.0) и eSpCas9(1.1) преодолевают влияние усеченных sgRNA в качестве стратегии для улучшения специфичности. Частоту вставок/делеций в трех локусах (EMX1(1), VEGFA(1) и VEGFA(5)) тестировали для главных аннотированных и прогнозируемых нецелевых сайтов. В случае обоих целевых сайтов VEGFA усеченные sgRNA повышали частоту вставок/делеций в некоторых нецелевых сайтах и приводили к образованию вставок/делеций в нецелевых последовательностях, не наблюдаемых при применении последовательностей дикого типа. Количество нецелевых сайтов, обнаруживаемых с помощью NGS, для каждого мутанта SpCas9 приведено ниже тепловой карты.

На фигуре 24 показано, что повышение положительного заряда в nt-бороздке может приводить к повышенному расщеплению в нецелевых сайтах. Точечные мутанты SpCas9(S845K) и SpCas9(L847R) проявляли меньшую специфичность, чем SpCas9 дикого типа в целевом сайте EMX1(1).

На фигурах 25A-25D изображено получение eSaCas9 посредством мутагенеза nt-бороздки. Версию SaCas9 с улучшенной специфичностью получали аналогично eSpCas9. (A,B) Мутантов по одиночным и двойным аминокислотным остаткам в бороздке между доменами RuvC и HNH подвергали скринингу в отношении сниженного нецелевого разрезания. (C) Мутантов с улучшенной специфичностью комбинировали с получением варианта SaCas9, который сохранял целевое разрезание сайта 7 EMX и характеризовался значительно сниженным нецелевым разрезанием. (D) Кристаллическая структура SaCas9, показывающая бороздку между доменами HNH и RuvC.

На фигуре 26 показано определение характеристик целевой эффективности для определенных мутантов с улучшенной специфичностью. Три мутанта SpCas9 имели мутации в петле захвата фосфата (Lys1107, Glu1108, Ser1109) в домене PI, которые придавали специфичность к основаниям 1 и 2 sgRNA, проксимальным относительно PAM. Они включали точечный мутант (K1107A) и два мутанта, у которых последовательность Lys-Glu-Ser была замещена дипептидами Lys-Gly (KG) и Gly-Gly (GG) соответственно. Данные, полученные авторами настоящего изобретения, указывают на то, что эти мутанты могут значительно снижать эффективность целевого расщепления.

На фигуре 27 показано, что eSpCas9(1.1) не является цитотоксичным для клеток человека. Клетки HEK293T трансфицировали с помощью фермента WT или eSpCas9(1.1) и инкубировали в течение 72 часов перед измерением жизнеспособности клеток с применением анализа CellTiter-Glo, при котором флуоресценция обнаруживается вследствие образования ATP в живых клетках.

На фигуре 28 показан анализ мутантов по Nt-бороздке с применением усеченных направляющих РНК. Усеченные направляющие РНК (Tru) комбинировали с мутантами SpCas9 по одиночной аминокислоте и нацеливали на (A) EMX1(1) или (B) VEGFA(1). В то время как большинство мутантов, нацеленных на EMX1 с применением направляющей длиной 18 нуклеотидов, сохраняли целевую эффективность, мутанты, нацеленные на VEGFA(1) с применением направляющей длиной 17 нуклеотидов, были существенно ослаблены.

На фигурах 29A-29B показаны выбранные мутанты по одиночным и двойным аминокислотным остаткам. Как и в случае SpCas9, уменьшение числа положительных зарядов в бороздке для не подвергаемой нацеливанию нити усиливает специфичность. Уменьшения числа положительных зарядов можно достичь путем замены положительно заряженных аминокислот на нейтральные или отрицательно заряженные аминокислоты (A) или путем смещения положения положительно заряженной аминокислоты внутри бороздки (B). Представляющим интерес мутантом является K572.

На фигуре 30 показана улучшенная специфичность выбранных мутантов. CM2 проявляет сильное снижение нецелевой активности при полном сохранении целевой активности. CM1: R499A; Q500K; K572A. CM2: R499A; Q500K; R654A; G655R. CM3: K572A; R654A; G655R.

На фигуре 31 показана активация локуса гамма-глобина HBG1 с помощью комплексов spCas9 или мутантов spCas9 с направляющими длиной 15 п. о., 17 п. о. и 20 п. о. Cas9 (px165) представляет собой не подвергнутый мутированию spCas9. dCas9 обозначает неактивный spCas9. Изображенные одиночные мутанты ("SM") представляют собой R780A, K810A и K848A. Изображенные двойные мутанты ("SM") представляют собой R780A/K810A и R780A/K855A.

На фигуре 32 показано сравнение различных программируемых нуклеазных платформ.

На фигуре 33 показаны типы терапевтических модификаций генома. Конкретный тип терапии с применением редактирования генома зависит от природы мутации, вызывающей заболевание. a. В случае нарушения функционирования гена патогенную функцию белка подвергают сайленсингу путем нацеливания на локус с осуществлением NHEJ. Образование вставок/делеций в представляющем интерес гене часто приводит к мутациям по типу сдвига рамки считывания, которые обусловливают преждевременные стоп-кодоны и нефункциональный белковый продукт или нонсенс-опосредованный распад транскриптов, что приводит к супрессии функции гена. b. Коррекцию гена, опосредованную HDR, можно применять, чтобы скорректировать вредную мутацию. Образование DSB запланировано вблизи сайта мутации в присутствии обеспечиваемой экзогенно корректирующей матрицы для HDR. HDR-репарация сайта разрыва с помощью экзогенной матрицы корректирует мутацию, восстанавливая функцию гена. c. Альтернативой для коррекции гена является добавление гена. При этом методе лечения в безопасный локус генома вводят терапевтический трансген. Образование DSB запланировано в безопасном локусе, а матрицу для HDR, характеризующуюся гомологией с сайтом разрыва, промотор и трансген вводят в ядро. При HDR-репарации происходит копирование кассеты с промотором-трансгеном в безопасный локус, при этом функция гена восстанавливается, хотя и без истинного физиологического контроля над экспрессией гена.

На фигуре 34 показана терапия с применением редактирования ex vivo и in vivo. В случае терапии с применением редактирования ex vivo проводят отбор клеток у человека, редактируют их и затем повторно пересаживают (верхняя панель). Чтобы данный метод терапии был успешным, целевые клетки должны обладать способностью выживать вне организма и попадать обратно в целевые ткани после трансплантации. Терапия in vivo предусматривает редактирование генома клеток in situ (нижние панели). В случае системной терапии in vivo средства доставки, которые являются относительно нейтральными относительно вида или состояния клеток, будут применяться для осуществления редактирования в широком диапазоне типов тканей. Хотя этот метод терапии с редактированием может стать осуществимым в будущем, в настоящее время не существует систем доставки, которые являются достаточно эффективными, чтобы сделать его практически осуществимым. Нацеленная терапия in vivo, при которой пациентам вводят средства доставки, обладающие тропизмом к конкретным системам органов, является практически осуществимой с применением клинически значимых вирусных векторов.

На фигурах 35A-35B показано схематическое изображение генной терапии с помощью векторов для гомологичной рекомбинации (HR) с применением Cas9.

На фигуре 36 представлена схема прикрепления сахаров для направленной доставки белка или направляющей, в частности с помощью GalNac.

На фигурах 37A, 37B и 37C совместно проиллюстрировано выравнивание последовательностей SaCas9 и SpCas9. Аннотации доменов RUVC и HNH этих двух белков также показаны на данных трех фигурах.

Фигуры приведены в данном документе только с целью иллюстрации, и они необязательно изображены в масштабе.

Подробное описание изобретения

Перед тем как описать способы по настоящему изобретению, следует отметить, что настоящее изобретение не ограничивается конкретными описанными способами, компонентами, продуктами или комбинациями, поскольку такие способы, компоненты, продукты и комбинации, без сомнения, могут варьироваться. Также следует отметить, что терминология, применяемая в данном документе, не подразумевается как ограничивающая, поскольку объем настоящего изобретения будет ограничиваться только прилагаемой формулой изобретения.

Используемые в данном документе формы единственного числа включают ссылки на объекты как в единственном, так и множественном числе, если из контекста явно не следует иное.

Используемые в данном документе термины "содержащий", "содержит" и "содержащийся" являются синонимами "включающий", "включает" или "охватывающие", "охватывает", и являются включительными или неограничивающими и не исключают дополнительные, неупомянутые части, элементы или стадии способов. Следует понимать, что используемые в данном документе термины "содержащий", "содержит" и "содержащийся" предусматривают термины "состоящий из", "состоит" и "состоит из", а также термины "состоящий, по сути, из", "состоит по сути" и "состоит, по сути, из". Следует отметить, что в настоящем изобретении и, в частности, в формуле изобретения и/или параграфах такие термины, как "содержит", "содержащийся", "содержащий" и т.п., могут иметь значение, приписываемое им в патентном законодательстве США, например, они могут означать "включает", "включенный", "включающий" и т.п., и что такие термины, как "состоящий, по сути, из" и "состоит, по сути, из" имеют значение, приписываемое им в патентном законодательстве США, например, они допускают не указанные в явной форме элементы, но исключают элементы, которые встречаются в известном уровне техники или которые влияют на основные или новые характеристики настоящего изобретения. При осуществлении настоящего изобретения на практике предпочтительным является соответствие статье 53(c) EPC и правилу 28(b), а также (c) EPC. Ничто из содержащегося в данном документе не предполагается как обязательство.

Описание диапазона числовых значение с помощью крайних точек подразумевает все числа и дробные числа, относящиеся к соответствующим диапазонам, а также указанные крайние точки.

Подразумевается, что используемый в данном документе термин "приблизительно" или "примерно" при ссылке на измеряемую величину, такую как параметр, количество, промежуток времени и т.п., охватывает изменения, составляющие +/-20% или меньше, предпочтительно +/-10% или меньше, более предпочтительно +/-5% или меньше, и еще более предпочтительно +/-1% или меньше, от указанного значения, в той степени, в которой такие изменения подходят для осуществления в раскрытом изобретении. Следует понимать, что значение, к которому относится модификатор "приблизительно" или "примерно", также раскрыто специально, и предпочтительно, само по себе.

Несмотря на то, что термины "один или несколько" или "по меньшей мере один", как, например, один или несколько или по меньшей мере один элемент(элементы) из группы элементов, понятны сами по себе в виде дальнейших примеров, данный термин охватывает, помимо прочего, ссылку на любой из указанных элементов, или на любые два или более указанных элементов, таких как, например, любые ≥3, ≥4, ≥5, ≥6 или ≥7 и т.д. указанных элементов и вплоть до всех указанных элементов.

Все ссылки, процитированные в настоящем описании, тем самым включены посредством ссылки во всей своей полноте. В частности, специально указано, что идеи из всех литературных источников в данном документе, включены посредством ссылки.

Если не определено иное, все термины, применяемые в раскрытии настоящего изобретения, включая технические и научные термины, имеют значение, которое обычно понятно среднему специалисту в области, к которой принадлежит настоящее изобретение. С помощью дополнительного руководства включены определения терминов для лучшего понимания идеи настоящего изобретения.

В следующих частях различные аспекты настоящего изобретения определены более подробно. Каждый аспект, определенный таким образом, может быть скомбинирован с любым другим аспектом или аспектами, если явно не указано обратное. В частности, любой признак, обозначенный как являющийся предпочтительным или преимущественным, может быть скомбинирован с любым другим признаком или признаками, обозначенными как являющиеся предпочтительными или преимущественными.

Стандартные справочные издания, излагающие общие принципы технологии рекомбинантной ДНК, включают Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989; Current Protocols in Molecular Biology, ed. Ausubel et al., Greene Publishing and Wiley-Interscience, New York, 1992 (с периодическими поправками) ("Ausubel et al. 1992"); серию Methods in Enzymology (Academic Press, Inc.); Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, 1990; PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995); Harlow and Lane, eds. (1988) Antibodies, a Laboratory Manual; and Animal Cell Culture (R.I. Freshney, ed. (1987). Общие принципы микробиологии изложены, например, в Davis, B. D. et al., Microbiology, 3rd edition, Harper & Row, publishers, Philadelphia, Pa. (1980).

Ссылка на протяжении всего настоящего описания на "один вариант осуществления" или "вариант осуществления" означает, что конкретный признак, структура или характеристика, описанные в связи с вариантом осуществления, включены по меньшей мере в один вариант осуществления настоящего изобретения. Таким образом, при появлении фраз "в одном варианте осуществления" или "в варианте осуществления" в различных местах на протяжении настоящего описания, не обязательно все они ссылаются на один и тот же вариант осуществления, но могут и ссылаться. Более того, конкретные признаки, структуры или характеристики могут быть скомбинированы любым подходящим способом, как будет очевидно для специалиста в данной области на основании настоящего изобретения, в одном или нескольких вариантах осуществления. Более того, хотя некоторые варианты осуществления, описанные в данном документе, включают некоторые, но не другие признаки, включенные в другие варианты осуществления, подразумевается, что комбинации признаков из различных вариантов осуществления находятся в пределах объема настоящего изобретения и образуют различные варианты осуществления, как будет понятно специалистам в данной области. Например, в прилагаемой формуле изобретения любой из заявленных вариантов осуществления может применяться в любой комбинации.

В данном описании настоящего изобретения сделана ссылка на сопровождающие фигуры, которые образуют его часть и в которых показаны для иллюстрации только конкретные варианты осуществления, с помощью которых настоящее изобретение может быть осуществлено на практике. Следует понимать, что могут использоваться другие варианты осуществления и структурные или логические изменения могут осуществляться без отступления от объема настоящего изобретения. Описание, следовательно, не следует понимать в ограничивающем смысле, и объем настоящего изобретения определяется прилагаемой формулой изобретения.

Целью настоящего изобретения не является охват в пределах настоящего изобретения любого ранее известного продукта, способа получения продукта или способа применения продукта, так что заявители оставляют за собой право и настоящим объявляют отказ от прав на любой ранее известный продукт, процесс или способ. Следует дополнительно отметить, что настоящее изобретение не предназначено охватывать в пределах объема настоящего изобретения любой продукт, способ получения продукта или способ применения продукта, который не соответствует письменному описанию и требованиям достаточного раскрытия сути изобретения USPTO (первый пункт § 112 статьи 35 USC) или EPO (статья 83 EPC), так что заявители оставляют за собой право и настоящим объявляют отказ от прав на любой ранее описанный продукт, способ получения продукта или способ применения продукта.

Предпочтительные утверждения (признаки) и варианты осуществления настоящего изобретения изложены в данном документе ниже. Каждое из утверждений и вариантов осуществления настоящего изобретения, определенных таким образом, может быть скомбинировано с любым другим утверждением и/или вариантом осуществления, если явно не указано обратное. В частности, любой признак, обозначенный как являющийся предпочтительным или преимущественным, может быть скомбинирован с любым другим признаком или признаками или утверждениями, обозначенными как являющиеся предпочтительными или преимущественными.

Используемый в данном документе термин "организм, отличный от человека" или "клетка организма, отличного от человека" обозначает организм, иной чем Homo sapiens, или клетку, не происходящую от него. Используемый в данном документе термин "эукариотический организм, отличный от человека" или "клетка эукариотического организма, отличного от человека" обозначает эукариотический организм, иной чем Homo sapiens, или клетку, полученную не от него. В предпочтительных вариантах осуществления такой эукариотический организм (клетка) представляет собой отличное от человека животное (клетку), как, например, (клетку или популяцию клеток) из отличного от человека млекопитающего, отличного от человека примата, копытного, грызуна (предпочтительно мыши или крысы), кролика, представителя псовых, собаки, коровы, представителя бычьих, овцы, представителя овечьих, козы, свиньи, представителя дикой птицы, представителя домашней птицы, курицы, рыбы, насекомого или членистоногого, предпочтительно млекопитающего, такого как грызун, в частности, мыши. В некоторых вариантах осуществления настоящего изобретения организм, или субъект, или клетка могут представлять собой (клетка или популяция клеток получены из) членистоногое, к примеру, насекомое, или нематоду. В некоторых способах по настоящему изобретению организм, или субъект, или клетка являются растением (клеткой). В некоторых способах по настоящему изобретению организм, или субъект, или клетка являются (получены из) водорослью, включая микроскопическую водоросль, или грибом. Специалист в данной области будет понимать, что эукариотические клетки, которые можно трансплантировать или вводить в эукариотический организм, отличный от человека, в соответствии со способами, упоминаемыми в данном документе, предпочтительно получены или происходят из того же вида, что и эукариотический организм, в который их трансплантируют. Например, клетку мыши трансплантируют в организм мыши в определенном варианте осуществления в соответствии со способами по настоящему изобретению, описываемыми в данном документе. В определенных вариантах осуществления эукариотический организм представляет собой эукариотический организм с ослабленной иммунной системой, т.е. эукариотический организм, у которого иммунная система частично или полностью отключена. К примеру, в способах в соответствии с настоящим изобретением могут применяться мыши с ослабленной иммунной системой, описываемые в данном документе. Примеры мышей с ослабленной иммунной системой включают без ограничения "голых" мышей, мышей RAG -/-, мышей SCID (с тяжелым комбинированным иммунодефицитом), мышей SCID-Beige, мышей NOD (с инсулинзависимым диабетом)-SCID, мышей NOG или NSG и т.д.

Будет понятно, что система CRISPR-Cas, описываемая в данном документе, не встречается в природе в указанной клетке, т. e. является сконструированной или экзогенной относительно указанной клетки. Система CRISPR-Cas, упоминаемая в данном документе, была введена в указанную клетку. Способы введения системы CRISPR-Cas в клетку известны из уровня техники, и они дополнительно описаны в других разделах данного документа. Клетка, содержащая систему CRISPR-Cas, или имеющая введенную систему CRISPR-Cas, в соответствии с настоящим изобретением предусматривает или способна к экспрессии отдельных компонентов системы CRISPR-Cas для создания функционального комплекса CRISPR, способного модифицировать (как, например, расщеплять) целевую последовательность ДНК. В соответствии с этим, как упоминается в данном документе, клетка, содержащая систему CRISPR-Cas, может представлять собой клетку, содержащую отдельные компоненты системы CRISPR-Cas для создания функционального комплекса CRISPR, способного модифицировать (как, например, расщеплять) целевую последовательность ДНК. Альтернативно как упоминается в данном документе, и предпочтительно, клетка, содержащая систему CRISPR-Cas, может представлять собой клетку, содержащую одну или несколько молекул нуклеиновой кислоты, кодирующих отдельные компоненты системы CRISPR-Cas, которые могут экспрессироваться в клетке для создания функционального комплекса CRISPR, способного модифицировать (как, например, расщеплять) целевую последовательность ДНК.

Используемый в данном документе термин "crRNA", или "направляющая РНК", или "одиночная направляющая РНК", или "sgRNA", или "один или несколько компонентов на основе нуклеиновой кислоты" эффекторного белка локуса CRISPR-Cas V типа или VI типа предусматривает любую полинуклеотидную последовательность, характеризующуюся достаточной комплементарностью с целевой последовательностью нуклеиновой кислоты для гибридизации с целевой последовательностью нуклеиновой кислоты и управления специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью нуклеиновой кислоты. В некоторых вариантах осуществления при оптимальном выравнивании с применением подходящего алгоритма выравнивания степень комплементарности составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с применением любого подходящего алгоритма для выравнивания последовательностей, к неограничивающим примерам которого относится алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (например, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; доступный на сайте www.novocraft.com), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на сайте soap.genomics.org.cn) и Maq (доступный на сайте maq.sourceforge.net). Способность направляющей последовательности (в рамках направляющей РНК для нацеливания на нуклеиновую кислоту) управлять специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью нуклеиновой кислоты можно оценивать с помощью любого подходящего анализа. Например, компоненты системы CRISPR для нацеливания на нуклеиновую кислоту, достаточные для образования комплекса нацеливания на нуклеиновую кислоту, в том числе направляющая последовательность, подлежащую тестированию, могут обеспечиваться в клетке-хозяине, имеющей соответствующую целевую последовательность нуклеиновой кислоты, как, например, с помощью трансфекции векторами, кодирующими компоненты комплекса нацеливания на нуклеиновую кислоту, с последующей оценкой предпочтительного нацеливания (например, расщепления) в пределах целевой последовательности нуклеиновой кислоты, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой последовательности нуклеиновой кислоты можно определять в пробирке путем обеспечения целевой последовательности нуклеиновой кислоты, компонентов комплекса нацеливания на нуклеиновую кислоту, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области. Направляющая последовательность и, следовательно, направляющая РНК для нацеливания на нуклеиновую кислоту, может быть выбрана для нацеливания на любую целевую последовательность нуклеиновой кислоты. Целевая последовательность может представлять собой ДНК. Целевая последовательность может представлять собой любую последовательность РНК. В некоторых вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы РНК, выбранной из группы, состоящей из матричной РНК (мРНК), pre-mRNA, рибосомальной РНК (rRNA), транспортной РНК (tRNA), микро-РНК (miRNA), малой интерферирующей РНК (siRNA), малой ядерной РНК (snRNA), малой ядрышковой РНК (snoRNA), двухнитевой РНК (dsRNA), некодирующей РНК (ncRNA), длинной некодирующей РНК (lncRNA) и малой цитоплазматической РНК (scRNA). В некоторых предпочтительных вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы РНК, выбранной из группы, состоящей из мРНК, pre-mRNA и rRNA. В некоторых предпочтительных вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы РНК, выбранной из группы, состоящей из ncRNA и lncRNA. В некоторых более предпочтительных вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы мРНК или молекулы pre-mRNA.

В некоторых вариантах осуществления направляющая РНК для нацеливания на нуклеиновую кислоту выбраны для снижения доли вторичной структуры в пределах направляющей РНК для нацеливания на РНК. В некоторых вариантах осуществления приблизительно или менее чем приблизительно 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% или меньше нуклеотидов направляющей РНК для нацеливания на нуклеиновую кислоту участвуют в самокомплементарном образовании пар оснований при оптимальном сворачивании. Оптимальное сворачивание можно определить с помощью любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного способа (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).

В определенных вариантах осуществления направляющая РНК или crRNA может предусматривать, состоять, по сути, из или состоять из последовательности прямого повтора (DR) и направляющей последовательности или спейсерной последовательности. В определенных вариантах осуществления направляющая РНК или crRNA может предусматривать, состоять, по сути, из или состоять из последовательности прямого повтора, слитой или связанной с направляющей последовательностью или спейсерной последовательностью. В определенных вариантах осуществления последовательность прямого повтора может быть расположена выше (т.е. в направлении 5') от направляющей последовательности или спейсерной последовательности. В других вариантах осуществления последовательность прямого повтора может быть расположена ниже (т.е. в направлении 3') от направляющей последовательности или спейсерной последовательности.

В определенных вариантах осуществления crRNA содержит "петлю-на-стебле", предпочтительно одну "петлю-на-стебле". В определенных вариантах осуществления последовательность прямого повтора образует "петлю-на-стебле", предпочтительно одну "петлю-на-стебле".

В определенных вариантах осуществления длина спейсера направляющей РНК составляет от 15 до 35 нуклеотидов. В определенных вариантах осуществления длина спейсера направляющей РНК составляет по меньшей мере 15 нуклеотидов. В определенных вариантах осуществления длина спейсера составляет от 15 до 17 нуклеотидов, например, 15, 16 или 17 нуклеотидов, от 17 до 20 нуклеотидов, например, 17, 18, 19 или 20 нуклеотидов, от 20 до 24 нуклеотидов, например, 20, 21, 22, 23 или 24 нуклеотида, от 23 до 25 нуклеотидов, например, 23, 24 или 25 нуклеотидов, от 24 до 27 нуклеотидов, например, 24, 25, 26 или 27 нуклеотидов, 27-30 нуклеотидов, например, 27, 28, 29 или 30 нуклеотидов, 30-35 нуклеотидов, например, 30, 31, 32, 33, 34 или 35 нуклеотидов, или 35 нуклеотидов или больше.

Последовательность "tracrRNA" или аналогичные термины включают любую полинуклеотидную последовательность, которая характеризуется достаточной комплементарностью с последовательностью crRNA для возможности гибридизации. В некоторых вариантах осуществления степень комплементарности между последовательностью tracrRNA и последовательностью crRNA по всей длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или больше. В некоторых вариантах осуществления длина tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов. В некоторых вариантах осуществления последовательность crRNA и парная tracr-последовательность содержатся в одном транскрипте, так что при гибридизация между ними двумя образуется транскрипт со вторичной структурой, такой как "шпилька". В одном варианте осуществления настоящего изобретения транскрипт или транскрибированная полинуклеотидная последовательность имеют по меньшей мере две или более "шпилек". В предпочтительных вариантах осуществления транскрипт имеет две, три, четыре или пять "шпилек". В дополнительном варианте осуществления настоящего изобретения транскрипт имеет не более пяти "шпилек". В шпилечной структуре часть последовательности в 5'-направлении по отношению к концевому "N" и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3'-направлении по отношению к петле соответствует tracr-последовательности.

В целом, система CRISPR-Cas, CRISPR-Cas9 или CRISPR может представлять собой таковую, применяемую в вышеупомянутых документах, таких как WO 2014/093622 (PCT/US2013/074667), и обозначать в совокупности транскрипты и другие элементы, вовлеченные в экспрессию или управление активностью CRISPR-ассоциированных ("Cas") генов, включая последовательности, кодирующие ген Cas, в частности ген Cas9 в случае CRISPR-Cas9, tracr-(транс-активирующую CRISPR) последовательность (например, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую "прямой повтор" и tracrRNA-процессированный частичный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также обозначаемую как "спейсер" в контексте эндогенной системы CRISPR) или "РНК", как данный термин используется в данном документе (например, РНК для направления Cas9, например РНК CRISPR и транс-активирующую (tracr) РНК, или одиночную направляющую РНК (sgRNA) (химерную РНК)) или другие последовательности и транскрипты из локуса CRISPR. В целом, система CRISPR характеризуется элементами, которые содействуют образованию комплекса CRISPR в сайте целевой последовательности (также называемой протоспейсер в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR "целевая последовательность" обозначает последовательность, относительно которой разрабатывается направляющая последовательность таким образом, чтобы обладать комплементарностью, при этом гибридизация между целевой последовательностью и направляющей последовательностью содействует образованию комплекса CRISPR. Отрезок направляющей последовательности, на протяжении которого комплементарность с целевой последовательностью важна для активности расщепления, обозначается в данном документе как затравочная последовательность. Целевая последовательность может содержать любой полинуклеотид, как, например, полинуклеотиды ДНК или РНК. В некоторых вариантах осуществления целевая последовательность находится в ядре или цитоплазме клетки, и она может включать нуклеиновые кислоты в митохондриях, органеллах, везикулах, липосомах или частицах, присутствующих в пределах клетки, или из них. В некоторых вариантах осуществления, особенно в случае вариантов применения не в ядре, NLS не являются предпочтительными. В некоторых вариантах осуществления прямые повторы можно идентифицировать in silico посредством поиска повторяющихся мотивов, которые соответствуют какому-либо или всем из следующих критериев: 1. находятся в окне размером 2 т. о. в геномной последовательности, фланкирующей локус CRISPR II типа; 2. охватывают от 20 до 50 п.о. и 3. чередуются с фрагментами из 20-50 п.о. В некоторых вариантах осуществления могут применяться 2 из этих критериев, например, 1 и 2, 2 и 3 или 1 и 3. В некоторых вариантах осуществления могут применяться все 3 критерия.

В вариантах осуществления настоящего изобретения термины направляющая последовательность и направляющая РНК, т.е. РНК, способная направлять Cas на целевой локус генома, используются взаимозаменяемо, как в вышеупомянутых процитированных документах, таких как WO 2014/093622 (PCT/US2013/074667). В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с применением подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с применением любого подходящего алгоритма для выравнивания последовательностей, к неограничивающим примерам которого относится алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (например, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; доступный на сайте www.novocraft.com), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на сайте soap.genomics.org.cn) и Maq (доступный на сайте maq.sourceforge.net). В некоторых вариантах осуществления длина направляющей последовательности составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления длина направляющей последовательности составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов. Предпочтительно длина направляющей последовательности составляет 10-30 нуклеотидов. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, подлежащая тестированию, могут быть обеспечены в клетке-хозяине, имеющей соответствующую целевую последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой полинуклеотидной последовательности можно определять в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области.

В некоторых вариантах осуществления систем CRISPR-Cas степень комплементарности между направляющей и ее соответствующей целевой последовательностью может составлять приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или 100%; причем длина направляющей РНК или sgRNA может составлять приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов; или длина направляющей РНК или sgRNA может составлять менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов; и преимущественно длина tracrRNA составляет 30 или 50 нуклеотидов. Однако аспект настоящего изобретения направлен на снижение нецелевых взаимодействий, например, снижение взаимодействия направляющей с целевой последовательностью, характеризующейся низкой комплементарностью. Действительно, в примерах показано, что настоящее изобретение предусматривает мутации, которые приводят к тому, что система CRISPR-Cas способна распознавать целевую и нецелевую последовательности, которые характеризуются от более чем 80% до приблизительно 95% комплементарностью, например, 83%-84%, или 88-89%, или 94-95% комплементарностью (к примеру, различать целевую последовательность длиной 18 нуклеотидов от нецелевой последовательности длиной 18 нуклеотидов с 1, 2 или 3 несовпадениями). В соответствии с этим, в контексте настоящего изобретения степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью составляет более чем 94,5%, или 95%, или 95,5%, или 96%, или 96,5%, или 97%, или 97,5%, или 98%, или 98,5%, или 99%, или 99,5%, или 99,9%, или 100%. Нецелевой локус характеризуется менее чем 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5%, или 94%, или 93%, или 92%, или 91%, или 90%, или 89%, или 88%, или 87%, или 86%, или 85%, или 84%, или 83%, или 82%, или 81%, или 80% комплементарностью между его последовательностью и направляющей, при этом преимущественно, чтобы нецелевой локус характеризовался 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5% комплементарностью между его последовательностью и направляющей.

В особенно предпочтительных вариантах осуществления в соответствии с настоящим изобретением направляющая РНК (способная направлять Cas на целевой локус) может содержать (1) направляющую последовательность, способную гибридизироваться с целевым локусом генома в эукариотической клетке; (2) tracr-последовательность; и (3) парную tracr-последовательность. Все из (1)-(3) могут находиться в одиночной РНК, т.е. sgRNA (расположенной в ориентации 5' - 3'), или tracrRNA может представлять собой РНК, отличную от РНК, содержащей направляющую и tracr-последовательность. Tracr-последовательность гибридизируется c парной tracr-последовательностью и направляет комплекс CRISPR/Cas к целевой последовательности.

Способы в соответствии с настоящим изобретением, описываемые в данном документе, охватывают индуцирование одной или нескольких мутаций в эукариотической клетке (in vitro, т.е. в выделенной эукариотической клетке), обсуждаемое в данном документе, предусматривающее доставку в клетку вектора, обсуждаемого в данном документе. Мутация (мутации) может (могут) включать введение, делецию или замену одного или нескольких нуклеотидов в каждой целевой последовательности клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1-75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации включают введение, делецию или замену 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 40, 45, 50, 75, 100, 200, 300, 400 или 500 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA.

Для сведения к минимуму токсичности и нецелевого эффекта рекомендуется контролировать концентрацию доставляемых мРНК Cas и направляющей РНК. Оптимальные концентрации мРНК Cas и направляющей РНК можно определить путем тестирования различных концентраций на клеточной модели или модели отличного от человека животного-эукариотического организма и применения глубокого секвенирования для анализа степени модификации в потенциальных нецелевых локусах генома. Альтернативно для сведения к минимуму уровня токсичности и нецелевого эффекта мРНК никазы Cas (например, Cas9 S. pyogenes с мутацией D10A) можно доставлять с парой направляющих РНК, нацеливающихся на представляющий интерес сайт. Направляющие последовательности и стратегии сведения к минимуму токсичности и нецелевых эффектов могут быть такими, как в WO 2014/093622 (PCT/US2013/074667); или с помощью мутации, как указано в данном документе.

Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизированую с целевой последовательностью и находящуюся в комплексе с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. Не вдаваясь в теорию, полагают, что tracr-последовательность, которая может содержать всю или часть tracr-последовательности дикого типа или состоять из нее (например, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также формировать часть комплекса CRISPR, как, например, путем гибридизации по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью.

Местоположение доменов RuvCI, RuvCII, RuvCIII и HNH указано на фигуре 22A-C. Используемый в данном документе термин "домен RuvCI" предпочтительно обозначает домен, содержащий аминокислоты 1-60 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Используемый в данном документе термин "домен RuvCII" предпочтительно обозначает домен, содержащий аминокислоты 718-775 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Используемый в данном документе термин "домен RuvCIII" предпочтительно обозначает домен, содержащий аминокислоты 909-1099 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Используемый в данном документе термин "домен HNH" предпочтительно обозначает домен, содержащий аминокислоты 776-908 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Бороздка между доменами RuvC и HNH обозначает бороздку между этими доменами в трехмерной структуре не встречающегося в природе фермента CRISPR, описываемого в данном документе. На фигуре 25D показана кристаллическая структура SaCas9, где показана бороздка между доменами HNH и RuvC в трехмерной структуре SaCas9.

Аптамеры

Одна направляющая с первой парой аптамер/РНК-связывающий белок может быть связана или слита с активатором, тогда как вторая направляющая с второй парой аптамер/РНК-связывающий белок может быть связана или слита с репрессором. Направляющие предназначены для различных мишеней (локусов), поэтому это обеспечивает возможность активировать один ген и репрессировать другой ген. Например, такой подход показан на следующей схеме:

направляющая 1-аптамер MS2-------РНК-связывающий белок MS2-------активатор VP64; и

направляющая 2 - аптамер PP7-------РНК-связывающий белок PP7-------репрессор SID4x.

Настоящее изобретение также относится к ортогональному нацеливанию на гены с помощью PP7/MS2. В данном примере sgRNA, нацеливающаяся на различные локусы, модифицирована с помощью отличающихся петель РНК для рекрутирования MS2-VP64 или PP7-SID4X, которые соответственно активируют и репрессируют свои целевые локусы. PP7 представляет собой РНК-связывающий белок оболочки бактериофага Pseudomonas. Аналогично MS2, он связывает специфическую последовательность и вторичную структуру РНК. Мотив распознавания РНК у PP7 отличается от такового у MS2. Вследствие этого PP7 и MS2 можно подвергать мультиплексированию, чтобы опосредовать отличающиеся эффекты в различных локусах генома одновременно. Например, sgRNA, нацеливающуюся на локус A, можно модифицировать с помощью петель MS2, рекрутирующих активаторы MS2-VP64, в то время как другую sgRNA, нацеливающуюся на локус B, можно модифицировать с помощью петель PP7, рекрутирующих репрессорные домены PP7-SID4X. Таким образом, dCas9 может опосредовать ортогональные специфичные к локусу модификации в одной и той же клетке. Этот принцип можно расширить для включения других ортогональных РНК-связывающих белков, таких как Q-бета.

Альтернативный метод ортогональной репрессии включает введение в направляющую некодирующих петель РНК с транс-активной репрессорной функцией (либо в положения, аналогичные петлям MS2/PP7, интегрированным в направляющую, либо в 3'-конец направляющей последовательности). К примеру, разрабатывали направляющие с некодирующими (но, как известно, репрессорными) петлями РНК (например, с применением репрессора Alu (в РНК), который нарушает функционирование РНК-полимеразы II в клетках млекопитающих). Последовательность РНК Alu размещали: вместо последовательностей РНК MS2, используемых в данном документе (например, в тетрапетле и/или "петле-на-стебле" 2); и/или на 3'-конце направляющей. Это обеспечивает возможные комбинации из MS2, PP7 или Alu на положениях тетрапетли и/или "петли-на-стебле" 2, а также, необязательно, добавление Alu на 3'-конце направляющей (с линкером или без него).

Применение двух различных аптамеров (отличающихся РНК) обеспечивает возможность применения слияния активатор-адаптерный белок и слияния репрессор-адаптерный белок с различными направляющими элементами для активации экспрессии одного гена, и в тоже время с репрессией другого. Их, вместе с их различными направляющими элементами, можно вводить вместе или практически вместе при подходе мультиплексирования. Одновременно можно применять множество таких модифицированных направляющих элементов, например, 10, или 20, или 30 и т.д., при этом следует доставлять только один (или по меньшей мере минимальное количество) Cas9, поскольку сравнительно небольшое количество Cas9 можно применять с большим количеством модифицированных направляющих элементов. Адаптерный белок может быть ассоциирован (предпочтительно связан или слит) с одним или несколькими активаторами или одним или несколькими репрессорами. Например, адаптерный белок может быть ассоциирован с первым активатором и вторым активатором. Первый и второй активаторы могут быть одинаковыми, но предпочтительно они являются различными активаторами. Например, один мог бы быть VP64, тогда как другой мог бы быть p65, хотя это всего лишь примеры и предусмотрены другие активаторы транскрипции. Можно применять три или более или даже четыре или более активаторов (или репрессоров), но размер упаковки может служить ограничением, так что количество не превышает 5 различных функциональных доменов. Предпочтительно применяются линкеры, а не прямое слияние с адаптерным белком, при этом с адаптерным белком ассоциированы два или более функциональных домена. Подходящие линкеры могут включать линкер GlySer.

Также предусмотрено, что комплекс фермент-направляющий элемент в целом может быть ассоциирован с двумя или более функциональными доменами. Например, два или более функциональных доменов могут быть ассоциированы с ферментом, или два или более функциональных доменов могут быть ассоциированы с направляющим элементом (с помощью одного или нескольких адаптерных белков), или один или несколько функциональных доменов могут быть ассоциированы с ферментом и один или несколько функциональный доменов могут быть ассоциированы с направляющим элементом (с помощью одного или нескольких адаптерных белков).

Слияние между адаптерным белком и активатором или репрессором может включать линкер. Например, могут применяться линкеры GlySer, GGGS. Их можно применять в повторах по 3 ((GGGGS)3) или 6, 9 или даже 12 или более для обеспечения, при необходимости, подходящей длины. Линкеры можно применять между РНК-связывающим белком и функциональным доменом (активатором или репрессором), или между ферментом CRISPR (Cas9) и функциональным доменом (активатором или репрессором). Линкеры применяют для конструирования молекулы с достаточной степенью "механической гибкости".

Нефункциональные направляющие: в настоящем изобретении можно применять направляющие РНК, содержащие нефункциональную направляющую последовательность

В одном аспекте настоящего изобретения предусмотрены направляющие последовательности, которые модифицированы таким способом, который обеспечивает возможность образования комплекса CRISPR и успешное связывание с мишенью, при этом в то же время не обеспечивают успешной нуклеазной активности (т.е. лишенные нуклеазной активности/без активности в отношении образования вставок/делеций). Что касается объяснений, такие модифицированные направляющие последовательности обозначены как "нефункциональные направляющие" или "нефункциональные направляющие последовательности". Эти нефункциональные направляющие или нефункциональные направляющие последовательности можно считать каталитически неактивными или конформационно неактивными с точки зрения нуклеазной активности. Нуклеазную активность можно измерять с применением анализа с использованием нуклеазы Surveyor, или глубокого секвенирования, обычно применяемых в уровне техники, предпочтительно анализа с использованием нуклеазы Surveyor. Аналогично, нефункциональные направляющие последовательности не могут в достаточной степени участвовать в продуктивном образовании пар оснований с точки зрения способности содействия каталитической активности или распознавания активности целевого и нецелевого связывания. Вкратце, анализ с использованием нуклеазы Surveyor включает очистку и амплификацию целевого сайта CRISPR в гене и образование гетеродуплексов с праймерами, обеспечивающими амплификацию целевого сайта CRISPR. После повторной гибридизации продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics) согласно протоколам, рекомендованным производителем, анализировали на гелях и оценивали количественно, исходя из относительной интенсивности окрашивания полосок.

Следовательно, в родственном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная композиция из системы CRISPR-Cas на основе Cas9, содержащая функциональный Cas9, описываемый в данном документе, и направляющую РНК (gRNA), где gRNA предусматривает нефункциональную направляющую последовательность, в результате чего gRNA способна гибридизироваться с целевой последовательностью, так что система CRISPR-Cas на основе Cas9 направляется в представляющий интерес локус генома в клетке, при этом отсутствует обнаруживаемая активность в отношении образования вставок/делеций, возникающая в результате нуклеазной активности немутантного фермента Cas9 системы, как определено с помощью анализа с использованием нуклеазы SURVEYOR. Вкратце, gRNA, содержащая нефункциональную направляющую последовательность, в результате чего gRNA способна гибридизироваться с целевой последовательностью, так что система CRISPR-Cas на основе Cas9 направляется в представляющий интерес локус генома в клетке, при этом отсутствует обнаруживаемая активность в отношении образования вставок/делеций, возникающая в результате нуклеазной активности немутантного фермента Cas9 системы, как определено с помощью анализа с использованием нуклеазы SURVEYOR, в данном документе называется "нефункциональная gRNA". Следует понимать, что любую из gRNA в соответствии с настоящим изобретением, описываемую в другом разделе данного документа, можно применять в качестве нефункциональных gRNA/gRNA, содержащих нефункциональную направляющую последовательность, описываемую в данном документе ниже. Любые из способов, продуктов, композиций и вариантов применения, описываемых в других разделах данного документа, одинаково применимы с нефункциональными gRNA/gRNA, содержащими нефункциональную направляющую последовательность, как дополнительно подробно описано ниже. С целью дополнительного руководства приводятся следующие конкретные аспекты и варианты осуществления.

Способность нефункциональной направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе нефункциональная направляющая последовательность, подлежащая тестированию, могут быть обеспечены в клетке-хозяине, имеющей соответствующую целевую последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой полинуклеотидной последовательности можно определять в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе нефункциональной направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой нефункциональной направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области. Может быть выбрана нефункциональная направляющая последовательность для нацеливания на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки.

Как дополнительно объясняется в данном документе, некоторые параметры структуры обеспечивают возможность достижения правильного остова у таких нефункциональных направляющих. Нефункциональные направляющие последовательности короче соответствующих направляющих последовательностей, которые приводят к активному специфическому образованию вставок/делеций под действием Cas9. Нефункциональные направляющие на 5%, 10%, 20%, 30%, 40%, 50% короче соответствующих направляющих, которые управляют тем же Cas9, приводящим к активному специфическому образованию вставок/делеций под действием Cas9.

Как объясняется ниже и известно из уровня техники, один аспект специфичности gRNA-Cas9 определяется последовательностью прямого повтора, которая должна быть соответствующим образом связана с такими направляющими. В частности, это означает, что последовательности прямого повтора разрабатывают в зависимости от организма, от которого происходит Cas9. Таким образом, структурные данные, доступные для проверенных нефункциональных направляющих последовательностей, можно применять для разработки эквивалентов, специфичных для Cas9. Структурное сходство между, например, ортологичными нуклеазными доменами RuvC двух или более эффекторных белков Cas9, можно применять для переноса дизайна на эквивалентные нефункциональные направляющие. Таким образом, нефункциональную направляющую в данном документе можно соответствующим образом модифицировать в отношении длины и последовательности в соответствии с такими специфичными для Cas9 эквивалентами, что обеспечивает возможность образования комплекса CRISPR и успешное связывание с мишенью, при этом в то же время не обеспечивает успешную нуклеазную активность.

Применение нефункциональных направляющих в контексте данного документа, а также существующий уровень техники, обеспечивают удивительную и непредусмотренную платформу для биологии сетей и/или биологии систем в приложениях in vitro, ex vivo и in vivo одновременно, обеспечивая возможность мультиплексного нацеливания на гены и, в частности, двунаправленного мультиплексного нацеливания на гены. До применения нефункциональных направляющих воздействие на множественные мишени, например, для активации, репрессии и/или сайленсинга генной активности, представляло собой проблему и в некоторых случаях было невозможным. С применением нефункциональных направляющих появилась возможность воздействовать на множественные мишени и, таким образом, на множественные виды активности, например, в одной и той же клетке, у одного и того же животного, или у одного и того же пациента. Такое мультиплексирование может происходить в одно и то же время или быть распределено в течение требуемого периода времени.

Например, в настоящее время нефункциональные направляющие впервые обеспечивают возможность применять gRNA в качестве средства для нацеливания на ген без последствий в виде нуклеазной активности, при этом в то же время обеспечивая направленные средства для активации или репрессии. Направляющая РНК, предусматривающая нефункциональную направляющую, может быть модифицирована таким образом, чтобы дополнительно включать элементы, которые обеспечивают возможность активации или репрессии генной активности, в частности, адаптерные белки (например, аптамеры), описываемые в других разделах данного документа, обеспечивающие возможность функционального размещения генных эффекторов (например, активаторов или репрессоров генной активности). Одним примером является введение аптамеров, как объясняется в данном документе и в уровне техники. Путем конструирования gRNA, предусматривающей нефункциональную направляющую, с включением аптамеров, взаимодействующих с белками (Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136, включенный в данный документ посредством ссылки), можно собрать синтетический комплекс активации транскрипции, состоящий из множественных отличающихся эффекторных доменов. Их можно моделировать в соответствии с естественными процессами активации транскрипции. Например, аптамер, который селективно связывает эффектор (например, активатор или репрессор; димеризованные белки оболочки бактериофага MS2 в качестве слитых белков с активатором или репрессором), или белок, который сам по себе связывает эффектор (например, активатор или репрессор), могут быть прикреплены к тетрапетле и/или "петле-на-стебле" 2 нефункциональной gRNA. В случае MS2 слитый белок MS2-VP64 связывается с тетрапетлей и/или "петлей-на-стебле" 2 и в свою очередь опосредует активацию транскрипции, например, для Neurog2. Другие активаторы транскрипции, например, представляют собой VP64, P65, HSF1 и MyoD1. Исключительно в качестве примера данной концепции, замещение "петель-на-стебле" MS2 на "петли-на-стебле", взаимодействующие с PP7, можно применять для рекрутирования репрессорных элементов.

Таким образом, одним аспектом настоящего изобретения является gRNA, которая предусматривает нефункциональную направляющую, где gRNA дополнительно содержит модификации, которые обеспечивают возможность активации или репрессии гена, как описано в данном документе. Нефункциональные gRNA могут содержать один или несколько аптамеров. Аптамеры могут быть специфичными к генным эффекторам, генным активаторам или генным репрессорам. Альтернативно аптамеры могут быть специфичными к белку, который, в свою очередь, является специфичным к генным эффекторам, генным активаторам или генным репрессорам и рекрутирует/связывает их. Если имеются множественные сайты для рекрутирования активаторов или репрессоров, предпочтительно, чтобы сайты были специфичными либо к активаторам, либо к репрессорам. Если имеются множественные сайты для связывания активаторов или репрессоров, сайты могут быть специфичными к одним и тем же активаторам или одним и тем же репрессорам. Сайты также могут быть специфичны к различным активаторам или различным репрессорам. Генные эффекторы, генные активаторы, генные репрессоры могут присутствовать в форме слитых белков.

В одном варианте осуществления нефункциональная gRNA, описываемая в данном документе, или комплекс CRISPR-Cas на основе Cas9, описываемый в данном документе, включают не встречающуюся в природе или сконструированную композицию, содержащую два или более адаптерных белков, где каждый белок ассоциируется с одним или несколькими функциональными доменами, и где адаптерный белок связывается с отличающейся последовательностью (последовательностями) РНК, вставленной (вставленными) по меньшей мере в одну петлю нефункциональной gRNA.

Следовательно, в одном аспекте предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая направляющую РНК (gRNA), предусматривающую нефункциональную направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где нефункциональная направляющая последовательность определена в данном документе, Cas9, содержащую по меньшей мере одну или несколько последовательностей ядерной локализации, где Cas9 необязательно содержит по меньшей мере одну мутацию, где по меньшей мере одна петля нефункциональной gRNA модифицирована путем вставки отличающейся последовательности(последовательностей) РНК, которая связывается с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где нефункциональная gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю, и где композиция содержит два или более адаптерных белков, где каждый белок ассоциируется с одним или несколькими функциональными доменами.

В определенных вариантах осуществления адаптерный белок представляет собой слитый белок, содержащий функциональный домен, причем слитый белок необязательно содержит линкер между адаптерным белком и функциональным доменом, при этом линкер необязательно включает линкер GlySer.

В определенных вариантах осуществления по меньшей мере одна петля нефункциональной gRNA не является модифицированной путем вставки отличающейся последовательности(последовательностей) РНК, которая связывается с двумя или более адаптерными белками.

В определенных вариантах осуществления один или несколько функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции.

В определенных вариантах осуществления один или несколько функциональный доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции, предусматривающий VP64, p65, MyoD1, HSF1, RTA или SET7/9.

В определенных вариантах осуществления один или несколько функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен репрессии транскрипции.

В определенных вариантах осуществления домен репрессии транскрипции представляет собой домен KRAB.

В определенных вариантах осуществления домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X.

В определенных вариантах осуществления по меньшей мере один из одного или нескольких функциональных доменов, ассоциированных с адаптерным белком, характеризуется одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновой кислоты.

В определенных вариантах осуществления активность расщепления ДНК обусловлена нуклеазой Fok1.

В определенных вариантах осуществления нефункциональная gRNA модифицирована таким образом, что после того, как нефункциональная gRNA связывает адаптерный белок и далее связывается с Cas9 и мишенью, функциональный домен находится в пространственной ориентации, которая позволяет функциональному домен действовать с присущей ему функцией.

В определенных вариантах осуществления по меньшей мере одна петля нефункциональной gRNA представляет собой тетрапетлю и/или петлю 2. В определенных вариантах осуществления тетрапетля и петля 2 нефункциональной gRNA модифицированы путем вставки отличающейся последовательности (последовательностей) РНК.

В определенных вариантах осуществления вставка отличающейся последовательность (последовательности) РНК, которая связывается с одним или несколькими адаптерными белками, представляет собой аптамерную последовательность. В определенных вариантах осуществления аптамерная последовательность представляет собой две или более аптамерные последовательности, специфичные к одному и тому же адаптерному белку. В определенных вариантах осуществления аптамерная последовательность представляет собой две или более аптамерные последовательности, специфичные к различным адаптерным белкам.

В определенных вариантах осуществления адаптерный белок предусматривает MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1.

В определенных вариантах осуществления клетка является эукариотической клеткой. В определенных вариантах осуществления эукариотическая клетка является клеткой млекопитающего, необязательно клеткой мыши. В определенных вариантах осуществления клетка млекопитающего является клеткой человека.

В определенных вариантах осуществления первый адаптерный белок ассоциируется с доменом p65, а второй адаптерный белок ассоциируется с доменом HSF1.

В определенных вариантах осуществления композиция содержит комплекс CRISPR-Cas на основе Cas9, имеющий по меньшей мере три функциональных домена, по меньшей мере один из которых ассоциируется с Cas9 и по меньшей мере два из которых ассоциируются с нефункциональной gRNA.

В определенных вариантах осуществления композиция дополнительно содержит вторую gRNA, где вторая gRNA представляет собой функциональную gRNA, способную гибридизироваться со второй целевой последовательностью, так что вторая система CRISPR-Cas на основе Cas9 направляется ко второму представляющему интерес локусу генома в клетке, при этом присутствует обнаруживаемая активность в отношении образования вставок/делеций во втором локусе генома, возникающая в результате нуклеазной активности фермента Cas9 системы.

В определенных вариантах осуществления композиция дополнительно содержит несколько нефункциональных gRNA и/или несколько функциональных gRNA.

Один аспект настоящего изобретения предусматривает извлечение пользы из модульности и настраиваемости каркаса gRNA для создания серии каркасов gRNA с разными сайтами связывания (в частности, аптамерами) для рекрутирования отличающихся типов эффекторов ортогональным способом. Опять-таки, что касается примера и иллюстрации более широкой концепции, замещение "петель-на-стебле" MS2 на "петли-на-стебле", взаимодействующие с PP7, можно применять для связывания/рекрутирования репрессорных элементов, обеспечивающих мультиплексный двунаправленный контроль транскрипции. Таким образом, в целом, gRNA, предусматривающую нефункциональную направляющую, можно использовать для обеспечения мультиплексного контроля транскрипции и предпочтительно двунаправленного контроля транскрипции. Такой контроль транскрипции является наиболее предпочтительным для генов. Например, одну или несколько gRNA, предусматривающих нефункциональную (нефункциональные) направляющую (направляющие), можно использовать в нацеливании на активацию одного или нескольких целевых генов. В то же самое время, одну или несколько gRNA, предусматривающих нефункциональную (нефункциональные) направляющую (направляющие), можно использовать в нацеливании на репрессию одного или нескольких целевых генов. Такую последовательность можно применять в целом ряде различных комбинаций, например, целевые гены вначале подвергают репрессии, а затем через соответствующий период времени другие мишени активируют, или выбранные гены подвергают репрессии, в то время как выбранные гены активируют, с последующей дополнительной активацией и/или репрессией. В результате этого, на множественные компоненты одной или нескольких биологических систем можно преимущественно воздействовать совместно.

В одном аспекте настоящего изобретения предусмотрена молекула (молекулы) нуклеиновой кислоты, кодирующая (кодирующие) нефункциональную gRNA, или комплекс CRISPR-Cas на основе Cas9, или композицию, описываемые в данном документе.

В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая: молекулу нуклеиновой кислоты, кодирующую нефункциональную направляющую РНК, определяемую в данном документе. В определенных вариантах осуществления векторная система дополнительно содержит молекулу (молекулы) нуклеиновой кислоты, кодирующую (кодирующие) Cas9. В определенных вариантах осуществления векторная система дополнительно содержит молекулу (молекулы) нуклеиновой кислоты, кодирующую(кодирующие) (функциональную) gRNA. В определенных вариантах осуществления молекула нуклеиновой кислоты или вектор дополнительно содержат регуляторный (регуляторные) элемент (элементы), функциональный в эукариотической клетке, функционально связанный с молекулой нуклеиновой кислоты, кодирующей направляющую последовательность (gRNA), и/или молекулой нуклеиновой кислоты, кодирующей Cas9, и/или необязательной последовательностью(последовательностями) ядерной локализации.

В другом аспекте для исследования взаимодействий между нефункциональной направляющей и активной нуклеазой Cas9, которые обеспечивают связывание ДНК, но не разрезание ДНК, можно применять структурный анализ. При этом определяют аминокислоты, важные для нуклеазной активности Cas9. Модификация таких аминокислот обеспечивает улучшенные ферменты Cas9, применяемые для редактирования генов.

Дополнительный аспект заключается в комбинировании применения нефункциональных направляющих, изложенных в данном документе, с другими применениями CRISPR, изложенными в данном документе, а также известными из уровня техники. Например, gRNA, предусматривающую нефункциональную (нефункциональные) направляющую (направляющие) для нацеленной мультиплексной активации или репрессии генов или нацеленной мультиплексной двунаправленной активации/репрессии генов, можно комбинировать с gRNA, предусматривающей направляющие, которые поддерживают нуклеазную активность, как изложено в данном документе. Такие gRNA, предусматривающие направляющие, которые поддерживают нуклеазную активность, могут дополнительно включать модификации, которые обеспечивают репрессию генной активности (например, аптамеры), или могут не включать такие модификации. Такие gRNA, предусматривающие направляющие, которые поддерживают нуклеазную активность, могут дополнительно включать модификации, которые обеспечивают активацию генной активности (например, аптамеры), или могут не включать такие модификации. Таким образом, вводятся дополнительные средства для мультиплексного генного контроля (например, мультиплексная нацеленная активация гена без нуклеазной активности/без активности в отношении образования вставок/делеций может обеспечиваться одновременно или в комбинации с нацеленной репрессией гена с нуклеазной активностью).

Например, 1) применение одной или нескольких gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), предусматривающих нефункциональную (нефункциональные) направляющую (направляющие), нацеленную (нацеленные) на один или несколько генов и дополнительно модифицированную (модифицированные) с помощью соответствующих аптамеров для рекрутирования генных активаторов; 2) можно комбинировать с одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), предусматривающими нефункциональную(нефункциональные) направляющую (направляющие), нацеленную(нацеленные) на один или несколько генов и дополнительно модифицированную (модифицированные) с помощью соответствующих аптамеров для рекрутирования генных репрессоров. 1) и/или 2) затем можно комбинировать с 3) одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), нацеленными на один или несколько генов. Эту комбинацию затем можно осуществлять по порядку в виде 1) + 2) + 3) с 4) одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), нацеленными на один или несколько генов и дополнительно модифицированными с помощью соответствующих аптамеров для рекрутирования генных активаторов. Эту комбинацию затем можно осуществлять по порядку в виде 1) + 2) + 3) + 4) с 5) одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), нацеленными на один или несколько генов и дополнительно модифицированными с помощью соответствующих аптамеров для рекрутирования генных репрессоров. В результате этого, в настоящее изобретение включены различные варианты применения и комбинации. Например, комбинация 1) + 2); комбинация 1) + 3); комбинация 2) + 3); комбинация 1) + 2) + 3); комбинация 1) + 2) +3) +4); комбинация 1) + 3) + 4); комбинация 2) + 3) +4); комбинация 1) + 2) + 4); комбинация 1) + 2) +3) +4) + 5); комбинация 1) + 3) + 4) +5); комбинация 2) + 3) +4) +5); комбинация 1) + 2) + 4) +5); комбинация 1) + 2) +3) + 5); комбинация 1) + 3) +5); комбинация 2) + 3) +5); комбинация 1) + 2) +5).

В одном аспекте настоящего изобретения предусмотрен алгоритм для разработки, оценки или отбора нацеливающей последовательности на основе нефункциональной направляющей РНК (нефункциональная направляющая последовательность) для направления системы CRISPR-Cas на основе Cas9 к целевому генному локусу. В частности, было определено, что специфичность нефункциональной направляющей РНК зависит от i) содержания GC и ii) длины нацеливающей последовательности и ее можно оптимизировать, варьируя данные параметры. В одном аспекте настоящего изобретения предусмотрен алгоритм для разработки или оценки нацеливающей последовательности на основе нефункциональной направляющей РНК, которая сводит к минимуму нецелевое связывание или взаимодействие нефункциональной направляющей РНК. В одном варианте осуществления настоящего изобретения алгоритм выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления системы CRISPR на генный локус в организме предусматривает a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе, анализ последовательности длиной 20 нуклеотидов, расположенной ниже каждого мотива CRISPR, путем i) определения содержания GC в последовательности; и ii) определения того, имеются ли в геноме организма нецелевые совпадения из 15 нижерасположенных нуклеотидов, ближайших к мотиву CRISPR, и c) выбор 15-нуклеотидной последовательности для применения в нефункциональной направляющей РНК, если содержание GC последовательности составляет 70% или меньше и не идентифицированы нецелевые совпадения. В одном варианте осуществления последовательность выбирают в качестве нацеливающей последовательности, если содержание GC составляет 60% или меньше. В определенных вариантах осуществления последовательность выбирают в качестве нацеливающей последовательности, если содержание GC составляет 55% или меньше, 50% или меньше, 45% или меньше, 40% или меньше, 35% или меньше, или 30% или меньше. В одном варианте осуществления анализируют две или более последовательностей генного локуса и выбирают последовательность с самым низким содержанием GC, или последовательность на втором месте по самому низкому содержанию GC, или последовательность на третьем месте по самому низкому содержанию GC. В одном варианте осуществления последовательность выбрана в качестве нацеливающей последовательности, если в геноме организма не идентифицированы нецелевые совпадения. В одном варианте осуществления нацеливающую последовательность выбирают, если в геноме организма не идентифицированы нецелевые совпадения.

В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления функционализированной системы CRISPR на генный локус в организме, который включает: a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе; b) анализ последовательности длиной 20 нуклеотидов, расположенной ниже каждого мотива CRISPR, путем: i) определения содержания GC в последовательности; и ii) определения того, имеются ли в геноме организма нецелевые совпадения с первыми 15 нуклеотидами последовательности; c) выбор последовательность для применения в направляющей РНК, если содержание GC в последовательности составляет 70% или меньше и не идентифицированы нецелевые совпадения. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 50% или меньше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 40% или меньше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 30% или меньше. В одном варианте осуществления анализируют две или более последовательностей и выбирают последовательность с самым низким содержанием GC. В одном варианте осуществления нецелевые совпадения определяют в регуляторных последовательностях организма. В одном варианте осуществления генный локус представляет собой регуляторный участок. В одном аспекте предусмотрена нефункциональная направляющая РНК, предусматривающая нацеливающую последовательность, выбранную в соответствии с вышеупомянутыми способами.

В одном аспекте настоящего изобретения предусмотрена нефункциональная направляющая РНК для нацеливания функционализированной системы CRISPR на генный локус в организме. В одном варианте осуществления настоящего изобретения нефункциональная направляющая РНК предусматривает нацеливающую последовательность, где содержание CG в целевой последовательность составляет 70% или меньше, и первые 15 нуклеотидов нацеливающей последовательности не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в регуляторной последовательности из другого генного локуса в организме. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет 60% или меньше, 55% или меньше, 50% или меньше, 45% или меньше, 40% или меньше, 35% или меньше, или 30% или меньше. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет от 70% до 60%, или от 60% до 50%, или от 50% до 40%, или от 40% до 30%. В одном варианте осуществления нацеливающая последовательность характеризуется самым низким содержанием CG среди потенциальных нацеливающих последовательностей для локуса.

В одном варианте осуществления настоящего изобретения первые 15 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 14 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 13 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 12 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 11 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 10 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В одном варианте осуществления настоящего изобретения первые 15 нуклеотидов нефункциональной направляющей не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в регуляторном участке другого генного локуса. В других вариантах осуществления первые 14 нуклеотидов, или первые 13 нуклеотидов нефункциональной направляющей, или первые 12 нуклеотидов направляющей, или первые 11 нуклеотидов нефункциональной направляющей, или первые 10 нуклеотидов нефункциональной направляющей не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в регуляторном участке другого генного локуса. В других вариантах осуществления первые 15 нуклеотидов, или 14 нуклеотидов, или 13 нуклеотидов, или 12 нуклеотидов, или 11 нуклеотидов нефункциональной направляющей не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в геноме.

В определенных вариантах осуществления нефункциональная направляющая РНК включает дополнительные нуклеотиды на 3'-конце, которые не совпадают с целевой последовательностью. Таким образом, нефункциональная направляющая РНК, которая включает первые 15 нуклеотидов, или 14 нуклеотидов, или 13 нуклеотидов, или 12 нуклеотидов, или 11 нуклеотидов, расположенных ниже мотива CRISPR, может быть увеличена по длине на 3'-конце на 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов, 20 нуклеотидов или больше.

В настоящем изобретении предусмотрен способ направления системы CRISPR-Cas на основе Cas9, в том числе без ограничения нефункционирующей системы на основе Cas9 (dCas9) или функционализированной системы на основе Cas9 (которая может предусматривать функционализированный Cas9 или функционализированную направляющую), в генный локус. В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК и направления функционализированной системы CRISPR к генному локусу в организме. В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК и осуществления генной регуляции целевого генного локуса с помощью функционализированной системы CRISPR-Cas на основе Cas9. В определенных вариантах осуществления способ применяют для осуществления регуляции целевого гена, при этом сводя к минимуму нецелевые эффекты. В одном аспекте настоящего изобретения предусмотрен способ выбора двух или более нацеливающих последовательностей на основе нефункциональных направляющих РНК и осуществления генной регуляции двух или более целевых генных локусов с помощью функционализированной системы CRISPR-Cas на основе Cas9. В определенных вариантах осуществления способ применяют для осуществления регуляции двух или более целевых генных локусов, при этом сводя к минимуму нецелевые эффекты

В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления функционализированного Cas9 к генному локусу в организме, который включает: a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе; b) анализ последовательности, расположенной ниже каждого мотива CRISPR, путем: i) выбора 10-15 нуклеотидов, смежных с мотивом CRISPR, ii) определение содержания GC в последовательности; и c) выбор последовательности длиной 10-15 нуклеотидов в качестве нацеливающей последовательности для применения в направляющей РНК, если содержание GC последовательности составляет 40% или больше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 50% или больше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 60% или больше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 70% или больше. В одном варианте осуществления анализируют две или более последовательностей и выбирают последовательность с самым высоким содержанием GC. В одном варианте осуществления способ дополнительно включает добавление к 3'-концу выбранной последовательности нуклеотидов, которые не совпадают с последовательностью, расположенной ниже мотива CRISPR. В одном аспекте предусмотрена нефункциональная направляющая РНК, предусматривающая нацеливающую последовательность, выбранную в соответствии с вышеупомянутыми способами.

В одном аспекте настоящего изобретения предусмотрена нефункциональная направляющая РНК для направления функционализированной системы CRISPR на генный локус в организме, где нацеливающая последовательность на основе нефункциональной направляющей РНК состоит из 10-15 нуклеотидов, смежных с мотивом CRISPR в генном локусе, где содержание CG в целевой последовательности составляет 50% или больше. В определенных вариантах осуществления нефункциональная направляющая РНК дополнительно содержит нуклеотиды, добавленные к 3'-концу нацеливающей последовательность, которые не совпадают с последовательностью, расположенной ниже мотива CRISPR в генном локусе.

В одном аспекте настоящего изобретения предусмотрен одиночный эффектор, подлежащий направлению к одному или более, или двум или более генным локусам. В определенных вариантах осуществления эффектор ассоциируется с Cas9, а одну или более, или две или более выбранных нефункциональных направляющих РНК применяют для направления Cas9-ассоциированного эффектора к одному или более, или двум или более выбранным целевым генным локусам. В определенных вариантах осуществления эффектор ассоциируется с одной или более, или двумя или более выбранными нефункциональными направляющими РНК, причем каждая выбранная нефункциональная направляющая РНК, находящаяся в комплексе с ферментом Cas9, приводит к тому, что ассоциированный с ней эффектов размещается на мишени нефункциональной направляющей РНК. Один неограничивающий пример таких систем CRISPR модулирует активность одного или более, или двух или более генных локусов, подлежащих регуляции с помощью одного и того же фактора транскрипции.

В одном аспекте настоящего изобретения предусмотрены два или более эффекторов, подлежащие направлению на один или несколько генных локусов. В определенных вариантах осуществления используют две или более нефункциональные направляющие РНК, причем каждый из двух или более эффекторов ассоциируется с выбранной нефункциональной направляющей РНК, при этом каждый из двух или более эффекторов размещается на выбранной мишени для его нефункциональной направляющей РНК. Один неограничивающий пример таких систем CRISPR модулирует активность одного или более, или двух или более генных локусов, подлежащих регуляции с помощью различных факторов транскрипции. Таким образом, в одном неограничивающем варианте осуществления два или более факторов транскрипции локализованы в различных регуляторных последовательностях одного гена. В другом неограничивающем варианте осуществления два или более факторов транскрипции локализованы в различных регуляторных последовательностях различных генов. В определенных вариантах осуществления один фактор транскрипции является активатором. В определенных вариантах осуществления один фактор транскрипции является ингибитором. В определенных вариантах осуществления один фактор транскрипции является активатором, а другой фактор транскрипции является ингибитором. В определенных вариантах осуществления регулируются генные локусы, экспрессирующие различные компоненты одного и того же регуляторного пути. В определенных вариантах осуществления регулируются генные локусы, экспрессирующие компоненты различных регуляторных путей.

В одном аспекте настоящего изобретения также предусмотрен способ и алгоритм для разработки и выбора нефункциональных направляющих РНК, которые являются специфичными в отношении расщепления целевой ДНК или связывания мишени и генной регуляции, опосредуемых активной системой CRISPR-Cas на основе Cas9. В определенных вариантах осуществления система CRISPR-Cas на основе Cas9 обеспечивает ортогональный генный контроль с применением активного Cas9, который расщепляет целевую ДНК в одном генном локусе, при этом в то же самое время связывается с другим генным локусом и содействует его регуляции.

В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления функционализированного Cas9 к генному локусу в организме без его расщепления, который включает: a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе; b) анализ последовательности, расположенной ниже каждого мотива CRISPR, путем: i) выбора 10-15 нуклеотидов, смежных с мотивом CRISPR, ii) определение содержания GC в последовательности; и c) выбор последовательности длиной 10-15 нуклеотидов в качестве нацеливающей последовательности для применения в нефункциональной направляющей РНК, если содержание GC в последовательности составляет 30% или больше, 40% или больше. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет 35% или больше, 40% или больше, 45% или больше, 50% или больше, 55% или больше, 60% или больше, 65% или больше, или 70% или больше. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет от 30% до 40%, или от 40% до 50%, или от 50% до 60%, или от 60% до 70%. В одном варианте осуществления настоящего изобретения анализируют две или более последовательностей в генном локусе и выбирают последовательность с самым высоким содержанием GC.

В одном варианте осуществления настоящего изобретения часть нацеливающей последовательности, в которой оценивают содержание GC, составляет 10-15 смежных нуклеотидов из 15 целевых нуклеотидов, ближайших к PAM. В одном варианте осуществления настоящего изобретения часть направляющей, в которой учитывают содержание GC, составляет 10-11 нуклеотидов, или 11-12 нуклеотидов, или 12-13 нуклеотидов, или 13, или 14, или 15 смежных нуклеотидов из 15 нуклеотидов, ближайших к PAM.

В одном аспекте настоящего изобретения дополнительно предусмотрен алгоритм идентификации нефункциональных направляющих РНК, которые содействуют расщеплению генного локуса системы CRISPR, при этом не допуская функциональной активации или ингибирования. Замечено, что повышенное содержание GC в нефункциональных направляющих РНК длиной 16-20 нуклеотидов совпадает с повышенным расщеплением ДНК и сниженной функциональной активацией.

Также в данном документе продемонстрировано, что эффективность функционализированного Cas9 может быть повышена путем добавления нуклеотидов к 3'-концу направляющей РНК, которая не совпадает с целевой последовательностью, расположенной ниже мотива CRISPR. Например, что касается нефункциональных направляющих РНК длиной 11-15 нуклеотидов, более короткие направляющие могут с меньшей вероятностью содействовать расщеплению мишени, но они также являются менее эффективными в содействии связыванию системы CRISPR и функциональному контролю. В определенных вариантах осуществления добавление нуклеотидов, которые не совпадают с целевой последовательностью, к 3'-концу нефункциональной направляющей РНК повышает эффективность активации, при этом повышая нежелательное расщепление мишени. В одном аспекте настоящего изобретения также предусмотрен способ и алгоритм идентификации улучшенных нефункциональных направляющих РНК, которые эффективно содействуют функции системы CRISPRP в отношении связывания ДНК и генной регуляции, при этом они не содействуют расщеплению ДНК. Таким образом, в определенных вариантах осуществления настоящего изобретения предусмотрена нефункциональная направляющая РНК, которая включает первые 15 нуклеотидов, или 14 нуклеотидов, или 13 нуклеотидов, или 12 нуклеотидов, или 11 нуклеотидов, расположенных ниже мотива CRISPR, и ее увеличивают по длине на 3'-конце с помощью нуклеотидов, которые не совпадают с мишенью, на 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов, 20 нуклеотидов или больше.

В одном аспекте настоящего изобретения предусмотрен способ осуществления селективного ортогонального генного контроля. Как будет понятно из раскрытия в данном документе, выбор нефункциональной направляющей в соответствии с настоящим изобретением, с учетом длины направляющей и содержания GC, обеспечивает эффективный и селективный контроль транскрипции с помощью функциональной системы CRISPR-Cas на основе Cas9, например, регуляцию транскрипции генного локуса путем активации или ингибирования и сведения к минимуму нецелевых эффектов. В соответствии с этим, с помощью обеспечения эффективной регуляции отдельных целевых локусов в настоящем изобретении также предусмотрена эффективная ортогональная регуляция двух или более целевых локусов.

В определенных вариантах осуществления ортогональный генный контроль выполняется путем активации или ингибирования двух или более целевых локусов. В определенных вариантах осуществления ортогональный генный контроль выполняется путем активации или ингибирования одного или нескольких целевых локусов и расщепления одного или нескольких целевых локусов.

В одном аспекте настоящего изобретения предусмотрена клетка, содержащая не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую одну или несколько нефункциональных направляющих РНК, раскрытых или полученных в соответствии со способом или алгоритмом, описанными в данном документе, где экспрессия одного или нескольких продуктов гена была изменена. В одном варианте осуществления настоящего изобретения экспрессия в клетке двух или более продуктов гена была изменена. В настоящем изобретении также предусмотрена линия клеток, полученная из такой клетки.

В одном аспекте настоящего изобретения предусмотрен многоклеточный организм, содержащий одну или несколько клеток, содержащих не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую одну или несколько нефункциональных направляющих РНК, раскрытых или полученных в соответствии со способом или алгоритмом, описанными в данном документе. В одном аспекте настоящего изобретения предусмотрен продукт, полученный из клетки, линии клеток или многоклеточного организма, содержащих не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую одну или несколько нефункциональных направляющих РНК, раскрытых или полученных в соответствии со способом или алгоритмом, описанными в данном документе.

Дополнительным аспектом настоящего изобретения является применение gRNA, предусматривающей нефункциональную(нефункциональные) направляющую (направляющие), описываемую(описываемые) в данном документе, необязательно в комбинации с gRNA, предусматривающей направляющую(направляющие), описываемую(описываемые) в данном документе или в уровне техники, в комбинации с системами (например, клетками, трансгенными животными, трансгенными мышами, индуцируемыми трансгенными животными, индуцируемыми трансгенными мышами), которые сконструированы либо для сверхэкспрессии Cas9, либо, предпочтительно, нокина Cas9. В результате этого, отдельная система (например, трансгенное животное, клетка) может служить основой для мультиплексных модификаций гена в системной/сетевой биологии. Благодаря нефункциональным направляющим теперь это возможно осуществлять in vitro, ex vivo и in vivo.

Например, после обеспечения Cas9 можно обеспечивать одну или несколько нефункционирующих gRNA для управления мультиплексной генной регуляцией и предпочтительно мультиплексной двунаправленной генной регуляцией. Одну или несколько нефункциональных gRNA, при необходимости или желании, можно обеспечивать способом, который подходит в пространственном и временном отношении (например, с помощью тканеспецифичной индукции экспрессии Cas9). Благодаря тому, что трансгенный/индуцируемый Cas9 обеспечивается (например, экспрессируется) в клетке, ткани, представляющем интерес животном, как gRNA, предусматривающие нефункциональные направляющие, так и gRNA, предусматривающие направляющие, являются одинаково эффективными. Аналогичным образом, дополнительным аспектом настоящего изобретения является применение gRNA, предусматривающей нефункциональную(нефункциональные) направляющую(направляющие), описываемую (описываемые) в данном документе, необязательно в комбинации с gRNA, предусматривающей направляющую(направляющие), описываемую(описываемые) в данном документе или в уровне техники, в комбинации с системами (например, клетками, трансгенными животными, трансгенными мышами, индуцируемыми трансгенными животными, индуцируемыми трансгенными мышами), которые сконструированы для нокаута CRISPR-Cas на основе Cas9.

В результате этого комбинация нефункциональных направляющих, описываемых в данном документе, с применениями CRISPR, описанными в данном документе, и применениями CRISPR, известными из уровня техники, обеспечивает высокоэффективное и точное средство для мультиплексного скрининга систем (например, сетевой биологии). Такой скрининг, например, обеспечивает возможность идентификации специфических комбинаций видов генной активности для идентификации генов, ответственных за заболевания (например, комбинации "включения/выключения"), в частности генетических заболеваний. Предпочтительным применением такого скрининга является рак. Аналогичным образом, в настоящее изобретение включен скрининг в отношении лечения таких заболеваний. На клетки или животных можно воздействовать аномальными условиями, которые приводят к заболеванию или эффектам, напоминающим заболевание. Можно обеспечивать кандидатные композиции и подвергать их скринингу в отношении эффекта в требуемом мультиплексном окружении. Например, раковые клетки пациента можно подвергать скринингу в отношении того, какие генные комбинации будут вызывать их гибель, и затем применять данную информацию для разработки соответствующих видов терапии.

В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. Набор может включать нефункциональные направляющие, описываемые в данном документе, с направляющими, описываемыми в данном документе, или без них.

Информация о структуре, предусмотренная в данном документе, обеспечивает возможность детального изучения взаимодействия нефункциональной gRNA с целевой ДНК и Cas9, предоставляя возможность конструирования или изменения структуры нефункциональной gRNA для оптимизации функциональности всей системы CRISPR-Cas на основе Cas9. Например, петли в нефункциональной gRNA можно увеличивать без перекрывания с белком Cas9 путем вставки адаптерных белков, которые могут связываться с РНК. Такие адаптерные белки могут дополнительно рекрутировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов.

В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.

Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.

В целом, нефункциональные gRNA модифицируют таким способом, который обеспечивает специфические сайты связывания (например, аптамеры) для адаптерных белков, содержащих один или несколько функциональных доменов (например, посредством образования слитого белка) для связывания. Модифицированные нефункциональные gRNA модифицированы таким образом, что как только нефункциональная gRNA образует комплекс CRISPR (т.е. Cas9 связывается с нефункциональной gRNA и мишенью) происходит связывание адаптерных белков, и функциональный домен на адаптерном белке располагается в пространственной ориентации, которая является преимущественной для эффективности присущей ему функции. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени.

Специалисту в данной области будет понятно, что модификации в нефункциональной gRNA, которые обеспечивают возможность связывания адаптер + функциональный домен, но не обеспечивают надлежащее размещение адаптор + функциональный домен (например, из-за стерического несоответствия в трехмерной структуре комплекса CRISPR), представляют собой модификации, которые не подразумеваются. Одна или несколько модифицированных нефункциональных gRNA могут быть модифицированы по тетрапетле, "петле-на-стебле" 1, "петле-на-стебле" 2 или "петле-на-стебле" 3, описываемым в данном документе, предпочтительно либо по тетрапетле, либо по "петле-на-стебле" 2, и наиболее предпочтительно как по тетрапетле, так и по "петле-на-стебле" 2.

Как объясняется в данном документе, функциональные домены могут представлять собой, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.

Нефункциональная gRNA может быть разработана с включением множественных связывающих сайтов распознавания (например, аптамеров), специфических в отношении одного и того же или разных адаптерных белков. Нефункциональная gRNA может быть разработана так, чтобы связываться с промоторным участком, расположенным на -1000 - +1 нуклеотидов выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеотидов. Такое размещение улучшает функциональные домены, которые влияют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированная нефункциональная gRNA может представлять собой одну или несколько модифицированных нефункциональных gRNA (например, по меньшей мере 1 gRNA, по меньшей мере 2 gRNA, по меньшей мере 5 gRNA, по меньшей мере 10 gRNA, по меньшей мере 20 gRNA, по меньшей мере 30 gRNA, по меньшей мере 50 gRNA), нацеленных на один или несколько целевых локусов, содержащихся в композиции.

Адаптерный белок может представлять собой любой из ряда белков, который связывается с аптамером или сайтом распознавания, введенным в модифицированную нефункциональную gRNA, и который обеспечивает возможность правильного размещения одного или нескольких функциональных доменов, после того как нефункциональная gRNA встроилась в комплекс CRISPR, чтобы воздействовать на мишень в пределах присущей ему функции. Как подробно объясняется в настоящей заявке, они могут представлять собой белки оболочки, предпочтительно белки оболочки бактериофагов. Функциональные домены, ассоциированные с такими адаптерными белками (например, в форме слитого белка), могут включать, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, если функциональный домен представляет собой активатор транскрипции или репрессор транскрипции, преимущественным является обеспечение дополнительно по меньшей мере NLS и предпочтительно на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов.

Таким образом, все из модифицированной нефункциональной gRNA, инактивированного Cas9 (с функциональными доменами или без них) и связывающего белка с одним или несколькими функциональными доменами могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение в хозяина может осуществляться с помощью вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной gRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта.

Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).

Настоящее изобретение охватывает применение композиций по настоящему изобретению для создания и использования трансгенных клеток/животных с зависимой от условия или индуцируемой CRISPR, о которых нельзя было и надеяться до осуществления настоящего изобретения или заявки. Например, целевая клетка содержит зависимый от условия или индуцируемый Cas9 (например, в форме Cre-зависимых конструкций) и/или зависимый от условий или индуцируемый адаптерный белок, и при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента Cas9 и/или экспрессии адаптера в целевой клетке. За счет применения идей и композиций по настоящему изобретению с известным способом создания комплекса CRISPR индуцируемые преобразования генома, на которые воздействуют функциональные домены, также являются аспектом настоящего изобретения. Одним из примеров этого является создание трансгенного животного с нокином CRISPR/зависимой от условий экспрессией (например, мыши, содержащей, например, кассету Lox-Stop-polyA-Lox(LSL)) и последующую доставку одной или нескольких композиций, обеспечивающих одну или несколько модифицированных нефункциональных gRNA (например, -200 нуклеотидов до TSS в представляющем интерес целевом гене для целей активации гена), описываемых в данном документе (например, модифицированных нефункциональных gRNA с одним или несколькими аптамерами, распознаваемыми белками оболочки, например, MS2), одного или нескольких адаптерных белков, описываемых в данном документе (MS2-связывающий белок, связанный с одним или несколькими VP64), и средств для индуцирования животного с зависимой от условий экспрессией (например, рекомбиназы Cre для обеспечения индуцируемой экспрессии Cas9). Альтернативно адаптерный белок может обеспечиваться как зависимый от условия или индуцируемый элемент с зависимым от условий или индуцируемым Cas9, чтобы обеспечить эффективную модель для целей скрининга, которой преимущественно требуется только минимальная разработка и введение специфических нефункциональных gRNA для целого ряда применений.

В другом аспекте нефункциональные направляющие дополнительно модифицируют для улучшения специфичности. Можно синтезировать защищенные нефункциональные направляющие, при этом вторичную структуру вводят в 3'-конец нефункциональной направляющей для улучшения ее специфичности. Защищенная направляющая РНК (pgRNA) содержит направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и защитную нить, где защитная нить необязательно комплементарна направляющей последовательности, и где направляющая последовательность в какой-то степени может гибридизироваться с защитной нитью. pgRNA необязательно включает удлиняющую последовательность. Термодинамика гибридизации pgRNA-целевой ДНК определяется количеством оснований, комплементарных между направляющей РНК и целевой ДНК. С использованием "термодинамической защиты" специфичность нефункциональной gRNA можно улучшать путем добавления защитной последовательности. Например, в одном способе комплементарная защитная нить варьирующей длины добавляется к 3'-концу направляющей последовательности в пределах нефункциональной gRNA. В результате этого, защитная нить связывается по меньшей мере с частью нефункциональной gRNA и обеспечивает защищенную gRNA (pgRNA). В свою очередь, нефункциональные gRNA, упомянутые в данном документе, можно легко защитить с применением описанных вариантов осуществления с получением pgRNA. Защитная нить может представлять собой либо отдельный РНК-транскрипт или нить, либо химерную версию, присоединенную к 3'-концу направляющей последовательности на основе нефункциональной gRNA.

Тандемные направляющие и варианты применения в подходе мультиплексного (тандемного) нацеливания

Авторы настоящего изобретения показали, что ферменты CRISPR, определяемые в данном документе, могут использовать более одной направляющей РНК без потери активности. Это делает возможным применение ферментов, систем или комплексов CRISPR, определяемых в данном документе, для нацеливания на множественные ДНК-мишени, гены или генные локусы с помощью одного фермента, системы или комплекса, определяемых в данном документе. Направляющие РНК можно располагать тандемно, необязательно разделенными нуклеотидной последовательностью, такой как прямой повтор, определяемый в данном документе. Положение различных направляющих РНК в тандеме не влияет на активность. Следует отметить, что термины "система CRISPR-Cas", "комплекс CRISP-Cas", "комплекс CRISPR" и "система CRISPR" используются взаимозаменяемо. Также термины "фермент CRISPR", "фермент Cas" или "фермент CRISPR-Cas" могут использоваться взаимозаменяемо. В предпочтительных вариантах осуществления указанный фермент CRISPR, фермент CRISP-Cas или фермент Cas представляет собой Cas9 или любой из его модифицированных или мутированных вариантов, описанных в других разделах данного документа.

В одном аспекте настоящего изобретения предусмотрен не встречающийся в природе или сконструированный фермент CRISPR, предпочтительно фермент CRISPR 2 класса, предпочтительно фермент CRISPR V или VI типа, описываемый в данном документе, такой как без ограничения Cas9, описываемый в других разделах данного документа, применяемый для тандемного или мультиплексного нацеливания. Следует понимать, что в таком подходе может применяться любое из ферментов, комплексов или систем CRISPR (или CRISPR-Cas или Cas) в соответствии с настоящим изобретением, описываемых в других разделах данного документа. Любые из способов, продуктов, композиций и вариантов применения, описываемые в других разделах данного документа, равным образом применимы в подходе мультиплексного или тандемного нацеливания, дополнительно подробно описанного ниже. С целью дополнительного руководства приводятся следующие конкретные аспекты и варианты осуществления.

В одном аспекте настоящего изобретения предусмотрено применение фермента, комплекса или системы Cas9, определяемых в данном документе, для нацеливания на множественные генные локусы. В одном варианте осуществления это можно осуществить путем применения множественных (тандемных или мультиплексных) последовательностей направляющих РНК (gRNA).

В одном аспекте настоящего изобретения предусмотрены способы применения одного или нескольких элементов фермента, комплекса или системы Cas9, определяемых в данном документе, для тандемного или мультиплексного нацеливания, где указанная система CRISP содержит последовательности множественных направляющих РНК. Предпочтительно указанные последовательности gRNA разделены нуклеотидной последовательностью, такой как прямой повтор, определяемой в других разделах данного документа.

Фермент, система или комплекс Cas9, определяемые в данном документе, обеспечивают эффективные средства для модифицирования множественных целевых полинуклеотидов. Фермент, система или комплекс Cas9, определяемые в данном документе, характеризуются большим разнообразием применений, включая модифицирование (например, образование делеции, вставки, транслокации, инактивацию, активацию) одного или нескольких целевых полинуклеотидов в множестве типов клеток. В связи с этим, определяемые в данном документе фермент, система или комплекс Cas9 по настоящему изобретению имеют широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и определении прогноза заболевания, включая нацеливание на множественные генные локусы в пределах одной системы CRISPR.

В одном аспекте настоящего изобретения предусмотрен фермент, система или комплекс Cas9, определяемые в данном документе, т.е. комплекс CRISPR-Cas на основе Cas9, содержащий белок Cas9, имеющий по меньшей мере один ассоциированный с ним домен дестабилизации, и множественные направляющие РНК, которые нацеливаются на множественные молекулы нуклеиновой кислоты, такие как молекулы ДНК, в результате чего каждая из указанных множественных направляющих РНК специфически нацеливается на свою соответствующую молекулу нуклеиновой кислоты, например, молекулу ДНК. Каждая целевая молекула нуклеиновой кислоты, например, молекула ДНК, может кодировать продукт гена или охватывать генный локус. Следовательно, применение множественных направляющих РНК дает возможность нацеливания на множественные генные локусы или множественные гены. В некоторых вариантах осуществления фермент Cas9 может расщеплять молекулу ДНК, кодирующую продукт гена. В некоторых вариантах осуществления экспрессия продукта гена изменена. Белок Cas9 и направляющие РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющие РНК, предусматривающие расположенные тандемно направляющие последовательности. Настоящее изобретение дополнительно охватывает кодирующие последовательности для белка Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего, растительную клетку или клетку дрожжей, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. Экспрессия продукта гена может быть снижена. Фермент Cas9 может образовывать часть системы или комплекса CRISPR, которые дополнительно содержат расположенные тандемно направляющие РНК (gRNA), содержащие серию из 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 25, 25, 30 или более чем 30 направляющих последовательностей, при этом каждая способна специфически гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке. В некоторых вариантах осуществления функциональная система или комплекс CRISPR на основе Cas9 связываются с множественными целевыми последовательностями. В некоторых вариантах осуществления функциональная система или комплекс CRISPR могут редактировать множественные целевые последовательности, например, целевые последовательности могут предусматривать локус генома, а в некоторых вариантах осуществления может быть предусмотрено изменение экспрессии гена. В некоторых вариантах осуществления функциональная система или комплекс CRISPR могут содержать дополнительные функциональные домены. В некоторых вариантах осуществления настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии множественных продуктов гена. Способ может включать их введение в клетку, содержащую указанные целевые нуклеиновые кислоты, например молекулы ДНК, или содержащую и экспрессирующую целевую нуклеиновую кислоту, например молекулы ДНК; например, целевые нуклеиновые кислоты могут кодировать продукты гена или обеспечивать экспрессию продуктов гена (например, регуляторные последовательности).

В предпочтительных вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой Cas9, или система или комплекс CRISPR содержат Cas9. В некоторых вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой AsCas9, или система или комплекс CRISPR, применяемые для мультиплексного нацеливания, содержат AsCas9. В некоторых вариантах осуществления фермент CRISPR представляет собой LbCas9, или система или комплекс CRISPR содержат LbCas9. В некоторых вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, расщепляет обе нити ДНК с образованием двухнитевого разрыва (DSB). В некоторых вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой никазу. В некоторых вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, представляет собой двойную никазу. В некоторых вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, представляет собой фермент Cas9, такой как фермент DD Cas9, определяемый в других разделах данного документа.

В вариантах осуществления Cas9 можно объединять в пары, например, в виде пары никаз, например, никазы SaCas9 (никазы eSaCas9). Кроме того, Cas9 можно упаковывать с одной, или двумя, или большим числом направляющих в векторе на основе AAV. Это можно осуществлять, как описано в Friedland AE et al, Characterization of Staphylococcus aureus Cas9: a smaller Cas9 for all-in-one adeno-associated virus delivery and paired nickase applications, Genome Biol. 2015 Nov 24;16:257. doi: 10.1186/s13059-015-0817-8., раскрытие которого настоящим включено посредством ссылки.

В некоторых общих вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, ассоциируется с одним или несколькими функциональными доменами. В некоторых более конкретных вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой нефункциональный Cas9, определяемый в других разделах данного документа.

В одном аспекте настоящего изобретения предусмотрены средства для доставки фермента, системы или комплекса Cas9 для применения в множественном нацеливании, как определено в данном документе, или полинуклеотидов, определенных в данном документе. Неограничивающие примеры таких средств доставки представляют собой, например, частицу (частицы), доставляющую (доставляющие) компонент (компоненты) комплекса, вектор (векторы), содержащие полинуклеотид(полинуклеотиды), обсуждаемые в данном документе (например, кодирующие фермент CRISPR, обеспечивающие нуклеотиды, кодирующие комплекс CRISPR). В некоторых вариантах осуществления вектором может быть плазмида или вирусный вектор, такой как AAV или лентивирус. Преимущественной может быть транзиентная трансфекция с помощью плазмид, например, клеток HEK, особенно с учетом ограничений по размеру для AAV и того, что, хотя Cas9 вмещается в AAV, в случае дополнительных направляющих РНК может быть достигнут верхний предел.

Также предусмотрены модель, в которой конститутивно экспрессируется фермент, комплекс или система Cas9, применяемые в данном документе, для применения в мультиплексном нацеливании. Организм может быть трансгенным и может быть трансфицирован с помощью векторов по настоящему изобретению или может быть потомством организма, трансфицированного таким образом. В дополнительном аспекте настоящего изобретения предусмотрены композиции, содержащие фермент, систему и комплекс CRISPR, определяемые в данном документе, или полинуклеотиды или векторы, описанные в данном документе. Также предусмотрены системы или комплексы CRISPR на основе Cas9, содержащие множественные направляющие РНК, предпочтительно в формате тандемного расположения. Указанные различные направляющие РНК могут быть разделены нуклеотидными последовательностями, такими как прямые повторы.

Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, кодирующего систему или комплекс CRISPR на основе Cas9, или любого из полинуклеотидов или векторов, описанных в данном документе, и введение их субъекту. Также может предусматриваться подходящая матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации. Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, предусматривающий индуцирование активации или репрессии транскрипции множественных целевых генных локусов путем трансформации субъекта с помощью полинуклеотидов или векторов, описанных в данном документе, где указанный полинуклеотид или вектор кодирует или содержит фермент, комплекс или систему Cas9, содержащие множественные направляющие РНК, предпочтительно расположенные тандемно. В случае осуществления какой-либо обработки ex vivo, например, в культуре клеток, следует понимать, что термин "субъект" можно заменить фразой "клетка или культура клеток".

Также предусмотрены композиции, содержащие фермент, комплекс или систему Cas9, содержащие множественные направляющие РНК, предпочтительно расположенные тандемно, или полинуклеотид или вектор, кодирующие или содержащие указанный фермент, комплекс или систему Cas9, содержащие множественные направляющие РНК, предпочтительно расположенные тандемно, для применения в способах лечения, определяемых в других разделах данного документа. Может предусматриваться набор из частей, включающих такие композиции. Также предусмотрено применение указанной композиции в производстве лекарственного препарата для таких способов лечения. В настоящем изобретении также предусмотрено применение системы CRISPR на основе Cas9 в скрининге, например, скринингах в отношении мутации приобретения функции. Клетки, в которых искусственным путем обеспечивают сверхэкспрессию гена, могут снижать экспрессию гена с течением времени (восстановление равновесия), например, с помощью отрицательных обратных связей. К моменту начала скрининга уровень экспрессии нерегулируемого гена снова может быть снижен. Применение индуцируемого активатора Cas9 позволяет индуцировать транскрипцию непосредственно перед скринингом и тем самым сводит к минимуму вероятность ложноотрицательных соответствий. Соответственно, путем применения настоящего изобретения в скрининге, например, скринингах в отношении мутации приобретения функции, вероятность ложноотрицательных результатов может быть сведена к минимуму.

В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR, содержащая белок Cas9 и множественные направляющие РНК, каждая из которых специфически нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего каждая из множественных направляющих РНК нацеливается на свою специфическую молекулу ДНК, кодирующую продукт гена, и белок Cas9 расщепляет молекулу целевой ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена изменяется; и где белок CRISPR и направляющие РНК не встречаются в природе вместе. Настоящее изобретение охватывает множественные направляющие РНК, содержащие множественные направляющие последовательности, предпочтительно разделенные нуклеотидной последовательностью, такой как прямой повтор, и необязательно слитые с tracr-последовательностью. В одном варианте осуществления настоящего изобретения белок CRISPR представляет собой белок CRISPR-Cas V или VI типа, и в более предпочтительном варианте осуществления белок CRISPR представляет собой белок Cas9. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В другом аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе векторная система, содержащая один или несколько векторов, содержащих первый регуляторный элемент, функционально связанный с множественными направляющими РНК системы CRISPR на основе Cas9, каждая из которых специфически нацеливается на молекулу ДНК, кодирующую продукт гена, и второй регуляторный элемент, функционально связанный с последовательностью, кодирующей белок CRISPR. Оба регуляторных элемента могут находиться в одном и том же векторе или в разных векторах системы. Множественные направляющие РНК нацеливаются на множественные молекулы ДНК, кодирующие множественные продукты гена в клетке, и белок CRISPR может расщеплять множественные молекулы ДНК, кодирующие продукты гена (он может расщеплять одну или обе нити или фактически не проявлять нуклеазную активность), в результате чего экспрессия множественных продуктов гена изменяется; и где белок CRISPR и множественные направляющие РНК не встречаются в природе вместе. В предпочтительном варианте осуществления белок CRISPR представляет собой белок Cas9, необязательно кодон-оптимизированный для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего, растительную клетку или клетку дрожжей, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия каждого из множественных продуктов гена изменена, предпочтительно снижена.

В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая один или несколько векторов. В некоторых вариантах осуществления система содержит: (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии одна или несколько направляющих последовательностей управляют специфичным к последовательности связыванием комплекса CRISPR с одной или несколькими целевыми последовательностями в эукариотической клетке, где комплекс CRISPR содержит фермент Cas9 в комплексе с одной или несколькими направляющими последовательностями, которые гибридизируются с одной или несколькими целевыми последовательностями; и (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, предпочтительно содержащей по меньшей мере одну последовательность ядерной локализации и/или по меньшей мере одну NES; где компоненты (a) и (b) находятся в одном и том же или разных векторах системы. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления комплекс CRISPR содержит одну или несколько последовательностей ядерной локализации и/или одну или несколько NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного комплекса CRISPR на основе Cas9 в обнаруживаемом количестве в ядре эукариотической клетки или за его пределами. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина каждой из направляющих последовательностей составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов или 16-30, или 16-25, или 16-20 нуклеотидов.

Рекомбинантные векторы экспрессии могут содержать полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения в множественном нацеливании, определяемом в данном документе, в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным (регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).

В некоторых вариантах осуществления клетка-хозяин является транзиентно или нетранзиентно трансфицирована с помощью одного или нескольких векторов, содержащих полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения при множественном нацеливании, определяемом в данном документе. В некоторых вариантах осуществления клетку трансфицируют, когда она находится в естественных условиях у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, получена от субъекта. В некоторых вариантах осуществления клетка происходит из клеток, полученных от субъекта, как, например, линии клеток. Из уровня техники известен целый ряд линий клеток, применяемых в качестве культуры тканей, и их примеры приведены в других разделах данного документа. Линии клеток доступны из множества источников, известных специалистам в данной области (см., например, Американская коллекция типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную с помощью одного или нескольких векторов, содержащих полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения при множественном нацеливании, определяемом в данном документе, применяют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную с помощью компонентов системы или комплекса CRISPR на основе Cas9 для применения при множественном нацеливании, описываемом в данном документе (как, например, путем транзиентной трансфекции с помощью одного или нескольких векторов, или трансфекции с помощью РНК), и модифицированную посредством активности системы или комплекса CRISPR на основе Cas9, применяют для получения новой линии клеток, содержащей клетки, содержащие модификацию, но в которых отсутствует любая другая экзогенная последовательность. В некоторых вариантах осуществления клетки, транзиентно или нетранзиентно трансфицированные с помощью одного или нескольких векторов, содержащих полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения при множественном нацеливании, определяемом в данном документе, или линии клеток, полученные из таких клеток, применяют в оценке одного или нескольких тестируемых соединений.

Термин "регуляторные элементы" определен в других разделах данного документа.

Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.

В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких последовательностей направляющей РНК выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая (направляющие) последовательность (последовательности) управляет (управляют) специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с соответствующей целевой последовательностью(ями) в эукариотической клетке, где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с одной или несколькими направляющими последовательностями, которые гибридизируются с соответствующей (соответствующими) целевой (целевыми) последовательностью (последовательностями); и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий предпочтительно по меньшей мере одну последовательность ядерной локализации и/или NES. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом и необязательно разделенных прямым повтором, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 содержит одну или несколько последовательностей ядерной локализации и/или последовательностей ядерного экспорта или NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки и/или за его пределами.

В некоторых вариантах осуществления фермент Cas9 представляет собой фермент системы CRISPR V или VI типа. В некоторых вариантах осуществления фермент Cas9 представляет собой фермент Cas9. В некоторых вариантах осуществления фермент Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae, и он может включать дополнительные изменения или мутации Cas9, определяемые в других разделах данного документа, и он может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина одной или нескольких направляющих последовательностей составляет (или длина каждой составляет) по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов. При применении множественных направляющих РНК они предпочтительно разделены последовательностью прямого повтора. В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение. Кроме того, организм может представлять собой гриб.

В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и/или (b) второй регуляторный элемент, функционально связанный фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий последовательность ядерной локализации. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент системы CRISPR V или VI типа. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент Cas9. В некоторых вариантах осуществления фермент Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность). В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования множественных целевых полинуклеотидов в клетке-хозяине, такой как эукариотическая клетка. В некоторых вариантах осуществления способ предусматривает обеспечение связывания комплекса CRISPR на основе Cas9 с множественными целевыми полинуклеотидами, например, для осуществления расщепления указанных множественных целевых полинуклеотидов, за счет чего обеспечивается модифицирование множественных целевых полинуклеотидов, где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с множественными направляющими последовательностями, каждая из которых гибридизируется со специфической целевой последовательностью в пределах указанного целевого полинуклеотида, где указанные множественные направляющие последовательности связаны с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность (например, для обеспечения одиночной направляющей РНК, sgRNA). В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении каждой целевой последовательности с помощью указанного фермента Cas9. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции множественных целевых генов. В некоторых вариантах осуществления способ дополнительно предусматривает репарацию одного или нескольких указанных расщепленных целевых полинуклеотидов с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в одном или нескольких указанных целевых полинуклеотидов. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего одну или несколько целевых последовательностей. В некоторых вариантах осуществления способ дополнительно предусматривает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и последовательностей множественных направляющих РНК, связанных с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии множественных полинуклеотидов в эукариотической клетке. В некоторых вариантах осуществления способ предусматривает обеспечение связывания комплекса CRISPR на основе Cas9 c множественными полинуклеотидами, так что указанное связывание приводит к повышенной или сниженной экспрессии указанных полинуклеотидов; где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с множественными направляющими последовательностями, каждая из которых специфически гибридизируется с ее собственной целевой последовательностью в пределах указанного полинуклеотида, где указанные направляющие последовательности связаны с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и множественных направляющих последовательностей, связанных с последовательностями прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность.

В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий последовательности множественных направляющих РНК выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где каждая из направляющих последовательностей при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с его соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.

Аспекты настоящего изобретения охватывают не встречающуюся в природе или сконструированную композицию, которая может содержать направляющую РНК (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и фермент Cas9, определяемый в данном документе, который может содержать по меньшей мере одну или более последовательностей ядерной локализации.

Один аспект настоящего изобретения охватывает способы модифицирования представляющего интерес локуса генома для изменения экспрессии гена в клетке путем введения в клетку любой из композиций, описываемых в данном документе.

Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.

Используемый в данном документе термин "направляющая РНК" или "gRNA" имеет значение, применяемое в других разделах данного документа, и предусматривает любую полинуклеотидную последовательность, характеризующуюся достаточной комплементарностью с целевой последовательностью нуклеиновой кислоты, чтобы гибридизироваться с целевой последовательностью нуклеиновой кислоты и управлять специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью нуклеиновой кислоты. Каждая gRNA может быть разработана с включением множественных связывающих сайтов распознавания (например, аптамеров), специфических в отношении одного и того же или разных адаптерных белков. Каждая gRNA может быть разработана так, чтобы связываться с промоторным участком, расположенным на -1000 - +1 нуклеотидов выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеотидов. Такое размещение улучшает функциональные домены, которые воздействуют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированная gRNA может представлять собой одну или несколько модифицированных gRNA (например, по меньшей мере 1 gRNA, по меньшей мере 2 gRNA, по меньшей мере 5 gRNA, по меньшей мере 10 gRNA, по меньшей мере 20 gRNA, по меньшей мере 30 gRNA, по меньшей мере 50 gRNA), нацеленных на один или несколько целевых локусов, содержащихся в композиции. Указанные последовательности множественных gRNA могут быть расположены тандемно и предпочтительно разделены прямым повтором.

Таким образом, каждый из gRNA, фермента CRISPR, определяемых в данном документе, могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение хозяину может быть выполнено посредством вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной sgRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта. Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).

Настоящее изобретение охватывает применение композиций по настоящему изобретению для создания и использования трансгенных клеток/животных с зависимой от условия или индуцируемой CRISPR; см, например, Platt et al., Cell (2014), 159(2): 440-455, или патентные публикации согласно PCT, процитированные в данном документе, такие как WO 2014/093622 (PCT/US2013/074667). Например, клетки или животные, такие как отличные от человека животные, например, позвоночные или млекопитающие, такие как грызуны, например, мыши, крысы, или другие лабораторные или внелабораторные животные, например, кошки, собаки, овцы и т.д., могут характеризоваться состоянием "нокин", в результате чего у животного в зависимости от условий или индуцируемо экспрессируется Cas9, как описано в Platt et al. Таким образом целевая клетка или животное содержат зависимый от условия или индуцируемый (например, в форме Cre-зависимых конструкций) фермент CRISPR (например, Cas9) (например, в форме Cre-зависимых конструкций), при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента CRISPR (например, Cas9) в целевой клетке. С применением идей и композиций, определяемых в данном документе, с известным способом создания комплекса CRISPR индуцируемые преобразования генома также являются аспектом настоящего изобретения. Примеры таких индуцируемых преобразований были описаны в других разделах данного документа.

В некоторых вариантах осуществления фенотипическое изменение предпочтительно является результатом модификации генома при осуществлении нацеливания на генетическое заболевание, особенно в способах терапии, и предпочтительно, если обеспечивается матрица для репарации для коррекции или изменения фенотипа.

В некоторых вариантах осуществления заболевания, на которые можно осуществлять нацеливание, включают заболевания, которые обусловлены патогенными дефектами сплайсинга.

В некоторых вариантах осуществления клеточные цели включают в себя гемопоэтические стволовые клетки/клетки-предшественники (CD34+); человеческие T-клетки и клетки глаза (клетки сетчатки), например, фоторецепторные клетки-предшественники.

В некоторых вариантах осуществления гены-мишени включают: ген бета-глобина человека - HBB (для лечения серповидноклеточной анемии, в том числе путем стимуляции конверсии генов (с использованием близкородственного гена HBD в качестве эндогенной матрицы)); CD3 (T-клетки) и CEP920 - сетчатка (глаза).

В некоторых вариантах осуществления заболевания-мишени также включают рак; серповидноклеточную анемию (обусловленную точечной мутацией); HBV, HIV; бета-талассемию; а также офтальмологическое или глазное заболевание, например, врожденный амавроз Лебера (LCA), вызванный дефектом сплайсинга.

В некоторых вариантах осуществления способы доставки включают опосредованную катионным липидом "прямую" доставку комплекса фермент-направляющая (рибонуклеопротеин) и электропорацию плазмидной ДНК.

Способы, продукты и варианты применения, описанные в данном документе, можно применять для целей, не связанных с терапией. Кроме того, любой из способов, описанных в данном документе, можно применять in vitro и ex vivo.

В одном аспекте предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая:

I. две или более полинуклеотидные последовательности системы CRISPR-Cas, предусматривающие

(a) первую направляющую последовательность, способную гибридизироваться с первой целевой последовательностью в полинуклеотидном локусе,

(b) вторую направляющую последовательность, способную гибридизироваться со второй целевой последовательностью в полинуклеотидном локусе,

(c) последовательность прямого повтора,

и

II. фермент Cas9 или вторую полинуклеотидную последовательность, кодирующую его,

где будучи транскрибированными, первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплекса CRISPR на основе Cas9 с первой и второй целевыми последовательностями соответственно,

где первый комплекс CRISPR содержит фермент Cas9 в комплексе с первой направляющей последовательностью, которая может гибридизироваться с первой целевой последовательностью,

где второй комплекс CRISPR содержит фермент Cas9 в комплексе со второй направляющей последовательностью, которая может гибридизироваться со второй целевой последовательностью, и

где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, при этом индуцируется двухнитевой разрыв, за счет чего обеспечивается модифицирование организма, или отличного от человеческого, или отличного от животного организма. Аналогично могут быть предусмотрены композиции, содержащие более двух направляющих РНК, например, каждая из которых специфична в отношении одной мишени, и они расположены тандемно в композиции или системе или комплексе CRISPR, описываемых в данном документе.

В другом варианте осуществления Cas9 доставляется в клетку в виде белка. В другом и особенно предпочтительном варианте осуществления Cas9 доставляется в клетку в виде белка или в виде нуклеотидной последовательности, кодирующей его. Доставка в клетку в виде белка может включать доставку рибонуклеопротеинового (RNP) комплекса, в котором белок находится в комплексе с множественными направляющими.

В одном аспекте предусмотрены клетки-хозяева и линии клеток, модифицированные с помощью композиций, систем или модифицированных ферментов по настоящему изобретению или содержащие их, в том числе стволовые клетки и их потомство.

В одном аспекте предусмотрены способы клеточной терапии, при которых, например, отдельную клетку или популяцию клеток отбирают или культивируют, где такую клетку или клетки модифицируют или они были модифицированы ex vivo, как описано в данном документе, а затем возвращают (отобранные клетки) или вводят (культивируемые клетки) в организм. Стволовые клетки, будь то эмбриональные, индуцированные плюрипотентные или тотипотентные стволовые клетки, также особенно предпочтительны в этом отношении. Но, разумеется, также предусматриваются варианты осуществления in vivo.

Способы в соответствии с настоящим изобретением могут дополнительно предусматривать доставку матриц, таких как матрицы для репарации, которые могут представлять собой dsODN или ssODN, см. ниже. Доставка матриц может осуществляться одновременно или отдельно от доставки какого-либо или всех из фермента CRISPR или направляющих РНК и с помощью одного и того же или различных механизмов доставки. В некоторых вариантах осуществления предпочтительно, чтобы матрица доставлялась вместе с направляющими РНК и, предпочтительно, также с ферментом CRISPR. Примером может служить вектор на основе AAV, при этом фермент CRISPR представляет собой AsCas9 или LbCas9.

Способы в соответствии с настоящим изобретением могут дополнительно включать: (a) доставку в клетку двухнитевого олигодезоксинуклеотида (dsODN), содержащего "липкие" концы, комплементарные "липким" концам, создаваемым с помощью указанного двухнитевого разрыва, где указанный dsODN интегрируется в представляющий интерес локус; или (b) доставку в клетку однонитевого олигодезоксинуклеотида (ssODN), где указанный ssODN действует как матрица для гомологичной репарации указанного двухнитевого разрыва. Способы в соответствии с настоящим изобретением можно применять для предупреждения или лечения заболевания у индивидуума, при этом необязательно указанное заболевание вызвано дефектом в указанном представляющем интерес локусе. Способы в соответствии с настоящим изобретением можно выполнять in vivo у индивидуума или ex vivo в отношении клетки, извлеченной из индивидуума, где необязательно указанную клетку возвращают в организм индивидуума.

Настоящее изобретение также охватывает продукты, полученные в результате применения фермента CRISPR, или фермента Cas, или фермента Cas9, или фермента CRISPR-CRISPR, или системы CRISPR-Cas, или системы CRISPR-Cas9, для применения в тандеме или при множественном нацеливании, определяемых в данном документе.

Сопровождаемые направляющие для системы CRISPR-Cas на основе Cas9 в соответствии с настоящим изобретением

В одном аспекте настоящего изобретения предусмотрены сопровождаемые системы или комплексы CRISPR-Cas на основе Cas9, в частности, такая система, включающая сопровождаемую направляющую системы CRISPR-Cas на основе Cas9. Под "сопровождаемой" подразумевается, что система, или комплекс CRISPR-Cas на основе Cas9, или направляющая доставляются в определенное время или место в клетке, так что активность системы или комплекса CRISPR-Cas на основе Cas9 или направляющей контролируются в пространственном или временном отношении. Например, активность и местоназначение системы или комплекса CRISPR-Cas на основе Cas9 или направляющей могут контролироваться с помощью аптамерной последовательности сопровождающей РНК, которая характеризуется аффинностью связывания в отношении лиганда аптамера, такого как белок клеточной поверхности или другой локализованный клеточный компонент. Альтернативно сопровождающий аптамер, например, может реагировать на эффектор аптамера на клетке или в ней, такой как временный эффектор, такой как внешний источник энергии, который прилагают к клетке в определенное время.

Сопровождаемые системы или комплексы CRISPR-Cas на основе Cas9 имеют gRNA с функциональной структурой, разработанной для улучшения структуры, архитектуры, стабильности, генетической экспрессии gRNA или любой их комбинации. Такая структура может включать аптамер.

Аптамеры представляют собой биомолекулы, которые можно разрабатывать или отбирать так, чтобы они крепко связывались с другими лигандами, например, с применением методики, называемой систематическая эволюция лигандов с помощью экспоненциального обогащения (SELEX; Tuerk C, Gold L: "Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase." Science 1990, 249:505-510). Аптамеры на основе нуклеиновых кислот, например, можно отбирать из пулов олигонуклеотидов со случайной последовательностью, которые характеризуются высокой аффинностью связывания и специфичностью для целого ряда мишеней, значимых с биомедицинской точки зрения, что предполагает целый ряд терапевтических вариантов использования аптамеров (Keefe, Anthony D., Supriya Pai, and Andrew Ellington. "Aptamers as therapeutics." Nature Reviews Drug Discovery 9.7 (2010): 537-550). Эти характеристики также предполагают целый ряд применений аптамеров в качестве средств доставки лекарственных средств (Levy-Nissenbaum, Etgar, et al. "Nanotechnology and aptamers: applications in drug delivery." Trends in biotechnology 26.8 (2008): 442-449; и Hicke BJ, Stephens AW. "Escort aptamers: a delivery service for diagnosis and therapy." J Clin Invest 2000, 106:923-928.). Также можно конструировать аптамеры, которые функционируют как молекулярные переключатели, реагирующие на гашение сигнала путем изменения свойств, такие как РНК-аптамеры, которые связывают флуорофоры с имитацией активности зеленого флуоресцентного белка (Paige, Jeremy S., Karen Y. Wu, and Samie R. Jaffrey. "RNA mimics of green fluorescent protein." Science 333.6042 (2011): 642-646). Также предполагалось, что аптамеры можно применять как компоненты нацеленных терапевтических систем доставки siRNA, например, для нацеливания на белки клеточной поверхности (Zhou, Jiehua, and John J. Rossi. "Aptamer-targeted cell-specific RNA interference." Silence 1.1 (2010): 4).

В соответствии с этим в данном документе предусмотрена gRNA, модифицированная, например, с помощью одного или нескольких аптамеров, разработанных для улучшения доставки gRNA, включая доставку через клеточную мембрану, во внутриклеточные компартменты или в ядро. Такая структура может включать, либо в дополнение к одному или нескольким аптамерам, либо без такого одного или нескольких аптамеров, фрагмент (фрагменты), (который) которые (придает) придают направляющей возможность доставки, индукции или реакции на выбранный эффектор. В соответствии с этим настоящее изобретение охватывает gRNA, которая реагирует на нормальные или патологические физиологические условия, включая без ограничения pH, гипоксию, концентрацию O2, температуру, концентрацию белка, концентрацию фермента, структуру липида, воздействие света, механическое разрушение (например, ультразвуковые волны), магнитные поля, электрические поля или электромагнитное излучение.

В одном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая сопровождаемую направляющую РНК (egRNA), содержащую:

направляющую последовательность РНК, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; и

сопровождающую аптамерную последовательность РНК, где сопровождающий аптамер характеризуется аффинностью связывания в отношении лиганда аптамера на клетке или в ней, или сопровождающий аптамер реагирует на локализованный эффектор аптамера на клетке или в ней, где присутствие лиганда или эффектора аптамера на клетке или в ней является ограниченным во временном или пространственном отношении.

Сопровождающий аптамер, например, может изменять конформацию в ответ на взаимодействие c лигандом или эффектором аптамера в клетке.

Сопровождающий аптамер может характеризоваться специфической аффинностью связывания в отношении лиганда аптамера.

Лиганд аптамера может локализоваться в определенном положении или компартменте клетки, например, на мембране клетки или в ней. В соответствии с этим связывание сопровождающего аптамера с лигандом аптамера может направлять egRNA в представляющее интерес местоположение в клетке, как, например, внутреннее пространство клетки посредством связывания с лигандом аптамера, который представляет собой лиганд клеточной поверхности. Таким образом, можно обеспечивать нацеливание на различные ограниченные пространственно местоположения в пределах клетки, такие как ядро клетки или митохондрии.

После того, как запланированные изменения были введены, как, например, путем редактирования запланированных копий гена в геноме клетки, продолжение экспрессии CRISPR/Cas9 в данной клетке более не является необходимым. Действительно, длительная экспрессия была бы нежелательной в случае нецелевых эффектов в сайтах генома, не предназначенных для редактирования и т.д. Таким образом, целесообразной была бы ограниченная во времени экспрессия. Одним подходом к решению служит индуцируемая экспрессия, но помимо этого заявители сконструировали самоинактивирующуюся систему CRISPR-Cas с применением Cas9, которая основана на применении некодирующей направляющей целевой последовательности в пределах самого вектора, несущего CRISPR. Таким образом, после того как экспрессия началась, система CRISPR будет вызывать собственное разрушение, но перед тем как разрушение завершится, у нее будет достаточно времени для редактирования геномных копий целевого гена (для чего, с точки зрения нормальной точечной мутации в диплоидной клетке, потребуется не более двух редактирований). Проще говоря, самоинактивирующаяся система CRISPR-Cas с применением Cas9 включает дополнительную РНК (т.e. направляющую РНК), которая нацеливается на кодирующую последовательность самого фермента CRISPR или которая нацеливается на одну или несколько некодирующих направляющих целевых последовательностей, комплементарных уникальным последовательностям, присутствующим в одном или нескольких из следующих: (a) в пределах промотора, управляющего экспрессией элементов некодирующей РНК, (b) в пределах промотора, управляющего экспрессией гена Cas9, (c) в пределах 100 п.о. стартового кодона трансляции ATG в последовательности, кодирующей Cas9, (d) в пределах инвертированного концевого повтора (iTR) вирусного вектора доставки, например, в геноме AAV.

egRNA может включать аптамерную связывающую последовательность РНК, функционально связывающую сопровождающую последовательность РНК с направляющей последовательностью РНК.

В вариантах осуществления egRNA может включать одну или несколько фотолабильных связей или не встречающихся в природе остатков.

В одном аспекте сопровождающая аптамерная последовательность РНК может быть комплементарна целевой miRNA, которая может присутствовать в клетке или может не присутствовать в ней, так что, только когда целевая miRNA присутствует, наблюдается связывание сопровождающей аптамерной последовательности РНК с целевой miRNA, что приводит к расщеплению egRNA с помощью индуцируемого РНК комплекса сайленсинга (RISC) в клетке.

В вариантах осуществления длина сопровождающей аптамерной последовательности РНК может составлять, например, от 10 до 200 нуклеотидов, и egRNA может включать более одной сопровождающей аптамерной последовательности РНК.

Следует понимать, что любые из направляющих последовательностей РНК, описываемых в других разделах данного документа, можно применять в egRNA, описываемой в данном документе. В определенных вариантах осуществления настоящего изобретения направляющая РНК или зрелая crRNA предусматривает, состоит, по сути, из или состоит из последовательности прямого повтора и направляющей последовательности или спейсерной последовательности. В определенных вариантах осуществления направляющая РНК или зрелая crRNA предусматривает, состоит, по сути, из или состоит из последовательности прямого повтора, связанной с направляющей последовательностью или спейсерной последовательностью. В определенных вариантах осуществления направляющая РНК или зрелая crRNA содержит 19 нуклеотидов частичного прямого повтора, за которыми следуют 23-25 нуклеотидов направляющей последовательности или спейсерной последовательности. В определенных вариантах осуществления эффекторный белок представляет собой эффекторный белок FnCas9, и требуется направляющая последовательность длиной по меньшей мере 16 нуклеотидов, чтобы достигнуть обнаруживаемого расщепления ДНК, и направляющая последовательность длиной минимум 17 нуклеотидов, чтобы достичь эффективного расщепления ДНК in vitro. В определенных вариантах осуществления последовательность прямого повтора расположена выше (т.е. в направлении 5') направляющей последовательности или спейсерной последовательности. В предпочтительном варианте осуществления затравочная последовательность (т.е. последовательность, критически важная для распознавания и/или гибридизации с последовательностью в целевом локусе) направляющей РНК для FnCas9 находится примерно в пределах первых 5 нуклеотидов на 5'-конце направляющей последовательности или спейсерной последовательности.

egRNA может быть включена в не встречающуюся в природе или сконструированную композицию с комплексом CRISPR-Cas на основе Cas9 вместе с Cas9, который может включать по меньшей мере одну мутацию, например, мутацию, в результате которой Cas9 характеризуется не более чем 5% нуклеазной активности Cas9, не имеющего по меньшей мере одной мутации, например, характеризуется нуклеазной активностью, сниженной по меньшей мере на 97% или 100% по сравнению с Cas9, не имеющей по меньшей мере одной мутации. Cas9 может также включать одну или несколько последовательностей ядерной локализации. Мутированные ферменты Cas9 с модулированной активностью, такой как сниженная нуклеазная активность, описаны в других разделах данного документа.

Сконструированная композиция с CRISPR-Cas на основе Cas9 может быть обеспечена в клетке, такой как эукариотическая клетка, клетка млекопитающего или клетка человека.

В вариантах осуществления композиции, описанные в данном документе, содержат комплекс CRISPR-Cas на основе Cas9 по меньшей мере с тремя функциональными доменами, причем по меньшей мере один из них ассоциируется с Cas9 и по меньшей мере два из них ассоциируются с egRNA.

Композиции, описанные в данном документе, можно применять для введения преобразования локуса генома в клетку-хозяина, такую как эукариотическая клетка, в частности, клетка млекопитающего или отличного от человеческого эукариотического организма, в частности, отличного от человека млекопитающего, такого как мышь, in vivo. Преобразование локуса генома может предусматривать воздействие на активацию гена, ингибирование гена или расщепление в локусе. Композиции, описанные в данном документе, также можно применять для модифицирования представляющего интерес локуса генома, чтобы изменить экспрессию гена в клетке. Способы введения преобразования локуса генома в клетку-хозяина с применением фермента Cas9, предусмотренного в данном документе, описаны подробно в других разделах данного документа. Доставка композиции может осуществляться, например, посредством доставки молекулы (молекул) нуклеиновой кислоты, кодирующей (кодирующих) композицию, при этом молекула (молекулы) нуклеиновой кислоты функционально связана (связаны) с регуляторной последовательностью (последовательностями), и экспрессии молекулы (молекул) нуклеиновой кислоты in vivo, например, с помощью лентивируса, аденовируса или AAV.

В настоящем изобретении предусмотрены композиции и способы, с помощью которых можно адаптировать активность gRNA-опосредованного редактирования генов. В настоящем изобретении предусмотрены вторичные структуры gRNA, которые улучшают эффективность разрезания путем увеличения gRNA и/или увеличения количества РНК, доставляемой в клетку. gRNA может включать светолабильные или индуцируемые нуклеотиды.

Чтобы повысить эффективность gRNA, например gRNA, доставляемой с помощью вирусной или невирусной технологии, заявители добавили в gRNA вторичные структуры, которые усиливают ее стабильность и улучшают редактирование генов. Помимо этого, чтобы преодолеть отсутствие эффективной доставки, заявители модифицировали gRNA с помощью проникающих в клетку РНК-аптамеров; при этом аптамеры связываются с рецепторами клеточной поверхности и содействуют проникновению gRNA в клетки. Примечательно, что проникающие в клетку аптамеры можно разрабатывать так, чтобы они нацеливались на специфические клеточные рецепторы для опосредования специфичной в отношении клетки доставки. Заявители также создали направляющие, которые являются индуцируемыми.

Чувствительность к свету у индуцируемой системы можно обеспечивать путем активации и связывания криптохрома-2 и CIB1. Стимуляция голубым светом индуцирует активирующее конформационное изменение в криптохроме-2, что приводит к рекрутированию его партнера по связыванию CIB1. Данное связывание является быстрым и обратимым, достигая насыщения за <15 сек после импульсной стимуляции и возвращаясь к исходному состоянию <15 мин после окончания стимуляции. Эта быстрая кинетика связывания приводит к тому, что система ограничивается во временном отношении только скоростью транскрипции/трансляции и распада транскрипта/белка, а не захватом и выведением индуцирующих средств. Активация криптохрома-2 также является высокочувствительной, что позволяет использовать стимуляцию светом слабой интенсивности и снижает риски фототоксичности. Более того, в таком контексте, как интактный головной мозг млекопитающего, различную интенсивность света можно применять для контроля размера стимулируемого участка, что обеспечивает возможность большей точности, чем может обеспечивать векторная доставка сама по себе.

В настоящем изобретении предусмотрены источники энергии, такие как электромагнитное излучение, энергия звука или тепловая энергия, для индуцирования направляющей. Преимущественно, электромагнитное излучение является компонентом видимого света. В предпочтительном варианте осуществления свет представляет собой голубой свет с длиной волны, составляющей от приблизительно 450 до приблизительно 495 нм. В особенно предпочтительном варианте осуществления длина волны составляет приблизительно 488 нм. В другом предпочтительном варианте осуществления стимуляцию светом проводят путем импульсного облучения. Мощность света может варьировать в диапазоне приблизительно 0-9 мВт/см2. В предпочтительном варианте осуществления разновидность стимуляции, заключающаяся в не более 0,25 секунд стимуляции через каждые 15 секунд, должна приводить к максимальной активации.

Клетки, предусмотренные в осуществлении настоящего изобретения на практике, могут представлять собой прокариотическую клетку или эукариотическую клетку, преимущественно клетку животного, растительную клетку или клетку дрожжей, более преимущественно клетку млекопитающего.

Химически чувствительная или чувствительная к изменению энергии направляющая может подвергаться конформационному изменению после индуцирования вследствие связывания химического источника или под действием энергии, что позволяет ей действовать в качестве направляющей и функционировать в системе или комплексе CRISPR-Cas на основе Cas9. Настоящее изобретение может предусматривать применение химического источника или источника энергии, чтобы обеспечить функционирование направляющей и системы или комплекса CRISPR-Cas на основе Cas9; и необязательно дополнительно определить, что экспрессия локуса генома является измененной.

Существует несколько различных конструкций этой химически индуцируемой системы: 1. система на основе ABI-PYL, индуцируемая абсцизовой кислотой (ABA) (см, например, http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2), 2. система на основе FKBP-FRB, индуцируемая рапамицином (или родственными химическими соединениями на основе рапамицина) (см., например, http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html), 3. система на основе GID1-GAI, индуцируемая гиббереллином (GA) (см., например, http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).

Другая система, предусматриваемая настоящим изобретением, представляет собой химически индуцируемую систему, основанную на изменении субклеточной локализации. Заявители также разработали систему, в которой полипептид включает ДНК-связывающий домен, содержащий по меньшей мере пять или более мономеров эффекторов, подобных активаторам транскрипции (TALE), и по меньшей мере один или более полумономеров, специфично расположенных для нацеливания на представляющий интерес локус генома, связанный по меньшей мере с одним или более эффекторными доменами, дополнительно связаны с чувствительным к химическим веществам или энергии белком. Этот белок будет приводить к изменению субклеточной локализации всего полипептида (т.е. транспорт всего полипептида из цитоплазмы в ядро клеток) после связывания химического вещества или при переносе энергии с чувствительным к химическим веществам или энергии белком. Такой транспорт всего полипептида из одних субклеточных компартментов или органелл, в которых его активность блокирована вследствие отсутствия субстрата для эффекторного домена, в другие, в которых субстрат присутствует, позволит всему полипептиду вступать в контакт с требуемым для него субстратом (т.е. геномной ДНК в ядре млекопитающего), и это приводит к активации или репрессии экспрессии целевого гена.

Систему данного типа также можно было бы применять для индуцирования расщепления представляющего интерес локуса генома в клетке, где эффекторный домен представляет собой нуклеазу.

Химически индуцируемая система может представлять собой систему на основе эстрогенового рецептора (ER), индуцируемую 4-гидрокситамоксифеном (4OHT) (см., например, http://www.pnas.org/content/104/3/1027.abstract). Мутированный лиганд-связывающий домен эстрогенового рецептора, называемый ERT2, транслоцируется в ядро клеток после связывания 4-гидрокситамоксифена. В дополнительных вариантах осуществления настоящего изобретения любое встречающееся в природе или сконструированное производное любого ядерного рецептора, рецептора тиреоидного гормона, рецептора ретиноевой кислоты, эстрогенового рецептора, рецептора родственного эстрогену соединения, глюкокортикоидного рецептора, прогестеронового рецептора, андрогенового рецептора можно применять в индуцируемых системах, аналогичных индуцируемой системе на основе ER.

Другая индуцируемая система основана на конструкции с применением системы на основе ионных каналов транзиторного рецепторного потенциала (TRP), индуцируемой энергией, теплом или радиоволнами (см., например, http://www.sciencemag.org/content/336/6081/604). Эти белки системы TRP реагируют на различные стимулы, включая свет и тепло. Когда этот белок активируется под действием света или тепла, ионный канал будет открываться и обеспечивать возможность проникновения ионов, таких как ионы кальция, внутрь плазматической мембраны. Этот входящий поток ионов будет связываться с внутриклеточными партнерами, взаимодействующими с ионами, связанными с полипептидом, в том числе с направляющей и другими компонентами комплекса или системы CRISPR-Cas на основе Cas9, и связывание будет индуцировать изменение субклеточной локализации полипептида, приводя к тому, что весь полипептид проникает в ядро клеток. После попадания внутрь ядра направляющий белок и другие компоненты комплекса CRISPR-Cas на основе Cas9 будут активными и станут модулировать экспрессию целевого гена в клетках.

Систему данного типа также можно было бы применять для индуцирования расщепления представляющего интерес локуса генома в клетке; и, в связи с этим, следует отметить, что фермент Cas9 является нуклеазой. Свет можно генерировать с помощью лазера или других форм источников энергии. Тепло можно генерировать путем повышения температуры, обусловленного источником энергии или наночастицами, которые высвобождают тепло после поглощения энергии из источника энергии, доставляемой в форме радиоволн.

Хотя активация светом может представлять собой преимущественный вариант осуществления, иногда она может быть неблагоприятной, в частности для in vivo применений, при которых свет не может проникать через кожу или другие органы. В данном случае предусмотрены способы применения других видов энергии активации, в частности, энергии электрического поля и/или ультразвука, которые будут оказывать аналогичный эффект.

Энергию электрического поля предпочтительно применяют, фактически как описано в уровне техники, с применением одного или нескольких электрических импульсов, составляющих от приблизительно 1 Вольт/см до приблизительно 10 кВольт/см в условиях in vivo. Вместо или вдобавок к импульсам электрическое поле может доставляться непрерывным способом. Электрический импульс можно прилагать в течение от 1 мкс до 500 миллисекунд, предпочтительно от 1 мкс до 100 миллисекунд. Электрическое поле можно прилагать непрерывно или импульсным способом в течение приблизительно 5 минут.

Используемая в данном документе "энергия электрического поля" представляет собой электрическую энергию, которая воздействует на клетку. Предпочтительно электрическое поле характеризуется напряженностью, составляющей от приблизительно 1 Вольт/см до приблизительно 10 кВольт/см или более в условиях in vivo (см. WO97/49450).

Используемый в данном документе термин "электрическое поле" включает один или несколько импульсов при варьирующей емкости и напряжении и включает экспоненциальные и/или квадратные формы волны, и/или модулированные формы волны и/или модулированные квадратные формы волны. Ссылки на электрические поля и электричество следует принимать как включающие ссылку на наличие разницы электрических потенциалов в окружающей среде клетки. Такая окружающая среда может быть создана с помощью статического электричества, переменного тока (AC), постоянного тока (DC) и т.д., как известно из уровня техники. Электрическое поле может быть однородным, неоднородным или иным, и может варьировать по напряженности и/или направлению зависимым от времени образом.

Также возможны однократные или множественные приложения электрического поля, а также однократные или множественные приложения ультразвука в любом порядке и в любой комбинации. Ультразвук и/или электрическое поле можно доставлять в виде однократных или множественных непрерывных приложений или в виде импульсов (импульсная доставка).

Электропорацию применяли как в in vitro, так и в in vivo процедурах для введения чужеродного материала в живые клетки. В случае in vitro применений образец с живыми клетками вначале смешивают с представляющим интерес средством и помещают между электродами, такими как параллельные пластины. Затем электроды прилагают электрическое поле к смеси клетки/вводимый материал. Примеры систем, с помощью которых осуществляют in vitro электропорацию, включают прибор Electro Cell Manipulator ECM600 и Electro Square Porator T820, оба произведены подразделением BTX из Genetronics, Inc (см. патент США № 5869326).

Известные методики электропорации (как in vitro, так и in vivo) действуют при приложении короткого импульса высокого напряжения к электродам, расположенным вокруг участка обработки. Электрическое поле, генерируемое между электродами, временно образует поры в клеточных мембранах, вследствие чего молекулы представляющего интерес средства проникают в клетки. При известных применениях электропорации это электрическое поле предусматривает однократный импульс квадратной волны порядка 1000 В/см, продолжительностью приблизительно 100 мкс. Такой импульс может генерироваться, например, в известных применениях Electro Square Porator T820.

Предпочтительно электрическое поле характеризуется напряженностью от приблизительно 1 В/см до приблизительно 10 кВ/см в условиях in vitro. Таким образом, электрическое поле может характеризоваться напряженностью, составляющей 1 В/см, 2 В/см, 3 В/см, 4 В/см, 5 В/см, 6 В/см, 7 В/см, 8 В/см, 9 В/см, 10 В/см, 20 В/см, 50 В/см, 100 В/см, 200 В/см, 300 В/см, 400 В/см, 500 В/см, 600 В/см, 700 В/см, 800 В/см, 900 В/см, 1 кВ/см, 2 кВ/см, 5 кВ/см, 10 кВ/см, 20 кВ/см, 50 кВ/см или больше. Более предпочтительно от приблизительно 0,5 кВ/см до приблизительно 4,0 кВ/см в условиях in vitro. Предпочтительно электрическое поле характеризуется напряженностью от приблизительно 1 В/см до приблизительно 10 кВ/см в условиях in vivo. Однако напряженность электрического поля может быть снижена, если увеличивается количество импульсов, доставляемых в целевой сайт. Таким образом, предусмотрена импульсная доставка электрических полей при более низкой напряженности поля.

Предпочтительно предусмотрено приложение электрического поля в форме множественных импульсов, как, например, двойных импульсов одинаковой напряженности и емкости или последовательных импульсов с разной напряженностью и/или емкостью. Используемый в данном документе термин "импульс" включает один или несколько электрических импульсов при варьирующей емкости и напряжении и включает экспоненциальные и/или квадратные формы волны и/или модулированные формы волны/квадратные формы волны.

Предпочтительно электрический импульс доставляется в виде формы волны, выбранной из экспоненциальной формы волны, квадратной формы волны, модулированной формы волны и модулированной квадратной формы волны.

В предпочтительном варианте осуществления используется постоянный ток при низком напряжении. Таким образом, заявители раскрывают применение электрического поля, прилагаемого к клетке, ткани или тканевой массе при напряженности поля, составляющей от 1 В/см до 20 В/см, в течение периода, составляющего 100 миллисекунд или более, предпочтительно 15 минут или более.

Ультразвук преимущественно применяют при уровне мощности, составляющем от приблизительно 0,05 Вт/см2 до приблизительно 100 Вт/см2. Можно применять диагностический или терапевтический ультразвук или их комбинации.

Используемый в данном документе термин "ультразвук" обозначает форму энергии, которая состоит из механических вибраций, частота которых настолько высока, что они находятся за пределами слуха человека. Нижняя граница частоты для ультразвукового спектра в целом может приниматься как приблизительно 20 кГц. В большинстве диагностических применений ультразвука используются частоты в диапазоне от 1 до 15 МГц (из Ultrasonics in Clinical Diagnosis, P. N. T. Wells, ed., 2nd. Edition, Publ. Churchill Livingstone [Edinburgh, London & NY, 1977]).

Ультразвук применялся как в диагностических, так и в терапевтических применениях. При применении в качестве диагностического инструмента ("диагностический ультразвук"), ультразвук, как правило, применяют при плотности энергии в диапазоне до приблизительно 100 мВт/см2 (рекомендация FDA), хотя применялись плотности энергии до 750 мВт/см2. В физиотерапии ультразвук, как правило, применяют в качестве источника энергии в диапазоне до приблизительно 3-4 Вт/см2 (рекомендация WHO). При других терапевтических применениях можно использовать более высокую интенсивность ультразвука, например, HIFU с параметрами от 100 Вт/см до 1 кВт/см2 (или даже выше) в течение коротких периодов времени. Предусмотрено, что используемый в настоящем описании термин "ультразвук" охватывает диагностический, терапевтический и фокусированный ультразвук.

Фокусированный ультразвук (FUS) обеспечивает доставку тепловой энергии без инвазивного зонда (см. Morocz et al. 1998 Journal of Magnetic Resonance Imaging Vol.8, No. 1, pp.136-142. Другой формой фокусированного ультразвука является фокусированный ультразвук высокой интенсивности (HIFU), обзор которого приведен у Moussatov et al. в Ultrasonics (1998) Vol.36, No.8, pp.893-900 и TranHuuHue et al. in Acustica (1997) Vol.83, No.6, pp.1103-1106.

Предпочтительно используют комбинацию диагностического ультразвука и терапевтического ультразвука. Однако эта комбинация не подразумевается как ограничивающая, и квалифицированный читатель будет понимать, что можно применять любую из множества комбинаций ультразвука. Кроме того, можно варьировать плотность энергии, частоту колебаний ультразвука и период воздействия.

Предпочтительно воздействие источника ультразвуковой энергии происходит при плотности потока энергии, составляющей от приблизительно 0,05 до приблизительно 100 Вт см-2. Даже более предпочтительно воздействие источника ультразвуковой энергии происходит при плотности потока энергии, составляющей от приблизительно 1 до приблизительно 15 Вт см-2.

Предпочтительно воздействие источника ультразвуковой энергии происходит при частоте колебаний, составляющей от приблизительно 0,015 до приблизительно 10,0 МГц. Более предпочтительно воздействие источника ультразвуковой энергии происходит при частоте колебаний, составляющей от приблизительно 0,02 до приблизительно 5,0 МГц или приблизительно 6,0 МГц. Наиболее предпочтительно ультразвук прилагают при частоте колебаний, составляющей 3 МГц.

Предпочтительно воздействие происходит в течение периода времени, составляющего от приблизительно 10 миллисекунд до приблизительно 60 минут. Предпочтительно воздействие происходит в течение периода времени, составляющего от приблизительно 1 секунды до приблизительно 5 минут. Более предпочтительно ультразвук прилагают в течение приблизительно 2 минут. Однако в зависимости от конкретной целевой клетки, которую необходимо разрушить, воздействие может иметь большую продолжительность, например, 15 минут.

Преимущественно, на целевую ткань воздействуют с помощью источника ультразвуковой энергии при плотности акустического потока энергии, составляющей от приблизительно 0,05 Вт см-2 до приблизительно 10 Вт см-2, с частотой колебаний в диапазоне от приблизительно 0,015 до приблизительно 10 МГц (см. WO 98/52609). Однако также возможны альтернативы, например, воздействие источником ультразвуковой энергии при плотности акустического потока энергии, составляющей более 100 Вт см-2, но в течение укороченных периодов времени, например, 1000 Вт см-2 в течение периодов в диапазоне миллисекунд или менее.

Предпочтительно приложение ультразвука происходит в форме множественных импульсов; таким образом, как непрерывные волны, так и импульсные волны (импульсная доставка ультразвука) можно использовать в любой комбинации. Например, можно применять ультразвук с непрерывной волной, а затем ультразвук с импульсной волной, или наоборот. Это можно повторять любое число раз, в любом порядке и комбинации. Ультразвук с импульсной волной можно применять на фоне ультразвука с непрерывной волной, и можно применять любое число импульсов в любом числе групп.

Предпочтительно ультразвук может предусматривать ультразвук с импульсной волной. В очень предпочтительном варианте осуществления ультразвук прилагают при плотности потока энергии, составляющей 0,7 Вт см-2 или 1,25 Вт см-2, в виде непрерывной волны. Более высокие плотности потока энергии можно использовать при применении ультразвука с импульсной волной.

Применение ультразвука является преимущественным, поскольку подобно свету его можно точно фокусировать на мишени. Более того, ультразвук является преимущественным, поскольку его можно фокусировать более глубоко в тканях, чем свет. Следовательно, он лучше подходит для терапии с проникновением через всю ткань (как, например, без ограничения доля печени) или весь орган (как, например, без ограничения печень целиком или мышца целиком, как, например, сердце). Другим важным преимуществом является то, что ультразвук представляет собой неинвазивное воздействие, которое применяют при самых разных диагностических и терапевтических применениях. Для примера, ультразвук хорошо известен в методиках медицинской визуализации и, кроме того, в ортопедической терапии. Кроме того, приборы, подходящие для приложения ультразвука к подвергаемому воздействию субъекту-позвоночному, широко доступны и их применение хорошо известно из уровня техники.

Быстрый транскрипционный ответ и эндогенное нацеливание по настоящему изобретению делают их идеальной системой для изучения динамики транскрипции. Например, настоящее изобретение можно применять для изучения динамики вариантной выработки после индуцированной экспрессии целевого гена. На другом полюсе цикла транскрипции, исследования распада мРНК зачастую проводятся в ответ на сильный внеклеточный стимул, вызывающий изменения уровня экспрессии множества генов. Настоящее изобретение можно использовать для обратимого индуцирования транскрипции эндогенной мишени, после чего точечную стимуляцию можно прекращать и можно отслеживать кинетику разрушения отдельной мишени.

Временная точность в настоящем изобретении может обеспечивать возможность зависимой от времени генетической регуляции, согласованной с экспериментальными вмешательствами. Например, мишени с предполагаемым влиянием на долговременную потенциацию (LTP) можно модулировать в органоподобной или диссоциированной культурах нейронов, но только во время стимула для индукции LTP, чтобы не препятствовать нормальному развитию клеток. Аналогично, в клеточных моделях, проявляющих фенотипы заболевания, мишени, которые предположительно влияют на эффективность конкретной терапии, можно модулировать только во время лечения. Наоборот, генетические мишени можно модулировать только во время патологического стимула. Любое число экспериментов, в которых важен выбор момента времени для запуска генетических изменений в ответ на внешние экспериментальные стимулы, могут потенциально получать пользу от настоящего изобретения.

In vivo контекст обеспечивает аналогичные обширные возможности для контроля экспрессии гена в рамках настоящего изобретения. Фотоиндуцируемость обеспечивает потенциал для точности в пространственном отношении. Используя преимущество развития технологии оптродов, стимулирующий оптоволоконный электрод можно помещать в определенный участок головного мозга. Затем размер участка стимуляции может быть отрегулирован с помощью интенсивности света. Это можно осуществлять в сочетании с доставкой системы или комплекса CRISPR-Cas на основе Cas9 по настоящему изобретению, или, в случае трансгенных по Cas9 животных, может доставляться направляющая РНК по настоящему изобретению и технология оптродов может обеспечивать возможность модуляции экспрессии гена в определенных участках головного мозга. Пропускающий свет организм, экспрессрующий Cas9, может иметь направляющую РНК по настоящему изобретению, введенную в него, и затем можно вызвать очень точные локальные изменения экспрессии гена, индуцированные лазером.

Питательная среда для культивирования клеток-хозяев включает среду, обычно применяемую для культуры тканей, такую как M199-основание Эрла, среда Игла MEM (E-MEM), среда Дульбекко MEM (DMEM), SC-UCM102, UP-SFM (GIBCO BRL), EX-CELL302 (Nichirei), EX-CELL293-S (Nichirei), TFBM-01 (Nichirei), ASF104, среди прочих. Подходящие питательные среды для определенных типов клеток можно найти в Американской коллекции типовых культур (ATCC) или Европейской коллекции культур клеток (ECACC). Питательные среды можно дополнить аминокислотами, такими как L-глутамин, солями, противогрибковыми или антибактериальными средствами, такими как Fungizone®, пенициллин-стрептомицин, животной сывороткой и т.п. Среда для культур клеток необязательно может быть бессывороточной.

Настоящее изобретение также может обеспечивать важную временную точность in vivo. Настоящее изобретение можно применять для изменения экспрессии гена во время конкретной стадии развития. Настоящее изобретение можно применять для выбора момента времени для запуска генетических изменений в конкретный промежуток времени проведения эксперимента. Например, гены, вовлеченные в условный рефлекс, можно подвергать сверхэкспрессии или репрессии только во время подачи условного стимула в определенный участок интактного головного мозга грызуна или примата. Кроме того, настоящее изобретение можно применять для индуцирования изменений экспрессии гена только во время конкретных стадий развития заболевания. Например, онкоген можно подвергать сверхэкспрессии только после того, как опухоль достигнет конкретного размера или стадии метастазирования. Наоборот, белки, которые предположительно влияют на развитие болезни Альцгеймера, можно подвергнуть нокдауну только в заданные моменты времени жизни животного и в пределах конкретного участка головного мозга. Хотя эти примеры не являются исчерпывающим перечнем потенциальных применений настоящего изобретения, они указывают на некоторые области, в которых настоящее изобретение может представлять собой перспективную технологию.

Защищенные направляющие: ферменты в соответствии с настоящим изобретением можно применять в комбинации c защищенными направляющими РНК

В одном аспекте целью настоящего изобретения является дальнейшее усиление специфичности отдельных направляющих РНК с учетом Cas9 с помощью термодинамического регулирования специфичности связывания направляющей РНК с целевой ДНК. Речь идет об общем подходе к введению несовпадений, удлинения или усечения в направляющую последовательность для повышения/снижения числа комплементарных оснований относительно несовпадающих оснований, общих у геномной мишени и ее потенциальных нецелевых локусов, чтобы обеспечить термодинамическое преимущество нацеливаемым локусам генома над нецелевыми локусами генома.

В одном аспекте настоящего изобретения предусмотрена направляющая последовательность, которую модифицируют с помощью вторичной структуры для усиления специфичности системы CRISPR-Cas на основе Cas9, и в результате этого вторичная структура может защищать от экзонуклеазной активности и обеспечивать возможность добавлений на 3'-конце направляющей последовательности.

В одном аспекте настоящего изобретении предусмотрена гибридизация "защитной РНК" с направляющей последовательностью, где "защитная РНК" представляет собой нить РНК, комплементарную 5'-концу направляющей РНК (gRNA), для образования тем самым частично двухнитевой gRNA. В одном варианте осуществления настоящего изобретения защита несовпадающих оснований с помощью абсолютно комплементарной защитной последовательности снижает вероятность связывания целевой ДНК с несовпадающими парами оснований на 3'-конце. В вариантах осуществления настоящего изобретения также могут присутствовать дополнительные последовательности, предусматривающие увеличенную длину.

Удлинения направляющей РНК (gRNA), совпадающие с геномной мишенью, обеспечивают защиту и усиливают специфичность gRNA. Предусмотрено, что удлинение gRNA с помощью совпадающей последовательности, дистальной относительно конца затравочной последовательности спейсера для отдельных геномных мишеней, обеспечивает повышенную специфичность. Совпадающие удлинения gRNA, которые усиливают специфичность, наблюдали в клетках без применения усечения. Прогнозирование структуры gRNA, сопровождающей эти стабильные удлинения, показало, что стабильные формы возникают из защищенных состояний, где удлинение образует замкнутую петлю с затравочной последовательностью gRNA благодаря комплементарным последовательностям в удлинении спейсера и затравочной последовательности спейсера. Эти результаты демонстрируют, что концепция защищенной направляющей также включает последовательности, совпадающие с целевой последовательностью генома, дистальные относительно 20-мерного участка связывания спейсера. Для прогнозирования полностью совпадающих или частично совпадающих удлинений направляющей, которые приводят к защищенным состояниям gRNA, можно применять термодинамическое прогнозирование. Это расширяет концепцию защищенных gRNA до взаимодействия между X и Z, где длина X обычно будет составлять 17-20 нуклеотидов, а длина Z составляет 1-30 нуклеотидов. Термодинамическое прогнозирование можно применять для определения оптимального состояния удлинения для Z, потенциального введения небольших количеств несовпадений в Z, чтобы содействовать образованию защищенных конформаций между X и Z. На протяжении настоящей заявки термины "X" и "длина затравочной" последовательности (SL) используются взаимозаменяемо с термином "открытая длина" (EpL), который обозначает число нуклеотидов, доступных для связывания целевой ДНК; термины "Y" и "защитная длина" (PL) используются взаимозаменяемо для обозначения длины защитной последовательности; а термины "Z", "E", "E'" и "EL" используются взаимозаменяемо и соответствуют термину "удлинение" (ExL), который обозначает число нуклеотидов, на которое удлинена целевая последовательность.

Удлиняющая последовательность, которая соответствует удлинению (ExL), может необязательно быть прикреплена напрямую к направляющей последовательности на 3'-конце защищенной направляющей последовательности. Длина удлиняющей последовательности может составлять 2-12 нуклеотидов. Предпочтительно ExL может обозначать 0, 2, 4, 6, 8, 10 или 12 нуклеотидов в длину. В предпочтительном варианте осуществления ExL обозначает 0 или 4 нуклеотида в длину. В более предпочтительном варианте осуществления длина ExL составляет 4 нуклеотида. Удлиняющая последовательность может быть комплементарна целевой последовательности или может не быть комплементарна ей.

Удлиняющая последовательность также необязательно может быть прикреплена напрямую к направляющей последовательности на 5'-конце защищенной направляющей последовательности, а также к 3'-концу защищающей последовательности. В результате этого, удлиняющая последовательность служит в качестве связующей последовательности между защищенной последовательностью и защищающей последовательностью. Не вдаваясь в теорию, полагают, что такая связь может размещать защищающую последовательность возле защищенной последовательности для улучшения связывания защищающей последовательности с защищенной последовательностью.

Добавление несовпадений gRNA на дистальном конце gRNA может демонстрировать усиленную специфичность. Введение незащищенных дистальных несовпадений в Y или удлинение gRNA с помощью дистальных несовпадений (Z) может демонстрировать усиленную специфичность. Эта концепция, как упоминается, привязана к компонентам X, Y и Z, применяемым в защищенных gRNA. Концепцию незащищенных несовпадений можно дополнительно обобщить до концепций X, Y и Z, описанных для защищенных направляющих РНК.

Cas9Cas9

В одном аспекте настоящего изобретения предусмотрена усиленная специфичность Cas9Cas9, где двухнитевой 3'-конец защищенной направляющей РНК (pgRNA) обеспечивает возможность двух возможных исходов: (1) будет происходить обмен направляющая РНК-защитная РНК на направляющая РНК-целевая нить ДНК и направляющая будет полностью связываться с мишенью, или (2) направляющая РНК не сможет полностью связаться с мишенью, и поскольку целевое расщепление под действием Cas9 представляет собой многостадийную кинетическую реакцию, при которой требуется связывание направляющая РНК:целевая ДНК для активации образования Cas9-катализируемых DSB, при этом расщепление под действием Cas9 не происходит, если направляющая РНК не связалась правильным образом. В соответствии с конкретными вариантами осуществления защищенная направляющая РНК улучшает специфичность связывания мишени по сравнению с встречающейся в природе системой CRISPR-Cas. В соответствии с конкретными вариантами осуществления защищенная модифицированная направляющая РНК улучшает стабильность по сравнению с встречающейся в природе CRISPR-Cas. В соответствии с конкретными вариантами осуществления длина защитной последовательности составляет от 3 до 120 нуклеотидов, и она содержит 3 или более смежных нуклеотидов, комплементарных другой последовательности направляющей или защитной последовательности. В соответствии с конкретными вариантами осуществления защитная последовательность образует шпильку. В соответствии с конкретными вариантами осуществления направляющая РНК дополнительно содержит защищенную последовательность и открытую последовательность. В соответствии с конкретными вариантами осуществления открытая последовательность имеет 1-19 нуклеотидов. Более конкретно, открытая последовательность по меньшей мере на 75%, по меньшей мере на 90% или на приблизительно 100% комплементарна целевой последовательности. В соответствии с конкретными вариантами осуществления направляющая последовательность по меньшей мере на 90% или на приблизительно 100% комплементарна защитной нити. В соответствии с конкретными вариантами осуществления направляющая последовательность по меньшей мере на 75%, по меньшей мере на 90% или на приблизительно 100% комплементарна целевой последовательности. В соответствии с конкретными вариантами осуществления направляющая РНК дополнительно содержит удлиняющую последовательность. Более конкретно, удлиняющая последовательность функционально связана с 3'-концом защищенной направляющей последовательности, и необязательно напрямую связана с 3'-концом защищенной направляющей последовательности. В соответствии с конкретными вариантами осуществления удлиняющая последовательность имеет 1-12 нуклеотидов. В соответствии с конкретными вариантами осуществления удлиняющая последовательность функционально связана с направляющей последовательностью на 3'-конце защищенной направляющей последовательности и 5'-конце защитной нити и необязательно напрямую связана с 3’-концом защищенной направляющей последовательности и 3'-концом защитной нити, где удлиняющая последовательность представляет собой связывающую последовательность между защищенной последовательностью и защитной нитью. В соответствии с конкретными вариантами осуществления удлиняющая последовательность не является комплементарной защитной нити на 100%, необязательно не является комплементарной защитной нити по меньшей мере на 95%, по меньшей мере на 90%, по меньшей мере на 80%, по меньшей мере на 70%, по меньшей мере на 60%, или по меньшей мере на 50%. В соответствии с конкретными вариантами осуществления направляющая последовательность дополнительно содержит несовпадающие основания, прикрепленные к концу направляющей последовательности, где несовпадающие основания термодинамически оптимизируют специфичность.

В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR-Cas, содержащая белок Cas9 и защищенную направляющую РНК, которая нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего защищенная направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена изменяется; и где белок Cas9 и защищенная направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает защищенную направляющую РНК, предусматривающую направляющую последовательность, слитую на 3'-конце с последовательностью прямого повтора. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего, растительную клетку или клетку дрожжей, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium или Francisella Novicida и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть дополнительным гомологом или ортологом Cas9. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая фермент Cfp1, является кодон-оптимизированной для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В целом и на протяжении данного описания термин "вектор" обозначает молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).

Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.

В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR в комплексе с направляющей РНК, предусматривающей направляющую последовательность, которая гибридизируется с целевой последовательностью, и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент Cas9 не обладает активностью расщепления нити ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II.

В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение или дрожжи. Кроме того, организм может представлять собой гриб.

В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе выше. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент Cas9 в комплексе с защищенной направляющей РНК, предусматривающей направляющую последовательность, которая гибридизируется с целевой последовательностью, и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020 или Francisella tularensis 1 Novicida и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент CRISPR не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент Cas9 в комплексе с защищенной направляющей РНК, предусматривающей направляющую последовательность, гибридизируемую с целевой последовательностью в пределах указанного целевого полинуклеотида. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента Cas9. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью механизмов генной вставки на основе негомологичного соединения концов (NHEJ), более конкретно, с применением экзогенной полинуклеотидной матрицы, где указанная репарация приводит к мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9, защищенной направляющей РНК, предусматривающей направляющую последовательность, связанную с последовательностью прямого повтора. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR на основе Cas9 с полинуклеотидом, так что указанное связывание приводит к повышенной или сниженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент Cas9 в комплексe с защищенной направляющей РНК, предусматривающей направляющую последовательность, гибридизируемую с целевой последовательностью в пределах указанного полинуклеотида. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и защищенной направляющей РНК.

В одном аспекте настоящего изобретения предусмотрен способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и защищенной направляющей РНК, предусматривающей направляющую последовательность, связанную с последовательностью прямого повтора; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, ответственного за развитие заболевания, где комплекс CRISPR содержит фермент Cas9 в комплексe с направляющей РНК, предусматривающей последовательность, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, с получением тем самым модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента Cas9. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью механизмов генной вставки на основе негомологичного соединения концов (NHEJ) с применением экзогенной полинуклеотидной матрицы, где указанная репарация приводит к мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность.

В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.

В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий защищенную направляющую последовательность ниже последовательности прямого повтора, где, будучи экспрессированной, защищенная направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.

В одном аспекте настоящего изобретения предусмотрен способ отбора одной или нескольких клеток путем введения одной или нескольких мутаций в ген в одной или нескольких клетках, причем способ включает: введение одного или нескольких векторов в клетку(клетки), где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9, защищенной направляющей РНК, предусматривающей направляющую последовательность, и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые отменяют расщепление под действием фермента Cas9; обеспечение механизмов генной вставки на основе негомологичного соединения концов (NHEJ) матрицы редактирования с целевым полинуклеотидом в клетке (клетках), подлежащей (подлежащих) отбору; обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, где комплекс CRISPR содержит фермент Cas9 в комплексе с защищенной направляющей РНК, предусматривающей направляющую последовательность, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, где связывание комплекса CRISPR с целевым полинуклеотидом индуцирует гибель клетки, тем самым обеспечивая возможность отбора одной или нескольких клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления настоящего изобретения клетка, подлежащая отбору, может представлять собой эукариотическую клетку. Аспекты настоящего изобретения предусматривают отбор специфических клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.

Что касается мутаций в ферменте Cas9, если фермент не представляет собой FnCas9, мутации могут быть такими, как описано в других разделах данного документа; также предусмотрена консервативная замена для любой из заменяющих аминокислот. В одном аспекте настоящего изобретения предусмотрено в отношении любого, или каждого, или всех вариантов осуществления, обсуждаемых в данном документе, что фермент CRISPR содержит по меньшей мере одну или более, или по меньшей мере две или более мутаций, где по меньшей мере одна или более мутаций или по меньшей мере две или более мутаций выбраны из мутаций, описанных в других разделах данного документа.

В дополнительном аспекте настоящее изобретение относится к выполняемому с помощью компьютера способу идентификации или разработки потенциальных соединений для помещения или связывания с системой CRISPR-Cas9 или ее функциональной частью или наоборот (выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем CRISPR-Cas9 или их функциональной части для связывания с требуемыми соединениями) или к выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем CRISPR-Cas9 (например, с точки зрения прогнозирования областей системы CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных кристаллической структуры или исходя из данных ортологов Cas9, или с учетом того, где можно прикрепить функциональную группу, такую как активатор или репрессор, к системе CRISPR-Cas9, или в отношении усечений Cas9 или в отношении разработки никаз), причем указанный способ включает:

применение компьютерной системы, например, компьютера с хранимой программой, содержащего процессор, систему хранения данных, устройство ввода и устройство вывода, стадии:

(a) ввода в компьютер с хранимой программой посредством указанного устройства ввода данных, включающих трехмерные координаты подгруппы атомов из кристаллической структуры CRISPR-Cas9 или связанных с таковой, например, в домене связывания системы CRISPR-Cas9 или альтернативно или дополнительно в доменах, которые варьируют, исходя из различий среди ортологов Cas9, или касающихся Cas9, или касающихся никаз, или касающихся функциональных групп, необязательно с информацией по структуре комплекса (комплексов) системы CRISPR-Cas9, с получением тем самым набора данных;

(b) сравнения с применением указанного процессора указанного набора данных с компьютерной базой данных по структурам, хранящейся в указанной компьютерной системе хранения данных, например, структурам соединений, которые связываются, или предположительно связываются, или для которых требуется, чтобы они связывались с системой CRISPR-Cas9, или с ортологами Cas9 (например, Cas9s или с доменами или участками, которые варьируют среди ортологов Cas9), или с кристаллической структурой CRISPR-Cas9, или с никазами или с функциональными группами;

(с) выбора из указанной базы данных, с применением компьютерных способов, структуры (структур), например, структур CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться с определенными структурами CRISPR-Cas9, частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных по другим частям кристаллической структуры CRISPR-Cas9 и/или об ортологах Cas9, усеченных Cas9, новых никазах или конкретных функциональных группах, или положений для прикрепления функциональных групп или систем функциональная группа-CRISPR-Cas9;

(d) конструирования, с применением компьютерных способов, модели выбранной(выбранных) структуры(структур) и

(e) вывода данных по выбранной(выбранным) структуре(структурам) на указанное устройство вывода;

и необязательно синтеза одной или нескольких выбранных структур;

и дополнительно необязательного тестирования указанной (указанных) синтезированной (синтезированных) выбранной (выбранных) структуры (структур) как системы CRISPR-Cas9 или таковой (таковых) в ней;

или указанный способ включает: обеспечение координат по меньшей мере двух атомов кристаллической структуры CRISPR-Cas9, например, по меньшей мере двух атомов из таблицы кристаллических структур для кристаллической структуры CRISPR-Cas9, изложенной в данном документе, или координат по меньшей мере субдомена кристаллической структуры CRISPR-Cas9 ("выбранных координат"), обеспечивающих структуру кандидатной молекулы, содержащей связывающую молекулу, или частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных по другим частям кристаллической структуры CRISPR-Cas9 и/или от ортологов Cas9, или структуре функциональных групп, и подгонку структуры кандидатной молекулы к выбранным координатам, с получением тем самым данных о продукте, содержащих структуры CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться с определенными структурами CRISPR-Cas9, частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, усеченных Cas9, новых никаз или конкретных функциональных групп, или положений для прикрепления функциональных групп или систем функциональная группа-CRISPR-Cas9, с выводом данных о них; и необязательно синтез соединения (соединений) на основании указанных данных о продукте и дополнительно необязательно включает тестирование указанного (указанных) синтезированного (синтезированных) соединения (соединений) как системы CRISPR-Cas9 или такового (таковых) в ней.

Тестирование может предусматривать анализ системы CRISPR-Cas9, полученной на основании указанной (указанных) синтезированной (синтезированных) выбранной (выбранных) структуры (структур), например, в отношении связывания или выполнения требуемой функции.

Выводная информация в вышеупомянутые способах может предусматривать передачу данных, например, передачу информации через телекоммуникацию, телефон, видеоконференцию, средства массовой информации, например, презентацию, такую как компьютерная презентация (например, POWERPOINT), Интернет, электронную почту, сообщение с помощью документов, таких как документ компьютерной программы (например, WORD) и т.п. В соответствии с этим, настоящее изобретение также охватывает машиночитаемые носители, содержащие данные по атомным координатам в соответствии с кристаллической структурой, приведенной в данном документе, причем указанные данные определяют трехмерную структуру CRISPR-Cas9 или по меньшей мере одного его субдомена, или данные по структурному фактору для CRISPR-Cas9, причем указанные данные по структурному фактору можно получить на основании данных по атомным координатам из кристаллической структуры, приведенной в данном документе. Машиночитаемые носители также могут содержать любые данные из вышеупомянутых способов. Настоящее изобретение дополнительно охватывает способы с использованием компьютерной системы для получения или выполнения рациональной разработки, как в вышеупомянутых способах, предусматривающей либо данные по атомным координатам в соответствии с кристаллической структурой, приведенной в данном документе, причем указанные данные определяют трехмерную структуру CRISPR-Cas9 или по меньшей мере одного его субдомена, либо данные по структурному фактору для CRISPR-Cas9, причем указанные данные по структурному фактору можно получить на основании данных по атомным координатам из кристаллической структуры, приведенной в данном документе. Настоящее изобретение дополнительно охватывает способ ведения коммерческой деятельности, включающий обеспечение пользователя компьютерной системой, или носителем, или данными трехмерной структуры CRISPR-Cas9, или по меньшей мере одного ее субдомена, или структурного фактора для CRISPR-Cas9, при этом указанная структура изложена в виде данных по атомным координатам из кристаллической структуры, приведенной в данном документе, или указанный структурный фактор, можно получить на основании таких данных, или электронным носителем, приведенным в данном документе, или передачей данных, приведенной в данном документе.

"Сайт связывания" или "активный сайт" предусматривает, или состоит, по сути, из, или состоит из сайта (такого как атом, функциональная группа аминокислотного остатка или множество таких атомов и/или групп) в полости или участке связывания, который может связываться с соединением, таким как молекула нуклеиновой кислоты, которое вовлекается в связывание.

Под "подгонкой" подразумевают определение с помощью автоматизированных или полуавтоматизированных средств взаимодействий между одним или несколькими атомами кандидатной молекулы и по меньшей мере одним атомом структуры по настоящему изобретению и вычисление степени стабильности таких взаимодействий. Взаимодействия включают притяжение и отталкивание, обусловленное зарядом, стерическими аспектами и т.п. Далее описаны различные компьютерные способы подгонки.

Под "среднеквадратичным (или rms) отклонением" подразумевается квадратный корень из арифметического среднего квадратов отклонений от среднего.

Под "компьютерной системой" подразумевают аппаратные программные средства, программные средства и средства хранения данных, применяемые для анализа данных по атомным координатам. Минимальные аппаратные средства компьютерных систем по настоящему изобретению, как правило, содержат центральный процессор (CPU), устройства ввода, устройства вывода и средства хранения данных. Для визуализации данных по структуре желательно обеспечить дисплей или монитор. Средствами хранения данных может быть RAM или средства для доступа к машиночитаемым носителям по настоящему изобретению. Примерами таких систем являются компьютер и планшетные устройства под управлением операционных систем Unix, Windows или Apple.

Под "машиночитаемыми носителями" подразумевают любой носитель или носители, которые могут быть считаны и доступ к которым может быть получен непосредственно или опосредованно с помощью компьютера, например, так, что носители подходят для применения в вышеупомянутой компьютерной системе. Такие носители включают без ограничения магнитные запоминающие устройства, такие как дискеты, запоминающее устройство в виде жесткого диска и магнитная лента; оптические запоминающие устройства, такие как оптические диски или CD-ROM; электрические запоминающие устройства, такие как RAM и ROM; флеш-накопители; устройства с облачным хранилищем данных и гибриды этих категорий, такие как магнитные/оптические запоминающие устройства.

Настоящее изобретение охватывает применение защищенных направляющих, описанных в данном документе выше, в оптимизированных функциональных ферментных системах CRISPR-Cas, описанных в данном документе.

Образование RISC посредством конструирования направляющих

В некоторых вариантах осуществления направляющая может быть защищенной направляющей (например, pgRNA) или сопровождаемой направляющей (например, esgRNA), как описано в данном документе. В некоторых вариантах осуществления обе из них используются в RISC. RISC представляет собой ключевой компонент RNAi. RISC (индуцируемый РНК комплекс сайленсинга) представляет собой мультибелковый, точнее говоря рибонуклеопротеиновый, комплекс, в который входит одна нить фрагмента двухнитевой РНК (dsRNA), такой как малая интерферирующая РНК (siRNA) или микроРНК (miRNA), которая действует в качестве матрицы для RISC для распознавания комплементарного траснкрипта матричной РНК (мРНК). мРНК при этом расщепляется под действием одного из компонентов RISC.

В связи с этим, образование RISC является преимущественным в некоторых вариантах осуществления. Направляющие РНК в соответствии с различными аспектами настоящего изобретения, включая без ограничения защищенные и/или сопровождаемые направляющие РНК, можно адаптировать для включения РНК-нуклеотидов, которые содействуют образованию RISC, например, в комбинации с siRNA или miRNA, которые могут обеспечиваться или могут, например, уже экспрессироваться в клетке. Это может быть применимо, например, в качестве самоинактивирующейся системы для удаления или разрушения направляющей.

При этом направляющая РНК может содержать последовательность, комплементарную целевой miRNA или siRNA, которая может присутствовать в клетке или может не присутствовать в ней. Таким образом, только когда присутствует miRNA или siRNA, например, в результате экспрессии (в клетке или посредством вмешательства человека), наблюдается связывание последовательности РНК с miRNA или siRNA, что затем приводит к расщеплению направляющей РНК под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке. Следовательно, в некоторых вариантах осуществления направляющая РНК содержит последовательность РНК, комплементарную целевой miRNA или siRNA, и связывание последовательности направляющей РНК с целевой miRNA или siRNA приводит к расщеплению направляющей РНК под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке.

Это дополнительно объяснено ниже с конкретной ссылкой как на защищенные, так и на сопровождаемые направляющие.

Образование RISC с применением защищенных направляющих

Например, защищенная направляющая может быть описана в следующем аспекте: сконструированная, не встречающаяся в природе композиция, содержащая систему CRISPR на основе (Cas), ассоциированного с короткими палиндромными повторами, регулярно расположенными группами (CRISPR) (CRISPR-Cas), с полинуклеотидной последовательностью, защищенной направляющей РНК (pgRNA), содержащей (a) защитную последовательность, (b) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (c) парную tracr-последовательность и (d) tracr-последовательность, где (a), (b), (c) и (d) расположены в ориентации 5' - 3', где защитная последовательность содержит два или более нуклеотидов, которые некомплементарны целевой последовательности, где, будучи транскрибированной, парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, где комплекс CRISPR содержит белок Cas9 II типа в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, и где полинуклеотидная последовательность одной или нескольких из направляющей, tracr- и парной tracr-последовательности модифицирована.

В одном аспекте данную систему с защищенной направляющей применяют для защиты с помощью вторичных структур 5'-концевых удлинений sgRNA. Например, заявители удлиняют sgRNA, вследствие чего вводится сайт связывания miRNA, чтобы сделать sgRNA активной только после обработки и разрезания сайта связывания miRNA под действием аппарата комплекса RISC. Это не будет возможным без защиты с помощью вторичных структур, поскольку экзонуклеазная обработка будет начинаться с 5'-конца и обеспечивать обрезание в направлении sgRNA. Путем добавления небольшой петли с вторичной структурой в направлении 5' от добавленного сайта miRNA, miRNA может быть защищена от обрезания под действием экзонуклеаз.

Образование RISC с применением сопровождаемых направляющих

В другом примере можно описать сопровождаемую направляющую. В частности, предусмотрены esgRNA, индуцируемые miRNA. В этом случае аптамерная последовательность сопровождаемой РНК комплементарна целевой miRNA, так что, если в клетке присутствует целевая miRNA, включенная в индуцируемый РНК комплекс сайленсинга (RISC), наблюдается связывание аптамерной последовательности сопровождаемой РНК с целевой miRNA, что приводит к расщеплению esgRNA под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке.

В альтернативных вариантах осуществления на 5'-конце esgRNA может обеспечиваться целый ряд первичных и вторичных структур, разработанных таким образом, что комплекс RISC может получить доступ к сайту связывания miRNA. esgRNA может иметь первую и вторую линкерную последовательности, расположенные в направлении 5' от защитной последовательности. В альтернативных вариантах осуществления длина каждого из линкеров 1 и 2, например, может независимо составлять 0, 1, 2, 3, или 4 нуклеотида, при этом длина защитной последовательности составляет 0, 1 или 2 нуклеотида.

В иллюстративном варианте осуществления индукцию нацеливания на esgRNA можно проиллюстрировать с применением miR-122 в системе клеток HEK.293, в которых miR-122 нативно не экспрессируется. В отсутствие экзогенной miR-122 защищенные esgRNA не опосредуют нацеленную нуклеазную активность в отношении EMX1.3. При добавлении экзогенной miR-122 (100 нг/лунка) наблюдали нацеленное разрезание EMX1.3 (в виде отчетливых продуктов расщепления, видимых как электрофоретические варианты на гелях). Это демонстрирует, что экспрессируемые на высоком уровне эндогенные miRNA можно использовать в системах, которые обеспечивают индуцируемые генетическим образом sgRNA. Любую miRNA можно применять вместо miRNA122, при этом соответствующую последовательность легко определить.

Например, sgRNA можно связать с аптамерной последовательностью "сопровождаемой" РНК, комплементарной эндогенной целевой miRNA. Целевая miRNA может формировать индуцируемый РНК комплекс сайленсинга (RISC) в клетке. Если в клетке присутствует целевая miRNA, происходит связывание аптамерной последовательности сопровождаемой РНК с целевой miRNA, что приводит к расщеплению esgRNA под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке. Расщепление сопровождаемой последовательности высвобождает активную sgRNA.

Например, защищенную направляющую можно описать в следующем аспекте: не встречающаяся в природе или сконструированная композиция, содержащая сопровождаемую одиночную направляющую РНК (esgRNA) CRISPR-Cas9, содержащую:

направляющую последовательность РНК, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; и

аптамерную последовательность сопровождаемой РНК,

где аптамерная последовательность сопровождаемой РНК предусматривает аффинность связывания в отношении лиганда аптамера на клетке или в ней, или аптамерная последовательность сопровождаемой РНК реагирует на локализованной эффектор аптамера на клетке или в ней,

где присутствие лиганда или эффектора аптамера на клетке или в ней является ограниченным во временном или пространственном отношении.

Сопровождающая аптамерная последовательность РНК может быть комплементарна целевой miRNA, которая может присутствовать в клетке или может не присутствовать в ней, так что, только когда целевая miRNA присутствует, наблюдается связывание сопровождающей аптамерной последовательности РНК с целевой miRNA, что приводит к расщеплению esgRNA с помощью индуцируемого РНК комплекса сайленсинга (RISC) в клетке. Следовательно, в некоторых вариантах осуществления аптамерная последовательность сопровождаемой РНК комплементарна целевой miRNA, а связывание аптамерной последовательности сопровождаемой РНК с целевой miRNA приводит к расщеплению esgRNA под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке.

В соответствии с настоящим изобретением нуклеотидная последовательность, кодирующая по меньшей мере одно из указанной направляющей РНК или белка Cas, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена, в результате чего экспрессия по меньшей мере одного компонента системы CRISPR-Cas управляется промотором представляющего интерес гена. Подразумевается, что "функционально связанный" означает, что нуклеотидная последовательность, кодирующая направляющую РНК и/или Cas, связана с регуляторным (регуляторными) элементом (элементами) таким способом, который обеспечивает возможность экспрессии нуклеотидной последовательности, как также указано в других разделах данного документа. Термин "регуляторные элементы" также описан в других разделах данного документа. В соответствии с настоящим изобретением регуляторный элемент предусматривает промотор представляющего интерес гена, как, например, предпочтительно промотор представляющего интерес эндогенного гена. В определенных вариантах осуществления промотор находится в своем эндогенном положении в геноме. В таких вариантах осуществления нуклеиновая кислота, кодирующая CRISPR и/или Cas, находится под транскрипционным контролем промотора представляющего интерес гена в своем нативном положении в геноме. В других определенных вариантах осуществления промотор обеспечивается на (отдельной) молекуле нуклеиновой кислоты, такой как вектор или плазмида, или другой внехромосомной нуклеиновой кислоте, т.е. промотор не обеспечивается в своем нативном положении в геноме. В определенных вариантах осуществления промотор интегрирован в геном в ненативном положении в геноме.

В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена. В определенных вариантах осуществления нуклеиновая кислота, кодирующая Cas, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена. В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена, и нуклеиновая кислота, кодирующая Cas, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена. В последнем случае промотор, управляющий экспрессией направляющей РНК и Cas, может быть таким же, или может отличаться. В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК и/или Cas, интегрирована в геном. В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК и/или Cas, является внехромосомной или эписомной. Нуклеиновая кислота, кодирующая направляющую РНК, и нуклеиновая кислота, кодирующая Cas, могут располагаться на одной и той же или различных молекулах нуклеиновой кислоты.

Выбранные последовательности ДНК, на которые нацеливается (нацеливаются) направляющая (направляющие) РНК в соответствии с настоящим изобретением, могут представлять собой эндогенные последовательности ДНК или экзогенные последовательности ДНК. Выбранные последовательности ДНК, такие как экзогенные последовательности ДНК, на которые нацеливается (нацеливаются) направляющая (направляющие) РНК в соответствии с настоящим изобретением, могут быть интегрированы в геном или могут быть внехромосомными (например, обеспечиваться в плазмиде или векторе). В определенных вариантах осуществления способы, описываемые в данном документе, включают введение в клетку вектора или плазмиды с помощью средств, известных их уровня техники, как описано в других разделах данного документа, причем указанный вектор или плазмида содержит указанную выбранную последовательность ДНК, а указанный способ включает обнаружение модификации указанной выбранной последовательности ДНК в указанном векторе. Будет понятно, что указанный вектор или плазмида или по меньшей мере выбранная последовательность ДНК, содержащаяся в них, могут интегрироваться в геном, как, например, с помощью случайной интеграции или путем гомологичной рекомбинации. Если последовательность выбранной целевой ДНК представляет собой эндогенную последовательность, предпочтительно, чтобы последовательность выбирали таким образом, чтобы модификация не воздействовала на (нормальное) функционирование клетки или оказывала минимальное воздействие. Специалист в данной области легко идентифицирует такие последовательности с помощью традиционного анализа или экспериментов. В любом случае предпочтительно, чтобы такая последовательность выбранной эндогенной целевой ДНК не располагалась в кодирующей последовательности или ORF гена и/или не располагалась в регуляторных последовательностях гена (таких как промоторы, энхансеры, сайленсеры и т.д.).

Как описано в других разделах данного документа, последовательность выбранной целевой ДНК модифицирована под действием функционального комплекса CRISPR (т.е. направляющая РНК находится в комплексе с белком Cas, где направляющая РНК содержит направляющую последовательность, парную tracr-последовательность и tracr-последовательность в ориентации 5' - 3', где tracr-последовательность может располагаться на той же молекуле нуклеиновой кислоты, что и направляющая последовательность и парная tracr-последовательность, или может не располагаться). Используемый в данном документе термин "модифицированная", по сути, соответствует термину "мутированная", т.е. последовательность нуклеиновой кислоты последовательности целевой ДНК изменена, как описано в других разделах данного документа, например, содержит точечные мутации, делеции, замены или вставки одного или нескольких нуклеотидов.

Однако, как описано в других разделах данного документа, также будет очевидно, что в определенных вариантах осуществления выражение "модифицированный" соответствует изменениям целевых локусов, таким как активация или репрессия транскрипции гена, метилирование или деметилирование сайтов CpG и т.п., для которых могут не требоваться точечные мутации, делеции, замены или вставки одного или нескольких нуклеотидов. Более того, как описано в других разделах данного документа, также будет очевидно, что ссылка на фермент CRISPR-Cas как "изменяющий" или "модифицирующий" один или несколько целевых полинуклеотидных локусов охватывает прямое изменение или модификацию, например, посредством каталитической активности фермента самого по себе, но также непрямое изменение или модификацию, например, посредством каталитической активности, ассоциированной с ферментом CRISPR-Cas, как, например, таковой гетерологичного функционального домена, например, домена активации транскрипции. Кроме того, как будет понятно, подразумевается, что один или несколько целевых полинуклеотидных локусов, которые "изменены" или "модифицированы" под действием фермента CRISPR-Cas, могут содержаться в полинуклеотидной последовательности, комплементарной части направляющей РНК, представляющей собой направляющую последовательность, или вблизи нее, например, в вариантах осуществления, где изменение или модификация осуществляются с помощью каталитической активности фермента CRISPR-Cas самого по себе, например, расщепление ДНК с помощью нуклеазной активности фермента CRISPR-Cas. Однако также охватываются варианты осуществления, где один или несколько целевых локусов, которые необходимо "изменить" или "модифицировать", находятся в определенном положении, отличном от последовательности, комплементарной части направляющей РНК, представляющей собой направляющую последовательность, например, в вариантах осуществления, где изменение или модификация осуществляются посредством гетерологичного функционального домена, ассоциированного с ферментом CRISPR-Cas, например, активация или репрессия транскрипции гена. В связи с этим "изменение" или "модификация" (или аналогичные термины) целевого локуса означает, что это обеспечивается посредством прямого или непрямого действия фермента CRISPR-Cas, и более того, "целевой локус", который необходимо изменить или модифицировать, и "целевая последовательность", которая комплементарна части направляющей РНК, представляющей собой направляющую последовательность, могут быть одинаковыми или могут не быть одинаковыми.

В определенных вариантах осуществления в способах в соответствии с настоящим изобретением, описываемых в данном документе, система CRISPR-Cas является мультиплексной, т.е. могут обеспечиваться множественные различные направляющие РНК. Каждая направляющая РНК может нацеливаться (т.е. гибридизироваться) с отличающейся выбранной ДНК-мишенью. Экспрессия различных направляющих РНК может управляться промоторами различных представляющих интерес генов. В соответствии с этим, в определенных вариантах осуществления способы по настоящему изобретению, описываемые в данном документе, представляют собой способы определения экспрессии более чем одного, как, например, по меньшей мере двух представляющих интерес генов в клетке, включающие обеспечение клетки, содержащей систему CRISPR-Cas, причем указанная система CRISPR-Cas содержит более одной, как, например, по меньшей мере две направляющие РНК, которые нацеливаются на отличающуюся выбранную последовательность ДНК, а белок Cas способен модифицировать выбранную последовательность ДНК; при этом каждая направляющая РНК функционально связана в клетке с регуляторным элементом, предусматривающим промотор отличающегося представляющего интерес гена; и определение экспрессии указанные представляющих интерес генов исходя из обнаружения модификации указанных соответствующих выбранных последовательностей ДНК. В определенных вариантах осуществления более одной отличающейся направляющей РНК могут быть функционально связаны в клетке с регуляторным элементом, предусматривающим промотор, того же представляющего интерес гена. Разные направляющие РНК могут обеспечиваться на разных молекулах нуклеиновой кислоты или на одной и той же молекуле нуклеиновой кислоты. Соответствующие направляющие РНК можно разрабатывать таким образом, что только модификация первой выбранной целевой ДНК создает или разрушает вторую выбранную целевую ДНК.

В определенных вариантах осуществления один или несколько компонентов системы CRISPR-Cas могут экспрессироваться в клетке в зависимости от условий (например, тканеспецифичная или специфичная к типу клеток экспрессия) и/или индуцируемым способом (например, химически индуцируемая экспрессия). Системы с индуцируемой зависимой от условий экспрессией описаны в других разделах данного документа. В конкретных вариантах осуществления одна или несколько направляющих РНК могут экспрессироваться в клетке в зависимости от условий и/или индуцируемым способом. В конкретных предпочтительных вариантах осуществления Cas может экспрессироваться в клетке в зависимости от условий и/или индуцируемым способом.

Используемый в данном документе термин "нацеливание" выбранной последовательности ДНК означает, что направляющая РНК способна гибридизироваться с выбранной последовательностью ДНК. Как используется в данном документе, "гибридизация" или "осуществление гибридизации" обозначает реакцию, при которой один или несколько полинуклеотидов реагируют с образованием комплекса, который стабилизируется посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или посредством любого другого специфичного к последовательности способа. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию более масштабном процессе, такую как начальная стадия PGR или расщепление полинуклеотида под действием фермента. Последовательность, способную к гибридизации с данной последовательностью, называют "комплементарной последовательностью" для данной последовательности.

Используемое в данном документе выражение "экспрессия" или "осуществление экспрессии" означает процесс, при котором полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или процесс, посредством которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг мРНК в эукариотической клетке. Как используется в данном документе, "экспрессия" гена или нуклеиновой кислоты охватывает не только экспрессию генов в клетках, но также транскрипцию и трансляцию нуклеиновой (нуклеиновых) кислоты (кислот) в системах клонирования и в любом другом контексте.

Термины "полипептид", "пептид" и "белок" используются в данном документе взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Термины также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, как, например, соединением с компонентом для мечения. Используемый в данном документе термин "аминокислота" включает природные и/или отличные от природных или синтетические аминокислоты, в том числе глицин и как D-, так и I-оптические изомеры, и аналоги аминокислот, и пептидомиметики.

Термины "субъект", "индивидуум" и "пациент" используются в данном документе взаимозаменяемо для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают без ограничения мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro.

В определенных вариантах осуществления способы и клетки в соответствии с настоящим изобретением, описываемые в данном документе, можно применять в способах скрининга терапевтических средств и/или в диагностических способах. Кандидатные терапевтические средства могут характеризоваться различным влиянием на временные профили экспрессии, которые могут регистрироваться в соответствии со способами, описываемыми в данном документе.

Термины "терапевтическое средство", "оказывающее терапевтический эффект средство" или "средство для лечения" используются взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает возможность осуществления диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.

Как используется в данном документе, "лечение", или "осуществление лечения", или "временное ослабление", или "облегчение" используются взаимозаменяемо. Эти термины обозначают подход для получения благоприятных или требуемых результатов, в том числе без ограничения терапевтического эффекта и/или профилактического эффекта. Под терапевтическим эффектом понимают любое терапевтически значимое улучшение или воздействие в отношении одного или нескольких заболеваний, состояний или симптомов, лечение которых осуществляют. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.

Используемые в данном документе термины "химерная РНК", "химерная направляющая РНК", "направляющая РНК", "одиночная направляющая РНК" и "синтетическая направляющая РНК" обозначают полинуклеотидную последовательность, содержащую направляющую последовательность, tracr-последовательность и парную tracr-последовательность. Термин "направляющая последовательность" обозначает последовательность длиной приблизительно 20 п.о. в пределах направляющей РНК, которая определяет целевой сайт, и его можно использовать взаимозаменяемо с терминами "направляющая" или "спейсер". Термин "парная tracr-последовательность" также можно использовать взаимозаменяемо с термином "прямой (прямые) повтор (повторы)". Направляющая последовательность, tracr- и парная tracr-последовательность могут обеспечиваться на одной молекуле нуклеиновой кислоты. Альтернативно направляющая и парная tracr-последовательность могут обеспечиваться на одной молекуле нуклеиновой кислоты, тогда как tracr-последовательность обеспечивается на отдельной молекуле нуклеиновой кислоты.

В целом, система CRISPR-Cas или CRISPR представляет собой применяемую в вышеупомянутых документах, таких как WO 2014/093622 (PCT/US2013/074667), и обозначает в совокупности транскрипты и другие элементы, вовлеченные в экспрессию или управление активностью CRISPR-ассоциированных ("Cas") генов, включая последовательности, кодирующие ген Cas, tracr- (транс-активирующую CRISPR) последовательность (например, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую "прямой повтор" и tracrRNA-процессированный частичный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также обозначаемую как "спейсер" в контексте эндогенной системы CRISPR), или "РНК", в смысле термина, используемого в данном документе (например, РНК для направления Cas, такого как Cas9, например, РНК CRISPR и трансактивирующая (tracr) РНК или одиночная направляющая РНК (sgRNA) (химерная РНК)), или другие последовательности и транскрипты из локуса CRISPR. В целом, система CRISPR характеризуется элементами, которые содействуют образованию комплекса CRISPR в сайте целевой последовательности (также называемой протоспейсер в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR "целевая последовательность" обозначает последовательность, относительно которой разрабатывается направляющая последовательность таким образом, чтобы обладать комплементарностью, при этом гибридизация между целевой последовательностью и направляющей последовательностью содействует образованию комплекса CRISPR. Целевая последовательность может содержать любой полинуклеотид, как, например, полинуклеотиды ДНК или РНК. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления прямые повторы можно идентифицировать in silico посредством поиска повторяющихся мотивов, которые соответствуют какому-либо или всем из следующих критериев: 1. находятся в окне размером 2 т.о. в геномной последовательности, фланкирующей локус CRISPR II типа; 2. охватывают от 20 до 50 п.о. и 3. чередуются с фрагментами из 20-50 п.о. В некоторых вариантах осуществления могут применяться 2 из этих критериев, например, 1 и 2, 2 и 3 или 1 и 3. В некоторых вариантах осуществления могут применяться все 3 критерия.

В вариантах осуществления настоящего изобретения термины направляющая последовательность и направляющая РНК, т.е. РНК, способная направлять Cas на целевой локус генома, используются взаимозаменяемо, как в вышеупомянутых процитированных документах, таких как WO 2014/093622 (PCT/US2013/074667). В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с применением подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с применением любого подходящего алгоритма для выравнивания последовательностей, к неограничивающим примерам которого относится алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (например, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; доступный на сайте www.novocraft.com), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на сайте soap.genomics.org.cn) и Maq (доступный на сайте maq.sourceforge.net). В некоторых вариантах осуществления длина направляющей последовательности составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления длина направляющей последовательности составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов. Предпочтительно длина направляющей последовательности составляет 10-30 нуклеотидов. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, подлежащая тестированию, могут быть обеспечены в клетке-хозяине, имеющей соответствующую целевую последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой полинуклеотидной последовательности можно определять в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области.

Направляющая последовательность, т.е. РНК, способная направлять Cas в целевой локус генома, может быть выбрана так, чтобы нацеливаться на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки. Иллюстративные целевые последовательности включают последовательности, которые являются уникальными в целевом геноме. Например, для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGG, где NNNNNNNNNNNNXGG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGG, где NNNNNNNNNNNXGG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. Для Cas9 CRISPR1 S. thermophilus уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; а W представляет собой A или T) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 CRISPR1 S. thermophilus в виде MMMMMMMMMNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; а W представляет собой A или T) характеризуется единичным появлением в геноме. Для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGGXG, где NNNNNNNNNNNNXGGXG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGGXG, где NNNNNNNNNNNXGGXG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. В каждой из этих последовательностей "M" может представлять собой A, G, T или C и не должен учитываться при идентификации последовательности как уникальной. В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в пределах направляющей последовательности. В некоторых вариантах осуществления приблизительно или менее чем приблизительно 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% или меньше нуклеотидов направляющей последовательности участвуют в самокомплементарном образовании пар оснований при оптимальном сворачивании. Оптимальное сворачивание можно определить с помощью любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного способа (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).

В целом, парная tracr-последовательность включает любую последовательность, которая характеризуется достаточной комплементарностью с tracr-последовательностью для содействия одному или нескольким из следующего: (1) вырезания направляющей последовательности, фланкированной парными tracr-последовательностями, в клетке, содержащей соответствующую tracr-последовательность; и (2) образования комплекса CRISPR в целевой последовательности, где комплекс CRISPR содержит парную tracr-последовательность, которая гибридизирована с tracr-последовательностью. В целом, степень комплементарности указана с привязкой к оптимальному выравниванию парной tracr-последовательности и tracr-последовательности по всей длине более короткой из двух последовательностей. Оптимальное выравнивание можно определить с помощью любого подходящего алгоритма выравнивания и можно дополнительно учитывать вторичные структуры, как, например, участок самокомплементарности в пределах либо tracr-последовательности, либо парной tracr-последовательности. В некоторых вариантах осуществления степень комплементарности между tracr-последовательностью и парной tracr-последовательность по всей длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или больше. В некоторых вариантах осуществления длина tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов. В некоторых вариантах осуществления tracr-последовательность и парная tracr-последовательность содержатся в одном транскрипте, так что при гибридизация между ними двумя образуется транскрипт со вторичной структурой, такой как "шпилька". В одном варианте осуществления настоящего изобретения транскрипт или транскрибированная полинуклеотидная последовательность имеют по меньшей мере две или более "шпилек". В предпочтительных вариантах осуществления транскрипт имеет две, три, четыре или пять "шпилек". В дополнительном варианте осуществления настоящего изобретения транскрипт имеет не более пяти "шпилек". В шпилечной структуре часть последовательности в 5' направлении относительно концевого "N" и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3' направлении относительно петли соответствует tracr-последовательности. Дополнительными неограничивающими примерами отдельных полинуклеотидов, составляющих направляющую последовательность, парную tracr-последовательность и tracr-последовательность, являются следующие (перечисленные от 5' к 3'), где "N" представляет собой основание направляющей последовательности, причем первый блок букв нижнего регистра представляет собой парную tracr-последовательность, а второй блок букв нижнего регистра представляет собой tracr-последовательность, а конечная поли-T-последовательность представляет собой терминатор транскрипции: (1) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (SEQ ID NO: X); (2) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (SEQ ID NO: X) (3) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT; (SEQ ID NO: X) (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT; (SEQ ID NO: X) (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT; и (SEQ ID NO: X) (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT (SEQ ID NO: X). В некоторых вариантах осуществления последовательности (1) - (3) используют в комбинации с Cas9 из CRISPR1 S. thermophilus. В некоторых вариантах осуществления последовательности (4) - (6) используют в комбинации с Cas9 из S. pyogenes. В некоторых вариантах осуществления tracr-последовательность является транскриптом, отдельным от транскрипта, содержащего парную tracr-последовательность.

В некоторых вариантах осуществления кандидатную tracrRNA можно впоследствии спрогнозировать с использованием последовательностей, которые соответствуют любому или всем из следующих критериев: 1. гомология последовательности c прямыми повторами (поиск мотива с помощью программного обеспечения Geneious с несовпадениями до 18 п. о.); 2. присутствие прогнозируемого Rho-независимого терминатора транскрипции в направлении транскрипции; и 3. устойчивая вторичная структура со "шпилькой" между tracrRNA и прямым повтором. В некоторых вариантах осуществления могут применяться 2 из этих критериев, например, 1 и 2, 2 и 3 или 1 и 3. В некоторых вариантах осуществления могут применяться все 3 критерия.

В некоторых вариантах осуществления конструкции химерных синтетических направляющих РНК (sgRNA) могут включать по меньшей мере 12 п.о. дуплексной структуры между прямым повтором и tracrRNA.

РНК для направления Cas, такого как Cas9, могут предусматривать РНК CRISPR и трансактивирующую (tracr) РНК. Парная tracr- и tracr-последовательности могут быть соединены с образованием трансактивирующей (tracr) последовательности. Парную tracr- и tracr-последовательности необязательно можно разрабатывать так, чтобы они формировали одиночную направляющую РНК (sgRNA). Действительно, преимущественным является то, что РНК для направления Cas могут предусматривать химерную одиночную направляющую РНК (sgRNA). Tracr-последовательность и парная tracr-последовательность по всей длине более короткой из двух при оптимальном выравнивании могут быть комплементарны на приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или больше. Длина tracr-последовательности может составлять приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов.

В классических системах CRISPR-Cas степень комплементарности между направляющей и ее соответствующей целевой последовательностью может составлять приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или 100%; причем длина направляющей РНК или sgRNA может составлять приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов; или длина направляющей РНК или sgRNA может составлять менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов; и преимущественно длина tracrRNA составляет 30 или 50 нуклеотидов. Однако аспект настоящего изобретения направлен на снижение нецелевых взаимодействий, например, снижение взаимодействия направляющей с целевой последовательностью, характеризующейся низкой комплементарностью. Действительно, в примерах показано, что настоящее изобретение предусматривает мутации, которые приводят к тому, что система CRISPR-Cas способна распознавать целевую и нецелевую последовательности, которые характеризуются от более чем 80% до приблизительно 95% комплементарностью, например, 83%-84%, или 88-89%, или 94-95% комплементарностью (к примеру, различать целевую последовательность длиной 18 нуклеотидов от нецелевой последовательности длиной 18 нуклеотидов с 1, 2 или 3 несовпадениями). В соответствии с этим, в контексте настоящего изобретения степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью составляет более чем 94,5%, или 95%, или 95,5%, или 96%, или 96,5%, или 97%, или 97,5%, или 98%, или 98,5%, или 99%, или 99,5%, или 99,9%, или 100%. Нецелевой локус характеризуется менее чем 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5%, или 94%, или 93%, или 92%, или 91%, или 90%, или 89%, или 88%, или 87%, или 86%, или 85%, или 84%, или 83%, или 82%, или 81%, или 80% комплементарностью между его последовательностью и направляющей, при этом преимущественно, чтобы нецелевой локус характеризовался 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5% комплементарностью между его последовательностью и направляющей.

В особенно предпочтительных вариантах осуществления в соответствии с настоящим изобретением направляющая РНК (способная направлять Cas на целевой локус) может содержать (1) направляющую последовательность, способную гибридизироваться с целевым локусом генома в эукариотической клетке; (2) tracr-последовательность; и (3) парную tracr-последовательность. Все из (1)-(3) могут находиться в одиночной РНК, т.е. sgRNA (расположенной в ориентации 5' - 3'), или tracrRNA может представлять собой РНК, отличную от РНК, содержащей направляющую и tracr-последовательность. Tracr-последовательность гибридизируется c парной tracr-последовательностью и направляет комплекс CRISPR/Cas к целевой последовательности.

Способы в соответствии с настоящим изобретением, описываемые в данном документе, охватывают индуцирование одной или нескольких мутаций в эукариотической клетке (in vitro, т.е. в выделенной эукариотической клетке), обсуждаемое в данном документе, предусматривающее доставку в клетку вектора, обсуждаемого в данном документе. Мутация(мутации) может(могут) включать введение, делецию или замену одного или нескольких нуклеотидов в каждой целевой последовательности клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1-75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации включают введение, делецию или замену 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 40, 45, 50, 75, 100, 200, 300, 400 или 500 нуклеотидов в каждой целевой последовательности указанной клетки (клеток) с помощью направляющей (направляющих) РНК или sgRNA.

Для сведения к минимуму токсичности и нецелевого эффекта будет важно контролировать концентрацию доставляемых мРНК Cas и направляющей РНК. Оптимальные концентрации мРНК Cas и направляющей РНК можно определить путем тестирования различных концентраций на клеточной модели или модели отличного от человека животного-эукариотического организма и применения глубокого секвенирования для анализа степени модификации в потенциальных нецелевых локусах генома. Альтернативно для сведения к минимуму уровня токсичности и нецелевого эффекта мРНК никазы Cas (например, Cas9 S. pyogenes с мутацией D10A) можно доставлять с парой направляющих РНК, нацеливающихся на представляющий интерес сайт. Направляющие последовательности и стратегии сведения к минимуму токсичности и нецелевых эффектов могут быть такими, как в WO 2014/093622 (PCT/US2013/074667); или с помощью мутации, как указано в данном документе.

В некоторых вариантах осуществления систему CRISPR преимущественно получают из системы CRISPR II типа. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из определенного организма, содержащего эндогенную систему CRISPR, как, например, Streptococcus pyogenes. В предпочтительных вариантах осуществления настоящего изобретения система CRISPR представляет собой систему CRISPR II типа, а фермент Cas представляет собой Cas9, который катализирует расщепление ДНК. Неограничивающие примеры белков Cas включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известный как Csn1 и Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, их гомологи или их модифицированные версии. Предпочтительный фермент Cas может быть идентифицирован как Cas9, поскольку он может обозначать общий класс ферментов, обладающих гомологией с самой большой нуклеазой с множественными нуклеазными доменами из системы CRISPR II типа. В наиболее предпочтительном случае фермент Cas9 получен или происходит из SpCas9 или SaCas9. Следует иметь в виду, что SpCas9 или SaCas9 получены или происходят из Cas9 S. pyogenes или S. aureus. Под происходящим заявители подразумевают, что в основе происходящего фермента главным образом лежит фермент дикого типа в том смысле, что он характеризуется высокой степенью гомологии последовательности с этим ферментом, но он был некоторым образом подвергнут мутации (модифицирован), как описано в данном документе. Следует иметь в виду, что термины фермент Cas и CRISPR, как правило, используются в данном документе взаимозаменяемо, если не является очевидным иное. Фермент Cas может представлять собой, например, любой встречающийся в природе бактериальный Cas9, а также любые химерные формы, мутантные формы, гомологи или ортологи. Большинство вариантов нумераций остатков, используемых в данном документе, относятся к ферменту Cas9 из локуса CRISPR II типа Streptococcus pyogenes (альтернативно аннотированный как SpCas9 или spCas9). Однако следует понимать, что настоящее изобретение включает многие другие Cas9 из других видов микроорганизмов, например, ортологи SpCas9, или Cas9, полученные из микроорганизмов, кроме S. pyogenes, например, SaCas9, происходящий из S. aureus, St1Cas9, происходящий из S. thermophilus, и т.д. Специалист в данной области сможет определить подходящие соответствующие остатки в ферментах Cas9, отличных от SpCas9, путем сравнения релевантных аминокислотных последовательностей. Таким образом, если конкретное аминокислотное замещение обозначается с применением нумерации SpCas9, то, если из контекста не очевидно, что это не предназначено для применения в отношении других ферментов Cas9, причем подразумевается, что настоящее изобретение охватывает соответствующие модификации в других ферментах Cas9.

В некоторых вариантах осуществления немодифицированный Cas характеризуется активностью расщепления ДНК, подобно Cas9. В некоторых вариантах осуществления Cas управляет расщеплением одной или обеих нитей в определенном положении целевой последовательности, как, например, в пределах целевой последовательности и/или в пределах последовательности, комплементарной целевой последовательности. В некоторых вариантах осуществления Cas управляет расщеплением одной или обеих нитей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления вектор кодирует Cas, который является мутированным по сравнению с соответствующим ферментом дикого типа, так что мутированный Cas не обладает способностью расщеплять одну или обе нити целевого полинуклеотида, содержащего целевую последовательность. Например, замена аспартата на аланин (D10A) в каталитическом домене RuvC I Cas9 из S. pyogenes превращает Cas9 из нуклеазы, которая расщепляет обе нити, в никазу (расщепляет одну нить). Другие примеры мутаций, которые делают Cas9 никазой, включают без ограничения H840A, N854A и N863A. В качестве дополнительного примера два или более каталитических доменов Cas9 (RuvC I, RuvC II и RuvC III или домен HNH) можно подвергать мутациям с получением мутированного Cas9, у которого практически полностью отсутствует активность расщепления ДНК. В некоторых вариантах осуществления мутацию D10A объединяют с одной или несколькими из мутаций H840A, N854A или N863A с получением фермента Cas9, у которого практически полностью отсутствует активность расщепления ДНК. В некоторых вариантах осуществления считается, что у фермента Cas практически полностью отсутствует активность расщепления ДНК, если активность расщепления ДНК у мутированного фермента составляет не более чем приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше относительно активности расщепления ДНК у немутированной формы фермента; примером может служить случай, когда активность расщепления ДНК у мутированной формы отсутствует или несущественна по сравнению с немутированной формой. Таким образом, Cas может содержать одну или несколько мутаций и может применяться в качестве универсального ДНК-связывающего белка, слитого или не слитого с функциональным доменом. Мутации могут представлять собой мутации, введенные искусственным образом, или мутации приобретения или потери функции. Мутации могут включать без ограничения мутации в одном из каталитических доменов (например, D10 и H840) в каталитических доменах RuvC и HNH соответственно; или фермент CRISPR может содержать одну или несколько мутаций, выбранных из группы, состоящей из D10A, E762A, H840A, N854A, N863A или D986A, и/или одной или нескольких мутаций в домене RuvC1 или HNH Cas, или иметь иную мутацию, обсуждаемую в данном документе. В одном аспекте настоящего изобретения фермент Cas может быть слит с белком, например TAG, и/или индуцируемым/контролируемым доменом, таким как химически индуцируемый/контролируемый домен. В настоящем изобретении Cas может представлять собой химерные белки Cas, например, Cas, характеризующийся усиленной функцией ввиду того, что он является химерой. Химерные белки Cas могут представлять собой новые Cas, содержащие фрагменты из более чем одного встречающегося в природе Cas. Они могут содержать продукты слияния N-концевого (концевых) фрагмента (фрагментов) одного гомолога Cas9 с C-концевым (концевыми) фрагментом (фрагментами) другого гомолога Cas. Cas может доставляться в клетку в форме мРНК. Экспрессия Cas может находиться под контролем индуцируемого промотора. Если фермент не является SpCas9, мутации можно осуществлять по любому или всем остаткам, соответствующим положениям 10, 762, 840, 854, 863 и/или 986 SpCas9 (которые могут быть определены, например, с помощью стандартных инструментов сравнения последовательностей). В частности, любые или все из следующих мутаций являются предпочтительными для SpCas9: D10A, E762A, H840A, N854A, N863A и/или D986A; а также предусматривается консервативная замена любой из замещаемых аминокислот. То же самое (или консервативные замены по этим мутациям) также является предпочтительным в соответствующих положениях других Cas9. Особенно предпочтительными являются D10 и H840 в SpCas9. Однако в других Cas9 остатки, соответствующие D10 и H840 SpCas9, также являются предпочтительными. Очевидно, что цель настоящего изобретения заключается в том, чтобы не охватывать известные мутации. То есть, мутации, которые, как известно из уровня техники, приводят к тому, что Cas9 становится никазой или Cas9 становится "нефункциональной", например, характеризуется небольшой, например, 5% или менее чем 5%, например, менее чем 4%, 3%, 2% или 1%, нуклеазной активностью или ее отсутствием по сравнению с немутированным Cas9, как подразумевается, не входят в объем мутаций Cas9, которые снижают или исключают взаимодействие между направляющей и нецелевой молекулами нуклеиновой кислоты, при этом заявитель оставляет за собой право использовать оговорку для исключения такой известной мутации, обуславливающей образование "никазы" или "неработающего" Cas9. Действительно, фраза "в результате чего фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения) не подразумевает охват мутаций, которые обуславливают только образование никазы или неработающего Cas9, или известных мутаций Cas9. ОДНАКО, это не означает, что модификацию (модификации) или мутацию (мутации) по настоящему изобретению "в результате которых фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате которых фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения) нельзя комбинировать с мутациями, которые приводят к тому, что фермент является никазой или он является нефункциональным. Такой нефункциональный фермент может представлять собой улучшенное средство, связывающее молекулу нуклеиновой кислоты. И такая никаза может представлять собой улучшенную никазу. Например, изменение нейтральной (нейтральных) аминокислоты (аминокислот) в бороздке и/или возле нее, и/или других заряженных остатков в других определенных положениях в Cas9, которые находятся в непосредственной близости от нуклеиновой кислоты (например, ДНК, кДНК, РНК, sgRNA), на положительно заряженную (заряженные) аминокислоту(аминокислоты) может приводить к ситуации "в результате чего фермент в комплексе CRISPR характеризуется сниженной способность модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом", например, к большему числу разрезов. Поскольку это могут быть как усиленные целевые, так и нецелевые разрезы (сверхрежущий Cas9), применение такого фермента с тем, что известно из уровня техники как усеченная направляющая или усеченные sgRNA (см., например, Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs," Nature Biotechnology 32, 279-284 (2014) doi:10.1038/nbt.2808, получен 17 ноября 2013 года, принят 06 января 2014 года, опубликован онлайн 26 января 2014 года, иcправлен онлайн 29 января 2014 года), для обеспечения усиленной целевой активности без повышения числа нецелевых разрезов, или для получения сверхрежущих никаз, или для комбинирования с мутацией, которая обеспечивает нефункциональный Cas9 для сверхсвязывающего средства.

При осуществлении настоящего изобретения на практике можно применять ортологи SpCas9. Фермент Cas может быть идентифицирован как Cas9, поскольку он может обозначать общий класс ферментов, обладающих гомологией с самой большой нуклеазой с множественными нуклеазными доменами из системы CRISPR II типа. В наиболее предпочтительном случае фермент Cas9 получен или происходит из SpCas9 (Cas9 S. pyogenes) или SaCas9 (Cas9 S. aureus). "StCas9" относится к Cas9 дикого типа из S. thermophilus, при этом последовательность его белка представлена в базе данных SwissProt под номером доступа G3ECR1. Аналогично, Cas9 S. pyogenes или SpCas9 включен в SwissProt под номером доступа Q99ZW2. Под происходящим заявители подразумевают, что в основе происходящего фермента главным образом лежит фермент дикого типа в том смысле, что он характеризуется высокой степенью гомологии последовательности с этим ферментом, но он был некоторым образом подвергнут мутации (модифицирован), как описано в данном документе. Следует иметь в виду, что термины "Cas" и "фермент CRISPR" обычно используются в данном документе взаимозаменяемо, если не очевидно иное. Как упоминается выше, большинство вариантов нумераций остатков, используемых в данном документе, относятся к ферменту Cas9 из локуса CRISPR II типа Streptococcus pyogenes. Однако следует иметь в виду, что настоящее изобретение включает многие другие Cas9 из других видов микроорганизмов, как, например, SpCas9, SaCa9, St1Cas9 и т.д. Ферментативное действие Cas9, полученного из Streptococcus pyogenes, или любого близкородственного Cas9, приводит к образованию двухнитевых разрывов в последовательностях целевого сайта, которые гибридизируются с 20 нуклеотидами направляющей последовательности и которые содержат последовательность мотива, смежного с протоспейсером (PAM) (примеры включают NGG/NRG или PAM, который можно определить, как описано в данном документе) после 20 нуклеотидов целевой последовательности. Активность CRISPR, осуществляемая посредством Cas9, которая заключается в сайт-специфическом распознавании и расщеплении ДНК, определяется направляющей последовательностью, tracr-последовательностью, которая частично гибридизируется с направляющей последовательностью и последовательностью PAM. Не вдаваясь в теорию, полагают, что целевая последовательность должна быть ассоциирована с PAM (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Требования к точности и длине последовательности PAM отличаются в зависимости от применяемого фермента Cas, но PAM обычно представляют собой последовательности длиной 2-5 пар оснований, расположенных смежно с протоспейсером (то есть целевой последовательностью). В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент Cas в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизирована с tracr-последовательностью. Больше аспектов системы CRISPR описаны в Karginov and Hannon, The CRISPR system: small RNA-guided defense in bacteria and archaea, Mole Cell 2010, January 15; 37(1): 7. Локус CRISPR II типа происходит из Streptococcus pyogenes SF370, который содержит кластер из четырех генов Cas9, Cas1, Cas2 и Csn1, а также два элемента некодирующей РНК, tracrRNA и характерный массив повторяющихся последовательностей (прямых повторов), чередующихся с короткими фрагментами неповторяющихся последовательностей (спейсерами, приблизительно 30 п.о. каждый). В данной системе направленный двухнитевой разрыв (DSB) ДНК образуется в ходе четырех последовательных стадий. Во-первых, две некодирующие РНК, массив pre-crRNA и tracrRNA, транскрибируются с локуса CRISPR. Во-вторых, tracrRNA гибридизируется с прямыми повторами в pre-crRNA, которая затем процессируется в зрелые crRNA, содержащие отдельные спейсерные последовательности. В-третьих, комплекс зрелая crRNA:tracrRNA направляет Cas к ДНК-мишени, состоящей из протоспейсера и соответствующего PAM, посредством образования гетеродуплекса между спейсерным участком crRNA и протоспейсерной ДНК. И наконец, Cas опосредует расщепление целевой ДНК выше PAM с образованием DSB в пределах протоспейсера. Массив pre-crRNA, состоящий из одного спейсера, фланкированного двумя прямыми повторами (DR), также охватывается термином "парные tracr-последовательности". В определенных вариантах осуществления присутствие Cas может быть постоянным, или его присутствие можно индуцировать, или его присутствие зависит от условий, или его можно вводить или доставлять. Оптимизацию Cas можно применять для усиления функции или для разработки новых функций, при этом можно получать химерные белки Cas. Также Cas можно применять в качестве универсального ДНК-связывающего белка.

Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизированую с целевой последовательностью и находящуюся в комплексе с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. Не вдаваясь в теорию, полагают, что tracr-последовательность, которая может содержать всю или часть tracr-последовательности дикого типа или состоять из нее (например, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также формировать часть комплекса CRISPR, как, например, путем гибридизации по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью.

В настоящем изобретении термин "Cas" может означать "Cas9" или фермент CRISPR. В контексте настоящего изобретения Cas9, или Cas, или фермент CRISPR является мутированным или модифицированным, "в результате чего фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения); и при чтении настоящего описания подразумевается, что термины "Cas9", или "Cas", или "фермент CRISPR и т.д. включают мутированный или модифицированный Cas9, или Cas, или фермент CRISPR в соответствии с настоящим изобретением, т.e. "в результате этого фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения).

Оптимизация кодонов и использование кодонов для экспрессии белка Cas

Молекула нуклеиновой кислоты, кодирующая Cas, преимущественно является кодон-оптимизированной для Cas. В данном случае примером кодон-оптимизированной последовательности является последовательность, оптимизированная для экспрессии у эукариота, например, у людей (т.e. является оптимизированной для экспрессии у людей), или у другого эукариота, животного или млекопитающего, обсуждаемых в данном документе; см., например, кодон-оптимизированная последовательность SaCas9 для человека в WO 2014/093622 (PCT/US2013/074667). Хотя это является предпочтительным, следует иметь в виду, что возможны другие примеры и что известна оптимизация кодонов для вида-хозяина, отличного от человека, или оптимизация кодонов для конкретных органов. В некоторых вариантах осуществления кодирующая фермент последовательность, кодирующая Cas, является кодон-оптимизированной для экспрессии в определенных клетках, как, например, эукариотических клетках. Эукариотические клетки могут быть клетками определенного организма или полученными из него, как, например, клетками млекопитающего, в том числе без ограничения человека, или отличного от человека эукариота, или животного, или млекопитающего, обсуждаемых в данном документе, например, мыши, крысы, кролика, собаки, крупного рогатого скота или отличного от человека млекопитающего или примата. В некоторых вариантах осуществления могут исключаться способы модифицирования генетической идентичности зародышевой линии человека и/или способы модификации генетической идентичности животных, которые, вероятно, могут причинить им страдания без какой-либо значительной медицинской пользы для человека или животного, а также животные, являющиеся результатом таких способов. В целом, оптимизация кодонов означает способ модифицирования последовательности нуклеиновой кислоты для повышения уровня экспрессии в представляющих интерес клетках-хозяевах путем замещения по меньшей мере одного кодона (например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности на кодоны, которые чаще или наиболее часто используют в генах такой клетки-хозяина, при этом с сохранением нативной аминокислотной последовательности. Разные виды проявляют определенное "предпочтение" в отношении конкретных кодонов определенной аминокислоты. "Предпочтение" кодонов (различия в частоте использования кодонов между организмами) зачастую соотносится с эффективностью трансляции матричной РНК (mRNA), которая, в свою очередь, как полагают, зависит, среди прочего, от свойств кодонов, которые транслируются, и доступности конкретных молекул транспортной РНК (tRNA). Преобладание выбранных тРНК в клетке, как правило, указывает на кодоны, используемые наиболее часто при синтезе пептидов. Соответственно, гены можно приспособить для оптимальной экспрессии генов в данном организме за счет оптимизации кодонов. Таблицы частоты использования кодонов общедоступны, например, в "Базе данных частот использования кодонов", доступной в интернете по адресу www.kazusa.orjp/codon/, и эти таблицы можно адаптировать различными способами. См., Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000). Также доступны компьютерные алгоритмы для оптимизации кодонов определенной последовательности для экспрессии в определенной клетке-хозяине, как, например, Gene Forge (Aptagen; Джакобус, Пенсильвания). В некоторых вариантах осуществления один или несколько кодонов (например, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более или все кодоны) в последовательности, кодирующей Cas, соответствуют наиболее часто используемому кодону для определенной аминокислоты.

В определенных вариантах осуществления способы, описываемые в данном документе, могут включать обеспечение трансгенной по Cas клетки, в которой одна или несколько нуклеиновых кислот, кодирующих одну или несколько направляющих РНК, обеспечивают или вводят функционально связанными в клетку с регуляторным элементом, содержащим промотор одного или нескольких представляющих интерес генов. Используемый в данном документе термин "трансгенная по Cas клетка" обозначает клетку, такую как эукариотическая клетка, в геном которой был интегрирован ген Cas. Природа, тип или происхождение клетки конкретно не ограничиваются в соответствии с настоящим изобретением. Также способ, посредством которого трансген Cas вводят в клетку, может отличаться и может представлять собой любой способ, известный из уровня техники. В определенных вариантах осуществления трансгенную по Cas клетку получают путем введения трансгена Cas в выделенную клетку. В определенных других вариантах осуществления трансгенную по Cas клетку получают путем выделения клеток из трансгенного по Cas организма. В качестве примера и без ограничения, трансгенная по Cas клетка, упоминаемая в данном документе, может быть получена из трансгенного по Cas эукариота, такого как эукариота с нокином по Cas. Ссылка делается на WO 2014/093622 (PCT/US13/74667), который включен в данный документ посредством ссылки. Способы из публикаций заявок на патенты США №№ 20120017290 и 20110265198, закрепленных за Sangamo BioSciences, Inc., относящиеся к нацеливанию на локус Rosa, можно модифицировать для использования системы CRISPR-Cas по настоящему изобретению. Способы из публикации заявки на патент США № 20130236946, закрепленной за Cellectis, относящиеся к нацеливанию на локус Rosa, можно также модифицировать для использования системы CRISPR-Cas по настоящему изобретению. В качестве дополнительного примера ссылка делается на Platt et. al. (Cell; 159(2):440-455 (2014)), описывающую мышь с нокином по Cas9, которая включена в данный документ посредством ссылки. Трансген Cas может дополнительно содержать кассету Lox-Stop-polyA-Lox (LSL), за счет чего обеспечивается возможность индуцирования экспрессии Cas с помощью Cre-рекомбиназы. Альтернативно трансгенная по Cas клетка может быть получена путем введения трансгена Cas в выделенную клетку. Системы доставки для трансгенов хорошо известны из уровня техники. В качестве примера, трансген Cas может быть доставлен, например, в эукариотическую клетку посредством доставки с помощью вектора (например, AAV, аденовируса, лентивируса), и/или частицы, и/или наночастицы, как также описывается в других разделах данного документа.

Специалисту в данной области будет понятно, что клетка, такая как трансгенная по Cas клетка, упоминаемая в данном документе, может содержать дополнительные изменения в геноме помимо наличия интегрированного гена Cas или мутаций, возникающих за счет специфического в отношении последовательности действия Cas при образовании комплекса с РНК, способной направлять Cas в целевой локус, таких как, например, одна или несколько онкогенных мутаций, как в качестве примера и без ограничения описано у Platt et al. (2014), Chen et al. (2014) или Kumar et al. (2009).

Белок Cas с одной или несколькими NLS

В некоторых вариантах осуществления последовательность Cas слита с одной или несколькими последовательностями ядерной локализации (NLS), как, например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше NLS. В некоторых вариантах осуществления Cas содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше NLS на амино-конце или рядом с ним, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше NLS на карбокси-конце или рядом с ним или их комбинацию (например, ни одной либо по меньшей мере одну или несколько NLS на амино-конце и ни одной либо одну или несколько NLS на карбокси-конце). В тех случаях, когда присутствуют более одной NLS, каждая может быть выбрана независимо от других, так что одна NLS может присутствовать в более чем одной копии и/или в комбинации с одной или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления настоящего изобретения Cas содержит не более 6 NLS. В некоторых вариантах осуществления считается, что NLS находится рядом с N- или C-концом в тех случаях, когда наиболее близкая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот вдоль полипетидной цепи от N- или C-конца. Неограничивающие примеры NLS включают последовательность NLS, происходящую из NLS из большого Т-антигена вируса SV40 с аминокислотной последовательностью PKKKRKV(SEQ ID NO: Х); NLS из нуклеоплазмина (например, двусоставная NLS из нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK) (SEQ ID NO: Х); NLS из c-myc с аминокислотной последовательностью PAAKRVKLD (SEQ ID NO: Х) или RQRRNELKRSP (SEQ ID NO: Х); NLS из hRNPA1 M9 с последовательностью NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: X); последовательности RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: Х) домена IBB из импортина-альфа; последовательностей VSRKRPRP (SEQ ID NO: X) и PPKKARED (SEQ ID NO: X) белка T миомы; последовательности POPKKKPL (SEQ ID NO: X) человеческого p53; последовательности SALIKKKKKMAP (SEQ ID NO: X) c-abl IV мыши; последовательностей DRLRR (SEQ ID NO: X) и PKQKKRK (SEQ ID NO: Х) из NS1 вируса гриппа; последовательности RKLKKKIKKL (SEQ ID NO: Х) из дельта-антигена вируса гепатита; последовательности REKKKFLKRR (SEQ ID NO: Х) из белка Mx1 мыши; последовательность KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: Х) из поли(АДФ-рибоза)-полимеразы человека и последовательности RKCLQAGMNLEARKTKK (SEQ ID NO: Х) рецепторов стероидных гормонов глюкокортикоидов (человека). В целом, одна или несколько NLS являются достаточно эффективными, чтобы управлять накоплением Cas в обнаруживаемом количестве в ядре эукариотической клетки. В целом, степень проявления активности ядерной локализации может быть результатом следующего: числа NLS в Cas, конкретных используемых (конкретной используемой) NLS или комбинации этих факторов. Обнаружение накопления в ядре можно выполнять с помощью любой подходящей методики. Например, обнаруживаемый маркер может быть слит с Cas, так что расположение в клетке может быть визуализировано, как, например, в комбинации со средствами для обнаружения расположения в ядре (например, окрашивающим средством, специфичным к ядру, таким как DAPI). Ядра клеток также можно выделять из клеток, причем их содержимое затем можно анализировать с помощью любого подходящего способа для обнаружения белка, как, например, иммуногистохимического анализа, вестерн-блоттинга или анализа активности фермента. Накопление в ядре также можно определить опосредованно, как, например, с помощью анализа эффекта образования комплекса CRISPR (например, анализа в отношении расщепления ДНК или мутации в целевой последовательности или анализа активности экспрессии генов, измененной посредством образования комплекса CRISPR и/или активности Cas) по сравнению с контролем, который не подвергали воздействию Cas или комплекса или подвергали воздействию Cas, у которого отсутствуют одна или несколько NLS. В некоторых вариантах осуществления NLS не добавляют или не сливают с белком Cas.

Доставка системы CRISPR

Благодаря использованию данного раскрытия и сведений из уровня техники, систему CRISPR-Cas, особенно новые системы CRISPR, описанные в данном документе, или ее компоненты, или ее молекулы нуклеиновой кислоты (в том числе, например, матрицу для HDR), или молекулы нуклеиновой кислоты, кодирующие или представляющие собой ее компоненты, можно доставлять с помощью системы доставки, описываемой в данном документе как в целом, так и в подробностях.

Общая информация касательно векторов

В целом и на протяжении данного описания термин "вектор" обозначает молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Векторы для экспрессии в эукариотической клетке и обеспечивающие таковую в ней могут обозначаться в данном документе как "векторы экспрессии у эукариот". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным (регуляторными) элементом (элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).

Предполагается, что термин "регуляторный элемент" подразумевает промоторы, энхансеры, сайты внутренней посадки рибосомы (IRES) и другие элементы контроля экспрессии (например, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (например, печени, поджелудочной железе) или определенных типах клеток (например, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (например, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (например, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (например, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).

Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.

В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы нацеливания на нуклеиновую кислоту, вводят в клетку-хозяина, так что экспрессия элементов системы нацеливания на нуклеиновую кислоту управляет образованием комплекса нацеливания на нуклеиновую кислоту на одном или нескольких целевых сайтах. Например, каждый из эффекторного фермента для нацеливания на нуклеиновую кислоту, и направляющей РНК для нацеливания на нуклеиновую кислоту могут быть функционально связаны с отдельными регуляторными элементами в отдельных векторах. РНК системы нацеливания на нуклеиновую кислоту могут быть доставлены в трансгенное по эффекторному белку для нацеливания на нуклеиновую кислоту животное или млекопитающее, например, животное или млекопитающее, которое постоянно, или при индукции, или в определенных условиях экспрессирует эффекторный белок для нацеливания на нуклеиновую кислоту; или животное или млекопитающее, которое по другим причинам экспрессирует эффекторный белок для нацеливания на нуклеиновую кислоту или имеет клетки, содержащие эффекторный белок для нацеливания на нуклеиновую кислоту, как, например, посредством предварительного введения им вектора или векторов, кодирующих и экспрессирующих in vivo эффекторный белок для нацеливания на нуклеиновую кислоту. Альтернативно два или более элементов, экспрессируемых с одних и тех же или различных регуляторных элементов, можно объединять в одном векторе, при этом один или несколько дополнительных векторов обеспечивают любые компоненты системы нацеливания на нуклеиновую кислоту, не включенные в первый вектор. Элементы системы нацеливания на нуклеиновую кислоту, которые объединены в одном векторе, могут быть размещены в любой подходящей ориентации, как, например, один элемент, расположенный с 5'-конца ("выше") относительно второго элемента или 3'-конца ("ниже") относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на одной и той же или противоположной нити по отношению к кодирующей последовательности второго элемента и ориентирована в одном и том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего эффекторный белок для нацеливания на нуклеиновую кислоту и направляющую РНК для нацеливания на нуклеиновую кислоту, встроенных в одну или несколько интронных последовательностей (например, каждая в отдельном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту и направляющая РНК для нацеливания на нуклеиновую кислоту могут быть функционально связаны с одним и тем же промотором и экспрессироваться с него. Средства доставки, векторы, частицы, наночастицы, составы и их компоненты для экспрессии одного или нескольких элементов системы нацеливания на нуклеиновую кислоту являются такими, как используемые в вышеизложенных документах, таких как WO 2014/093622 (PCT/US2013/074667). В некоторых вариантах осуществления вектор содержит один или несколько сайтов встраивания, как, например, последовательность узнавания рестрикционной эндонуклеазой (также называемая "сайтом клонирования"). В некоторых вариантах осуществления один или несколько сайтов встраивания (например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше сайтов встраивания) находятся выше и/или ниже одного или нескольких элементов последовательности одного или нескольких векторов. В некоторых вариантах осуществления вектор содержит сайт встраивания выше парной tracr-последовательности и необязательно ниже регуляторного элемента, функционально связанного с парной tracr-последовательностью, так что после встраивания направляющей последовательности в сайт встраивания и при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления вектор содержит два или более сайтов встраивания, чтобы обеспечить возможность встраивания направляющей последовательности в каждый сайт. При таком размещении две или более направляющих последовательностей могут содержать две или более копии одиночной направляющей последовательности, две или более различные направляющие последовательности или их комбинации. В тех случаях, когда применяются множественные отличающиеся направляющие последовательности, можно использовать одну экспрессионную конструкцию, чтобы нацеливать активности нацеливания на нуклеиновую кислоту на множественные отличающиеся соответствующие целевые последовательности в клетке. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или больше направляющих последовательностей. В некоторых вариантах осуществления векторы, содержащие приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше таких направляющих последовательностей, могут быть получены и необязательно доставлены в клетку. В некоторых вариантах осуществления вектор содержит регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует эффекторный белок для нацеливания на нуклеиновую кислоту. Эффекторный белок для нацеливания на нуклеиновую кислоту либо направляющую РНК или направляющие РНК для нацеливания на нуклеиновую кислоту можно доставлять по отдельности; и преимущественно по меньшей мере одно из них доставляют посредством комплекса на основе частиц или наночастиц. мРНК эффекторного белка для нацеливания на нуклеиновую кислоту может быть доставлена до направляющей РНК для нацеливания на нуклеиновую кислоту, чтобы предоставить время для экспрессии эффекторного белка для нацеливания на нуклеиновую кислоту. мРНК эффекторного белка для нацеливания на нуклеиновую кислоту может быть введена за 1-12 часов (предпочтительно за приблизительно 2-6 часов) до введения направляющей РНК для нацеливания на нуклеиновую кислоту. Альтернативно мРНК эффекторного белка для нацеливания на нуклеиновую кислоту и направляющая РНК для нацеливания на нуклеиновую кислоту могут быть введены вместе. Преимущественно вторую бустерную дозу направляющей РНК можно вводить через 1-12 часов (предпочтительно через около 2-6 часов) после первого введения мРНК эффекторного белка для нацеливания на нуклеиновую кислоту + направляющей РНК. Введение дополнительных доз мРНК эффекторного белка для нацеливания на нуклеиновую кислоту и/или направляющей РНК может быть пригодным для достижения наиболее эффективных уровней модификации генома.

Общая информация касательно векторной доставки

Определенные аспекты настоящего изобретения относятся к векторам, например, для доставки или введения в клетку Cas и/или РНК, способной направлять Cas в целевой локус (т. e. направляющей РНК), а также для наращивания количества этих компонентов (например, в прокариотических клетках). Как используется в данном документе, "вектор" представляет собой инструмент, который позволяет или облегчает перенос объекта из одной среды в другую. Он представляет собой репликон, такой как плазмида, фаг или космида, в который может быть встроен другой сегмент ДНК для осуществления таким образом репликации встроенного сегмента. Как правило, вектор способен к репликации, если ассоциирован с соответствующими элементами контроля. В целом, термин "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы (AAV)). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным (регуляторными) элементом (элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина). Что касается способов рекомбинации и клонирования, следует упомянуть заявку на патент США № 10/815730, опубликованную 2 сентября 2004 г. как US 2004-0171156 A1, содержание которой включено в данный документ посредством ссылки в полном объеме.

Вектор (векторы) могут включать в себя регуляторный (регуляторные) элемент (элементы), например, промотор(промоторы). Вектор (векторы) могут содержать кодирующие Cas последовательности и/или одну, но, возможно, также могут содержать по меньшей мере 3, или 8, или 16, или 32, или 48, или 50 кодирующих направляющие РНК (например, sgRNA) последовательности, как, например, 1-2, 1-3, 1-4 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-8, 3-16, 3-30, 3-32, 3-48, 3-50 РНК (например, sgRNA). В одном векторе может быть промотор для каждой РНК (например, sgRNA), преимущественно, если присутствует до приблизительно 16 РНК (например, sgRNA); а если в одном векторе содержится более чем 16 РНК (например, sgRNA), то один промотор или несколько промоторов могут управлять экспрессией более чем одной РНК (например, sgRNA), например, если присутствует 32 РНК (например, sgRNA), то каждый промотор может управлять экспрессией двух РНК (например, sgRNA), и если присутствует 48 РНК (например, sgRNA), то каждый промотор может управлять экспрессией трех РНК (например, sgRNA). Путем простых арифметических приемов и общепринятых протоколов клонирования, а также идей настоящего раскрытия специалист в данной области сможет легко осуществить настоящее изобретение на практике, что касается РНК (например, sgRNA) для подходящего иллюстративного вектора, такого как AAV, и подходящего промотора, такого как промотор U6, например, U6-sgRNA. Например, предел упаковки AAV составляет ~4,7 т. п. о. Длина одного U6-sgRNA (плюс сайты рестрикции для клонирования) составляет 361 п. о. Следовательно, специалист в данной области сможет легко разместить приблизительно 12-16, например 13, кассет U6-sgRNA в одном векторе. Он может быть собран с помощью любого подходящего способа, как, например, стратегия Golden Gate, применяемая для сборки TALE (http://www.genome-engineering.org/taleffectors/). Специалист в данной области также может применять стратегию, основанную на использовании тандемных направляющих, для повышения числа U6-sgRNA в примерно 1,5 раза, например, для повышения числа U6-sgRNA от 12 до 16, например, от 13 до примерно 18-24, например, приблизительно 19. Следовательно, специалист в данной области сможет легко получить примерно 18-24, например приблизительно 19, промоторов-РНК, например U6-sgRNA, в одном векторе, например в векторе на основе AAV. Дополнительным способом повышения числа промоторов и РНК, например, sgRNA, в векторе является применение одного промотора (например, U6) для экспрессии массива РНК, например, sgRNA, разделенных расщепляемыми последовательностями. Еще одним дополнительным способом повышения числа промоторов-РНК, например, sgRNA, в векторе является экспрессия массива промоторов-РНК, например, sgRNA, разделенных расщепляемыми последовательностями в интроне кодирующей последовательности или гена; и в данном случае преимущественным является применение промотора полимеразы II, который может обладать повышенной экспрессией и способностью к транскрипции длинной РНК специфическим в отношении ткани образом. (См., например, http://nar.oxfordjournals.org/content/34/7/e53.short, http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html). В преимущественном варианте осуществления AAV может упаковывать U6 в тандеме с sgRNA, нацеливающейся на приблизительно 50 генов включительно. Соответственно, исходя из сведений из уровня техники и идей настоящего раскрытия специалист в данной области сможет легко получить и применять вектор(векторы), например, один вектор, экспрессирующий несколько РНК, или направляющих, или sgRNA, находящихся под контролем одного или нескольких промоторов либо функционально эффективно или функционально связанных с ними, особенно это касается числа РНК, или направляющих, или sgRNA, обсуждаемых в данном документе, без каких-либо неоправданных экспериментов.

Кодирующие направляющие РНК, например, sgRNA, последовательности и/или кодирующие Cas последовательности могут быть функционально или функционально эффективно связанными с регуляторным (регуляторными) элементом (элементами), и, следовательно, регуляторный (регуляторные) элемент (элементы) управляет (управляют) экспрессией. Промотор (промоторы) может (могут) быть конститутивным (конститутивными) промотором (промоторами), и/или активируемым (активируемыми) при определенных условиях промотором (промоторами), и/или индуцируемым (индуцируемыми) промотором (промоторами), и/или тканеспецифичным (тканеспецифичными) промотором (промоторами). Промотор может быть выбран из группы, состоящей из РНК-полимераз, pol I, pol II, pol III, T7, U6, H1, ретровирусного промотора LTR вируса саркомы Рауса (RSV), промотора цитомегаловируса (CMV), промотора SV40, промотора дигидрофолатредуктазы, промотора β-актина, промотора глицерофосфаткиназы (PGK) и промотора EF1α. Предпочтительным промотором является промотор U6.

Векторная доставка

Векторная доставка, например, доставка с помощью плазмиды, вируса. Фермент CRISPR, например Cas9, и/или любую из РНК по настоящему изобретению, например направляющую РНК, можно доставлять с помощью любого подходящего вектора, например плазмиды или вирусных векторов, таких как аденоассоциированный вирус (AAV), лентивирус, аденовирус или другие типы вирусных векторов, или их комбинации. Cas9 и одна или несколько направляющих РНК могут быть упакованы в одном или нескольких векторах, например, плазмиде или вирусных векторах. В некоторых вариантах осуществления вектор, например, плазмиду или вирусный вектор, доставляют в представляющую интерес ткань посредством, например, внутримышечной инъекции, тогда как в других случаях доставка осуществляется посредством внутривенного, трансдермального, интраназального, перорального, трансмукозального или других способов доставки. Такая доставка может осуществляться в виде однократной дозы или многократных доз. Специалисту в данной области понятно, что фактическая доза, подлежащая доставке согласно данному документу, может в значительной степени варьировать в зависимости от ряда факторов, таких как выбор вектора, целевые клетка, организм или ткань, общее состояние субъекта, подлежащего лечению, степень требуемой трансформации/модификации, путь введения, способ введения, тип требуемой трансформации/модификации и т.п.

Такая доза может дополнительно содержать, например, носитель (воду, солевой раствор, этанол, глицерин, лактозу, сахарозу, фосфат кальция, желатин, декстран, агар, пектин, арахисовое масло, кунжутное масло и т.д.), разбавитель, фармацевтически приемлемый носитель (например, фосфатно-солевой буфер), фармацевтически приемлемый наполнитель и/или другие соединения, известные из уровня техники. Доза может дополнительно содержать одну или несколько фармацевтически приемлемых солей, таких как, например, соль неорганической кислоты, такая как гидрохлорид, гидробромид, фосфат, сульфат и т.д.; и соли органических кислот, такие как ацетаты, пропионаты, малонаты, бензоаты и т.д. Дополнительно в ней также могут присутствовать вспомогательные вещества, такие как смачивающие или эмульгирующие средства, буферные вещества, поддерживающие pH, гели или гелеобразующие материалы, ароматизаторы, красители, микросферы, полимеры, суспендирующие средства и т.д. Кроме того, также могут присутствовать один или несколько других традиционных фармацевтических ингредиентов, таких как консерванты, увлажнители, суспендирующие средства, поверхностно-активные вещества, антиоксиданты, средства против слеживания, заполнители, хелатообразователи, средства для нанесения покрытий, химические стабилизаторы и т.д., особенно если лекарственная форма представляет собой форму, подлежащую восстановлению. Подходящие иллюстративные ингредиенты включают микрокристаллическую целлюлозу, натрий-карбоксиметилцеллюлозу, полисорбат 80, фенилэтиловый спирт, хлорбутанол, сорбат калия, сорбиновую кислоту, диоксид серы, пропилгаллат, парабены, этилванилин, глицерин, фенол, парахлорфенол, желатин, альбумин и их комбинацию. Подробное обсуждение фармацевтически приемлемых наполнителей доступно в REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991), включенном в данный документ посредством ссылки.

В одном варианте осуществления согласно данному документу доставку осуществляют посредством аденовируса, который может находиться в однократной бустерной дозе, содержащей по меньшей мере 1 x 105 частиц (также называемых единицами частиц, pu) аденовирусного вектора. В одном варианте осуществления согласно данному документу доза предпочтительно составляет по меньшей мере приблизительно 1 x 106 частиц (например, приблизительно 1 x 106 - 1 x 1012 частиц), более предпочтительно по меньшей мере приблизительно 1 x 107 частиц, более предпочтительно по меньшей мере приблизительно 1 x 108 частиц (например, приблизительно 1 x 108 - 1 x 1011 частиц или приблизительно 1 x 108 - 1 x 1012 частиц) и наиболее предпочтительно по меньшей мере приблизительно 1 x 100 частиц (например, приблизительно 1 x 109 - 1 x 1010 частиц или приблизительно 1 x 109 - 1 x 1012 частиц) или даже по меньшей мере приблизительно 1 x 1010 частиц (например, приблизительно 1 x 1010 - 1 x 1012 частиц) аденовирусного вектора. Альтернативно доза содержит не более чем приблизительно 1 x 1014 частиц, предпочтительно не более чем приблизительно 1 x 1013 частиц, еще более предпочтительно не более чем приблизительно 1 x 1012 частиц, еще более предпочтительно не более чем приблизительно 1 x 1011 частиц и наиболее предпочтительно не более чем приблизительно 1 x 1010 частиц (например, не более чем приблизительно 1 x 109 частиц). Таким образом, доза может включать в себя однократную дозу аденовирусного вектора, например, с приблизительно 1 x 106 единиц частиц (pu), приблизительно 2 x 106 pu, приблизительно 4 x 106 pu, приблизительно 1 x 107 pu, приблизительно 2 x 107 pu, приблизительно 4 x 107 pu, приблизительно 1 x 108 pu, приблизительно 2 x 108 pu, приблизительно 4 x 108 pu, приблизительно 1 x 109 pu, приблизительно 2 x 109 pu, приблизительно 4 x 109 pu, приблизительно 1 x 1010 pu, приблизительно 2 x 1010 pu, приблизительно 4 x 1010 pu, приблизительно 1 x 1011 pu, приблизительно 2 x 1011 pu, приблизительно 4 x 1011 pu, приблизительно 1 x 1012 pu, приблизительно 2 x 1012 pu или приблизительно 4 x 1012 pu аденовирусного вектора. См., например, аденовирусные векторы в патенте США № 8454972 B2 Nabel, et. al., выданном 4 июня 2013 г.; включенном в данный документ посредством ссылки, и дозы в столбце 29, строках 36-58 данного патента. В одном варианте осуществления согласно данному документу аденовирус доставляется посредством многократных доз.

В одном варианте осуществления согласно данному документу доставку осуществляют посредством AAV. Полагают, что терапевтически эффективная доза для in vivo доставки AAV человеку находится в диапазоне от приблизительно 20 до приблизительно 50 мл физиологического раствора, содержащего от приблизительно 1 x 1010 до приблизительно 1 x 1010 функциональных частиц AAV/мл раствора. Дозу можно скорректировать для уравновешивания терапевтической пользы и любых побочных эффектов. В одном варианте осуществления согласно данному документу доза AAV, как правило, находится в диапазоне концентраций от приблизительно 1 x 105 до 1 x 1050 геномов AAV, от приблизительно 1 x 108 до 1 x 1020 геномов AAV, от приблизительно 1 x 1010 до приблизительно 1 x 1016 геномов или от приблизительно 1 x 1011 до приблизительно 1 x 1016 геномов AAV. Доза для человека может составлять приблизительно 1 x 1013 геномов AAV. Такие концентрации можно доставлять в растворе носителя объемом от приблизительно 0,001 мл до приблизительно 100 мл, от приблизительно 0,05 до приблизительно 50 мл или от приблизительно 10 до приблизительно 25 мл. Другие эффективные дозы может без труда установить средний специалист в данной области посредством стандартных испытаний с построением кривых зависимости "доза-эффект". См., например, патент США № 8404658 B2 Hajjar, et al., выданный 26 марта 2013 г., в столбце 27, строках 45-60.

Общие принципы упаковки и использования промоторов

Существуют следующие способы упаковки молекул нуклеиновой кислоты, кодирующих Cas9, например ДНК, в векторы, например вирусные векторы, для опосредования модификации генома in vivo.

Для обеспечения опосредованного NHEJ нокаута гена необходимо следующее.

Один вирусный вектор

Вектор, содержащий две или более кассет экспрессии:

промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;

промотор-gRNA1-терминатор;

промотор-gRNA2-терминатор;

промотор-gRNA(N)-терминатор (до предельного размера вектора).

Два вирусных вектора

Вектор 1, содержащий одну кассету экспрессии для управления экспрессией Cas9:

промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;

вектор 2, содержащий одну или несколько кассет экспрессии для управления экспрессией одной или нескольких направляющих РНК:

промотор-gRNA1-терминатор;

промотор-gRNA(N)-терминатор (до предельного размера вектора).

Для опосредования репарации с участием гомологичной рекомбинации.

В дополнение к подходам с одним и двумя вирусными векторами, описанными выше, можно использовать дополнительный вектор для доставки матрицы для репарации с участием гомологичной рекомбинации.

Промотор, используемый для управления экспрессией молекулы нуклеиновой кислоты, кодирующей Cas9, может включать следующее.

ITR AAV может служить в качестве промотора: это является преимущественным для устранения необходимости в дополнительном промоторном элементе (который может занимать пространство в векторе). Освободившееся дополнительное пространство можно задействовать для управления экспрессией дополнительных элементов (gRNA и т.д.). Также активность ITR является относительно более слабой, поэтому ее можно использовать для снижения потенциальной токсичности, обусловленной сверхэкспрессией Cas9.

Для повсеместной экспрессии можно использовать следующие промоторы: CMV, CAG, CBh, PGK, SV40, генов тяжелой или легкой цепей ферритина и т.д.

Для экспрессии в головном мозге или в другом отделе ЦНС можно использовать следующие промоторы: гена синапсина I для всех нейронов, гена CaMKII-альфа для возбуждающих нейронов, GAD67, или GAD65, или VGAT для GABA-эргических нейронов и т.д.

Для экспрессии в печени можно использовать промотор гена альбумина.

Для экспрессии в легких можно использовать SP-B.

Для эндотелиальных клеток можно использовать ICAM.

Для кроветворных клеток можно использовать промотор гена IFN-бета или CD45.

Для остеобластов можно использовать OG-2.

Промотор, используемый для управления направляющей РНК, может включать в себя следующее:

промоторы для Pol III, такие как U6 или H1.

Использование промотора для Pol II и интронных кассет для экспрессии gRNA.

Кристаллизация и структура CRISPR-Cas9

Кристаллизация CRISPR-Cas9 и определение характеристики кристаллической структуры. Кристаллы могут быть получены с помощью методик, используемых в кристаллографии белков, в том числе способами групповой обработки, жидкого моста, диализа, диффузии из паровой фазы и "висячей капли". Как правило, кристаллы выращивают путем растворения практически чистой CRISPR-Cas9 и молекулы нуклеиновой кислоты, с которой она связывается, в водном буфере, содержащем осаждающее вещество при концентрации чуть ниже необходимой для осаждения. Воду удаляют путем контролируемого выпаривания для обеспечения условий осаждения, которые поддерживают до прекращения роста кристаллов. См., Nishimasu et al.

Пути применения кристаллов, координат кристаллической структуры и атомной структуры. Кристаллы и, в частности, полученные на основании них координаты атомной структуры, имеют широкий спектр применений. Кристаллы и координаты структуры особенно пригодны для идентификации соединений (молекул нуклеиновой кислоты), которые связываются с CRISPR-Cas9, и CRISPR-Cas9, которые могут связываться с конкретными соединениями (молекулами нуклеиновой кислоты). Таким образом, координаты структуры, описанные в данном документе, можно использовать в качестве моделей фазирования при определении кристаллических структур дополнительных синтетических или подвергнутых мутации CRISPR-Cas9, Cas9, никаз, доменов связывания. Обеспечение кристаллической структуры CRISPR-Cas9, находящейся в комплексе с молекулой нуклеиновой кислоты, может обеспечить специалисту понимание сути CRISPR-Cas9. Такое понимание обеспечивает возможность разработки модифицированных CRISPR-Cas9, как, например, путем прикрепления к ним функциональной группы, такой как репрессор или активатор. Хотя к N- или C-концу CRISPR-Cas9 можно прикрепить функциональную группу, такую как репрессор или активатор, кристаллическая структура демонстрирует, что N-конец, по видимому, загорожен или скрыт, тогда как C-конец более доступен для функциональной группы, такой как репрессор или активатор. Более того, кристаллическая структура демонстрирует, что существует гибкая петля между остатками CRISPR-Cas9 (S. pyogenes), соответствующими примерно 534-676, которая подходит для прикрепления функциональной группы, такой как активатор или репрессор. Прикрепление может быть выполнено посредством линкера, например, гибкого глицин-серинового (GlyGlyGlySer) или (GGGS)3 или жесткого альфа-спирального линкера, такого как (Ala(GluAlaAlaAlaLys)Ala). Кроме гибкой петли также имеется нуклеазный или H3-участок, H2-участок и спиральный участок. Под "спиралью" или "спиральным" подразумевают спираль, как известно из уровня техники, в том числе без ограничения альфа-спираль. Кроме того, термин "спираль" или "спиральный" также может использоваться для обозначения C-концевого спирального элемента с N-концевым поворотом.

Обеспечение кристаллической структуры CRISPR-Cas9, находящейся в комплексе с молекулой нуклеиновой кислоты, обеспечивает новый подход для поиска новых лекарственных средств или соединений, идентификации и разработки соединений, которые могут связываться с CRISPR-Cas9, и, таким образом, в настоящем изобретении предусматриваются инструменты, пригодные для диагностики, лечения или предупреждения состояний или заболеваний у многоклеточных организмов, например, водорослей, растений, позвоночных, рыб, амфибий, рептилий, птиц, млекопитающих; например, домашних растений, животных (например, продуктивных животных, таких как свинья, жвачное животное, курица; животного-компаньона, такого как представители кошачьих, собачьих, грызунов (кролик, песчанка, хомячок); лабораторных животных, таких как мышь, крыса) и людей. Соответственно, в настоящем изобретении предусмотрен способ рациональной разработки комплексов CRISPR-Cas9, основанный на использовании компьютера. Такая рациональная разработка может предусматривать обеспечение структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех (например, по меньшей мере 2 или больше, например, по меньшей мере 5, преимущественно по меньшей мере 10, более преимущественно по меньшей мере 50 и еще более преимущественно по меньшей мере 100 атомов структуры) координат из таблицы кристаллических структур и/или представленных на фигуре (фигурах), касающихся кристаллической структуры; см. Nishimasu et al.; обеспечение структуры требуемой молекулы нуклеиновой кислоты, в отношении которой требуется комплекс CRISPR-Cas9; и подгонку структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех координат, к требуемой молекуле нуклеиновой кислоты, включенной в указанную подгонку, с получением предполагаемой (предполагаемых) модификации (модификаций) комплекса CRISPR-Cas9, определяемого с помощью некоторых или всех координат, для того, чтобы указанная требуемая молекула нуклеиновой кислоты связывалась с комплексом (комплексами) CRISPR-Cas9, включающим (включающими) требуемую молекулу нуклеиновой кислоты. В способе или подгонке согласно способу можно использовать координаты представляющих интерес атомов комплекса CRISPR-Cas9, определяемого с помощью некоторых или всех координат, которые соответствуют близлежащей по отношению к активному сайту или участку связывания области (например, по меньшей мере 2 или больше, например, по меньшей мере 5, преимущественно по меньшей мере 10, более преимущественно по меньшей мере 50 и еще более преимущественно по меньшей мере 100 атомов структуры), для моделирования близлежащей по отношению к активному сайту или участку связывания области. Эти координаты можно использовать для определения пространства, в отношении которого затем проводят скрининг "in silico" в отношении требуемой или кандидатной молекулы нуклеиновой кислоты. Таким образом, в настоящем изобретении предусмотрен способ рациональной разработки комплексов CRISPR-Cas9, основанный на использовании компьютера. Данный способ может предусматривать обеспечение координат по меньшей мере двух атомов из таблицы кристаллических структур ("выбранные координаты"); см. Nishimasu et al.; обеспечение структуры кандидатной или требуемой молекулы нуклеиновой кислоты и подгонку структуры кандидата к выбранным координатам. Таким образом специалист также может подогнать функциональную группу и кандидатную или требуемую молекулу нуклеиновой кислоты. Например, обеспечение структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех (например, по меньшей мере 2 или больше, например, по меньшей мере 5, преимущественно по меньшей мере 10, более преимущественно по меньшей мере 50 и еще более преимущественно по меньшей мере 100 атомов структуры) координат; обеспечение структуры требуемой молекулы нуклеиновой кислоты, в отношении которой требуется комплекс CRISPR-Cas9; подгонка структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех координат из таблицы кристаллических структур и/или представленных на фигурах, касающихся кристаллической структуры; см. Nishimasu et al.; к требуемой молекуле нуклеиновой кислоты, включенной в указанную подгонку, с получением предполагаемой модификации (модификаций) определяемого комплекса CRISPR-Cas9 для того, чтобы указанная требуемая молекула нуклеиновой кислоты связывалась с комплексом(комплексами) CRISPR-Cas9, включающим (включающими) требуемую молекулу нуклеиновой кислоты; выбор предполагаемого совпадения комплекса (комплексов) CRISPR-Cas9-требуемая молекула нуклеиновой кислоты, подгонка такого предполагаемого совпадения комплекса(комплексов) CRISPR-Cas9-требуемая молекула нуклеиновой кислоты к функциональной группе (например, активатору, репрессору), например, что касается местоположений для размещения функциональной группы (например, положений в пределах гибкой петли) и/или предполагаемых модификаций предполагаемого совпадения комплекса(комплексов) CRISPR-Cas9-требуемая молекула нуклеиновой кислоты для получения местоположений для размещения функциональной группы.

Однако по информации о кристаллической структуре SpCas9 (см. Nishimasu et al.) нельзя спрогнозировать уменьшение нецелевых эффектов, достигаемых за счет мутаций согласно настоящему изобретению; или то, что конкретные мутации могут приводить к уменьшению нецелевых эффектов, раскрытых в данном документе. Но благодаря настоящему изобретению, обеспечиваемому информацию о мутациях, которые обеспечивают снижение нецелевых эффектов или с помощью которых оно достигается, специалист в данной области сможет легко применить идеи в соответствии с данным документом в сочетании с информацией о кристаллической структуре SpCas9 и информацией о последовательностях Cas9 для проведения анализов последовательностей и структур Cas9 с целью определения аналогичных аминокислот, которые можно подвергать мутации или модификации аналогичным образом, чтобы получить дополнительные мутированные или модифицированные Cas9, в которых мутация или модификация приводят к уменьшению нецелевых эффектов.

Таким образом, настоящее изобретение вместе с информацией о кристалле SpCas9 может быть осуществлено на практике с использованием координат, соответствующих близлежащей по отношению к мутации (мутациям) или модификации (модификациям), раскрытой(раскрытых) в данном документе, области или активному сайту или участку связывания, расположенных в непосредственной близости к такой мутации (мутациям) или модификации (модификациям); и, следовательно, в способах определения дополнительных мутаций или модификаций в SpCas9 или аналогичных мутаций или модификаций в ортологах Cas9 можно использовать аспект, например, сравнительный аспект представляющего интерес субдомена (субдоменов) комплекса CRISPR-Cas9. Способы определения дополнительных мутаций или модификаций SpCas9 или аналогичных мутаций или модификаций в ортологах Cas9 можно осуществлять на практике с использованием координат домена или субдомена. Способы необязательно могут предусматривать синтез кандидатной или требуемой молекулы нуклеиновой кислоты и/или систем CRISPR-Cas9 согласно результатам "in silico" и тестирование "практических" или фактических мутаций или модификаций в отношении связывания, и/или активности, и/или снижения нецелевых эффектов. Системы CRISPR-Cas9, включающие в себя мутации или модификации, необязательно могут включать в себя функциональную группу. Такие способы могут предусматривать изучение клетки или организма, содержащего клетку, на предмет требуемой реакции, например, уменьшения проявления симптомов, или состояния, или заболевания, преимущественно включающей в себя снижение нецелевых эффектов. Получение структуры кандидатной молекулы нуклеиновой кислоты может предусматривать выбор соединения путем компьютерного скрининга базы данных, содержащей данные о молекулах нуклеиновой кислоты, например, такие данные, которые имеют отношение к состояниям или заболеваниям. 3-D идентификатор в отношении связывания кандидатной молекулы нуклеиновой кислоты может быть получен из геометрических и функциональных ограничений, происходящих из структуры и химической природы комплекса CRISPR-Cas9 или его доменов или участков в кристаллической структуре с учетом мутаций или модификаций, раскрытых в данном документе. В действительности, идентификатор может представлять собой тип фактической (фактических) модификации (модификаций) кристаллической структуры комплекса CRISPR-Cas9 согласно данному документу для обеспечения связывания CRISPR-Cas9 с кандидатной или требуемой молекулой нуклеиновой кислоты. В данном документе затем могут быть выполнены "практические" стадии с использованием идентификатора и молекул нуклеиновой кислоты, которые предположительно обладают хорошим связыванием.

"Подгонка" может означать определение взаимодействий между по меньшей мере одним атомом кандидата и по меньшей мере одним атомом комплекса CRISPR-Cas9 с помощью автоматизированных или полуавтоматизированных средств и вычисление степени стабильности таких взаимодействий. Взаимодействия могут включать притяжение, отталкивание, обусловленное зарядом, стерическими аспектами и т.п. "Субдомен" может означать по меньшей мере один, например, один, два, три или четыре, полный (полных) элемент (элементов) вторичной структуры. Конкретные участки или домены CRISPR-Cas9 включают таковые, идентифицированные в таблице кристаллических структур и на фигурах, соответствующих им; см. Nishimasu et al.

В любом случае трехмерная структура комплекса CRISPR-Cas9 (например Cas9 S. pyogenes; см. Nishimasu et al.) обеспечивает в контексте настоящего изобретения дополнительный инструмент для идентификации дополнительных мутаций в ортологах Cas9 в виде положений для мутаций/модификаций, идентифицированных в данном документе, которые могут быть применены к ортологам Cas9 на основании сравнения последовательности и структурного положения с использованием кристаллической структуры комплекса CRISPR-SpCas9. Кристаллическая структура также может быть основой для разработки новых и специфичных Cas9, например, таких, которые имеют мутацию (мутации) или модификацию (модификации) согласно данному документу, и включают в себя, или имеют в качестве партнера по слиянию, или имеют связанные с ними любую одну или несколько различных функциональных групп, например, репрессор транскрипции, активатор транскрипции, нуклеазный домен, ДНК-метилтрансферазу, протеинацетилтрансферазу, протеиндеацетилазу, протеинметилтрансферазу, протеиндезаминазу, протеинкиназу и протеинфосфатазу; а в некоторых аспектах функциональных домен представляет собой эпигенетический регулятор; см., например, Zhang et al., патент США № 8507272, и снова упоминается, что этот и все документы, цитируемые в данном документе, и все цитируемые в настоящей заявке документы тем самым включены в данный документ посредством ссылки, путем модификации Cas9 с помощью новых никаз. Исходя из настоящего раскрытия и зная трехмерную структуру кристалла CRISPR-Cas9 (Cas9 S. pyogenes) можно использовать компьютерные моделирующие программы для разработки или идентификации разных молекул, которые, как ожидается, будут взаимодействовать с возможными или подтвержденными сайтами, такими как сайты связывания или другие структурные или функциональные особенности системы CRISPR-Cas9 (например, Cas9 S. pyogenes). Соединение, которое потенциально связывает ("связующее"), можно исследовать посредством применения компьютерного моделирования с использованием программы докинга. Программы докинга являются известными; например, GRAM, DOCK или AUTODOCK (см. Walters et al. Drug Discovery Today, vol. 3, no. 4 (1998), 160-178, и Dunbrack et al. Folding and Design 2 (1997), 27-42). Эта процедура может включать компьютерную подгонку потенциальных связующих с целью выяснения того, насколько хорошо форма и химическая структура потенциального связующего будут способствовать связыванию с системой CRISPR-Cas9 (например, Cas9 S. pyogenes). С помощью компьютера можно вручную выполнить проверку активного сайта или сайта связывания системы CRISPR-Cas9 (например, Cas9 S. pyogenes). Программы, как, например, GRID (P. Goodford, J. Med. Chem, 1985, 28, 849-57), представляющая собой программу, которая определяет вероятные сайты взаимодействия между молекулами с различными функциональными группами, также можно использовать для анализа активного сайта или сайта связывания для прогнозирования частичных структур связывающих соединений. Компьютерные программы можно использовать для оценки притяжения, отталкивания или стерического несоответствия двух партнеров по связыванию, например, системы CRISPR-Cas9 (например, Cas9 S. pyogenes) и кандидатной молекулы нуклеиновой кислоты или молекулы нуклеиновой кислоты и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes); и при этом кристаллическая структура CRISPR-Cas9 (Cas9 S. pyogenes) облегчает такие способы. Как правило, чем плотнее подгонка, тем меньше стерических несоответствий, и чем больше силы притяжения, тем сильнее потенциал связующего, поскольку эти свойства согласуются с более четкой константой связывания. Более того, чем больше специфичность при разработке кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), тем более вероятно, что она не будет взаимодействовать вдобавок с нецелевыми молекулами. В настоящем изобретении также разрешаются "практические" способы. Например, в одном аспекте настоящего изобретения предусмотрен способ определения структуры связующего (например, целевой молекулы нуклеиновой кислоты) кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), связанной с кандидатной системой CRISPR-Cas9 (например, Cas9 S. pyogenes), при этом указанный способ включает (a) получение первого кристалла кандидатной системы CRISPR-Cas9 (Cas9 S. pyogenes) в соответствии с настоящим изобретением или второго кристалла кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), (b) приведение в контакт первого кристалла или второго кристалла с указанным связующим в условиях, приводящих к образованию комплекса; и (c) определение структуры указанного кандидата (например, системы CRISPR-Cas9 (например, Cas9 S. pyogenes) или комплекса системы CRISPR-Cas9 (Cas9 S. pyogenes)). Второй кристалл, по сути, может иметь те же координаты, обсуждаемые в данном документе, однако из-за незначительных изменений в системе CRISPR-Cas9 (например, Cas9 в такой системе представляет собой, например, Cas9 S. pyogenes, в отличие от Cas9 S. pyogenes), где "например, Cas9 S. pyogenes" указывает на то, что Cas9 представляет собой Cas9 и может происходить из S. pyogenes или его ортолога или может быть получен из них), кристалл может образовываться в другой пространственной группе симметрии. Настоящее изобретение дополнительно предусматривает вместо или в дополнение к способам "in silico" другие "практические" способы, включающие высокопроизводительный скрининг связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes) (вышеупомянутой(вышеупомянутых) системы(систем) CRISPR-Cas9 с одной или несколькими функциональными группами или без них), для отбора соединений с активностью связывания. Такие пары связующего и системы CRISPR-Cas9, которые демонстрируют активность связывания, могут быть выбраны и дополнительно подвергнуты кристаллизации с кристаллом CRISPR-Cas9, имеющим структуру согласно настоящему документу, например, путем совместной кристаллизации или смачивания, для рентгеноструктурного анализа. После разработки, идентификации или выбора возможных пар связующего и системы CRISPR-Cas9 путем определения тех, которые имеют благоприятные подходящие свойства, например, прогнозируемое сильное притяжение, основанное на данных кристаллической структуры пар связующего и CRISPR-Cas9 согласно данному документу, эти возможные пары затем можно подвергать скринингу в отношении активности с помощью "практических" способов. Следовательно, в одном аспекте настоящее изобретение может предусматривать получение или синтез возможных пар и приведение в контакт связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes) (вышеупомянутой (вышеупомянутых системы (систем) CRISPR-Cas9 с одной или несколькими функциональными группами или без них) для определения способности к связыванию. На последней стадии приведение в контакт выполняют преимущественно в условиях, позволяющих определить функцию. Вместо или в дополнение к выполнению такого анализа настоящее изобретение может предусматривать получение или синтез комплекса (комплексов) в результате указанного приведения в контакт и осуществление анализа комплекса (комплексов), например, с помощью рентгеновской дифракции, или ЯМР, или других способов, для определения способности к связыванию или взаимодействию. Затем можно получить подробную информацию о структуре, что касается связывания, и с учетом этой информации можно произвести корректировку структуры или функций кандидатной системы CRISPR-Cas9 или ее компонентов. При необходимости эти стадии можно повторять и проводить повторно. Альтернативно или в дополнение потенциальные системы CRISPR-Cas9 из вышеупомянутых способов или используемые в них могут находиться с молекулами нуклеиновой кислоты in vivo, в том числе без ограничения за счет введения в организм (в том числе отличного от человека животного и человека) для выяснения или подтверждения функции, в том числе того, дают ли они в результате требуемый исход (например, уменьшение проявления симптомов, лечение).

Настоящее изобретение дополнительно относится к способу определения трехмерных структур систем или комплекса (комплексов) CRISPR-Cas с неизвестной структурой с использованием координат структуры из документов, обсуждаемых в данном документе, особенно, если они скорректированы в отношении модификации (модификаций) или мутации (мутаций), обсуждаемых в данном документе. Например, если для системы или комплекса CRISPR-Cas неизвестной кристаллической структуры получены данные рентгеноструктурного анализа или ЯМР-спектроскопии, то структуру комплекса CRISPR-Cas9 можно использовать для интерпретации этих данных с получением вероятной структуры для неизвестной системы или комплекса с помощью таких методик, как фазовое моделирование в случае рентгеноструктурного анализа. Таким образом, способ может включать выравнивание графического представления системы или комплекса CRISPR-Cas с неизвестной кристаллической структурой с аналогичным графическим представлением системы или комплекса CRISPR-Cas9 с кристаллической структурой согласно документам, цитируемых в данном документе (преимущественно скорректированной в отношении модификации (модификаций) или мутации (мутаций) согласно данному документу), с обеспечением совпадения гомологичных или аналогичных участков (например, гомологичных или аналогичных последовательностей); моделирование структуры совпавших гомологичных или аналогичных участков (например, последовательностей) системы или комплекса CRISPR-Cas с неизвестной кристаллической структурой; и определение конформации (например, принимая во внимание то, что благоприятные взаимодействия должны формироваться так, чтобы формировалась низкоэнергетическая конформация) неизвестной кристаллической структуры, которая практически сохраняет структуру указанных совпавших гомологичных участков. "Гомологичными участками" описываются, например, что касается аминокислот, аминокислотные остатки в двух последовательностях, которые являются идентичными или имеют подобные, например, алифатические, ароматические, полярные, отрицательно заряженные или положительно заряженные химические группы боковых цепей. Гомологичные участки, что касается молекул нуклеиновой кислоты, могут характеризоваться по меньшей мере 85%, или 86%, или 87%, или 88%, или 89%, или 90%, или 91%, или 92%, или 93%, или 94%, или 95%, или 96%, или 97%, или 98%, или 99% гомологией или идентичностью. Идентичные и подобные участки иногда описываются специалистами в данной области как "инвариантные" и "консервативные" соответственно. Преимущественно первую и третью стадии выполняют с помощью компьютерного моделирования. Моделирование гомологии является методикой, которая хорошо известна специалистам в данной области (см., например, Greer, Science vol. 228 (1985) 1055, и Blundell et al. Eur J Biochem vol 172 (1988), 513). Компьютерное представление консервативных участков кристаллической структуры CRISPR-Cas9 согласно данному документу и таковых в системе CRISPR-Cas с неизвестной кристаллической структурой помогает прогнозировать и определять кристаллическую структуру системы CRISPR-Cas с неизвестной кристаллической структурой. Кроме того, аспекты настоящего изобретения, в которых используется кристаллическая структура CRISPR-Cas9 in silico, можно в равной степени применять к новой (новым) мутации(мутациям) или модификации(модификациям) согласно данному документу и кристаллической структуре CRISPR-Cas. Таким образом может быть получена библиотека кристаллических структур CRISPR-Cas. Таким образом, в настоящем изобретении предусмотрена рациональная разработка системы CRISPR-Cas. Например, после определения конформации или кристаллической структуры системы или комплекса CRISPR-Cas с помощью способов, описанных в данном документе (в том числе с учетом информации из уровня техники на основании документов, цитируемых в данном документе), такую конформацию можно использовать в способах, основанных на использовании компьютера, согласно данному документу для определения конформации или кристаллической структуры других систем или комплексов CRISPR-Cas, чья кристаллическая структура еще неизвестна. Данные всех этих кристаллических структур могут находиться в базе данных, и способы согласно данному документу могут быть более надежными, если сравнения согласно данному документу проводятся между кристаллической структурой или ее частями из данного документа и одной или несколькими кристаллическими структурами из библиотеки. В настоящем изобретении дополнительно предусмотрены системы, такие как компьютерные системы, предназначенные для получения структур и/или выполнения рациональной разработки системы или комплекса CRISPR-Cas. Система может содержать данные атомных координат или может быть получена из них, например, путем моделирования, при этом указанные данные определяют трехмерную структуру системы или комплекса CRISPR-Cas или по меньшей мере одного их домена или субдомена или их данные по структурному фактору, при этом указанные данные по структурному фактору получают из данных по атомным координатам. Настоящее изобретение также относится к машиночитаемым носителям с данными по атомным координатам, при этом указанные данные определяют трехмерную структуру системы или комплекса CRISPR-Cas или по меньшей мере одного их домена или субдомена или данные по их структурному фактору. "Машиночитаемые носители" относятся к любым носителям, которые могут быть считаны и доступ к которым может быть получен непосредственно с помощью компьютера, и включают без ограничения магнитное запоминающее устройство; оптическое запоминающее устройство; электрическое запоминающее устройство; облачное хранилище данных и гибриды этих категорий. Путем обеспечения таких машиночитаемых носителей к данным по атомных координатам может быть получен доступ обычным способом для моделирования или других способов "in silico". Настоящее изобретение дополнительно охватывает способы ведения коммерческой деятельности путем предоставления доступа к таким машиночитаемым носителям, например, на основании подписки, через Интернет или глобальную коммуникационную компьютерную сеть; или компьютерная система может быть доступна пользователю на основании подписки. "Компьютерная система" относится к аппаратным средствам, программным средствам и средствам хранения данных, применяемым для анализа данных по атомным координатам по настоящему изобретению. Минимальные аппаратные средства компьютерных систем по настоящему изобретению могут содержать центральный процессор (CPU), устройства ввода, устройства вывода и средства хранения данных. Для визуализации данных по структуре желательно обеспечить дисплей или монитор. Настоящее изобретение дополнительно охватывает способы передачи информации, представленной в данном документе или полученной любым способом или его стадией, описанными в данном документе, например, посредством телекоммуникаций, телефона, массовых коммуникаций, средств массовой информации, презентаций, Интернета, электронной почты и т.д. Кристаллические структуры по настоящему изобретению можно анализировать для получения карты(карт) распределения плотности электронов Фурье систем или комплексов CRISPR-Cas. Карты распределения плотности электронов Фурье могут быть рассчитаны на основании картин рентгеновской дифракции. Затем эти карты можно использовать для определения аспектов связывания или других взаимодействий. Карты распределения плотности электронов могут быть рассчитаны с использованием известных программ, таких как в компьютерном пакете CCP4 (Collaborative Computing Project, No. 4. The CCP4 Suite: Programs for Protein Crystallography, Acta Crystallographica, D50, 1994, 760-763). Для визуализации карт и построения моделей можно использовать такие программы, как "QUANTA" (1994, San Diego, Calif.: Molecular Simulations, Jones et al., Acta Crystallography A47 (1991), 110-119).

Приведенная в данном документе кристаллическая структура обеспечивает данные атомных координат для CRISPR-Cas9 (S. pyogenes) и перечни каждого атома с уникальным номером; химический элемент и его положение для каждого аминокислотного остатка (определяемого по картам распределения плотности электронов и сравнениям последовательностей антител), аминокислотный остаток, в котором расположен данный элемент, идентификатор цепи, номер остатка, координаты (например, X, Y, Z), которые определяют атомное положение относительно кристаллографических осей (в ангстремах) для соответствующего атома, заполнение атомом соответствующего положения, "B", параметр изотопного замещения (в ангстремах2), который отражает движение атома вокруг его атомного центра, и атомный номер.

В конкретных вариантах осуществления настоящего изобретения конформационные изменения кристаллических структур системы CRISPR-Cas9 или компонентов CRISPR-Cas9 обеспечивают важную и необходимую информацию о гибкости или подвижности белковых структурных участков относительно нуклеотидных (РНК или ДНК) структурных участков, которые могут быть важны для функции системы CRISPR-Cas. Информацию о структуре, представленную для Cas9 (например, Cas9 S. pyogenes: Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27. (2014). 156(5):935-49; или Cas9 Sa: Crystal Structure of Staphylococcus aureus Cas9, Nishimasu et al., Cell 162, 1113-1126 (Aug. 27, 2015)) в качестве фермента CRISPR в настоящей заявке, можно использовать для дополнительного конструирования и оптимизации системы CRISPR-Cas, и ее также можно экстраполировать на детальное исследование структурно-функциональных связей в системах с другим ферментом CRISPR. Один аспект настоящего изобретения относится к кристаллической структуре Cas9 S. pyogenes в комплексе с sgRNA и ее целевой ДНК при разрешающей способности в 2,4 Å. В структуре была выявлена двудольная компоновка, состоящая из доли распознавания мишени и нуклеазной доли, обеспечивающих размещение дуплекса sgRNA:ДНК в положительно заряженной бороздке на границе их соприкосновения. Доля распознавания является существенной для связывания sgRNA и ДНК, а нуклеазная доля содержит нуклеазные домены HNH и RuvC, расположенные надлежащим образом для расщепления комплементарной и некомплементарной нитей целевой ДНК соответственно. Эта структура с высоким разрешением и функциональные анализы, представленные в данном документе, объясняют молекулярный механизм направляемого РНК нацеливания на ДНК с помощью Cas9 и обеспечивают исчерпывающую информацию для получения оптимизированных систем CRISPR-Cas и их компонентов.

В конкретных вариантах осуществления настоящего изобретения кристаллическая структура обеспечивает необходимую стадию, направленную на понимание молекулярного механизма направляемого РНК нацеливания на ДНК с помощью Cas9. Структурные и функциональные анализы согласно данному документу обеспечивают пригодную основу для рациональной разработки технологий модуляции генома на основе Cas9 и могут служить руководством относительно опосредованного Cas9 распознавания последовательностей PAM на целевой ДНК или допустимости несовпадения между дуплексом sgRNA:ДНК. Аспекты настоящего изобретения также относятся к мутантам, полученным в результате усечения, например, мутант Cas9 S. pyogenes, полученный в результате усечения, может облегчать упаковку Cas9 в ограниченные по размеру вирусные векторы для in vivo и терапевтических применений. Аналогично, конструирование взаимодействующего с PAM (PI) домена может обеспечить программирование специфичности в отношении PAM, улучшить точность распознавания целевого сайта и повысить универсальность платформы конструирования генома Cas9. Кроме того, конструирование взаимодействующего с PAM (PI) домена может обеспечить программирование специфичности в отношении PAM, улучшить точность распознавания целевого сайта и повысить универсальность платформы конструирования генома Cas, например, Cas9. Белки Cas, такие как белки Cas9, можно конструировать с изменением их специфичности в отношении PAM, например, как описывается у Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592.

Настоящее изобретение охватывает оптимизированные функциональные ферментные системы CRISPR-Cas. В частности, фермент CRISPR содержит одну или несколько мутаций, которые превращают его в ДНК-связывающий белок, к которому могут быть рекрутированы, или добавлены, или вставлены, или прикреплены функциональные домены, проявляющие представляющую интерес функцию. В определенных вариантах осуществления фермент CRISPR содержит одну или несколько мутаций, которые включают без ограничения D10A, E762A, H840A, N854A, N863A или D986A (на основании нумерации аминокислотных положений Cas9 S. pyogenes), и/или одна или несколько мутаций находятся в домене RuvC1 или HNH фермента CRISPR или представляют собой другую мутацию, обсуждаемую в данном документе. В некоторых вариантах осуществления фермент CRISPR имеет одну или несколько мутаций в каталитическом домене, где при транскрипции парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен.

Информация о структуре, представленная в данном документе, позволяет детально изучить взаимодействие sgRNA (или химерной РНК) с целевой ДНК и ферментом CRISPR (например, Cas9), предоставляя возможность конструирования или изменения структуры sgRNA для оптимизации функциональности всей системы CRISPR-Cas. Например, петли в sgRNA могут быть увеличены без перекрывания с белком Cas9 путем вставки отличающейся (отличающихся) петли (петель) РНК или отличающейся (отличающихся) последовательности(последовательностей), которая (которые) могут рекрутировать адаптерные белки, которые могут связываться с отличающейся (отличающимися) петлей (петлями) РНК или отличающейся (отличающимися) последовательностью (последовательностями).

Функциональные варианты ферментов в соответствии с настоящим изобретением

В вариантах осуществления упоминаемый в данном документе белок Cas9 также охватывает функциональный вариант. "Функциональный вариант" белка, как используется в данном документе, обозначает вариант такого белка, который сохраняет, по меньшей мере частично, активность этого белка. Функциональные варианты могут включать мутантов (которые могут представлять собой мутанты, полученные в результате вставки, делеции или замещения), в том числе полиморфов и т.п. Также функциональные варианты включают продукты слияния такого белка с другими, обычно не родственными, нуклеиновой кислотой, белком, полипептидом или пептидом. Функциональные варианты могут встречаться в природе или могут быть получены человеком. Преимущественные варианты осуществления могут предусматривать сконструированный или не встречающийся в природе нацеливающийся на РНК эффектoрный белок II типа, например, Cas9 или его ортолог или гомолог.

Общая информация касательно мутации белков в соответствии с настоящим изобретением

Настоящее изобретение охватывает комплекс CRISPR-Cas, содержащий фермент CRISPR и направляющую РНК (sgRNA), где фермент CRISPR содержит по меньшей мере одну мутацию, вследствие которой фермент CRISPR характеризуется не более чем 5% нуклеазной активности фермента CRISPR, не имеющего по меньшей мере одной мутации и необязательно по меньшей мере одной или нескольких последовательностей ядерной локализации; направляющая РНК (sgRNA) содержит направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; и где фермент CRISPR ассоциирован с двумя или более функциональными доменами; или по меньшей мере одна петля sgRNA модифицирована путем вставки отличающейся (отличающихся) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с двумя или более функциональными доменами; или фермент CRISPR ассоциирован с одним или несколькими функциональными доменами, и по меньшей мере одна петля sgRNA модифицирована путем вставки отличающейся (отличающихся) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с одним или несколькими функциональными доменами.

Функциональные домены и адаптерные белки, аптамеры

Адаптерные белки могут включать без ограничения комбинации ортогональный связывающий РНК белок/аптамер, которые встречаются во множестве белков оболочки бактериофагов. Перечень таких белков оболочки включает без ограничения Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s и PRR1. Такие адаптерные белки или ортогональные связывающие РНК белки могут дополнительно ректурировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов. В некоторых вариантах осуществления функциональный домен может быть выбран из группы, состоящей из домена транспозазы, домена интегразы, домена рекомбиназы, домена резольвазы, домена инвертазы, домена протеазы, домена ДНК-метилтрансферазы, домена ДНК-гидроксилметилазы, домена ДНК-деметилазы, дезаминазы, домена гистонацетилазы, домена гистондеацетилазы, нуклеазного домена, репрессорного домена, активаторного домена, доменов сигнала ядерной локализации, домена белка, регулирующего транскрипцию (или рекрутирующего транскрипционный комплекс), домена, ассоциированного с активностью клеточного поглощения, домена связывания нуклеиновой кислоты, домена презентации антитела, модифицирующих гистоны ферментов, рекрутера модифицирующих гистоны ферментов; ингибитора модифицирующих гистоны ферментов, гистонметилтрансферазы, гистондеметилазы, гистонкиназы, гистонфосфатазы, гистонрибозилазы, гистондерибозилазы, гистонубиквитиназы, гистондеубиквитиназы, гистонбиотиназы и протеазы гистонового хвоста.

В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65. В некоторых вариантах осуществления функциональных домен представляет собой дезаминазу, такую как цитидиндезаминазу. Цитидиндезаминаза может быть направлена на целевую нуклеиновую кислоту, туда, где она управляет превращением цитидина в уридин, что приводит в результате к заменам C на T (G на A в комплементарной нити). В таком варианте осуществления нуклеотидные замены могут быть осуществлены без расщепления ДНК.

В одном аспекте для идентификации активности в отношении образования вставок/делеций/нуклеазной активности используют анализ с использованием нуклеазы Surveyor. В целом, анализ с использованием нуклеазы Surveyor включает экстракцию геномной ДНК, ПЦР-амплификацию участка генома, фланкирующего целевой сайт CRISPR, очистку продуктов, повторную гибридизацию для обеспечения образования гетеродуплексов. После повторной гибридизации продукты обрабатывают нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics) согласно протоколу, рекомендованному производителем. Анализ можно проводить с использованием полиакриламидных гелей в соответствии с известными способами. Количественный анализ может основываться на значениях относительной интенсивности окрашивания полос.

***Индуцируемый фермент и разделяемый фермент ("Split-Cas9")

В одном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная система CRISPR-Cas на основе индуцируемого Cas9, содержащая:

первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого димера, и

вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого димера,

где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,

где вторая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерного экспорта,

где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого димера вместе,

где сведение первой и второй половинок индуцируемого димера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,

где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и

где функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью и необязательно редактирует локус генома для изменения экспрессии генов.

В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 индуцируемый димер представляет собой, или содержит, или состоит, по сути, из, или состоит из индуцируемого гетеродимера. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 первая половинка, или первая часть, или первый фрагмент индуцируемого гетеродимера представляет собой, или содержит, или состоит из, или состоит, по сути, из FKBP, необязательно FKBP12. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 вторая половинка, или вторая часть, или второй фрагмент индуцируемого гетеродимера представляет собой, или содержит, или состоит из, или состоит, по сути, из FRB. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 порядок расположения в первой слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит из, или состоит, по сути, из N'-концевой части Cas9-FRB-NES. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 порядок расположения в первой слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит из, или состоит, по сути, из NES-N'-концевая часть Cas9-FRB-NES. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 порядок расположения во второй слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит, по сути, из, или состоит из C'-концевой части Cas9-FKBP-NLS. В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, в которой порядок расположения во второй слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит из, или состоит, по сути, из NLS-C'-концевая часть Cas9-FKBP-NLS. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 может присутствовать линкер, который отделяет часть Cas9 от половинки, или части, или фрагмента индуцируемого димера. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 источник энергии, являющийся индуктором, представляет собой, или содержит, или состоит, по сути, из, или состоит из рапамицина. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 индуцируемый димер представляет собой индуцируемый гомодимер. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 - Cas9 представляет собой FnCas9. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 один или несколько функциональных доменов ассоциированы с одной или обеими частями Cas9, например, функциональные домены необязательно включают активатор транскрипции, транскрипционный элемент или нуклеазу, такую как нуклеаза Fok1. В одном аспекте системы CRISPR-Cas на основе индуцируемого Cas9 функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью, и при этом фермент представляет собой нефункциональный Cas9, который необязательно характеризуется нуклеазной активностью, сниженной по меньшей мере на 97% или 100% (или характеризуется не более чем 3% и преимущественно 0% нуклеазной активностью) по сравнению с Cas9, не имеющим по меньшей мере одной мутации. Настоящее изобретение дополнительно охватывает полинуклеотид, кодирующий систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе, и он предусмотрен в одном аспекте настоящего изобретения.

В одном аспекте настоящего изобретения предусмотрен вектор для доставки первой слитой конструкции на основе Cas9, к которой прикреплена первая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерной локализации, в соответствии с обсуждаемым в данном документе. В одном аспекте настоящего изобретения предусмотрен вектор для доставки второй слитой конструкции на основе Cas9, к которой прикреплена вторая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерного экспорта.

В одном аспекте настоящего изобретения предусмотрен вектор для доставки как первой слитой конструкции на основе Cas9, к которой прикреплена первая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерной локализации, обсуждаемыми в данном документе; так и второй слитой конструкции на основе Cas9, к которой прикреплена вторая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерного экспорта, обсуждаемыми в данном документе.

В одном аспекте вектор может представлять отдельную плазмиду или кассету экспрессии.

В одном аспекте настоящего изобретения предусмотрены эукариотическая клетка-хозяин или линия клеток, трансформированные с помощью любого из векторов, обсуждаемых в данном документе, или экспрессирующие систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе.

В одном аспекте настоящего изобретения предусмотрен трансгенный организм, трансформированный с помощью любого из векторов, обсуждаемых в данном документе, или экспрессирующий систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе, или его потомство. В одном аспекте настоящего изобретения предусмотрен модельный организм, который конститутивно экспрессирует систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе.

В одном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная система CRISPR-Cas на основе индуцируемого Cas9, содержащая:

первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого гетеродимера, и

вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого гетеродимера,

где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,

где вторая слитая конструкция на основе Cas9 функционально связана с сигналом ядерного экспорта,

где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гетеродимера вместе,

где сведение первой и второй половинок индуцируемого гетеродимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,

где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и

где функциональная система CRISPR-Cas на основе Cas9 редактирует локус генома для изменения экспрессии генов.

В одном аспекте настоящего изобретения предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, обсуждаемого в данном документе, или любого из векторов, обсуждаемых в данном документе, и введение субъекту источника энергии, являющегося индуктором. Настоящее изобретение охватывает пути применения такого полинуклеотида или вектора в изготовлении лекарственного препарата, например, такого лекарственного препарата, предназначенного для лечения субъекта или для такого способа лечения субъекта. Настоящее изобретение охватывает полинуклеотид, обсуждаемый в данном документе, или любой из векторов, обсуждаемых в данном документе, для применения в способе лечения субъекта, нуждающегося в этом, предусматривающем индуцирование редактирования генов, где способ дополнительно включает введение субъекту источника энергии, являющегося индуктором. В одном аспекте в способе также обеспечивается матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации.

В настоящем изобретении также предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование активации или репрессии транскрипции путем трансформации субъекта с помощью полинуклеотида, обсуждаемого в данном документе, или любого из векторов, обсуждаемых в данном документе, где указанные полинуклеотид или вектор кодируют или содержат каталитически неактивный Cas9 и один или несколько ассоциированных c ним функциональных доменов, обсуждаемых в данном документе; при этом способ дополнительно включает введение субъекту источника энергии, являющегося индуктором. В настоящем изобретении также предусмотрены полинуклеотид, обсуждаемый в данном документе, или любой из векторов, обсуждаемых в данном документе, для применения в способе лечения субъекта, нуждающегося в этом, включающем индуцирование активации или репрессии транскрипции, где способ дополнительно включает введение субъекту источника энергии, являющегося индуктором.

Соответственно, настоящее изобретение охватывает, помимо прочего, гомодимеры, а также гетеродимеры, нефункциональный Cas9 или Cas9, характеризующийся фактически отсутствием нуклеазной активности, например, из-за мутации, системы или комплексы, в которых присутствуют одна или несколько NLS и/или одна или несколько NES; функциональный (функциональные) домен (домены), связанный (связанные) со split-Cas9; способы, в том числе способы лечения, и пути применения.

Следует понимать, что когда в данном документе ссылаются на Cas9, белок Cas9 или фермент Cas9, то под ними подразумевают split-Cas9 согласно настоящему изобретению. В одном аспекте настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии продукта гена. Указанный способ может предусматривать введение в клетку, содержащую и экспрессирующую молекулу ДНК, кодирующую продукт гена, сконструированной, не встречающейся в природе системы CRISPR-Cas на основе Cas9, содержащей белок Cas9 и направляющую РНК, которая нацеливается на молекулу ДНК, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего изменяется экспрессия продукта гена; и где белок Cas9 и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, связанную с последовательностью прямого повтора (DR). Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR-Cas на основе Cas9, содержащая белок Cas9 и направляющую РНК, которая нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего изменяется экспрессия продукта гена; и где белок Cas9 и направляющая РНК не встречаются в природе вместе; при этом предусматривается split-Cas9 согласно настоящему изобретению. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, связанную с последовательностью DR. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В другом аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе векторная система, содержащая один или несколько векторов, содержащих первый регуляторный элемент, функционально связанный с направляющей РНК системы CRISPR-Cas на основе Cas9, которая нацеливается на молекулу ДНК, кодирующую продукт гена, и второй регуляторный элемент, функционально связанный с белком Cas9; при этом предусматривается split-Cas9 согласно настоящему изобретению. Компоненты (a) и (b) могут быть расположены в одном и том же или разных векторах системы. Направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего изменяется экспрессия продукта гена; и где белок Cas9 и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, связанную с последовательностью DR. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая один или несколько векторов. В некоторых вариантах осуществления система содержит: (a) первый регуляторный элемент, функционально связанный с последовательностью DR и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности DR, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) последовательностью DR; и (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент Cas9, содержащий последовательность ядерной локализации; где компоненты (a) и (b) находятся в одном и том же или разных векторах системы; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 со своей целевой последовательностью в эукариотической клетке.

В некоторых вариантах осуществления комплекс CRISPR-Cas на основе Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного комплекса CRISPR-Cas на основе Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. Не вдаваясь в теорию, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR-Cas на основе Cas9 у эукариот, но включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновой кислоты в ядре.

В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 видов бактерий, выбранных из группы, состоящей из Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae, и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления минимальная длина прямого повтора составляет 16 нуклеотидов, и он содержит одну "петлю-на-стебле". В дополнительных вариантах осуществления длина прямого повтора составляет более 16 нуклеотидов, предпочтительно более 17 нуклеотидов, и он содержит более одной "петли-на-стебле" или оптимизированных вторичных структур.

В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности DR, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) последовательностью DR; и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент Cas9, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b); при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления Cas9 не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления минимальная длина прямого повтора составляет 16 нуклеотидов, и он содержит одну "петлю-на-стебле". В дополнительных вариантах осуществления длина прямого повтора составляет более 16 нуклеотидов, предпочтительно более 17 нуклеотидов, и он содержит более одной "петли-на-стебле" или оптимизированных вторичных структур. В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение. Кроме того, организм может представлять собой гриб.

В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности DR, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) последовательностью DR; и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент Cas9, содержащий последовательность ядерной локализации, и преимущественно он предусматривает split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 видов бактерий, выбранных из группы, состоящей из Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae, и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления фермент CRISPR не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления минимальная длина прямого повтора составляет 16 нуклеотидов, и он содержит одну "петлю-на-стебле". В дополнительных вариантах осуществления длина прямого повтора составляет более 16 нуклеотидов, предпочтительно более 17 нуклеотидов, и он содержит более одной "петли-на-стебле" или оптимизированных вторичных структур.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного Cas9; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из Cas9 и направляющей последовательности, связанной с последовательностью DR. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с полинуклеотидом, так что указанное связывание приводит к повышенной или сниженной экспрессии указанного полинуклеотида; где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с направляющей последовательностью, гибридизирующейся с целевой последовательностью в пределах указанного полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из Cas9 и направляющей последовательности, связанной с последовательностью DR.

В одном аспекте настоящего изобретения предусмотрен способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из Cas9 и направляющей последовательности, связанной с последовательностью прямого повтора; и (b) обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, ответственного за развитие заболевания, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, и (2) последовательностью DR, с получением тем самым модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного Cas9. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность.

В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.

В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий направляющую последовательность ниже последовательности прямого повтора, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.

В одном аспекте настоящего изобретения предусмотрен способ отбора клетки или нескольких клеток путем введения одной или нескольких мутаций в ген в одной или нескольких клетках, при этом способ предусматривает введение одного или нескольких векторов в клетку (клетки), где один или несколько векторов управляют экспрессией одного или нескольких из Cas9, направляющей последовательности, связанной с последовательностью прямого повтора, и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые обеспечивают прекращение расщепления под действием Cas9; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в клетке (клетках), подлежащей (подлежащих) отбору; обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, и (2) последовательностью прямого повтора, где связывание комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом индуцирует гибель клетки, тем самым обеспечивая возможность отбора одной или нескольких клеток, в которые были введены одна или несколько мутаций; при этом предусматривается split-Cas9 согласно настоящему изобретению. В другом предпочтительном варианте настоящего изобретения клетка, подлежащая отбору, может представлять собой эукариотическую клетку. Аспекты настоящего изобретения предусматривают отбор специфических клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.

В данном документе встречается фраза "при этом предусматривается split-Cas9 согласно настоящему изобретению" или подобное выражение; и они указывают на то, что Cas9 в представленных в данном документе вариантах осуществления может представлять собой split-Cas9, обсуждаемый в данном документе.

В одном аспекте настоящее изобретение относится к не встречающейся в природе или сконструированной системе CRISPR-Cas на основе индуцируемого Cas9, содержащей первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого гетеродимера, и вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого гетеродимера, где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации, где вторая слитая конструкция на основе Cas9 функционально связана с сигналом ядерного экспорта, где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гетеродимера вместе, где сведение первой и второй половинок индуцируемого гетеродимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9, где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и где функциональная система CRISPR-Cas на основе Cas9 редактирует локус генома для изменения экспрессии генов. В одном варианте осуществления настоящего изобретения первая половинка индуцируемого гетеродимера представляет собой FKBP12, а вторая половинка индуцируемого гетеродимера представляет собой FRB. В другом варианте осуществления настоящего изобретения источником энергии, являющимся индуктором, является рапамицин.

Источником энергии, являющимся индуктором, можно считать просто индуктор или димеризующее средство. Термин "источник энергии, являющийся индуктором" используется по всему данному документу для согласованности. Источник энергии, являющийся индуктором, (или индуктор) действует с восстановлением Cas9. В некоторых вариантах осуществления источник энергии, являющийся индуктором, обеспечивает сведение двух частей Cas9 вместе за счет действия двух половинок индуцируемого димера. Две половинки индуцируемого димера, следовательно, сводятся вместе в присутствии источника энергии, являющегося индуктором. Без источника энергии, являющегося индуктором, две половинки димера не будут образовывать димер (димеризоваться).

Таким образом, две половинки индуцируемого димера взаимодействуют с источником энергии, являющимся индуктором, с димеризацией в димер. В свою очередь, это обеспечивает восстановление Cas9 путем сведения первой и второй частей Cas9 вместе.

Каждая из слитых конструкций на основе фермента CRISPR содержит одну часть split-Cas9. Они сливаются, предпочтительно посредством линкера, такого как линкер GlySer, описанный в данном документе, с одной из двух половин димера. Две половинки димера могут быть, по сути, двумя одинаковыми мономерами, которые вместе образуют гомодимер, или они могут быть разными мономерами, которые вместе образуют гетеродимер. Таким образом, два мономера можно рассматривать как одну половинку полного димера.

Cas9 является составным в том смысле, что две части фермента Cas9, по сути, содержат функциональный Cas9. Такой Cas9 может функционировать как фермент, редактирующий геном (при образовании комплекса с целевой ДНК и направляющей), такой как никаза или нуклеаза (расщепляющая обе нити ДНК), или он может быть нефункциональным Cas9, который в сущности представляет собой ДНК-связывающий белок с очень небольшой каталитической активностью или с отсутствием таковой, как правило, из-за мутации (мутаций) в его каталитических доменах.

Две части split-Cas9 можно рассматривать как N'-концевую часть и C'-концевую часть split-Cas9. Слияние, как правило, происходит в точке разделения Cas9. Другими словами, С'-конец N'-концевой части split-Cas9 сливается с одной из половинок димера, тогда как N'-конец C'-концевой части сливается с другой половинкой димера.

Cas9 не подлежит разделению в том смысле, что заново образуется разрыв. Точку разделения, как правило, разрабатывают in silico и клонируют в конструкции. Вместе две части split-Cas9, N'-концевая и C'-концевая части, образуют полный Cas9, содержащий предпочтительно по меньшей мере 70% или больше аминокислот дикого типа (или нуклеотидов, кодирующих их), предпочтительно по меньшей мере 80% или больше, предпочтительно по меньшей мере 90% или больше, предпочтительно по меньшей мере 95% или больше, и наиболее предпочтительно по меньшей мере 99% или больше аминокислот дикого типа (или нуклеотидов, кодирующих их). Может быть возможным некоторое урезание, и при этом предусматриваются мутанты. Нефункциональные домены могут быть полностью удалены. Важно то, что две части могут быть сведены вместе, и что требуемая функция Cas9 возобновляется или восстанавливается.

Димер может быть гомодимером или гетеродимером.

Один или несколько, предпочтительно два, NLS можно использовать в функциональном связывании с первой конструкцией на основе Cas9. Один или несколько, предпочтительно два, NES можно использовать в функциональном связывании с первой конструкцией на основе Cas9. NLS и/или NES предпочтительно фланкируют слияние split-Cas9-димера (т.e. половины димера), т. e. один NLS может быть расположен на N'-конце первой конструкции на основе Cas9, и один NLS может быть на C'-конце первой конструкции на основе Cas9. Аналогично, один NES может быть расположен на N'-конце второй конструкции на основе Cas9, и один NES может быть на C'-конце второй конструкции на основе Cas9. Если ссылаются на N'- или C'-концы, следует понимать, что они соответствуют 5'- и 3'-концам в соответствующей нуклеотидной последовательности.

Предпочтительный порядок расположения заключается в том, что первая конструкция на основе Cas9 устроена так: 5'-NLS-(N'-концевая часть Cas9)-линкер-(первая половина димера)-NLS-3'. Предпочтительный порядок расположения заключается в том, что вторая конструкция на основе Cas9 устроена так: 5'-NES-(вторая половина димера)-линкер-(C'-концевая часть Cas9)-NES-3'. Подходящий промотор предпочтительно находится выше каждой из этих конструкций. Две конструкции можно доставлять отдельно или вместе.

В некоторых вариантах осуществления один или все из NES для функционального связывания со второй конструкцией на основе Cas9 могут быть заменены на NLS. Однако это, как правило, может быть не предпочтительным, и в других вариантах осуществления сигнал локализации для функционального связывания со второй конструкцией Cas9 представляет собой один или несколько NES.

Также следует понимать, что NES может быть функционально связан с N'-концевым фрагментом split-Cas9, и что NLS может быть функционально связан с C'-концевым фрагментом split-Cas9. Однако порядок расположения, при котором NLS функционально связан с N'-концевым фрагментом split-Cas9, а NES функционально связан с С'-концевым фрагментом split-Cas9, может быть предпочтительным.

NES функционирует с тем, чтобы локализовать вторую слитую конструкцию на основе Cas9 вне ядра, по меньшей мере до тех пор, пока не будет обеспечен источник энергии, являющийся индуктором (например, по меньшей мере до тех пор, пока не будет обеспечен источник энергии для выполнения индуктором своей функции). Присутствие индуктора стимулирует димеризацию двух продуктов слияния на основе Cas9 в цитоплазме и делает термодинамически выгодным перемещение в ядро димеризованных первого и второго продуктов слияния на основе Cas9. Без ограничения теорией, заявители полагают, что NES обеспечивает изоляцию второго продукта слияния на основе Cas9 в цитоплазме (т.e. вне ядра). NLS в первом продукте слияния на основе Cas9 обеспечивает его локализацию в ядре. В обоих случаях, заявители используют NES или NLS для сдвига равновесия (равновесия ядерного транспорта) в требуемом направлении. Димеризация, как правило, происходит вне ядра (очень небольшая часть может происходить в ядре), и NLS в димеризованном комплексе сдвигают равновесие ядерного транспорта к ядерной локализации, так что димеризованный и, следовательно, восстановленный Cas9 проникает в ядро.

Фактически, заявители способны восстанавливать функцию split-Cas9. Для доказательства концепции применяли транзиентную трансфекцию, и димеризация происходила в фоновом режиме в присутствии источника энергии, являющегося индуктором. Никакой активности не наблюдали в случае отдельных фрагментов Cas9. Затем обеспечивали стабильную экспрессию посредством доставки лентивируса для проявления этого, и было показано, что подход со split-Cas9 может быть применимым.

Такой подход со split-Cas9 согласно настоящему изобретению является полезным, поскольку он обеспечивает возможность индуцирования активности Cas9, обеспечивая таким образом временный контроль. Более того, для снижения активности самособранных комплексов в окружении можно использовать разные последовательности локализации (т. e. NES и NLS как предпочтительные). Тканеспецифичные промоторы, например, один для каждой из первой и второй слитых конструкций на основе Cas9, также можно использовать для специфического в отношении ткани нацеливания, с обеспечением таким образом пространственного контроля. Два разных тканеспецифичных промотора можно использовать, чтобы обеспечить при необходимости более высокую степень контроля. Этот же подход можно использовать по отношению к специфичным в отношении стадии промоторов, или может быть смесь специфичных в отношении стадии промоторов и тканеспецифичных промоторов, при этом одна из первой и второй слитых конструкций на основе Cas9 находится под контролем (т.e. функционально связана или содержит) тканеспецифичного промотора, тогда как другая из первой и второй слитых конструкций на основе Cas9 находится под контролем (т.e. функционально связана или содержит) специфичного в отношении стадии промотора.

Система CRISPR-Cas на основе индуцируемого Cas9 содержит одну или несколько последовательностей ядерной локализации (NLS), описанных в данном документе, например, функционально связанные с первой слитой конструкцией на основе Cas9. Эти последовательности ядерной локализации в идеальном случае характеризуются достаточной эффективностью, чтобы управлять накоплением указанной первой слитой конструкции на основе Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. Не вдаваясь в теорию, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR-Cas на основе Cas9 у эукариот, но включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновой кислоты в ядре, и содействует функционированию системы из 2 частей согласно настоящему изобретению.

Подобным образом, вторая слитая конструкция на основе Cas9 функционально связана с последовательностью ядерного экспорта (NES). На самом деле, она может быть связана с одной или несколькими последовательностями ядерного экспорта. Другими словами, число последовательностей экспорта, используемых со второй слитой конструкцией на основе Cas9, предпочтительно составляет 1, или 2, или 3. Как правило, 2 являются предпочтительными, но 1 достаточна, и поэтому является предпочтительной в некоторых вариантах осуществления. Подходящие примеры NLS и NES известны из уровня техники. Например, предпочтительным сигналом ядерного экспорта (NES) является человеческий белок тирозинкиназа 2. Предпочтительные сигналы будут видоспецифичными.

Если используется система FRB и FKBP, то FKBP предпочтительно фланкируется последовательностями ядерной локализации (NLS). Если используется система FRB и FKBP, то предпочтительный порядок расположения представляет собой N'-концевой Cas9-FRB-NES: C'-концевой Cas9-FKBP-NLS. Таким образом, первая слитая конструкция на основе Cas9 будет содержать C'-концевую часть Cas9, а вторая слитая конструкция Cas9 будет содержать N'-концевую часть Cas9.

Другой полезный аспект настоящего изобретения заключается в том, что она может быть быстро активизироваться, т.е. имеет быструю реакцию. Без ограничения теорией полагают, что активность Cas9 может быть индуцирована посредством димеризации имеющихся (уже присутствующих) слитых конструкций (за счет приведения в контакт с источником энергии, являющимся индуктором) быстрее, чем посредством экспрессии (в особенности трансляции) новых слитых конструкций. Таким образом, первая и вторая слитые конструкции на основе Cas9 могут экспрессироваться в целевой клетке заблаговременно, т.е. до того, как потребуется активность Cas9. Затем активность Cas9 может временно контролироваться, а потом быстро устанавливаться путем добавления источника энергии, являющегося индуктором, который в идеале действует быстрее (с димеризацией гетеродимера и обеспечением тем самым активности Cas9), чем посредством экспрессии (в том числе индукции транскрипции) Cas9, доставленного, например, вектором.

Термины "Cas9" или "фермент Cas9" и "фермент CRISPR" используются в данном документе взаимозаменяемо, если не является очевидным иное.

Заявители продемонстрировали, что Cas9 может быть разделен на два компонента, которые при сведении вновь вместе восстанавливают функциональную нуклеазу. С использованием чувствительных к рапамицину доменов димеризации заявители получили химически индуцируемый Cas9 для временного контроля опосредованного Cas9 редактирования генома и модулирования транскрипции. Другими словами, заявители продемонстрировали, что Cas9 может быть химически индуцируемым, будучи разделенным на два фрагмента, и что чувствительные к рапамицину домены димеризации можно использовать для контролируемой повторной сборки Cas9. Заявители показали, что повторно собранный Cas9 может использоваться для опосредования редактирования генома (посредством нуклеазной/никазной активности), а также для модулирования транскрипции (в качестве ДНК-связывающего домена, так называемого "нефункционального Cas9").

Таким образом, использование чувствительных к рапамицину доменов димеризации является предпочтительным. Повторная сборка Cas9 является предпочтительной. Повторная сборка может определяться путем восстановления активности связывания. Если Cas9 представляет собой никазу или индуцирует двухнитевой разрыв, то проводят подходящее процентное сравнение с диким типом, как описывается в данном документе.

Обработка рапамицином может продолжаться 12 дней. Доза может составлять 200 нM. Такая временная и/или молярная дозировка является примером соответствующей дозы для линий клеток эмбриональной почки человека 293FT (HEK293FT), и ее также можно использовать для других линий клеток. Эта схема может быть экстраполирована для терапевтического применения in vivo, например, в мг/кг. Однако в данном случае также предусматривается, что стандартную дозировку также используют для введения рапамицина субъекту. Под "стандартной дозировкой" подразумевают дозировку при обычном терапевтическом применении рапамицина или первичном показании (т. e. дозу, используемую при введении рапамицина для предупреждения отторжения органа).

Следует отметить, что предпочтительным порядком расположения частей Cas9-FRB/FKBP является отдельный, и они являются неактивными до тех пор, пока индуцируемая рапамицином димеризация FRB и FKBP не приведет к повторной сборке функциональной полноразмерной нуклеазы Cas9. Таким образом, предпочтительно, чтобы первая слитая конструкция на основе Cas9, к которой прикреплена первая половина индуцируемого гетеродимера, доставлялась отдельно и/или локализовалась отдельно от второй слитой конструкции на основе Cas9, к которой присоединена первая половина индуцируемого гетеродимера.

Для обеспечения изоляции фрагмента Cas9(N)-FRB в цитоплазме, где существует меньшая вероятность димеризации с фрагментом Cas9(C)-FKBP, локализуемым в ядре, предпочтительно использовать в Cas9(N)-FRB одну последовательность ядерного экспорта (NES) из человеческой протеинтирозинкиназы 2 (Cas9(N)-FRB-NES). В присутствии рапамицина Cas9(N)-FRB-NES димеризуется с Cas9(C)-FKBP-2xNLS с восстановлением полного белка Cas9, что сдвигает равновесие ядерного транспорта в направлении ядерного импорта и обеспечивает возможность нацеливания на ДНК.

Высокая дозировка Cas9 может увеличить частоту образования вставок-делеций в нецелевых (OT) последовательностях, которые характеризуются несколькими несовпадающими основаниями с направляющей нитью. Такие последовательности являются особенно восприимчивыми, если несовпадающие основания являются непоследовательными и/или находятся за пределами затравочного участка направляющей. Соответственно, временный контроль активности Cas9 может использоваться для снижения дозировки в экспериментах с длительной экспрессией, и, следовательно, приводить к сниженному образованию нецелевых вставок/делеций по сравнению с конститутивно активным Cas9.

Доставка с помощью вирусов является предпочтительной. В частности, предусматривается вектор доставки на основе лентивируса или AAV. Заявители получили конструкцию split-Cas9 на основе лентивируса, подобную плазмиде lentiCRISPR. Составные части должны быть достаточно маленькими, чтобы соответствовать ограничению по размеру AAV, составляющему ~4,7 т.п.о.

Заявители продемонстрировали, что стабильную низкокопийную экспрессию split-Cas9 можно использовать для индуцирования существенных вставок/делеций в целевом локусе без значительной мутации в нецелевых сайтах. Заявители клонировали фрагменты Cas9 (2 части на основе split 5, описанного в данном документе).

Также можно использовать нефункциональный Cas9, содержащий домен трансактивации VP64, например, добавленный к Cas9(C)-FKBP-2xNLS (неактивный Cas9(C)-FKBP-2xNLS-VP64). Эти фрагменты восстанавливают каталитически неактивный продукт слияния Cas9-VP64 (нефункциональный Cas9-VP64). Активация транскрипции индуцируется с помощью VP64 в присутствии рапамицина с индуцированием димеризации продукта слияния Cas9(C)-FKBP и продукта слияния Cas9(N)-FRB. Другими словами, заявители тестировали индуцируемость разделяемого нефункционального Cas9-VP64 и показали, что активация транскрипции индуцируется нефункциональным split-Cas9-VP64 в присутствии рапамицина. Таким образом, индуцируемый Cas9 согласно настоящему изобретению может быть ассоциирован с одним или несколькими функциональными доменами, такими как активатор или репрессор транскрипции или нуклеаза (такая как Fok1). Функциональный домен может быть связан или слит с одной частью split-Cas9.

Предпочтительный порядок расположения заключается в том, что первая конструкция на основе Cas9 устроена так: 5'-первый сигнал локализации-(N'-концевая часть Cas9)-линкер-(первая половинка димера)-первый сигнал локализации-3', и вторая конструкция на основе Cas9 устроена так: 5'-второй сигнал локализации-(вторая половинка димера)-линкер-(C'-концевая часть Cas9)-второй сигнал локализации-функциональный домен-3'. В данном случае функциональный домен помещен на 3'-конце второй конструкции на основе Cas9. Альтернативно, функциональный домен может быть помещен на 5'-конце первой конструкции на основе Cas9. Один или несколько функциональных доменов можно использовать на 3'-конце, или 5'-конце, или на обоих концах. Подходящий промотор предпочтительно находится выше каждой из этих конструкций. Две конструкции можно доставлять отдельно или вместе. Сигналами локализации могут быть NLS или NES, при условии, что они не перемешиваются в каждой конструкции.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, где Cas9 характеризуется нуклеазной активностью, сниженной по меньшей мере на 97% или 100% по сравнению с ферментом Cas9, не имеющим по меньшей мере одной мутации.

Соответственно, также предпочтительно, чтобы Cas9 представлял собой нефункциональный Cas9. В идеальном случае, разделение всегда должно быть таким, чтобы каталитический (каталитические) домен (домены) не подвергался (не подвергались) воздействию. Значение нефункционального Cas9 состоит в том, что происходит связывание с ДНК, но не происходит расщепление или не проявляется никазная активность.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где один или несколько функциональных доменов ассоциированы с Cas9. Такой функциональных домен может быть ассоциирован (т.e. связан или слит) с одной или обеими частями split-Cas9. Он может быть ассоциирован с каждой из двух частей split-Cas9. Следовательно, они могут быть представлены, как правило, в виде части первой и/или второй слитых конструкций на основе Cas9, в виде продуктов слияния в пределах этой конструкции. Функциональные домены, как правило, сливаются посредством линкера, такого как линкер GlySer, обсуждаемый в данном документе. Один или несколько функциональных доменов могут представлять собой домен активации или домен репрессии транскрипции. Хотя они могут представлять собой разные домены, предпочтительно, чтобы все функциональные домены являлись либо активаторами, либо репрессорами, и чтобы не использовалась смесь двух.

Домен активации транскрипции может включать VP64, p65, MyoD1, HSF1, RTA или SET7/9.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где один или несколько функциональных доменов, ассоциированных с Cas9, представляют собой домен репрессии транскрипции.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где домен репрессии транскрипции представляет собой домен KRAB.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК, активность интеграции ДНК или активность связывания нуклеиновой кислоты.

Домены, модифицирующие гистоны, также являются предпочтительными в некоторых вариантах осуществления. Иллюстративные домены, модифицирующие гистоны, обсуждаются ниже. Домены транспозазы, домены механизма HR (гомологичной рекомбинации), домены рекомбиназы и/или домены интегразы также являются предпочтительными в качестве функциональных доменов по настоящему изобретению. В некоторых вариантах осуществления активность интеграции ДНК имеют домены механизма HR, домены интегразы, домены рекомбиназы и/или домены транспозазы.

В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемой Cas9, обсуждаемая в данном документе, где активность расщепления ДНК обеспечивается нуклеазой.

В одном аспекте настоящего изобретения предусматривается система CRISPR-Cas на основе индуцируемой Cas9, обсуждаемая в данном документе, где нуклеаза предусматривает нуклеазу Fok1.

Применение таких функциональных доменов, которые являются предпочтительными для системы на основе split-Cas9 согласно настоящему изобретению, также подробно обсуждается в Konermann et al. ("Genome-scale transcriptional activation with an engineered CRISPR-Cas9 complex", опубликованной в Nature 11 декабря 2014 г.).

Система согласно настоящему изобретению может применяться с любой направляющей.

В определенных вариантах осуществления могут применяться модифицированные направляющие. Особенно предпочтительными являются направляющие в соответствии с идеями вышеупомянутой статьи Konermann, опубликованной в Nature 11 декабря 2014 г. Эти направляющие модифицированы тем, что добавлены связывающиеся с белком части РНК (такие как аптамеры). Такая (такие) часть (части) может (могут) замещать часть направляющей. Соответствующие домены связывающего РНК белка могут использоваться для последующего распознавания РНК и рекрутирования функциональных доменов, таких как описываемые в данном документе, к направляющей. Они прежде всего предназначены для применения с нефункциональным Cas9, что приводит к активации или репрессии транскрипции или расщеплению ДНК посредством нуклеаз, таких как Fok1. Применение таких направляющих в комбинации с нефункциональным Cas9 является эффективным, и оно особенно эффективно, если сам Cas9 также ассоциирован со своим собственным функциональным доменом, обсуждаемым в данном документе. Если нефункциональный Cas9 (с ассоциированным своим собственным функциональным доменом или без него) индуцируется с восстановлением в соответствии с настоящим изобретением, т.e. представляет собой split-Cas9, то инструмент является особенно пригодным.

Направляющая РНК (gRNA), также предпочтительная для применения в соответствии с настоящим изобретением, может содержать направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где gRNA модифицирована путем вставки отличающейся (отличающихся) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с одним или несколькими функциональными доменами. Cas9 может содержать по меньшей мере одну мутацию, вследствие которой фермент Cas9 характеризуется не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации; и/или по меньшей мере одну или несколько последовательностей ядерной локализации. Также предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая одну или несколько направляющих РНК (gRNA), содержащих направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент Cas9 содержит по меньшей мере одну мутацию, вследствие которой фермент Cas9 характеризуется не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, где по меньшей мере одна gRNA модифицирована путем вставки отличающейся (отличающихся) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с одним или несколькими функциональными доменами.

gRNA предпочтительно модифицирована путем вставки отличающейся (отличающихся) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками. Вставка отличающейся (отличающихся) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, предпочтительно представляет собой аптамерную последовательность или две или более аптамерные последовательности, специфичные в отношении одного и того же адаптерного белка или разных адаптерных белков. Адаптерный белок предпочтительно предусматривает MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1. Могут быть пригодны линии клеток, стабильно экспрессирующие, помимо прочего, нефункциональный split-Cas9.

Заявители продемонстрировали, что Cas9 может быть разделен на два отличающихся фрагмента, которые при сведении вновь вместе с помощью химической индукции восстанавливают функциональную полноразмерную нуклеазу Cas9. Структура split-Cas9 будет пригодной для ряда применений. Например, split-Cas9 может обеспечивать возможность осуществления генетических стратегий, направленных на ограничение активности Cas9 в популяциях клеток, находящихся на границе раздела, путем помещения каждого фрагмента под контроль разных тканеспецифичных промоторов. Кроме того, также можно использовать разные химически индуцируемые домены димеризации, такие как APA и гиббереллин.

Источником энергии, являющимся индуктором, предпочтительно является химическая индукция.

Положением или местоположением разделения является точка, в которой первая часть фермента Cas9 отделяется от второй части. В некоторых вариантах осуществления первая часть будет содержать или кодировать от 1 до X аминокислоты, тогда как вторая часть будет содержать или кодировать от X+1 аминокислоты до конца. В данном примере нумерация является непрерывной, но это не всегда может быть необходимо, поскольку аминокислоты (или нуклеотиды, кодирующие их) могут быть урезаны с конца любого из разделенных концов при условии, что сохраняются достаточная активность связывания ДНК и, при необходимости, активность никазы или расщепления ДНК, например, по меньшей мере 40%, 50%, 60%, 70%, 80%, 90% или 95% активности по сравнению с Cas9 дикого типа.

Иллюстративная нумерация, представленная в данном документе, может приводиться относительно белка дикого типа, предпочтительно FnCas9 дикого типа. Однако предусматривается, что могут использоваться мутанты Cas9 дикого типа, такие как белка FnCas9. Нумерация также может не полностью соответствовать нумерации FnCas9, поскольку, например, могут использоваться некоторые N'- или C'-концевые усечения или делеции, но это можно устранить с помощью стандартных инструментов выравнивания последовательностей. Ортологи также предпочтительны как инструмент выравнивания последовательностей.

Таким образом, положение разделения может быть выбрано средним специалистом в данной области, например, на основании данных о кристаллической структуре и/или компьютерных результатов прогнозирования структуры.

Например, с помощью компьютерного анализа первичной структуры нуклеаз Cas9 выявили три отличающихся участка (фиг. 1). Первый, C-концевой RuvC-подобный домен, который является единственным охарактеризованным функциональным доменом. Второй, N-концевой альфа-спиральный участок, и третий, участок со смешанной альфа- и бета-структурой, расположенный между RuvC-подобным доменом и альфа-спиральным участком. Несколько небольших отрезков из неструктурированных участков прогнозируются в первичной структуре Cas9. Неструктурированные участки, которые доступны для растворителя и не являются консервативными среди разных ортологов Cas9, могут представлять собой предпочтительные стороны для разделений (фиг. 2 и фиг. 3).

В нижеприведенной таблице представлены неограничивающие потенциальные участки разделения в As и LbCas9. Сайт разделения в пределах такого участка может быть подходящим.

Участок разделения AsCas9 LbCas9
1 575-588 566-571
2 631-645 754-757
3 653-664 -
4 818-844 -

Для мутантов Fn, As и Lb Cas9 должно быть совершенно очевидно, что соответствующее положение для потенциального сайта разделения, например, основывается на выравнивании последовательностей. Для отличных от Fn, As и Lb ферментов можно использовать кристаллическую структуру ортолога, если существует относительно высокая степень гомологии между ортологом и предполагаемым Cas9, или можно использовать компьютерное прогнозирование.

В идеальном случае положение разделения должно быть расположено в пределах участка или петли. Предпочтительно, положение разделения находится там, где прерывание аминокислотной последовательности не приводит к частичному или полному разрушению структурного элемента (например, альфа-спиралей или бета-листов). Неструктурированные участки (участки, которые не обнаруживаются в кристаллической структуре, поскольку эти участки недостаточно структурированы, чтобы "застывать" в кристалле) часто являются предпочтительными вариантами. Заявители могут, например, проводить разделения в неструктурированных участках, которые доступны на поверхности Cas9.

Заявители могут придерживаться следующей процедуры, которая представлена в качестве предпочтительного примера и в качестве руководства. Поскольку неструктурированные участки не обнаруживаются в кристаллической структуре, заявители рассматривают окружающую аминокислотную последовательность в кристалле с первичной аминокислотной последовательностью Cas9. Каждый неструктурированный участок может состоять, например, из приблизительно 3-10 аминокислот, которые не обнаруживаются в кристалле. Следовательно, заявители выполняют разделение между этими аминокислотами. Для включения большего количества потенциальных сторон разделения заявители включают разделения, расположенные в петлях вне Cas9, с использованием тех же критериев, что и с неструктурированными участками.

В некоторых вариантах осуществления положение разделения находится во внешней петле Cas9. В других предпочтительных вариантах осуществления положение разделения находится в неструктурированном участке Cas9. Неструктурированный участок, как правило, представляет собой очень гибкую внешнюю петлю, структуру которой сложно определить по рентгенограмме кристалла.

После идентификации положения разделения можно разрабатывать подходящие конструкции.

Как правило, NES располагается на N'-конце первой части разделяемой аминокислоты (или на 5'-конце нуклеотида, кодирующего ее). В таком случае, NLS располагается на С'-конце второй части разделяемой аминокислоты (или на 3'-конце нуклеотида, кодирующего ее). Таким образом, первая слитая конструкция на основе Cas9 может быть функционально связана с одним или несколькими сигналами ядерного экспорта, а вторая слитая конструкция на основе Cas9 может быть функционально связана с сигналом ядерной локализации.

Разумеется, может предусматриваться обратный порядок расположения, при котором NLS располагается на N'-конце первой части разделяемой аминокислоты (или на 5'-конце нуклеотида, кодирующего ее). В таком случае, NES располагается на С'-конце второй части разделяемой аминокислоты (или на 3'-конце нуклеотида, кодирующего ее). Таким образом, первая слитая конструкция на основе Cas9 может быть функционально связана с одним или несколькими сигналами ядерной локализации, а вторая слитая конструкция на основе Cas9 может быть функционально связана с сигналом ядерного экспорта.

Разделения, которые обеспечивают то, что две части (либо боковая сторона разделения) имеют примерно одинаковую длину, могут быть полезны для целей упаковки. Например, считается, что легче поддерживать стехиометрию между обеими частями, когда транскрипты имеют примерно одинаковый размер.

В некоторых примерах N- и C-концевые части кодон-оптимизированного Cas9 человека, такого как FnCas9, сливают с доменами димеризации FRB и FKBP соответственно. Такой порядок расположения может быть предпочтительным. Они могут быть перенаправлены (т.е. N'-конец с FKBP и C'-конец с FRB).

Линкеры, как, например, (GGGGS)3, предпочтительно используют в данном документе для отделения фрагмента Cas9 от домена димеризации. (GGGGS)3 является предпочтительным, поскольку он является относительно длинным линкером (15 аминокислот). Глициновые остатки являются наиболее гибкими, а сериновые остатки повышают вероятность того, что линкер будет находиться на внешней стороне белка. (GGGGS)6, (GGGGS)9 или (GGGGS)12 предпочтительно можно использовать в качестве альтернатив. Другими предпочтительными альтернативами являются (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10 или (GGGGS)11.

Например, (GGGGS)3 может быть включен между N'-концевым фрагментом Cas9 и FRB. Например, (GGGGS)3 может быть включен между FKB и C'-концевым фрагментом Cas9.

Доступны альтернативные линкеры, но считается, что очень гибкие линкеры лучше обеспечивают максимальную возможность объединения двух 2 частей Cas9 и, таким образом, восстановления активности Cas9. Одной альтернативой является то, что NLS нуклеоплазмина можно использовать в качестве линкера.

Линкер также можно использовать между Cas9 и любым функциональным доменом. Опять-таки, в данном случае можно использовать линкер (GGGGS)3 (или его варианты с 6, 9 или 12 повторами) или можно использовать NLS нуклеоплазмина в качестве линкера между Cas9 и функциональным доменом.

Предусматриваются альтернативы системы FRB/FKBP. Например, система ABA и гиббереллина.

Соответственно, предпочтительными примерами семейства FKBP являются любые из следующих индуцируемых систем: FKBP, который димеризуется с кальциневрином А (CNA) в присутствии FK506; FKBP, который димеризуется с CyP-Fas в присутствии FKCsA; FKBP, который димеризуется с FRB в присутствии рапамицина; GyrB, который димеризуется с GryB в присутствии кумермицина; GAI, который димеризуется с GID1 в присутствии гиббереллина; или Snap-tag, который димеризуется с HaloTag в присутствии HaXS.

Альтернативы в самом семействе FKBP также являются предпочтительными. Например, FKBP, который гомодимеризуется (т.е. один FKBP димеризуется с другим FKBP) в присутствии FK1012. Таким образом, также предусмотрена система CRISPR-Cas на основе не встречающегося в природе или сконструированного индуцируемого Cas9, содержащая:

первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого гомодимера, и

вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого гомодимера,

где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,

где вторая слитая конструкция на основе Cas9 функционально связана с (необязательно одним или несколькими) сигналом(сигналами) ядерного экспорта,

где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гомодимера вместе,

где сведение первой и второй половинок индуцируемого гомодимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,

где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и

где функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью и необязательно редактирует локус генома для изменения экспрессии генов.

В одном варианте осуществления гомодимер предпочтительно представляет собой FKBP, а источник энергии, являющийся индуктором, предпочтительно представляет собой FK1012. В другом варианте осуществления гомодимер предпочтительно представляет собой GryB, а источник энергии, являющийся индуктором, предпочтительно представляет собой кумермицин. В другом варианте осуществления гомодимер предпочтительно представляет собой ABA, а источник энергии, являющийся индуктором, предпочтительно представляет собой гиббереллин.

В других вариантах осуществления димер является гетеродимером. Предпочтительными примерами гетеродимеров являются любые из следующих индуцируемых систем: FKBP, который димеризуется с кальциневрином А (CNA) в присутствии FK506; FKBP, который димеризуется с CyP-Fas в присутствии FKCsA; FKBP, который димеризуется с FRB в присутствии рапамицина в присутствии кумермицина; GAI, который димеризуется с GID1 в присутствии гиббереллина; или Snap-tag, который димеризуется с HaloTag в присутствии HaXS.

Заявители использовали FKBP/FRB, поскольку он хорошо охарактеризован, и оба домена являются достаточно маленькими (<100 аминокислот) для содействия упаковке. Более того, рапамицин использовался долгое время и его побочные эффекты хорошо известны. Крупные домены димеризации (>300 aa) также должны работать, но для обеспечения восстановления Cas9 могут потребоваться более длинные линкеры.

У Paulmurugan и Gambhir (Cancer Res, August 15, 2005 65; 7413) обсуждаются базовые сведения о системе FRB/FKBP/рапамицин. Другим полезным документом является статья Crabtree et al. (Chemistry & Biology 13, 99-107, Jan 2006).

В данном примере конструируют один вектор, кассету экспрессии (плазмиду). gRNA находится под контролем промотора U6. Используют два разных разделения Cas9. Конструкция split-Cas9 основывается на первой слитой конструкции на основе Cas9, фланкированной NLS, с FKBP, слитым с C'-концевой частью split-Cas9 посредством линкера GlySer; и второй слитой конструкции на основе Cas9, фланкированной NES, с FRB, слитым с N'-концевой частью split-Cas9 посредством линкера GlySer. Для отделения первой и второй слитых конструкций на основе Cas9 используют P2A, обеспечивающий разделение при транскрипции. Split-Cas9 демонстрирует образование вставок/делеций, подобное таковому у дикого типа, в присутствии рапамицина, но значительно более низкое образование вставок/делеций, чем у дикого типа, в отсутствии рапамицина.

Соответственно, предусматривается один вектор. Вектор содержит:

первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого димера, и

вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого димера,

где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,

где вторая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерного экспорта,

где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гетеродимера вместе,

где сведение первой и второй половинок индуцируемого гетеродимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,

где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и

где функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью и необязательно редактирует локус генома для изменения экспрессии генов. Эти элементы предпочтительно представлены в одной конструкции, например, в кассете экспрессии.

Первая слитая конструкция на основе Cas9 предпочтительно фланкирована по меньшей мере одним сигналом ядерной локализации на каждом конце. Вторая слитая конструкция на основе Cas9 предпочтительно фланкирована по меньшей мере одним сигналом ядерного экспорта на каждом конце.

Также предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, кодирующего систему, или любого из векторов согласно настоящему изобретению и введение субъекту источника энергии, являющегося индуктором. Также может предусматриваться подходящая матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации.

Также предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование активации или репрессии транскрипции путем трансформации субъекта с помощью полинуклеотида, кодирующего систему согласно настоящему изобретению, или любого из векторов согласно настоящему изобретению, где указанные полинуклеотид или вектор кодируют или содержат каталитически неактивный Cas9 и один или несколько ассоциированных с ним функциональных доменов; при этом способ дополнительно включает введение субъекту источника энергии, являющегося индуктором.

Также предусмотрены композиции, содержащие систему согласно настоящему изобретению, для применения в указанном способе лечения. Также предусмотрено применение системы согласно настоящему изобретению в изготовлении лекарственного препарата для таких способов лечения.

Примеры состояний, которые можно лечить с помощью системы согласно настоящему изобретению, описаны в данном документе или в документах, цитируемых в данном документе.

Один вектор может содержать средство, разделяющее транскрипты, например, P2A. P2A разделяет транскрипт надвое с отделением первой и второй слитых конструкций на основе Cas9. Разделение происходит из-за "рибосомного пропуска". По сути, рибосома пропускает аминокислоту в ходе трансляции, что разрывает цепь белка и дает в результате два отдельных полипептида/белка. Один вектор также пригоден для применений, при которых низкая фоновая активность не имеет значения, но при этом желательна высокая индуцируемая активность.

Одним примером может быть получение клональных линий эмбриональных стволовых клеток. Обычной процедурой является транзиентная трансфекция плазмидами, кодирующими Cas9 wt или никазы Cas9. Эти плазмиды обеспечивают продуцирувание молекул Cas9, которые остаются активными в течение нескольких дней и характеризуются более высокой вероятностью нецелевой активности. Использование одного вектора экспрессии для split-Cas9 позволяет ограничить "высокую" активность Cas9 в более короткий промежуток времени (например, одна доза индуктора, такого как рапамицин). Без непрерывных (ежесуточных) обработок индуктором (например, рапамицином) активность отдельных векторов экспрессии split-Cas9 является низкой и обеспечивает пониженную вероятность возникновения нежелательных нецелевых эффектов.

Пик активности индуцированного Cas9 полезен в некоторых вариантах осуществления и может быть наиболее легко вызван с использованием одного вектора доставки, но это также возможно с помощью двойной векторной системы (каждый вектор доставляет одну половинку split-Cas9). Пик может представлять высокую активность и длиться в течение короткого срока, как правило, продолжительности действия индуктора.

Соответственно, предусмотрен способ получения клональных линий эмбриональных стволовых клеток, включающий трансфекцию одной или нескольких эмбриональных стволовых клеток с помощью полинуклеотида, кодирующего систему согласно настоящему изобретению, или одного из векторов согласно настоящему изобретению для экспрессии split-Cas9 согласно настоящему изобретению и введение в одну или несколько стволовых клеток источника энергии, являющегося индуктором, согласно настоящему изобретению или приведение их в контакт с ним для индуцирования восстановления Cas9. Может предусматриваться матрица для репарации.

Как и во всех способах, описанных в данном документе, следует понимать, что будут необходимы подходящие gRNA или направляющие.

Если функциональные домены и подобные "ассоциированы" с одной или другой частью фермента, то они, как правило, являются продуктами слияния. Термин "связанный с" используется в данном документе в отношении того, как одна молекула "связывается" по отношению к другой, например, между частями Cas9 и функциональным доменом. В случае таких белок-белковых взаимодействий эту ассоциацию можно рассматривать с точки зрения распознавания как распознавание антителом эпитопа. Альтернативно один белок может быть ассоциирован с другим белком посредством слияния обоих, например, одна субъединица является слитой с другой субъединицей. Слияние обычно происходит путем добавления одной аминокислотной последовательности к другой, например, посредством сплайсинга нуклеотидных последовательностей, которые кодируют каждый белок или субъединицу. Альтернативно, по сути, это можно рассматривать как связывание двух молекул или прямую связь, например, белок слияния. В любом случае слитый белок может включать линкер между двумя представляющими интерес субъединицами (т.е. между ферментом и функциональным доменом или между адаптерным белком и функциональным доменом). Таким образом, в некоторых вариантах осуществления часть Cas9 ассоциирована с функциональным доменом за счет связывания с ним. В других вариантах осуществления Cas9 ассоциирован с функциональным доменом ввиду того, что двое слиты вместе необязательно посредством промежуточного линкера. Примеры линкеров включают линкеры GlySer, обсуждаемые в данном документе.

Другие примеры индукторов включают свет и гормоны. Что касается света, индуцируемые димеры могут быть гетеродимерами и включать первую индуцируемую светом половинку димера и вторую (и комплиментарную) индуцируемую светом половинку димера. Предпочтительным примером первой и второй индуцируемых светом половинок димера является система CIB1 и CRY2. Домен CIB1 является гетеродимерным партнером по связыванию чувствительного к свету криптохрома 2 (CRY2).

В другом примере чувствительная к синему свету система димеризации Magnet (pMag и nMag) может быть слита с двумя частями белка split-Cas9. В ответ на стимуляцию светом pMag и nMag димеризуются и происходит повторная сборка Cas9. Например, такая система описывается вместе с Cas9 у Nihongaki et al. (Nat. Biotechnol. 33, 755-790, 2015).

В настоящем изобретении подразумевается то, что источником энергии, являющимся индуктором, может быть тепло, ультразвук, электромагнитная энергия или химическое вещество. В предпочтительном варианте осуществления настоящего изобретения источником энергии, являющимся индуктором, может быть антибиотик, малая молекула, гормон, производное гормона, стероид или производное стероида. В более предпочтительном варианте осуществления источником энергии, являющимся индуктором, может быть абсцизовая кислота (ABA), доксициклин (DOX), кумат, рапамицин, 4-гидрокситамоксифен (4OHT), эстроген или экдизон. В настоящем изобретении предусматривается то, что по меньшей мере один "переключатель" может быть выбран из группы, состоящей из индуцируемых на основе антибиотиков систем, индуцируемых на основе электромагнитной энергии систем, индуцируемых на основе малых молекул систем, индуцируемых на основе ядерных рецепторов систем и индуцируемых на основе гормонов систем. В более предпочтительном варианте осуществления по меньшей мере один переключатель может быть выбран из группы, состоящей из индуцируемых тетрациклином (Tet)/DOX систем, индуцируемых светом систем, индуцируемых ABA систем, систем на основе куматного репрессора/оператора, индуцируемых 4OHT/эстрогеном систем, индуцируемых на основе экдизона систем и индуцируемых FKBP12/FRAP (комплекс FKBP12-рапамицин) систем. Такие индукторы также обсуждаются в данном документе и в заявке PCT/US2013/051418, включенной в данный документ посредством ссылки.

В целом, любое применение, которое может касаться Cas9, будь то wt, никаза или нефункциональный Cas9 (с ассоциированными функциональными доменами или без них), может быть осуществлено с использованием подхода split-Cas9 согласно настоящему изобретению. Преимуществом остается индуцируемый характер активности Cas9.

В качестве дополнительного примера могут быть получены продукты слияния split-Cas9 с флуоресцентными белками, такими как GFP. Это позволит визуализировать локусы генома (см. "Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System" Chen B. et al. Cell 2013), но индуцируемым образом. Таким образом, в некоторых вариантах осуществления одна или несколько частей Cas9 могут быть ассоциированы (и, в частности, слиты с) флуоресцентным белком, например, GFP.

Дополнительные эксперименты касаются того, существует ли разница в нецелевом разрезании среди Cas9 дикого типа (wt) и split-Cas9 при аналогичном уровне нецелевого разрезания. Для этого заявители использовали транзиентную трансфекцию плазмидами Cas9 wt и split-Cas9 и осуществляли сбор в разные моменты времени. Заявители определяли нецелевую активацию после выявления ряда образцов, в которых целевое разрезание составляло +/- 5%. Заявители получали линии клеток со стабильной экспрессией Cas9 wt или split-Cas9 без направляющих (с использованием лентивируса). После отбора с помощью антибиотика направляющие доставляли с помощью отдельного лентивируса и осуществляли сбор в разные моменты времени для измерения целевого/нецелевого разрезания.

Заявители ввели дестабилизирующую последовательность (PEST, см. "Use of mRNA- and protein-destabilizing elements to develop a highly responsive reporter system" Voon DC et al. Nucleic Acids Research 2005) во фрагмент FRB(N)Cas9-NES для облегчения более быстрого разрушения и, следовательно, для снижения стабильности комплекса нефункциональный split-Cas9-VP64.

Такие дестабилизирующие последовательности, описываемые в других разделах данного описания, (в том числе PEST) могут быть предпочтительными для применения с системами split-Cas9.

Получали линии клеток, стабильно экспрессирующие нефункциональный split-Cas9-VP64 и MS2-p65-HSF1 + направляющая. Скрининг на предмет устойчивости к PLX может продемонстрировать, что необратимая регулируемая во времени активация транскрипции может быть пригодна в скринингах лекарственных средств. Этот подход может быть преимущественным, если нефункциональный split-Cas9-VP64 является необратимым.

В одном аспекте настоящего изобретения предусмотрена не встречающейся в природе или сконструированная система CRISPR-Cas на основе Cas9, которая может содержать по меньшей мере один "переключатель", при этом активность указанной системы CRISPR-Cas на основе Cas9 контролируется в отношении "переключателя" путем приведения в контакт по меньшей мере с одним источником энергии, являющимся индуктором. В одном варианте осуществления настоящего изобретения контроль в отношении по меньшей мере одного "переключателя" или активности указанной системы CRISPR-Cas на основе Cas9 может быть активирован, усилен, прекращен или подавлен. Приведение в контакт по меньшей мере с одним источником энергии, являющимся индуктором, может приводить в результате к первому эффекту и второму эффекту. Первый эффект может представлять собой одно или несколько из ядерного импорта, ядерного экспорта, рекрутирования вторичного компонента (такого как эффекторная молекула), конформационного изменения (белка, ДНК или РНК), расщепления, высвобождения молекулы-карго (такой как защищенная молекула или кофактор), ассоциации или диссоциации. Второй эффект может представлять собой одно или несколько из активации, усиления, прекращения или подавления контроля в отношении по меньшей мере одного "переключателя" или активности указанной системы CRISPR-Cas на основе Cas9. В одном варианте осуществления первый эффект и второй эффект могут проявляться в виде каскада.

В другом аспекте настоящего изобретения система CRISPR-Cas на основе Cas9 может дополнительно содержать по меньшей мере один или несколько из сигнала ядерной локализации (NLS), сигнала ядерного экспорта (NES), функционального домена, гибкого линкера, мутации, делеции, изменения или усечения. Одно или несколько из NLS, NES или функционального домена могут быть активированными в зависимости от условий или инактивированными. В другом варианте осуществления мутацией может быть одна или несколько из мутации в гомологичном участке фактора транскрипции, мутации в ДНК-связывающем домене (как, например, подвергнутые мутации основные остатки в структуре основная спираль-петля-спираль), мутации в эндогенном NLS или мутации в эндогенном NES. В настоящем изобретении подразумевается то, что источником энергии, являющимся индуктором, может быть тепло, ультразвук, электромагнитная энергия или химическое вещество. В предпочтительном варианте осуществления настоящего изобретения источником энергии, являющимся индуктором, может быть антибиотик, малая молекула, гормон, производное гормона, стероид или производное стероида. В более предпочтительном варианте осуществления источником энергии, являющимся индуктором, может быть абсцизовая кислота (ABA), доксициклин (DOX), кумат, рапамицин, 4-гидрокситамоксифен (4OHT), эстроген или экдизон. В настоящем изобретении предусматривается то, что по меньшей мере один "переключатель" может быть выбран из группы, состоящей из индуцируемых на основе антибиотиков систем, индуцируемых на основе электромагнитной энергии систем, индуцируемых на основе малых молекул систем, индуцируемых на основе ядерных рецепторов систем и индуцируемых на основе гормонов систем. В более предпочтительном варианте осуществления по меньшей мере один переключатель может быть выбран из группы, состоящей из индуцируемых тетрациклином (Tet)/DOX систем, индуцируемых светом систем, индуцируемых ABA систем, систем на основе куматного репрессора/оператора, индуцируемых 4OHT/эстрогеном систем, индуцируемых на основе экдизона систем и индуцируемых FKBP12/FRAP (комплекс FKBP12-рапамицин) систем.

Аспекты контроля, подробно описываемые в данной заявке, относятся по меньшей мере к одному или нескольким "переключателям". Термин "переключатель", используемый в данном документе, обозначает систему или набор компонентов, которые действуют согласованно с обеспечением изменения, охватывающего все аспекты биологической функции, такие как активация, подавление, усиление или прекращение этой функции. В одном аспекте термин "переключатель" охватывает "генетические переключатели", которые содержат основные компоненты в виде белков, регулирующих гены, и специфические последовательности ДНК, которые эти белки распознают. В одном аспекте "переключатели" относятся к индуцируемым и репрессируемым системам, используемым в генной регуляции. В целом, индуцируемая система может быть неактивна до тех пор, пока не будет присутствовать определенная молекула (называемая индуктором), которая обеспечивает экспрессию гена. Считается, что молекула "индуцирует экспрессию". Способ, с помощью которого это осуществляется, зависит от механизмов контроля, а также от различий в типе клетки. Репрессируемая система является активной, пока не присутствует определенная молекула (называемая корепрессором), которая подавляет экспрессию гена. Считается, что молекула "репрессирует экспрессию". Способ, с помощью которого это осуществляется, зависит от механизмов контроля, а также от различий в типе клетки. Термин "индуцируемый", используемый в данном документе, может охватывать все аспекты "переключателя" независимо от задействованного молекулярного механизма. Соответственно, "переключатель", как подразумевается в настоящем изобретении, может включать без ограничения индуцируемые на основе антибиотиков системы, индуцируемые на основе электромагнитной энергии системы, индуцируемые на основе малых молекул системы, индуцируемые на основе ядерных рецепторов системы и индуцируемые на основе гормонов системы. В предпочтительных вариантах осуществления "переключателем" может быть индуцируемая тетрациклином (Tet)/DOX система, индуцируемые светом системы, индуцируемая абсцизовой кислотой система, система на основе куматного репрессора/оператора, индуцируемая 4OHT/эстрогеном система, индуцируемые на основе экдизона системы и индуцируемая FKBP12/FRAP (комплексом FKBP12-рапамицин) система.

Система CRISPR-Cas на основе Cas9 согласно настоящему изобретению может быть разработана для модулирования или изменения экспрессии отдельных эндогенных генов точным в пространственном и временном отношении способом. Система CRISPR-Cas на основе Cas9 может быть разработана так, чтобы связываться с промоторной последовательностью представляющего интерес гена для изменения экспрессии гена. Cas9 может быть разделен надвое, при этом одна половинка сливается с одной половинкой гетеродимера криптохрома (криптохрома-2 или CIB1), тогда как оставшаяся часть криптохрома сливается с другой половинкой Cas9. В некоторых аспектах транскрипционный эффекторный домен также может быть включен в систему CRISPR-Cas на основе Cas9. Эффекторные домены могут быть либо активаторами, такими как VP16, VP64 или p65, либо репрессорами, такими как KRAB, EnR или SID. В нестимулированном состоянии одна половинка белка Cas9-криптохром-2 локализуется в промоторном участке представляющего интерес гена, но не связывается с CIB1-эффекторным белком. При стимуляции светом синего спектра криптохром-2 активируется, подвергается конформационному изменению и открывает свой домен связывания. CIB1, в свою очередь, связывается с криптохромом-2, что приводит в результате к локализации второй половинки Cas9 в промоторном участке представляющего интерес гена и инициированию редактирования генома, которое может приводить к сверхэкспрессии или сайленсингу гена. Аспекты LITE дополнительно описываются в Liu, H et al., Science, 2008, и Kennedy M et al., Nature Methods 2010, содержание которых включено в данный документ посредством ссылки во всей своей полноте.

Активаторные и репрессорные домены, которые могут дополнительно модулировать функцию, могут быть выбраны на основании видов, эффективности, механизма, продолжительности, размера или любого ряда других параметров. Предпочтительные эффекторные домены включают без ограничения домен транспозазы, домен интегразы, домен рекомбиназы, домен резолвазы, домен инвертазы, домен протеазы, домен ДНК-метилтрансферазы, домен ДНК-деметилазы, домен гистонацетилазы, домен гистондеацетилазы, нуклеазный домен, репрессорный домен, активаторный домен, домены сигнала ядерной локализации, домен рекрутирования транскрипционного белка, домен, ассоциированный с активностью клеточного поглощения, домен связывания нуклеиновой кислоты или домен презентации антитела.

Существует несколько разных способов получения индуцируемых систем: 1. система на основе ABI-PYL, индуцируемая абсцизовой кислотой (ABA) (см., например, веб-сайт stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2), 2. система на основе FKBP-FRB, индуцируемая рапамицином (или родственными химическими соединениями на основе рапамицина) (см., например, веб-сайт nature.com/nmeth/journal/v2/n6/full/nmeth763.html), 3. система на основе GID1-GAI, индуцируемая гиббереллином (GA) (см., например, веб-сайт nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).

Другая система, предусматриваемая настоящим изобретением, представляет собой химически индуцируемую систему, основанную на изменении субклеточной локализации. Заявители также предусматривают индуцируемую систему CRISPR-Cas на основе Cas9, сконструированную для нацеливания на представляющий интерес локус генома, при этом фермент Cas9 разделен на две слитых конструкции, которые дополнительно связаны с разными частями чувствительного к химическим веществам или энергии белка. Такой чувствительный к химическим веществам или энергии белок будет приводить к изменению субклеточной локализации одной из половинок фермента Cas9 (т.е. транспорту одной из половинок фермента Cas9 из цитоплазмы в ядро клеток) при связывании химического вещества или при переносе энергии на чувствительный к химическим веществам или энергии белок. Такой транспорт слитых конструкций из одних субклеточных компартментов или органелл, в которых его активность ограничивается из-за отсутствия субстрата для восстановленной системы CRISPR-Cas на основе Cas9, в другие, в которых субстрат присутствует, позволит компонентам объединяться и восстанавливать функциональную активность, а затем вступать в контакт с требуемым для них субстратом (т.е. геномной ДНК в ядре клетки млекопитающих) и приводить в результате к активации или репрессии экспрессии целевого гена.

Предусматриваются другие индуцируемые системы, такие как без ограничения регуляция тяжелыми металлами [Mayo KE et al., Cell 1982, 29:99-108; Searle PF et al., Mol Cell Biol 1985, 5:1480-1489, и Brinster RL et al., Nature (London) 1982, 296:39-42], стероидными гормонами [Hynes NE et al., Proc Natl Acad Sci USA 1981, 78:2038-2042; Klock G et al., Nature (London) 1987, 329:734-736, и Lee F et al., Nature (London) 1981, 294:228-232.], тепловым шоком [Nouer L: Heat Shock Response. Boca Raton, FL: CRC; 1991], и были разработаны другие реагенты [Mullick A, Massie B: Transcription, translation and the control of gene expression. В Encyclopedia of Cell Technology, под ред.: Speir RE. Wiley; 2000:1140-1164, и Fussenegger M, Biotechnol Prog 2001, 17:1-51]. Однако в случае таких индуцируемых промоторов млекопитающих существуют ограничения, такие как "утечка" при "выключенном" состоянии и плейотропные эффекты индукторов (теплового шока, тяжелых металлов, глюкокортикоидов и т.д.). Было предложено применение гормонов насекомых (экдизона), с надеждой снизить противодействие клеточными процессам в клетках млекопитающих [No D et al., Proc Natl Acad Sci USA 1996, 93:3346-3351]. В другой превосходной системе в качестве индуктора применяется рапамицин [Rivera VM et al., Nat Med 1996, 2:1028-1032], но роль рапамицина в качестве иммуносупрессора была главным ограничением его применения in vivo и, поэтому было необходимо найти биологически инертное соединение [Saez E et al., Proc Natl Acad Sci USA 2000, 97:14512-14517] для контроля экспрессии гена.

См. также приведенный ниже раздел об индуцируемых системах.

Дестабилизированный фермент: ферменты в соответствии с настоящим изобретением, имеющие или ассоциированные с доменами дестабилизации

В одном аспекте настоящего изобретения предусмотрен не встречающийся в природе или сконструированный фермент CRISPR, предпочтительно фермент CRISPR 2 класса, предпочтительно фермент CRISPR V или VI типа, описанный в данном документе, такой как предпочтительно без ограничения Cas9, описываемый в других разделах данного документа, ассоциированный по меньшей мере с одним доменом дестабилизации (DD); и, для краткости, такой не встречающийся в природе или сконструированный фермент CRISPR, ассоциированный по меньшей мере с одним доменом дестабилизации (DD), называют в данном документе "ферментом DD-CRISPR". Следует понимать, что любой из ферментов CRISPR в соответствии с настоящим изобретением, описываемый в других разделах настоящего документа, может применяться в виде имеющего дестабилизирующие домены, описываемые в данном документе ниже, или ассоциированного с ними. Любые из способов, продуктов, композиций и вариантов применения, описываемых в других разделах данного документа, одинаково применимы с ферментами CRISPR, ассоциированными с дестабилизирующими доменами, как подробно описывается ниже.

С целью дополнительного руководства приводятся следующие конкретные аспекты и варианты осуществления.

Поскольку аспекты и варианты осуществления, описываемые в данном разделе, включают ферменты DD-CRISPR, DD-Cas, DD-Cas9Cas9, DD-CRISPR-Cas или системы или комплексы DD-CRISPR-Cas9, термины "CRISPR", "Cas", "Cas9, "система CRISPR", "комплекс CRISPR", "CRISPR-Cas", "CRISPR-Cas9" или подобные без приставки "DD", можно рассматривать как имеющие приставку DD, особенно если позволяет контекст, так что настоящее изобретение охватывает варианты осуществления с DD. Таким образом, в одном аспекте настоящего изобретения предусмотрены способы применения одного или нескольких элементов системы CRISPR (которая может рассматриваться как система DD-CRISPR и/или система CRISPR). Комплекс CRISPR по настоящему изобретению обеспечивает эффективные средства модифицирования целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению обладает широкой применимостью, включая модифицирование (например, осуществление делеции, встраивания, транслокации, инактивации, активации) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний.

В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система DD-CRISPR-Cas, содержащая фермент DD-CRISPR, например, такой фермент DD-CRISPR, где фермент CRISPR представляет собой белок Cas (в данном документе называемый "белок DD-Cas", т.е. "DD" перед термином, таким как "комплекс DD-CRISPR-Cas9", означает комплекс CRISPR-Cas9, содержащий белок Cas9, имеющий по меньшей мере один домен дестабилизации, ассоциированный с ним), преимущественно белок DD-Cas, например, белок Cas9, ассоциированный по меньшей мере с одним доменом дестабилизации (в данном документе называемый "белок DD-Cas9"), и направляющую РНК, которая нацеливается на молекулу нуклеиновой кислоты, такую как молекула ДНК, тем самым направляющая РНК нацеливается на молекулу нуклеиновой кислоты, например, молекулу ДНК. Молекула нуклеиновой кислоты, например, молекула ДНК может кодировать продукт гена. В некоторых вариантах осуществления белок DD-Cas может расщеплять молекулу ДНК, кодирующую продукт гена. В некоторых вариантах осуществления экспрессия продукта гена изменена. Белок Cas и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, необязательно, если применимо, слитую с последовательностью tracr. Настоящее изобретение дополнительно охватывает кодирование белка Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. Экспрессия продукта гена может быть снижена. Фермент CRISPR может образовывать часть системы CRISPR-Cas, которая дополнительно содержит направляющую РНК (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке. В некоторых вариантах осуществления функциональная система CRISPR-Cas связывается с целевой последовательностью. В некоторых вариантах осуществления функциональная система CRISPR-Cas может редактировать целевую последовательность, например, целевая последовательность может предусматривать локус генома, а в некоторых вариантах осуществления может быть предусмотрено изменение экспрессии гена. В некоторых вариантах осуществления функциональная система CRISPR-Cas может содержать дополнительные функциональные домены. В некоторых вариантах осуществления настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии продукта гена. Способ может включать введение в клетку, содержащую целевую нуклеиновую кислоту, например, молекулу ДНК, или содержащую и экспрессирующую целевую нуклеиновую кислоту, например, молекулу ДНК; например, целевая нуклеиновая кислота может кодировать продукт гена или обеспечивать экспрессию продукта гена (например, регуляторную последовательность).

В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент CRISPR подтипа V-A или V-B. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой As DD-Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой Lb DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR расщепляет обе нити ДНК с образованием двухнитевого разрыва (DSB). В некоторых вариантах осуществления фермент DD-CRISPR представляет собой никазу. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой двойную никазу. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой нефункциональный Cas9, например, Cas9, фактически не проявляющий нуклеазной активности, например, проявляющий не более 5% нуклеазной активности по сравнению с Cas9 дикого типа или с Cas9, не имеющим мутации. Подходящие мутации Cas9 описываются в других разделах данного документа и включают, например, D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A и N1257A в соответствии с аминокислотными положениями в домене RuvC FnCas9p; или, например, N580A, N584A, T587A, W609A, D610A, K613A, E614A, D616A, K624A, D625A, K627A и Y629A по сравнению с предполагаемым вторым нуклеазным доменом, описываемым в других разделах данного документа.

В некоторых общих вариантах осуществления фермент DD-CRISPR ассоциирован с одним или несколькими функциональными доменами. В некоторых более конкретных вариантах осуществления фермент DD-CRISPR представляет собой нефункциональный Cas9 и/или ассоциирован с одним или несколькими функциональными доменами. В некоторых вариантах осуществления фермент DD-CRISPR содержит усечение, например, α-спирали или смешанной α/β вторичной структуры. В некоторых вариантах осуществления усечение предусматривает удаление или замещение линкером. В некоторых вариантах осуществления линкер является разветвленным или иным образом обеспечивает привязку DD и/или функционального домена. В некоторых вариантах осуществления фермент CRISPR ассоциирован с DD в форме белка слияния. В некоторых вариантах осуществления фермент CRISPR является слитым с DD. Другими словами, DD может быть ассоциирован с ферментом CRISPR путем слияния с указанным ферментом CRISPR. В некоторых вариантах осуществления фермент можно рассматривать как модифицированный фермент CRISPR, где фермент CRISPR слит по меньшей мере с одним доменом дестабилизации (DD). В некоторых вариантах осуществления DD может быть ассоциирован с ферментом CRISPR посредством соединительного белка, например, с использованием системы, такой как маркерная система, такая как стрептавидин-биотиновая система. Таким образом, предусмотрен продукт слияния фермента CRISPR с соединительным белком, специфическим в отношении высокоаффинного лиганда для такого соединителя, при этом DD связан с указанным высокоаффинным лигандом. Например, стрептавидин может быть соединителем, слитым с ферментом CRISPR, тогда как биотин может быть связан с DD. При совместной локализации стрептавидин будет связываться с биотином, соединяя, таким образом, фермент CRISPR с DD. Для простоты, продукт слияния фермента CRISPR и DD является предпочтительным в некоторых вариантах осуществления. В некоторых вариантах осуществления продукт слияния содержит линкер между DD и ферментом CRISPR. В некоторых вариантах осуществления слияние может происходить по N-концу фермента CRISPR. В некоторых вариантах осуществления по меньшей мере один DD сливается с N-концом фермента CRISPR. В некоторых вариантах осуществления слияние может происходить по С-концу фермента CRISPR. В некоторых вариантах осуществления по меньшей мере один DD сливается с С-концом фермента CRISPR. В некоторых вариантах осуществления один DD может быть слит с N-концом фермента CRISPR, а другой DD слит с C-концом фермента CRISPR. В некоторых вариантах осуществления фермент CRISPR ассоциирован по меньшей мере с двумя DD, и при этом первый DD слит с N-концом фермента CRISPR, а второй DD слит с C-концом фермента CRISPR, при этом первый и второй DD являются одинаковыми или разными. В некоторых вариантах осуществления слияние может происходить по N-концу DD. В некоторых вариантах осуществления слияние может происходить по С-концу DD. В некоторых вариантах осуществления слияние может происходить между С-концом фермента CRISPR и N-концом DD. В некоторых вариантах осуществления слияние может происходить между C-концом DD и N-концом фермента CRISPR. Меньший фон наблюдали с DD, содержащим по меньшей мере одно N-концевое слияние, чем с DD, содержащим по меньшей мере одно C-концевое слияние. Объединение N- и С-концевых слияний характеризовалось наименьшим фоном, но и наиболее низкой общей активностью. Преимущественно DD обеспечивается по меньшей мере одним N-концевым слиянием или по меньшей мере одним N-концевым слиянием плюс по меньшей мере одно C-концевое слияние. И, конечно же, DD может быть обеспечен по меньшей мере одним C-концевым слиянием.

В определенных вариантах осуществления дестабилизирующие белок домены, такие как для регуляции индуцированием, могут быть слиты с N-концом и/или C-концом, например, Cas9. Кроме того, дестабилизирующие домены могут быть введены в первичную последовательность, например, Cas9, в доступные для растворителя петли. С помощью компьютерного анализа первичной структуры нуклеаз Cas9 выявили три отличающихся участка. Первый, C-концевой RuvC-подобный домен, который является единственным охарактеризованным функциональным доменом. Второй, N-концевой альфа-спиральный участок, и третий, участок со смешанной альфа- и бета-структурой, расположенный между RuvC-подобным доменом и альфа-спиральным участком. Несколько небольших отрезков из неструктурированных участков прогнозируются в первичной структуре Cas9. Неструктурированные участки, которые доступны для растворителя и не являются консервативными среди разных ортологов Cas9, представляют собой предпочтительные стороны для разделений и вставок небольших белковых последовательностей. Кроме того, эти стороны можно использовать для создания химерных белков между ортологами Cas9.

В некоторых вариантах осуществления DD представляет собой ER50. Соответствующий стабилизирующий лиганд для такого DD в некоторых вариантах осуществления представляет собой 4HT. Таким образом, в некоторых вариантах осуществления один из по меньшей мере одного DD представляет собой ER50, а стабилизирующий лиганд для него представляет собой 4HT или CMP8. В некоторых вариантах осуществления DD представляет собой DHFR50. Соответствующий стабилизирующий лиганд для такого DD в некоторых вариантах осуществления представляет собой TMP. Таким образом, в некоторых вариантах осуществления один из по меньшей мере одного DD представляет собой DHFR50, а стабилизирующий лиганд для него представляет собой TMP. В некоторых вариантах осуществления DD представляет собой ER50. Соответствующий стабилизирующий лиганд для такого DD в некоторых вариантах осуществления представляет собой CMP8. Следовательно, CMP8 может быть стабилизирующим лигандом, являющимся альтернативой 4HT в системе ER50. Хотя возможно, чтобы CMP8 и 4HT могли/должны были применяться конкурентным образом, некоторые типы клеток могут быть более восприимчивыми к одному или другому из этих двух лигандов, и на основании настоящего раскрытия и информации из уровня техники специалист сможет применять CMP8 и/или 4HT.

В некоторых вариантах осуществления один или два DD могут быть слиты с N-концом фермента CRISPR, и один или два DD слиты с C-концом фермента CRISPR. В некоторых вариантах осуществления с ферментом CRISPR ассоциированы по меньшей мере два DD, и при этом DD являются одинаковыми DD, т.е. DD являются гомологичными. Таким образом, оба (или два или более) из DD могут быть DD ER50. Это является предпочтительным в некоторых вариантах осуществления. Альтернативно оба (или два или более) из DD могут быть DD DHFR50. Это также является предпочтительным в некоторых вариантах осуществления. В некоторых вариантах осуществления с ферментом CRISPR ассоциированы по меньшей мере два DD, и при этом DD являются разными DD, т.е. DD являются гетерологичными. Таким образом, один из DD может представлять собой ER50, тогда как один или несколько из DD или любых других DD могут представлять собой DHFR50. Наличие двух или более DD, которые являются гетерологичными, может быть предпочтительным, поскольку может обеспечивать больший уровень контроля разрушения. Тандемное слияние более чем одного DD на N- или C-конце может усиливать разрушение; и такое тандемное слияние может представлять собой, например, ER50-ER50-Cas9 или DHFR-DHFR-Cas9. Предусматривается, что высокие уровни разрушения могут наблюдаться в отсутствии обоих стабилизирующих лигандов, промежуточные уровни разрушения могут наблюдаться в отсутствии одного стабилизирующего лиганда и в присутствии другого (или иного) стабилизирующего лиганда, тогда как низкие уровни разрушения могут наблюдаться в присутствии обоих (или двух или более) стабилизирующих лигандов. Контроль также может быть обеспечен наличием N-концевого DD ER50 и C-концевого DD DHFR50.

В некоторых вариантах осуществления продукт слияния фермента CRISPR с DD содержит линкер между DD и ферментом CRISPR. В некоторых вариантах осуществления линкер представляет собой линкер GlySer. В некоторых вариантах осуществления фермент DD-CRISPR дополнительно содержит по меньшей мере один сигнал ядерного экспорта (NES). В некоторых вариантах осуществления фермент DD-CRISPR содержит два или более NES. В некоторых вариантах осуществления фермент DD-CRISPR содержит по меньшей мере один сигнал ядерной локализации (NLS). Он может присутствовать наряду с NES. В некоторых вариантах осуществления фермент CRISPR содержит, или состоит, по сути, из, или состоит из сигнала локализации (ядерного импорта или экспорта), в виде линкера между ферментом CRISPR и DD или его части. Метки HA или Flag также охватываются настоящим изобретением в качестве линкеров. Заявители применяют NLS и/или NES в качестве линкера, а также применяют глицин-сериновые линкеры как короткие GS до (GGGGS)3.

В одном аспекте настоящего изобретения предусмотрен полинуклеотид, кодирующий фермент CRISPR и ассоциированный DD. В некоторых вариантах осуществления кодируемый фермент CRISPR и ассоциированный DD функционально связаны с первым регуляторным элементом. В некоторых вариантах осуществления DD также кодируется и функционально связан со вторым регуляторным элементом. Преимущественно DD согласно данному документу "зачищает" стабилизирующий лиганд, и, таким образом, он преимущественно является тем же DD (т.е. тем же типом домена), что и ассоциированный с ферментом, например, обсуждаемым в данном документе (при этом следует учитывать, что термин "зачистка" имеет значение, обсуждаемое в данном документе, а также может обеспечивать осуществление действия, с тем чтобы способствовать активности или завершать ее). С помощью зачистки стабилизирующего лиганда избытком DD, который не ассоциирован с ферментом CRISPR, будет наблюдаться большее разрушение фермента CRISPR. Без ограничения теорией предусматривается, что по мере добавления дополнительного или избыточного неассоциированного DD равновесие будет сдвигаться от образования комплекса со стабилизирующим лигандом или связывания с DD, ассоциированным с ферментом CRISPR, больше в направлении образования комплекса со стабилизирующим лигандом или связывания со свободным DD (т.е. который не ассоциирован с ферментом CRISPR). Таким образом, обеспечение избыточного или дополнительного неассоциированного (или свободного) DD является предпочтительным, если нужно снизить активность фермента CRISPR за счет усиленного разрушения фермента CRISPR. Избыток свободного DD связывается с остаточным лигандом, а также лишает лиганд возможности связываться с продуктом слияния DD-Cas. Поэтому, он ускоряет разрушение DD-Cas и усиливает временный контроль активности Cas. В некоторых вариантах осуществления первый регуляторный элемент представляет собой промотор и необязательно может включать энхансер. В некоторых вариантах осуществления второй регуляторный элемент представляет собой промотор и необязательно может включать энхансер. В некоторых вариантах осуществления первый регуляторный элемент представляет собой ранний промотор. В некоторых вариантах осуществления второй регуляторный элемент представляет собой поздний промотор. В некоторых вариантах осуществления второй регуляторный элемент представляет собой, или содержит, или состоит, по сути, из индуцируемого элемента контроля, необязательно системы tet, или репрессорного элемента контроля, необязательно системы tetr. Индуцируемый промотор может быть подходящим, например, rTTA, для индуцирования tet в присутствии доксициклина.

Прикрепление или ассоциация могут быть выполнены посредством линкера, например, гибкого глицин-серинового (GlyGlyGlySer) или (GGGS)3, или жесткого альфа-спирального линкера, такого как (Ala(GluAlaAlaAlaLys)Ala). Линкеры, такие как (GGGGS)3, предпочтительно используют в данном документе для отделения белковых или пептидных доменов. (GGGGS)3 является предпочтительным, поскольку он является относительно длинным линкером (15 аминокислот). Глициновые остатки являются наиболее гибкими, а сериновые остатки повышают вероятность того, что линкер будет находится на внешней стороне белка. (GGGGS)6, (GGGGS)9 или (GGGGS)12 предпочтительно можно использовать в качестве альтернатив. Другими предпочтительными альтернативами являются (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10 или (GGGGS)11. Доступны альтернативные линкеры, но считается, что очень гибкие линкеры лучше обеспечивают максимальную возможность объединения двух 2 частей Cas и, таким образом, восстановления активности Cas. Одной альтернативой является то, что NLS нуклеоплазмина можно использовать в качестве линкера. Например, линкер также можно использовать между Cas и любым функциональным доменом. Опять-таки, в данном случае можно использовать линкер (GGGGS)3 (или его варианты с 6, 9 или 12 повторами) или можно использовать NLS нуклеоплазмина в качестве линкера между Cas и функциональным доменом.

В одном аспекте настоящего изобретения предусмотрены средства для доставки комплекса DD-CRISPR-Cas по настоящему изобретению или полинуклеотидов, обсуждаемых в данном документе, например, частица(частицы), доставляющая(доставляющие) компонент(компоненты) комплекса, вектор(векторы), содержащий(содержащие) полинуклеотид(полинуклеотиды), обсуждаемые в данном документе (например, кодирующие фермент CRISPR, DD; обеспечивающий РНК комплекса CRISPR-Cas). В некоторых вариантах осуществления вектором может быть плазмида или вирусный вектор, такой как AAV или лентивирус. Преимущественной может быть транзиентная трансфекция с помощью плазмид, например, клеток HEK, особенно с учетом ограничений по размеру для AAV и того, что, хотя Cas9 вмещается в AAV, в случае дополнительной кодирующей последовательности для ассоциации с DD может быть достигнут верхний предел.

Также предусмотрена модель, которая конститутивно экспрессирует фермент CRISPR и ассоциированный DD. Организм может быть трансгенным и может быть трансфицирован с помощью векторов по настоящему изобретению или может быть потомством организма, трансфицированного таким образом. В дополнительном аспекте настоящего изобретения предусмотрены композиции, содержащие фермент CRISPR и ассоциированный DD, или полинуклеотиды, или векторы, описываемые в данном документе. Также предусмотрены системы CRISPR-Cas, содержащие направляющие РНК.

Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, кодирующего систему, или любого из векторов согласно настоящему изобретению и введение субъекту стабилизирующего лиганда. Также может предусматриваться подходящая матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации. Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, включающий индуцирование активации или репрессии транскрипции путем трансформации субъекта с помощью полинуклеотида, кодирующего систему согласно настоящему изобретению, или любого из векторов согласно настоящему изобретению, где указанные полинуклеотид или вектор кодируют или содержат каталитически неактивный фермент CRISPR и один или несколько ассоциированных с ним функциональных доменов; при этом способ дополнительно включает введение субъекту стабилизирующего лиганда. Эти способы также могут включать доставку и/или обеспечение экспрессии избыточного DD у субъекта. В случае осуществления какой-либо обработки ex vivo, например, в культуре клеток, следует понимать, что термин "субъект" можно заменить фразой "клетка или культура клеток".

Также предусмотрены композиции, содержащие систему согласно настоящему изобретению, для применения в указанном способе лечения. Отдельная композиция может содержать стабилизирующий лиганд. Может предусматриваться набор из частей, включающих такие композиции. Также предусмотрено применение системы согласно настоящему изобретению в изготовлении лекарственного препарата для таких способов лечения. В настоящем изобретении также предусмотрено применение системы согласно настоящему изобретению в скрининге, например, скринингах в отношении мутации приобретения функции. Клетки, в которых искусственным путем обеспечивают сверхэкспрессию гена, могут снижать экспрессию гена с течением времени (восстановление равновесия), например, с помощью отрицательных обратных связей. К моменту начала скрининга уровень экспрессии нерегулируемого гена снова может быть снижен. Применение индуцируемого активатора Cas9 позволяет индуцировать транскрипцию непосредственно перед скринингом и тем самым сводит к минимуму вероятность ложноотрицательных соответствий. Соответственно, путем применения настоящего изобретения в скрининге, например, скринингах в отношении мутации приобретения функции, вероятность ложноотрицательных результатов может быть сведена к минимуму.

В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR-Cas, содержащая белок Cas и направляющую РНК, которая нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена изменяется; и где белок Cas и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, слитую с tracr-последовательностью. В одном варианте осуществления настоящего изобретения белок Cas представляет собой белок Cas9. Настоящее изобретение дополнительно охватывает кодирование белка Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

Если функциональные домены и подобные "ассоциированы" с одной или другой частью фермента, то они, как правило, являются продуктами слияния. Термин "связанный с" используется в данном документе в отношении того, как одна молекула "связывается" по отношению к другой, например, между частями фермента CRISPR и функциональным доменом. Эти два можно считать привязанными друг к другу. В случае таких белок-белковых взаимодействий эту ассоциацию можно рассматривать с точки зрения распознавания как распознавание антителом эпитопа. Альтернативно один белок может быть ассоциирован с другим белком посредством слияния обоих, например, одна субъединица является слитой с другой субъединицей. Слияние обычно происходит путем добавления одной аминокислотной последовательности к другой, например, посредством сплайсинга нуклеотидных последовательностей, которые кодируют каждый белок или субъединицу. Альтернативно, по сути, это можно рассматривать как связывание двух молекул или прямую связь, например, белок слияния. В любом случае слитый белок может включать линкер между двумя представляющими интерес субъединицами (например, между ферментом и функциональным доменом или между адаптерным белком и функциональным доменом). Таким образом, в некоторых вариантах осуществления часть фермента CRISPR ассоциирована с функциональным доменом за счет связывания с ним. В других вариантах осуществления фермент CRISPR ассоциирован с функциональным доменом ввиду того, что двое слиты вместе необязательно посредством промежуточного линкера. Примеры линкеров включают линкеры GlySer, обсуждаемые в данном документе. Тогда как не связанный ковалентной связью DD может инициировать разрушение ассоциированного Cas (например, Cas9), разрушение протеасомами предусматривает раскручивание цепи белка; и слияние является предпочтительным, поскольку оно может обеспечивать, чтобы DD оставался присоединенным к Cas при разрушении. Однако фермент CRISPR и DD сводятся вместе в присутствии стабилизирующего лиганда, специфического для DD, образуя стабилизационный комплекс. Этот комплекс содержит стабилизирующий лиганд, связанный с DD. Комплекс также содержит DD, ассоциированный с ферментом CRISPR. В отсутствии указанного стабилизирующего лиганда обеспечивается разрушение DD и ассоциированного с ним фермента CRISPR.

Дестабилизирующие домены являются универсальными для придания нестабильности широкому диапазону белков; см., например, Miyazaki, J Am Chem Soc. Mar 7, 2012; 134(9): 3942-3945, включенную в данный документ посредством ссылки. CMP8 или 4-гидрокситамоксифен могут представлять собой дестабилизирующие домены. В более широком смысле, термочувствительный мутант DHFR млекопитающих (DHFRts), дестабилизирующий остаток по правилу N-конца, как оказалось, стабилен при пермиссивной температуре, но нестабилен при 37°C. Добавление метотрексата, высокоаффинного лиганда для DHFR млекопитающих, к клеткам, экспрессирующим DHFRts, частично ингибировало разложение белка. Это было важным доказательством того, что низкомолекулярный лиганд может стабилизировать белок, в ином случае предназначеный для разложения в клетках. Производное рапамицина применяли для стабилизации нестабильного мутанта домена FRB в mTOR (FRB*) и восстановления функция слитой киназы, GSK-3β.6,7. Эта система продемонстрировала, что зависимая от лиганда стабильность является привлекательной стратегией для регуляции функции специфического белка в сложной биологической среде. Система для контроля активности белка может включать DD, становящийся функциональным при возникновении комплементации убиквитина с помощью индуцированной рапамицином димеризации белка, связывающего FK506, и FKBP12. Можно сконструировать мутантов FKBP12 человека или белка ecDHFR, которые будут метаболически нестабильны в отсутствии их высокоаффинных лигандов, Shield-1 или триметоприма (TMP) соответственно. Эти мутанты представляют собой некоторые из возможных дестабилизирующих доменов (DD), применимых при осуществлении настоящего изобретения на практике, и нестабильность DD в виде слияния с ферментом CRISPR обеспечивает разрушение белка CRISPR в виде полного слитого белка под действием протеасомы. Shield-1 и TMP связывают и стабилизируют DD дозозависимым образом. Домен связывания лиганда эстрогенового рецептора (ERLBD, остатки 305-549 в ERS1) также может быть сконструирован как дестабилизирующий домен. Поскольку сигнальный путь эстрогенового рецептора вовлечен в ряд заболеваний, таких как рак молочной железы, этот путь был широко изучен, и были разработаны многочисленные агонисты и антагонисты эстрогенового рецептора. Таким образом, известны совместимые пары ERLBD и лекарственных средств. Существуют лиганды, которые связываются с мутантой формой, а не формой дикой типа ERLBD. Путем применения одного из этих мутантных доменов, кодирующих три мутации (L384M, M421G, G521R)12, возможно регулировать стабильность DD, происходящего из ERLBD, с применением лиганда, который не нарушает эндогенные сети, чувствительные к эстрогену. Дополнительная мутация (Y537S) может быть введена для дополнительной дестабилизации ERLBD и для конфигурации его в качестве потенциального кандидата DD. Такой тетра-мутант является предпочтительной разработкой DD. Мутант ERLBD может быть слит с ферментом CRISPR, и его стабильность можно регулировать или нарушать с применением лиганда, при условии, что фермент CRISPR имеет DD. Другим DD может быть метка размером 12 кДа (107 аминокислот) на основе мутированного белка FKBP, стабилизируемого лигандом Shield1; см., например, Nature Methods 5, (2008). Например, DD может представлять собой модифицированный связывающий FK506 белок 12 (FKBP12), который связывается и обратимо стабилизируется синтетической биологически инертной малой молекулой Shield-1; см., например, Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ. A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules. Cell. 2006;126:995-1004; Banaszynski LA, Sellmyer MA, Contag CH, Wandless TJ, Thorne SH. Chemical control of protein stability and function in living mice. Nat Med. 2008;14:1123-1127; Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules. The Journal of biological chemistry. 2007;282:24866-24872; и Rodriguez, Chem Biol. Mar 23, 2012; 19(3): 391-398, все из которых включены в данный документ посредством ссылки и могут быть использованы при осуществлении настоящего изобретения на практике в выборе DD для ассоциации с ферментом CRISPR для осуществления настоящего изобретения на практике. Как можно видеть, информация из уровня техники включает целый ряд DD, и DD можно ассоциировать с ферментом CRISPR, например, сливать преимущественно с помощью линкера, в результате чего DD можно стабилизировать в присутствии лиганда, а в случае его отсутствия DD может становиться дестабилизированным, в результате чего полностью дестабилизируется фермент CRISPR, или DD может быть стабилизированным в отсутствие лиганда, а когда лиганд присутствует DD может становиться дестабилизированным; при этом DD обеспечивает возможность регуляции и контроля фермента CRISPR и, следовательно, комплекса или системы CRISPR-Cas — условно говоря, включение или выключение, с обеспечением тем самым средства для регуляции или контроля системы, например, в in vivo или in vitro окружении. Например, если представляющий интерес белок экспрессируется в виде продукта слияния с меткой DD, то он дестабилизируется и быстро разлагается в клетке, например, с помощью протеасом. Таким образом, отсутствие стабилизирующего лиганда приводит к разрушению Cas, ассоциированного с DD. Если с представляющим интерес белком сливают новый DD, его нестабильность предается представляющему интерес белку, что приводит к быстрому разрушению всего слитого белка. Пиковая активность Cas иногда выгодна для снижения нецелевых эффектов. Таким образом, короткие всплески высокой активности являются предпочтительными. Настоящее изобретение может обеспечивать такие пики. В некотором смысле система является индуцируемой. В некотором другом смысле система подвергается репрессии в отсутствие стабилизирующего лиганда и вновь активируется в присутствии стабилизирующего лиганда. Не вдаваясь в теорию и не давая каких-либо обещаний, другие преимущества настоящего изобретения могут включать следующие:

дозируемость (в отличие от системы, которая "включается" или "выключается", например, можно обеспечивать переменную активность системы или комплекса CRISPR-Cas);

ортогональность, например, лиганд влияет только на его когнатный DD, так что две или более систем могут функционировать независимо, и/или ферменты CRISPR могут быть от одного или нескольких ортологов;

транспортируемость, например, может работать в разных типах клеток или линиях клеток;

быстрота;

временный контроль;

способность снижать фоновую или нецелевую токсичность Cas или избыточное накопление Cas путем обеспечения разрушения Cas.

Хотя DD может находиться на N- и/или C-конце(концах) фермента CRISPR, в том числе DD на одной или нескольких сторонах разделения (как определяется в других разделах данного документа), например, Cas9(N)-линкер-DD-линкер-Cas9(C) также является способом введения DD. В некоторых вариантах осуществления, если используется только одна концевая ассоциация DD с ферментом CRISPR, подлежащим использованию, то предпочтительно использовать ER50 в качестве DD. В некоторых вариантах осуществления, если используются как N-конец, так и C-конец, то предпочтительно использовать ER50 и/или DHFR50. Особенно хорошие результаты наблюдали с N-концевым слиянием, что было удивительным. Наличие как N-концевого, так и C-концевого слияния может быть синергическим. Размер домена дестабилизации варьирует, но, как правило, составляет от примерно 100 до примерно 300 аминокислот. DD предпочтительно представляет собой сконструированный дестабилизирующий белок домен. DD и способы получения DD, например, из высокоаффинного лиганда и его связывающего лиганд домена. Настоящее изобретение можно считать "ортогональным", поскольку только специфический лиганд будет стабилизировать соответствующий ему (когнатный) DD, при этом он не будет влиять на стабильность некогнатных DD. Коммерчески доступной системой DD является система CloneTech, ProteoTuner™; стабилизирующим лигандом является Shield1.

В некоторых вариантах осуществления стабилизирующий лиганд представляет собой "малую молекулу". В некоторых вариантах осуществления стабилизирующий лиганд способен проникать в клетку. Он характеризуется высокой аффинностью к соответствующему ему DD. Подходящие пары DD-стабилизирующий лиганд известны из уровня техники. В целом, стабилизирующий лиганд может быть удален с помощью:

естественной обработки (например, разрушения протеасомами), например, in vivo;

зачистки, например, ex vivo/в культуре клеток, путем

обеспечения предпочтительного партнера по связыванию или

обеспечения субстрата XS (DD без Cas).

В другом аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе векторная система, содержащая один или несколько векторов, содержащих первый регуляторный элемент, функционально связанный с направляющей РНК системы CRISPR-Cas, которая нацеливается на молекулу ДНК, кодирующую продукт гена, и второй регуляторный элемент, функционально связанный с белком DD-Cas. Компоненты (a) и (b) могут быть расположены в одном и том же или разных векторах системы. Направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, а белок DD-Cas может расщеплять молекулу ДНК, кодирующую продукт гена (он может расщеплять одну или обе нити или фактически не проявлять нуклеазную активность), в результате чего экспрессия продукта гена изменяется; и где белок DD-Cas и направляющая РНК не встречаются в природе вместе. В одном варианте осуществления настоящего изобретения белок DD-Cas представляет собой белок DD-Cas9. Настоящее изобретение дополнительно охватывает кодирование белка DD-Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая один или несколько векторов. В некоторых вариантах осуществления система содержит: (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса DD-CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент DD-CRISPR, содержащий по меньшей мере одну последовательность ядерной локализации и/или по меньшей мере одну NES; где компоненты (a) и (b) находятся в одном и том же или разных векторах системы. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса DD-CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления комплекс DD-CRISPR содержит одну или несколько последовательностей ядерной локализации и/или одну или несколько NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного комплекса CRISPR в обнаруживаемом количестве в ядре эукариотической клетки или за его пределами. Не вдаваясь в теорию, полагают, что последовательность ядерной локализации и/или NES не является необходимой для активности комплекса DD-CRISPR у эукариот, но включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновой кислоты в ядре и/или молекулы за пределами ядра. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент DD-Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, Cas9 одного из этих организмов, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним) и может включать дополнительные мутации или изменения или может представлять собой химерный Cas9. Фермент может быть гомологом или ортологом DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов. В целом и на протяжении данного описания термин "вектор" обозначает молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным (регуляторными) элементом (элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).

В некоторых вариантах осуществления клетка-хозяин транзиентно или нетранзиентно трасфицирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетку трансфицируют, когда она находится в естественных условиях у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, получена от субъекта. В некоторых вариантах осуществления клетка происходит из клеток, полученных от субъекта, как, например, линии клеток. Из уровня техники известен целый ряд линий клеток, применяемых в качестве культуры тканей. Примеры линий клеток включают без ограничения C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, клетки BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN/OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линию клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные разновидности. Линии клеток доступны из множества источников, известных специалистам в данной области (см., например, Американская коллекция типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную с помощью одного или нескольких векторов, описанных в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную с помощью компонентов системы CRISPR, описанной в данном документе (как, например, путем транзиентной трансфекции с помощью одного или нескольких векторов или трансфекции с использованием РНК), и модифицированную с помощью активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки с модификацией, но без любой другой экзогенной последовательности. В некоторых вариантах осуществления клетки, транзиентно или нетранзиентно трансфицированные с помощью одного или нескольких векторов, описанных в данном документе, или линии клеток, полученные из таких клеток, применяют в оценке одного или нескольких тестируемых соединений.

Предполагается, что термин "регуляторный элемент" подразумевает промоторы, энхансеры, сайты внутренней посадки рибосомы (IRES) и другие элементы контроля экспрессии (например, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (например, печени, поджелудочной железе) или определенных типах клеток (например, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (например, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (например, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (например, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).

Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.

В одном аспекте настоящего изобретения предусмотрен вектор, содержащий регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует фермент DD-CRISPR, содержащий одну или несколько последовательностей ядерной локализации и/или NES. В некоторых вариантах осуществления указанный регуляторный элемент управляет транскрипцией фермента DD-CRISPR в эукариотической клетке так, что указанный фермент DD-CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки и/или экспортируется из ядра. В некоторых вариантах осуществления регуляторный элемент представляет собой промотор полимеразы II. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент DD-Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность).

В одном аспекте настоящего изобретения предусмотрен фермент DD-CRISPR, содержащий одну или несколько последовательностей ядерной локализации и/или NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента DD-CRISPR в обнаруживаемом количестве в ядре эукариотической клетки и/или за его пределами. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент DD-Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность).

В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса DD-CRISPR с целевой последовательностью в эукариотической клетке, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент DD-CRISPR, содержащий по меньшей мере одну последовательность ядерной локализации и/или NES. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса DD-CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR содержит одну или несколько последовательность ядерной локализации и/или последовательностей ядерного экспорта или NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки и/или за его пределами. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность). В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов. В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение. Кроме того, организм может представлять собой гриб.

В отношении применения системы CRISPR-Cas в общем упоминаются документы, в том числе патентные заявки, патенты и патентные публикации, цитируемые по всему настоящему раскрытию, поскольку варианты осуществления настоящего изобретения могут применяться как в этих документах. Система (системы) CRISPR-Cas (например, одиночная (одиночные) или мультиплексная(мультиплексные)) могут быть использованы в сочетании с последними достижениями в геномике сельскохозяйственных культур. Такая (такие) система (системы) CRISPR-Cas может (могут) быть использована (использованы) для осуществления эффективного и рентабельного детального изучения или редактирования гена или генома растений или манипуляции с ними, например, для быстрого исследования, и/или отбора, и/или детальных изучений, и/или сравнения, и/или манипуляций, и/или трансформации генов или геномов растений; например, для получения, идентификации, разработки, оптимизации или придания признака (признаков) или характеристики (характеристик) растению(растениям) или для трансформации генома растения. Соответственно, может быть улучшено получение растений, новых растений с новыми комбинациями признаков или характеристик или новых растений с улучшенными признаками. Такую (такие) систему (системы) CRISPR-Cas можно использовать по отношению к растениям при сайт-направленной интеграции (SDI) или редактировании генов (GE) или в любой из методик приближенной обратной селекции (NRB) или обратной селекции (RB). В отношении применения системы CRISPR-Cas в растениях следует упомянуть веб-сайт "CRISPR-PLANT" Аризонского университета (http://www.genome.arizona.edu/crispr/) (при поддержке Университета штата Пенсильвания и AGI). Варианты осуществления настоящего изобретения можно использовать при редактировании генома у растений или в случае, когда RNAi или аналогичные методики редактирования генома были использованы ранее; см., например, Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system", Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39); Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system", Plant Physiology September 2014 pp 114.247577; Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system", Nature Biotechnology 31, 686-688 (2013); Feng, "Efficient genome editing in plants using a CRISPR/Cas system", Cell Research (2013) 23:1229-1232. doi:10.1038/cr.2013.114; опубликовано онлайн 20 августа 2013 г.; Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system", Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. электронная публикация 17 августа 2013 г.; Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice", Rice 2014, 7:5 (2014), Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy", New Phytologist (2015) (Forum) 1-4 (доступно только онлайн по адресу www.newphytologist.com); Caliando et al., "Targeted DNA degradation using a CRISPR device stably carried in the host genome", NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989; патент США № 6603061 - Agrobacterium-Mediated Plant Transformation Method; патент США № 7868149 - Plant Genome Sequences and Uses Thereof и US 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits, все содержание и раскрытие каждого из которых включено в данный документ посредством ссылки во всей полноте. При практическом осуществлении настоящего изобретения содержание и раскрытие Morrell et al."Crop genomics: advances and applications", Nat Rev Genet. 2011 Dec 29;13(2):85-96; которое включено в данный документ посредством ссылки, в том числе то, как варианты осуществления в данном документе могут быть использованы по отношению к растениям. Соответственно, в данном документе ссылка на клетки животных также может быть применима, с учетом необходимых изменений, по отношению к клеткам растений, если не очевидно иное.

В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и/или (b) второй регуляторный элемент, функционально связанный фермент-кодирующей последовательностью, которая кодирует указанный фермент CRISPR, содержащий последовательность ядерной локализации. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR представляет собой Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент Cas9. В некоторых вариантах осуществления фермент Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность). В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса DD-CRISPR с целевым полинуклеотидом, например, для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность (например, для обеспечения одиночной направляющей РНК, sgRNA). В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента DD-CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR и направляющей последовательности, связанной с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса DD-CRISPR с полинуклеотидом, так что указанное связывание приводит к повышенной или сниженной экспрессии указанного полинуклеотида; где комплекс DD-CRISPR содержит фермент DD-CRISPR, в комплексе с направляющей последовательностью, гибридизирующейся с целевой последовательностью в пределах указанного полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR и направляющей последовательности, связанной с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность.

В одном аспекте настоящего изобретения предусмотрен способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR, направляющей последовательности, связанной с последовательность прямого повтора (если применимо, также может быть предусмотрена tracr-последовательность); и (b) обеспечение связывания комплекса DD-CRISPR с целевым полинуклеотидом, например, для осуществления расщепления целевого полинуклеотида в пределах указанного гена, ответственного за развитие заболевания, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, с получением тем самым модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента DD-CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность.

В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.

В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий направляющую последовательность выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса DD-CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.

В одном аспекте настоящего изобретения предусмотрен способ отбора одной или нескольких клеток путем введения одной или нескольких мутаций в ген в одной или нескольких клетках, при этом способ включает введение одного или нескольких векторов в клетку (клетки), где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR, направляющей последовательности, связанной с последовательностью прямого повтора (если применимо, также может быть предусмотрена tracr-последовательность), и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые обеспечивают прекращение расщепления под действием фермента DD-CRISPR; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в клетке (клетках), подлежащей (подлежащих) отбору; обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, где связывание комплекса DD-CRISPR с целевым полинуклеотидом индуцирует гибель клетки, тем самым обеспечивая возможность отбора одной или нескольких клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления фермент DD-CRISPR представляет собой DD-Cas9. В другом аспекте настоящего изобретения клетка, подлежащая отбору, может представлять собой эукариотическую клетку. Аспекты настоящего изобретения предусматривают отбор специфических клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора. Клетка (клетки) может (могут) представлять собой прокариотическую или эукариотическую клетки.

В дополнительном аспекте настоящее изобретение относится к выполняемому с помощью компьютера способу идентификации или разработки потенциальных соединений для помещения или связывания с системой DD-CRISPR-Cas9 или ее функциональной частью или наоборот (выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем DD-CRISPR-Cas9 или их функциональной части для связывания с требуемыми соединениями) или к выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем DD-CRISPR-Cas9 (например, с точки зрения прогнозирования областей в системе DD-CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных кристаллической структуры или исходя из данных ортологов Cas9, или с учетом того, где можно прикрепить функциональную группу, такую как активатор или репрессор, к системе DD-CRISPR-Cas9, или в отношении усечений Cas9, или в отношении разработки никаз), при этом указанный способ включает применение компьютерной системы, например, компьютера с хранимой программой, содержащего процессор, систему хранения данных, устройство ввода и устройство вывода, стадии (a) ввода в компьютер с хранимой программой посредством указанного устройства ввода данных, содержащих трехмерные координаты подгруппы атомов из кристаллической структуры DD-CRISPR-Cas9 или связанных с таковой, например, в домене связывания системы DD-CRISPR-Cas9 или альтернативно или дополнительно в доменах, которые варьируют, исходя из различий среди ортологов Cas9, или касающихся Cas9, или касающихся никаз, или касающихся функциональных групп, необязательно с информацией по структуре комплекса (комплексов) системы CRISPR-Cas9, с получением тем самым набора данных; (b) сравнения с применением указанного процессора указанного набора данных с компьютерной базой данных по структурам, хранящейся в указанной компьютерной системе хранения данных, например, структурам соединений, которые связываются, или предположительно связываются, или для которых требуется, чтобы они связывались с системой DD-CRISPR-Cas9, или с ортологами DD-Cas9 (например, Cas9 или с доменами или участками, которые варьируют среди ортологов Cas9), или с кристаллической структурой DD-CRISPR-Cas9, или с никазами или с функциональными группами; (c) выбора из указанной базы данных с применением компьютерных способов, структуры (структур), например, структур DD-CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться в определенными структурами DD-CRISPR-Cas9, частей системы DD-CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных по другим частям кристаллической структуры DD-CRISPR-Cas9 и/или об ортологах DD-Cas9, усеченных Cas9, новых никаз или конкретных функциональных групп или положений для прикрепления функциональных групп или для мутирования систем DD-CRISPR-Cas9; (d) конструирования с применением компьютерных способов модели выбранной (выбранных) структуры (структур), и (e) вывода данных по выбранной (выбранным) структуре (структурам) на указанное устройство вывода, и необязательно синтеза одной или нескольких выбранных структур, и дополнительно необязательного тестирования указанной (указанных) синтезированной (синтезированных) выбранной (выбранных) структуры (структур) как системы CRISPR-Cas9 или таковой (таковыми) в ней; или указанный способ включает получение координат по меньшей мере двух атомов кристаллической структуры DD-CRISPR-Cas9, например, по меньшей мере двух атомов из цитируемых в данном документе материалов, или координат по меньшей мере субдомена кристаллической структуры DD-CRISPR-Cas9 ("выбранных координат"), получение структуры кандидата, содержащего связывающую молекулу, или частей системы DD-CRISPR-Cas9, с которыми можно проводить манипуляцию, например, исходя из данных по другим частям кристаллической структуры DD-CRISPR-Cas9 и/или об ортологах Cas9, или структуре функциональных групп, и подгонку структуры кандидата к выбранным координатам, с получением тем самым данных о продукте, содержащих структуры DD-CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться с определенными структурами DD-CRISPR-Cas9, частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, усеченного Cas9, новых никаз, или конкретных функциональных групп, или положений для прикрепления функциональных групп или для мутирования систем DD-CRISPR-Cas9, с выводом данных о них; и необязательно синтез соединения (соединений) на основании указанных данных о продукте, и дополнительно необязательное тестирование указанного (указанных) синтезированного (синтезированных) соединения (соединений) как системы DD-CRISPR-Cas9 или таковой (таковых) в ней. Тестирование может предусматривать анализ системы DD-CRISPR-Cas9, полученной на основании указанной (указанных) синтезированной (синтезированных) выбранной (выбранных) структуры (структур), например, в отношении связывания или выполнения требуемой функции. Выводная информация в вышеупомянутые способах может предусматривать передачу данных, например, передачу информации через телекоммуникацию, телефон, видеоконференцию, средства массовой информации, например, презентацию, такую как компьютерная презентация (например, POWERPOINT), Интернет, электронную почту, сообщение с помощью документов, таких как документ компьютерной программы (например, WORD) и т.п. Соответственно, настоящее изобретение также охватывает машиночитаемые носители, содержащие данные атомных координат в соответствии с цитируемыми в данном документе материалами, при этом указанные данные определяют трехмерную структуру DD-CRISPR-Cas9 или по меньшей мере одного ее субдомена, или данные по структурному фактору для CRISPR-Cas9, при этом указанные данные по структурному фактору можно получить из цитируемых в данном документе материалов. Машиночитаемые носители также могут содержать любые данные из вышеупомянутых способов. Настоящее изобретение дополнительно охватывает способы с использованием компьютерной системы для получения или выполнения рациональной разработки, как в вышеупомянутых способах, предусматривающей либо данные атомных координат в соответствии с цитируемыми в данном документе материалами, при этом указанные данные определяют трехмерную структуру DD-CRISPR-Cas9 или по меньшей мере одного ее субдомена, либо данные по структурному фактору для CRISPR-Cas9, при этом указанные данные по структурному фактору получают из данных атомных координат из цитируемых в данном документе материалов. Настоящее изобретение дополнительно охватывает способ ведения коммерческой деятельности, включающий обеспечение пользователя компьютерной системой, или носителем, или данными трехмерной структуры DD-CRISPR-Cas9, или по меньшей мере одного ее субдомена, или структурного фактора для DD-CRISPR-Cas9, при этом указанная структура изложена в цитируемых в данном документе материалах, и указанные данные по структурному фактору можно получить из данных атомных координат из цитируемых в данном документе материалов, или электронным носителем, приведенным в данном документе, или передачей данных, приведенной в данном документе.

"Сайт связывания" или "активный сайт" предусматривает, или состоит, по сути, из, или состоит из сайта (такого как атом, функциональная группа аминокислотного остатка или множество таких атомов и/или групп) в полости или участке связывания, который может связываться с соединением, таким как молекула нуклеиновой кислоты, которое вовлекается в связывание. Под "подгонкой" подразумевают определение с помощью автоматизированных или полуавтоматизированных средств взаимодействий между одним или несколькими атомами кандидатной молекулы и по меньшей мере одним атомом структуры по настоящему изобретению и вычисление степени стабильности таких взаимодействий. Взаимодействия включают притяжение и отталкивание, обусловленное зарядом, стерическими аспектами и т.п. Далее описаны различные компьютерные способы подгонки. Под "среднеквадратичным (или rms) отклонением" подразумевается квадратный корень из арифметического среднего квадратов отклонений от среднего. Под "компьютерной системой" подразумевают аппаратные программные средства, программные средства и средства хранения данных, применяемые для анализа данных по атомным координатам. Минимальные аппаратные средства компьютерных систем по настоящему изобретению, как правило, содержат центральный процессор (CPU), устройства ввода, устройства вывода и средства хранения данных. Для визуализации данных по структуре желательно обеспечить дисплей или монитор. Средствами хранения данных может быть RAM или средства для доступа к машиночитаемым носителям по настоящему изобретению. Примерами таких систем являются компьютер и планшетные устройства под управлением операционных систем Unix, Windows или Apple. Под "машиночитаемыми носителями" подразумевают любой носитель или носители, которые могут быть считаны, и доступ к которым может быть получен непосредственно или опосредованно с помощью компьютера, например, так, что носители подходят для применения в вышеупомянутой компьютерной системе. Такие носители включают без ограничения магнитные запоминающие устройства, такие как дискеты, запоминающее устройство в виде жесткого диска и магнитная лента; оптические запоминающие устройства, такие как оптические диски или CD-ROM; электрические запоминающие устройства, такие как RAM и ROM; флеш-накопители; устройства с облачным хранилищем данных и гибриды этих категорий, такие как магнитные/оптические запоминающие устройства.

В конкретных вариантах осуществления настоящего изобретения конформационные изменения кристаллических структур системы DD-CRISPR-Cas9 или компонентов DD-CRISPR-Cas9 обеспечивают важную и необходимую информацию о гибкости или подвижности белковых структурных участков относительно нуклеотидных (РНК или ДНК) структурных участков, которые могут быть важны для функции системы DD-CRISPR-Cas. Информацию о структуре, представленную для Cas9 в цитируемых в данном документе материалах, можно использовать для дополнительного конструирования и оптимизации системы DD-CRISPR-Cas согласно данному документу, и ее можно экстраполировать на детальное исследование структурно-функциональных связей в другом ферменте CRISPR, например, в системах с ферментом DD-CRISPR, а также, например, в других системах с ферментом CRISPR типа V или VI (например, в других системах с ферментом DD-CRISPR типа V или VI). Настоящее изобретение охватывает оптимизированные функциональные ферментные системы DD-CRISPR-Cas. В частности, фермент DD-CRISPR содержит одну или несколько мутаций, которые превращают его в ДНК-связывающий белок, к которому могут быть рекрутированы, или добавлены, или вставлены, или прикреплены функциональные домены, проявляющие представляющую интерес функцию. В определенных вариантах осуществления фермент CRISPR содержит одну или несколько мутаций в RuvC1 фермента DD-CRISPR и/или иную мутацию, обсуждаемую в данном документе. В некоторых вариантах осуществления фермент DD-CRISPR имеет одну или несколько мутаций в каталитическом домене, где, будучи транскрибированной, направляющая последовательность управляет специфичным к последовательности связыванием комплекса DD-CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен (например, для обеспечения дестабилизированного домена или содействия ему). Информация о структуре, представленная в цитируемых в данном документе материалах, обеспечивает детальное изучение взаимодействия направляющей с целевой ДНК и ферментом CRISPR (например, Cas9; например, ферментом DD-CRISPR, например, DD-Cas9)), предоставляя возможность конструирования или изменения структуры sgRNA для оптимизации функциональности всей системы DD-CRISPR-Cas. Например, петли в направляющей могут быть увеличены без перекрывания с белком Cas9 путем вставки адаптерных белков, которые могут связываться с РНК. Такие адаптерные белки могут дополнительно рекрутировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов. Функциональный домен может содержать, состоять, по сути, из или состоять из домена активации транскрипции, например, VP64. Функциональный домен может содержать, состоять, по сути, из домена репрессии транскрипции, например, KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой, или содержит, или состоит, по сути, из SID или конкатемеров SID (например, SID4X). В некоторых вариантах осуществления функциональный домен содержит, состоит, по сути, из домена эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен содержит, состоит, по сути, из домена активации, который может представлять собой домен активации P65.

Аспекты настоящего изобретения охватывают не встречающуюся в природе или сконструированную композицию, которая может содержать направляющую РНК (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и фермент DD-CRISPR, который может содержать по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент DD-CRISPR содержит одну, или две, или больше мутаций, вследствие которых фермент характеризуется измененной или сниженной нуклеазной активностью по сравнению с ферментом дикого типа, где по меньшей мере одна петля gRNA модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок дополнительно рекрутирует один или несколько гетерологичных функциональных доменов. В одном варианте осуществления настоящего изобретения фермент DD-CRISPR содержит одну, или две, или больше мутаций. В другом варианте осуществления функциональный домен содержит, состоит, по сути, из домена активации транскрипции, например, VP64. В другом варианте осуществления функциональный домен содержит, состоит, по сути, из домена репрессии транскрипции, например, домена KRAB, домена SID или домена SID4X. В вариантах осуществления настоящего изобретения один или несколько гетерологичных функциональных доменов характеризуются одной или несколькими видами активности, выбранными из группы, включающей, состоящей, по сути, из или состоящей из метилазной активности, деметилазной активности, активности в отношении активации транскрипции, активности в отношении репрессии транскрипции, активности фактора освобождения транскрипта, активности в отношении модификации гистонов, активности расщепления РНК и активности связывания нуклеиновой кислоты. В дополнительных вариантах осуществления настоящего изобретения клетка является эукариотической клеткой, или клеткой млекопитающего, или клеткой человека. В дополнительных вариантах осуществления адаптерный белок выбран из группы, включающей, состоящей, по сути, из или состоящей из MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1. В другом варианте осуществления по меньшей мере одна петля gRNA представляет собой тетрапетлю и/или петлю 2. Один аспект настоящего изобретения охватывает способы модифицирования представляющего интерес локуса генома для изменения экспрессии гена в клетке путем введения в клетку любой из композиций, описываемых в данном документе.

Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.

В целом, gRNA модифицируют таким способом, который обеспечивает специфические сайты связывания (например, аптамеры) для адаптерных белков, содержащих один или несколько функциональных доменов (например, посредством образования слитого белка) для связывания. Модифицированные sgRNA модифицированы таким образом, что как только gRNA образует комплекс DD-CRISPR (т.е. фермент DD-CRISPR связывается с gRNA и мишенью), происходит связывание адаптерных белков, и функциональный домен на адаптерном белке располагается в пространственной ориентации, которая является преимущественной для эффективности присущей ему функции. Например, если функциональный домен содержит, состоит, по сути, из активатора транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени.

Специалисту в данной области будет понятно, что модификации в gRNA, которые обеспечивают возможность связывания адаптер + функциональный домен, но не обеспечивают надлежащее размещение адаптор + функциональный домен (например, из-за стерического несоответствия в трехмерной структуре комплекса CRISPR), представляют собой модификации, которые не подразумеваются. Одна или несколько модифицированных gRNA могут быть модифицированы по тетрапетле, "петле-на-стебле" 1, "петле-на-стебле" 2 или "петле-на-стебле" 3, описываемым в данном документе, предпочтительно либо по тетрапетле, либо по "петле-на-стебле" 2, и наиболее предпочтительно как по терапетле, так и по "петле-на-стебле" 2.

Как объясняется в данном документе, функциональные домены могут представлять собой, например, один или несколько доменов из группы, включающей, состоящей, по сути, из или состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). В некоторых случаях преимущественным является дополнительное обеспечение по меньшей мере одного NLS и/или NES. В некоторых случаях преимущественно размещать NLS и/или NES на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.

gRNA может быть разработана с включением множественных связывающих сайтов распознавания (например, аптамеров), специфических в отношении одного и того же или разных адаптерных белков. gRNA может быть разработана так, чтобы связываться с промоторным участком, расположенным на -1000 - +1 нуклеотидов выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеотидов. Такое размещение улучшает функциональные домены, которые воздействуют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированная gRNA может представлять собой одну или несколько модифицированных gRNA (например, по меньшей мере 1 gRNA, по меньшей мере 2 gRNA, по меньшей мере 5 gRNA, по меньшей мере 10 gRNA, по меньшей мере 20 gRNA, по меньшей мере 30 gRNA, по меньшей мере 50 gRNA), нацеленных на один или несколько целевых локусов, содержащихся в композиции.

Кроме того, фермент DD-CRISPR со сниженной нуклеазной активностью является наиболее эффективным, если нуклеазная активность инактивирована (например, инактивация нуклеазы по меньшей мере на 70%, по меньшей мере на 80%, по меньшей мере на 90%, по меньшей мере на 95%, по меньшей мере на 97% или на 100% по сравнению с ферментом дикого типа; или, другими словами, фермент DD-Cas9 или фермент DD-CRISPR характеризуется преимущественно приблизительно 0% нуклеазной активностью относительно немутированного фермента Cas9 или фермента CRISPR или фермента дикого типа, или не более чем приблизительно 3%, или приблизительно 5%, или приблизительно 10% нуклеазной активностью относительно немутированного фермента Cas9 или фермента CRISPR или фермента дикого типа). Это возможно путем введения мутаций в нуклеазный домен RuvC Cas9 и его ортологов. Инактивированный фермент CRISPR может быть ассоциирован (например, посредством образования слитого белка) с одним или несколькими функциональными доменами, например, по меньшей мере с одним дестабилизирующим доменом; или, например, подобными описываемым в данном документе для модифицированных gRNA, связывающих адаптерные белки, в том числе, например, с одним или несколькими доменами из группы, включающей, состоящей, по сути, из или состоящей из доменов с метилазной активностью, деметилазной активности, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, когда предусматривается Fok1, преимущественно, чтобы предусматривались множественные функциональные домены Fok1 для обеспечения функционального димера, и чтобы разрабатывались gRNA, обеспечивающие надлежащее расстояние для функционального применения (Fok1), как конкретно описано в Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов. В некоторых случаях преимущественным является дополнительное обеспечение по меньшей мере одного NLS или NES. В некоторых случаях преимущественно размещать NLS или NES на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В целом, размещение одного или нескольких функциональных доменом в инактивированном ферменте DD-CRISPR обеспечивает корректную пространственную ориентацию функционального домена, чтобы воздействовать на мишень с присущим ему функциональным эффектом. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени. Могут быть предусмотрены положения, отличные от N-/C-конца фермента DD-CRISPR.

Адаптерный белок может представлять собой любой из ряда белков, который связывается с аптамером или сайтом распознавания, введенным в модифицированную gRNA, и который обеспечивает возможность правильного размещения одного или нескольких функциональных доменов, после того как gRNA встроилась в комплекс CRISPR, чтобы воздействовать на мишень в пределах присущей ему функции. Как подробно объясняется в настоящей заявке, они могут представлять собой белки оболочки, предпочтительно белки оболочки бактериофагов. Функциональные домены, ассоциированные с такими адаптерными белками (например, в форме слитого белка), могут включать, например, один или несколько доменов из группы, включающей, состоящей, по сути, из или состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, если функциональный домен представляет собой активатор транскрипции или репрессор транскрипции, преимущественным является дополнительное обеспечение по меньшей мере NLS или NES и предпочтительно на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В адаптерном белке можно использоваться известные линкеры для прикрепления таких функциональных доменов. Такие линкеры можно применять для ассоциации DD с ферментом CRISPR или для обеспечения фермента CRISPR, содержащего DD.

Таким образом, все из gRNA, например, модифицированной gRNA, инактивированного фермента DD-CRISPR (с функциональными доменами или без них) и связывающего белка с одним или несколькими функциональными доменами могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение хозяину может быть выполнено посредством вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной sgRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта. Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).

Настоящее изобретение охватывает применение композиций по настоящему изобретению для создания и использования трансгенных клеток/животных с зависимой от условий или индуцируемой DD-CRISPR; см, например, Platt et al., Cell (2014), 159(2): 440-455, или патентные публикации согласно PCT, процитированные в данном документе, такие как WO 2014/093622 (PCT/US2013/074667). Например, клетки или животные, такие как отличные от человека животные, например, позвоночные или млекопитающие, такие как грызуны, например, мыши, крысы, или другие лабораторные или внелабораторные животные, например, кошки, собаки, овцы и т.д., могут характеризоваться состоянием "нокин", в результате чего у животного в зависимости от условий или индуцируемо экспрессируется DD-Cas9, как описано в Platt et al. Таким образом, целевая клетка или животное содержат зависимый от условий или индуцируемый фермент DD-CRISPR (например, DD-Cas9) (например, в форме Cre-зависимых конструкций) и/или зависимый от условий или индуцируемый адаптерный белок или DD, и при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента DD-CRISPR (например, DD-Cas9) и/или экспрессии адаптера или DD в целевой клетке. С применением идей и композиций в соответствии с настоящим изобретением с известным способом создания комплекса CRISPR индуцируемые преобразования генома также являются аспектом настоящего изобретения. Одним из примеров этого является создание трансгенного животного с нокином CRISPR/зависимой от условий экспрессией (например, мыши, содержащей, например, кассету Lox-Stop-polyA-Lox(LSL)) и последующая доставка одной или нескольких композиций, обеспечивающих одну или несколько модифицированных gRNA (например, -200 нуклеотидов до TSS в представляющем интерес целевом гене для целей активации гена, например, модифицированных gRNA с одним или несколькими аптамерами, распознаваемыми белками оболочки, например, MS2), один или несколько адаптерных белков, описываемых в данном документе (MS2-связывающий белок, связанный с одним или несколькими VP64), и средств для индуцирования животного с зависимой от условий экспрессией (например, рекомбиназы Cre для обеспечения индуцируемой экспрессии DD-Cas9). Альтернативно адаптерный белок или DD может обеспечиваться как зависимый от условий или индуцируемый элемент с зависимым от условий или индуцируемым ферментом CRISPR, чтобы обеспечить эффективную модель для целей скрининга, для которой преимущественно требуется только минимальная разработка и введение специфических gRNA для целого ряда применений.

В некоторых вариантах осуществления фенотипическое изменение предпочтительно является результатом модификации генома при осуществлении нацеливания на генетическое заболевание, особенно в способах терапии, и предпочтительно, если обеспечивается матрица для репарации для коррекции или изменения фенотипа.

В некоторых вариантах осуществления заболевания, на которые можно осуществлять нацеливание, включают заболевания, которые обусловлены патогенными дефектами сплайсинга.

В некоторых вариантах осуществления клеточные цели включают в себя гемопоэтические стволовые клетки/клетки-предшественники (CD34+); человеческие T-клетки и клетки глаза (клетки сетчатки), например, фоторецепторные клетки-предшественники.

В некоторых вариантах осуществления гены-мишени включают: ген бета-глобина человека - HBB (для лечения серповидноклеточной анемии, в том числе путем стимуляции конверсии генов (с использованием близкородственного гена HBD в качестве эндогенной матрицы)); CD3 (T-клетки) и CEP920 - сетчатка (глаза).

В некоторых вариантах осуществления заболевания-мишени также включают рак; серповидноклеточную анемию (обусловленную точечной мутацией); HBV, HIV; бета-талассемию; а также офтальмологическое или глазное заболевание, например, врожденный амавроз Лебера (LCA), вызванный дефектом сплайсинга.

В некоторых вариантах осуществления способы доставки включают опосредованную катионным липидом "прямую" доставку комплекса фермент-направляющая (рибонуклеопротеин) и электропорацию плазмидной ДНК.

Способы, продукты и варианты применения, описанные в данном документе, можно применять для целей, не связанных с терапией. Кроме того, любой из способов, описанных в данном документе, можно применять in vitro и ex vivo.

В одном аспекте предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая:

I. две или более полинуклеотидные последовательности системы CRISPR-Cas, предусматривающие

(a) первую направляющую последовательность, способную гибридизироваться с первой целевой последовательностью в полинуклеотидном локусе,

(b) вторую направляющую последовательность, способную гибридизироваться со второй целевой последовательностью в полинуклеотидном локусе,

(c) последовательность прямого повтора,

(d) необязательно, если применимо, tracr-последовательность; и

II. фермент Cas9 или вторую полинуклеотидную последовательность, кодирующую его,

где фермент Cas9 представляет собой модифицированный фермент, содержащий один или несколько DD, описываемых в данном документе,

где будучи транскрибированными, первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплекса CRISPR с первой и второй целевыми последовательностями соответственно,

где первый комплекс CRISPR содержит фермент Cas9 в комплексе с первой направляющей последовательностью, которая может гибридизироваться с первой целевой последовательностью,

где второй комплекс CRISPR содержит фермент Cas9 в комплексе со второй направляющей последовательностью, которая может гибридизироваться со второй целевой последовательностью, и

где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, при этом индуцируется двухнитевой разрыв, за счет чего обеспечивается модифицирование организма, или отличного от человеческого, или отличного от животного организма.

В другом варианте осуществления Cas9 доставляется в клетку в виде белка. В другом и особенно предпочтительном варианте осуществления Cas9 доставляется в клетку в виде белка или в виде нуклеотидной последовательности, кодирующей его. Доставка в клетку в виде белка может включать доставку рибонуклеопротеинового (RNP) комплекса, где белок находится в комплексе с направляющей.

В одном аспекте предусмотрены клетки-хозяева и линии клеток, модифицированные с помощью композиций, систем или модифицированных ферментов по настоящему изобретению или содержащие их, в том числе стволовые клетки и их потомство.

В одном аспекте предусмотрены способы клеточной терапии, при которых, например, отдельную клетку или популяцию клеток отбирают или культивируют, где такую клетку или клетки модифицируют или они были модифицированы ex vivo, как описано в данном документе, а затем возвращают (отобранные клетки) или вводят (культивируемые клетки) в организм. Стволовые клетки, будь то эмбриональные, индуцированные плюрипотентные или тотипотентные стволовые клетки, также особенно предпочтительны в этом отношении. Но, разумеется, также предусматриваются варианты осуществления in vivo.

Способы в соответствии с настоящим изобретением могут дополнительно предусматривать доставку матриц, таких как матрицы для репарации, которые могут представлять собой dsODN или ssODN, см. ниже. Доставка матриц может осуществляться одновременно или отдельно от доставки какого-либо или всех из фермента CRISPR или направляющей и с помощью одного и того же или различных механизмов доставки. В некоторых вариантах осуществления предпочтительно, чтобы матрица доставлялась вместе с направляющей и, предпочтительно, также с ферментом CRISPR. Примером может служить вектор на основе AAV, при этом фермент CRISPR представляет собой AsCas9 или LbCas9.

Способы в соответствии с настоящим изобретением могут дополнительно включать: (a) доставку в клетку двухнитевого олигодезоксинуклеотида (dsODN), содержащего "липкие" концы, комплементарные "липким" концам, создаваемым с помощью указанного двухнитевого разрыва, где указанный dsODN интегрируется в представляющий интерес локус; или (b) доставку в клетку однонитевого олигодезоксинуклеотида (ssODN), где указанный ssODN действует как матрица для гомологичной репарации указанного двухнитевого разрыва. Способы в соответствии с настоящим изобретением можно применять для предупреждения или лечения заболевания у индивидуума, при этом необязательно указанное заболевание вызвано дефектом в указанном представляющем интерес локусе. Способы в соответствии с настоящим изобретением можно выполнять in vivo у индивидуума или ex vivo в отношении клетки, извлеченной из индивидуума, где необязательно указанную клетку возвращают в организм индивидуума.

Настоящее изобретение также охватывает продукты, полученные в результате применения фермента CRISPR, или фермента Cas, или фермента Cas9, или фермента CRISPR-CRISPR, или системы CRISPR-Cas, или системы CRISPR-Cas9 по настоящему изобретению.

Структурная гомология, гомологи и ортологи

В вариантах осуществления белок Cas9, упоминаемый в данном документе, также охватывает гомолога или ортолога Cas9, такого как SpCas9 или eSpCas9. Термины "ортологичный" (также в данном документе называемый "ортолог") и "гомологичный" (также в данном документе называемый "гомолог") хорошо известны из уровня техники. В качестве дополнительного руководства, "гомологичный" белок, как используется в данном документе, представляет собой белок того же вида, который выполняет ту же или подобную функцию, что и белок, которому он гомологичен. Гомологи и ортологи могут быть идентифицированы с помощью моделирования гомологии (см., например, Greer, Science vol. 228 (1985) 1055, и Blundell et al. Eur J Biochem vol 172 (1988), 513) или "структурного BLAST" (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a "structural BLAST": using structural relationships to infer function. Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225.). См. также Shmakov et al. (2015) в рамках применения в области локусов CRISPR-Cas. Гомологичные белки могут, но не обязательно должны быть структурно родственными, или они являются только частично структурно родственными. "Ортологичный" белок, как используется в настоящем документе, представляет собой белок от другого вида, который выполняет ту же или подобную функцию, что и белок, которому он ортологичен. Ортологичные белки могут, но не обязательно должны быть структурно родственными, или они являются только частично структурно родственными. В конкретных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с Cas9. В дополнительных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с Cas9 дикого типа. В конкретных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с Cas9. В дополнительных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с SpCas9 дикого типа. Если Cas9 имеет одну или несколько мутаций (мутированный), то гомолог или ортолог указанного Cas9, упоминаемого в данном документе, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с мутированным Cas9.

Конкретные домены ортологичных белков, подобным образом, являются родственными. В определенных вариантах осуществления ортологичный домен Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90% или по меньшей мере 95%, с Cas9. В конкретных вариантах осуществления ортологичный домен Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90% или по меньшей мере 95%, с SpCas9.

Доставка комплекса CRISPR-Cas9 или его компонентов

Благодаря использованию данного раскрытия и сведений из уровня техники, систему CRISPR-Cas, особенно новые системы CRISPR, описанные в данном документе, или ее компоненты, или ее молекулы нуклеиновой кислоты (в том числе, например, матрицу для HDR), или молекулы нуклеиновой кислоты, кодирующие или представляющие собой ее компоненты, можно доставлять с помощью системы доставки, описываемой в данном документе как в целом, так и в подробностях.

Векторная доставка, например, доставка с помощью плазмиды, вируса. Фермент CRISPR, например, Cas9, ортолог Cas9 или его мутант, и/или любую из РНК по настоящему изобретению, например, направляющую РНК, можно доставлять с помощью любого подходящего вектора, например, плазмиды или вирусных векторов, таких как аденоассоциированный вирус (AAV), лентивирус, аденовирус или другие типы вирусных векторов, или их комбинации. Cas9 и одна или несколько направляющих РНК могут быть упакованы в одном или нескольких векторах, например, плазмиде или вирусных векторах. В некоторых вариантах осуществления вектор, например, плазмиду или вирусный вектор, доставляют в представляющую интерес ткань посредством, например, внутримышечной инъекции, тогда как в других случаях доставка осуществляется посредством внутривенного, трансдермального, интраназального, перорального, трансмукозального или других способов доставки. Такая доставка может осуществляться в виде однократной дозы или многократных доз. Специалисту в данной области понятно, что фактическая доза, подлежащая доставке согласно данному документу, может в значительной степени варьировать в зависимости от ряда факторов, таких как выбор вектора, целевые клетка, организм или ткань, общее состояние субъекта, подлежащего лечению, степень требуемой трансформации/модификации, путь введения, способ введения, тип требуемой трансформации/модификации и т.п.

Такая доза может дополнительно содержать, например, носитель (воду, солевой раствор, этанол, глицерин, лактозу, сахарозу, фосфат кальция, желатин, декстран, агар, пектин, арахисовое масло, кунжутное масло и т.д.), разбавитель, фармацевтически приемлемый носитель (например, фосфатно-солевой буфер), фармацевтически приемлемый наполнитель и/или другие соединения, известные из уровня техники. Доза может дополнительно содержать одну или несколько фармацевтически приемлемых солей, таких как, например, соль неорганической кислоты, такая как гидрохлорид, гидробромид, фосфат, сульфат и т.д.; и соли органических кислот, такие как ацетаты, пропионаты, малонаты, бензоаты и т.д. Дополнительно в ней также могут присутствовать вспомогательные вещества, такие как смачивающие или эмульгирующие средства, буферные вещества, поддерживающие pH, гели или гелеобразующие материалы, ароматизаторы, красители, микросферы, полимеры, суспендирующие средства и т.д. Кроме того, также могут присутствовать один или несколько других традиционных фармацевтических ингредиентов, таких как консерванты, увлажнители, суспендирующие средства, поверхностно-активные вещества, антиоксиданты, средства против слеживания, заполнители, хелатообразователи, средства для нанесения покрытий, химические стабилизаторы и т.д., особенно если лекарственная форма представляет собой форму, подлежащую восстановлению. Подходящие иллюстративные ингредиенты включают микрокристаллическую целлюлозу, натрий-карбоксиметилцеллюлозу, полисорбат 80, фенилэтиловый спирт, хлорбутанол, сорбат калия, сорбиновую кислоту, диоксид серы, пропилгаллат, парабены, этилванилин, глицерин, фенол, парахлорфенол, желатин, альбумин и их комбинацию. Подробное обсуждение фармацевтически приемлемых наполнителей доступно в REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991), включенном в данный документ посредством ссылки.

В одном варианте осуществления согласно данному документу доставку осуществляют посредством аденовируса, который может находиться в однократной бустерной дозе, содержащей по меньшей мере 1 x 105 частиц (также называемых единицами частиц, pu) аденовирусного вектора. В одном варианте осуществления согласно данному документу доза предпочтительно составляет по меньшей мере приблизительно 1 x 106 частиц (например, приблизительно 1 x 106 - 1 x 1012 частиц), более предпочтительно по меньшей мере приблизительно 1 x 107 частиц, более предпочтительно по меньшей мере приблизительно 1 x 108 частиц (например, приблизительно 1 x 108 - 1 x 1011 частиц или приблизительно 1 x 108 - 1 x 1012 частиц) и наиболее предпочтительно по меньшей мере приблизительно 1 x 109 частиц (например, приблизительно 1 x 109 - 1 x 1010 частиц или приблизительно 1 x 109 - 1 x 1012 частиц) или даже по меньшей мере приблизительно 1 x 1010 частиц (например, приблизительно 1 x 1010 - 1 x 1012 частиц) аденовирусного вектора. Альтернативно доза содержит не более чем приблизительно 1 x 1014 частиц, предпочтительно не более чем приблизительно 1 x 1013 частиц, еще более предпочтительно не более чем приблизительно 1 x 1012 частиц, еще более предпочтительно не более чем приблизительно 1 x 1011 частиц и наиболее предпочтительно не более чем приблизительно 1 x 1010 частиц (например, не более чем приблизительно 1 x 109 частиц). Таким образом, доза может включать в себя однократную дозу аденовирусного вектора, например, с приблизительно 1 x 106 единиц частиц (pu), приблизительно 2 x 106 pu, приблизительно 4 x 106 pu, приблизительно 1 x 107 pu, приблизительно 2 x 107 pu, приблизительно 4 x 107 pu, приблизительно 1 x 108 pu, приблизительно 2 x 108 pu, приблизительно 4 x 108 pu, приблизительно 1 x 109 pu, приблизительно 2 x 109 pu, приблизительно 4 x 109 pu, приблизительно 1 x 1010 pu, приблизительно 2 x 1010 pu, приблизительно 4 x 1010 pu, приблизительно 1 x 1011 pu, приблизительно 2 x 1011 pu, приблизительно 4 x 1011 pu, приблизительно 1 x 1012 pu, приблизительно 2 x 1012 pu или приблизительно 4 x 1012 pu аденовирусного вектора. См., например, аденовирусные векторы в патенте США № 8454972 B2 Nabel, et. al., выданном 4 июня 2013 г.; включенном в данный документ посредством ссылки, и дозы в столбце 29, строках 36-58 данного патента. В одном варианте осуществления согласно данному документу аденовирус доставляется посредством многократных доз.

В одном варианте осуществления согласно данному документу доставку осуществляют посредством AAV. Полагают, что терапевтически эффективная доза для in vivo доставки AAV человеку находится в диапазоне от приблизительно 20 до приблизительно 50 мл физиологического раствора, содержащего от приблизительно 1 x 1010 до приблизительно 1 x 1010 функциональных частиц AAV/мл раствора. Дозу можно скорректировать для уравновешивания терапевтической пользы и любых побочных эффектов. В одном варианте осуществления согласно данному документу доза AAV, как правило, находится в диапазоне концентраций от приблизительно 1 x 105 до 1 x 1050 геномов AAV, от приблизительно 1 x 108 до 1 x 1020 геномов AAV, от приблизительно 1 x 1010 до приблизительно 1 x 1016 геномов или от приблизительно 1 x 1011 до приблизительно 1 x 1016 геномов AAV. Доза для человека может составлять приблизительно 1 x 1013 геномов AAV. Такие концентрации можно доставлять в растворе носителя объемом от приблизительно 0,001 мл до приблизительно 100 мл, от приблизительно 0,05 до приблизительно 50 мл или от приблизительно 10 до приблизительно 25 мл. Другие эффективные дозы может без труда установить средний специалист в данной области посредством стандартных испытаний с построением кривых зависимости "доза-эффект". См., например, патент США № 8404658 B2 Hajjar, et al., выданный 26 марта 2013 г., в столбце 27, строках 45-60.

В одном варианте осуществления согласно данному документу доставку осуществляют посредством плазмиды. В таких композициях с плазмидами доза должна представлять собой количество плазмид, достаточное для вызывания эффекта. Например, подходящие количества плазмидной ДНК в композициях с плазмидами могут составлять от приблизительно 0,1 до приблизительно 2 мг или от приблизительно 1 мкг до приблизительно 10 мкг из расчет на индивидуума весом 70 кг. Плазмиды по настоящему изобретению в общем будут содержать (i) промотор; (ii) последовательность, кодирующую фермент CRISPR, функционально связанную с указанным промотором; (iii) селектируемый маркер; (iv) точку начала репликациии и (v) расположенный ниже нее терминатор транскрипции, функционально связанный с (ii). Плазмида может также кодировать компоненты РНК комплекса CRISPR, но наряду с этим один или несколько из них могут кодироваться другим вектором.

Дозы в данном документе определяются в расчете на индивидуума со средним весом 70 кг. Частота введения находится в пределах компетенции практикующего врача или ветеринара (например, доктора, ветеринарного врача) или ученого, являющегося специалистом в данной области. Также отмечено, что вес используемых в эксперименте мышей, как правило, составляет приблизительно 20 г, что при проведении экспериментов с мышами пропорционально индивидууму весом 70 кг.

В некоторых вариантах осуществления молекулы РНК по настоящему изобретению доставляют в липосомных составах или составах на основе Lipofectin и им подобных, и их можно получить с помощью способов, хорошо известных специалистам в данной области. Такие способы описаны, например, в патентах США №№ 5593972, 5589466 и 5580859, включенных в данный документ посредством ссылки. Были разработаны системы доставки, специально предназначенные для повышения эффективности и улучшения доставки siRNA в клетки млекопитающих (см., например, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 и Simeoni et al., NAR 2003, 31, 11: 2717-2724), и их можно применять в настоящем изобретении. Недавно siRNA успешно применили для ингибирования экспрессии генов у приматов (см., например, Tolentino et al., Retina 24(4):660), и их также можно применять в настоящем изобретении.

И действительно, доставка РНК также является применимым способом доставки in vivo. Cas9 и gRNA (и, например, матрицу для HR-репарации) можно доставлять в клетки с использованием липосом, или частиц, или наночастиц. Таким образом, доставка фермента CRISPR, такого как Cas9, и/или доставка РНК по настоящему изобретению может осуществляться в форме РНК и посредством микровезикул, липосом, или частиц, или наночастиц. Например, мРНК Cas9 и gRNA могут быть упакованы в липосомные частицы для доставки in vivo. Реагенты для липосомной трансфекции, такие как Lipofectamine от Life Technologies, и другие реагенты, имеющиеся в продаже, могут эффективно доставлять молекулы РНК в печень.

Также предпочтительные средства доставки РНК включают доставку РНК посредством частиц или наночастиц (Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010) или экзосом (Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641). И действительно, как было показано, экзосомы являются особенно применимыми в доставке siRNA, системы, в некоторой степени сходной с системой CRISPR. Например, El-Andaloussi S, et al. ("Exosome-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. электронная публикация от 15 ноября 2012 г.) описывают как экзосомы, являющиеся перспективными инструментами доставки лекарственных средств через различные биологические барьеры, можно приспособить для доставки siRNA in vitro и in vivo. Данный подход заключается в создании целенаправленных экзосом посредством трансфекции вектором экспрессии, содержащим экзосомный белок, слитый с пептидным лигандом. Экзосомы затем очищают от супернатанта с трансфицированными клетками и характеризуют, а затем в экзосомы загружают РНК. Доставку или введение в соответствии с настоящим изобретением можно осуществлять с помощью экзосом, в частности, без ограничения в головной мозг. Витамин E (α-токоферол) можно конъюгировать с CRISPR-Cas и доставлять в головной мозг вместе с липопротеином высокой плотности (HDL), например, аналогично тому, как это было выполнено Uno et al. (HUMAN GENE THERAPY 22:711-719 (June 2011)) для доставки короткой интерферирующей РНК (siRNA) в головной мозг. Мышам проводили инфузию с помощью осмотических мининасосов (модель 1007D; Alzet, Купертино, Калифорния), наполненных фосфатно-солевым буфером (PBS) или свободной Toc-siBACE или Toc-siBACE/HDL, и соединенных с набором 3 для инфузий в головной мозг (Alzet). Канюлю для инфузий в головной мозг размещали приблизительно на 0,5 мм кзади от брегмы на средней линии для инфузии в дорсальную часть третьего желудочка. Uno et al. обнаружили, что всего 3 нмоль Toc-siRNA с HDL в том же способе ICV инфузии могут индуцировать аналогичную степень целенаправленного снижения. Аналогичная доза CRISPR-Cas, конъюгированной с α-токоферолом и вводимой совместно с HDL, целенаправленно воздействующей на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться в количестве от приблизительно 3 нмоль до приблизительно 3 мкмоль CRISPR-Cas, целенаправленно воздействующей на головной мозг. Zou et al. (HUMAN GENE THERAPY 22:465-475 (April 2011)) описывают способ опосредованной лентивирусами доставки коротких шпилечных РНК, нацеливающихся на PKCγ, для сайленсинга in vivo генов в спинном мозге крыс. Zou et al. вводили приблизительно 10 мкл рекомбинантного лентивируса с титром 1 x 109 трансдуцирующих единиц (TU)/мл с помощью интратекального катетера. Аналогичная доза экспрессируемой CRISPR-Cas в лентивирусном векторе, нацеливающемся на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться приблизительно 10-50 мл CRISPR-Cas, нацеливающейся на головной мозг, в лентивирусе с титром 1 x 109 трансдуцирующих единиц (TU)/мл.

Если подразумевают местную доставку в головной мозг, то этого можно достичь разными способами. Например, материал можно доставлять интрастриатально, например, с помощью инъекции. Инъекцию можно осуществлять стереотаксически посредством краниотомии.

Повышение эффективности NHEJ или HR также способствует доставке. Предпочтительно, чтобы эффективность NHEJ повышали посредством совместной экспрессии ферментов для обработки концов, таких как Trex2 (Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). Предпочтительно, чтобы эффективность HR повышалась путем транзиентного ингибирования компонентов аппарата NHEJ, таких как Ku70 и Ku86. Эффективность HR также можно повысить путем совместной экспрессии прокариотических или эукариотических ферментов гомологичной рекомбинации, таких как RecBCD, RecA.

Упаковка и промоторы

Существуют следующие способы упаковки молекул нуклеиновой кислоты, кодирующих Cas9 по настоящему изобретению, например ДНК, в векторы, например вирусные векторы, для опосредования модификации генома in vivo.

Для обеспечения опосредованного NHEJ нокаута гена необходимо следующее.

Один вирусный вектор

Вектор, содержащий две или более кассет экспрессии:

промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;

промотор-gRNA1-терминатор;

промотор-gRNA2-терминатор;

промотор-gRNA(N)-терминатор (до предельного размера вектора).

Два вирусных вектора

Вектор 1, содержащий одну кассету экспрессии для управления экспрессией Cas9:

промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;

вектор 2, содержащий одну или несколько кассет экспрессии для управления экспрессией одной или нескольких направляющих РНК:

промотор-gRNA1-терминатор;

промотор-gRNA(N)-терминатор (до предельного размера вектора).

Для опосредования репарации с участием гомологичной рекомбинации.

В дополнение к подходам с одним и двумя вирусными векторами, описанными выше, можно использовать дополнительный вектор для доставки матрицы для репарации с участием гомологичной рекомбинации.

Промотор, используемый для управления экспрессией молекулы нуклеиновой кислоты, кодирующей Cas9, может включать следующее.

— ITR AAV может служить в качестве промотора: это является преимущественным для устранения необходимости в дополнительном промоторном элементе (который может занимать пространство в векторе). Освободившееся дополнительное пространство можно задействовать для управления экспрессией дополнительных элементов (gRNA и т.д.). Также активность ITR является относительно более слабой, поэтому ее можно использовать для снижения потенциальной токсичности, обусловленной сверхэкспрессией Cas9.

— Для повсеместной экспрессии промоторы, которые могут быть использованы, включают: CMV, CAG, CBh, PGK, SV40, генов тяжелой или легкой цепей ферритина и т.д.

Для экспрессии в головном мозге или в другом отделе ЦНС можно использовать следующие промоторы: гена синапсина I для всех нейронов, гена CaMKII-альфа для возбуждающих нейронов, GAD67, или GAD65, или VGAT для GABA-эргических нейронов и т.д. Для экспрессии в печени можно использовать промотор гена альбумина. Для экспрессии в легком можно использовать SP-B. Для эндотелиальных клеток можно использовать ICAM. Для кроветворных клеток можно использовать промотор гена IFN-бета или CD45. Для остеобластов можно использовать OG-2.

Промотор, используемый для управления направляющей РНК, может включать в себя следующее:

— промоторы Pol III, такие как U6 или H1;

— использование промотора Pol II и интронных кассет для экспрессии gRNA.

Аденоассоциированный вирус (AAV)

Cas9 или мутант или ортолог Cas9 и одну или несколько направляющих РНК можно доставлять с помощью аденоассоциированного вируса (AAV), лентивируса, аденовируса или других типов плазмидных или вирусных векторов, в частности, с применением составов и доз согласно, например, патентам США №№ 8454972 (составы, дозы для аденовируса), 8404658 (составы, дозы для AAV) и 5846946 (составы, дозы для плазмидных ДНК) и клиническим испытаниям и публикациям результатов клинических испытаний с использованием лентивируса, AAV и аденовируса. Например, для AAV путь введения, состав и доза могут быть такими, как определено в патенте США № 8454972 и в клинических испытаниях с использованием AAV. Для аденовируса путь введения, состав и доза могут быть такими, как определено в патенте США № 8404658 и в клинических испытаниях с использованием аденовируса. Для доставки с помощью плазмид путь введения, состав и доза могут быть такими, как определено в патенте США № 5846946 и в клинических испытаниях с использованием плазмид. Дозы могут быть определены в расчете на или экстраполированы на индивидуума со средним весом 70 кг (например, взрослый мужчина), и могут быть скорректированы для пациентов, субъектов, млекопитающих с другим весом и другого вида. Частота введения входит в пределы компетенции практикующего врача или ветеринара (например, доктора, ветеринарного врача) и зависит от обычных факторов, в том числе от возраста, пола, общего состояния здоровья, других состояний пациента или субъекта и конкретных рассматриваемых состояний или симптомов. Вирусные векторы можно инъецировать в представляющую интерес ткань. В случае специфичной относительно типа клетки модификации генома, экспрессия Cas9 может управляться промотором, специфичным относительно типа клетки. Например, при печеночноспецифической экспрессии может использоваться промотор гена альбумина, а при нейрон-специфической экспрессии (например, для нацеливания на нарушения ЦНС) может использоваться промотор гена синапсина I.

Что касается доставки in vivo, то AAV является преимущественным по сравнению с другими вирусными векторами по двум причинам:

низкая токсичность (она может быть обусловлена способом очистки, не требующим ультрацентрифугирования клеточных частиц, которые могут активировать иммунный ответ);

низкая вероятность вызова инсерционного мутагенеза, поскольку он не интегрируется в геном хозяина.

AAV имеет предел упаковки, составляющий 4,5 или 4,75 т.п.о. Это означает, что все из Cas9, а также промотора и терминатора транскрипции должны помещаться в одном и том же вирусном векторе. Конструкции, размер которых превышает 4,5 или 4,75 т.п.о., будут обуславливать значительное снижение продуцирования вируса. SpCas9 является достаточно крупным, размер гена самого по себе превышает 4,1 т.п.о., затрудняя его упаковку в AAV. Следовательно, варианты осуществления настоящего изобретения включают использование более коротких гомологов Cas9. Например:

Вид Размер Cas9
Corynebacter diphtheriae 3252
Eubacterium ventriosum 3321
Streptococcus pasteurianus 3390
Lactobacillus farciminis 3378
Sphaerochaeta globus 3537
Azospirillum B510 3504
Gluconacetobacter diazotrophicus 3150
Neisseria cinerea 3246
Roseburia intestinalis 3420
Parvibaculum lavamentivorans 3111
Staphylococcus aureus 3159
Nitratifractor salsuginis DSM 16511 3396
Campylobacter lari CF89-12 3009
Streptococcus thermophilus LMD-9 3396

Эти виды, таким образом, в целом являются предпочтительными видами для получения Cas9.

Что касается AAV, то AAV может представлять собой AAV1, AAV2, AAV5 или любую их комбинацию. Можно выбрать AAV из AAV с учетом клеток, подлежащих нацеливанию; например, можно выбрать AAV серотипов 1, 2, 5 или гибридный капсид AAV1, AAV2, AAV5 или любую их комбинацию для нацеливания на головной мозг или нейроны; и можно выбрать AAV4 для нацеливания на сердечную ткань. AAV8 применим для доставки в печень. Вышеуказанные промоторы и векторы в данном документе являются предпочтительными по отдельности. Сопоставление определенных серотипов AAV по отношению к определенным клеткам (см. Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)) представлено следующим образом:

Линия клеток AAV-1 AAV-2 AAV-3 AAV-4 AAV-5 AAV-6 AAV-8 AAV-9
Huh-7 13 100 2,5 0,0 0,1 10 0,7 0,0
HEK293 25 100 2,5 0,1 0,1 5 0,7 0,1
HeLa 3 100 2,0 0,1 6,7 1 0,2 0,1
HepG2 3 100 16,7 0,3 1,7 5 0,3 Нет данных
Hep1A 20 100 0,2 1,0 0,1 1 0,2 0,0
911 17 100 11 0,2 0,1 17 0,1 Нет данных
CHO 100 100 14 1,4 333 50 10 1,0
COS 33 100 33 3,3 5,0 14 2,0 0,5
MeWo 10 100 20 0,3 6,7 10 1,0 0,2
NIH3T3 10 100 2,9 2,9 0,3 10 0,3 Нет данных
A549 14 100 20 Нет данных 0,5 10 0,5 0,1
HT1180 20 100 10 0,1 0,3 33 0,5 0,1
Моноциты 1111 100 Нет данных Нет данных 125 1429 Нет данных Нет данных
Незрелые DC 2500 100 Нет данных Нет данных 222 2857 Нет данных Нет данных
Зрелые DC 2222 100 Нет данных Нет данных 333 3333 Нет данных Нет данных

Лентивирус

Лентивирусы являются сложными ретровирусами, которые обладают способностью инфицировать как митотические, так и постмитотические клетки и экспрессировать в них свои гены. Наиболее известным лентивирусом является вирус иммунодефицита человека (HIV), который использует гликопротеины оболочки других вирусов для нацеливания на широкий спектр типов клеток.

Лентивирусы можно получить следующим образом. После клонирования pCasES10 (которая содержит остов лентивирусной плазмиды-переносчика) HEK293FT, прошедшие малое количество пассажей (p=5), высевали во флакон T-75 до 50% конфлюэнтности за день до трансфекции в DMEM с 10% фетальной бычьей сывороткой и без антибиотиков. Через 20 часов среду заменяли на среду OptiMEM (бессывороточную) и через 4 часа проводили трансфекцию. Клетки трансфицировали с помощью 10 мкг лентивирусной плазмиды-переносчика (pCasES10) и следующих пакующих плазмид: 5 мкг pMD2.G (псевдотип VSV-g) и 7,5 мкг psPAX2 (gag/pol/rev/tat). Трансфекцию проводили в 4 мл OptiMEM со средством доставки на основе катионного липида (50 мкл Lipofectamine 2000 и 100 мкл реагента Plus). Через 6 часов среду заменяли на DMEM, не содержащую антибиотиков, с 10% фетальной бычьей сыворотки. В данных способах при культивировании клеток использовали сыворотку, но использование бессывороточных способов является предпочтительным.

Лентивирус можно очистить следующим способом. Вируссодержащие супернатанты собирали через 48 часов. Супернатанты сперва очищали от дебриса и фильтровали через фильтр с низкой степенью связывания белка (PVDF) на 0,45 мкм. Затем их центрифугировали на ультрацентрифуге в течение 2 часов при 24000 об/мин. Вируссодержащие супернатанты ресуспендировали в 50 мкл DMEM в течение ночи при 4°C. Затем их разделяли на аликвоты и сразу же замораживали при -80°C.

В другом варианте осуществления также предусмотрены минимальные лентивирусные векторы для отличных от приматов организмов на основе вируса инфекционной анемии лошадей (EIAV), особенно для генной терапии заболеваний глаз (см., например, Balagaan, J Gene Med 2006; 8: 275-285). В другом варианте осуществления также предусмотрен RetinoStat®, лентивирусный вектор на основе вируса инфекционной анемии лошадей для генной терапии, экспрессирующий ангиостатические белки эндостатин и ангиостатин, который доставляют посредством субретинальной инъекции для лечения влажной формы возрастной дегенерации желтого пятна (см., например, Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)), и данный вектор может быть модифицирован для системы CRISPR-Cas по настоящему изобретению.

В другом варианте осуществления самоинактивирующиеся лентивирусные векторы с siRNA, нацеленной на общий экзон, который имеет tat/rev HIV, сигналом ядрышковой локализации TAR-ловушкой и специфичным к CCR5 рибозимом в виде головки молотка (см., например, DiGiusto et al. (2010) Sci Transl Med 2:36ra43) можно использовать и/или адаптировать для системы CRISPR-Cas по настоящему изобретению. Не менее 2,5 × 106 клеток CD34+ на килограмм массы пациента можно собирать и предварительно стимулировать в течение 16-20 часов в среде X-VIVO 15 (Lonza), содержащей 2 мкмоля/L-глутамина, фактор стволовых клеток (100 нг/мл), лиганд Flt-3 (Flt-3L) (100 нг/мл) и тромбопоэтин (10 нг/мл) (CellGenix), при плотности 2 × 106 клеток/мл. Предварительно стимулированные клетки можно трансдуцировать лентивирусом при множественности заражения 5 в течение 16-24 часов во флаконах с культурой тканей на 75 см2, покрытых фибронектином (25 мг/см2) (RetroNectin, Takara Bio Inc.).

Лентивирусные векторы были раскрыты в отношении лечения болезни Паркинсона, см., например, публикацию заявки на патент США № 20120295960 и патенты США №№ 7303910 и 7351585. Лентивирусные векторы также были раскрыты в отношении лечения заболеваний глаз, см., например, публикации заявок на патенты США №№ 20060281180, 20090007284, US20110117189; US20090017543; US20070054961, US20100317109. Лентивирусные векторы также были раскрыты в отношении доставки в головной мозг, см., например, публикации заявок на патенты США №№ US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 и патент США № US7259015.

Доставка РНК

Доставка РНК. Фермент CRISPR, например Cas9, и/или любую из РНК по настоящему изобретению, например направляющую РНК, также можно доставлять в форме РНК. С помощью транскрипции in vitro можно получить мРНК Cas9. Например, мРНК Cas9 можно синтезировать с помощью кассеты для ПЦР, содержащей следующие элементы: промотор T7-последовательность Козак (GCCACC)-Cas9-3’-UTR гена бета-глобина-поли(A)-хвост (цепь из 120 или больше адениновых остатков). Кассету можно использовать для транскрипции полимеразой T7. Направляющие РНК также можно транскрибировать с помощью транскрипции in vitro с кассеты, содержащей промотор T7-GG-последовательность направляющей РНК.

Для повышения экспрессии и снижения возможной токсичности последовательность, кодирующую фермент CRISPR, и/или направляющую РНК можно модифицировать для включения одного или нескольких модифицированных нуклеозидов, например, с использованием псевдо-U или 5-метил-C.

Способы доставки мРНК в настоящее время являются особенно перспективными для доставки в печень.

Многие клинические работы по доставке РНК были сосредоточены на RNAi или антисмысловых РНК, но данные системы можно адаптировать для доставки РНК для осуществления настоящего изобретения. Соответственно, также ниже необходимо ознакомиться с использованной литературой по RNAi и т.д. И действительно, доставка РНК также является применимым способом доставки in vivo. Cas9 и gRNA (и, например, матрицу для HR-репарации) можно доставлять в клетки с использованием липосом или наночастиц. Таким образом, доставка фермента CRISPR, такого как Cas9, и/или доставка РНК по настоящему изобретению может осуществляться в форме РНК и посредством микровезикул, липосом или наночастиц. Например, мРНК Cas9 и gRNA могут быть упакованы в липосомные частицы для доставки in vivo. Реагенты для липосомной трансфекции, такие как Lipofectamine от Life Technologies, и другие реагенты, имеющиеся в продаже, могут эффективно доставлять молекулы РНК в печень.

Доставка РНК посредством частиц

Также предпочтительные средства доставки РНК включают доставку РНК посредством наночастиц (Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010) или экзосом (Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641). И действительно, как было показано, экзосомы являются особенно применимыми в доставке siRNA, системы, в некоторой степени сходной с системой CRISPR. Например, El-Andaloussi S, et al. ("Exosome-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131, электронная публикация от 15 ноября 2012 г.) описывают как экзосомы, являющиеся перспективными инструментами доставки лекарственных средств через различные биологические барьеры, можно приспособить для доставки siRNA in vitro и in vivo. Данный подход заключается в создании целенаправленных экзосом посредством трансфекции вектором экспрессии, содержащим экзосомный белок, слитый с пептидным лигандом. Экзосомы затем очищают от супернатанта с трансфицированными клетками и характеризуют, а затем в экзосомы загружают РНК. Доставку или введение в соответствии с настоящим изобретением можно осуществлять с помощью экзосом, в частности, без ограничения в головной мозг. Витамин E (α-токоферол) можно конъюгировать с CRISPR-Cas и доставлять в головной мозг вместе с липопротеином высокой плотности (HDL), например, аналогично тому, как это было выполнено Uno et al. (HUMAN GENE THERAPY 22:711-719 (June 2011)) для доставки короткой интерферирующей РНК (siRNA) в головной мозг. Мышам проводили инфузию с помощью осмотических мининасосов (модель 1007D; Alzet, Купертино, Калифорния), наполненных фосфатно-солевым буфером (PBS) или свободной Toc-siBACE или Toc-siBACE/HDL, и соединенных с набором 3 для инфузий в головной мозг (Alzet). Канюлю для инфузий в головной мозг размещали приблизительно на 0,5 мм кзади от брегмы на средней линии для инфузии в дорсальную часть третьего желудочка. Uno et al. обнаружили, что всего 3 нмоль Toc-siRNA с HDL в том же способе ICV инфузии могут индуцировать аналогичную степень целенаправленного снижения. Аналогичная доза CRISPR-Cas, конъюгированной с α-токоферолом и вводимой совместно с HDL, целенаправленно воздействующей на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться в количестве от приблизительно 3 нмоль до приблизительно 3 мкмоль CRISPR-Cas, целенаправленно воздействующей на головной мозг. Zou et al. (HUMAN GENE THERAPY 22:465-475 (April 2011)) описывают способ опосредованной лентивирусами доставки коротких шпилечных РНК, нацеливающихся на PKCγ, для сайленсинга in vivo генов в спинном мозге крыс. Zou et al. вводили приблизительно 10 мкл рекомбинантного лентивируса с титром 1 x 109 трансдуцирующих единиц (TU)/мл с помощью интратекального катетера. Аналогичная доза экспрессируемой CRISPR-Cas в лентивирусном векторе, нацеливающемся на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться приблизительно 10-50 мл CRISPR-Cas, нацеливающейся на головной мозг, в лентивирусе с титром 1 x 109 трансдуцирующих единиц (TU)/мл.

Если подразумевают местную доставку в головной мозг, то этого можно достичь разными способами. Например, материал можно доставлять интрастриатально, например, с помощью инъекции. Инъекцию можно осуществлять стереотаксически посредством краниотомии.

Повышение эффективности NHEJ или HR также способствует доставке. Предпочтительно, чтобы эффективность NHEJ повышали посредством совместной экспрессии ферментов для обработки концов, таких как Trex2 (Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). Предпочтительно, чтобы эффективность HR повышалась путем транзиентного ингибирования компонентов аппарата NHEJ, таких как Ku70 и Ku86. Эффективность HR также можно повысить путем совместной экспрессии прокариотических или эукариотических ферментов гомологичной рекомбинации, таких как RecBCD, RecA.

Доставка посредством плазмид

В одном варианте осуществления согласно данному документу доставку осуществляют посредством плазмиды. В таких композициях с плазмидами доза должна представлять собой количество плазмид, достаточное для вызывания эффекта. Например, подходящие количества плазмидной ДНК в композициях с плазмидами могут составлять от приблизительно 0,1 до приблизительно 2 мг или от приблизительно 1 мкг до приблизительно 10 мкг из расчет на индивидуума весом 70 кг. Плазмиды по настоящему изобретению в общем будут содержать (i) промотор; (ii) последовательность, кодирующую фермент CRISPR, функционально связанную с указанным промотором; (iii) селектируемый маркер; (iv) точку начала репликациии и (v) расположенный ниже нее терминатор транскрипции, функционально связанный с (ii). Плазмида может также кодировать компоненты РНК комплекса CRISPR, но наряду с этим один или несколько из них могут кодироваться другим вектором.

Дозы в данном документе определяются в расчете на индивидуума со средним весом 70 кг. Частота введения находится в пределах компетенции практикующего врача или ветеринара (например, доктора, ветеринарного врача) или ученого, являющегося специалистом в данной области. Также отмечено, что вес используемых в эксперименте мышей, как правило, составляет приблизительно 20 г, что при проведении экспериментов с мышами пропорционально индивидууму весом 70 кг.

В некоторых вариантах осуществления молекулы РНК по настоящему изобретению доставляют в липосомных составах или составах на основе Lipofectin и им подобных, и их можно получить с помощью способов, хорошо известных специалистам в данной области. Такие способы описаны, например, в патентах США №№ 5593972, 5589466 и 5580859, включенных в данный документ посредством ссылки. Были разработаны системы доставки, специально предназначенные для повышения эффективности и улучшения доставки siRNA в клетки млекопитающих (см., например, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 и Simeoni et al., NAR 2003, 31, 11: 2717-2724), и их можно применять в настоящем изобретении. Недавно siRNA успешно применили для ингибирования экспрессии генов у приматов (см., например, Tolentino et al., Retina 24(4):660), и их также можно применять в настоящем изобретении.

Общая информация касательно доставки посредством частиц

Кроме того, упоминается заявка согласно PCT PCT/US14/70057, ссылка на номер дела у патентного поверенного 47627.99.2060 и BI-2013/107, под названием "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS" (заявляется приоритет по одной или нескольких или всех из предварительных заявок на патент США: 62/054490, поданной 24 сентября 2014 г.; 62/010441, поданной 10 июня 2014 г.; и 61/915118, 61/915215 и 61/915148, каждая из которых подана 12 декабря 2013 г.) ("the Particle Delivery PCT"), включенная в данный документ посредством ссылки, в отношении способа получения частицы, содержащей sgRNA-и-белок Cas9, включающего смешивание смеси, содержащей sgRNA и белок Cas9 (и необязательно матрицу для HDR), со смесью, содержащей, состоящей, по сути, из или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта; с получением с помощью такого способа частиц. Например, при этом белок Cas9 и sgRNA смешивали вместе при подходящем молярном соотношении, например, 3:1 - 1:3, или 2:1 - 1:2 или 1:1, при подходящей температуре, например, 15-30°C, например, 20-25°C, например, комнатной температуре, в течение подходящего периода времени, например, 15-45, как, например, 30 минут, преимущественно в стерильном буфере без нуклеаз, например, 1X PBS. В отдельности, компоненты частиц, такие как или включающие поверхностно-активное вещество, например, катионный липид, например, 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); фосфолипид, например, димиристоилфосфатидилхолин (DMPC); биоразлагаемый полимер, такой как этиленгликолевый полимер или PEG, и липопротеин, такой как липопротеин низкой плотности, например, холестерин, растворяли в спирте, преимущественно C1-6алкиловом спирте, таком как метанол, этанол, изопропанол, например, 100% этанол. Два раствора смешивали вместе с образованием частиц, содержащих комплексы Cas9-sgRNA. Соответственно, можно обеспечивать предварительное образование комплекса sgRNA с белком Cas9 перед составлением целого комплекса в частице. Составы можно получать с различным молярным соотношением различных компонентов, известных как способствующие доставке нуклеиновых кислот в клетки (например, 1,2-диолеоил-3-триметиламмоний-пропан (DOTAP), 1,2-дитетрадеканоил-sn-глицеро-3-фосфохолин (DMPC), полиэтиленгликоль (PEG) и холестерин). Например, молярные соотношения DOTAP: DMPC: PEG: холестерин могут быть следующими: DOTAP 100, DMPC 0, PEG 0, холестерин 0; или DOTAP 90, DMPC 0, PEG 10, холестерин 0; или DOTAP 90, DMPC 0, PEG 5, холестерин 5. DOTAP 100, DMPC 0, PEG 0, холестерин 0. Данная заявка, соответственно, охватывает смешивание sgRNA, белка Cas9 и компонентов, которые образуют частицу; а также частицы, полученные в результате такого добавления. Аспекты настоящего изобретения могут охватывать частицы; например, частицы с применением способа, аналогичного таковому в "Particle Delivery PCT", например, путем добавления смеси, содержащей sgRNA и/или Cas9, как в настоящем изобретении, и компоненты, которые образуют частицу, например, как в "Particle Delivery PCT", с образованием частицы и частиц в результате такого смешивания (или, конечно же, другие частицы, содержащие sgRNA и/или Cas9, как в настоящем изобретении).

Системы доставки и/или составы на основе частиц

Известно, что несколько типов систем доставки и/или составов на основе частиц являются применимыми в разнообразном спектре биомедицинских применений. Частицу обычно определяют как небольшой объект, ведущий себя как целая единица в том, что касается ее транспорта и свойств. Частицы дополнительно классифицируют в соответствии с диаметром. Крупные частицы охватывают диапазон от 2500 до 10000 нанометров. Тонкодисперсные частицы имеют размер от 100 до 2500 нанометров. Ультрадисперсные частицы или наночастицы, как правило, имеют размер от 1 до 100 нанометров. Основанием для предела в 100 нм является тот факт, что новые свойства, отличающие частицы от насыпного материала, обычно проявляются в критическом линейном масштабе менее 100 нм.

Используемые в данном документе система доставки и/или состав на основе частиц определяют как любые биологическая система доставки/состав, содержащие частицы в соответствии с настоящим изобретением. Частица в соответствии с настоящим изобретением представляет собой любой объект, имеющий наибольший размер (например, диаметр) менее 100 микрон (мкм). В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 10 мкм. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 2000 нанометров (нм). В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 1000 нанометров (нм). В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 900 нм, 800 нм, 700 нм, 600 нм, 500 нм, 400 нм, 300 нм, 200 нм или 100 нм. Частицы по настоящему изобретению, как правило, имеют наибольший размер (например, диаметр) 500 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 250 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 200 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 150 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 100 нм или менее. В некоторых вариантах осуществления настоящего изобретения применяют меньшие частицы, например, имеющие наибольший размер 50 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер, варьирующий в диапазоне от 25 нм до 200 нм.

Определение характеристик частиц (в том числе, например, определение характеристик морфологии, размеров и т.д.) осуществляют с применением ряда различных методик. Стандартными методиками являются электронная микроскопия (TEM, SEM), атомно-силовая микроскопия (AFM), динамическое рассеяние света (DLS), рентгеновская фотоэлектронная спектроскопия (XPS), порошковая рентгеновская дифракция (XRD), инфракрасная спектроскопия с преобразованием Фурье (FTIR), времяпролетная масс-спектрометрия с лазерной десорбцией и ионизацией из матрицы (MALDI-TOF), спектроскопия в ультрафиолетовой и видимой области спектра, двойная поляризационная интерферометрия и ядерный магнитный резонанс (ЯМР). Получение характеристик (измерения размеров) можно проводить в отношении нативных частиц (т.е. до загрузки) или после загрузки молекулы-карго (в данном документе молекула-карго относится, например, к одному или нескольким компонентам системы CRISPR-Cas, например, ферменту или мРНК CRISPR, или направляющей РНК, или к любой их комбинации, и может включать дополнительные носители и/или наполнители) для получения частиц, имеющих оптимальный размер для доставки, для любого применения настоящего изобретения in vitro, ex vivo и/или in vivo. В определенных предпочтительных вариантах осуществления определение характеристик размеров частиц (например, диаметра) основано на измерениях с применением динамического рассеяния лазерного излучения (DLS). Упоминаются патент США № 8709843; патент США № 6007845; патент США № 5855913; патент США № 5985309; патент № 5543158 и публикация James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), опубликованная в интернете 11 мая 2014 года, doi:10.1038/nnano.2014.84, касаются частиц, способов их получения и применения, а также их измерения.

Системы доставки на основе частиц в пределах объема настоящего изобретения могут быть представлены в любой форме, в том числе без ограничения в форме твердых, полутвердых, эмульгированных или коллоидных частиц. Таким образом, любые системы доставки, описанные в данном документе, в том числе без ограничения, например, системы на основе липидов, липосомы, мицеллы, микровезикулы, экзосомы или генная пушка, могут предусматриваться в качестве систем доставки на основе частиц в пределах объема настоящего изобретения.

Частицы

мРНК фермента CRISPR и направляющую РНК могут быть доставлены одновременно с использованием частиц или липидных оболочек; например, фермент CRISPR и РНК по настоящему изобретению, например, в виде комплекса, могут быть доставлены посредством частицы, как в Dahlman et al., WO 2015089419 A2 и документах, цитируемых там, такой как 7C1 (см., например, James E. Dahlman и Carmen Barnes et al. Nature Nanotechnology (2014), опубликованный онлайн 11 мая 2014 г., doi:10.1038/nnano.2014.84), например, частицы для доставки, содержащей липид или липидоид и гидрофильный полимер, например, катионный липид и гидрофильный полимер, например, где катионный липид содержит 1,2-диолеоил-3-триметиламмония-пропан (DOTAP) или 1,2-дитетерадеканоил-sn-глицеро-3-фосфохолин (DMPC), и/или где гидрофильный полимер содержит этиленгликоль или полиэтиленгликоль (PEG); и/или где частица дополнительно содержит холестерин (например, частица из состава 1 = DOTAP 100, DMPC 0, PEG 0, холестерин 0; состава номер 2 = DOTAP 90, DMPC 0, PEG 10, холестерин 0; состава номер 3 = DOTAP 90, DMPC 0, PEG 5, холестерин 5), где частицы образуются с использованием эффективного многостадийного способа, при котором первый эффекторный белок и РНК смешивают вместе, например, при молярном соотношении 1:1, например, при комнатной температуре, например, в течение 30 минут, например, в стерильном не содержащем нуклеазу 1X PBS; и отдельно DOTAP, DMPC, PEG и холестерин, применимые для состава, растворяют в спирте, например, 100% этаноле; и два раствора смешивают вместе с образованием частиц, содержащих комплексы).

Например, у Su X, Fricke J, Kavanagh DG, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. электронная публикация 1 апреля 2011 г.) описаны биоразлагаемые частицы со структурой ядро-оболочка с ядром из сложного поли(β-аминоэфира) (PBAE), окруженным фосфолипидной двухслойной оболочкой. Они были разработаны для доставки мРНК in vivo. Чувствительный к рН компонент PBAE был выбран для содействия разрушению эндосом, тогда как поверхностный липидный слой был выбран для сведения к минимуму токсичности поликатионного ядра. Таким образом, они являются предпочтительными для доставки РНК по настоящему изобретению.

В одном варианте осуществления предусмотрены частицы на основе самособирающихся биоадгезивных полимеров, которые можно применять для пероральной доставки пептидов, внутривенной доставки пептидов и интраназальной доставки пептидов, во всех случаях в головной мозг. Также предусмотрены другие варианты осуществления, такие как абсорбция при пероральном применении и внутриглазная доставка гидрофобных лекарственных средств. Технология молекулярных оболочек предусматривает сконструированную полимерную оболочку, защищающую и доставляющую в очаг заболевания (см., например, Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026; Siew, A., et al. Mol Pharm, 2012. 9(1):14-28; Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36; Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80; Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74; Garrett, N.L., et al. J Biophotonics, 2012. 5(5-6):458-68; Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688; Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33; Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40; Qu, X., et al. Biomacromolecules, 2006. 7(12):3452-9 и Uchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199). Предусмотрены дозы, составляющие приблизительно 5 мг/кг, которые в зависимости от целевой ткани будут однократными или многократными дозами.

В одном варианте осуществления частицы, которые могут доставлять РНК в раковые клетки для прекращения роста опухолей, разработанные в лаборатории Дэна Андерсона в MIT, можно использовать для системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней. В частности, в лаборатории Андерсона были разработаны полностью автоматизированные, комбинаторные системы для синтеза, очистки, определения характеристик и составления новых биоматериалов и наносоставов. См., например, Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6; Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5; Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64; Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7; Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9 и Lee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93.

Заявка на патент США 20110293703 относится к липидоподобным соединениям, также являющимся особенно применимыми при введении полинуклеотидов, которые можно применять для доставки системы CRISPR-Cas по настоящему изобретению. В одном аспекте аминоспиртовые липидоподобные соединения объединяют со средством, подлежащим доставке в клетку или субъекту, с образованием микрочастиц, наночастиц, липосом или мицелл. Средство, подлежащее доставке с помощью частиц, липосом или мицелл, может быть в форме газа, жидкости или твердого вещества, и средство может представлять собой полинуклеотид, белок, пептид или малую молекулу. Аминоспиртовые липидоподобные соединения можно объединять с другими аминоспиртовыми липидоподобными соединениями, полимерами (синтетическими или природными), поверхностно-активными веществами, холестерином, углеводами, белками, липидами и т.д. с образованием частиц. Эти частицы можно затем необязательно объединять с фармацевтическим наполнителем с образованием фармацевтической композиции.

В публикации заявки на патент США № 20110293703 также представлены способы получения аминоспиртовых липидоподобных соединений. Одному или нескольким эквивалентам амина позволяют вступать в реакцию с одним или несколькими эквивалентами соединения с концевыми эпоксидными группами в подходящих условиях с образованием аминоспиртового липидоподобного соединения по настоящему изобретению. В определенных вариантах осуществления все аминогруппы амина полностью реагируют с соединением с концевыми эпоксидными группами с образованием третичных аминов. В других вариантах осуществления все аминогруппы амина не полностью реагируют с соединением с концевыми эпоксидными группами для образования третичных аминогрупп, в результате чего, таким образом, образуются первичные или вторичные аминогруппы аминоспиртового липидоподобного соединения. Эти первичные или вторичные аминогруппы оставляют в существующем состоянии или могут вводить в реакцию с другим электрофилом, таким как другое соединение с концевыми эпоксидными группами. Специалисту в данной области будет понятно, что введение амина в реакцию с меньшим, чем избыточное, количеством соединения с концевыми эпоксидными группами приведет к получению множества различных аминоспиртовых липидоподобных соединений с различным количеством "хвостов". Определенные амины могут быть полностью функционализированными с помощью двух "хвостов" соединений, полученных из эпоксидов, тогда как другие молекулы могут быть не полностью функционализированными с помощью "хвостов" соединений, полученных из эпоксидов. Например, диамин или полиамин может содержать один, два, три или четыре "хвоста" соединений, полученных из эпоксидов, у различных аминофрагментов молекулы, в результате чего образуются первичные, вторичные и третичные аминогруппы. В определенных вариантах осуществления все аминогруппы являются не полностью функционализированными. В определенных вариантах осуществления используют два соединения с концевыми эпоксидными группами одного типа. В других вариантах осуществления используют два или более различных соединений с концевыми эпоксидными группами. Синтез аминоспиртовых липидоподобных соединений осуществляют с помощью растворителя или без него, и синтез можно осуществлять при более высоких температурах, варьирующих в диапазоне 30-100°C, предпочтительно при примерно 50-90°C. Получаемые аминоспиртовые липидоподобные соединения необязательно можно очищать. Например, смесь аминоспиртовых липидоподобных соединений можно очищать с получением аминоспиртового липидоподобного соединения с определенным количеством "хвостов" соединений, полученных из эпоксидов. Или же смесь можно очищать с получением определенного стерео- или региоизомера. Аминоспиртовые липидоподобные соединения можно также алкилировать с помощью алкилгалогенида (например, йодистого метила) или другого алкилирующего средства и/или их можно ацилировать.

В публикации заявки на патент США № 20110293703 также представлены библиотеки аминоспиртовых липидоподобных соединений, полученных согласно способам по настоящему изобретению. Эти аминоспиртовые липидоподобные соединения можно получать и/или подвергать скринингу с применением высокопроизводительных методик, предусматривающих использование дозаторов жидкостей, автоматических манипуляторов, планшетов для микротитрования, компьютеров и т.д. В определенных вариантах осуществления аминоспиртовые липидоподобные соединения подвергают скринингу в отношении их способности к трансфекции полинуклеотидов или других средств (например, белков, пептидов, малых молекул) в клетку.

Публикация заявки на патент США № 20130302401 относится к классу поли(бета-аминоспиртов) (PBAA), получаемых с помощью комбинаторных методик полимеризации. PBAA по настоящему изобретению можно применять в биотехнологии и биомедицинских применениях в качестве покрытий (таких как пленочные покрытия или многослойные пленки для медицинских инструментов или имплантатов), добавок, материалов, наполнителей, средств, предотвращающих биологическое обрастание, средств для формирования микроструктуры и средств для инкапсулирования клеток. В случае применения в качестве поверхностных покрытий эти PBAA вызывают различные уровни воспаления как in vitro, так и in vivo в зависимости от их химических структур. Большое химическое разнообразие этого класса материалов позволяет идентифицировать полимерные покрытия, ингибирующие активацию макрофагов in vitro. Более того, эти покрытия уменьшают рекрутирование воспалительных клеток и уменьшают выраженность фиброза после подкожной имплантации микрочастиц карбоксилированного полистирола. Эти полимеры можно использовать для образования капсул на основе полиэлектролитных комплексов для инкапсулирования клеток. Настоящее изобретение также может иметь много других применений в биологии, таких как получение антимикробных покрытий, доставка ДНК или siRNA и тканевая инженерия с применением стволовых клеток. Идеи, изложенные в публикации заявки на патент США № 20130302401, можно применять по отношению к системе CRISPR-Cas по настоящему изобретению. В некоторых вариантах осуществления могут быть использованы частицы на основе сахара, например GalNAc, как описывается в данном документе и со ссылкой на WO 2014118272 (включенной в данный документ посредством ссылки) и Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961), а также согласно идеям в данном документе, особенно в отношении применений в доставке для всех частиц, если не очевидно иное.

В другом варианте осуществления предусмотрены липидные частицы (LNP). В частности, малые интерферирующие РНК, воздействующие на транстиретин, инкапсулировали в липидные частицы и использовали для доставки у людей (см., например, Coelho et al., N Engl J Med 2013;369:819-29), и такую систему можно приспосабливать и применять в отношении системы CRISPR-Cas по настоящему изобретению. Предусмотрены дозы, составляющие от приблизительно 0,01 до приблизительно 1 мг на кг массы тела, вводимые внутривенно. Предусмотрены лекарственные препараты для снижения риска возникновения инфузионных реакций, такие как дексаметазон, ацетаминофен, дифенгидрамин или цетиризин и ранитидин. Также предусмотрены многократные дозы, состоящие из пяти доз по приблизительно 0,3 мг на килограмм, принимаемых каждые 4 недели.

Было показано, что LNP являются высокоэффективными в доставке siRNA в печень (см., например, Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470) и, таким образом, предусмотрены для доставки в печень РНК, кодирующей CRISPR-Cas. Может быть предусмотрен режим дозирования с приемом приблизительно четырех доз по 6 мг/кг LNP каждые две недели. Tabernero et al. продемонстрировали, что после первых 2 циклов дозирования LNP при 0,7 мг/кг наблюдалась регрессия опухоли, а к концу 6 циклов у пациента достигался частичный ответ с полной регрессией метастазов в лимфатических узлах и значительным уменьшением размеров опухолей в печени. У данного пациента, у которого сохранялась ремиссия и который завершил лечение после получения доз в течение 26 месяцев, полный ответ достигался после приема 40 доз. У двух пациентов с RCC и внепеченочными очагами заболевания, включающими почку, легкое и лимфатические узлы, в которых наблюдалось прогрессирование после предшествующей терапии ингибиторами сигнального пути VEGF, наблюдалась стабилизация заболевания во всех очагах в течение примерно 8-12 месяцев, а пациент с PNET и метастазами в печени продолжал участие в расширенном исследовании в течение 18 месяцев (36 доз) при стабилизации заболевания.

Однако следует принимать во внимание заряд LNP. Так, объединение катионных липидов с отрицательно заряженными липидами индуцирует образование структур, не являющихся двуслойными, которые облегчают внутриклеточную доставку. Поскольку заряженные LNP быстро выводятся из кровотока после внутривенной инъекции, были разработаны ионизируемые катионные липиды со значениями pKa ниже 7 (см., например, Rosin et al., Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011). Отрицательно заряженные полимеры, такие как РНК, можно загружать в LNP при низких значениях pH (например, pH 4), где ионизируемые липиды проявляют положительный заряд. Однако при физиологических значениях pH LNP проявляют низкий поверхностный заряд, совместимый с большими значениями времени пребывания в кровотоке. Основное внимание сосредоточено на четырех видах молекул ионизируемых катионных липидов, а именно 1,2-дилинолеоил-3-диметиламмонийпропане (DLinDAP), 1,2-дилинолеилокси-3-N,N-диметиламинопропане (DLinDMA), 1,2-дилинолеилоксикето-N,N-диметил-3-аминопропане (DLinKDMA) и 1,2-дилинолеил-4-(2-диметиламиноэтил)-[1,3]-диоксолане (DLinKC2-DMA). Было показано, что системы LNP с siRNA, содержащие эти липиды, проявляют существенно отличающиеся свойства сайленсинга генов в гепатоцитах in vivo, при этом их активность изменяется в ряду DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP при использовании модели сайленсинга гена фактора VII (см., например, Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011). Может быть предусмотрена доза 1 мкг/мл LNP или РНК CRISPR-Cas в LNP или ассоциированная с ней, в особенности для состава, содержащего DLinKC2-DMA.

Получение LNP и инкапсулирование CRISPR-Cas можно применять и/или адаптировать согласно Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011. Катионные липиды 1,2-дилинолеоил-3-диметиламмонийпропан (DLinDAP), 1,2-дилинолеилокси-3-N,N-диметиламинопропан (DLinDMA), 1,2-дилинолеилоксикето-N,N-диметил-3-аминопропан (DLinK-DMA), 1,2-дилинолеил-4-(2-диметиламиноэтил)-[1,3]-диоксолан (DLinKC2-DMA), (3-o-[2″-(метоксиполиэтиленгликоль 2000)-сукциноил]-1,2-димиристоил-sn-гликоль (PEG-S-DMG) и R-3-[(ω-метоксиполи(этиленгликоль)2000)-карбамоил]-1,2-димиристилоксипропил-3-амин (PEG-C-DOMG) могут быть предоставлены Tekmira Pharmaceuticals (Ванкувер, Канада) или синтезированы. Холестерин можно приобрести у Sigma (Сент-Луис, Миссури). Конкретную РНК CRISPR-Cas можно инкапсулировать в LNP, содержащую DLinDAP, DLinDMA, DLinK-DMA и DLinKC2-DMA (катионный липид:DSPC:холестерин: PEG-S-DMG или PEG-C-DOMG в молярном соотношении 40:10:40:10). При необходимости можно включать в состав 0,2% SP-DiOC18 (Invitrogen, Берлингтон, Канада) для определения клеточного поглощения, внутриклеточной доставки и биораспределения. Инкапсулирование можно осуществлять путем растворения липидных смесей, содержащих катионный липид:DSPC:холестерин:PEG-C-DOMG (молярное соотношение 40:10:40:10), в этаноле до конечной концентрации липидов 10 ммолей/л. Этот раствор липидов в этаноле можно добавлять по каплям к 50 ммолей/л цитрата, pH 4,0, с образованием многослойных везикул до получения конечной концентрации этанола 30% об./об. Крупные однослойные везикулы могут быть образованы после экструзии многослойных пузырьков через два установленных один над другим поликарбонатных фильтра Nuclepore на 80 нм с помощью экструдера (Northern Lipids, Ванкувер, Канада). Инкапсулирование можно осуществлять путем добавления РНК, растворенной при 2 мг/мл в 50 ммолей/л цитрата, pH 4,0, содержащего 30% этанол об./об., по каплям к экструдированным предварительно сформированным крупным однослойным везикулам и инкубирования при 31°C в течение 30 минут при постоянном перемешивании до конечного весового соотношения РНК/липид 0,06/1 вес./вес. Удаление этанола и нейтрализацию буфера для получения состава проводили путем диализа против фосфатно-солевого буфера (PBS), pH 7,4, в течение 16 часов с помощью диализных мембран Spectra/Por 2 из регенерированной целлюлозы. Распределение частиц по размеру можно определить посредством динамического рассеяния света с использованием измерителя размера частиц NICOMP 370, режимов объема пузырьков/интенсивности рассеянного света и аппроксимации функцией Гаусса (Nicomp Particle Sizing, Санта-Барбара, Калифорния). Размер частиц для всех трех систем LNP может составлять ~70 нм в диаметре. Эффективность инкапсулирования siRNA можно определить путем удаления свободной РНК из образцов, отобранных до или после диализа, с помощью колонок VivaPureD MiniH (Sartorius Stedim Biotech). Инкапсулированную РНК можно экстрагировать из элюированных частиц и подвергнуть количественной оценке при 260 нм. Соотношение РНК и липидов определяли путем измерения содержания холестерина в везикулах с помощью ферментативного анализа Cholesterol E от Wako Chemicals USA (Ричмонд, Виргиния). В связи с обсуждением в данном документе LNP и PEG-липидов, ПЭГилированные липосомы или LNP являются также подходящими для доставки системы CRISPR-Cas или ее компонентов.

Получение крупных LNP можно применять и/или адаптировать согласно Rosin et al., Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011. Раствор предварительно приготовленной смеси липидов (общая концентрация липидов 20,4 мг/мл) можно получать в этаноле, содержащем DLinKC2-DMA, DSPC и холестерин в молярном соотношении 50:10:38,5. К предварительно приготовленной смеси липидов можно добавлять ацетат натрия в молярном соотношении 0,75:1 (ацетат натрия:DLinKC2-DMA). Липиды затем можно гидрировать путем объединения смеси с 1,85 объема цитратного буфера (10 ммоль/л, pH 3,0) при энергичном перемешивании, вызывая самопроизвольное образование липосом в водном буфере, содержащем 35% этанол. Раствор липосом можно инкубировать при 37°C для обеспечения зависимого от времени увеличения размера частиц. Можно отбирать аликвоты в различные моменты времени в ходе инкубирования для изучения изменений размера липосом посредством динамического рассеяния света (Zetasizer Nano ZS, Malvern Instruments, Вустершир, Великобритания). По достижении желаемого размера частиц к смеси липосом можно добавлять водный раствор конъюгатов PEG-липид (исходный раствор = 10 мг/мл PEG-DMG в 35% (об./об.) этаноле) с получением конечной молярной концентрации PEG 3,5% от общего количества липидов. После добавления конъюгатов PEG-липид липосомы должны сохранять свой размер с эффективным подавлением дальнейшего роста. К пустым липосомам затем можно добавлять РНК при соотношении РНК и общих липидов, составляющим примерно 1:10 (вес:вес.), с последующим инкубированием в течение 30 минут при 37°C с образованием нагруженных LNP. Смесь затем можно подвергнуть диализу в течение ночи в PBS и отфильтровать через фильтрующий шприц с диаметром пор 0,45 мкм.

Конструкции сферических нуклеиновых кислот (SNA™) и другие частицы (в частности, частицы золота) также предусмотрены в качестве средства доставки системы CRISPR/Cas к предполагаемым мишеням. Репрезентативные данные показывают, что конструкции сферических нуклеиновых кислот (SNA™) AuraSense лекарственных препаратов на основе частиц золота, функционализированных нуклеиновыми кислотами, также являются применимыми.

Литературные источники, которые можно использовать совместно с изложенными в данном документе идеями, включают: Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257, Hao et al., Small. 2011 7:3158-3162, Zhang et al., ACS Nano. 2011 5:6962-6970, Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391, Young et al., Nano Lett. 2012 12:3867-71, Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80, Mirkin, Nanomedicine 2012 7:635-638 Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691, Weintraub, Nature 2013 495:S14-S16, Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630, Jensen et al., Sci. Transl. Med. 5, 209ra152 (2013) и Mirkin, et al., Small, 10:186-192.

Самособирающиеся частицы с РНК можно конструировать с полиэтиленимином (PEI), который пэгилирован с пептидным лигандом Arg-Gly-Asp (RGD), прикрепленным к дистальному концу цепи полиэтиленгликоля (PEG). Данную систему использовали, например, в качестве средства для целенаправленного воздействия на сосудистую сеть опухолей, экспрессирующую интегрины, и для доставки siRNA, подавляющей экспрессию рецептора 2 сосудистого эндотелиального фактора роста (VEGF R2), добиваясь тем самым подавления опухолевого ангиогенеза (см., например, Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19). Наноплексы можно получать путем смешивания равных объемов водных растворов катионного полимера и нуклеиновой кислоты с получением чистого молярного избытка ионизируемого азота (полимера) относительно фосфата (нуклеиновой кислоты) в диапазоне от 2 до 6. Электростатические взаимодействия между катионными полимерами и нуклеиновой кислотой приводят в результате к образованию полиплексов, характеризующихся распределением частиц по размеру со средним размером, составляющим приблизительно 100 нм, в связи с чем их называют наноплексами. Для доставки в самособирающихся частицах согласно Schiffelers et al. предполагается доза, составляющая приблизительно от 100 до 200 мг CRISPR-Cas.

Наноплексы согласно Bartlett et al. (PNAS, September 25, 2007,vol. 104, no. 39) также можно применять в настоящем изобретении. Наноплексы согласно Bartlett et al. получают путем смешивания равных объемов водных растворов катионного полимера и нуклеиновой кислоты с получением чистого молярного избытка ионизируемого азота (полимера) относительно фосфата (нуклеиновой кислоты) в диапазоне от 2 до 6. Электростатические взаимодействия между катионными полимерами и нуклеиновой кислотой приводят в результате к образованию полиплексов, характеризующихся распределением частиц по размеру со средним размером, составляющим приблизительно 100 нм, в связи с чем их называют наноплексами. Конъюгаты DOTA-siRNA согласно Bartlett et al. синтезировали следующим образом. Сложный моно(N-гидроксисукцинимидный эфир) 1,4,7,10-тетраазациклододекан-1,4,7,10-тетрауксусной кислоты (сложный эфир DOTA-NHS) заказывали у Macrocyclics (Даллас, Техас). В микроцентрифужную пробирку добавляли аминомодифицированную смысловую нить РНК со 100-кратным молярным избытком сложного эфира DOTA-NHS в карбонатном буфере (pH 9). Содержимое вводили в реакцию путем перемешивания в течение 4 ч. при комнатной температуре. Конъюгат DOTA-смысловая нить РНК осаждали этанолом, ресуспендировали в воде и отжигали с немодифицированной антисмысловой нитью с получением конъюгата DOTA-siRNA. Все жидкости предварительно обрабатывали с помощью Chelex-100 (Bio-Rad, Геркулес, Калифорния) для удаления следовых количеств металлических примесей. Частицы с siRNA, нацеливающиеся на Tf и ненацеливающиеся, могут быть образованы с использованием поликатионов, содержащих циклодекстрин. Как правило, частицы получают в воде при соотношении зарядов 3 (+/-) и концентрации siRNA 0,5 г/литр. Один процент молекул конъюгатов адамантан-PEG на поверхности нацеленных частиц модифицировали с помощью Tf (адамантан-PEG-Tf). Частицы суспендировали в 5% (вес./об.) растворе глюкозы в качестве носителя для инъекции.

Davis et al. (Nature, Vol 464, 15 April 2010) проводили клиническое испытание с РНК, в котором использовали систему доставки на основе нацеленных частиц (регистрационный номер клинического испытания NCT00689065). Пациентам с солидными формами рака, трудно поддающимися стандартным методикам лечения, вводили дозы нацеленных частиц в дни 1, 3, 8 и 10 21-дневного цикла посредством 30-минутной внутривенной инфузии. Частицы состоят из синтетической системы доставки, содержащей: (1) линейный полимер на основе циклодекстрина (CDP), (2) лиганд, нацеливающийся на белок трансферрин человека (TF), представленный на внешней поверхности частиц, который входит в контакт с рецепторами TF (TFR) на поверхности раковых клеток, (3) гидрофильный полимер (полиэтиленгликоль (PEG), используемый для обеспечения стабильности частиц в биологических жидкостях), и (4) siRNA, предназначенную для снижения экспрессии RRM2 (последовательность, применяемая в клинической практике, ранее была обозначена как siR2B+5). Давно известно, что в злокачественных клетках повышена экспрессия TFR, а RRM2 является общепризнанной мишенью для противораковой терапии. Было показано, что эти частицы (клинический вариант обозначен как CALAA-01) хорошо переносятся в исследованиях с использованием многократных доз у отличных от человека приматов. Даже при том, что отдельному пациенту с хроническим миелоидным лейкозом вводили siRNA посредством доставки с помощью липосом, клиническое испытание Davis et al. является первым испытанием с участием человека, в котором проводят системную доставку siRNA с помощью системы целенаправленной доставки и лечат пациентов с солидным раком. Для того, чтобы выяснить, может ли система целенаправленной доставки обеспечивать эффективную доставку функциональных siRNA в опухоли человека, Davis et al. исследовали биоптаты от трех пациентов из трех различных групп дозирования; пациентов A, B и C, все из которых имели метастазирующую меланому и получали дозы CALAA-01 с 18, 24 и 30 мг м-2 siRNA соответственно. Аналогичные дозы также могут быть предусмотрены для системы CRISPR-Cas по настоящему изобретению. Доставку по настоящему изобретению можно осуществлять с помощью частиц, содержащих линейный полимер на основе циклодекстрина (CDP), лиганд, нацеливающийся на белок трансферрин человека (TF), представленный на внешней поверхности частиц, который входит в контакт с рецепторами TF (TFR) на поверхности раковых клеток, и/или гидрофильный полимер (например, полиэтиленгликоль (PEG), применяемый для обеспечения стабильности частиц в биологических жидкостях).

В контексте настоящего изобретения предпочтительно, чтобы один или несколько компонентов комплекса CRISPR, например, фермент CRISPR, или мРНК, или направляющая РНК, были доставлены с помощью частиц или липидных оболочек. Вместе с аспектами частиц по настоящему изобретению можно применять другие системы доставки или векторы.

В целом, "наночастица" относится к любой частице, имеющей диаметр менее 1000 нм. В определенных предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер (например, диаметр) 500 нм или менее. В других предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер, варьирующий в диапазоне от 25 нм до 200 нм. В других предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер 100 нм или менее. В других предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер, варьирующий в диапазоне от 35 нм до 60 нм.

Частицы, охватываемые настоящим изобретением, могут быть представлены в различных формах, например, в виде твердых частиц (например, металла, такого как серебро, золото, железо, титан, неметалла, липидных твердых веществ, полимеров), суспензий частиц или их комбинаций. Могут быть получены частицы металла, диэлектрика и полупроводника, а также гибридные структуры (например, частицы типа ядро/оболочка). Частицы, изготовленные из полупроводникового материала, также могут являться меченными квантовыми точками, если они достаточно малы (как правило, менее 10 нм), чтобы происходило квантование уровней энергии электронов. Такие наноразмерные частицы используются в биомедицинских применениях в качестве носителей лекарственных средств или визуализирующих средств и могут быть приспособлены для аналогичных целей в настоящем изобретении.

Были получены полутвердые и мягкие частицы, и они находятся в пределах объема настоящего изобретения. Частицей-прототипом полутвердой природы является липосома. Различные типы частиц-липосом в настоящее время применяют в клинической практике в качестве систем доставки противораковых лекарственных средств и вакцин. Частицы, одна полусфера которых является гидрофильной, а другая полусфера - гидрофобной, называются частицами Януса и являются особенно эффективными в стабилизации эмульсий. Они способны к самосборке на поверхностях раздела вода/масло и действовать в качестве твердых поверхностно-активных веществ.

В патенте США № 8709843, включенном в данный документ посредством ссылки, представлена система доставки лекарственных средств для целенаправленной доставки частиц, содержащих терапевтическое средство, в ткани, клетки и внутриклеточные компартменты. Настоящее изобретение предусматривает нацеленные частицы, содержащие полимер, конъюгированный с поверхностно-активным веществом, гидрофильным полимером или липидом. В патенте США № 6007845, включенном в данный документ посредством ссылки, предусмотрены частицы, имеющие ядро из мультиблочного сополимера, образованного путем ковалентного связывания соединения с несколькими функциональными группами с одним или несколькими гидрофобными полимерами и одним или несколькими гидрофильными полимерами, и содержащие биологически активный материал. В патенте США № 5855913, включенном в данный документ посредством ссылки, представлена композиция в форме частиц, содержащая аэродинамически легкие частицы, имеющие плотность после утряски менее 0,4 г/см3 и средний диаметр от 5 мкм до 30 мкм, содержащие поверхностно-активное вещество на их поверхности, для доставки лекарственных средств в легочную систему. В патенте США № 5985309, включенном в данный документ посредством ссылки, предусмотрены частицы, содержащие поверхностно-активное вещество и/или гидрофильный или гидрофобный комплекс положительно или отрицательно заряженного терапевтического или диагностического средства и заряженной молекулы, имеющей противоположный заряд, для доставки в легочную систему. В патенте США № 5543158, включенном в данный документ посредством ссылки, предусмотрены биоразлагаемые инъекционные частицы, имеющие биоразлагаемую твердую сердцевину, содержащую биологически активный материал, и поли(алкиленгликолевые) фрагменты на поверхности. В WO2012135025 (также опубликованном как US20120251560), включенном в данный документ посредством ссылки, описаны конъюгированные полимеры на основе полиэтиленимина (PEI) и конъюгированные азамакроциклы (совместно именуемые "конъюгированным липополимером" или "липополимерами"). В определенных вариантах осуществления может быть предусмотрено, что такие конъюгированные липополимеры можно применять в случае с системой CRISPR-Cas для осуществления внесения изменений в геном in vitro, ex vivo и in vivo с модификацией экспрессии гена, включающей модулирование экспрессии белка.

В одном варианте осуществления частица может представлять собой гибрид липида, модифицированного эпоксидными группами, и полимера, преимущественно 7C1 (см., например, James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), опубликовано онлайн 11 мая 2014 г., doi:10.1038/nnano.2014.84). C71 синтезировали путем введения липидов C15 с концевыми эпоксидными группами в реакцию с PEI600 в молярном соотношении 14:1 и составляли с C14PEG2000 с получением частиц (диаметром от 35 до 60 нм), которые были стабильными в растворе PBS в течение по меньшей мере 40 дней.

Гибрид липида, модифицированного эпоксидными группами, и полимера можно использовать для доставки системы CRISPR-Cas по настоящему изобретению в клетки легких, сердечно-сосудистой системы или почек, однако, специалист в данной области может приспособить систему для доставки в другие целевые органы. Предусмотрена доза, варьирующая в диапазоне от приблизительно 0,05 до приблизительно 0,6 мг/кг. Также предусмотрен прием доз в течение нескольких дней или недель, при этом общая доза составляет приблизительно 2 мг/кг.

Экзосомы

Экзосомы являются эндогенными нановезикулами, переносящими РНК и белки, и которые могут доставлять РНК в головной мозг и другие целевые органы. Для снижения иммуногенности Alvarez-Erviti et al. (2011, Nat Biotechnol 29: 341) использовали аутогенные дендритные клетки для получения экзосом. Нацеливания на головной мозг достигали путем конструирования дендритных клеток, экспрессирующих Lamp2b, мембранный белок экзосом, слитый с нейрон-специфическим пептидом RVG. Очищенные экзосомы нагружали экзогенной РНК путем электропорации. Меченные RVG нацеленные экзосомы, инъецируемые внутривенно, осуществляли специфическую доставку siRNA для GAPDH в нейроны, микроглию, олигодендроциты в головном мозге, обуславливая нокдаун конкретного гена. Предварительное воздействие меченных RVG экзосом не ослабляло выраженность нокдауна, и неспецифическое поглощение в других тканях не наблюдалось. Терапевтические возможности опосредованной экзосомами доставки siRNA были продемонстрированы сильно выраженным нокдауном мРНК (60%) и белка (62%) BACE1, терапевтической мишени при болезни Альцгеймера.

Для получения пула иммунологически инертных экзосом Alvarez-Erviti et al. отбирали костный мозг у инбредных мышей C57BL/6 с гомогенным гаплотипом главного комплекса гистосовместимости (MHC). Поскольку незрелые дендритные клетки вырабатывают большие количества экзосом, лишенных активаторов T-клеток, таких как MHC-II и CD86, Alvarez-Erviti et al. проводили отбор дендритных клеток с помощью гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF) в течение 7 дней. Экзосомы очищали от культуральной надосадочной жидкости на следующий день с применением общепринятых протоколов ультрацентрифугирования. Вырабатываемые экзосомы были физически однородными и характеризовались распределением по размеру с пиком при 80 нм в диаметре, как определяли с помощью анализа отслеживания частиц (NTA) и электронной микроскопии. Alvarez-Erviti et al. получали 6-12 мкг экзосом (измерено по концентрации белка) на 106 клеток.

Затем Alvarez-Erviti et al. исследовали возможность загрузки модифицированных экзосом экзогенными молекулами-карго с применением протоколов электропорации, приспособленных для применений на наноразмерном уровне. Поскольку электропорация для мембранных частиц в нанометрическом масштабе изучена недостаточно хорошо, для эмпирической оптимизации протокола электропорации использовали неспецифичную меченную Cy5 РНК. Количество инкапсулированной РНК анализировали после ультрацентрифугирования и лизиса экзосом. Электропорация при 400 В и 125 мкФ приводила к наибольшему удержанию РНК и применялась для всех последующих экспериментов.

Alvarez-Erviti et al. вводили по 150 мкг каждой siRNA для BACE1, инкапсулированной в 150 мкг меченных RVG экзосом, нормальным мышам C57BL/6 и сравнивали эффективность нокдауна с таковой в четырех контрольных группах: необработанные мыши, мыши, которым инъецировали только меченные RVG экзосомы, мыши, которым инъецировали siRNA для BACE1, образующую комплекс с реагентом на основе катионных липосом для доставки in vivo, и мыши, которым инъецировали siRNA для BACE1, образующую комплекс с RVG-9R, пептидом RVG, конъюгированным с 9 остатками D-аргинина, который электростатически связывается с siRNA. Образцы кортикальной ткани анализировали через 3 дня после введения, и как у обработанных siRNA-RVG-9R, так и у обработанных меченными RVG экзосомами с siRNA мышей наблюдали значительный нокдаун белка (45%, P < 0,05 и 62%, P < 0,01), обусловленный значительным снижением уровней мРНК BACE1 (66% [+ или -] 15%, P < 0,001 и 61% [+ или -] 13%, P < 0,01 соответственно). Более того, заявители продемонстрировали значительное снижение (55%, P < 0,05) общих уровней [бета]-амилоидного пептида 1-42, основного компонента амилоидных бляшек в патологическом процессе при болезни Альцгеймера у животных, обработанных меченными RVG экзосомами. Наблюдавшееся снижение было большим, чем снижение уровней β-амилоидного пептида 1-40, демонстрируемое у нормальных мышей после внутрижелудочковой инъекции ингибиторов BACE1. Alvarez-Erviti et al. проводили быструю амплификацию 5'-концов кДНК (RACE) в отношении продукта расщепления BACE1, что свидетельствовало об опосредованном RNAi нокдауне с помощью siRNA.

Наконец, Alvarez-Erviti et al. исследовали, индуцируют ли меченные RVG экзосомы с РНК иммунные ответы in vivo, путем определения концентраций IL-6, IP-10, TNFα и IFN-α в сыворотке крови. После обработки экзосомами для всех цитокинов регистрировали незначительные изменения подобно обработке реагентом для трансфекции с siRNA и в отличие от siRNA-RVG-9R, который активно стимулировал секрецию IL-6, что подтверждало иммунологическую инертность как особенность обработки экзосомами. С учетом того, что экзосомы инкапсулируют только 20% siRNA, доставка с помощью меченных RVG экзосом, по-видимому, является более эффективной, чем доставка с помощью RVG-9R, поскольку с использованием в пять раз меньшего количества siRNA без соответствующего уровня стимуляции иммунного ответа достигали сопоставимого нокдауна мРНК и большего нокдауна белка. Данный эксперимент продемонстрировал терапевтические возможности технологии меченных RVG экзосом, которая потенциально подходит для долговременного сайленсинга генов, связанных с нейродегенеративными заболеваниями. Систему доставки на основе экзосом по Alvarez-Erviti et al. можно использовать для доставки системы CRISPR-Cas по настоящему изобретению к терапевтическим мишеням, особенно при нейродегенеративных заболеваниях. В настоящем изобретении может быть предусмотрена доза, составляющая приблизительно 100-1000 мг CRISPR-Cas, инкапсулированных в приблизительно 100-1000 мг меченных RVG экзосом.

El-Andaloussi et al. (Nature Protocols 7, 2112-2126(2012)) раскрывают, как экзосомы, полученные из культивируемых клеток, можно приспособить для доставки РНК in vitro и in vivo. В данном протоколе впервые описано создание нацеленных экзосом посредством трансфекции вектором экспрессии, содержащим экзосомный белок, слитый с пептидным лигандом. Затем El-Andaloussi et al. объясняют, как очищать и характеризовать экзосомы из надосадочной жидкости с трансфицированными клетками. Затем El-Andaloussi et al. подробно описывают важнейшие стадии загрузки РНК в экзосомы. Наконец, El-Andaloussi et al. излагают в общих чертах, как использовать экзосомы для эффективной доставки РНК in vitro и in vivo в головной мозг мышей. Также приведены примеры предполагаемых результатов, в которых опосредованная экзосомами доставка РНК оценивается посредством функциональных анализов и визуализации. Выполнение полного протокола занимает ~3 недели. Доставку или введение согласно настоящему изобретению можно осуществлять с помощью экзосом, полученных из аутогенных дендритных клеток. Среди приведенных в данном документе идей, эту можно использовать в практическом применении настоящего изобретения.

В другом варианте осуществления предполагаются экзосомы плазмы крови согласно Wahlgren et al. (Nucleic Acids Research, 2012, Vol. 40, No. 17 e130). Экзосомы представляют собой наноразмерные везикулы (размером 30-90 нм), вырабатываемые многими типами клеток, в том числе дендритными клетками (DC), B-клетками, T-клетками, тучными клетками, эпителиальными клетками и опухолевыми клетками. Данные везикулы образуются путем внутреннего почкования поздних эндосом, а затем высвобождаются во внеклеточную среду при слиянии с плазматической мембраной. Поскольку в естественных условиях экзосомы переносят РНК между клетками, данное свойство может быть полезным в генной терапии, и согласно данному раскрытию может быть использовано в практическом раскрытии настоящего изобретения.

Экзосомы из плазмы крови могут быть получены путем центрифугирования лейкоцитарной пленки при 900g в течение 20 мин. для отделения плазмы крови с последующим сбором надосадочных жидкостей культуры клеток, центрифугированием при 300g в течение 10 мин. для удаления клеток и при 16500g в течение 30 мин. с последующей фильтрацией через фильтр с диаметром пор 0,22 мм. Экзосомы осаждают путем ультрацентрифугирования при 120000 g в течение 70 мин. Введение siRNA в экзосомы посредством химической трансфекции проводят согласно инструкциям производителя в наборе RNAi Human/Mouse Starter Kit (Quiagen, Хильден, Германия). К 100 мл PBS добавляют siRNA при конечной концентрации 2 ммоля/мл. После добавления реагента для трансфекции HiPerFect смесь инкубируют в течение 10 мин при КТ. С целью удаления избытка мицелл экзосомы повторно выделяют с помощью латексных частиц с альдегидными/сульфатными группами. Введение CRISPR-Cas в экзосомы посредством химической трансфекции можно проводить аналогично введению siRNA. Экзосомы можно совместно культивировать с моноцитами и лимфоцитами, выделенными из периферической крови здоровых доноров. Таким образом, может быть предусмотрено, чтобы экзосомы, содержащие CRISPR-Cas, можно было вводить в моноциты и лимфоциты и подвергать аутологическому обратному введению в организм человека. Соответственно, доставку или введение согласно настоящему изобретению можно осуществлять с помощью плазменных экзосом.

Липосомы

Доставку или введение согласно настоящему изобретению можно осуществлять с помощью липосом. Липосомы являются сферическими везикулярными структурами, содержащими одно- или многослойный липидный бислой, окружающий внутренние водные компартменты, и относительно непроницаемый внешний липофильный фосфолипидный бислой. Липосомы получили значительное внимание в качестве носителей для доставки лекарственных средств, поскольку они являются биологически совместимыми, нетоксичными, могут доставлять как гидрофильные, так и липофильные молекулы лекарственных средств, защищают свою молекулу-карго от разрушения плазматическими ферментами и переносят свой "груз" через биологические мембраны и гематоэнцефалический барьер (BBB) (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).

Липосомы можно получать из нескольких различных типов липидов; однако для создания липосом в качестве носителей лекарственных средств чаще всего применяют фосфолипиды. Хотя образование липосом является самопроизвольным при смешивании липидной пленки с водным раствором, его также можно ускорить путем приложения силы в виде встряхивания посредством применения гомогенизатора, ультразвукового диспергатора или экструзионного аппарата (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).

К липосомам можно добавлять некоторые другие добавки с целью модификации их структуры и свойств. Например, холестерин либо сфингомиелин можно добавлять к смеси липосом в целях содействия стабилизации структуры липосом и предотвращения утечки внутренних молекул-карго липосом. Кроме того, липосомы получают из гидрогенизированного яичного фосфатидилхолина или яичного фосфатидилхолина, холестерина и диацетилфосфата, и их средние размеры пузырьков доводят до приблизительно 50 и 100 нм (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).

Липосомный состав может содержать главным образом природные фосфолипиды и липиды, такие как 1,2-дистеароил-sn-глицеро-3-фосфатидилхолин (DSPC), сфингомиелин, формы яичного фосфатидилхолина и моносиалоганглиозид. Поскольку данный состав состоит только из фосфолипидов, липосомные составы сталкиваются со многими проблемами, одной из которых является нестабильность в плазме. Было предпринято несколько попыток преодоления данных проблем, в частности, посредством манипуляции с липидной мембраной. Одна из этих попыток направлена на манипуляцию с холестерином. Добавление холестерина к традиционным составам уменьшает быстрое высвобождение инкапсулированного биологически активного соединения в плазму крови или 1,2-диолеоил-sn-глицеро-3-фосфоэтаноламин (DOPE) повышает стабильность (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).

В особенно преимущественном варианте осуществления желательными являются липосомы "троянские кони" (также известные как "молекулярные троянские кони"), и протоколы можно найти на http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long. Эти частицы обеспечивают доставку трансгена в головной мозг в целом после внутрисосудистой инъекции. Без ограничений полагают, что нейтральные липидные частицы со специфичными антителами, конъюгированными с поверхностью, обеспечивают проникновение через гематоэнцефалический барьер посредством эндоцитоза. Заявитель теоретически допускает использование липосом "троянских коней" для доставки нуклеаз семейства CRISPR в головной мозг посредством внутрисосудистой инъекции, что будет обеспечивать получение животных с трансгенами во всем головном мозге без необходимости в манипуляции с эмбрионами. Для введения in vivo в липосомы может быть предусмотрено приблизительно 1-5 г ДНК или РНК.

В другом варианте осуществления систему CRISPR-Cas можно вводить в липосомы, такие как стабильная частица из нуклеиновой кислоты и липидов (SNALP) (см., например, Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005). Предусматриваются ежедневные внутривенные инъекции приблизительно 1, 3 или 5 мг/кг/день специфичной целенаправленно воздействующей CRISPR-Cas в SNALP. Обработку можно осуществлять ежедневно в течение приблизительно трех дней, а затем еженедельно в течение приблизительно пяти недель. В другом варианте осуществления также предусмотрена специфичная CRISPR-Cas, инкапсулированная в SNALP, вводимая посредством внутривенной инъекции в дозах, составляющих приблизительно 1 или 2,5 мг/кг (см., например, Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006). Состав на основе SNALP может содержать липиды 3-N-[(ω-метоксиполи(этиленгликоль)2000)-карбамоил]-1,2-димиристилоксипропиламин (PEG-C-DMA), 1,2-дилинолеилокси-N,N-диметил-3-аминопропан (DLinDMA), 1,2-дистеароил-sn-глицеро-3-фосфохолин (DSPC) и холестерин в молярном процентном соотношении 2:40:10:48 (см., например, Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006).

В другом варианте осуществления было подтверждено, что стабильные частицы из нуклеиновой кислоты и липидов (SNALP) являются эффективными молекулами для доставки в высоковаскуляризированные опухоли печени, происходящие из HepG2, но не в слабо васкуляризированные опухоли печени, происходящие из HCT-116 (см., например, Li, Gene Therapy (2012) 19, 775-780). SNALP-липосомы можно получать путем составления D-Lin-DMA и PEG-C-DMA с дистеароилфосфатидилхолином (DSPC), холестерином и siRNA с использованием соотношения липид/siRNA 25:1 и молярного соотношения холестерин/D-Lin-DMA/DSPC/PEG-C-DMA 48/40/10/2. Полученные в результате SNALP-липосомы имеют размер приблизительно 80-100 нм.

В еще одном варианте осуществления SNALP может содержать синтетический холестерин (Sigma-Aldrich, Сент-Луис, Миссури, США), дипальмитоилфосфатидилхолин (Avanti Polar Lipids, Алабастер, Алабама, США), 3-N-[(ω-метоксиполи(этиленгликоль)2000)карбамоил]-1,2-димиристилоксипропиламин и катионный 1,2-дилинолеилокси-3-N,N-диметиламинопропан (см., например, Geisbert et al., Lancet 2010; 375: 1896-905). Может предусматриваться режим дозирования с приемом приблизительно 2 мг/кг общего количества CRISPR-Cas на дозу, вводимую, например, в виде болюсной внутривенной инфузии.

В еще одном варианте осуществления SNALP может содержать синтетический холестерин (Sigma-Aldrich), 1,2-дистеароил-sn-глицеро-3-фосфохолин (DSPC; Avanti Polar Lipids Inc.), PEG-C-DMA и 1,2-дилинолеилокси-3-(N,N-диметил)аминопропан (DLinDMA) (см., например, Judge, J. Clin. Invest. 119:661-673 (2009)). Составы, используемые для исследований in vivo, могут содержать липиды и РНК в конечном массовом соотношении, составляющем приблизительно 9:1.

Профиль безопасности нанопрепаратов для RNAi был рассмотрен Barros and Gollob из Alnylam Pharmaceuticals (см., например, Advanced Drug Delivery Reviews 64 (2012) 1730-1737). Стабильная частица из нуклеиновой кислоты и липидов (SNALP) содержит четыре различных липида - ионизируемый липид (DLinDMA), который является катионным при низком pH, нейтральный липид-помощник, холестерин и диффундирующий конъюгат полиэтиленгликоль (PEG)-липид. Частица имеет диаметр примерно 80 нм и является электронейтральной при физиологическом значении pH. Во время составления ионизируемый липид служит для конденсации липида с анионной РНК в ходе образования частиц. Будучи положительно заряженным в условиях возрастающей кислотности в эндосомах, ионизируемый липид также опосредует слияние SNALP с мембраной эндосомы, обеспечивая высвобождение РНК в цитоплазму. Конъюгат PEG-липид стабилизирует частицу и уменьшает агрегацию во время составления, а также впоследствии обеспечивает нейтральную гидрофильную наружную поверхность, улучшающую фармакокинетические свойства.

К настоящему времени была начата реализация двух программ клинических исследований с применением составов на основе SNALP с РНК. В Tekmira Pharmaceuticals недавно завершили фазу I однодозового исследования SNALP-ApoB с участием взрослых добровольцев с повышенным уровнем холестерина LDL. ApoB преимущественно экспрессируется в печени и тонкой кишке и является ключевым для сборки и секреции VLDL и LDL. Семнадцать субъектов получали однократную дозу SNALP-ApoB (повышение дозы, охватывающее 7 уровней дозирования). Не наблюдалось свидетельств гепатотоксичности (предполагаемой в качестве возможной дозолимитирующей токсичности на основании доклинических исследований). Один (или два) субъекта при наиболее высокой дозе испытывали симптомы гриппоподобных заболеваний, указывающие на стимуляцию иммунной системы, и было принято решение завершить испытание.

В Alnylam Pharmaceuticals аналогичным образом успешно провели исследование ALN-TTR01, в котором используется технология SNALP, описанная выше, и целенаправленное воздействие на выработку гепатоцитами TTR, как мутантного, так и дикого типа, для лечения опосредованного TTR амилоидоза (ATTR). Были описаны три синдрома при ATTR: семейная амилоидическая полинейропатия (FAP) и семейная амилоидическая кардиомиопатия (FAC) — оба из которых обусловлены аутосомно-доминантными мутациями в TTR; и старческий системный амилоидоз (SSA), обусловленный отложением TTR дикого типа. Недавно завершили I фазу плацебо-контролируемого испытания с повышением однократной дозы ALN-TTR01 с участием пациентов с ATTR. Введение ALN-TTR01 осуществляли в виде 15-минутной IV инфузии 31 пациенту (исследуемое лекарственное средство для 23 и плацебо для 8) в диапазоне доз 0,01-1,0 мг/кг (из расчета по siRNA). Лечение хорошо переносилось без значительного повышения показателей печеночных проб. Инфузионные реакции отмечались у 3 из 23 пациентов при ≥0,4 мг/кг; все они реагировали на замедление скорости инфузии и все они продолжали исследование. Минимальные и временные повышения уровней цитокинов IL-6, IP-10 и IL-1ra в сыворотке отмечались у двух пациентов при наиболее высокой дозе 1 мг/кг (как предполагалось на основании доклинических исследований и исследований с участием NHP). Снижение уровня TTR в сыворотке, ожидаемый фармакодинамический эффект ALN-TTR01, наблюдалось при 1 мг/кг.

В еще одном варианте осуществления SNALP можно получить путем солюбилизации катионного липида, DSPC, холестерина и конъюгата PEG-липид, например, в этаноле, например, при молярном соотношении 40:10:40:10 соответственно (см. Semple et al., Nature Biotechnology, Volume 28 Number 2 February 2010, pp. 172-177). Смесь липидов добавляли к водному буферу (50 мМ цитрат, pH 4) с перемешиванием до конечной концентрации этанола и липидов 30% (об./об.) и 6,1 мг/мл соответственно, и ей позволяли уравновешиваться при 22°C в течение 2 мин. перед экструзией. Гидрированные липиды экструдировали через два установленных один над другим фильтра с размером пор 80 нм (Nuclepore) при 22°C с помощью экструдера Lipex (Northern Lipids) до достижения диаметра пузырьков 70-90 нм, определяемого посредством анализа по методу динамического рассеяния света. Для этого обычно требовалось 1-3 прохождения. Добавляли siRNA (солюбилизированную в водном растворе, содержащем 30% этанол, с 50 мМ цитратом, pH 4) к предварительно уравновешенным (35°C) везикулам со скоростью ~5 мл/мин. при перемешивании. После достижения конечного целевого соотношения siRNA/липиды 0,06 (вес./вес.) смесь инкубировали в течение дополнительных 30 мин. при 35°C для обеспечения реорганизации пузырьков и инкапсулирования siRNA. Этанол затем удаляли, а внешний буфер заменяли на PBS (155 мМ NaCl, 3 мМ Na2HPO4, 1 мМ KH2PO4, pH 7,5) путем диализа либо тангенциальной поточной диафильтрации. В SNALP инкапсулировали siRNA посредством регулируемого способа по методу ступенчатого разбавления. Липидные составляющие KC2-SNALP представляли собой DLin-KC2-DMA (катионный липид), дипальмитоилфосфатидилхолин (DPPC; Avanti Polar Lipids), синтетический холестерин (Sigma) и PEG-C-DMA, используемые в молярном соотношении 57,1:7,1:34,3:1,4. После образования нагруженных частиц SNALP подвергали диализу против PBS и стерилизации путем фильтрации через фильтр с диаметром пор 0,2 мкм перед применением. Средние значения размера частиц составляли 75-85 нм, и 90-95% siRNA были инкапсулированы в липидных частицах. Конечное соотношение siRNA/липиды в составах, используемых для in vivo тестирования, составляло ~0,15 (вес./вес.). Системы LNP-siRNA, содержащие siRNA для фактора VII, разбавляли до соответствующих концентраций в стерильном PBS непосредственно перед применением, и составы вводили внутривенно через латеральную хвостовую вену в общем объеме 10 мл/кг. Данный способ и данные системы доставки можно экстраполировать на систему CRISPR-Cas по настоящему изобретению.

Другие липиды

Другие катионные липиды, такие как аминолипид 2,2-дилинолеил-4-диметиламиноэтил-[1,3]-диоксолан (DLin-KC2-DMA), можно использовать для инкапсулирования CRISPR-Cas, или ее компонентов, или кодирующих их молекул нуклеиновых кислот, аналогично siRNA (см., например, Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529-8533), и, следовательно, можно применять в практическом осуществлении настоящего изобретения. Может быть предусмотрен предварительно сформированный пузырек со следующим составом липидов: аминолипид, дистеароилфосфатидилхолин (DSPC), холестерин и (R)-2,3-бис(октадецилокси)пропил-1-(метоксиполи (этиленгликоль)2000)пропилкарбамат (конъюгат PEG-липид) в молярном соотношении 40/10/40/10 соответственно и с соотношением siRNA для FVII/общее количество липидов, составляющим примерно 0,05 (вес./вес.). Для обеспечения узкого распределения частиц по размеру в диапазоне 70-90 нм и низкого коэффициента полидисперсности 0,11+0,04 (n = 56) частицы можно экструдировать до трех раз через мембраны с диаметром пор 80 нм перед добавлением РНК CRISPR-Cas. Можно использовать частицы, содержащие высокоактивный аминолипид 16, в которых молярное соотношение четырех липидных компонентов 16, DSPC, холестерина и конъюгата PEG-липид (50/10/38,5/1,5) можно дополнительно оптимизировать для повышения активности in vivo.

Michael S D Kormann et al. ("Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157 (2011)) описывают применение липидных оболочек для доставки РНК. Применение липидных оболочек также является предпочтительным в настоящем изобретении.

В другом варианте осуществления липиды можно составлять с системой CRISPR-Cas по настоящему изобретению с образованием липидных частиц (LNP). Липиды включают без ограничения DLin-KC2-DMA4, C12-200 и совместно действующие липиды дистеароилфосфатидилхолин, холестерин и PEG-DMG, которые можно составлять с CRISPR-Cas вместо siRNA (см., например, Novobrantseva, Molecular Therapy-Nucleic Acids (2012) 1, e4; doi:10.1038/mtna.2011.3) с помощью процедуры самопроизвольного образования пузырьков. Молярное соотношение компонентов может составлять приблизительно 50/10/38,5/1,5 (DLin-KC2-DMA или C12-200/дистеароилфосфатидилхолин/холестерин/PEG-DMG). Конечное весовое соотношение липиды:siRNA может составлять ~12:1 и 9:1 в случае липидных частиц (LNP) на основе DLin-KC2-DMA и C12-200 соответственно. Составы могут характеризоваться средними диаметрами частиц ~80 нм при >90% эффективности включения. Может быть предусмотрена доза 3 мг/кг.

Tekmira имеет портфель из примерно 95 семейств патентов-аналогов, выданных в США и за границей, которые направлены на различные аспекты LNP и составы на основе LNP (см., например, патенты США №№ 7982027; 7799565; 8058069; 8283333; 7901708; 7745651; 7803397; 8101741; 8188263; 7915399; 8236943 и 7838658 и европейские патенты №№ 1766035; 1519714; 1781593 и 1664316), все из которых можно применять в настоящем изобретении и/или адаптировать к нему.

Систему CRISPR-Cas, или ее компоненты, или кодирующие их молекулы нуклеиновых кислот можно доставлять инкапсулированными в микросферах на основе PLGA, таких как дополнительно описанные в опубликованных заявках на патенты США 20130252281, и 20130245107, и 20130244279 (закрепленных за Moderna Therapeutics), которые относятся к аспектам составления композиций, содержащих модифицированные молекулы нуклеиновых кислот, которые могут кодировать белок, предшественник белка или частично или полностью процессированную форму белка или предшественника белка. Состав может характеризоваться молярным соотношением 50:10:38,5:1,5-3,0 (катионный липид:фузогенный липид:холестерин:конъюгат PEG-липид). Конъюгат PEG-липид может быть выбран без ограничения из PEG-C-DOMG, PEG-DMG. Фузогенный липид может представлять собой DSPC. См. также Schrum et al., Delivery and Formulation of Engineered Nucleic Acids, опубликованную заявку на патент США 20120251618.

Технология Nanomerics преодолевает проблемы, связанные с биологической доступностью, для широкого спектра терапевтических средств, в том числе низкомолекулярных гидрофобных лекарственных средств, пептидов и терапевтических средств на основе нуклеиновых кислот (плазмид, siRNA, miRNA). Конкретные пути введения, для которых технология продемонстрировала очевидные преимущества, включают пероральный путь, перенос через гематоэнцефалический барьер, доставку в солидные опухоли, а также в глаз. См., например, Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26; Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305-10 и Lalatsa et al., 2012, J Control Release. 2012 Jul 20; 161(2):523-36.

В публикации заявки на патент США № 20050019923 описаны катионные дендримеры для доставки биологически активных молекул, таких как молекулы полинуклеотидов, пептиды и полипептиды и/или фармацевтические средства, в организм млекопитающего. Дендримеры подходят для обеспечения нацеленной доставки биологически активных молекул, например, в печень, селезенку, легкое, почку или сердце (или даже головной мозг). Дендримеры являются синтетическими 3-мерными макромолекулами, получаемыми ступенчатым способом из простых разветвленных мономерных звеньев, природу и количество функциональных групп которых можно легко регулировать и изменять. Дендримеры синтезируют путем повторяющегося присоединения "строительных блоков" в направлении от сердцевины с несколькими функциональными группами (дивергентный подход к синтезу) или к сердцевине с несколькими функциональными группами (конвергентный подход к синтезу), и каждое присоединение 3-мерной оболочки из "строительных блоков" приводит к образованию дендримеров более высокой генерации. Синтез полипропилениминовых дендримеров начинается с диаминобутановой сердцевины, к которой присоединяют удвоенное количество аминогрупп посредством двойного присоединения по Михаэлю ацетонитрила к первичным аминогруппам с последующим гидрированием нитрильных групп. Это обуславливает удвоение количества аминогрупп. Полипропилениминовые дендримеры содержат 100% протонируемых атомов азота и до 64 концевых аминогрупп (генерация 5, DAB 64). Протонируемые группы обычно представляют собой аминогруппы, способные принимать протоны при нейтральном pH. Применение дендримеров в качестве средств для доставки генов в основном ориентировано на использование полиамидоамина и фосфорсодержащих соединений со смесью из амина/амида или N--P(O2)S в качестве конъюгирующих единиц соответственно, при этом в работах не сообщалось о применении полипропилениминовых дендримеров низкой генерации для доставки генов. Полипропилениминовые дендримеры также изучали в качестве pH-чувствительных систем с контролируемым высвобождением для доставки лекарственных средств и для инкапсулирования в них "гостевых" молекул в случае химической модификации периферических аминокислотных групп. Также изучали цитотоксичность и взаимодействие полипропилениминовых дендримеров с ДНК, а также эффективность трансфекции с помощью DAB 64.

Публикация заявки на патент США № 20050019923 основана на наблюдении того, что в противоположность более ранним сообщениям, катионные дендримеры, такие как полипропилениминовые дендримеры, проявляют подходящие свойства, такие как специфичное нацеливание и низкая токсичность, для применения в целенаправленной доставке биологически активных молекул, таких как генетический материал. В дополнение, производные катионного дендримера также проявляют подходящие свойства для нацеленной доставки биологически активных молекул. См. также "Биологически активные полимеры", публикация заявки на патент США 20080267903, в которой раскрыто следующее: "Показано, что различные полимеры, в том числе катионные полиаминные полимеры и дендримерные полимеры, обладают антипролиферативной активностью и могут, таким образом, быть применимыми для лечения нарушений, характеризующихся нежелательной пролиферацией клеток, таких как неоплазии и опухоли, воспалительные нарушения (в том числе аутоиммунные нарушения), псориаз и атеросклероз. Полимеры можно применять в отдельности в качестве активных средств или в качестве средств доставки других терапевтических средств, таких как молекулы лекарственных средств или нуклеиновые кислоты, для генной терапии. В таких случаях присущая полимерам собственная противоопухолевая активность может дополнять активность средства, подлежащего доставке. Раскрытия данных патентных публикаций можно использовать совместно с идеями данного документа для доставки системы(систем) CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот).

Белки с избыточным зарядом

Белки с избыточным зарядом представляют собой класс сконструированных или встречающихся в природе белков, которые обычно имеют высокий положительный или отрицательный суммарный теоретический заряд, и их можно использовать в доставке системы(систем) CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот). Белки как с избыточным отрицательным, так и с избыточным положительным зарядом проявляют особое свойство устойчивости к термически или химически индуцированной агрегации. Белки с избыточным положительным зарядом также способны проникать в клетки млекопитающих. Ассоциация молекул-карго, таких как плазмидная ДНК, РНК, с этими белками или другими белками может обеспечивать функциональную доставку данных макромолекул в клетки млекопитающих как in vitro, так и in vivo. В 2007 г. в лаборатории Дэвида Лю сообщили о создании и определении характеристик белков с избыточным зарядом (Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112).

Невирусная доставка РНК и плазмидной ДНК в клетки млекопитающих является значимой как в исследованиях, так и в терапевтических применениях (Akinc et al., 2010, Nat. Biotech. 26, 561-569). Очищенный белок GFP с зарядом +36 (или другой белок с избыточным положительным зарядом) смешивают с РНК в подходящей бессывороточной среде и обеспечивают возможность образования ими комплекса перед добавлением к клеткам. Включение сыворотки на этой стадии ингибирует образование комплексов белок с избыточным зарядом-РНК и снижает эффективность обработки. Следующий протокол был найден эффективным для ряда линий клеток (McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116) (однако, следовало выполнить пилотные эксперименты с варьирующей дозой белка и РНК для оптимизации процедуры для конкретных линий клеток). (1) За один день до обработки высеять 1 x 105 клеток на лунку в 48-луночный планшет. (2) В день обработки развести очищенный белок GFP с зарядом +36 в бессывороточной среде до конечной концентрации 200 нМ. Добавить РНК до конечной концентрации 50 нМ. Перемешать в вихревой мешалке и инкубировать при комнатной температуре в течение 10 мин. (3) Во время инкубирования аспирировать среду от клеток и промыть один раз с помощью PBS. (4) После инкубирования GFP с зарядом +36 и РНК добавить к клеткам комплексы белок-РНК. (5) Инкубировать клетки с комплексами при 37°C в течение 4 ч. (6) После инкубирования аспирировать среду и промыть три раза с помощью 20 ед./мл гепарина в PBS. Инкубировать клетки в сывороточной среде в течение дополнительных 48 ч или дольше в зависимости от анализа активности. (7) Анализировать клетки с помощью иммуноблоттинга, qPCR, фенотипического анализа или другого соответствующего способа.

В лаборатории Дэвида Лю дополнительно обнаружили, что GFP с зарядом +36 является эффективным реагентом для доставки плазмид в ряд клеток. Поскольку плазмидная ДНК является более крупной молекулой-карго, чем siRNA, то для образования эффективного комплекса с плазмидами требуется пропорционально больше белка GFP с зарядом +36. Для эффективной доставки плазмид заявители разработали вариант GFP с зарядом +36, несущий C-концевую пептидную метку HA2, известный пептид, разрушающий эндосомы, происходящий из белка гемагглютинина вируса гриппа. Следующий протокол был эффективным для многих клеток, но, как изложено выше, рекомендуется, чтобы дозы плазмидной ДНК и белка с избыточным зарядом были оптимизированы для конкретных линий клеток и путей применения в доставке. (1) За один день до обработки высеять 1 x 105 клеток на лунку в 48-луночный планшет. (2) В день обработки разбавить очищенный белок GFP с зарядом þ36 в бессывороточной среде до конечной концентрации 2 мМ. Добавить 1 мг плазмидной ДНК. Перемешать в вихревой мешалке и инкубировать при комнатной температуре в течение 10 мин. (3) Во время инкубирования аспирировать среду от клеток и промыть один раз с помощью PBS. (4) После инкубирования GFP с зарядом þ36 и плазмидной ДНК осторожно добавить к клеткам комплексы белок-ДНК. (5) Инкубировать клетки с комплексами при 37°C в течение 4 ч. (6) После инкубирования аспирировать среду и промыть с помощью PBS. Инкубировать клетки в сывороточной среде и инкубировать в течение дополнительных 24-48 ч. (7) При необходимости проанализировать доставку плазмид (например, посредством экспрессии генов, обусловленной плазмидами). Cм., например, McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116 (2009); Cronican et al., ACS Chemical Biology 5, 747-752 (2010); Cronican et al., Chemistry & Biology 18, 833-838 (2011); Thompson et al., способs in Enzymology 503, 293-319 (2012); Thompson, D.B., et al., Chemistry & Biology 19 (7), 831-843 (2012). Способы применения белков с избыточным зарядом можно использовать для доставки системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней. Эти системы согласно Доктору Лю и приведенные в данном документе публикации в связи с идеями данного документа можно использовать в доставке системы (систем) CRISPR Cas, или ее компонента (компонентов), или кодирующей (кодирующих) их молекулы (молекул) нуклеиновой кислоты(нуклеиновых кислот).

Пептиды, приникающие в клетку (CPP)

В еще одном варианте осуществления предусмотрены пептиды, проникающие в клетку (CPP), для доставки системы CRISPR-Cas. CPP представляют собой короткие пептиды, способствующие поглощению клетками различных молекул-карго (от наноразмерных частиц до малых химических молекул и крупных фрагментов ДНК). Термин “молекула-карго”, используемый в данном документе, включает без ограничения группу, состоящую из терапевтических средств, диагностических зондов, пептидов, нуклеиновых кислот, антисмысловых олигонуклеотидов, плазмид, белков, частиц, липосом, хромофоров, малых молекул и радиоактивных материалов. В аспектах настоящего изобретения молекула-карго может также содержать любой компонент системы CRISPR-Cas или всю функциональную систему CRISPR-Cas. В аспектах настоящего изобретения дополнительно представлены способы доставки желаемой молекулы-карго субъекту, включающие: (a) получение комплекса, содержащего пептид, проникающий в клетку, по настоящему изобретению и требуемую молекулу-карго, и (b) пероральное, внутрисуставное, внутрибрюшинное, интратекальное, внутриартериальное, интраназальное, интрапаренхиматозное, подкожное, внутримышечное, внутривенное, накожное, ректальное или местное введение комплекса субъекту. Молекула-карго связана с пептидами химической связью посредством ковалентных связей либо посредством нековалентных взаимодействий.

Функцией CPP является доставка молекулы-карго в клетки, при этом процесс, который обычно происходит посредством эндоцитоза, приводит к доставке молекулы-карго в эндосомы живых клеток млекопитающих. Пептиды, проникающие в клетку, имеют разные размер, аминокислотные последовательности и заряды, но все CPP имеют одну отличительную характеристику, которая представляет собой способность к перемещению через плазматическую мембрану и содействию доставке различных молекул-карго в цитоплазму или органеллу. Перемещение CPP можно подразделить на три основных механизма поступления: прямое прохождение через мембрану, поступление, опосредованное эндоцитозом, и перемещение посредством образования промежуточной структуры. CPP нашли многочисленные применения в медицине в качестве средств для доставки лекарственных средств при лечении различных заболеваний, в том числе рака, и ингибиторов вирусов, а также контрастных веществ для мечения клеток. Примеры последних включают действие в качестве носителя GFP, контрастных веществ для MRI или квантовых точек. CPP обладают большим потенциалом в качестве векторов доставки in vitro и in vivo для применения в научно-исследовательской работе и медицине. CPP обычно имеют такой аминокислотный состав, при котором они характеризуются высокой относительной распространенностью положительно заряженных аминокислот, таких как лизин или аргинин, либо имеют последовательности, характеризующиеся чередующимся расположением полярных/заряженных аминокислот и неполярных гидрофобных аминокислот. Эти два типа структур называются поликатионными или амфипатическими соответственно. Третьим классом CPP являются гидрофобные пептиды, содержащие только неполярные остатки с низким суммарным зарядом или имеющие гидрофобные группы аминокислот, крайне важные для поглощения клетками. Одним из первых обнаруженных CPP был трансактивирующий активатор транскрипции (Tat) вируса иммунодефицита человека 1 (HIV-1), который, как было выявлено, эффективно поглощался из окружающей среды многочисленными типами клеток в культуре. С тех пор количество известных CPP значительно увеличилось, и были созданы низкомолекулярные синтетические аналоги с более эффективными свойствами белковой трансдукции. CPP включают без ограничения пенетратин, Tat (48-60), транспортан и (R-AhX-R4) (Ahx = аминогексаноил).

В патенте США 8372951 представлен CPP, полученный из катионного белка эозинофилов (ECP), проявляющий высокую эффективность проникновения в клетку и низкую токсичность. Также представлены аспекты доставки CPP со своей молекулой-карго позвоночному субъекту. Дополнительные аспекты, касающиеся CPP и их доставки, описаны в патентах США 8575305; 8614194 и 8044019. CPP можно применять для доставки системы CRISPR-Cas или ее компонентов. Эти CPP можно использовать для доставки системы CRISPR-Cas или ее компонентов, что также представлено в рукописи “Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA” Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor, et al. Genome Res. 2014 Apr 2. [Электронная публикация, предшествующая печатной], включенной посредством ссылки во всей своей полноте, где продемонстрировано, что обработка с помощью рекомбинантного белка Cas9 конъюгированного с CPP, и направляющих РНК, образующих комплекс с CPP, приводит к нарушениям функционирования эндогенных генов в линиях клеток человека. В данной статье белок Cas9 был конъюгирован с CPP с помощью тиоэфирной связи, тогда как направляющая РНК образовывала комплекс с CPP с образованием конденсированных положительно заряженных частиц. Было показано, что одновременная и последовательная обработка клеток человека, в том числе эмбриональных стволовых клеток, дермальных фибробластов, клеток HEK293T, клеток HeLa и клеток эмбриональной карциномы, модифицированным Cas9 и направляющей РНК приводила к эффективным нарушениям функционирования генов со снижением частоты нецелевых мутаций по сравнению с трансфекциями плазмидами.

Имплантируемые устройства

В другом варианте осуществления также предполагаются имплантируемые устройства для доставки системы CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот). Например, в публикации заявки на патент США 20110195123 раскрыто имплантируемое медицинское устройство, высвобождающее лекарственное средство локально и в течение длительного периода, в том числе несколько типов такого устройства, реализуемые способы лечения и способы имплантации. Устройство содержит полимерный субстрат, такой как матрица, например, применяемый в качестве корпуса устройства, и лекарственные средства, и в некоторых случаях дополнительные трехмерные подложки-носители, такие как металлы или дополнительные полимеры, и материалы для улучшения видимости и визуализации. Имплантируемое устройство для доставки может быть преимущественным в обеспечении высвобождения локально и в течение длительного периода, где лекарственное средство высвобождается непосредственно во внеклеточный матрикс (ECM) пораженного заболеванием участка, как, например, в случае опухоли, воспаления, дегенерации, или в целях симптоматической терапии, или в пораженные гладкомышечные клетки, или для предупреждения. Одной разновидностью лекарственного средства является РНК, что раскрыто выше, и данную систему можно применять для системы CRISPR-Cas по настоящему изобретению и/или адаптировать к ней. Способы имплантации в некоторых вариантах осуществления представляют собой существующие процедуры имплантации, разработанные и применяемые в настоящее время для других видов лечения, в том числе для брахитерапии и пункционной биопсии. В таких случаях размеры нового имплантата, описанного в настоящем изобретении, аналогичны размерам первоначального имплантата. Как правило, в ходе одной процедуры лечения имплантируют несколько устройств.

В публикации заявки на патент США 20110195123 представлена имплантируемая или вставная система доставки лекарственных средств, в том числе системы, применимые для введения в полость, такую как брюшная полость, и/или для любого другого типа введения, в которой система доставки лекарственных средств не закреплена и не присоединена, содержащая биоустойчивый, и/или разлагаемый, и/или биопоглощаемый полимерный субстрат, который может, например, необязательно представлять собой матрицу. Следует отметить, что термин "вставка" также включает имплантацию. Система доставки лекарственных средств преимущественно реализуется как "Loder", описанная в публикации заявки на патент США 20110195123.

Полимер или множество полимеров, содержащие средство и/или множество средств, являются биосовместимыми, обеспечивая высвобождение средства с контролируемой скоростью, где общий объем полимерного субстрата, такого как матрица, например, в некоторых вариантах осуществления необязательно и предпочтительно не превосходит максимальный объем, позволяющий достигнуть терапевтического уровня средства. В качестве неограничивающего примера, такой объем предпочтительно находится в диапазоне от 0,1 м3 до 1000 мм3, как того требует объем загруженного средства. Loder необязательно может иметь больший размер, например, будучи включенным в состав устройства, размер которого определяется функциональным назначением, например, без ограничения коленного сустава, внутриматочного или шеечного кольца и т.п.

Система доставки лекарственных средств (для доставки композиции) в некоторых вариантах осуществления предназначена для предпочтительного использования разлагаемых полимеров, где основным механизмом высвобождения является объемная эрозия; или же в некоторых вариантах осуществления применяются неразлагаемые или медленно разлагаемые полимеры, где основным механизмом высвобождения является диффузия, а не объемная эрозия, так что их наружная часть функционирует в качестве мембраны, а их внутренняя часть функционирует в качестве депо лекарственного средства, которое практически не подвергается воздействию окружения в течение продолжительного периода (например, от приблизительно недели до приблизительно нескольких месяцев). Также можно необязательно применять комбинации различных полимеров с различными механизмами высвобождения. Градиент концентраций на поверхности предпочтительно эффективно поддерживается постоянным в течение значительного периода в ходе общего периода высвобождения лекарственного средства, и, таким образом, скорость диффузии (называемой "диффузией нулевого порядка") является эффективно постоянной. Под выражением "постоянный" подразумевают скорость диффузии, которая предпочтительно поддерживается выше нижнего порога терапевтической эффективности, но которая, тем не менее, может необязательно характеризоваться начальным всплеском и/или колебаться, например, повышаясь и понижаясь в некоторой степени. Скорость диффузии предпочтительно поддерживается таким образом в течение длительного периода, и до определенного уровня она может считаться постоянной для оптимизации терапевтически эффективного периода, например, эффективного периода сайленсинга.

Система доставки лекарственных средств необязательно и предпочтительно предназначена для защиты нуклеотидного лечебного средства от разрушения, химического по своей природе или обусловленного воздействием ферментов и других факторов в организме субъекта.

Система доставки лекарственных средств из публикации заявки на патент США № 20110195123 необязательно связана с чувствительными и/или активирующими приборами, функционирующими во время и/или после имплантации устройства посредством неинвазивных и/или минимально инвазивных способов активации и/или ускорения/замедления, например, необязательно в том числе без ограничения способов или устройств с применением термического нагревания и охлаждения, лазерных пучков и ультразвука, в том числе фокусированного ультразвука, и/или RF (радиочастот).

Согласно некоторым вариантам осуществления публикации заявки на патент США № 20110195123 участок для локальной доставки может необязательно включать целевые участки, характеризующиеся высокой аномальной пролиферацией клеток и подавлением апоптоза, в том числе опухоли, очаги активного и/или хронического воспаления и инфекции, включающих аутоиммунные болезненные состояния, ткань с дегенеративными изменениями, включающую мышечную и нервную ткань, очаги хронической боли, участки с дегенеративными изменениями, и местоположения переломов костей, и другие местоположения ран, для усиления регенерации ткани, а также поврежденные сердечные, гладкие и поперечно-полосатые мышцы.

Участок для имплантации композиции или целевой участок предпочтительно характеризуется радиусом, площадью и/или объемом, достаточно малыми для целенаправленной локальной доставки. Например, целевой участок необязательно имеет диаметр в диапазоне от приблизительно 0,1 мм до приблизительно 5 см.

Местоположение целевого участка предпочтительно выбирают для достижения максимальной терапевтической эффективности. Например, композицию системы доставки лекарственных средств (необязательно вместе с устройством для имплантации, описанным выше) необязательно и предпочтительно имплантируют в опухолевое окружение, или рядом с ним, или в кровеносную сеть, связанную с ним.

Например, композицию (необязательно вместе с устройством) необязательно имплантируют в поджелудочную железу, предстательную железу, молочную железу, печень или рядом с ними, через сосок, в сосудистую систему и т.д.

Целевое местоположение необязательно выбирают из группы, состоящей из (только в качестве неограничивающих примеров, поскольку любой участок в организме необязательно может подходить для имплантации Loder): 1. участков головного мозга, таких как базальные ганглии, белое и серое вещество, с дегенеративными изменениями подобными таковым при болезни Паркинсона или Альцгеймера; 2. спинного мозга, как в случае бокового амиотрофического склероза (ALS); 3. шейки матки для предупреждения инфекции, обусловленной HPV; 4. суставов с активным и хроническим воспалением; 5. дермы, как в случае псориаза; 6. участков симпатических и чувствительных нервов для обезболивающего эффекта; 7. участков внутрикостной имплантации; 8. очагов острой и хронической инфекции; 9. интравагинальных участков; 10. внутреннего уха слуховой системы, лабиринта внутреннего уха, вестибулярной системы; 11. внутритрахеальных участков; 12. внутрисердечных участков; участков коронарных сосудов, эпикардиальных участков; 13. мочевого пузыря; 14. желчевыделительной системы; 15. участков паренхимной ткани, в том числе без ограничения почки, печени, селезенки; 16. лимфатических узлов; 17. слюнных желез; 18. участков десен вокруг зубов; 19. внутрисуставных участков (имплантация в суставы); 20. внутриглазных участков; 21. ткани головного мозга; 22. желудочков головного мозга; 23. полостей, в том числе брюшной полости (например, без ограничения для лечения рака яичника); 24. внутрипищеводных участков и 25. внутрипрямокишечных участков.

Вставка системы (например, устройства, содержащего композицию) необязательно связана с инъекцией материала в ECM в целевом участке и окруженности этого участка для воздействия на локальные pH, и/или температуру, и/или другие биологические факторы, влияющие на диффузию лекарственного средства и/или кинетику лекарственного средства в ECM целевого участка и окруженности такого участка.

Согласно некоторым вариантам осуществления высвобождение указанного средства необязательно может быть связано с чувствительными и/или активирующими приборами, функционирующими до, и/или во время, и/или после вставки посредством неинвазивных, и/или минимально инвазивных, и/или других способов активации и/или ускорения/замедления, включающих способы или устройства с применением лазерных пучков, ионизирующего излучения, термического нагревания и охлаждения, и ультразвука, в том числе фокусированного ультразвука, и/или RF (радиочастот), а также химических активаторов.

Согласно другим вариантам осуществления в публикации заявки на патент США № 20110195123 лекарственное средство предпочтительно содержит РНК, например, для лечения случаев локализованного рака молочной железы, поджелудочной железы, головного мозга, почки, мочевого пузыря, легкого и предстательной железы, описанных ниже. Несмотря на то, что примеры были приведены с RNAi, многие применимые лекарственные средства подлежат инкапсуляции в Loder, и их можно применять в контексте настоящего изобретения, при условии, что такие лекарственные средства можно инкапсулировать в субстрате Loder, таком как, например, матрица, и данную систему можно использовать и/или приспособить для доставки системы CRISPR Cas по настоящему изобретению.

В качестве другого примера конкретного применения, дегенеративные заболевания нервной системы и мышц развиваются в связи с аномальной экспрессией генов. Локальная доставка РНК может иметь терапевтические свойства, препятствующие такой аномальной экспрессии генов. Локальная доставка антиапоптотических, противовоспалительных и антидегенеративных лекарственных средств, в том числе низкомолекулярных лекарственных средств и макромолекул, может также необязательно быть терапевтической. В таких случаях Loder применяют для пролонгированного высвобождения при постоянной скорости и/или посредством выделенного устройства, которое имплантируют отдельно. Все из этого можно применять для системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней.

В качестве еще одного примера конкретного применения, психические и когнитивные нарушения лечат с помощью модификаторов генов. Нокдаун гена является возможным методом лечения. Применение Loder для локальной доставки средств в участки центральной нервной системы является возможным методом терапии психических и когнитивных нарушений, в том числе без ограничения психоза, биполярных расстройств, невротических расстройств и расстройств поведения. Loder могут также обеспечивать локальную доставку лекарственных средств, в том числе низкомолекулярных лекарственных средств и макромолекул, при имплантации в конкретные участки головного мозга. Все из этого можно применять для системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней.

В качестве другого примера конкретного применения сайленсинг генов медиаторов врожденного и/или приобретенного иммунного ответа в локальных участках обеспечивает предупреждение отторжения трансплантированного органа. Локальная доставка РНК и иммуномодулирующих реагентов с помощью Loder, имплантированного в трансплантированный орган и/или участок имплантации, активирует подавление местного иммунитета в отношении трансплантированного органа путем отвлечения иммунных клеток, таких как CD8. Все из этого можно применять для системы CRISPR-Cas по настоящему изобретению и/или адаптировать к ней.

В качестве другого примера конкретного применения, факторы роста сосудов, в том числе VEGF, и ангиогенин, и другие, являются существенно важными для неоваскуляризации. Локальная доставка факторов, пептидов, пептидомиметиков или подавление их репрессоров является важным терапевтическим воздействием; сайленсинг репрессоров и локальная доставка факторов, пептидов, макромолекул и низкомолекулярных лекарственных средств, стимулирующих ангиогенез, с помощью Loder являются терапевтическими мерами в отношении заболевания периферических сосудов, системного заболевания сосудов и заболевания сосудов сердца.

Способ вставки, такой как имплантация, необязательно можно еще применять для других типов имплантации в ткань, и/или для вставок, и/или для отбора образцов тканей необязательно без модификаций или, в альтернативном случае, необязательно лишь с незначительными модификациями таких способов. Такие способы необязательно включают без ограничения способы брахитерапии, биопсию, эндоскопию с применением ультразвуковых технологий и/или без них, такую как ERCP, стереотаксические способы в отношении тканей головного мозга, лапароскопию, в том числе имплантацию с помощью лапароскопа в суставы, органы брюшной полости, стенку мочевого пузыря и полости тела.

Технологию имплантируемого устройства, описанную в данном документе, можно применять с руководствами в данном документе и, таким образом, с помощью данного раскрытия и знаний в данной области систему CRISPR-Cas, или ее компоненты, или ее молекулы нуклеиновой кислоты, или кодируемые или обеспечиваемые компоненты можно доставлять посредством имплантируемого устройства.

Аэрозольная доставка

Субъекты, которых лечат от заболевания легкого, например, могут получать фармацевтически эффективное количество векторной системы на основе AAV в форме аэрозоля на легкое, доставляемое эндобронхиально при самостоятельном дыхании. Вследствие этого доставка в форме аэрозоля является предпочтительной для доставки AAV. Аденовирус или частицу AAV можно применять для доставки. Подходящие конструкции с генами, каждый из которых функционально связан с одной или несколькими регуляторными последовательностями, можно клонировать в вектор доставки. В этом случае следующие конструкции представлены в качестве примеров: промотор Cbh или EF1a для Cas (Cas9), промотор U6 или H1 для направляющей РНК. Предпочтительной схемой является применение направляющей, целенаправленно воздействующей на CFTR с мутацией дельта-508, матрицы для репарации мутации дельта-F508 и кодон-оптимизированного фермента Cas9 необязательно с одним или несколькими сигналами или последовательностями ядерной локализации (NLS), например, с двумя (2) NLS. Также предусматриваются конструкции без NLS.

мРНК фермента CRISPR и направляющая РНК

Направляющую РНК и мРНК фермента CRISPR можно также доставлять по отдельности. мРНК фермента CRISPR можно доставлять перед направляющей РНК, чтобы предоставить время для экспрессии фермента CRISPR. За 1-12 часов (предпочтительно за около 2-6 часов) до введения направляющей РНК можно вводить мРНК фермента CRISPR.

Альтернативно мРНК фермента CRISPR и направляющую РНК можно вводить совместно. Вторую бустерную дозу направляющей РНК можно преимущественно вводить через 1-12 часов (предпочтительно примерно через 2-6 часов) после первого введения мРНК фермента CRISPR + направляющей РНК.

Введение дополнительных доз мРНК фермента CRISPR и/или направляющей РНК может быть полезным для достижения наиболее эффективных уровней модификации генома. В некоторых вариантах осуществления фенотипическое изменение предпочтительно является результатом модификации генома при осуществлении нацеливания на генетическое заболевание, особенно в способах терапии, и предпочтительно, если обеспечивается матрица для репарации для коррекции или изменения фенотипа.

В некоторых вариантах осуществления заболевания, на которые можно осуществлять нацеливание, включают заболевания, которые обусловлены патогенными дефектами сплайсинга.

В некоторых вариантах осуществления клеточные цели включают в себя гемопоэтические стволовые клетки/клетки-предшественники (CD34+); человеческие T-клетки и клетки глаза (клетки сетчатки), например, фоторецепторные клетки-предшественники.

В некоторых вариантах осуществления гены-мишени включают: ген бета-глобина человека - HBB (для лечения серповидноклеточной анемии, в том числе путем стимуляции конверсии генов (с использованием близкородственного гена HBD в качестве эндогенной матрицы)); CD3 (T-клетки) и CEP920 - сетчатка (глаза).

В приведенных в данном документе обсуждениях, касающихся цели, являющейся ассоциированной с мутацией или с состоянием заболевания, такие мутация или состояние заболевания могут представлять собой, например, гемофилию B, SCID, SCID-X1, ADA-SCID, наследственную тирозинемию, серповидноклеточную анемию, β-талассемию, сцепленную с Х-хромосомой CGD, синдром Вискотта-Олдрича, анемию Фанкони, адренолейкодистрофию (ALD), метахроматическую лейкодистрофию (MLD), синдром Ушера, пигментный ретинит, врожденный амавроз Лебера, кистозный фиброз, HIV/AIDS, HSV-1, HSV-2, или в более широком смысле иммунодефицитное нарушение, гематологическое состояние или болезнь лизосомального накопления. Цель может быть ассоциирована с иммунотерапией, такой как, например, иммунотерапия рака.

В некоторых вариантах осуществления способы доставки включают опосредованную катионным липидом "прямую" доставку комплекса фермент-направляющая (рибонуклеопротеин) и электропорацию плазмидной ДНК.

Способы в соответствии с настоящим изобретением могут дополнительно предусматривать доставку матриц, таких как матрицы для репарации, которые могут представлять собой dsODN или ssODN, см. ниже. Доставка матриц может осуществляться одновременно или отдельно от доставки какого-либо или всех из фермента CRISPR, направляющей, парной tracr или tracr-РНК и путем одного и того же или другого механизма доставки. В некоторых вариантах осуществления предпочтительным является то, что матрицу доставляют вместе с направляющей, парной tracr и/или tracr-РНК, а также предпочтительно с ферментом CRISPR. Примером может служить вектор на основе AAV, при этом фермент CRISPR представляет собой SaCas9 (с мутацией N580).

Способы в соответствии с настоящим изобретением могут дополнительно включать: (a) доставку в клетку двухнитевого олигодезоксинуклеотида (dsODN), содержащего "липкие" концы, комплементарные "липким" концам, создаваемым с помощью указанного двухнитевого разрыва, где указанный dsODN интегрируется в представляющий интерес локус; или (b) доставку в клетку однонитевого олигодезоксинуклеотида (ssODN), где указанный ssODN действует как матрица для гомологичной репарации указанного двухнитевого разрыва. Способы в соответствии с настоящим изобретением можно применять для предупреждения или лечения заболевания у индивидуума, при этом необязательно указанное заболевание вызвано дефектом в указанном представляющем интерес локусе. Способы в соответствии с настоящим изобретением можно выполнять in vivo у индивидуума или ex vivo в отношении клетки, извлеченной из индивидуума, где необязательно указанную клетку возвращают в организм индивидуума.

Ферменты в соответствии с настоящим изобретением могут быть применимы в оптимизированных функциональных системах CRISPR-Cas, которые представляют интерес для функционального скрининга; тест SAM

В одном аспекте настоящее изобретение относится к не встречающийся в природе или сконструированной композиции, содержащей V типа, более конкретно направляющие РНК Cas9 CRISPR, содержащие направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где направляющая РНК модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с двумя или более адаптерными белками (например, аптамерами), и где каждый адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где направляющая РНК модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю. В конкретных вариантах осуществления направляющая РНК модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК на 5'-конец прямого повтора, в прямом повторе или на 3'-конец направляющей последовательности. При наличии более одного функционального домена функциональные домены могут быть одинаковыми или разными, например, два одинаковых или два разных активатора или репрессора. В одном аспекте настоящее изобретение относится к композиции на основе не встречающейся в природе или сконструированной композиции комплекса CRISPR-Cas, содержащей направляющую РНК, обсуждаемую в данном документе, и фермент CRISPR, который представляет собой фермент Cas9, при этом необязательно фермент Cas9 содержит по меньшей мере одну мутацию, так что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно одна или несколько содержат по меньшей мере одну или несколько последовательностей ядерной локализации. В одном аспекте настоящее изобретение относится к обсуждаемым в данном документе направляющей РНК Cas9 CRISPR или комплексу CRISPR-Cas на основе Cas9, в том числе к не встречающейся в природе или сконструированной композиции, содержащей два или более адаптерных белка, где каждый белок ассоциируется с одним или несколькими функциональными доменами и где адаптерный белок связывается с отличной(отличными) последовательностью (последовательностями) РНК, вставленной(вставленными) в направляющую РНК. В конкретных вариантах осуществления направляющая РНК, в качестве дополнения или альтернативы, модифицирована так, что все еще обеспечивает связывание комплекса Cas9 CRISPR, но предотвращает расщепление ферментом Cas9 (как подробно описывается в других разделах настоящего документа).

В одном аспекте настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, содержащей направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, где направляющая РНК модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где направляющая РНК модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю, и где композиция содержит два или более адаптерных белка, при этом каждый белок ассоциируется с одним или несколькими функциональными доменами. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где фермент Cas9 обладает пониженной нуклеазной активностью по меньшей мере на 97% или 100% по сравнению с ферментом Cas9, не имеющим по меньшей мере одной мутации. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где фермент Cas9 содержит две или более мутаций. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где фермент Cas9 ассоциируется с одним или несколькими функциональными доменами. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где каждый из двух или более функциональных доменов, ассоциированных с адаптерным белком, является гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где каждый из одного или нескольких функциональных доменов, ассоциированных с ферментом Cas9, является гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где адаптерным белком является слитый белок, содержащий функциональный домен, при этом слитый белок необязательно содержит линкер между адаптерным белком и функциональным доменом, при этом линкер необязательно включает в себя линкер GlySer. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где gRNA не является модифицированной путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с двумя или более адаптерными белками. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, являются доменами активации транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменами активации транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, являются доменами активации транскрипции, содержащими VP64, p65, MyoD1, HSF1, RTA или SET7/9. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменами активации транскрипции, содержащими VP64, p65, MyoD1, HSF1, RTA или SET7/9. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, являются доменами репрессии транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменами репрессии транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где домен репрессии транскрипции является доменом KRAB. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где по меньшей мере один из одного или нескольких функциональных доменов, ассоциированных с адаптерным белком, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновой кислоты. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК, активность связывания нуклеиновой кислоты, или активность молекулярного переключателя, или химическую индуцируемость, или световую индуцируемость. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где активность расщепления ДНК обусловлена нуклеазой Fok1. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов присоединяются к ферменту Cas9 так, что при связывании с gRNA и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией; или необязательно где один или несколько функциональных доменов присоединяются к ферменту Cas9 через линкер, необязательно линкер GlySer. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где gRNA модифицируется так, что после связывания gRNA с адаптерным белком и дальнейшего связывания с ферментом Cas9 и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются присоединенными к домену RuvC Cas9. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где прямой повтор направляющей РНК модифицируется путем вставки отличной (отличных) последовательности(последовательностей) РНК. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где вставка отличной (отличных) последовательности (последовательностей) РНК, которая (которые) связывается с одним или несколькими адаптерными белками, представляет собой аптамерную последовательность. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении одного и того же адаптерного белка. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении разных адаптерных белков. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где адаптерный белок включает в себя MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ϕCb5, ϕCb8r, ϕCb12r, ϕCb23r, 7s, PRR1. Следовательно, в конкретных вариантах осуществления аптамер выбран из связывающегося белка, специфически связывающего любой из адаптерных белков, перечисленных выше. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где клеткой является эукариотическая клетка. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где эукариотической клеткой является клетка млекопитающих, растительная клетка или дрожжевая клетка, при этом клетка млекопитающих необязательно представляет собой клетку мыши. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где клеткой млекопитающих является клетка человека. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где первый адаптерный белок ассоциируется с доменом p65, а второй адаптерный белок ассоциируется с доменом HSF1. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где композиция содержит комплекс CRISPR-Cas, имеющий по меньшей мере три функциональных домена, по меньшей мере один из которых ассоциируется с ферментом Cas9, и по меньшей мере два из которых ассоциируются с gRNA.

В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе выше композиции, где имеется более чем одна gRNA, и gRNA нацеливаются на разные последовательности, посредством чего при использовании композиции происходит мультиплексирование. В одном аспекте настоящее изобретение относится к композиции, где имеется более чем одна gRNA, модифицированная путем вставки отличной (отличных) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками.

В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько адаптерных белков, ассоциированных с одним или несколькими функциональными доменами, присутствуют и связываются с отличной(отличными) последовательностью(последовательностями) РНК, вставленной(вставленными) в направляющую РНК.

В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где целевая последовательность(последовательности) является(являются) некодирующей(некодирующими) или регуляторной(регуляторными) последовательностью(последовательностями). Регуляторные последовательности могут представлять собой последовательность(последовательности) промотора, энхансера или сайленсера.

В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где направляющую РНК модифицируют так, чтобы она содержала по меньшей мере одну некодирующую функциональную петлю, например, где по меньшей мере одна некодирующая функциональная петля является репрессорной; например, где по меньшей мере одна некодирующая функциональная петля содержит Alu.

В одном аспекте настоящее изобретение относится к способу преобразования в локусе генома, предусматривающему введение хозяину или экспрессию у хозяина in vivo одной или нескольких композиций, обсуждаемых в данном документе. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором преобразование в локусе генома включает в себя воздействие на активацию гена, ингибирование гена или расщепление в локусе.

В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором хозяином является эукариотическая клетка. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором хозяином является клетка млекопитающих, необязательно клетка мыши, или растительная клетка, или дрожжевая клетка. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором хозяином является эукариотический организм, отличный человека. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором эукариотическим организмом, отличным от человека, является отличное от человека млекопитающее. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором отличным от человека млекопитающим является мышь.

В одном аспекте настоящее изобретение относится к способу модификации представляющего интерес локуса генома с изменением экспрессии гена в клетке путем введения в клетку или экспрессии в клетке композиции, обсуждаемой в данном документе. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, предусматривающему доставку композиции или молекулы (молекул) нуклеиновой кислоты, кодирующей (кодирующих) ее, где указанная (указанные) молекула (молекулы) нуклеиновой кислоты функционально связана(связаны) с регуляторной (регуляторными) последовательностью (последовательностями) и экспрессируется (экспрессируются) in vivo. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, где экспрессия in vivo осуществляется с помощью лентивируса, аденовируса, или AAV.

В одном аспекте настоящее изобретение относится к линии клеток млекопитающих из клеток, обсуждаемых в данном документе, где линией клеток необязательно является линия клеток человека или линия клеток мыши. В одном аспекте настоящее изобретение относится к трансгенной модели млекопитающего, необязательно мыши, где модель была трансформирована обсуждаемой в данном документе композицией или является потомством указанного трансформанта.

В одном аспекте настоящее изобретение относится к молекуле(молекулам) нуклеиновой кислоты, кодирующей(кодирующим) направляющую РНК, или комплекс CRISPR-Cas на основе Cas9, или композицию, обсуждаемую в данном документе. В одном аспекте настоящее изобретение относится к вектору, содержащему молекулу нуклеиновой кислоты, кодирующую направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где прямой повтор в gRNA модифицирован путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с двумя или более адаптерными белками, и где каждый адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю. В одном аспекте настоящее изобретение относится к вектору(векторам), содержащему(содержащим) молекулу(молекулы) нуклеиновой кислоты, кодирующую(кодирующие) не встречающуюся в природе или сконструированную композицию комплекса CRISPR-Cas, содержащую gRNA, обсуждаемую в данном документе, и фермент Cas9, где необязательно фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно один или несколько содержат по меньшей мере одну или несколько последовательностей ядерной локализации. В одном аспекте вектор может дополнительно содержать регуляторный(регуляторные) элемент(элементы), функционирующий (функционирующие) в эукариотической клетке, функционально связанный(связанные) с молекулой нуклеиновой кислоты, кодирующей направляющую РНК (gRNA), и/или с молекулой нуклеиновой кислоты, кодирующей фермент Cas9, и/или необязательно с последовательностью(последовательностями) ядерной локализации.

В одном аспекте настоящее изобретение относится к набору, содержащему один или несколько компонентов, описанных в данном документе выше. В некоторых вариантах осуществления набор содержит векторную систему, обсуждаемую выше, и инструкции по применению набора.

В одном аспекте настоящее изобретение относится к способу скрининга на предмет мутации приобретения функции (GOF) или потери функции (LOF) или для скрининга некодирующих РНК или потенциальных регуляторных областей (например, энхансеров, репрессоров), содержащий линию клеток, обсуждаемую в данном документе, или клетки модели, обсуждаемой в данном документе, содержащие или экспрессирующие Cas9, и введения композиции, обсуждаемой в данном документе, в клетки клеточной линии или модель, с включением тем самым в gRNA либо активатора, либо репрессора, и мониторинга на предмет GOF или LOF, соответственно, в отношении тех клеток, в которых введенная gRNA включает в себя активатор, или в отношении тех клеток, в которых введенная gRNA включает в себя репрессор. Скрининг в соответствии с настоящим изобретением называют тестом SAM.

В одном аспекте настоящее изобретение относится к комплексу CRISPR-Cas на основе Cas9, содержащему фермент Cas9 и направляющую РНК (gRNA), где фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно по меньшей мере одну или несколько последовательностей ядерной локализации; где направляющая РНК (gRNA) содержит направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; и где gRNA модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с двумя или более функциональными доменами, или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю; или фермент Cas9 ассоциируется с одним или несколькими функциональными доменами, а gRNA модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с двумя или более функциональными доменами, или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю.

В одном аспекте настоящее изобретение относится к полногеномной библиотеке, содержащей множество направляющих РНК (gRNA) Cas9, содержащих направляющие последовательности, каждая из которых способна гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и тем самым библиотека способна нацеливаться на множество целевых последовательностей во множестве локусов генома в популяции эукариотических клеток, где каждая gRNA модифицирована путем вставки отличной (отличных) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими либо двумя или более адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю. И при наличии более одного функционального домена функциональные домены могут быть одинаковыми или разными, например, два одинаковых или два разных активатора или репрессора. В одном аспекте настоящее изобретение относится к библиотеке не встречающейся (не встречающихся) в природе или сконструированной (сконструированных) композиции (композиций) с комплексом CRISPR-Cas, содержащей(содержащим) gRNA в соответствии с настоящим изобретением и фермент Cas9, где необязательно фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно одна или несколько содержат по меньшей мере одну или несколько последовательностей ядерной локализации. В одном аспекте настоящее изобретение относится к gRNA или к комплексу(комплексам) CRISPR-Cas на основе Cas9 в соответствии с настоящим изобретением, в том числе к не встречающиеся в природе или сконструированной композиции, содержащей один, или два, или больше адаптерных белков, где каждый белок ассоциируется с одним или несколькими функциональными доменами, и где адаптерный белок связывается с отличной (отличными) последовательностью (последовательностями) РНК, вставленной (вставленными) по меньшей мере в одну петлю gRNA.

В одном аспекте настоящее изобретение относится к библиотеке не встречающихся в природе или сконструированных композиций, каждая из которых содержит направляющую РНК (gRNA) Cas9 CRISPR, содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, где по меньшей мере одна петля в gRNA модифицирована путем вставки отличной (отличных) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами, где композиция содержит один или несколько либо два или более адаптерных белка, где каждый белок ассоциируется с одним или несколькими функциональными доменами, и где gRNA содержат полногеномную библиотеку, содержащую множество направляющих РНК (gRNA) Cas9. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 обладает сниженной нуклеазной активностью по меньшей мере на 97% или 100% по сравнению с ферментом Cas9, не имеющим по меньшей мере одной мутации. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 содержит две или более мутаций. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 содержит две или более мутаций. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 ассоциируется с одним или несколькими функциональными доменами. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или больше функциональных доменов, ассоциированных с адаптерным белком, являются гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где адаптерный белок является белком слияния, содержащим функциональных домен. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где gRNA не является модифицированной путем вставки отличной (отличных) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с двумя или более адаптерными белками. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с ферментом Cas9, представляют собой домен активации транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции, содержащий VP64, p65, MyoD1 или HSF1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменом активации транскрипции, содержащим VP64, p65, MyoD1 или HSF1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен репрессии транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменом репрессии транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где домен репрессии транскрипции представляет собой домен KRAB. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где домен репрессии транскрипции представляет собой домен SID или домен SID4X. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где по меньшей мере один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновой кислоты. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК, активность связывания нуклеиновой кислоты или активность молекулярного переключателя или химическую индуцируемость, или световую индуцируемость. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где активность расщепления ДНК обусловлена нуклеазой Fok1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов присоединяются к ферменту Cas9 так, что при связывании с gRNA и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где gRNA модифицируется так, что после связывания gRNA с адаптерным белком и дальнейшего связывания с ферментом Cas9 и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются присоединенными к N-концу фермента Cas9. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются присоединенными к RuvC белка FnCas9 или любому ортологу, соответствующему этим доменам. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где прямой повтор в gRNA модифицирован путем вставки отличной (отличных) последовательности (последовательностей) РНК. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где вставка отличной (отличных) последовательности (последовательностей) РНК, которая связывается с одним или несколькими адаптерными белками, представляет собой аптамерную последовательность. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении одного и того же адаптерного белка. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении другого адаптерного белка. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где адаптерный белок включает в себя MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где клеточная популяция клеток является популяцией эукариотических клеток. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где эукариотическая клетка является клеткой млекопитающих, растительной клеткой или дрожжевой клеткой. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, де клеткой млекопитающих является клетка человека. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где популяция клеток является популяцией эмбриональных стволовых (ES) клеток. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где целевой последовательностью в локусе генома является некодирующая последовательность. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где функция гена одного или нескольких продуктов генов изменяется путем указанного нацеливания; или где в отношении функции гена наблюдается мутация приобретения функции; или где в отношении функции гена наблюдается изменение функции; или где в отношении функции гена наблюдается снижение функции; или где тест является тестом на предмет некодирующих РНК или потенциальных регуляторных областей (например, энхансеров, репрессоров). В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где указанное нацеливание приводит к нокауту функции гена. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает приблизительно 100 или больше последовательностей. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает приблизительно 1000 или больше последовательностей. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает приблизительно 20000 или больше последовательностей. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает весь геном. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает панель целевых последовательностей, сфокусированных на соответствующем или желательном пути. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путь является иммунным путем. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путь является путем деления клетки. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где изменение функции гена предусматривает введение в каждую клетку в популяции клеток векторной системы из одного или нескольких векторов, содержащих сконструированную, не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую I. белок Cas9 и II. один или несколько типов направляющих РНК Cas9, где компоненты I и II могут находиться на одном и том же или на разных векторах системы, вводящей компоненты I и II в каждую клетку, где направляющая последовательность нацеливается на уникальный ген в каждой клетке, где белок Cas9 функционально связан с регуляторным элементом, где при транскрибировании направляющая РНК, содержащая направляющую последовательность, управляет специфичным к последовательности связыванием системы CRISPR-Cas на основе Cas9 с целевой последовательностью в локусах генома уникального гена с индуцированием расщепления локуса генома белком Cas9 и подтверждением разных мутаций во множестве уникальных генов в каждой клетке популяции клеток с образованием тем самым библиотеки мутантных клеток. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько векторов являются плазмидными векторами. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где регуляторным элементом является индуцируемый промотор. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где индуцируемым промотором является доксициклиновый индуцируемый промотор. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где подтверждение разных мутаций осуществляется путем полноэкзомного секвенирования. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где достигается мутация в 100 или более уникальных генах. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где достигается мутация в 1000 или более уникальных генах. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где достигается мутация в 20000 или более уникальных генах. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где мутация достигается во всем геноме. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где изменение функции гена достигается во множестве уникальных генов, которые функционируют при определенном физиологическом пути или состоянии. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путем или состоянием является иммунный путь или состояние. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путем или состоянием является путь или состояние деления клетки. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где первый адаптерный белок ассоциируется с доменом p65, а второй адаптерный белок ассоциируется с доменом HSF1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где каждый комплекс CRISPR-Cas на основе Cas9 имеет по меньшей мере три функциональных домена, по меньшей мере один из которых ассоциируется с ферментом Cas9 и по меньшей мере два из которых ассоциируются с gRNA. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где изменением в функции гена является нокаутная мутация.

В одном аспекте настоящее изобретение относится к способу функционального скрининга генов в геноме в пуле клеток ex vivo или in vivo, предусматривающему введение или экспрессию библиотеки, содержащей несколько направляющих РНК системы CRISPR-Cas на основе Cas9 (gRNA), и где скрининг дополнительно предусматривает применение фермента Cas9, где комплекс CRISPR является модифицированным, чтобы содержать гетерологичный функциональный домен. В одном аспекте настоящего изобретения предусмотрен способ скрининга генома, включающий введение хозяину библиотеки или ее экспрессию у хозяина in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий активатор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где активатор присоединяется к ферменту Cas9. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где активатор прикреплен к N-концу или C-концу фермента Cas9. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где активатор присоединяется к прямому повтору в gRNA Cas9 CRISPR. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий репрессор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где скрининг предусматривает воздействие на активацию гена, ингибирование гена или расщепление в локусе, и выявление указанного. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где хозяином является эукариотическая клетка. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где хозяином является клетка млекопитающих, дрожжевая клетка или растительная клетка. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где хозяином является эукариотический организм, отличный от человека. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где эукариотическим организмом, отличным от человека, является отличное от человека млекопитающее. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где отличным от человека млекопитающим является мышь. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, предусматривающему доставку комплексов CRISPR-Cas на основе Cas9, или их компонента (компонентов), или молекулы (молекул) нуклеиновой кислоты, кодирующей их, где указанная (указанные) молекула (молекулы) нуклеиновой кислоты функционально связана (связаны) с регуляторной (регуляторными) последовательностью (последовательностями) и экспрессируется (экспрессируются) in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где экспрессия in vivo осуществляется с помощью лентивируса, аденовируса или AAV. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где доставка осуществляется с помощью частицы, наночастицы, липида или пептида, проникающих в клетку (CPP).

В одном аспекте настоящее изобретение относится к паре комплексов CRISPR-Cas на основе Cas9, при этом каждый из них содержит направляющую РНК Cas9 (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где указанная gRNA является модифицированной путем вставки отличной (отличных) последовательности (последовательностей) РНК, которая (которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами, где каждая gRNA из каждого CRISPR-Cas на основе Cas9 содержит функциональный домен, характеризующийся активностью расщепления ДНК. В одном аспекте настоящее изобретение относится к парным комплексам CRISPR-Cas на основе Cas9, обсуждаемым в данном документе, где активность расщепления ДНК обусловлена нуклеазой Fok1.

В конкретных вариантах осуществления в способах и композициях в данном документе применяется нуклеотидная последовательность, кодирующая белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающих, а в более предпочтительном варианте осуществления клетка млекопитающих является человеческой клеткой, дрожжевой клеткой или растительной клеткой. Альтернативно эукариотическая клетка является растительной клеткой. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.

В некоторых вариантах осуществления способов и композиций, представленных в данном документе, фермент Cas9 получен из Acidaminococcus sp. BV3L6, бактерии Lachnospiraceae MA2020 или Francisella tularensis 1 Novicida Cas9 и может включать в себя мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9.

В одном аспекте, настоящее изобретение относится к способу создания модельной эукариотической клетки, содержащей ген с модифицированной экспрессией. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов, описываемых в данном документе выше, в эукариотическую клетку и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом так, что происходит модификация генного локуса с получением тем самым модельной эукариотической клетки, содержащей модифицированный локус гена.

В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных выше вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.

Настоящее изобретение охватывает оптимизированные функциональные системы фермента CRISPR-Cas на основе Cas9, особенно в комбинации с модифицированными направляющими в соответствии с настоящим изобретением, а также, если фермент Cas9 также ассоциирован с функциональным доменом. В частности, фермент Cas9 содержит одну или несколько мутаций, которые превращают его в связывающий ДНК белок, к которому могут быть добавлены, или приложены, или вставлены, или присоединены функциональные домены, проявляющие представляющую интерес функцию. В определенных вариантах осуществления фермент Cas9 содержит одну или несколько мутаций, и/или одна или несколько мутаций находятся в домене RuvC1 фермента Cas9 или представляют собой мутацию, иным образом обсуждаемую в данном документе. В некоторых вариантах осуществления фермент Cas9 имеет одну или несколько мутаций в каталитическом домене, где при транскрипции направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен. В некоторых вариантах осуществления предпочтительной является мутация в E1006 в соответствии с белком FnCas9.

Информация о структуре, представленная в данном документе, обеспечивает детальное изучение взаимодействия направляющей РНК с целевой ДНК и ферментом Cas9, предоставляя возможность конструирования или изменения структуры направляющей РНК для оптимизации функциональности всей системы CRISPR-Cas на основе Cas9. Например, петли в направляющей РНК могут быть увеличены без перекрывания с белком Cas9 путем вставки адаптерных белков, которые могут связываться с РНК. Такие адаптерные белки могут дополнительно рекрутировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов.

В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.

Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.

В целом, направляющую РНК модифицируют таким путем, который обеспечивает специфические сайты связывания (например, аптамеры) для адаптерных белков, содержащих один или несколько функциональных доменов (например, посредством образования слитого белка) для связывания. Модифицированную направляющую РНК модифицируют так, что как только направляющая РНК формирует комплекс CRISPR (т.е. фермент Cas9 связывается с направляющей РНК и мишенью), адаптерные белки связываются, и функциональный домен в адаптерном белке располагается в пространственной ориентации, которая является предпочтительной для эффективности присущей функции. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени.

Специалисту в данной области будет понятно, что модификации для направляющей РНК, которые обеспечивают связывание адаптор + функциональный домен, но не обеспечивают надлежащее размещение адаптор + функциональный домен (например, из-за стерического несоответствия в трехмерной структуре комплекса CRISPR), являются модификациями, которые не подразумеваются. Одна или несколько модифицированных направляющих РНК могут быть модифицированы путем введения отличной (отличных) последовательности (последовательностей) РНК на 5'-конце прямого повтора, в прямой повтор или на 3'-конце направляющей последовательности.

Как объясняется в данном документе, функциональные домены могут представлять собой, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.

Направляющая РНК может быть разработана с включением в себя нескольких связывающих сайтов распознавания (например, аптамеров), специфичных в отношении одного и того же или разных адаптерных белков. Направляющая РНК фермента Cas9 характеризуется тем, что, как правило, она состоит из 37-43 нуклеотидов и тем, что она содержит только одну "петлю-на-стебле". Направляющая РНК может быть разработана со связыванием с промоторным участком -1000 - +1 нуклеиновых кислот выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеиновых кислот. Такое размещение улучшает функциональные домены, которые влияют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированной направляющей РНК может быть одна или несколько модифицированных направляющих РНК, нацеленных на один или несколько целевых локусов (например, по меньшей мере 1 направляющая РНК, по меньшей мере 2 направляющих РНК, по меньшей мере 5 направляющих РНК, по меньшей мере 10 направляющих РНК, по меньшей мере 20 направляющих РНК, по меньшей мере 30 направляющих РНК, по меньшей мере 50 направляющих РНК), содержащихся в композиции.

Кроме того, фермент Cas9 со сниженной нуклеазной активностью является наиболее эффективным при инактивировании нуклеазной активности (например, инактивация нуклеазы по меньшей мере на 70%, по меньшей мере на 80%, по меньшей мере на 90%, по меньшей мере на 95%, по меньшей мере на 97% или на 100% по сравнению с ферментом дикого типа; или, другими словами, фермент Cas9 обладает преимущественно приблизительно 0% нуклеазной активности немутантного или дикого типа фермента Cas9 или не более чем приблизительно 3%, или приблизительно 5%, или приблизительно 10% нуклеазной активности немутированного или дикого типа фермента Cas9). Это возможно путем введения мутаций в нуклеазные домены RuvC FnCas9 и ее ортологов. Например, используются мутации в остатке, выбранном из группы, состоящей из D917A, E1006A, E1028A, D1227A, D1255A или N1257, как в FnCas9, и более предпочтительно вводятся одна или несколько мутаций, выбранных из группы, состоящей из местоположений D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A и N1257 в FnCas9 или соответствующем ортологе. В конкретных вариантах осуществления мутациями являются D917A с E1006A в FnCas9.

Инактивированный фермент Cas9 может быть ассоциирован (например, посредством образования слитого белка) с одним или несколькими функциональными доменами, подобными, например, описываемому в данном документе, для модифицированных направляющей РНК адаптерных белков, в том числе, например, с одним или несколькими доменами из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае обеспечения Fok1 предпочтительным является то, что несколько функциональных доменов Fok1 обеспечены для функционального димера и что направляющие РНК предназначены для обеспечения надлежащего интервала для функционального использования (Fok1), как конкретно описано в Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов. В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.

В целом, размещение одного или нескольких функциональных доменом в инактивированном ферменте Cas9 обеспечивает корректную пространственную ориентацию функционального домена для воздействия на мишень с присущим функциональным эффектом. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции преимущественно будет размещаться для влияния на транскрипцию мишени, а нуклеаза (например, Fok1) преимущественно будет размещаться для расщепления или частичного расщепления мишени. Могут быть предусмотрены положения, отличные от N-/C-конца фермента Cas9.

Адаптерным белком может быть какой-либо из ряда белков, который связывается с аптамером или сайтом распознавания, введенным в модифицированную направляющую РНК, и который обеспечивает надлежащее размещение одного или нескольких функциональных доменов, как только направляющая РНК была встроена в комплекс CRISPR, для воздействия на мишень с присущей функцией. Как подробно объясняется в настоящей заявке, они могут представлять собой белки оболочки, предпочтительно белки оболочки бактериофагов. Функциональные домены, ассоциированные с такими адаптерными белками (например, в форме слитого белка), могут включать, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, если функциональный домен представляет собой активатор транскрипции или репрессор транскрипции, преимущественным является обеспечение дополнительно по меньшей мере NLS и предпочтительно на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов.

Таким образом, модифицированная направляющая РНК, инактивированный фермент Cas9 (с функциональными доменами или без таковых) и связывающий белок с одним или несколькими функциональными доменами могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение в хозяина может осуществляться с помощью вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной gRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта.

Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).

Настоящее изобретение охватывает применение композиций в соответствии с настоящим изобретением для создания и применения условных или индуцируемых трансгенных по CRISPR клетки/животных. (См., например, Platt et al., Cell (2014), http://dx.doi.org/10.1016/j.cell.2014.09.014, или патентные публикации PCT, цитируемые в данном документе, такие как WO 2014/093622 (PCT/US2013/074667), которые не считаются уровнем техники настоящих изобретения или заявки). Например, целевая клетка содержит зависимый от условия или индуцируемый фермент Cas9 CRISPR (например, в форме зависимых от Cre конструкций) и/или зависимый от условий или индуцируемый адаптерный белок, и при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента Cas9 и/или экспрессии адаптера в целевой клетке. За счет применения идей и композиций по настоящему изобретению с известным способом создания комплекса CRISPR индуцируемые преобразования генома, на которые воздействуют функциональные домены, также являются аспектом настоящего изобретения. Одним из примеров этого является создание трансгенного животного с нокином CRISPR/зависимой от условий экспрессией (например, мыши, содержащей, например, кассету Lox-Stop-polyA-Lox(LSL)) и последующую доставку одной или нескольких композиций, обеспечивающих одну или несколько модифицированных направляющих РНК (например, -200 нуклеотидов до TSS в представляющем интерес целевом гене для целей активации гена), описываемых в данном документе (например, модифицированных направляющих РНК с одним или несколькими аптамерами, распознаваемыми белками оболочки, например, MS2), одного или несколько адаптерных белков, описываемых в данном документе, (MS2-связывающий белок, связанный с одним или несколькими VP64), и средств для индуцирования животного с зависимой от условий экспрессией (например, рекомбиназы Cre для обеспечения индуцируемой экспрессии Cas9). Альтернативно адаптерный белок может быть обеспечен как условный или индуцируемый элемент с условным или индуцируемым ферментом Cas9 для обеспечения эффективной модели для скрининга, которая преимущественно требует только минимальной разработки и введения специфических gRNA для широкого диапазона применений.

Деактивированный/инактивированный белок Cas

Если белок Cas9 обладает нуклеазной активностью, то белок Cas9 может быть модифицирован с наличием сниженной нуклеазной активности, например, с инактивацией нуклеазы по меньшей мере на 70%, по меньшей мере на 80%, по меньшей мере на 90%, по меньшей мере на 95%, по меньшей мере на 97% или на 100% по сравнению с ферментом дикого типа; или, другими словами, фермент Cas9 обладает преимущественно приблизительно 0% нуклеазной активности немутированного или дикого типа фермента Cas9 или фермента CRISPR или не более чем приблизительно 3%, или приблизительно 5%, или приблизительно 10% нуклеазной активности немутированного или дикого типа фермента Cas9, например, немутированного или дикого типа фермента Cas9 или фермента CRISPR S. pyogenes. Это возможно путем введения мутаций в нуклеазные домены Cas9 и ее ортологов.

Инактивированный фермент Cas9 CRISPR может быть ассоциированным (например, посредством образования слитого белка) с одним или несколькими функциональными доменами, в том числе, например, с одним или несколькими доменами из группы, содержащей, состоящей в основном из, или состоящей из метилазной активности, деметилазной активности, активности в отношении активации транскрипции, активности репрессии транскрипции, активности фактора освобождения транскрипта, активности модификации гистонов, активности расщепления РНК, активности расщепления ДНК, активности связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае обеспечения Fok1 предпочтительным является то, что несколько функциональных доменов Fok1 обеспечены для функционального димера и что sgRNA предназначены для обеспечения надлежащего интервала для функционального использования (Fok1), как конкретно описано в Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов. В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.

В целом, размещение одного или нескольких функциональных доменом в инактивированном ферменте Cas9 обеспечивает корректную пространственную ориентацию функционального домена для воздействия на мишень с присущим функциональным эффектом. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени. Могут быть предусмотрены положения, отличные от N-/C-конца фермента CRISPR.

В одном варианте осуществления Cas9 может содержать одну или несколько мутаций (и, следовательно, молекула (молекулы) нуклеиновой кислоты, кодирующая (кодирующие) его, может (могут) иметь мутацию (мутации)). Мутации могут быть искусственно введенными мутациями и могут включать в себя без ограничения одну или несколько мутаций в каталитическом домене. Примеры каталитических доменов в отношении фермента Cas9 могут включать в себя без ограничения домены RuvC I, RuvC II, RuvC III и HNH.

В одном варианте осуществления Cas9 может содержать одну или несколько мутаций. Мутации могут быть искусственно введенными мутациями и могут включать в себя без ограничения одну или несколько мутаций в каталитическом домене для обеспечения никазы, например. Примеры каталитических доменов в отношении фермента Cas могут включать в себя без ограничения домены RuvC I, RuvC II, RuvC III и HNH.

В одном варианте осуществления Cas9 можно применять в качестве генерического связывающегося с нуклеиновой кислотой белка при слиянии или при функциональном связывании с функциональным доменом. Иллюстративные функциональные домены могут включать без ограничения инициатор трансляции, активатор трансляции, репрессор трансляции, нуклеазы, в частности, рибонуклеазы, сплайсосому, гранулы, индуцируемый/контролируемый светом домен или химически индуцируемый/контролируемый домен.

В некоторых вариантах осуществления немодифицированный эффекторный белок для нацеливания на нуклеиновую кислоту может характеризоваться активностью расщепления. В некоторых вариантах осуществления эффекторный белок для нацеливания на РНК может управлять расщеплением одной или обеих нитей нуклеиновой кислоты (ДНК или РНК) в определенном положении целевой последовательностью или вблизи нее, как, например, в пределах целевой последовательности и/или в последовательности, комплементарной целевой последовательности, или в последовательностях, ассоциированных с целевой последовательностью. В некоторых вариантах осуществления, эффекторный белок для нацеливания на Cas9 может управлять расщеплением одной или обеих нитей ДНК или РНК в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления расщепление может быть "тупым", т.е. образующим "тупые" концы. В некоторых вариантах осуществления расщепление может быть ступенчатым, т.е. образующим липкие концы. В некоторых вариантах осуществления расщепление может представлять собой ступенчатый разрыв с "липким" 5'-концом, например, с "липким" 5'-концом из 1-5 нуклеотидов. В некоторых вариантах осуществления расщепление может представлять собой ступенчатый разрыв с "липким" 3'-концом, например, с "липким" 3'-концом из 1-5 нуклеотидов. В некоторых вариантах осуществления вектор кодирует нацеливающийся на нуклеиновую кислоту белок Cas, который может быть мутированным по отношению к соответствующему ферменту дикого типа, так что у мутантного нацеливающегося на нуклеиновую кислоту белка Cas отсутствует способность расщеплять одну или обе нити ДНК или РНК целевого полинуклеотида, содержащего целевую последовательность. В качестве дополнительного примера два или более каталитических доменов Cas (RuvC I, RuvC II и RuvC III или домен HNH) можно подвергать мутациям с получением мутированного Cas, у которого практически полностью отсутствует активность расщепления РНК. Описываемые в данном документе соответствующие каталитические домены эффекторного белка Cas9 также могут быть мутированы с получением мутированного Cas9, не обладающего полной активностью расщепления ДНК или обладающего, по сути, пониженной активностью расщепления ДНК. В некоторых вариантах осуществления нацеливающийся на нуклеиновую кислоту эффекторный белок можно считать, по сути, не обладающим полной активностью расщепления РНК, если активность расщепления РНК у мутированного фермента составляет не более чем приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше от активности расщепления нуклеиновой кислоты немутированной формы фермента; примером может служить случай, когда активность расщепления ДНК у мутированной формы отсутствует или несущественна по сравнению с немутированной формой. Эффекторный белок может быть идентифицирован относительно общего класса ферментов, обладающих гомологией с самой большой нуклеазой с несколькими нуклеазными доменами системы CRISPR II типа. Наиболее предпочтительно, эффекторные белок является белком II типа, таким как Cas9. Под происходящим заявители подразумевают, что в основе происходящего фермента главным образом лежит фермент дикого типа в том смысле, что он характеризуется высокой степенью гомологии последовательности с этим ферментом, но он был некоторым образом подвергнут мутации (модифицирован), как известно из уровня техники или описано в данном документе.

Опять-таки, следует учитывать, что термины Cas, и фермент CRISPR, и белок CRISPR, и белок Cas, как правило, используют взаимозаменяемо, и при всех упоминаниях в данном документе они относятся по аналогии к новым эффекторным белкам CRISPR, далее описываемым в настоящей заявке, если иное не очевидно, например, конкретным упоминанием Cas9. Как упоминается выше, многие из порядков нумерации остатков, используемых в данном документе, относятся к эффекторному белку из локуса CRISPR II типа. Однако следует учитывать, что настоящее изобретение включает намного больше эффекторных белков из других видов микроорганизмов.

Перечень организмов в качестве возможного источника белка Cas

Белок Cas может включать в себя белок Cas из организма рода, включающего в себя Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.

Белок Cas9 может включать в себя белок Cas9 из организма рода, включающего в себя Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.

Предпочтительные примеры включают в себя S. pyogenes, S. aureus.

В одном варианте осуществления белок Cas9 может быть ортологом из организма рода, включающего в себя без ограничения Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma и Campylobacter. Виды организма такого рода могут быть иными, обсуждаемыми в данном документе.

Некоторые способы идентификации ортологов ферментов системы CRISPR-Cas могут предусматривать идентификацию tracr-последовательностей в представляющих интерес геномах. Идентификация tracr-последовательностей может заключаться в следующих стадиях: поиска прямых повторов или парных tracr-последовательностей в базе данных для идентификации участка CRISPR, содержащего фермент CRISPR; поиска гомологичных последовательностей в участке CRISPR, фланкирующем фермент CRISPR как в смысловом, так и в антисмысловом направлениях; поиска терминаторов транскрипции и вторичных структур; идентификации какой-либо последовательности, которая не является прямым повтором или парной tracr-последовательностью, но обладает более чем 50% идентичностью в отношении прямого повтора или парной tracr-последовательности, в качестве потенциальной tracr-последовательности; получения потенциальной tracr-последовательности и анализа на предмет ассоциированных с ней последовательностей терминатора транскрипции.

Следует учитывать, что любое из функциональных свойств, описанных в данном документе, может быть сконструировано в ферментах CRISPR от других ортологов, в том числе химерных ферментов, содержащих фрагменты из нескольких ортологов. Примеры таких ортологов описываются в других разделах настоящего документа. Таким образом, химерные ферменты может включать в себя фрагменты ортологов фермента CRISPR из организма, который включает в себя без ограничения Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma и Campylobacter. Химерный фермент может содержать первый фрагмент и второй фрагмент, и при этом фрагментами могут быть ортологи фермента CRISPR из организмов родов, упоминаемых в данном документе, или из видов, упоминаемых в данном документе; преимущественно фрагменты являются фрагментами ортологов фермента CRISPR из различных видов.

Для сведения к минимуму токсичности и нецелевого эффекта будет важной регуляция концентрации доставляемых мРНК фермента CRISPR и направляющей РНК. Оптимальные концентрации мРНК фермента CRISPR и направляющей РНК можно определить путем тестирования различных концентраций в клеточной или животной модели и применения глубокого секвенирования для анализа степени модификации в возможных нецелевых локусах генома. Например, для направляющей последовательности, нацеливающейся на 5'-GAGTCCGAGCAGAAGAAGAA-3' в гене EMX1 генома человека, можно применять глубокое секвенирование для определения уровня модификации в следующих двух нецелевых локусах: 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' и 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'. Для доставки in vivo следует выбрать концентрацию, дающую наиболее высокий уровень целевой модификации при сведении к минимуму уровня нецелевой модификации.

Доставка: варианты для ДНК/РНК, или ДНК/ДНК, или РНК/РНК, или белок/РНК

В некоторых вариантах осуществления компоненты системы CRISPR могут быть доставлены в различной форме, такой как комбинации ДНК/РНК, или РНК/РНК, или белок/РНК. Например, Cas9 может быть доставлен в виде кодирующего ДНК полинуклеотида, или кодирующего РНК полинуклеотида, или в виде белка. Направляющая может быть доставлена в виде кодирующего ДНК полинуклеотида или РНК. Предусматриваются все возможные комбинации, в том числе смешанные формы доставки.

В некоторых вариантах осуществления предусматриваются все такие комбинации (ДНК/РНК, или ДНК/ДНК, или РНК/РНК, или белок/РНК).

В определенном варианте осуществления, если Cas9 доставляют в форме белка, то можно предварительно собрать его с одной или несколькими направляющими.

Доставка: нанококоны

Кроме того, система CRISPR может быть доставлена с использованием нанококонов, например, как описывается у Sun W et al., Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery., J Am Chem Soc. 2014 Oct 22;136(42):14722-5. doi: 10.1021/ja5088024. Epub 2014 Oct 13. ; или у Sun W et al., Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for Genome Editing., Angew Chem Int Ed Engl. 2015 Oct 5;54(41):12029-33. doi: 10.1002/anie.201506030. Epub 2015 Aug 27.

Доставка - GalNAc

Компоненты комплекса CRISPR могут быть доставлены с помощью конъюгации или ассоциации с транспортными фрагментами (адаптированными, например, из подходов, раскрытых в патентах США №№ 8106022; 8313772, включенных в данный документ посредством ссылки). Стратегии доставки нуклеиновой кислоты, например, можно применять для улучшения доставки направляющей РНК, или информационных РНК, или кодирующих ДНК, кодирующих компоненты комплекса CRISPR, в том числе белка CRISPR. Например, РНК могут включать модифицированные нуклеотиды РНК для улучшения стабильности, понижения иммуностимуляции и/или улучшения специфичности (см. Deleavey, Glen F. et al., 2012, Chemistry & Biology , Volume 19 , Issue 8, 937 - 954; Zalipsky, 1995, Advanced Drug Delivery Reviews 16: 157-182; Caliceti and Veronese, 2003, Advanced Drug Delivery Reviews 55: 1261-1277). Были описаны различные конструкции, которые можно применять для модификации нуклеиновых кислот, таких как gRNA, для более эффективной доставки, например, обратимые нейтрализующие заряд модификации фосфотриэфирного скелета, которые могут быть адаптированы для модификации gRNA так, что они будут более гидрофобными и неанионными, с улучшением тем самым попадания в клетку (Meade BR et al., 2014, Nature Biotechnology 32,1256-1261). В следующих альтернативных вариантах осуществления выбранные мотивы РНК могут быть применимы для опосредования клеточной трансфекции (Magalhães M., et al., Molecular Therapy (2012); 20 3, 616-624). Подобным образом, аптамеры могут быть адаптированы для доставки компонентов комплекса CRISPR, например, с помощью добавления аптамеров к gRNA (Tan W. et al., 2011, Trends in Biotechnology, December 2011, Vol. 29, No. 12).

В некоторых вариантах осуществления конъюгацию трехразветвленного N-ацетилгалактозамина (GalNAc) с олигонуклеотидными компонентами можно применять для улучшения доставки, например, доставки для отбора типов клеток, например, гепатоцитов (см., WO2014118272, включенную в данный документ посредством ссылки; Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961). Это можно рассматривать как частицу на основе сахара, и дополнительные подробности о других системах доставки в виде частиц и/или составах приведены в данном документе в соответствующем разделе. Поэтому GalNAc можно рассматривать как частицу в том же смысле, что и другие частицы, описываемые в данном документе, так что общие применения и другие соображения, например, доставка указанных частиц, также применимы к частицам GalNAc. Стратегия конъюгации из жидкой фазы, например, может быть использована для присоединения кластеров трехразветвленных GalNAc (молекулярная масса ~2000), активированных как PFP (пентафторфенильные) сложные эфиры, к 5′-гексиламино-модифицированным олигонуклеотидам (5′-HA ASO, молекулярная масса ~8000 Да; Østergaard et al., Bioconjugate Chem., 2015, 26 (8), pp 1451-1455). Подобным образом, были описаны поли(акрилатные) полимеры для доставки нуклеиновой кислоты in vivo (см. WO2013158141, включенную в данный документ посредством ссылки). В следующих альтернативных вариантах осуществления предварительное смешивание наночастиц CRISPR (или белковых комплексов) со встречающимися в природе сывороточными белками можно применять для улучшения доставки (Akinc A et al., 2010, Molecular Therapy vol. 18 no. 7, 1357-1364).

Доступны методики скрининга для идентификации доставленных энхансеров, например, с помощью скрининга химических библиотек (Gilleron J. et al., 2015, Nucl. Acids Res. 43 (16): 7984-8001). Также были описаны подходы для оценивания эффективности средств доставки, таких как липидные наночастицы, которые могут быть использованы для идентификации эффективных носителей доставки для компонентов CRISPR (см. Sahay G. et al., 2013, Nature Biotechnology 31, 653-658).

В некоторых вариантах осуществления доставка компонентов белка CRISPR может быть облегчена добавлением функциональных пептидов к белку, таких как пептиды, которые изменяют гидрофобность белка, например, для улучшения функциональности in vivo. Белковые компоненты комплекса CRISPR, подобным образом, могут быть модифицированы для облегчения последующих химических реакций. Например, к белку могут быть добавлены аминокислоты, которые имеют группу, подвергаемую клик-химии (Nikić I. et al., 2015, Nature Protocols 10,780-791). В вариантах осуществления такого рода клик-химическая группа затем может быть использована в широком ряде альтернативных структур, например, поли(этиленгликоль) для стабильности, проникающие в клетку пептиды, аптамеры РНК, липиды или углеводы, такие как GalNAc. В качестве дополнительных альтернатив, белковый компонент комплекса CRISPR может быть модифицирован для адаптации белка для попадания в клетку (см. Svensen et al., 2012, Trends in Pharmacological Sciences, Vol. 33, No. 4), например, путем добавления проникающих в клетку пептидов к белку (см. Kauffman, W. Berkeley et al., 2015, Trends in Biochemical Sciences, Volume 40, Issue 12, 749 - 764; Koren and Torchilin, 2012, Trends in Molecular Medicine, Vol. 18, No. 7). В следующих альтернативных вариантах осуществления пациенты или субъекты могут предварительно получать соединения или составы, которые облегчают последующую доставку компонентов комплекса CRISPR.

Индуцируемые системы

В некоторых вариантах осуществления фермент CRISPR может образовывать компонент индуцируемой системы. Индуцируемая природа системы будет обеспечивать возможность пространственно-временного контроля редактирования генов или экспрессии генов с использованием определенной формы энергии. Форма энергии может включать, но без ограничения, электромагнитное излучение, звуковую энергию, химическую энергию и тепловую энергию. Примеры индуцируемой системы включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), двухгибридные системы активации транскрипции с использованием малых молекул (FKBP, ABA и т.д.) или индуцируемые светом системы (фитохром, домены LOV или криптохром). В одном варианте осуществления фермент CRISPR может быть частью индуцируемого светом транскрипционного эффектора (LITE) для управления изменениями транскрипционной активности специфичным к последовательности образом. Компоненты индуцируемой светом системы могут включать фермент CRISPR, чувствительный к свету гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых ДНК-связывающих белков и способы их применения представлены в US 61/736465, US 61/721283 и WO 2014/018423, которые включены в данный документ посредством ссылки во всей полноте.

Самоинактивирующиеся системы

Как только все копии гена в геноме клетки подвергли редактированию, дальнейшая экспрессия CRISRP/Cas9 в такой клетке более не требуется. В действительности, поддержание экспрессии было бы нежелательным в случае нецелевых эффектов в сайтах генома, не предназначенных для редактирования и т.д. Таким образом, целесообразной была бы ограниченная во времени экспрессия. Индуцируемая экспрессия предоставляет одно решение проблемы, но помимо нее заявители сконструировали самоинактивирующуюся систему CRISPR-Cas9, которая основана на применении некодирующей направляющей целевой последовательности в самом векторе, несущем CRISPR. Таким образом, после того как экспрессия началась, система CRISPR будет вызывать собственное разрушение, но перед тем как разрушение завершится, у нее будет достаточно времени для редактирования геномных копий целевого гена (для чего, с точки зрения нормальной точечной мутации в диплоидной клетке, потребуется не более двух редактирований). Вкратце, самоинактивирующаяся система CRISPR-Cas включает в себя дополнительную РНК (т.e. направляющую РНК), которая нацеливает кодирующую последовательность для самого фермента CRISPR или которая нацеливает одну или несколько некодирующих направляющих целевых последовательностей, комплементарных уникальным последовательностям, присутствующим в одной или нескольких из следующих:

(a) в промоторе, управляющем экспрессией элементов некодирующей РНК,

(b) в промоторе, управляющем экспрессией гена Cas9,

(c) в последовательности в 100 п.о. инициирующего трансляцию стартового ATG-кодона в кодирующей последовательности Cas9,

(d) в инвертированном концевом повторе (iTR) вирусного вектора для доставки, например, в геноме AAV.

Более того, такую РНК можно доставлять посредством вектора, например, отдельного вектора или того же вектора, который кодирует комплекс CRISPR. Когда введение осуществляют с помощью отдельного вектора, то РНК CRISPR, которая целенаправленно воздействует на экспрессию Cas, можно вводить последовательно или одновременно. При последовательном введении РНК CRISPR, которая целенаправленно воздействует на экспрессию Cas, можно доставлять после РНК CRISPR, которая предназначена, например, для редактирования генов или рекомбинации генов. Данный период может быть периодом, исчисляемым в минутах (например, 5 минут, 10 минут, 20 минут, 30 минут, 45 минут, 60 минут). Данный период может быть периодом, исчисляемым в часах (например, 2 часа, 4 часа, 6 часов, 8 часов, 12 часов, 24 часа). Данный период может быть периодом, исчисляемым в днях (например, 2 дня, 3 дня, 4 дня, 7 дней). Данный период может быть периодом, исчисляемым в неделях (например, 2 недели, 3 недели, 4 недели). Данный период может быть периодом, исчисляемым в месяцах (например, 2 месяца, 4 месяца, 8 месяцев, 12 месяцев). Данный период может быть периодом, исчисляемым в годах (например, 2 года, 3 года, 4 года). Таким путем, фермент Cas связывается с первой gRNA/chiRNA, способной гибридизироваться с первой мишенью, такой как представляющие интерес локус или локусы генома, и выполняет функцию (функции), требующиеся для системы CRISPR-Cas (например, редактирование генов); и впоследствии фермент Cas может затем ассоциироваться со второй gRNA/chiRNA, способной гибридизироваться с последовательностью, содержащей по меньшей мере часть кассеты Cas или CRISPR. Если gRNA/chiRNA целенаправленно воздействуют на последовательности, кодирующие экспрессию белка Cas, фермент блокируется, а система становится самоинактивирующейся. Аналогичным образом, РНК CRISPR, которая целенаправленно воздействует на экспрессию Cas, введенного посредством, например, липосомы, липофекции, частиц, микровезикул, что объясняется в данном документе, можно вводить последовательно или одновременно. Проще говоря, самоинактивацию можно применять для инактивации одой или нескольких направляющих РНК, используемых для целенаправленного воздействия одной или нескольких мишеней.

В ряде аспектов обеспечивается одиночная gRNA, которая способна гибридизироваться с последовательностью, расположенной ниже стартового кодона фермента CRISPR, при этом после определенного периода времени происходит потеря экспрессии фермента CRISPR. В ряде аспектов обеспечиваются одна или несколько gRNA, которые способны гибридизироваться с одной или несколькими кодирующими или некодирующими участками полинуклеотида, кодирующего систему CRISPR-Cas, при этом после определенного периода времени происходит инактивация одной или нескольких, или в ряде случаев, всех систем CRISPR-Cas. В ряде аспектов системы и не ограничиваясь теорией клетка может содержать множество комплексов CRISPR-Cas, где первое подмножество комплексов CRISPR содержит первую chiRNA, способную целенаправленно воздействовать на подлежащие редактированию локус или локусы генома, а второе подмножество комплексов CRISPR содержит по меньшей мере одну вторую chiRNA, способную целенаправленно воздействовать на полинуклеотид, кодирующий систему CRISPR-Cas, где первое подмножество комплексов CRISPR-Cas опосредует редактирование целевых локуса или локусов генома, а второе подмножество комплексов CRISPR впоследствии инактивирует систему CRISPR-Cas, инактивируя тем самым в дальнейшем экспрессию CRISPR-Cas в клетке.

Таким образом, настоящее изобретение относится к системе CRISPR-Cas, содержащей один или несколько векторов для доставки в эукариотическую клетку, где вектор(векторы) кодирует(кодируют): (i) фермент CRISPR; (ii) первую направляющую РНК, способную гибридизироваться с целевой последовательностью в клетке; (iii) вторую направляющую РНК, способную гибридизироваться с одной или несколькими целевыми последовательностями в векторе, который кодирует фермент CRISPR; (iv) по меньшей мере одну парную tracr-последовательность и (v) по меньшей мере одну tracr-последовательность. В первом и втором комплексах можно использовать одинаковые tracr и парную tracr, отличающиеся при этом лишь по направляющей последовательности, где при экспрессии в клетке первая направляющая РНК управляет специфическим к последовательности связыванием первого комплекса CRISPR с последовательностью в клетке; вторая направляющая РНК управляет специфическим к последовательности связыванием второго комплекса CRISPR с целевой последовательностью в векторе, который кодирует фермент CRISPR; при этом комплексы CRISPR содержат (a) парную tracr-последовательность, гибридизированную с tracr-последовательностью, а (b) фермент CRISPR связан с направляющей РНК таким образом, чтобы направляющая РНК могла гибридизироваться со своей целевой последовательностью; а второй комплекс CRISPR инактивирует систему CRISPR-Cas для предупреждения дальнейшей экспрессии клеткой фермента CRISPR.

Дополнительные характеристики вектора(векторов), закодированных ферментов, направляющих последовательностей и т.д. раскрыты в других разделах данного документа. К примеру, одна или обе направляющие последовательности могут быть частью последовательности chiRNA, которая обеспечивает направляющую, парную tracr- и tracr- последовательности в единой РНК с тем, чтобы такая система могла кодировать (i) фермент CRISPR; (ii) первую chiRNA, содержащую последовательность, способную гибридизироваться с первой целевой последовательностью в клетке, первой парной tracr-последовательностью и первой tracr-последовательностью; (iii) вторую направляющую РНК, способную гибридизироваться с вектором, который кодирует фермент CRISPR, вторую парную tracr-последовательность и вторую tracr-последовательность. Проще говоря, фермент может включать в себя одну или несколько NLS и т.д.

Разные кодирующие последовательности (фермент CRISPR, направляющие РНК, tracr и парную tracr) можно ввести в отдельный вектор или во множество векторов. К примеру, возможным является кодирование фермента в одном векторе, а последовательностей разных РНК в другом векторе, или кодирование фермента и одной chiRNA в одном векторе, а остальной chiRNA в другом векторе, или любая другая комбинация. В целом предпочтительной является система, использующая всего один или два разных вектора.

При использовании множества векторов возможной является их доставка в неравных количествах, а в идеальном варианте с избытком вектора, который кодирует первую направляющую РНК, связанную со второй направляющей РНК, способствуя тем самым задержке конечной инактивации системы CRISPR до момента прохождения редактирования генома.

Первая направляющая РНК может целенаправленно воздействовать на любую представляющую интерес целевую последовательность в геноме, что описано в других частях в данном документе. Вторая направляющая РНК целенаправленно воздействует на любую последовательность в векторе, который кодирует фермент CRISPR Cas9, и тем самым инактивирует экспрессию фермента, обусловленную данным вектором. Таким образом, целевая последовательность в векторе должна быть способна к инактивации экспрессии. Подходящие целевые последовательности могут находиться, например, рядом с инициирующим трансляцию стартовым кодоном кодирующей последовательности Cas9 или в его пределах, в некодирующей последовательности в промоторе, управляющем экспрессией элементов некодирующей РНК, в пределах промотора, управляющего экспрессией гена Cas9, в пределах 100 п. о. инициирующего трансляцию стартового ATG-кодона в кодирующей последовательности Cas9 и/или в пределах инвертированного концевого повтора (iTR) вирусного вектора для доставки, например, в геноме AAV. Двухнитевой разрыв рядом с данным участком может индуцировать сдвиг рамки в кодирующей последовательности Cas9, вызывая потерю экспрессии белка. Альтернативой целевой последовательности для "самоинактивирующейся" направляющей РНК было бы нацеливание на редактирование/инактивацию регуляторных участков/ последовательностей, которые необходимы для экспрессии системы CRISPR-Cas9 или для стабильности вектора. К примеру, если нарушена структура промотора для кодирующей последовательности Cas9, тогда транскрипция будет подавляться или предупреждаться. Проще говоря, если вектор включает в себя последовательности, обеспечивающие репликацию, поддержание или стабильность, тогда можно целенаправленно воздействовать на эти последовательности. К примеру, в векторе на основе AAV приемлемая целевая последовательность находится в пределах iTR. Другими приемлемыми для нацеливания последовательностями могут быть промоторные последовательности, сайты полиаденилирования и т.д.

Более того, если направляющие РНК экспрессируются в формате массива, тогда "самоинактивирующиеся" направляющие РНК, целенаправленно воздействующие одновременно на оба промотора, в результате приведут к вырезанию вставочных нуклеотидов в пределах экспрессионной конструкции CRISPR-Cas, вызывая фактически полную инактивацию. Проще говоря, вырезание вставочных нуклеотидов будет являться результатом целенаправленного воздействия направляющих РНК на оба ITR или одновременного целенаправленного воздействия на два или более компонентов CRISPR-Cas. Как поясняется в данном документе, самоинактивация в целом применима с системами CRISPR-Cas9 для обеспечения регуляции CRISPR-Cas9. Например, как поясняется в данном документе, самоинактивацию можно задействовать для CRISPR-опосредованной репарации мутаций, например, нарушений, обусловленных экспансией, как поясняется в данном документе. Результат такой самоинактивации заключается во временной активности CRISPR-опосредованной репарации.

Добавление не воздействующих целенаправленно нуклеотидов к 5'-концу (например, 1-10 нуклеотидов, предпочтительно 1-5 нуклеотидов) "самоинактивирующиейся" направляющей РНК можно использовать для задержки ее процессирования и/или изменения ее эффективности в качестве средства для обеспечения редактирования в целевом локусе генома перед выключением CRISPR-Cas9.

В одном аспекте самоинактивирующейся системы AAV-CRISPR-Cas9 плазмиды, которые совместно экспрессируют одну или несколько sgRNA, целенаправленно воздействующих на представляющие интерес последовательности в геноме (например, 1-2, 1-5, 1-10, 1 -15, 1-20, 1-30), можно создавать с "самоинактивирующимися" sgRNA, которые целенаправленно воздействуют на последовательность SpCas9 в сконструированном стартовом ATG-сайте или рядом с ним (например, в пределах 5 нуклеотидов, в пределах 15 нуклеотидов, в пределах 30 нуклеотидов, в пределах 50 нуклеотидов, в пределах 100 нуклеотидов). На регуляторную последовательность в участке промотора U6 также можно целенаправленно воздействовать с помощью sgRNA. U6-контролируемые sgRNA можно сконструировать в формате массива с тем, чтобы одновременно могло высвобождаться множество последовательностей sgRNA. При первичной доставке в целевые ткань/клетки (клетка слева) sgRNA начинают накапливаться, тогда как в ядре уровни Cas9 повышаются. Cas9 объединяется в комплексы со всеми sgRNA для опосредования редактирования генома и самоинактивации плазмид, несущих CRISPR-Cas9.

Один аспект самоинактивирующейся системы CRISPR-Cas9 представляет собой экспрессию в отдельном формате или в формате тандемного массива от 1 до 4 или более разных направляющих последовательностей; например, до приблизительно 20 или приблизительно 30 направляющих последовательностей. Каждая отдельная самоинактивирующаяся направляющая последовательность может целенаправленно воздействовать на разные мишени. Такие последовательности могут процессироваться, например, из транскрипта одной химерной pol3. Можно применять промоторы рol3, такие как промоторы U6 или H1. Промоторы рol2 упомянуты во всем данном документе. Последовательности с инвертированными терминальными повторами (iTR) могут фланкировать промотор Pol3 - sgRNA - промотор Pol2 - Cas9.

В одном аспекте химерный транскрипт в формате тандема представляет собой одну или несколько направляющих последовательностей, которые редактируют одну или несколько мишеней, тогда как одна или несколько самоинактивирующихся направляющих последовательностей инактивируют систему CRISPR/Cas9. Таким образом, например, описываемая система CRISPR-Cas9 для репарации нарушений, обусловленных экспансией, можно непосредственно объединять с самоинактивирующейся системой CRISPR-Cas9, описанной в данном документе. Такая система может, например, иметь две направляющие последовательности, направленные на целевой участок для репарации, а также по меньшей мере третью направляющую последовательность, управляющую самоинактивацией CRISPR-Cas9. Ссылаются на заявку с порядковым № PCT/US2014/069897 под названием "Композиции и способы применения систем CRISPR-Cas при связанных с нуклеотидными повторами нарушениях", опубликованную 12 декабря 2014 г. как WO/2015/089351.

Наборы

В одном аспекте настоящее изобретение относится к наборам, содержащим любой один или несколько из элементов, раскрытых в приведенных выше способах и композициях. Элементы могут быть предоставлены отдельно или в комбинациях и могут быть предоставлены в любом подходящем контейнере, как, например, ампуле, флаконе или пробирке. В некоторых вариантах осуществления набор включает инструкции на одном или нескольких языках, например на нескольких языках.

В некоторых вариантах осуществления набор содержит один или несколько реагентов для применения в способе, в котором используется один или несколько элементов, описанных в данном документе. Реагенты могут быть предоставлены в любом подходящем контейнере. Например, набор может предусматривать один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, которая применима в конкретном анализе, или в форме, которая предусматривает добавление одного или нескольких других компонентов перед применением (например, в форме концентрата или лиофилизированной форме). Буфер может быть любым буфером, в том числе без ограничения буфером с карбонатом натрия, буфером с бикарбонатом натрия, боратным буфером, Tris-буфером, буфером MOPS, буфером HEPES и их комбинациями. В некоторых вариантах осуществления буфер является щелочным. В некоторых вариантах осуществления буфер имеет значение pH от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для встраивания в вектор, чтобы функционально связать направляющую последовательность и регуляторный элемент. В некоторых вариантах осуществления набор содержит матричный полинуклеотид для гомологичной рекомбинации. В некоторых вариантах осуществления набор содержит один или несколько векторов и/или один или несколько полинуклеотидов, описанных в данном документе. Преимущественно набор может предоставлять все элементы систем по настоящему изобретению.

Системы нацеливания на нуклеиновую кислоту и способы

Термин "система нацеливания на нуклеиновую кислоту", где нуклеиновая кислота представляет собой ДНК или РНК, а в некоторых аспектах также может являться гибридами ДНК-РНК или их производными, в собирательном значении относится к транскриптам и другим элементам, вовлеченным в экспрессию или управляющим активностью генов, ассоциированных с нацеливающимся на ДНК или РНК CRISPR ("Cas"), которые могут включать в себя последовательности, кодирующие нацеливающийся на ДНК или РНК белок Cas и нацеливающуюся на ДНК или РНК направляющую РНК, содержащую последовательность РНК CRISPR (crRNA), и (в некоторых, но не во всех системах) последовательность трансактивирующей РНК системы CRISPR/Cas (tracrRNA), или другие последовательности и транскрипты из локуса нацеливающегося на ДНК или РНК CRISPR. Как правило, система нацеливания на РНК характеризуется элементами, которые способствуют образованию комплекса нацеливания на ДНК или РНК в сайте целевой последовательности ДНК или РНК. В контексте образования комплекса нацеливания на ДНК или РНК "целевая последовательность" относится к последовательности ДНК или РНК, по отношению к которой нацеливающаяся на ДНК или РНК направляющая РНК сконструирована так, чтобы обладать комплементарностью, при этом гибридизация между целевой последовательностью и нацеливающейся на РНК направляющей РНК способствует образованию комплекса нацеливания на РНК. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки.

В одном аспекте настоящего изобретения новые нацеливающиеся на ДНК системы, также называемые нацеливающимся на ДНК CRISPR/нацеливающейся на ДНК системой Cas или CRISPR-Cas в соответствии с настоящей заявкой, основываются на идентифицированных белках Cas9, для которых не требуется получение индивидуализированных белков для целенаправленного воздействия на конкретные последовательности ДНК, но скорее один эффекторный белок или фермент может быть запрограммирован молекулой РНК для распознавания определенной мишени ДНК, другими словами, фермент может связываться с определенной мишенью ДНК с помощью указанной молекулы РНК. Аспекты настоящего изобретения, в частности, относятся к нацеливающимся на ДНК направляемым РНК системам CRISPR SpCas9.

В одном аспекте настоящего изобретения предусмотрены способы применения одного или нескольких элементов системы нацеливания на нуклеиновую кислоту. Комплекс нацеливания на нуклеиновую кислоту по настоящему изобретению обеспечивает эффективное средство для модифицирования целевой ДНК или РНК (одно- или двухнитевой, линейной или сверхспирализированной). Комплекс нацеливания на нуклеиновую кислоту по настоящему изобретению обладает широкой применимостью, включая модифицирование (например, осуществление делеции, встраивания, транслокации, инактивации, активации) целевой ДНК или РНК во множестве типов клеток. Как таковой комплекс нацеливания на нуклеиновую кислоту в соответствии с настоящим изобретением имеет широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Типичный комплекс нацеливания на нуклеиновую кислоту содержит нацеливающийся на ДНК или РНК эффекторный белок, образующий комплекс с направляющей РНК, гибридизированной с целевой последовательностью в целевом представляющем интерес локусе.

Нацеливающиеся на нуклеиновую кислоту системы, векторные системы, векторы и композиции, описываемые в данном документе, можно применять в различных нацеливающихся на нуклеиновую кислоту применениях, изменяющем или модифицирующем синтезе генного продукта, такого как белок, расщеплении нуклеиновых кислот, редактировании нуклеиновых кислот, сплайсинге нуклеиновых кислот; обороте целевых нуклеиновых кислот, отслеживании целевых нуклеиновых кислот, выделении целевых нуклеиновых кислот, визуализации целевых нуклеиновых кислот и т.д.

Аспекты настоящего изобретения также охватывают способы и варианты применения композиций и систем, описываемых в данном документе, в конструировании генома, например, для изменения или манипуляции с экспрессией одного или нескольких генов или одного или нескольких продуктов генов в прокариотических или эукариотических клетках in vitro, in vivo или ex vivo.

В одном варианте осуществления настоящее изобретение относится к способу расщепления целевой ДНК. Способ может включать модификацию целевой ДНК с использованием комплекса нацеливания на нуклеиновую кислоту, который связывается с целевой ДНК и осуществляет расщепление указанной целевой ДНК. В одном варианте осуществления комплекс нацеливания на нуклеиновую кислоту в соответствии с настоящим изобретением при введении в клетку может образовывать разрыв (например, одно- или двухнитевой разрыв) в последовательности РНК. Например, способ можно применять для расщепления РНК, ответственной за развитие заболевания, в клетке. Например, в клетку может быть введена экзогенная РНК-матрица, содержащая последовательность, подлежащую интеграции, фланкированную последовательностью, расположенной выше, и последовательностью, расположенной ниже. Последовательности, расположенные выше и ниже, характеризуются сходством последовательности с каждой стороной сайта интеграции в РНК. При необходимости донорной РНК может быть мРНК. Экзогенная РНК-матрица содержит последовательность, подлежащую интеграции (например, мутированную РНК). Последовательность, предназначенная для интеграции, может представлять собой последовательность, эндогенную или экзогенную по отношению к клетке. Примеры последовательности, подлежащей интеграции, включают в себя РНК, кодирующую белок, или некодирующую РНК (например, microRNA). Таким образом, последовательность, предназначенная для интеграции, может быть функционально связанной с соответствующей регуляторной последовательностью или соответствующими регуляторными последовательностями. Альтернативно последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию. Последовательности, расположенные выше и ниже в экзогенной РНК-матрице, выбирают таким образом, чтобы способствовать рекомбинации между последовательностью РНК, представляющей интерес, и донорной РНК. Последовательность, расположенная выше, представляет собой последовательность РНК, которая обладает сходством последовательности с последовательностью РНК, расположенной выше подвергаемого нацеливанию сайта интеграции. Аналогично, последовательность, расположенная ниже, представляет собой последовательность РНК, которая обладает сходством последовательности с последовательностью РНК, расположенной ниже подвергаемого нацеливанию сайта интеграции. Последовательности, расположенные выше и ниже в экзогенной РНК-матрице, могут характеризоваться 75%, 80%, 85%, 90%, 95% или 100% идентичностью последовательности с подвергаемой нацеливанию последовательностью РНК. Предпочтительно, последовательности, расположенные выше и ниже в экзогенной РНК-матрице, характеризуются приблизительно 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с подвергаемой нацеливанию последовательностью РНК. В некоторых способах последовательности, расположенные выше и ниже в экзогенной РНК-матрице, характеризуются приблизительно 99% или 100% идентичностью последовательности с подвергаемой нацеливанию последовательностью РНК. Последовательность, расположенная выше или ниже, может содержать от приблизительно 20 п.о. до приблизительно 2500 п.о., например приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п.о. В некоторых способах иллюстративная последовательность, расположенная выше или ниже, имеет от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 600 п.о. до приблизительно 1000 п.о. или, более конкретно, от приблизительно 700 п.о. до приблизительно 1000 п.о. В некоторых способах экзогенная РНК-матрица может дополнительно содержать маркер. Такой маркер может облегчать скрининг в отношении подвергаемых нацеливанию интеграций. Примеры подходящих маркеров включают сайты рестрикции, флуоресцентные белки или селектируемые маркеры. Экзогенную РНК-матрицу по настоящему изобретению можно сконструировать с применением методик рекомбинации (см., например, Sambrook et al., 2001, и Ausubel et al., 1996). В способе модифицирования целевой ДНК путем интеграции экзогенной ДНК-матрицы разрыв (например, двух- или однонитевой разрыв) вводят в последовательность ДНК с помощью нацеливающегося на нуклеиновую кислоту комплекса, осуществляют репарацию разрыва посредством гомологичной рекомбинации с участием экзогенной матричной ДНК так, что матрица интегрируется в целевую ДНК. Наличие двухнитевого разрыва обеспечивает интеграцию матрицы. В других вариантах осуществления настоящее изобретение относится к способу модификации экспрессии РНК в эукариотической клетке. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью комплекса нацеливания на нуклеиновую кислоту, который связывается с кодирующей ДНК РНК (например, мРНК или пре-мРНК). В некоторых способах целевую ДНК можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания нацеливающегося на ДНК комплекса с целевой последовательностью в клетке целевая ДНК инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или микроРНК, может быть инактивирована, вследствие чего не образуется белок, или microRNA или транскрипт pre-microRNA. Целевой ДНК нацеливающегося на ДНК комплекса может быть любая ДНК, эндогенная или экзогенная по отношению к эукариотической клетке. Например, целевой ДНК может быть ДНК, находящаяся в ядре эукариотической клетки. Целевой ДНК может быть последовательность, кодирующая продукт гена (например, мРНК или пре-мРНК), кодирующая продукт гена (например, белок) или некодирующая последовательность (например, ncRNA, lncRNA, tRNA или rRNA). Примеры целевой ДНК включают в себя последовательность, ассоциированную с биохимическим путем передачи сигнала, например, ДНК, ассоциированную с биохимическим путем передачи сигнала. Примеры целевой ДНК включают в себя ассоциированную с заболеванием ДНК. "Ассоциированная с заболеванием" ДНК обозначает любую ДНК, которая обеспечивает продукты транскрипции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ДНК, транскрибированная с гена, который начинает экспрессироваться при аномально высоком уровне; это может быть ДНК, транскрибированная с гена, который начинает экспрессироваться при аномально низком уровне, где измененная экспрессия коррелирует с появлением и/или прогрессированием заболевания. Ассоциированная с заболеванием ДНК также означает ДНК, транскрибированную с гена, несущего мутацию(мутации) или генетическую вариацию, который является непосредственно ответственным или находится в неравновесном сцеплении с геном(ами), ответственным за этиологию заболевания. Транслированные продукты могут быть известны или неизвестны и могут присутствовать на нормальном или аномальном уровне. Целевой ДНК нацеливающегося на ДНК комплекса может быть любая ДНК, эндогенная или экзогенная по отношению к эукариотической клетке. Например, целевой ДНК может быть ДНК, находящаяся в ядре эукариотической клетки. Целевой ДНК может быть последовательность, кодирующая продукт гена (например, мРНК, пре-мРНК, белок), или некодирующая последовательность (например, ncRNA, lncRNA, tRNA или rRNA).

В некоторых вариантах осуществления способ может включать обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с целевой ДНК для осуществления расщепления указанной целевой ДНК, за счет чего обеспечивается модифицирование целевой ДНК, где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК, гибридизированной с целевой последовательностью в пределах указанной целевой ДНК. В одном аспекте настоящее изобретение относится к способу модицификации экспрессии ДНК или РНК в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с ДНК так, что указанное связывание приводит к повышенной или сниженной экспрессии указанной ДНК; где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК. Аналогичные соображения и условия распространяются на способы модифицирования целевой ДНК, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения. В одном аспекте настоящее изобретение относится к способам модификации целевой ДНК в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.

Действительно, в любом аспекте настоящего изобретения комплекс нацеливания на нуклеиновую кислоту может содержать эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК, гибридизированной с целевой последовательностью.

Настоящее изобретение относится к конструированию и оптимизации систем, способов и композиций, используемых для контроля экспрессии гена, предусматривающих нацеливание на последовательность ДНК, которые относятся к системе нацеливания на нуклеиновую кислоту и ее компонентам. Преимущество способов по настоящему изобретению заключается в том, что система CRISPR сводит к минимуму или исключает нецелевое связывание и возникающие в результате этого побочные эффекты. Это достигается при использовании систем, предусматривающих наличие высокой степени специфичности к последовательности в отношении целевой ДНК.

Что касается комплекса или системы нацеливания на нуклеиновую кислоту, предпочтительно, чтобы tracr-последовательность имела одну или несколько шпилек и имела длину 30 или более нуклеотидов, 40 или более нуклеотидов или 50 или более нуклеотидов; при этом последовательность crRNA имеет длину от 10 до 30 нуклеотидов, эффекторный белок для нацеливания на нуклеиновую кислоту представляет собой эффекторный белок Cas9 II типа.

Редактирование и модификация

В одном аспекте настоящее изобретение относится к способам применения одного или нескольких элементов системы CRISPR. Комплекс CRISPR по настоящему изобретению обеспечивает эффективные средства модифицирования целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению обладает широкой применимостью, включая модифицирование (например, осуществление делеции, встраивания, транслокации, инактивации, активации) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в целевом полинуклеотиде. В определенных вариантах осуществления последовательность прямого повтора связана с направляющей последовательностью.

Расщепление и репарация ДНК

Способ включает модификацию целевого полинуклеотида с применением комплекса CRISPR, который связывается с целевым полинуклеотидом и осуществляет расщепление указанного целевого полинуклеотида. Как правило, комплекс CRISPR по настоящему изобретению при введении в клетку создает разрыв (например, однонитевой или двухнитевой разрыв) в геномной последовательности. Например, способ можно применять для расщепления гена, ответственного за развитие заболевания, в клетке. Репарация разрыва, созданного комплексом CRISPR, может осуществляться посредством процесса репарации, например, путем склонного к ошибкам негомологичного соединения концов (NHEJ) или высокоточной репарации с участием гомологичной рекомбинации (HDR). В ходе данного процесса репарации в геномную последовательность может быть введен экзогенный матричный полинуклеотид. В некоторых способах процесс HDR используют для модификации геномной последовательности. Например, в клетку вводят экзогенный матричный полинуклеотид, содержащий последовательность, подлежащую интеграции, фланкированную последовательностью, расположенной выше, и последовательностью, расположенной ниже. Последовательности, расположенные выше и ниже, характеризуются сходством последовательности с каждой стороной сайта интеграции в хромосоме. При необходимости донорный полинуклеотид может представлять собой ДНК, например плазмидную ДНК, бактериальную искусственную хромосому (BAC), искусственную хромосому дрожжей (YAC), вирусный вектор, линейный фрагмент ДНК, ПЦР-фрагмент, "оголенную" нуклеиновую кислоту или нуклеиновую кислоту в комплексе со средством доставки, таким как липосома или полоксамер. Экзогенный матричный полинуклеотид содержит последовательность, подлежащую интеграции (например, мутированный ген). Последовательность, предназначенная для интеграции, может представлять собой последовательность, эндогенную или экзогенную по отношению к клетке. Примеры последовательности, подлежащей интеграции, включают полинуклеотиды, кодирующие белок или некодирующую РНК (например, microRNA). Таким образом, последовательность, предназначенная для интеграции, может быть функционально связанной с соответствующей регуляторной последовательностью или соответствующими регуляторными последовательностями. Альтернативно последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, выбирают таким образом, чтобы способствовать рекомбинации между хромосомной последовательностью, представляющей интерес, и донорным полинуклеотидом. Последовательность, расположенная выше, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с геномной последовательностью, расположенной выше подвергаемого нацеливанию сайта интеграции. Аналогично, последовательность, расположенная ниже, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с хромосомной последовательностью, расположенной ниже подвергаемого нацеливанию сайта интеграции. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, могут характеризоваться 75%, 80%, 85%, 90%, 95% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, предпочтительно характеризуются 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. В некоторых способах последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, характеризуются приблизительно 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. Последовательность, расположенная выше или ниже, может содержать от приблизительно 20 п.о. до приблизительно 2500 п.о., например приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п.о. В некоторых способах иллюстративная последовательность, расположенная выше или ниже, имеет от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 600 п.о. до приблизительно 1000 п.о. или, более конкретно, от приблизительно 700 п.о. до приблизительно 1000 п.о. В некоторых способах экзогенный матричный полинуклеотид может дополнительно содержать маркер. Такой маркер может облегчать скрининг в отношении подвергаемых нацеливанию интеграций. Примеры подходящих маркеров включают сайты рестрикции, флуоресцентные белки или селектируемые маркеры. Экзогенный матричный полинуклеотид согласно настоящему изобретению можно сконструировать с применением методик рекомбинантной ДНК (см., например, Sambrook et al., 2001 и Ausubel et al., 1996). В способе модифицирования целевого полинуклеотида посредством интеграции экзогенного матричного полинуклеотида в геномную последовательность вводят двухнитевой разрыв с помощью комплекса CRISPR, осуществляют репарацию разрыва посредством гомологичной рекомбинации с участием экзогенного матричного полинуклеотида, так что матрица интегрируется в геном. Наличие двухнитевого разрыва обеспечивает интеграцию матрицы. В других вариантах осуществления настоящее изобретение относится к способу модификации экспрессии полинуклеотида в эукариотической клетке. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью комплекса CRISPR, который связывается с полинуклеотидом. В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или микроРНК, может быть инактивирована, вследствие чего не образуется белок, или microRNA или транскрипт pre-microRNA. В некоторых способах регуляторную последовательность можно инактивировать, так что она больше не функционирует в качестве регуляторной последовательности. Используемое в данном документе выражение "регуляторная последовательность" относится к любой последовательности нуклеиновой кислоты, которая оказывает влияние на транскрипцию, трансляцию или доступность последовательности нуклеиновой кислоты. Примеры регуляторной последовательности включают промотор, терминатор транскрипции и энхансер, которые являются регуляторными последовательностями. Целевым полинуклеотидом для комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическим путем передачи сигнала, к примеру, ген или полинуклеотид, ассоциированный с биохимическим путем передачи сигнала. Примеры целевых полинуклеотидов включают ассоциированный с заболеванием ген или полинуклеотид. "Ассоциированный с заболеванием" ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при аномально высоком уровне; это может быть ген, который начинает экспрессироваться при аномально низком уровне, где измененная экспрессия коррелирует с появлением и/или прогрессированием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию(мутации) или генетическую вариацию, который непосредственно ответственен или находится в неравновесном сцеплении с геном(генами), ответственным(ответственными) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут присутствовать на нормальном или аномальном уровне. Целевым полинуклеотидом для комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК).

Редактирование генов или изменение целевого локуса с помощью Cas9; HDR и матриц

Двухнитевой разрыв или однонитевой разрыв в одной из нитей преимущественно должен находиться достаточно близко к целевому положению так, чтобы происходила коррекция. В одном варианте осуществления расстояние составляет не более 50, 100, 200, 300, 350 или 400 нуклеотидов. Без ограничения какой-либо теорией, полагают, что разрыв должен находиться достаточно близко к целевому положению, так чтобы разрыв находился в участке, который подвергается опосредованному экзонуклеазой удалению в ходе конечной резекции. Если расстояние между целевым положением и разрывом слишком большое, то мутация не может быть включена в конечную резекцию и, поэтому, не может быть исправлена, поскольку только последовательность матричной нуклеиновой кислоты может быть использована для коррекции последовательности в участке конечной резекции.

В одном варианте осуществления, при котором направляющая РНК и молекула II типа, в частности Cas9 или его ортолог или гомолог, предпочтительно нуклеаза Cas9, индуцируют двухнитевой разрыв с целью индуцирования опосредованной HDR коррекции, сайт расщепления находится на расстоянии 0-200 п.о. (например, 0-175, 0-150, 0-125, 0-100, 0-75, 0-50, 0-25, 25-200, 25-175, 25-150, 25-125, 25-100, 25-75, 25-50, 50-200, 50-175, 50-150, 50-125, 50-100, 50-75, 75-200, 75-175, 75-150, 75-125, 75-100 п.о.) от целевого положения. В одном варианте осуществления сайт расщепления находится на расстоянии 0-100 п.о. (например, 0-75, 0-50, 0-25, 25-100, 25-75, 25-50, 50-100, 50-75 или 75-100 п.о.) от целевого положения. В дополнительном варианте осуществления две или более направляющих РНК, образующих комплекс с Cas9 или его ортологом или гомологом, можно применять для индуцирования мультиплексных разрывов для индуцирования опосредованной HDR коррекции.

Гомологическое плечо должно протягиваться по меньшей мере до участка, в котором может произойти конечная резекция, например, чтобы позволить резецированному однонитевому "липкому" концу находить комплементарный участок в донорной матрице. Вся длина может быть ограничена параметрами, такими как размер плазмиды или пределы упаковки вируса. В одном варианте осуществления гомологическое плечо может не протягиваться до повторяющихся элементов. Типичная длина гомологического плеча составляет по меньшей мере 50, 100, 250, 500, 750 или 1000 нуклеотидов.

Целевое положение, как используется в данном документе, относится к сайту в целевой нуклеиновой кислоте или целевом гене (например, хромосоме), который модифицирован зависимым от Cas9 II типа, в частности Cas9 или его ортолога или гомолога, предпочтительно молекулы Cas9, процессом. Например, целевым положением может быть модифицированное расщепление молекулой Cas9 целевой нуклеиновой кислоты и модификация, направленная на матричную нуклеиновую кислоту, например, коррекция целевого положения. В одном варианте осуществления целевым положением может быть сайт между двумя нуклеотидами, например, смежными нуклеотидами, в целевой нуклеиновой кислоте, в который добавляют один или несколько нуклеотидов. Целевое положение может содержать один или несколько нуклеотидов, которые изменяются, например, корректируются, матричной нуклеиновой кислотой. В одном варианте осуществления целевое положение находится в целевой последовательности (например, в последовательности, с которой связывается направляющая РНК). В одном варианте осуществления целевое положение находится выше или ниже целевой последовательности (например, последовательности, с которой связывается направляющая РНК).

Матричная нуклеиновая кислота, как данный термин используется в данном документе, относится к последовательности нуклеиновой кислоты, которую можно применять в сочетании с молекулой II типа, в частности с Cas9 или его ортологом или гомологом, предпочтительно с молекулой Cas9 и молекулой направляющей РНК для изменения структуры целевого положения. В одном варианте осуществления целевую нуклеиновую кислоту модифицируют для обеспечения некоторой части или всей последовательности матричной нуклеиновой кислоты, как правило, в сайте(сайтах) расщепления или рядом с таковым(таковыми). В одном варианте осуществления матричная нуклеиновая кислота является однонитевой. В альтернативном варианте осуществления матричная нуклеиновая кислота является двухнитевой. В одном варианте осуществления матричной нуклеиновой кислотой является ДНК, например, двухнитевая ДНК. В альтернативном варианте осуществления матричная нуклеиновая кислота является однонитевой.

В одном варианте осуществления матричная нуклеиновая кислота изменяет структуру целевого положения путем участия в гомологичной рекомбинации. В одном варианте осуществления матричная нуклеиновая кислота изменяет последовательность целевого положения. В одном варианте осуществления матричная нуклеиновая кислота приводит к включению модифицированного или не встречающегося в природе основания в целевую нуклеиновую кислоту.

Матричная последовательность может подвергаться опосредованной или катализируемой разрывом рекомбинации с целевой последовательностью. В одном варианте осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая соответствует сайту в целевой последовательности, который расщепляется путем опосредованного Cas9 преобразования с расщеплением. В одном варианте осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая соответствует как первому сайту в целевой последовательности, который расщепляется при первом опосредованном Cas9 событии, так и второму сайту в целевой последовательности, который расщепляется при втором опосредованном Cas9 событии.

В определенных вариантах осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая приводит к изменению в кодирующей последовательности транслируемой последовательности, например, последовательность, которая приводит к замене одной аминокислоты на другую в белковом продукте, например, с трансформированием мутантного аллеля в аллель дикого типа, с трансформированием аллеля дикого типа в мутантный аллелль, и/или к введению стоп-кодона, вставки аминокислотного остатка, делеции аминокислотного остатка или нонсенс-мутации. В определенных вариантах осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая приводит к изменению в некодирующей последовательности, например, к изменению в экзоне или в 5'- или 3'-нетранслируемом или нетранскрибируемом участке. Такие изменения включают в себя изменение в контрольном элементе, например, в промоторе, энхансере, и изменение в цис-действующем или транс-действующем контрольном элементе.

Матричную нуклеиновую кислоту, обладающую гомологичностью с целевым положением в целевом гене, можно применять для изменения структуры целевой последовательности. Матричную последовательность можно применять для изменения нежелательной структуры, например, нежелательного или мутантного нуклеотида. Матричная нуклеиновая кислота может включать в себя последовательность, которая при интегрировании приводит к снижению активности положительного контрольного элемента; повышению активности положительного контрольного элемента; снижению активности отрицательного контрольного элемента; повышению активности негативного контрольного элемента; снижению экспрессии гена; повышению экспрессии гена; повышению устойчивости к нарушению или заболеванию; повышению устойчивости к проникновению вируса; исправлению мутации или изменению нежелательного аминокислотного остатка, обеспечению, усилению, отмене или снижению биологического свойства продукта гена, например, повышению ферментативной активности фермента, или усилению способности продукта гена взаимодействовать с другой молекулой.

Матричная нуклеиновая кислота может включать в себя последовательность, которая приводит к изменению в последовательности 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более нуклеотидов целевой последовательности. В одном варианте осуществления матричная нуклеиновая кислота может иметь длину 20 +/-10, 30 +/-10, 40 +/-10, 50 +/-10, 60 +/-10, 70 +/-10, 80 +/-10, 90 +/-10, 100 +/-10, 110 +/-10, 120 +/-10, 130 +/-10, 140 +/-10, 150 +/-10, 160 +/-10, 170 +/-10, 180 +/-10, 190 +/-10, 200 +/-10, 210 +/-10 или 220+/-10 нуклеотидов. В одном варианте осуществления матричная нуклеиновая кислота может иметь длину 30 +/-20, 40 +/-20, 50 +/-20, 60 +/-20, 70 +/-20, 80 +/-20, 90 +/-20, 100 +/-20, 110 +/-20, 120 +/-20, 130 +/-20, 140 +/-20, 150 +/-20, 160 +/-20, 170 +/-20, 180 +/-20, 190 +/-20, 200 +/-20, 210 +/-20 или 220 +/-20 нуклеотидов. В одном варианте осуществления матричная нуклеиновая кислота имеет длину 10-1000, 20-900, 30-800, 40-700, 50-600, 50-500, 50-400, 50-300, 50-200 или 50-100 нуклеотидов.

Матричная нуклеиновая кислота содержит следующие компоненты: [5'-гомологичное плечо]-[последовательность замены]-[3'-гомологичное плечо]. Гомологичные плечи обеспечивают рекомбинацию в хромосоме, замещая таким образом нежелательный элемент, например, мутацию или сигнатуру, последовательностью замены. В одном варианте осуществления гомологичные плечи фланкируют наиболее дистальные сайты расщепления. В варианте осуществления 3'-конец 5'-гомологичного плеча представляет собой положение рядом с 5'-концом последовательности замены. В одном варианте осуществления 5'-гомологичное плечо может протягиваться по меньшей мере на 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500 или 2000 нуклеотидов 5' от 5'-конца последовательности замены. В варианте осуществления 5'-конец 3'-гомологичного плеча представляет собой положение рядом с 3'-концом последовательностью замены. В варианте осуществления 3'-гомологичное плечо может протягиваться по меньшей мере на 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500 или 2000 нуклеотидов 3' от 3'-конца последовательности замены.

В определенных вариантах осуществления одно или оба гомологичных плеча могут быть укорочены, чтобы избежать включения некоторых повторяющихся элементов последовательности. Например, 5'-гомологичное плечо может быть укорочено, чтобы избежать повторяющегося элемента последовательности. В других вариантах осуществления 3'-гомологичное плечо может быть укорочено, чтобы избежать повторяющегося элемента последовательности. В некоторых вариантах осуществления оба 5'- и 3'-гомологичных плеча могут быть укорочены, чтобы избежать включения некоторых повторяющихся элементов последовательности.

В определенных вариантах осуществления матричные нуклеиновые кислоты для коррекции мутации можно разработать для применения в качестве однонитевого олигонуклеотида. При использовании однонитевого олигонуклеотида длина 5'- и 3'-гомологичных плеч может варьировать до приблизительно 200 пар оснований (п.о.), например, может составлять по меньшей мере 25, 50, 75, 100, 125, 150, 175 или 200 п.о.

Репарация ДНК и NHEJ

В определенных вариантах осуществления индуцируемое нуклеазой негомологичное соединение концов (NHEJ) может быть использовано для целевых ген-специфических нокаутов. Индуцируемое нуклеазой NHEJ также может быть использовано для удаления (например, делеции) последовательности в представляющем интерес гене. Как правило, NHEJ репарирует двухнитевой разрыв в ДНК путем соединения двух концов вместе; однако, как правило, оригинальная последовательность восстанавливается, только если два совместимых конца, точно так же, как если бы они были образованы двухнитевым разрывом, лигированы в полной мере. Концы ДНК двухнитевого разрыва зачастую подвергаются ферментативному процессированию, что приводит к добавлению или удалению нуклеотидов на одной или обеих нитях перед повторным соединением концов. Это приводит в результате к наличию вставочных и/или делеционных (инсерционно-делеционных) мутаций в последовательности ДНК на сайте репарации путем NHEJ. Две третьих таких мутаций, как правило, изменяют рамку считывания и, поэтому, продуцируют нефункциональный белок. Кроме того, мутации, которые сохраняют рамку считывания, но которые вставляют или удаляют значительную часть последовательности, могут нарушать функциональность белка. Это зависит от локуса, поскольку мутации в критических функциональных доменах, вероятно, менее переносимы, чем мутации в некритических участках белка. Мутации по типу вставок/делеций, созданные NHEJ, непредсказуемы по своей природе; однако на данном сайте разрыва некоторые инсерционно-делеционные последовательности являются предпочтительными и чрезмерно представлены в популяции, вероятно, из-за небольших областей микрогомологии. Длины делеций могут широко варьировать; чаще всего в диапазоне 1-50 п.о., но они могут свободно превысить 50 п.о., например, они могут свободно достичь более чем приблизительно 100-200 п.о. Вставки, как правило, короче и зачастую включают в себя короткие повторы последовательностей, непосредственно окружающие сайт разрыва. Однако можно получить крупные вставки, и в этих случаях вставленная последовательность часто проходит к другим областям генома или к плазмидной ДНК, присутствующей в клетках.

Поскольку NHEJ является мутагенным процессом, оно также может быть использовано для удаления небольших мотивов последовательностей, при условии, что не требуется образование определенной финальной последовательности. Если двухнитевой разрыв намечается рядом с короткой целевой последовательностью, то мутации по типу делеции, вызванные репарацией путем NHEJ, часто охватывают и, поэтому, удаляют нежелательные нуклеотиды. Для делеции более крупных сегментов ДНК введение двух двухнитевых разрывов, по одному с каждой стороны последовательности, может приводить к NHEJ между концами с удалением всей вставочной последовательности. Оба из этих подходов могут быть использованы для удаления определенных последовательностей ДНК; однако, допускающая ошибки природа NHEJ все равно может приводить к мутациям по типу вставок/делеций в сайте репарации.

Как двухнитевую расщепляющую молекулу II типа, в частности, Cas9 или его ортолог или гомолог, предпочтительно молекулы Cas9, так и однонитевую или никазную молекулу II типа, в частности, Cas9 или его ортолог или гомолог, предпочтительно молекулы Cas9, можно применять в способах и композициях, описываемых в данном документе, для создания NHEJ-опосредованных вставок/делеций. NHEJ-опосредованные вставки/делеции, нацеленные на ген, например, кодирующий участок, например, ранний кодирующий участок представляющего интерес гена, могут быть использованы для нокаута (т.е. для устранения экспрессии) представляющего интерес гена. Например, ранний кодирующий участок представляющего интерес гена включает в себя последовательность сразу после сайта начала транскрипции, в первом экзоне кодирующей последовательности или в пределах 500 п.о. сайта начала транскрипции (например, менее 500, 450, 400, 350, 300, 250, 200, 150, 100 или 50 п.о.).

В одном варианте осуществления, в котором направляющая РНК и молекула II типа, в частности, Cas9 или его ортолог или гомолог, предпочтительно нуклеаза Cas9, образует двухнитевой разрыв для индуцирования NHEJ-опосредованных вставок/делеций, направляющая РНК может быть сконфигурирована для размещения одного двухнитевого разрыва в непосредственной близости к нуклеотиду целевого положения. В одном варианте осуществления сайт расщепление может находиться в пределах 0-500 п.о. от целевого положения (например, менее 500, 400, 300, 200, 100, 50, 40, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 п.о. от целевого положения).

В одном варианте осуществления, в котором две направляющие РНК, образующие комплекс с молекулами II типа, в частности, Cas9 или его ортологом или гомологом, предпочтительно с никазами Cas9, индуцируют два однонитевых разрыва для индуцирования NHEJ-опосредованных вставок/делеций, две направляющих РНК могут быть сконфигурированы для размещения двух однонитевых разрывов для обеспечения репарации путем NHEJ нуклеотида целевого положения.

Доставка функциональных эффекторов

В отличие от нокаута гена, опосредованного CRISPR-Cas, который окончательно устраняет экспрессию путем мутации гена на уровне ДНК, нокдаун с помощью CRISPR-Cas позволяет временно сократить экспрессию гена с использованием искусственных факторов транскрипции. Мутирующие ключевые остатки в обоих доменах расщепления ДНК белка Cas9 приводят к образованию кристаллически неактивного Cas9. Кристаллически неактивный Cas9 объединяется в комплекс с направляющей РНК и локализуется с последовательностью ДНК, определяемой этим нацеливающимся доменом направляющей РНК, однако, он не расщепляет целевую ДНК. Слияние неактивного белка Cas9 с эффекторным доменом, например, доменом подавления транскрипции, облегчает вовлечение эффектора на какой-либо сайт ДНК, определяемый направляющей РНК. В определенных вариантах осуществления Cas9 может быть слит с доменом транскрипционного подавления и вовлечен в промоторный участок гена. В частности, для подавления гена в данном документе предусматривается, что блокирование сайта связывания эндогенного фактора транскрипции будет способствовать подавлению экспрессии гена. В другом варианте осуществления неактивный Cas9 может быть слит с модифицирующим хроматин белком. Изменение состояния хроматина может приводить к пониженной экспрессии целевого гена.

В одном варианте осуществления молекула направляющей РНК может быть нацелена на известные отвечающие за транскрипцию элементы (например, промоторы, энхансеры и т.д.), известные расположенные выше активирующие последовательности и/или последовательности с неизвестной или известной функцией, которые, как предполагается, способны контролировать экспрессию целевой ДНК.

В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или microRNA, может быть инактивирована, вследствие чего белок не образуется.

В определенных вариантах осуществления фермент CRISPR содержит одну или несколько мутаций, выбранных из группы, состоящей из D917A, E1006A и D1225A, и/или одна или несколько мутаций находятся в домене RuvC фермента CRISPR или представляют собой другую мутацию, обсуждаемую в данном документе. В некоторых вариантах осуществления фермент CRISPR имеет одну или несколько мутаций в каталитическом домене, где при транскрипции последовательность прямого повтора формирует одну "петлю-на-стебле", а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен. В некоторых вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.

Функциональные эффекторы (домены)

Редактирование генов может быть выполнено с помощью Cas9 в соответствии с настоящим изобретением. Cas9 может быть инактивирован и слит с одним или несколькими функциональными доменами (эффекторами).

В некоторых вариантах осуществления функциональный домен может быть выбран из группы, состоящей из домена транспозазы, домена интегразы, домена рекомбиназы, домена резольвазы, домена инвертазы, домена протеазы, домена ДНК-метилтрансферазы, домена ДНК-гидроксилметилазы, домена ДНК-деметилазы, домена гистонацетилазы, домена гистондеацетилазы, нуклеазного домена, репрессорного домена, активаторного домена, доменов сигнала ядерной локализации, домена регуляторного белка транскрипции (или вовлечения транскрипционного комплекса), ассоциированного с активностью клеточного поглощения домена, домена связывания нуклеиновой кислоты, домена представления антитела, модифицирующих гистоны ферментов, рекрутера модифицирующих гистоны ферментов; ингибитора модифицирующих гистоны ферментов, гистонметилтрансферазы, гистондеметилазы, гистонкиназы, гистонфосфатазы, гистонрибозилазы, гистондерибозилазы, гистонубиквитиназы, гистондеубиквитиназы, гистонбиотиназы и протеазы гистонового хвоста.

В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.

Нацеливание на ген в неделящихся клетках (нейронах и мышечных)

Неделящиеся (особенно неделящиеся, полностью дифференцированные) типы клеток, в том числе мышечных клеток и особенно нейронов, представляют проблемы для нацеливания на ген или конструирование генома, например, поскольку гомологичная рекомбинация (HR), как правило, подавляется в фазе G1 клеточного цикла. Однако, исследуя механизмы контроля клетками нормальных систем репарации, Orthwein et al. сообщили о ранее неизвестном переключателе, который держит HR "выключенной" в неделящихся клетках, и они разработали стратегию включения этого переключателя. Orthwein et al. (лаборатория Daniel Durocher при Mount Sinai Hospital в Оттаве, Канада, в Nature 16142, опубликованном онлайн 9 декабря 2015 г.) показали, что подавление HR может быть отменено и нацеливание на ген успешно осуществлено в клетках как почки (293T), так и остеосаркомы (U2OS). Как известно, опухолевые супрессоры BRCA1, PALB2 и BRAC2 обеспечивают репарацию DSB ДНК с помощью HR. Они выяснили, что образование комплекса BRCA1 с PALB2-BRAC2 регулируется убиквитиновым сайтом в PALB2, например, действием на сайт убиквитинлигазой E3. Такая убиквитинлигаза E3 состоит из KEAP1 (взаимодействующего с PALB2 белка) в комплексе с циллином-3 (CUL3)-RBX1. Убиквитинилирование PALB2 подавляет его взаимодействие с BRCA1 и нейтрализуется деубиквитилазой USP11, которая сама находится под контролем клеточного цикла. Восстановление взаимодействия BRCA1-PALB2 в комбинации с активацией резекции конца ДНК является достаточным для индуцирования гомологичной рекомбинации в G1, как измерено рядом способов, в том числе анализом основанного на CRISPR-Cas9 нацеливания на ген, направленным на USP11 или KEAP1 (экспрессированные из вектора pX459). Однако, если взаимодействие BRCA1-PALB2 восстанавливалось в перенесших резекцию клетках G1 с использованием либо истощения KEAP1, либо экспрессии мутанта PALB2-KR, выявляли достоверное увеличение числа событий нацеливания на ген.

Таким образом, реактивация HR в клетках, особенно в неделящихся, полностью дифференцированных типах клеток, в том числе в мышечных клетках и особенно нейронах, является предпочтительной в некоторых вариантах осуществления. В некоторых вариантах осуществления обеспечение взаимодействия BRCA1-PALB2 является предпочтительным в некоторых вариантах осуществления. В некоторых вариантах осуществления целевой клеткой является неделящаяся клетка. В некоторых вариантах осуществления целевой клеткой является нейрон или мышечная клетка. В некоторых вариантах осуществления на целевую клетку нацеливаются in vivo. В некоторых вариантах осуществления клетка находится в G1, и HR подавляется.

В некоторых вариантах осуществления предпочтительным является применение истощения KEAP1, например, ингибирование активности экспрессии KEAP1. Истощение KEAP1 может быть достигнуто посредством siRNA, например, как показано у Orthwein et al. В качестве альтернативы, предпочтительной является экспрессия мутанта PALB2-KR (не имеющего все восемь остатков Lys в домене взаимодействия с BRCA1) либо в комбинации с истощением KEAP1, либо отдельно.

PALB2-KR взаимодействует с BRCA1 не зависимо от положения в клеточном цикле. Таким образом, обеспечение или восстановление взаимодействия BRCA1-PALB2, особенно в клетках G1, является предпочтительным в некоторых вариантах осуществления, особенно, если целевые клетки являются неделящимися, или если удаление и возвращение (ex vivo нацеливания на ген) являются проблематичными, например, в нейронных или мышечных клетках. siRNA KEAP1 является предпочтительной и доступной от ThermoFischer.

В некоторых вариантах осуществления комплекс BRCA1-PALB2 может быть доставлен в клетку G1, в виде либо белкового комплекса, слитого белка, полинуклеотидов, кодирующих BRCA1 и PALB2, либо полинуклеотидов, кодирующих слитый белок BRCA1-PALB2. Такие полинуклеотиды могут находиться под контролем подходящего промотора, например, и доставляться, как описывается в данном документе, либо одновременно и необязательно в одних и тех же векторе или векторной системе в виде белка CRISPR, либо отдельно. Другие возможности обеспечения HR в неделящихся, полностью дифференцированных типах клеток, в том числе в мышечных клетках и особенно нейронах, могут включать в себя непосредственную доставку PALB2 (с использованием Cas9, слитого с аффинной молекулой для PALB2) и/или непосредственную доставку BRCA2 (с использованием Cas9, слитого с аффинной молекулой для BRCA2).

В некоторых вариантах осуществления деубиквитилирование PALB2 может быть обеспечено, например, усиленной экспрессией или активностью деубиквитилазы USP11. Таким образом, в некоторых вариантах осуществления предусматривается, что может быть обеспечена конструкция для обеспечения или активации экспрессии или активности деубиквитилазы USP11.

Нокдаун CRL4 также может быть использован для того, чтобы сделать KEAP1 неактивным или уменьшить его активность. Например, можно использовать siRNA CRL4. Альтернативно MLN4924 (ингибитор всего CRL) также может быть использованы для инактивации KEAP1.

Особенно предпочтительным является то, что также обеспечивается нокаут 53BP, поскольку предположили, что это необходимо для активации HDR (показано у Orthwein et al). Нокаут 53BP также может быть достигнут с помощью siRNA.

Активирующая резекция ДНК (создающая "липкие" 3'-концы на любой стороне двухнитевого разрыва ДНК) также важна для активации HR при G1. Это осуществляли путем доставки ORF гена CtIP (или SAE2) с мутацией (T847E), что имитирует активирующее фосфорилирование. Заявители утверждают, что эту потребность можно обойти путем использования двойных никаз Cas9 для введения "липких" 3'-концов (Hsu et al.). Следовательно, такое применение двойных никаз Cas9 для введения "липких" 3'-концов является предпочтительным в нацеливании на неделящиеся, полностью дифференцированные типы клеток, в том числе мышечные клетки и особенно нейроны.

В одном варианте осуществления настоящее изобретение относится к способу расщепления целевого полинуклеотида. Способ включает применение комплекса CRISPR, который связывается с целевым полинуклеотидом и осуществляет расщепление указанного целевого полинуклеотида. Как правило, комплекс CRISPR по настоящему изобретению при введении в клетку создает разрыв (например, однонитевой или двухнитевой разрыв) в геномной последовательности. Например, способ можно применять для расщепления гена, ответственного за развитие заболевания, в клетке.

Репарация разрыва, созданного комплексом CRISPR, может осуществляться посредством процесса репарации, например, путем склонного к ошибкам негомологичного соединения концов (NHEJ) или высокоточной репарации с участием гомологичной рекомбинации (HDR). В ходе данного процесса репарации в геномную последовательность может быть введен экзогенный матричный полинуклеотид. В некоторых способах процесс HDR используют для модификации геномной последовательности. Например, в клетку вводят экзогенный матричный полинуклеотид, содержащий последовательность, подлежащую интеграции, фланкированную последовательностью, расположенной выше, и последовательностью, расположенной ниже. Последовательности, расположенные выше и ниже, характеризуются сходством последовательности с каждой стороной сайта интеграции в хромосоме.

При необходимости донорный полинуклеотид может представлять собой ДНК, например плазмидную ДНК, бактериальную искусственную хромосому (BAC), искусственную хромосому дрожжей (YAC), вирусный вектор, линейный фрагмент ДНК, ПЦР-фрагмент, "оголенную" нуклеиновую кислоту или нуклеиновую кислоту в комплексе со средством доставки, таким как липосома или полоксамер.

Экзогенный матричный полинуклеотид содержит последовательность, подлежащую интеграции (например, мутированный ген). Последовательность, предназначенная для интеграции, может представлять собой последовательность, эндогенную или экзогенную по отношению к клетке. Примеры последовательности, подлежащей интеграции, включают полинуклеотиды, кодирующие белок или некодирующую РНК (например, microRNA). Таким образом, последовательность, предназначенная для интеграции, может быть функционально связанной с соответствующей регуляторной последовательностью или соответствующими регуляторными последовательностями. Альтернативно последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию.

Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, выбирают таким образом, чтобы способствовать рекомбинации между хромосомной последовательностью, представляющей интерес, и донорным полинуклеотидом. Последовательность, расположенная выше, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с геномной последовательностью, расположенной выше подвергаемого нацеливанию сайта интеграции. Аналогично, последовательность, расположенная ниже, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с хромосомной последовательностью, расположенной ниже подвергаемого нацеливанию сайта интеграции. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, могут характеризоваться 75%, 80%, 85%, 90%, 95% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, предпочтительно характеризуются 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. В некоторых способах последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, характеризуются приблизительно 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью.

Последовательность, расположенная выше или ниже, может содержать от приблизительно 20 п. о. до приблизительно 2500 п. о., например приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п. о. В некоторых способах иллюстративная последовательность, расположенная выше или ниже, имеет от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 600 п.. до приблизительно 1000 п.о. или, более конкретно, от приблизительно 700 п.о. до приблизительно 1000 п.о.

В некоторых способах экзогенный матричный полинуклеотид может дополнительно содержать маркер. Такой маркер может облегчать скрининг в отношении подвергаемых нацеливанию интеграций. Примеры подходящих маркеров включают сайты рестрикции, флуоресцентные белки или селектируемые маркеры. Экзогенный матричный полинуклеотид согласно настоящему изобретению можно сконструировать с применением методик рекомбинантной ДНК (см., например, Sambrook et al., 2001 и Ausubel et al., 1996).

В иллюстративном способе модифицирования целевого полинуклеотида посредством интеграции экзогенного матричного полинуклеотида в геномную последовательность вводят двухнитевой разрыв с помощью комплекса CRISPR, осуществляют репарацию разрыва посредством гомологичной рекомбинации с участием экзогенного матричного полинуклеотида, так что матрица интегрируется в геном. Наличие двухнитевого разрыва обеспечивает интеграцию матрицы.

В других вариантах осуществления настоящее изобретение относится к способу модификации экспрессии полинуклеотида в эукариотической клетке. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью комплекса CRISPR, который связывается с полинуклеотидом.

В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или microRNA, может быть инактивирована, вследствие чего белок не образуется.

В некоторых способах регуляторную последовательность можно инактивировать, так что она больше не функционирует в качестве регуляторной последовательности. Используемое в данном документе выражение "регуляторная последовательность" относится к любой последовательности нуклеиновой кислоты, которая оказывает влияние на транскрипцию, трансляцию или доступность последовательности нуклеиновой кислоты. Примеры регуляторной последовательности включают промотор, терминатор транскрипции и энхансер, которые являются регуляторными последовательностями. Инактивированная целевая последовательность может содержать мутацию по типу делеции (т.е. делецию одного или нескольких нуклеотидов), мутацию по типу вставки (т.е. вставку одного или нескольких нуклеотидов) или нонсенс-мутацию (т.е. замену одного нуклеотида на другой нуклеотид, так что вводится стоп-кодон). В некоторых способах инактивация целевой последовательности приводит в результате к "нокауту" целевой последовательности.

Иллюстративные способы применения системы CRISPR Cas

Настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, или одному или нескольким полинуклеотидам, кодирующим компоненты указанной композиции, или вектору или системам доставки, содержащим один или несколько полинуклеотидов, кодирующих компоненты указанной композиции, для применения при модификации целевой клетки in vivo, ex vivo или in vitro, и они могут быть выполнены с помощью способа, который изменяет клетку таким образом, что после модификации потомство или клеточная линия клетки, модифицированной с помощью CRISPR, сохраняет измененный фенотип. Модифицированные клетки и потомство могут быть частью многоклеточного организма, такого как растение или животное, с применением ex vivo или in vivo системы CRISPR по отношению к желаемым типам клеток. Изобретение CRISPR может представлять собой терапевтический способ лечения. Терапевтический способ лечения может включать редактирование гена или генома или генную терапию.

Модификация мишени с помощью системы или комплекса CRISPR-Cas

В одном аспекте настоящее изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.

В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения.

Действительно, в любом аспекте настоящего изобретения комплекс CRISPR может содержать фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизируеющейся или способной к гибридизации с целевой последовательностью, где указанная направляющая последовательность может быть связана с парной tracr-последовательностью, которая, в свою очередь, может гибридизироваться с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше.

Таким образом, в любом из не встречающихся в природе ферментов CRISPR, описанных в данном документе, содержится по меньшей мере одна модификация, и тем самым фермент характеризуется определенными улучшенными свойствами. В частности, любой из ферментов способен образовывать комплекс CRISPR с направляющей РНК. При образовании такого комплекса направляющая РНК способна связываться с целевой полинуклеотидной последовательностью, и фермент способен модифицировать целевой локус. Кроме того, фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом.

Кроме того, модифицированные ферменты CRISPR, описанные в данном документе, охватывают ферменты, где в комплексе CRISPR фермент характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. Такая функция может быть предусмотрена отдельно или предусмотрена в сочетании с вышеописанной функцией сниженной способности модифицировать один или несколько нецелевых локусов. Любые такие ферменты могут быть предусмотрены с одной из дополнительных модификаций фермента CRISPR, как описано в данном документе, например, в сочетании с активностью, обеспечиваемой одним или несколькими ассоциированными гетерологичными функциональными доменами, любыми дополнительными мутациями с целью снижения нуклеазной активности и т.п.

В предпочтительных вариантах осуществления настоящего изобретения предусмотрен модифицированный фермент CRISPR со сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом и повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. В сочетании с дополнительными модификациями фермента можно достичь существенно повышенной специфичности. Например, предусмотрена комбинация таких предпочтительных вариантов осуществления с одной или несколькими дополнительными мутациями, где одна или несколько дополнительных мутаций находятся в одном или нескольких каталитически активных доменах. Такие дополнительные каталитические мутации могут придавать функциональные свойства никаз, как описано подробно в других частях данного документа. В таких ферментах повышенная специфичность может быть достигнута за счет повышенной специфичности с точки зрения ферментативной активности.

Модификации для снижения нецелевых эффектов и/или повышения целевых эффектов, как описано выше, могут быть выполнены с аминокислотными остатками, расположенными в положительно заряженной области/бороздке, находящейся между доменами RuvC-III и HNH. Предполагается, что любой из функциональных эффектов, описанных выше, может быть достигнут с помощью модификации аминокислот в вышеупомянутой бороздке, однако также с помощью модификации аминокислот вблизи бороздки или за ее пределами.

Дополнительные функциональные свойства, которые могут быть сконструированы в модифицированных ферментах CRISPR, как описано в данном документе, могут включать следующее. 1. Модифицированные ферменты CRISPR, которые нарушают взаимодействие ДНК и белка без нарушения третичной или вторичной структуры белков. Это включает остатки, которые контактируют с любой частью дуплекса РНК:ДНК. 2. Модифицированные ферменты CRISPR, которые ослабляют взаимодействия между белками, удерживающими Cas9 в конформации, необходимой для разрезания нуклеазами в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая незначительно ингибирует, но по-прежнему обеспечивает конформацию нуклеазы домена HNH (располагается в поддающемся разрезанию фосфате). 3. Модифицированные ферменты CRISPR, которые усиливают взаимодействия между белками, удерживающими Cas9 в конформации, ингибирующей активность в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая стабилизирует домен HNH в конформации за пределами поддающегося разрезанию фосфата. Любое такое дополнительное функциональное усиление может быть предусмотрено в комбинации с любой другой модификацией фермента CRISPR, как описано подробно в других местах данного документа.

Любые из описанных в данном документе улучшенных функциональных свойств могут быть выполнены по отношению к любому ферменту CRISPR, такому как фермент Cas9. Ферменты Cas9, описанные в данном документе, получают из ферментов Cas9 от S. pyogenes и S. aureus. Однако предполагается, что любое из функциональных свойств, описанных в данном документе, может быть сконструировано в ферментах Cas9 от других ортологов, в том числе химерных ферментов, содержащих фрагменты из нескольких ортологов. Примеры таких ортологов можно найти, например, на фигурах 8 и 9, описываемых в данном документе.

В настоящем изобретении нуклеиновые кислоты используются для связывания целевых последовательностей ДНК. Это является преимущественным, поскольку получать нуклеиновые кислоты намного легче и дешевле, чем белки, и специфичность может варьировать в зависимости от длины фрагмента, если необходима гомология. Например, не требуется сложное 3-D определение положений многочисленных доменов. Термин "полинуклеотид", "нуклеотид", "нуклеотидная последовательность", "нуклеиновая кислота" и "олигонуклеотид" используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующие участки гена или фрагмента гена, локусы (локус), определенные(ый) в результате анализа сцепления, экзоны, интроны, матричная РНК (мРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенные ДНК любой последовательности, выделенные РНК любой последовательности, нуклеиновые кислоты-зонды и праймеры. Термин также охватывает структуры, подобные нуклеиновым кислотам с синтетическими каркасами, см., например, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997 и Samstag, 1996. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем соединения с компонентом для мечения. Используемый в данном документе термин "дикий тип" является термином из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которая встречаются в природе в отличие от мутантных или вариантных форм. "Дикий тип" представляет основу. Используемый в данном документе термин "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от встречающегося в природе. Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один иной компонент, с которым они естественным образом связаны в природе и встречаются в природе. "Комплементарность" означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты с помощью либо традиционного образования пар по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). "Точная комплементарность" означает, что все непрерывные остатки последовательности нуклеиновой кислоты будут связаны водородными связями с таким же количеством непрерывных остатков во второй последовательности нуклеиновой кислоты. Используемое в данном документе выражение "практически комплементарный" означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизируются при жестких условиях. Используемое в данном документе выражение"жесткие условия" в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с не подвергаемыми нацеливанию последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. В целом, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется со своей целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y. Если предполагается полинуклеотидная последовательность, то также предусматриваются комплементарные или частично комплементарные последовательности. Эти последовательности предпочтительно способны гибридизироваться с эталонной последовательностью при условиях высокой жесткости. Как правило, для доведения скорости гибридизации до максимума, выбирают условия гибридизации относительно низкой жесткости: температура на приблизительно 20-25°C ниже температуры точки плавления (Tm). Tm представляет собой температуру, при которой 50% специфичной целевой последовательности гибридизируется с точно комплементарным зондом в растворе при определенной ионной силе и pH. Как правило, если требуется по меньшей мере приблизительно 85% нуклеотидная комплементарность гибридизированных последовательностей, выбирают очень жесткие условия отмывки с температурой на приблизительно 5-15°C ниже, чем Tm. Если требуется по меньшей мере приблизительно 70% нуклеотидная комплементарность гибридизированных последовательностей, выбирают умеренно жесткие условия отмывки с температурой на приблизительно 15-30°C ниже, чем Tm. Высоко пермиссивные (очень низкой жесткости) условия отмывки могут характеризоваться наименьшей температурой на 50°C ниже Tm, что допускает высокий уровень несовпадений между гибридизированными последовательностями. Специалисты в данной области поймут, что другие физические и химические параметры на стадиях гибридизации и отмывки также можно изменять для того, чтобы повлиять на получаемый в результате выявляемый сигнал гибридизации исходя из конкретного уровня гомологии между целевой последовательностью и последовательностью зонда. Предпочтительные условия высокой жесткости предусматривают инкубацию в 50% формамиде, 5×SSC и 1% SDS при 42°C, или инкубацию при 5×SSC и 1% SDS при 65°C с отмывкой в 0,2×SSC и 0,1% SDS при 65°C. "Гибридизация" относится к реакции, в которой один или несколько полинуклеотидов вступают в реакцию с образованием комплекса, который стабилизирован посредством образования водородных связей между основаниями остатков нуклеотидов. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или посредством любого другого специфичного к последовательности способа. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида с помощью фермента. Последовательность, способную к гибридизации с данной последовательностью, называют "комплементарной последовательностью" для данной последовательности. Используемый в данном документе термин "локус генома" или "локус" (форма множественного числа локусы) представляет собой конкретное положение гена или последовательности ДНК на хромосоме. "Ген" относится к фрагментам ДНК или РНК, которые кодируют цепь полипептида или РНК, которые играют функциональную роль в организме, и, следовательно, он представляет собой молекулярную единицу наследственности в живых организмах. Для цели настоящего изобретения может считаться, что гены содержат участки, которые регулируют образование продукта гена, независимо от того являются ли регуляторные последовательности смежными с кодирующими и/или транскрибируемыми последовательностями или нет. Соответственно, ген содержит, но без обязательного ограничения, промоторные последовательности, терминаторы, регуляторные последовательности трансляции, например, сайты связывания рибосомы и сайты внутренней посадки рибосомы, энхансеры, сайленсеры, инсуляторы, граничные элементы, точки начала репликации, сайты прикрепления к матриксу и регуляторные участки локуса. Используемый в данном документе термин "экспрессия локуса генома" или "экспрессия гена" относится к процессу, в ходе которого информация гена используется в синтезе функционального продукта гена. Продукты экспрессии генов часто представляют собой белки, но у генов, не кодирующих белки, например генов rRNA или генов tRNA, продукт представляет собой функциональную РНК. Процесс экспрессии генов используется всеми известными живыми организмами - эукариотами (в том числе многоклеточными организмами), прокариотами (бактериями и археями) и вирусами для образования функциональных продуктов, необходимых для выживания. Как используется в данном документе, "экспрессия" гена или нуклеиновой кислоты охватывает не только экспрессию генов в клетках, но также транскрипцию и трансляцию нуклеиновой (нуклеиновых) кислоты (кислот) в системах клонирования и в любом другом контексте. Используемый в данном документе термин "экспрессия" также означает процесс, посредством которого полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или процесс, с помощью которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг мРНК в эукариотической клетке. Термины "полипептид", "пептид" и "белок" используются в данном документе взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Термины также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, как, например, соединением с компонентом для мечения. Используемое в данном документе выражение "аминокислота" включает природные и/или отличные от природных или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналоги аминокислот, и пептидомиметики. Используемое в данном документе выражение "домен" или "белковый домен" относится к части последовательности белка, которая может существовать и функционировать независимо от остальной части белковой цепи. Как описано в аспектах согласно настоящему изобретению, идентичность последовательности относится к гомологии последовательности. Сравнения гомологии можно проводить на глаз или, что делается чаще, с помощью легко доступных программ для сравнения последовательностей. с помощью этих коммерчески доступных компьютерных программ можно рассчитывать процент (%) гомологии между двумя или более последовательностями, а также можно рассчитывать идентичность последовательности между двумя или более аминокислотными последовательностями или последовательностями нуклеиновых кислот. В некоторых предпочтительных вариантах осуществления участок кэпирования dTALE, описанный в данном документе, имеет последовательности, по меньшей мере на 95% идентичные или обладающие идентичностью с участком кэпирования аминокислотных последовательностей, представленных в данном документе. Значения гомологии последовательности можно получить с помощью любой из ряда компьютерных программ, известных из уровня техники, например, BLAST или FASTA и т.д. Подходящей компьютерной программой для осуществления такого выравнивания является пакет программ GCG Wisconsin Bestfit (Университет Висконсина, США; Devereux et al., 1984, Nucleic Acids Research 12:387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (см. Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410) и пакет программ GENEWORKS в качестве средств для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999 ibid, pages 7-58 - 7-60). Однако предпочтительным является использование программы GCG Bestfit. Процентное значение (%) гомологии последовательности можно рассчитывать для непрерывных последовательностей, т.е. одну последовательность выравнивают с другой последовательностью и каждую аминокислоту или нуклеотид в одной последовательности непосредственно сравнивают с соответствующей аминокислотой или нуклеотидом в другой последовательности, один остаток за один раз. Это называется выравниванием "без гэпов". Как правило, такие выравнивания без гэпов осуществляют только для относительно малого числа остатков. Несмотря на то, что этот способ является очень простым и последовательным, при его применении не учитывается то, что, например, в паре последовательностей, которые в остальном являются идентичными, одна вставка или делеция может привести к тому, что следующие за ней аминокислотные остатки не будут учитываться при выравнивании, что, таким образом, потенциально приводит в результате к значительному уменьшению % гомологии при осуществлении глобального выравнивания. Следовательно, большинство способов сравнения последовательностей разработаны для получения оптимальных выравниваний, в которых учитываются возможные вставки и делеции без наложения чрезмерного штрафа на общую гомологию или балл идентичности. Это достигается путем вставки "гэпов" в выравнивание последовательностей в попытке доведения до максимума локальной гомологии или идентичности. Однако в этих более сложных способах назначаются "штрафы за внесения гэпа" для каждого гэпа, который встречается при выравнивании, таким образом, для одинакового количества идентичных аминокислот выравнивание последовательностей с наименьшим возможным количеством гэпов, что отражает более высокую степень родства между двумя сравниваемыми последовательностями, может привести в результате к более высокому баллу, чем выравнивание с большим количеством гэпов. Как правило, используют "значения аффинного штрафа за внесение гэпа для родственных последовательностей", с использованием которых начисляют относительно высокое значение за существование гэпа и меньший штраф за каждый последующий остаток в гэпе. Это наиболее часто используемая система оценки гэпов. Конечно, высокие штрафы за внесение гэпа могут привести к оптимизированным выравниваниям с меньшим количеством гэпов. В большинстве программ выравнивания допускается изменение штрафов за внесение гэпа. Однако предпочтительно использовать значения по умолчанию при использовании такого программного обеспечения для сравнений последовательностей. Например, при использовании пакета программ GCG Wisconsin Bestfit штраф за внесение гэпа по умолчанию для аминокислотных последовательностей составляет -12 для гэпа и -4 за каждый остаток его продолжения. Для расчета максимального % гомологии, следовательно, изначально требуется получение оптимального выравнивания с учетом штрафов за внесение гэпа. Подходящая компьютерная программа для осуществления такого выравнивания представляет собой пакет программ GCG Wisconsin Bestfit (Devereux et al., 1984 Nuc. Acids Research 12 p387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (cм. Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. - Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410) и пакет программ GENEWORKS в качестве инструментов для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 - 7-60). Однако для некоторых задач предпочтительно использовать программу GCG Bestfit. Новый инструмент под названием BLAST 2 Sequences также доступен для сравнения белковых и нуклеотидных последовательностей (см. FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 и веб-сайт Национального центра биотехнологической информации на веб-сайте Национальных институтов здравоохранения). Несмотря на то, что конечный % гомологии можно измерять в единицах идентичности, способ выравнивания сам по себе, как правило, не основывается на сравнении пар по типу "все или ничего". Вместо этого, как правило, используется матрица замен со шкалой сходства, с использованием которой назначаются баллы для каждого попарного сравнения на основании химического сходства или эволюционного расстояния. Примером такой матрицы, используемой чаще всего, является матрица BLOSUM62 - матрица по умолчанию для набора программ BLAST. В программах GCG Wisconsin, как правило, используются либо общедоступные значения по умолчанию, либо специальные таблицы сравнения символов, если предоставляются (дополнительные подробности см. в руководстве пользователя). Для некоторых задач предпочтительным является применение общедоступных значений по умолчанию для пакета программ GCG или, в случае другого программного обеспечения, матрицы по умолчанию, например BLOSUM62. Альтернативно процентные значения гомологии можно рассчитывать с использованием функции множественного выравнивания в DNASISTM (Hitachi Software) с применением алгоритма, аналогичного CLUSTAL (Higgins DG & Sharp PM (1988), Gene 73(1), 237-244). После того, как программное обеспечение предоставит оптимальное выравнивание, возможно рассчитать % гомологии, предпочтительно % идентичности последовательности. Программное обеспечение, как правило, осуществляет это в ходе сравнения последовательностей и выдает численный результат. Последовательности также могут иметь делеции, вставки или замены аминокислотных остатков, которые приводят к молчащему изменению и приводят в результате к функционально эквивалентному веществу. Преднамеренные аминокислотные замены могут быть сделаны исходя из сходства свойств аминокислот (например, полярность, заряд, растворимость, гидрофобность, гидрофильность и/или амфипатическая природа остатков) и, следовательно, они являются применимыми для того, чтобы сгруппировать аминокислоты в функциональные группы. Аминокислоты можно сгруппировать исходя из свойств только их боковых цепей. Однако также более полезно включить данные о мутациях. Группы аминокислот, полученные таким образом, вероятно, будут консервативными по структурным причинам. Эти группы могут быть описаны в форме диаграммы Венна (Livingstone C.D. and Barton G.J. (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756) (Taylor W.R. (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218). Консервативные замены могут быть сделаны, например, в соответствии с таблицей, представленной ниже, в которой описывается общепринятая группировка аминокислот в форме диаграммы Венна.

Группа Подгруппа
Гидрофобные F W Y H K M I L V A G C Ароматическая F W Y H
Алифатическая I L V
Полярная W Y H K R E D C S T N Q Заряженная H K R E D
Положительно заряженная H K R
Отрицательно заряженная E D
Небольшая V C A G S P T N D Маленькая A G S

Варианты осуществления согласно настоящему изобретению охватывают последовательности (как полинуклеотидные, так и полипептидные), которые могут содержать гомологичную замену (используемые в данном документе как замена, так и замещение означают обмен существующего аминокислотного остатка или нуклеотида на альтернативный остаток или нуклеотид), которая может происходить, т.е. в случае аминокислот, замену на аналогичную, например, основной на основную, кислой на кислую, полярной на полярную и т.д. Также может происходить негомологичная замена, т.е. остатка из одного класса на остаток из другого или, в альтернативном случае, связанная с включением аминокислот, отличных от природных, например, орнитина (далее в данном документе называемого Z), орнитиндиаминомасляной кислоты (далее в данном документе называемой B), норлейцинорнитина (далее в данном документе называемого O), пиридилаланина, тиенилаланина, нафтилаланина и фенилглицина. Вариантные аминокислотные последовательности могут содержать подходящие спейсерные группы, которые могут быть вставлены между любыми двумя аминокислотными остатками последовательности, в том числе алкильные группы, например, метильную, этильную или пропильную группы, в дополнение к аминокислотным спейсерам, таким как глициновые или β-аланиновые остатки. Другая форма вариации, которая включает присутствие одного или нескольких аминокислотных остатков в пептоидной форме, может быть хорошо понятна специалистам в данной области. Для того, чтобы избежать неопределенности, "пептоидная форма" используется для обозначения вариантных аминокислотных остатков, где замещающая группа для α-углерода расположена на атоме азота остатка, а не на α-углероде. Способы получения пептидов в пептоидной форме известны из уровня техники, например, Simon RJ et al., PNAS (1992) 89(20), 9367-9371 и Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134.

Моделирование гомологии. Соответствующие остатки в других ортологах Cas9 можно идентифицировать с помощью способов Zhang et al., 2012 (Nature; 490(7421): 556-60) и Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248) - компьютерного способа взаимодействия белок-белок (PPI) для прогнозирования взаимодействий, опосредованных границами домен-мотив. PrePPI (прогнозируемое PPI), структура на основе способа прогнозирования PPI, объединяет структурные доказательства с неструктурными доказательствами с использованием концепции байесовой статистики. Способ включает взятие пары белков и применение структурного выравнивания с целью выявления структурных элементов, которые соответствуют либо по своим экспериментально определенным структурам, либо по гомологичным моделям. Структурное выравнивание дополнительно используют для выявления как расположенных вблизи, так и удаленных структурных соседствующих элементов посредством общих и локальных геометрических связей. Во всех случаях, когда два соседствующих элемента из структурных элементов образуют комплекс, описанный в Protein Data Bank, он определяет матрицу для моделирования взаимодействия между двумя исследуемыми белками. Модели комплекса создают с помощью накладывания структур элементов на их соответствующий структурный соседствующий элемент в матрице. Этот подход дополнительно описан в Dey et al., 2013 (Prot Sci; 22: 359-66).

Для целей настоящего изобретения амплификация означает любой способ с использованием праймера и полимеразы, способной обеспечивать репликацию целевой последовательности с достаточной точностью. Амплификацию можно осуществлять с помощью природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli и обратная транскриптаза. Предпочтительным способом амплификации является ПЦР.

В определенных аспектах настоящее изобретение охватывает векторы. Как используется в данном документе, "вектор" представляет собой инструмент, который позволяет или облегчает перенос объекта из одной среды в другую. Он представляет собой репликон, такой как плазмида, фаг или космида, в который может быть встроен другой сегмент ДНК для осуществления таким образом репликации встроенного сегмента. Как правило, вектор способен к репликации, если ассоциирован с соответствующими элементами контроля. В целом, термин "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы (AAV)). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным (регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина). Что касается способов рекомбинации и клонирования, следует упомянуть заявку на патент США № 10/815730, опубликованную 2 сентября 2004 г. как US 2004-0171156 A1, содержание которой включено в данный документ посредством ссылки в полном объеме.

Аспекты настоящего изобретения относятся к бицистронным векторам для химерной РНК и модифицированным или мутированным ферментам CRISPR (например Cas9). Бицистронные векторы экспрессии для химерной РНК и модифицированные или мутированные ферменты CRISPR являются предпочтительными. В целом и в частности, в данном варианте осуществления модифицированные или мутированные ферменты CRISPR предпочтительно управляются промотором CBh. Химерная РНК предпочтительно может управляться промотором Pol III, таким как промотор U6. Оптимальным является их сочетание. Химерная направляющая РНК, как правило, состоит из направляющей последовательности (Ns) из 20 п.о., которая может быть соединена с tracr-последовательностью (проходящей от первого "U" в нижней нити к концу транскрипта). В разных указанных положениях tracr-последовательность может быть усечена. Направляющие и tracr-последовательности разделены парной tracr-последовательностью, которая может представлять собой GUUUUAGAGCUA. За ней может следовать показанная последовательность петли GAAA. Обе из них являются предпочтительными примерами. Авторы настоящего изобретения продемонстрировали Cas9-опосредованные вставки/делеции в локусах EMX1 и PVALB человека с помощью анализов с использованием нуклеазы SURVEYOR. ChiRNA показаны путем обозначения их "+n", а crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде отдельных транскриптов. По всей данной заявке химерная РНК также может называться одиночной направляющей или синтетической направляющей РНК (sgRNA). Петля предпочтительно представляет собой GAAA, но не ограничивается этой последовательностью, или действительно ее длина составляет только 4 п.о. Действительно, предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах имеют длину четыре нуклеотида и наиболее предпочтительно имеют последовательность GAAA. Однако можно применять более длинные или более короткие последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, C или G). Примеры петлеобразующих последовательностей включают CAAA и AAAG. При осуществлении на практике любых способов, раскрытых в данном документе, подходящий вектор можно вводить в клетку или эмбрион посредством одного или нескольких способов, известных из уровня техники, в том числе без ограничения микроинъекции, электропорации, сонопорации, баллистической трансфекции, трансфекции, опосредованной фосфатом кальция, трансфекции с помощью катионных липидных частиц, липосомной трансфекции, трансфекции с помощью дендримеров, трансфекции посредством теплового шока, трансфекции посредством нуклеофекции, магнитофекции, липофекции, импалефекции, оптической трансфекции, поглощения нуклеиновых кислот, стимулируемого проприетарным средством, и доставки с помощью липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах вектор вводят в эмбрион посредством микроинъекции. Можно осуществлять микроинъекцию вектора или векторов в ядро или цитоплазму эмбриона. В некоторых способах вектор или векторы можно вводить в клетку посредством нуклеофекции.

Термин "регуляторный элемент" предназначен для охвата промоторов, энхансеров, сайтов внутренней посадки рибосомы (IRES) и других контролирующих экспрессию элементов (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.). По отношению к регуляторным последовательностям следует упомянуть заявку на патент США № 10/491026, содержание которой включено в данный документ посредством ссылки в полном объеме. По отношению к промоторам следует упомянуть PCT-публикацию WO 2011/028929 и заявку на патент США № 12/511940, содержание которых включено в данный документ посредством ссылки во их полноте.

Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE экспрессия TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Альтернативно рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, с помощью регуляторных последовательностей промотора T7 и полимеразы T7.

Векторы можно вводить и размножать в прокариоте или прокариотической клетке. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяина. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с помощью векторов, содержащих конститутивные или индуцируемые промоторы, управляющие экспрессией либо слитых белков, либо белков, отличных от слитых белков. В слитых векторах добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как, например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка путем функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолитического расщепления вводят в место соединения слитого фрагмента и рекомбинантного белка для облегчения отделения рекомбинантного белка от слитого фрагмента после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Xa, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRIT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых соответственно глутатион-S-трансфераза (GST), мальтоза-связывающий белок E или белок A слиты с целевым рекомбинантным белком. Примеры подходящих индуцируемых не являющихся слитыми векторов экспрессии для E. coli включают pTrc (Amrann et al., (1988) Gene 69:301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). В некоторых вариантах осуществления вектор является дрожжевым вектором экспрессии. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния). В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых с помощью бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).

В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих с помощью вектора экспрессии для млекопитающих. Примеры векторов экспрессии для млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании в клетках млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, обезьяньего вируса 40 и других, раскрытых в данном документе и известных из уровня техники. Что касается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.

В некоторых вариантах осуществления рекомбинантные векторы экспрессии для млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны из уровня техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (специфичный к печени; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов T-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США № 4873316 и публикация европейской заявки № 264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Gruss, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). Что касается этих прокариотических и эукариотических векторов, следует упомянуть патент США № 6750059, содержание которого включено в данный документ посредством ссылки во всей его полноте. Другие варианты осуществления по настоящему изобретению могут относиться к вирусным векторам, которые упоминаются в заявке на патент США № 13/092085, содержание которой включено в данный документ посредством ссылки во всей ее полноте. Тканеспецифичные регуляторные элементы известны из уровня техники и, в связи с этим, следует упомянуть патент США № 7776321, содержание которого включено в данный документ посредством ссылки во всей его полноте. В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR так, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (прерываемые спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у E. coli (Ishino et al., J. Bacteriol., 169:5429-5433 [1987]; и Nakata et al., J. Bacteriol., 171:3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см. Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]; и Mojica et al., Mol. Microbiol., 17:85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]; и Mojica et al., Mol. Microbiol., 36:244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182:2393-2401 [2000]). Локусы CRISPR идентифицировали у более чем 40 прокариотов (см., например, Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]; и Mojica et al., [2005]), в том числе без ограничения Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.

В некоторых вариантах осуществления фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают без ограничения эпитопные метки, последовательности из генов-репортеров и белковые домены с одной или несколькими из следующих видов активности: метилазная активность, деметилазная активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК и активность связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гистидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (HA), Myc-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают без ограничения глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуоресцирующие белки, в том числе синий флуоресцентный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулами ДНК или связываются с другими клеточными молекулами, в том числе без ограничения связывающий мальтозу белок (MBP), S-метка, продукты слияния Lex A и ДНК-связывающего домена (DBD), продукты слияния GAL4 и ДНК-связывающего домена и продукты слияния белка BP16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US20110059502, включенном в данный документ с помощью ссылки. В некоторых вариантах осуществления меченый фермент CRISPR используют для идентификации расположения целевой последовательности.

Практическое осуществление настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL и ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).

Модели генетических и эпигенетических условий

Способ по настоящему изобретению можно применять для создания растения, животного или клетки, которые можно использовать в качестве модели заболевания. Используемое в данном документе выражение "заболевание" относится к заболеванию, нарушению или симптому у субъекта. Например, способ по настоящему изобретению можно применять для создания животного или клетки, которые содержат модификацию одной или нескольких последовательностей нуклеиновой кислоты, ассоциированных с заболеванием, или растения, животного или клетки, в которых изменены экспрессии одной или нескольких последовательностей нуклеиновой кислоты, ассоциированных с заболеванием. Такая последовательность нуклеиновой кислоты может кодировать последовательность белка, ассоциированного с заболеванием, или может представлять собой регуляторную последовательность, ассоциированную с заболеванием. Соответственно, подразумевается, что в вариантах осуществления настоящего изобретения растение, субъект, пациент, организм или клетка могут относиться к субъекту, отличному от человека, пациенту, организму или клетке. Таким образом, настоящее изобретение относится к растению, животному или клетке, полученным с помощью способа по настоящему изобретению, или их потомству. Потомство может представлять собой клон полученного растения или животного, или его можно получить с помощью полового размножения посредством скрещивания с другими индивидами того же вида для придания дополнительных желаемых признаков их потомкам. Клетка может находиться in vivo или ex vivo в случае многоклеточных организмов, в частности, животных или растений. В случае, если клетка находится в культуре, можно получить линию клеток при выполнении соответствующих условий культивирования, и предпочтительно, если клетка соответствующим образом приспособлена для этой цели (например, стволовая клетка). Также предусматриваются линии бактериальных клеток, полученные согласно настоящему изобретению. Следовательно, также предусматриваются линии клеток.

В некоторых способах модель заболевания можно использовать для изучения влияния мутаций на животное или клетку и развитие и/или прогрессирование заболевания с применением показателей, обычно используемых при изучении заболевания. Альтернативно такая модель заболевания является применимой для изучения влияния фармацевтически активного соединения на заболевание.

В некоторых способах модель заболевания можно использовать для оценки эффективности потенциальной стратегии генной терапии. Таким образом, ассоциированные с заболеванием ген или полинуклеотид можно модифицировать, так что развитие и/или прогрессирование заболевания замедляется или уменьшается. В частности, способ включает модификацию ассоциированных с заболеванием гена или полинуклеотида, так что продуцируется измененный белок, и в результате у животного или клетки наблюдается измененный ответ. Соответственно, в некоторых способах генетически модифицированное животное можно сравнивать с животным, предрасположенным к развитию заболевания, так что можно оценить эффект осуществления генной терапии.

В другом варианте осуществления настоящее изобретение относится к способу получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания. Способ предусматривает приведение тестового соединения в контакт с клеткой, содержащей один или несколько векторов, которые управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью и tracr-последовательностью; и обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного, например, с мутацией в гене, ответственном за развитие заболевания, который содержится в клетке.

Клеточную модель или животную модель можно сконструировать в сочетании со способом по настоящему изобретению для скрининга изменения клеточной функции. Такую модель можно применять для исследования влияния геномной последовательности, модифицированной с помощью комплекса CRISPR по настоящему изобретению, на представляющую интерес клеточную функцию. Например, модель клеточной функции можно применять для исследования воздействия модифицированной геномной последовательности на внутриклеточную передачу сигнала или внеклеточную передачу сигнала. Альтернативно модель клеточной функции можно применять для исследования воздействий модифицированной геномной последовательности на сенсорную чувствительность. В некоторых таких моделях одна или несколько геномных последовательностей, ассоциированных с биохимическим путем передачи сигнала, в модели является модифицированной.

Специально было исследовано несколько моделей заболеваний. Они включают гены CHD8, KATNAL2 и SCN2A, связанные с риском развития аутизма de novo, и ген UBE3A, связанный с синдромным аутизмом (синдром Ангельмана). Эти гены и полученные в результате модели аутизма, разумеется, являются предпочтительными, но служат для того, чтобы продемонстрировать широкую применимость настоящего изобретения по отношению к генам и соответствующим моделям.

Измененную экспрессию одной или нескольких геномных последовательностей, ассоциированных с биохимическим путем передачи сигнала, можно определять с помощью анализа различия по уровням мРНК соответствующих генов между тестируемой модельной клеткой и контрольной клеткой, если их приводят в контакт с кандидатным средством. Альтернативно различную экспрессию последовательностей, ассоциированных с биохимическим путем передачи сигнала, определяют посредством выявления различия по уровню кодируемого полипептида или продукта гена.

Для анализа индуцированного определенным средством изменения уровня мРНК-транскриптов или соответствующих полинуклеотидов, нуклеиновую кислоту, которая содержится в образце, вначале экстрагируют в соответствии со стандартными способами из уровня техники. Например, матричную РНК можно выделять с применением различных литических ферментов или химических растворов в соответствии с процедурами, изложенными в Sambrook et al. (1989), или экстрагировать с помощью смол, связывающих нуклеиновые кислоты, в соответствии с прилагаемыми инструкциями, предоставленными производителями. Содержащуюся в экстрагированном образце нуклеиновой кислоты мРНК затем выявляют с помощью методик амплификации или традиционных гибридизационных анализов (например, анализа с помощью нозерн-блоттинга) в соответствии со способами, широко известными из уровня техники или основанными на способах, проиллюстрированных в данном документе.

Для целей настоящего изобретения амплификация означает любой способ с использованием праймера и полимеразы, способной обеспечивать репликацию целевой последовательности с достаточной точностью. Амплификацию можно осуществлять с помощью природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli и обратная транскриптаза. Предпочтительным способом амплификации является ПЦР. В частности, выделенную РНК можно подвергать анализу с обратной транскрипцией, который объединен с количественной полимеразной цепной реакцией (RT-PCR), для количественного определения уровня экспрессии последовательности, ассоциированной с биохимическим путем передачи сигнала.

Выявление уровня экспрессии генов можно осуществлять в анализе амплификации в режиме реального времени. В одном аспекте амплифицированные продукты можно непосредственно визуализировать с помощью флуоресцентных ДНК-связывающих средств, в том числе без ограничения ДНК-интеркаляторов и средств, связывающихся с бороздкой спирали ДНК. Поскольку количество интеркаляторов, включенных в двухнитевые молекулы ДНК, как правило, является пропорциональным количеству амплифицированных ДНК-продуктов, можно без труда определить количество амплифицированных продуктов путем количественного определения флуоресценции интеркалирующего красителя с применением традиционных оптических систем из уровня техники. ДНК-связывающий краситель, подходящий для этой задачи, охватывает SYBR зеленый, SYBR синий, DAPI, йодид пропидия, Hoeсhst, SYBR золотой, бромид этидия, акридины, профлавин, акридиновый оранжевый, акрифлавин, фторкумарин, эллиптицин, дауномицин, хлорохин, дистамицин D, хромомицин, хомидий, митрамицин, комплексы рутений-полипиридил, антрамицин и т.п.

В другом аспекте можно использовать другие флуоресцентные метки, например, зонды, специфичные по отношению к последовательности, в реакции амплификации для обеспечения выявления и количественного определения амплифицированных продуктов. Количественная амплификация с использованием зонда основана на специфичном по отношению к последовательности выявлении требуемого амплифицированного продукта. Используются флуоресцентные зонды, специфичные по отношению к мишени (например, зонды TaqMan®), что приводит в результате к увеличению специфичности и чувствительности. Способы осуществления количественной амплификации с использованием зонда являются общепринятыми в данной области и описаны в патенте США № 5210015.

В еще одном аспекте можно осуществлять традиционные гибридизационные анализы с использованием гибридизационных зондов, которые характеризуются гомологией последовательности с последовательностями, ассоциированными с биохимическим путем передачи сигнала. Как правило, в реакции гибридизации зондам дают возможность образовать стабильные комплексы с последовательностями, ассоциированными с биохимическим путем передачи сигнала, которые содержатся в биологическом образце, полученном от исследуемого субъекта. Специалисту в данной области будет понятно, что если антисмысловая нуклеиновая кислота используется в качестве зонда, то целевые полинуклеотиды, представленные в образце, выбирают так, чтобы они были комплементарными последовательностям антисмысловых нуклеиновых кислот. Напротив, если нуклеотидный зонд является смысловой нуклеиновой кислотой, то целевой полинуклеотид выбирают так, чтобы он был комплементарным последовательностям смысловой нуклеиновой кислоты.

Гибридизацию можно осуществлять в условиях различной жесткости. Подходящие условия гибридизации для осуществления на практике настоящего изобретения являются такими, что обеспечивающее распознавание взаимодействие зонда с последовательностями, ассоциированными с биохимическим путем передачи сигнала, является как достаточно специфичным, так и достаточно стабильным. Условия, которые приводят к увеличению жесткости реакции гибридизации, хорошо известны из уровня техники и являются опубликованными. См., например (Sambrook, et al., (1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition). Гибридизационный анализ можно осуществлять с применением зондов, иммобилизованных на любой твердой подложке, в том числе без ограничения нитроцеллюлозной, стеклянной, кремниевой, и ряда ДНК-чипов. Предпочтительный гибридизационный анализ проводят на генных чипах высокой плотности, описанных в патенте США № 5445934.

Для удобного выявления комплексов зонд-мишень, образованных в ходе гибридизационного анализа, осуществляют конъюгирование нуклеотидных зондов с детектируемой меткой. Детектируемые метки, подходящие для применения в настоящем изобретении, включают любую композицию, выявляемую с помощью фотохимических, биохимических, спектроскопических, иммунохимических, электрических, оптических или химических средств. Широкий спектр соответствующих детектируемых меток известен из уровня техники, причем он включает флуоресцентные или хемилюминесцентные метки, метки на основе радиоактивных изотопов, ферментные или другие лиганды. В предпочтительных вариантах осуществления, вероятно, предпочтительной будет флуоресцентная метка или ферментная метка, как, например, дигоксигенин, ß-галактозидаза, уреаза, щелочная фосфатаза или пероксидаза, комплекс авидин/биотин.

Способы выявления, применяемые для выявления или количественного определения интенсивности гибридизации, как правило, будут зависеть от метки, выбранной выше. Например, радиоактивные метки можно выявлять с использованием фотографической пленки или фосфовизуализатора. Флуоресцентные маркеры можно выявлять и количественно определять с использованием фотодетектора для выявления излучаемого света. Ферментные метки, как правило, выявляют посредством снабжения фермента субстратом и измерения количества продукта реакции, образованного при воздействии фермента на субстрат; и, наконец, колориметрические метки выявляют посредством простой визуализации цветной метки.

Индуцированное определенным средством изменение экспрессии последовательностей, ассоциированных с биохимическим путем передачи сигнала, также можно определять посредством исследования соответствующих продуктов генов. Определение уровня белка, как правило, включает a) приведение белка, содержащегося в биологическом образце, в контакт со средством, которое специфично связывается с белком, ассоциированным с биохимическим путем передачи сигнала; и (b) идентификацию любого комплекса средство:белок, образованного таким образом. В одном аспекте данного варианта осуществления средство, которое специфически связывает белок, ассоциированный с биохимическим путем передачи сигнала, представляет собой антитело, предпочтительно, моноклональное антитело.

Реакцию осуществляют посредством приведения средства в контакт с образцом белков, ассоциированных с биохимическим путем передачи сигнала, полученным из тестируемых образцов, при условиях, которые обеспечивают возможность образования комплекса между средством и белками, ассоциированными с биохимическим путем передачи сигнала. Образование комплекса можно выявлять непосредственно или опосредованно в соответствии со стандартными процедурами из уровня техники. В способе непосредственного выявления средства снабжают детектируемой меткой и непрореагировавшие средства можно удалять от комплекса; количество оставшейся метки, таким образом, отражает количество образованного комплекса. Для такого способа предпочтительно выбирать метки, которые остаются прикрепленными к средствам даже при жестких условиях отмывки. Предпочтительно, чтобы метка не препятствовала реакции связывания. В альтернативном случае, для процедуры опосредованного выявления можно использовать средство, которое содержит метку, введенную либо химическим, либо ферментативным путем. Требуемая метка, как правило, не препятствует связыванию или стабильности полученного в результате комплекса средство:полипептид. Однако, метка, как правило, разработана так, чтобы она была доступной для эффективного связывания антителом и, следовательно, выработки детектируемого сигнала.

Широкий спектр меток, подходящих для выявления уровней белка, известен из уровня техники. Неограничивающие примеры включают радиоактивные изотопы, ферменты, коллоидные металлы, флуоресцентные соединения, биолюминесцентные соединения и хемилюминесцентные соединения.

Количество комплексов средство:полипептид, образованных в ходе реакции связывания, можно количественно определять с помощью стандартных количественных анализов. Как проиллюстрировано выше, образование комплекса средство:полипептид можно измерить непосредственно по количеству метки, оставшейся в сайте связывания. В альтернативном случае белок ассоциированный с биохимическим путем передачи сигнала, исследуют в отношении его способности конкурировать с меченым аналогом за участки связывания на специфическом средстве. В этом конкурентном анализе количество захваченной метки является обратно пропорциональным количеству последовательностей белка, ассоциированного с биохимическим путем передачи сигнала, присутствующих в исследуемом образце.

Ряд методик анализа белка, основанных на общих принципах, изложенных выше, доступен из уровня техники. Они включают без ограничения радиоиммунные анализы, ELISA (твердофазные ферментные иммунорадиометрические анализы), "сэндвич"-иммуноанализы, иммунорадиометрические анализы, иммуноанализы in situ (с применением, например, коллоидного золота, фермента или радиоизотопных меток), вестерн-блот анализ, иммунопреципитационные анализы, иммунофлуоресцентные анализы и SDS-PAGE.

Антитела, которые обеспечивают специфичное распознавание или связываются с белками, ассоциированными с биохимическим путем передачи сигнала, являются предпочтительными для осуществления вышеупомянутых анализов белка. При необходимости можно использовать антитела, которые обеспечивают распознавание конкретного типа посттрансляционных модификаций (например, модификации, индуцируемые биохимическим путем передачи сигнала). Посттрансляционные модификации включают без ограничения гликозилирование, липидизацию, ацетилирование и фосфорилирование. Эти антитела можно приобрести у коммерческих поставщиков. Например, антитела к фосфотирозину, которые обеспечивают специфичное распознавание фосфорилированных по тирозину белков, доступны от ряда поставщиков, включая Invitrogen и Perkin Elmer. Антитела к фосфотирозину являются особенно применимыми при выявлении белков, которые различным образом фосфорилируются по их тирозиновым остаткам в ответ на стресс ER (эндоплазматического ретикулума). Такие белки включают без ограничения эукариотический фактор инициации трансляции 2 альфа (eIF-2α). Альтернативно эти антитела можно получить с помощью традиционных технологий получения поликлональных или моноклональных антител посредством иммунизации животного-хозяина или клетки, продуцирующей антитела, целевым белком, который характеризуется необходимой посттрансляционной модификацией.

При осуществлении заявленного способа на практике может быть необходимо определить профиль экспрессии белка, ассоциированного с биохимическим путем передачи сигнала, в различных тканях организма, в различных типах клеток и/или в различных субклеточных структурах. Данные исследования можно проводить с применением тканеспецифичных, специфичных к определенным клеткам или специфичных к определенным субклеточным структурам антител, способных связываться с белковыми маркерами, которые преимущественно экспрессируются в определенных тканях, типах клеток или субклеточных структурах.

Измененную экспрессию гена, ассоциированного с биохимическим путем передачи сигнала, также можно определять с помощью исследования изменения активности продукта гена по сравнению с контрольной клеткой. Анализ индуцированного определенным средством изменения активности белка, ассоциированного с биохимическим путем передачи сигнала, будет зависеть от биологической активности и/или исследуемого пути передачи сигнала. Например, если белок представляет собой киназу, изменение его способности фосфорилировать субстрат(субстраты) на последующих стадиях можно определять посредством ряда анализов, известных из уровня техники. Иллюстративные анализы включают без ограничения иммуноблоттинг и иммунопреципитацию с использованием антител, таких как антитела к фосфотирозину, которые обеспечивают распознавание фосфорилированных белков. Кроме того, активность киназы можно выявлять с помощью высокопроизводительных хемилюминесцентных анализов, как, например, анализов AlphaScreen™ (доступный от Perkin Elmer) и eTag™ (Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174).

Если белок, ассоциированный с биохимическим путем передачи сигнала, является частью сигнального каскада, который приводит к колебанию внутриклеточных условий pH, молекулы, чувствительные к pH, например, флуоресцентные pH-чувствительные красители, можно использовать в качестве репортерных молекул. В другом примере, если белок, ассоциированный с биохимическим путем передачи сигнала, представляет собой ионный канал, можно отслеживать колебания мембранного потенциала и/или внутриклеточной концентрации ионов. Ряд коммерческих наборов и высокопроизводительных устройств являются особенно подходящими для быстрого и надежного скрининга модуляторов ионных каналов. Иллюстративные инструменты включают FLIPRTM (Molecular Devices, Inc.) и VIPR (Aurora Biosciences). Эти инструменты способны обеспечивать одновременное выявление реакций в более чем 1000 лунках с образцом в микропланшете и обеспечивать измерение в реальном времени и функциональные данные в течение секунды или даже миллисекунды.

При осуществлении на практике любых способов, раскрытых в данном документе, подходящий вектор можно вводить в клетку или эмбрион посредством одного или нескольких способов, известных из уровня техники, в том числе без ограничения микроинъекции, электропорации, сонопорации, баллистической трансфекции, трансфекции, опосредованной фосфатом кальция, трансфекции с помощью катионных липидных частиц, липосомной трансфекции, трансфекции с помощью дендримеров, трансфекции посредством теплового шока, трансфекции посредством нуклеофекции, магнитофекции, липофекции, импалефекции, оптической трансфекции, поглощения нуклеиновых кислот, стимулируемого проприетарным средством, и доставки с помощью липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах вектор вводят в эмбрион посредством микроинъекции. Можно осуществлять микроинъекцию вектора или векторов в ядро или цитоплазму эмбриона. В некоторых способах вектор или векторы можно вводить в клетку посредством нуклеофекции.

Целевой локус, целевой полинуклеотид; последовательность PAM

Целевым полинуклеотидом для комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Целью может быть контрольный элемент, или регуляторный элемент, или промотор, или энхансер, или сайленсер. В некоторых вариантах осуществления промотор может находиться в участке +200 п.о. или даже +1000 п.о. от TTS. В некоторых вариантах осуществления регуляторным участком может быть энхансер. Энхансер, как правило, занимает более чем +1000 п.о. от TTS. Более конкретно, экспрессия эукариотических кодирующих белок генов, как правило, регулируется посредством многочисленных цис-действующих участков контроля транскрипции. Некоторые контрольные элементы располагаются близко к сайту старта (промотор-проксимальные элементы), тогда как другие располагаются дальше (энхансеры и сайленсеры). Промоторы определяют сайт инициации транскрипция и управляют связыванием РНК-полимеразы II. Три типа промоторных последовательностей были идентифицированы ы эукариотической ДНК. TATA-бокс чаще всего преобладает в быстро транскрибируемых генах. Инициирующие промоторы редко встречаются в некоторых генах, а CpG-островки характерны для транскрибируемых генов. Промотор-проксимальные элементы встречаются в пределах ≈200 пар оснований сайта старта. Некоторые такие элементы, содержащие до ≈20 пар оснований, могут помогать регулировать конкретный ген. Энхансеры, которые составляют, как правило, ≈100-200 пар оснований в дину, содержат множество контрольных элементов по 8-20 п.о. Они могут быть размещены на расстоянии от 200 пар оснований до десятков тысяч пар оснований выше или ниже промотора, в интроне или ниже конечного экзона в гене.· Промотор-проксимальные элементы и энхансеры могут быть специфическими в отношении типа клеток, функционируя только в определенных типах дифференцированных клеток. Однако любая из этих областей может быть целевой последовательностью и охватываться концепцией того, что мишенью может быть контрольный элемент, или регуляторный элемент, или промотор, или энхансер, или сайленсер.

Как правило, в контексте эндогенной системы нацеливания на нуклеиновую кислоту образование комплекса нацеливания на нуклеиновую кислоту (содержащего направляющую РНК, гибридизированную с целевой последовательностью и образующую комплекс с одним или несколькими эффекторными белками для нацеливания на нуклеиновую кислоту) приводит к расщеплению одной или обеих нитей ДНК или РНК в (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. Используемый в данном документе термин "последовательность (последовательности), ассоциированная (ассоциированные) с представляющим интерес целевым локусом" относится к последовательностям рядом с окружающим пространством целевой последовательности (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или больше пар оснований от целевой последовательности, при этом целевая последовательность содержится в представляющем интерес целевом локусе).

Не вдаваясь в теорию, полагают, что целевая последовательность должна быть ассоциирована с PAM (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Точные требования к последовательности и к длине для PAM различаются в зависимости от используемого фермента CRISPR, но PAM обычно представляют собой последовательности длиной 2-5 пар оснований, расположенных рядом с протоспейсером (то есть целевой последовательностью). Примеры последовательностей PAM приводятся в разделе Примеры ниже, и специалист в данной области сможет идентифицировать дополнительные последовательности PAM для применения с данным ферментом CRISPR. Кроме того, конструирование взаимодействующего с PAM (PI) домена может обеспечить программирование специфичности в отношении PAM, улучшить точность распознавания целевого сайта и повысить универсальность платформы конструирования генома Cas, например, Cas9. Белки Cas, такие как белки Cas9, можно конструировать с изменением их специфичности в отношении PAM, например, как описывается у Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом, вследствие чего указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения. В одном аспекте настоящее изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.

Действительно, в любом аспекте настоящего изобретения комплекс CRISPR может содержать фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью, где указанная направляющая последовательность может быть связана с парной tracr-последовательностью, которая, в свою очередь, может гибридизироваться с tracr-последовательностью.

Настоящее изобретение относится к конструированию и оптимизации систем, способов и композиций, применяемых для контроля экспрессии генов, включающего целенаправленное воздействие на последовательность, такое как внесение изменений в геном или редактирование генов, связанное с системой CRISPR-Cas и ее компонентами. Ферментом Cas является Cas9. Преимущество способов по настоящему изобретению заключается в том, что система CRISPR сводит к минимуму или исключает нецелевое связывание и возникающие в результате этого побочные эффекты. Это достигается при использовании систем, предусматривающих наличие высокой степени специфичности к последовательности в отношении целевой ДНК.

Что касается комплекса или системы CRISPR-Cas, предпочтительно, чтобы tracr-последовательность имела одну или несколько шпилек и имела длину 30 или более нуклеотидов, 40 или более нуклеотидов или 50 или более нуклеотидов; при этом направляющая последовательность имеет длину от 10 до 30 нуклеотидов, а фермент CRISPR/Cas представляет собой фермент Cas9 II типа.

Целевой полинуклеотид для комплекса CRISPR может включать ряд ассоциированных с заболеваниями генов и полинуклеотидов, а также генов и полинуклеотидов, ассоциированных с биохимическими путями передачи сигнала, которые перечислены в предварительных заявках на патент США 61/736527 и 61/748427 с общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, и BI-2011/008/WSGR, номер в реестре 44063-701.102, соответственно, обе озаглавленные "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 12 декабря 2012 г. и 2 января 2013 г. соответственно, каждое содержание из которых включено в данный документ с помощью ссылки во всей их полноте.

Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическим путем передачи сигнала, к примеру, ген или полинуклеотид, ассоциированный с биохимическим путем передачи сигнала. Примеры целевых полинуклеотидов включают ассоциированный с заболеванием ген или полинуклеотид. "Ассоциированный с заболеванием" ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при аномально высоком уровне; это может быть ген, который начинает экспрессироваться при аномально низком уровне, где измененная экспрессия коррелирует с появлением и/или прогрессированием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию (мутации) или генетическую вариацию, который непосредственно ответственен или находится в неравновесном сцеплении с геном (генами), ответственным (ответственными) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут присутствовать на нормальном или аномальном уровне.

Скрининг полногеномного нокаута

Белки и системы CRISPR-Cas, описываемые в данном документе, могут быть использованы для выполнения эффективных и экономичных функциональных геномных тестов. Для таких тестов можно использовать полногеномные библиотеки CRISPR-Cas. Такие тесты и библиотеки могут обеспечить определение функции генов, вовлечение генов клеточных путей, и того, как какое-либо изменение в экспрессии гена может привести к определенному биологическому процессу. Преимущество настоящего изобретения заключается в том, что система CRISPR исключает нецелевое связывание и возникающие в результате этого побочные эффекты. Это достигается при использовании систем, предусматривающих наличие высокой степени специфичности к последовательности в отношении целевой ДНК.

Полногеномная библиотека может содержать множество направляющих РНК системы CRISPR-Cas, описываемых в данном документе, содержащих направляющие последовательности, которые способны нацеливаться на множество целевых последовательностей во множестве локусов генома в популяции эукариотических клеток. Популяцией клеток может быть популяция эмбриональных стволовых (ES) клеток. Целевой последовательностью в локусе генома может быть некодирующая последовательность. Некодирующей последовательностью может быть интрон, регуляторная последовательность, сайт сплайсинга, 3'-UTR, 5'-UTR или сигнал полиаденилирования. Функция гена одного или нескольких продуктов генов может быть изменена указанным нацеливанием. Нацеливание может приводить к нокауту функции гена. Нацеливание на продукт гена может предусматривать более чем одну направляющую РНК. На продукт гена можно нацеливаться с помощью 2, 3, 4, 5, 6, 7, 8, 9 или 10 направляющих РНК, предпочтительно 3-4 на ген. Нецелевые модификации могут быть минимизированы (см., например, DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013)), включенную в данный документ посредством ссылки. Нацеливание может предусматривать приблизительно 100 или более последовательностей. Нацеливание может предусматривать приблизительно 1000 или более последовательностей. Нацеливание может предусматривать приблизительно 20 000 или более последовательностей. Нацеливание может предусматривать полный геном. Нацеливание может предусматривать панель целевых последовательностей, ориентированных на релевантном или желательном пути. Путь может быть иммунным путем. Путь может быть путем клеточного деления.

Один аспект настоящего изобретения охватывает полногеномную библиотеку, которая может содержать множество направляющих РНК системы CRISPR-Cas, которое может содержать направляющие последовательности, способные нацеливаться на множество целевых последовательностей во множестве локусов генома, где указанное нацеливание приводит к нокауту функции гена. Эта библиотека потенциально может содержать направляющие РНК, которые нацеливаются на каждый без исключения ген в геноме организма.

В некоторых вариантах осуществления по настоящему изобретению организм или субъект является эукариотом (в том числе млекопитающим, в том числе человеком), или эукариотическим организмом, отличным от человека, или отличным от человека животным, или отличным от человека млекопитающим. В некоторых вариантах осуществления организм или субъект является отличным от человека животным и может быть членистоногим, например, насекомым, или может быть нематодой. В некоторых способах по настоящему изобретению организм или субъект является растением. В некоторых способах по настоящему изобретению организм или субъект является млекопитающим или отличным от человека млекопитающим. Отличное от человека млекопитающее может быть, например, грызуном (предпочтительно мышью или крысой), копытным или приматом. В некоторых способах по настоящему изобретению организм или субъект является водорослью, в том числе микроводорослью, или является грибом.

Нокаут функции гена может предусматривать введение в каждую клетку в популяции клеток векторной системы из одного или нескольких векторов, содержащих сконструированную, не встречающуюся в природе систему CRISPR-Cas, содержащую I. белок Cas и II. одну или несколько направляющих РНК, где компоненты I и II могут находиться на одном и том же или на разных векторах системы, вводящей компоненты I и II в каждую клетку, где направляющая последовательность нацеливается на уникальный ген в каждой клетке, где белок Cas функционально связан с регуляторным элементом, где при транскрибировании направляющая РНК, содержащая направляющую последовательность, управляет специфичным к последовательности связыванием системы Cas CRISPR-Cas с целевой последовательностью в локусах генома уникального гена с индуцированием расщепления локуса генома белком Cas и подтверждением разных нокаутных мутаций во множестве уникальных генов в каждой клетке популяция клеток с образованием тем самым библиотеки клеток с нокаутным геном. Настоящее изобретение предусматривает, что популяцией клеток является популяция эукариотических клеток, а в предпочтительном варианте осуществления популяцией клеток является популяция эмбриональных стволовых (ES) клеток.

Одним или несколькими векторами могут быть плазмидные векторы. Вектором может быть один вектор, содержащий Cas9, sgRNA и необязательно селекционный маркер в целевых клетках. Без углубления в теорию способность одновременно доставлять Cas9 и sgRNA с помощью одного вектора обеспечивает применение для любого представляющего интерес типа клеток, без необходимости сначала создавать линии клеток, которые экспрессируют Cas9. Регуляторным элементом может быть индуцируемый промотор. Индуцируемый промотор может представлять собой доксициклиновый индуцируемый промотор. В некоторых способах по настоящему изобретению экспрессия направляющей последовательности находится под контролем промотора T7 и управляется экспрессией полимеразы T7. Подтверждение различных нокаутных мутаций можно осуществлять полноэкзомным секвенированием. Нокаутная мутация может быть достигнута в 100 или больше уникальных генов. Нокаутная мутация может быть достигнута в 1000 или больше уникальных генов. Нокаутная мутация может быть достигнута в 20000 или больше уникальных генов. Нокаутная мутация может быть достигнута во всем геноме. Нокаут функции гена может быть достигнут во множестве уникальных генов, которые функционируют в конкретном физиологическом пути или состоянии. Путь или состояние может быть иммунным путем или состоянием. Путь или состояние может быть путем или состоянием клеточного деления.

Настоящее изобретение также относится к набору, который содержит полногеномные библиотеки, упоминаемые в данном документе. Набор может содержать один контейнер, содержащий векторы или плазмиды, содержащие библиотеку в соответствии с настоящим изобретением. Набор также может содержать панель, предусматривающую отбор уникальных направляющих РНК системы CRISPR-Cas, содержащих направляющие последовательности из библиотеки в соответствии с настоящим изобретением, где отбор указывает на конкретное физиологическое состояние. Настоящее изобретение предусматривает то, что нацеливание составляет приблизительно 100 или больше последовательностей, приблизительно 1000 или больше последовательностей или приблизительно 20000 или больше последовательностей или весь геном. Кроме того, панель целевых последовательностей может быть ориентирована на релевантный или желаемый путь, такой как иммунный путь или клеточное деление.

В дополнительном аспекте настоящего изобретения фермент Cas9 может содержать одну или несколько мутаций, и его можно применять в качестве стандартного ДНК-связывающего белка, слитого или не слитого с функциональным доменом. Мутации могут представлять собой мутации, введенные искусственным образом, или мутации приобретения или потери функции. Мутации могут включать без ограничения мутации в одном из каталитических доменов (D10 и H840) среди каталитических доменов RuvC и HNH соответственно. Были охарактеризованы дополнительные мутации. В одном аспекте настоящего изобретения функциональным доменом может быть домен активации транскрипции, которым может быть VP64. В других аспектах настоящего изобретения функциональным доменом может быть домен репрессии транскрипции, которым может быть KRAB или SID4X. Другие аспекты настоящего изобретения относятся к мутированному ферменту Cas9, слитому с доменами, которые включают без ограничения активатор транскрипции, репрессор транскрипции, рекомбиназу, транспозазу, фактор ремоделирования гистонов, деметилазу, ДНК-метилтрансферазу, криптохром, домен, индуцируемый/регулируемый светом, или домен, индуцируемый/регулируемый химическими веществами. Некоторые способы в соответствии с настоящим изобретением могут предусматривать индуцирование экспрессии целевых генов. В одном варианте осуществления индуцирование экспрессии путем нацеливания на множество целевых последовательностей во множестве локусов генома в популяции эукариотических клеток осуществляется путем применения функционального домена.

При осуществлении настоящего изобретения полезно учитывать следующие ссылки:

Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print]; опубликовано в окончательной отредактированной форме как: Science. 2014 Jan 3; 343(6166): 84-87.

Shalem et al. описали новый способ исследования функций генов в полногеномном масштабе. Их исследования показали, что доставка библиотеки CRISPR-Cas9 для нокаута в масштабе генома (GeCKO), целенаправленно воздействующей на 18080 генов, с 64751 уникальной направляющей последовательностью обеспечивала скрининг путем как положительного, так и отрицательного отбора в клетках человека. Во-первых, авторы показали применение библиотеки GeCKO для идентификации генов, существенных для жизнеспособности клеток у раковых и плюрипотентных стволовых клеток. Далее, в модели меланомы, авторы провели скрининг генов, утрата функций которых вовлечена в устойчивость к вемурафенибу, терапевтическому средству, ингибирующему мутантную протеинкиназу BRAF. Их исследования показали, что кандидаты высшего ранга включали ранее подтвержденные гены NF1 и MED12, а также новые хиты NF2, CUL3, TADA2B и TADA1. Авторы наблюдали высокий уровень согласованности между независимыми направляющими РНК, осуществляющими нацеливание на один и тот же ген, и высоким показателем подтверждения хитов и, таким образом, продемонстрировали перспективность скрининга с помощью Cas9 в масштабе генома.

Также можно упомянуть в качестве ссылок заявку на патент США № US20140357530 и патентную публикацию PCT № WO2014093701, включенные тем самым в данный документ посредством ссылки.

Функциональное изменение и скрининг

В некоторых вариантах осуществления один или несколько функциональных доменов ассоциируются с ферментом CRISPR, например, ферментом Cas9 II типа.

В некоторых вариантах осуществления один или несколько функциональных доменов ассоциируются с адаптерным белком, например, как используется с модифицированными направляющими у Konnerman et al. (Nature 517, 583-588, 29 January 2015).

В некоторых вариантах осуществления один или несколько функциональных доменов ассоциируются с dead-sgRNA (dRNA). В некоторых вариантах осуществления комплекс dRNA с активным Cas9 управляет генной регуляцией с помощью функционального домена в одном генном локусе, тогда как sgRNA управляет расщеплением ДНК с помощью активного Сas9 в другом локусе, например, как у Dahlman et al., ‘Orthogonal gene control with a catalytically active Cas9 nuclease' (in press). В некоторых вариантах осуществления dRNA отбирают для обеспечения максимальной селективности регуляции для представляющего интерес генного локуса по сравнению с нецелевой регуляцией. В некоторых вариантах осуществления dRNA отбирают для обеспечения максимальной регуляции целевого гена и минимального целевого расщепления.

Для целей следующего обсуждения эталоном функционального домена может быть функциональный домен, ассоциированный с ферментом CRISPR, или функциональный домен, ассоциированный с адаптерным белком.

При осуществлении настоящего изобретения петли в sgRNA могут быть увеличены без перекрывания с белком Cas9 путем вставки другой петли (петель) РНК или другой последовательности (последовательностей), которая (которые) может (могут) рекрутировать адаптерные белки, которые могут связываться с другой петлей (петлями) РНК или другой последовательностью (последовательностями). Адаптерные белки могут включать без ограничения комбинации ортогональный связывающий РНК белок/аптамер, которые встречаются во множестве белков оболочки бактериофагов. Перечень таких белков оболочки включает без ограничения Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s и PRR1. Такие адаптерные белки или ортогональные связывающие РНК белки могут дополнительно ректурировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов. В некоторых вариантах осуществления функциональный домен может быть выбран из группы, состоящей из домена транспозазы, домена интегразы, домена рекомбиназы, домена резольвазы, домена инвертазы, домена протеазы, домена ДНК-метилтрансферазы, домена ДНК-гидроксилметилазы, домена ДНК-деметилазы, домена гистонацетилазы, домена гистондеацетилазы, нуклеазного домена, репрессорного домена, активаторного домена, доменов сигнала ядерной локализации, домена регуляторного белка транскрипции (или вовлечения транскрипционного комплекса), ассоциированного с активностью клеточного поглощения домена, домена связывания нуклеиновой кислоты, домена представления антитела, модифицирующих гистоны ферментов, рекрутера модифицирующих гистоны ферментов; ингибитора модифицирующих гистоны ферментов, гистонметилтрансферазы, гистондеметилазы, гистонкиназы, гистонфосфатазы, гистонрибозилазы, гистондерибозилазы, гистонубиквитиназы, гистондеубиквитиназы, гистонбиотиназы и протеазы гистонового хвоста. В некоторых предпочтительных вариантах осуществления функциональным доменом является домен активации транскрипции, такой как без ограничения VP64, p65, MyoD1, HSF1, RTA, SET7/9 или гистонацетилтрансфераза. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.

В некоторых вариантах осуществления один или несколько функциональных доменов представляют собой NLS (последовательность ядерной локализации) или NES (сигнал ядерного экспорта). В некоторых вариантах осуществления один или несколько функциональных доменов представляют собой домен активации транскрипции, который включает в себя VP64, p65, MyoD1, HSF1, RTA, SET7/9 и гистонацетилтрансферазу. Другие упоминания в данном документе доменов активации (или активатора) в отношении доменов, ассоциированных с ферментом CRISPR, включают в себя любой известный домен активации транскрипции и, в частности, VP64, p65, MyoD1, HSF1, RTA, SET7/9 или гистонацетилтрансферазу.

В некоторых вариантах осуществления один или несколько функциональных доменов представляют собой домен репрессии транскрипции. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой домен KRAB. В определенных вариантах осуществления домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X.

В некоторых вариантах осуществления один или несколько функциональных доменов характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК, активность интеграции ДНК или активность связывания нуклеиновой кислоты.

Домены, модифицирующие гистоны, также являются предпочтительными в некоторых вариантах осуществления. Иллюстративные домены, модифицирующие гистоны, обсуждаются ниже. Домены транспозазы, домены механизма HR (гомологичной рекомбинации), домены рекомбиназы и/или домены интегразы также являются предпочтительными в качестве функциональных доменов по настоящему изобретению. В некоторых вариантах осуществления активность интеграции ДНК имеют домены механизма HR, домены интегразы, домены рекомбиназы и/или домены транспозазы. Гистонацетилтрансфераза является предпочтительной в некоторых вариантах осуществления.

В определенных вариантах осуществления активность расщепления ДНК обусловлена нуклеазой. В некоторых вариантах осуществления нуклеаза содержит нуклеазу Fok1. См. "Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014) в отношении направляемых димерной РНК нуклеаз FokI, которые распознают продленные последовательности и могут редактировать эндогенные гены с высокой эффективностью в человеческих клетках.

В некоторых вариантах осуществления один или несколько функциональных доменов присоединяются к ферменту CRISPR так, что при связывании с sgRNA и целью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией.

В некоторых вариантах осуществления один или несколько функциональных доменов присоединяются к адаптерному белку так, что при связывании фермента CRISPR с sgRNA и целью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией.

В одном аспекте настоящее изобретение относится к композиции, обсуждаемой в данном документе, где один или несколько функциональных доменов присоединяются к ферменту CRISPR или адаптерному белку через линкер, необязательно линкер GlySer, как обсуждается в данном документе.

Эндогенная репрессия транскрипции зачастую опосредуется модифицирующими хроматин ферментами, такими как гистонметилтрансферазы (HMT) и деацетилазы (HDAC). Типичная гистоновые эффекторные домены известны, и иллюстративный перечень представлен ниже. В иллюстративной таблице упоминаются белки и функциональные усечения небольших размеров для облегчения эффективной вирусной упаковки (например, посредством AAV). В целом, однако, домены могут включать в себя HDAC, гистонметилтрансферазы (HMT) и ингибиторы гистонацетилтрансферазы (HAT), а также вовлекающие HDAC и HMT белки. Функциональный домен может представлять собой или включать в некоторых вариантах осуществления эффекторные домены HDAC, рекрутерные эффекторные домены HDAC, эффекторные домены гистонметилтрансферазы (HMT), рекрутерные эффекторные домены гистонметилтрансферазы (HMT) или ингибиторные эффекторные домены гистонацетилтрансферазы.

Эффекторные домены HDAC

Подтип/
Комплекс
Название Субстрат (если известен) Модифика-ция (если известна) Организм Пол-ный размер (aa) Выбранное усечение (aa) Конеч-ный размер (aa) Каталити-ческих
домен
HDAC I HDAC8 - - X. laevis 325 1-325 325 1-272: HDAC
HDAC I RPD3 - - S. cerevisiae 433 19-340 322 (Vannier) 19-331: HDAC
HDAC IV MesoLo4 - - M. loti 300 1-300 (Gregoretti) 300 -
HDAC IV HDAC11 - - H. sapiens 347 1-347 (Gao) 347 14-326: HDAC
HD2 HDT1 - - A. thaliana 245 1-211 (Wu) 211 -
SIRT I SIRT3 H3K9Ac
H4K16Ac
H3K56Ac
- H. sapiens 399 143-399 (Scher) 257 126-382: SIRT
SIRT I HST2 - - C. albicans 331 1-331 (Hnisz) 331 -
SIRT I CobB - - E. coli (K12) 242 1-242 (Landry) 242 -
SIRT I HST2 - - S. cerevisiae 357 8-298 (Wilson) 291 -
SIRT III SIRT5 H4K8Ac
H4K16Ac
- H. sapiens 310 37-310 (Gertz) 274 41-309: SIRT
SIRT III Sir2A - - P. falciparum 273 1-273 (Zhu) 273 19-273: SIRT
SIRT IV SIRT6 H3K9Ac
H3K56Ac
- H. sapiens 355 1-289 (Tennen) 289 35-274: SIRT

Следовательно, репрессорные домены в соответствии с настоящим изобретением могут быть выбраны из гистонметилтрансфераз (HMT), гистондеацетилаз (HDAC), ингибиторов гистонацетилтрансферазы (HAT), а также вовлекающих HDAC и HMT белков.

Доменом HDAC может быть любой из доменов в представленной выше таблице, а именно HDAC8, RPD3, MesoLo4, HDAC11, HDT1, SIRT3, HST2, CobB, HST2, SIRT5, Sir2A или SIRT6.

В некотором варианте осуществления функциональным доменом может быть рекрутерный эффекторный домен HDAC. Предпочтительные примеры включают в себя домены в представленной ниже таблице, а именно MeCP2, MBD2b, Sin3a, NcoR, SALL1, RCOR1. NcoR является типичным в примерах настоящего изобретения, и, хотя является предпочтительным, предусматривается, что также будут применимыми и другие домены из класса.

Таблица рекрутерных эффекторных доменов HDAC

Подтип/
Комплекс
Название Субстрат (если известен) Модификация (если известна) Организм Полный размер (aa) Выбранное усечение (aa) Конечный размер (aa) Каталити-ческих
домен
Sin3a MeCP2 - - R. norvegicus 492 207-492 (Nan) 286 -
Sin3a MBD2b - - H. sapiens 262 45-262 (Boeke) 218 -
Sin3a Sin3a - - H. sapiens 1273 524-851 (Laherty) 328 627-829: Взаимодей-ствие HDAC1
NcoR NcoR - - H. sapiens 2440 420-488 (Zhang) 69 -
NuRD SALL1 - - M. musculus 1322 1-93 (Lauberth) 93 -
CoREST RCOR1 - - H. sapiens 482 81-300 (Gu, Ouyang) 220 -

В некотором варианте осуществления функциональным доменом может быть эффекторный домен метилтрансферазы (HMT). Предпочтительные примеры включают в себя домены в представленной ниже таблице, а именно NUE, vSET, EHMT2/G9A, SUV39H1, dim-5, KYP, SUVR4, SET4, SET1, SETD8 и TgSET8. NUE является типичным в примерах настоящего изобретения, и, хотя является предпочтительным, предусматривается, что также будут применимыми и другие домены из класса.

Таблица эффекторных доменов гистонметилтрансферазы (HMT)

Подтип/
Комплекс
Назва-
ние
Субстрат (если известен) Модифика-
ция (если известна)
Организм Полный
размер (aa)
Выбранное
усечение (aa)
Конечный
размер (aa)
Каталити-
ческих
домен
SET NUE H2B, H3, H4 - C. trachomatis 219  1-219 (Pennini) 219 -
SET vSET - H3K27me3 P. bursaria chlorella virus 119 1-119 (Mujtaba) 119 4-112: SET2
Семейство
SUV39
EHMT2/
G9A
H1.4K2, H3K9, H3K27 H3K9me1/2, H1K25me1 M. musculus 1263 969-1263 (Tachibana) 295 1025-1233: preSET, SET, postSET
SUV39 SUV39H1 - H3K9me2/3 H. sapiens 412 79-412 (Snowden) 334 172-412: preSET, SET, postSET
Suvar3-9 dim-5 - H3K9me3 N. crassa 331 1-331 (Rathert) 331 77-331: preSET, SET, postSET
Suvar3-9 (подсе-мейство SUVH) KYP - H3K9me1/2 A. thaliana 624 335-601 267 (Jackson) -
Suvar3-9 (подсе-мейство SUVR) SUVR4 H3K9me1 H3K9me2/3 A. thaliana 492 180-492 313 (Thorstensen) 192-462: preSET, SET, postSET
Suvar4-20 SET4 - H4K20me3 C. elegans 288 1-288 (Vielle) 288 -
SET8 SET1 - H4K20me1 C. elegans 242 1-242 (Vielle) 242 -
SET8 SETD8 - H4K20me1 H. sapiens 393  185-393 209 (Couture) 256-382: SET
SET8 TgSET8 - H4K20me1/2/3 T. gondii 1893  1590-1893 (Sautel) 304 1749-1884: SET

В некотором варианте осуществления функциональным доменом может быть рекрутерный эффекторный домен гистонметилтрансферазы (HMT). Предпочтительные примеры включают в себя домены в представленной ниже таблице, а именно Hp1a, PHF19 и NIPP1.

Таблица рекрутерных эффекторных доменов гистонметилтрансферазы (HMT)

Подтип/
Комплекс
Назва-ние Субстрат (если известен) Модификация (если известна) Организм Полный размер (aa) Выбранное усечение (aa) Конечный размер (aa) Каталитических домен
- Hp1a - H3K9me3 M. musculus 191 73-191 119 (Hathaway) 121-179: chromoshadow
- PHF19 - H3K27me3 H. sapiens 580 (1-250) + GGSG линкер + (500-580) 335 (Ballaré) 163-250: PHD2
- NIPP1 - H3K27me3 H. sapiens 351 1-329 (Jin) 329 310-329: EED

В некотором варианте осуществления функциональным доменом может быть ингибиторный эффекторный домен гистонацетилтрансферазы. Предпочтительные примеры включают в себя SET/TAF-1β, приведенные в таблице ниже.

Таблица ингибиторных эффекторных доменов гистонацетилтрансферазы

Подтип/
Комплекс
Название Субстрат (если известен) Модификация (если известна) Организм Полный размер (aa) Выбранное усечение (aa) Конечный размер (aa) Каталити-ческих домен
- SET/TAF-1β - - M. musculus 289 1-289 (Cervoni) 289 -

Также предпочтительным является нацеливание на эндогенные (регуляторные) контрольные элементы (такие как энхансеры и сайленсеры) в дополнение к промоторным или промотор-проксимальным элементам. Таким образом, настоящее изобретение также может быть использовано для нацеливания на эндогенные контрольные элементы (в том числе энхансеры и сайленсеры) в дополнение к нацеливанию на промотор. Такие контрольные элементы могут быть расположены выше и ниже сайта начала транскрипции (TSS), начинающегося от 200 т. о. от TSS до 100 т. о. Нацеливание на известные контрольные элементы может быть использовано для активации или подавления представляющего интерес гена. В некоторых случаях один контрольный элемент может влиять на транскрипцию нескольких целевых генов. Поэтому нацеливание на один контрольный элемент может быть использовано для контроля транскрипции нескольких генов одновременно.

С другой стороны, нацеливание на предполагаемые контрольные элементы (например, путем перекрывания области предполагаемого контрольного элемента, а также от 200 п.о. до 100 т.о. около элемента) может быть использовано как средство для подтверждения таких элементов (путем измерения транскрипции представляющего интерес гена) или для выявления новых контрольных элементов (например, путем перекрывания 100 т.о. выше и ниже TSS представляющего интерес гена). Кроме того, нацеливание на предполагаемые контрольные элементы может быть применимо в контексте понимания генетических причин заболевания. Многие мутации и общие варианты SNP, ассоциированные с фенотипами заболеваний, располагаются вне кодирующих областей. После нацеливания на такие области с системами либо активации, либо подавления, описываемыми в данном документе, может следовать считывание транскрипции либо a) ряда предполагаемых мишеней (например, ряда генов, расположенных в тесной близости к контрольному элементу), либо b) полнотранскриптомное считывание, например, с помощью RNAseq или микрочипа. Это позволило бы идентифицировать вероятные кандидатные гены, вовлеченные в фенотип заболевания. Такие кандидатные гены могут быть применимы в качестве новых мишеней лекарственных средств.

В данном документе упоминаются ингибиторы гистонацетилтрансферазы (HAT). Однако альтернативой в некоторых вариантах осуществления является то, что один или несколько функциональных доменов содержат ацетилтрансферазу, предпочтительно гистонацетилтрансферазу. Они применимы в области эпигеномики, например, в способах детального исследования эпигенома. Способы детального исследования эпигенома могут предусматривать, например, нацеливание на эпигеномные последовательности. Нацеливание на эпигеномные последовательности может включать в себя направляющую, направленную на эпигеномную целевую последовательность. Эпигеномная целевая последовательность может включать в себя в некоторых вариантах осуществления промотор, сайленсер или энхансерную последовательность.

Применение функционального домена, связанного с ферментом CRISPR-Cas, описываемым в данном документе, предпочтительно нефункционального Cas, более предпочтительно нефункционального Cas9, для нацеливания на эпигеномные последовательности может быть использовано для активации или подавления промоторов, сайленсера или энхансеров.

Примеры ацетилтрансфераз известны и могут включать в себя в некоторых вариантах осуществления гистонацетилтрансферазы. В некоторых вариантах осуществления гистонацетилтрансфераза может содержать каталитическое ядро человеческой ацетилтрансферазы p300 (Gerbasch & Reddy, Nature Biotech 6th April 2015).

В некоторых предпочтительных вариантах осуществления функциональный домен связывается с ферментом нефункциональным Cas9 для нацеливания на эпигеномные последовательности, такие как промоторы или энхансеры, и их активации. Одна или несколько направляющих, направленных на такие промоторы или энхансеры, также могут быть обеспечены для управления связывания фермента CRISPR с такими промоторами или энхансерами.

Термин "ассоциированный с" используют в настоящем документе в отношении ассоциации функционального домена с ферментом CRISPR или адаптерным белком. Он используется в отношении того, как одна молекула "связывается" по отношению к другой, например, между адаптерным белком и функциональным доменом или между ферментом CRISPR и функциональным доменом. В случае таких белок-белковых взаимодействий эту ассоциацию можно рассматривать с точки зрения распознавания как распознавание антителом эпитопа. Альтернативно один белок может быть ассоциирован с другим белком посредством слияния обоих, например, одна субъединица является слитой с другой субъединицей. Слияние обычно происходит путем добавления одной аминокислотной последовательности к другой, например, посредством сплайсинга нуклеотидных последовательностей, которые кодируют каждый белок или субъединицу. Альтернативно, по сути, это можно рассматривать как связывание двух молекул или прямую связь, например, белок слияния. В любом случае слитый белок может включать линкер между двумя представляющими интерес субъединицами (т.е. между ферментом и функциональным доменом или между адаптерным белком и функциональным доменом). Таким образом, в некоторых вариантах осуществления фермент CRISPR или адапторный белок ассоциируется с функциональным доменом путем связывания с ним. В других вариантах осуществления фермент CRISPR или адаптерный белок ассоциируется с функциональным доменом, поскольку два сливаются вместе, необязательно через промежуточный линкер.

Прикрепление функционального домена или слитого белка может быть выполнено через линкер, например, гибкий глицин-сериновый (GlyGlyGlySer), или (GGGS)3, или жесткий альфа-спиральный линкер, такой как (Ala(GluAlaAlaAlaLys)Ala). Линкеры, такие как (GGGGS)3, предпочтительно используют в данном документе для отделения белковых или пептидных доменов. (GGGGS)3 является предпочтительным, поскольку он является относительно длинным линкером (15 аминокислот). Глициновые остатки являются наиболее гибкими, а сериновые остатки повышают вероятность того, что линкер будет находится на внешней стороне белка. (GGGGS)6 (GGGGS)9 или (GGGGS)12 предпочтительно можно использовать в качестве альтернативных вариантов. Другими предпочтительными альтернативами являются (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10 или (GGGGS)11. Доступны альтернативные линкеры, но считается, что очень гибкие линкеры лучше обеспечивают максимальную возможность объединения двух 2 частей Cas9 и, таким образом, восстановления активности Cas9. Одной альтернативой является то, что NLS нуклеоплазмина можно использовать в качестве линкера. Например, линкер также можно использовать между Cas9 и каким-либо функциональным доменом. Опять-таки, в данном случае можно применять линкер (GGGGS)3 (или его варианты с 6, 9 или 12 повторами) или можно использовать NLS нуклеоплазмина в качестве линкера между Cas9 и функциональным доменом.

Насыщающий мутагенез

В отношении применения системы CRISPR-Cas в общем упоминаются документы, в том числе патентные заявки, патенты и патентные публикации, цитируемые по всему настоящему раскрытию, поскольку варианты осуществления настоящего изобретения могут применяться как в этих документах. Система(системы) CRISPR-Cas может быть использована для осуществления насыщающего или глубокосканирующего мутагенеза локусов генома вместе с клеточным фенотипом, например, для определения критических минимальных признаков и дискретных повреждаемостей функциональных элементов, необходимых для экспрессии гена, устойчивости к лекарственному средству и обратимости заболевания. Под насыщающим или глубокосканирующим мутагенезом подразумевается то, что каждое или практически каждое основание ДНК разрезается в локусах генома. Библиотека направляющих РНК CRISPR-Cas может быть введена в популяцию клеток. Библиотека может быть введена так, что каждая клетка получает одиночную направляющую РНК (sgRNA). В том случае, если библиотеку вводят путем трансдукции вирусного вектора, описываемого в данном документе, используется низкая мультиплетность инфекции (MOI). Библиотека может включать в себя sgRNA, нацеливающиеся на каждую последовательность выше последовательности РАМ (смежного с протоспейсером мотива) в локусе генома. Библиотека может включать в себя по меньшей мере 100 неперекрывающихся геномных последовательностей выше последовательности PAM для каждых 1000 пар оснований в локусе генома. Библиотека может включать в себя нацеливающиеся последовательности sgRNA выше по меньшей мере одной другой последовательности PAM. Система(системы) CRISPR-Cas может(могут) включать в себя более чем один белок Cas. Можно применять любой белок Cas, описываемый в данном документе, в том числе ортологи или сконструированные белки Cas, которые распознают другие последовательности PAM. Частота нецелевых сайтов для sgRNA может составлять менее 500. Оценки нецелевых событий могут быть получены для отбора sgRNA с самым низким числом нецелевых сайтов. Любой фенотип, определенный как ассоциированный с разрезанием по целевому сайту sgRNA, может быть подтвержден с использованием нацеливания sgRNA на тот же сайт в одном эксперименте. Подтверждение целевого сайта также может быть выполнено с использованием никазы Cas9, описываемой в данном документе, и двух sgRNA, нацеливающихся на представляющий интерес сайт генома. Без углубления в теорию, целевой сайт представляет собой истинное совпадение, если в подтверждающих экспериментах наблюдают изменение в фенотипе.

Локусы генома могут включать в по меньшей мере один непрерывный участок генома. По меньшей мере один непрерывный участок генома может содержать даже полный геном. По меньшей мере один непрерывный участок генома может содержать функциональный элемент генома. Функциональный элемент может находиться в некодирующем участке, кодирующем участке, интронном участке, промоторе или энхансере. По меньшей мере один непрерывный участок генома может содержать по меньшей мере 1 т. о. предпочтительно по меньшей мере 50 т. о. геномной ДНК. По меньшей мере один непрерывный учаток генома может содержать сайт связывания фактора транскрипции. По меньшей мере один непрерывный учаток генома может содержать участок гиперчувствительности к ДНКазе I. По меньшей мере один непрерывный учаток генома может содержать транскрипционный энхансерный или репрессорный элемент. По меньшей мере один непрерывный учаток генома может содержать сайт, обогащенный эпигенетической сигнатурой. По меньшей мере один непрерывный учаток геномной ДНК может содержать эпигенетический инсулятор. По меньшей мере один непрерывный учаток генома может содержать два или более непрерывных геномных участка, которые взаимодействуют физически. Участки генома, которые взаимодействуют, могут быть определены с помощью ‘технологии 4C'. Технология 4C обеспечивает возможность скрининга всего генома объективным образом на предмет сегментов ДНК, которые взаимодействуют физически с выбранным фрагментом ДНК, как описано у Zhao et al. ((2006) Nat Genet 38, 1341-7) и в патенте США № 8642295, оба из которых включены в данный документ посредством ссылки во всей своей полноте. Эпигенетической сигнатурой может быть гистонацетилирование, гистонметилирование, гистонубиквитинирование, гистонфосфорилирование, метилирование ДНК или отсутствие таковых.

Систему(системы) CRISPR-Cas для насыщающего или глубокосканируещего мутагенеза можно применять в популяции клеток. Систему(системы) CRISPR-Cas можно применять в эукариотических клетках, в том числе без ограничения в клетках млекопитающих и растений. Популяцией клеток могут быть прокариотические клетки. Популяцией эукариотических клеток может быть популяция эмбриональных стволовых (ES) клеток, нейронных клеток, эпителиальных клеток, иммунных клеток, эндокринных клеток, мышечных клеток, эритроцитов, лимфоцитов, растительных клеток или дрожжевых клеток.

В одном аспекте настоящее изобретение относится к способу скрининга на предмет функциональных элементов, ассоциированных с изменением в фенотипе. Библиотека может быть введена в популяцию клеток, которые адаптированы с содержанием белка Cas. Клетки могут быть рассортированы по меньшей мере на две группы на основании фенотипа. Фенотипом может быть экспрессия гена, клеточный рост или клеточная жизнеспособность. Определяют относительное представление направляющих РНК, присутствующих в каждой группе, с определением тем самым сайтов генома, ассоциированных с изменением в фенотипе с помощью представления направляющих РНК, присутствующих в каждой группе. Изменением в фенотипе может быть изменение в экспрессии представляющего интерес гена. Представляющий интерес ген может быть активирован, подавлен или нокаутирован. Клетки могут быть рассортированы в группу с высокой экспрессией и группу с низкой экспрессией. Популяция клеток может содержать репортерную конструкцию, которую используют для определения фенотипа. Репортерная конструкция может включать выявляемый маркер. Клетки могут быть рассортированы с использованием выявляемого маркера.

В другом аспекте настоящее изобретение относится к способу скрининга на предмет сайтов генома, ассоциированных с устойчивостью к химическому соединению. Химическим соединением может быть лекарственное средство или пестицид. Библиотеку можно вводить в популяцию клеток, которые адаптированы с содержанием белка Cas, где каждая клетка популяции содержит не более чем одну направляющую РНК; при этом популяцию клеток обрабатывают химическим соединением и определяют представление направляющих РНК после обработки химическим соединением в более поздний момент времени по сравнению с ранним моментом времени, посредством чего определяют сайты генома, ассоциированные с устойчивостью к химическому соединению с помощью обогащения направляющих РНК. Представление sgRNA может быть определено способами глубокого секвенирования.

Применительно к осуществлению настоящего изобретения можно упомянуть статью под названием "BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis." Canver, M.C., Smith, E.C., Sher, F., Pinello, L., Sanjana, N.E., Shalem, O., Chen, D.D., Schupp, P.G., Vinjamur, D.S., Garcia, S.P., Luc, S., Kurita, R., Nakamura, Y., Fujiwara, Y., Maeda, T., Yuan, G., Zhang, F., Orkin, S.H., & Bauer, D.E. DOI:10.1038/nature15521, опубликованную онлайн 16 сентября 2015 г., при этом данная статья включена в данный документ посредством ссылки и кратко обсуждается ниже.

Canver et al. описывают новую библиотеку объединенных в пулы направляющих РНК CRISPR-Cas9 для выполнения in situ насыщающего мутагенеза человеческих и мышиных энхансеров эритроидного BCL11A, ранее идентифицированных как энхансер, ассоциированный с уровнем фетального гемоглобина (HbF), и мышиный ортолог которого необходим для экспрессии эритроидного BCL11A. Этот подход выявляет критические минимальные признаки и дискретные повреждаемости этих энхансеров. Посредством редактирования первичных клеток-предшественников человека и мышиного трансгеноза авторы подтвердили энхансер эритроидного BCL11A в качестве мишени для повторной индукции HbF. Авторы создали подробную карту энхансеров, которая предоставляет информацию о терапевтическом редактировании генома.

Способ использования систем CRISPR-Cas для модификации клетки или организма

Настоящее изобретение в некоторых вариантах осуществления охватывает способ модифицирования клетки или организма. Клетка может быть прокариотической клеткой или эукариотической клеткой. Клетка может быть клеткой млекопитающего. Клетка млекопитающего может быть клеткой отличного от человека примата, быка, свиньи, грызуна или мыши. Клетка может быть эукариотической клеткой от организма, отличного от млекопитающего, например, птицы, рыбы или креветки. Клетка также может быть растительной клеткой. Растительная клетка может происходить из культурного растения, такого как маниока, кукуруза, сорго, пшеница или рис. Растительная клетка также может происходить из водоросли, дерева или овощной культуры. Модификация, введенная в клетку с помощью настоящего изобретения, может быть такой, что клетка и потомство клетки изменяются для улучшения продуцирования биологических продуктов, таких как антитело, крахмал, спирт или другой желаемый клеточный продукт. Модификация, введенная в клетку с помощью настоящего изобретения, может быть такой, что клетка и потомство клетки будут включать в себя изменение, которое меняет продуцируемый биологический продукт.

Система может содержать один или несколько разных векторов. В аспекте настоящего изобретения белок Cas является кодон-оптимизированным для экспрессии в эукариотической клетке, предпочтительно в клетке млекопитающего или клетке человека.

Системы CRISPR можно применять в растениях

Система(системы) CRISPR-Cas (например, одиночная (одиночные) или мультиплексная (мультиплексные)) могут быть использованы в сочетании с последними достижениями в геномике сельскохозяйственных культур. Такая (такие) система (системы) CRISPR-Cas может (могут) быть использована (использованы) для осуществления эффективного и рентабельного детального изучения или редактирования гена или генома растений или манипуляции с ними, например, для быстрого исследования, и/или отбора, и/или детальных изучений, и/или сравнения, и/или манипуляций, и/или трансформации генов или геномов растений; например, для получения, идентификации, разработки, оптимизации или придания признака (признаков) или характеристики (характеристик) растению (растениям) или для трансформации генома растения. Соответственно, может быть улучшено получение растений, новых растений с новыми комбинациями признаков или характеристик или новых растений с улучшенными признаками. Такую (такие) систему (системы) CRISPR-Cas можно использовать по отношению к растениям при сайт-направленной интеграции (SDI) или редактировании генов (GE) или в любой из методик приближенной обратной селекции (NRB) или обратной селекции (RB). В отношении применения системы CRISPR-Cas в растениях следует упомянуть веб-сайт "CRISPR-PLANT" Аризонского университета (http://www.genome.arizona.edu/crispr/) (при поддержке Университета штата Пенсильвания и AGI). Варианты осуществления настоящего изобретения можно применять при редактировании генома в растениях или в случае, когда RNAi или аналогичные методики редактирования генома были использованы ранее; см., например, Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system," Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39); Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system," Plant Physiology September 2014, pp. 114.247577; Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system," Nature Biotechnology 31, 686-688 (2013); Feng, "Efficient genome editing in plants using a CRISPR/Cas system," Cell Research (2013) 23:1229-1232. doi:10.1038/cr.2013.114; опубликовано онлайн 20 августа 2013 г.; Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system," Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. электронная публикация 17 августа 2013 г.; Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice", Rice 2014, 7:5 (2014), Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy", New Phytologist (2015) (Forum) 1-4 (доступно только онлайн по адресу www.newphytologist.com); Caliando et al., "Targeted DNA degradation using a CRISPR device stably carried in the host genome", NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/ naturecommunications DOI: 10.1038/ncomms7989; патент США № 6603061 - Agrobacterium-Mediated Plant Transformation Method; патент США № 7868149 - Plant Genome Sequences and Uses Thereof и US 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits, все содержание и раскрытие каждого из которых включено в данный документ посредством ссылки во всей полноте. При практическом осуществлении настоящего изобретения содержание и раскрытие Morrell et al. "Crop genomics: advances and applications", Nat Rev Genet. 2011 Dec 29;13(2):85-96; которое включено в данный документ посредством ссылки, в том числе то, как варианты осуществления в данном документе могут быть использованы по отношению к растениям. Соответственно, ссылка в данном документе на клетки животных может также применяться, с соответствующими изменениями, по отношению к растительным клеткам, если не очевидно иное; и ферменты в данном документе, имеющие ослабленные нецелевые эффекты, и системы, использующие такие ферменты, могут быть использованы в вариантах применения растений, в том числе упомянутых в данном документе.

Sugano et al. (Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18) описывают применение CRISPR/Cas9 по отношению к направленному мутагенезу в печеночном мхе Marchantia polymorpha L., который стал модельным видом для изучения эволюции наземных растений. Промотор U6 M. polymorpha был идентифицирован и клонирован с целью экспрессии gRNA. Целевая последовательность gRNA была разработана с целью нарушения работы гена, кодирующего фактор 1 ответа на ауксин (ARF1) в M. polymorpha. С помощью опосредованной Agrobacterium трансформации Sugano et al. выделили стабильные мутанты в поколении гаметофита M. polymorpha. Сайт-направленный мутагенез на основе CRISPR/Cas9 in vivo был достигнут с помощью вируса 35S мозаики цветной капусты или промотора EF1α M. polymorpha для экспрессии Cas9. Выделенные мутантные особи, проявляющие устойчивый к ауксину фенотип, не были химерными. Кроме того, стабильные мутанты были получены с помощью бесполого размножения растений T1. Несколько аллелей arf1 были легко определены с помощью направленного мутагенеза на основе CRIPSR/Cas9. Способы Sugano et al. могут быть применимы по отношению к системе CRISPR Cas по настоящему изобретению.

Kabadi et al. (Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13) разработали одиночную лентивирусную систему с экспрессией варианта Cas9, репортерного гена и до четырех sgRNA включительно из независимых промоторов РНК-полимеразы III, которые включены в вектор с помощью удобного способа клонирования Golden Gate. Каждая sgRNA эффективно экспрессировала и могла опосредовать мультиплексное редактирование генов и длительную активацию транскрипции в иммортализованных и первичных клетках человека. Способы Kabadi et al. могут быть применимы по отношению к системе CRISPR Cas по настоящему изобретению.

Ling et al. (BMC Plant Biology 2014, 14:327) разработали набор бинарных векторов CRISPR/Cas9 на основе каркаса pGreen или pCAMBIA, а также gRNA. Для этого набора инструментов не требуются рестриктазы помимо BsaI для получения конечных конструкций, несущих оптимизированный по кодону маиса Cas9 и одну или несколько gRNA с высокой эффективностью лишь в одной стадии клонирования. Набор инструментов был валидирован с помощью протопластов маиса, линий трансгенного маиса и линий трансгенного арабидопсиса, и, как было показано, характеризовался высокой эффективностью и специфичностью. Что более важно, с помощью этого набора инструментов целевые мутации трех генов арабидопсиса были выявлены в трансгенных сеянцах поколения T1. Кроме того, несколько мутаций генов могли быть унаследованы следующим поколением. (Направляющая РНК) набор модульных векторов, как и набор инструментов для мультиплексного редактирования генома у растений. Набор инструментов Lin et al. может быть применен по отношению к системе CRISPR Cas по настоящему изобретению.

Протоколы для целевого редактирования генома растений посредством CRISPR/Cas9 также доступны в томе 1284 серии в Methods in Molecular Biology pp 239-255 от 10 февраля 2015 г. Включена подробная процедура для разработки, конструирования и оценки двойных gRNA для оптимизированного по кодону растений опосредованного Cas9 (pcoCas9) редактирования генома с помощью клеточных систем на основе модели протопластов Arabidopsis thaliana и Nicotiana benthamiana. Стратегии применения системы CRISPR/Cas9 с целью получения целевых модификаций генома в целых растениях также описаны. Протоколы в этой главе могут быть применены по отношению к системе CRISPR Cas по настоящему изобретению.

Ma et al. (Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007) описывают устойчивую векторную систему CRISPR/Cas9, используя оптимизированный по кодону растения ген Cas9, для удобного и высокоэффективного мультиплексного редактирования генома в однодольных и двудольных растениях. Ma et al. разработали процедуры на основе ПЦР для быстрого получения нескольких кассет экспрессии sgRNA, которые могут быть собраны в бинарные векторы CRISPR/Cas9 в одном цикле клонирования с помощью лигирования Golden Gate или сборки Gibson. С помощью этой системы Ma et al. редактировали 46 целевых сайтов у риса со средней скоростью мутации, составляющей 85,4%, большей частью в биаллельном и гомозиготном статусе. Ma et al. предусматривают примеры мутаций генов с потерей функции в растениях риса T0 и растениях арабидопсиса T1 с помощью одновременного нацеливания на несколько (до восьми) представителей семейства генов, несколько генов в пути биосинтеза или нескольких сайтов в одном гене. Способы Ma et al. могут быть применимы по отношению к системе CRISPR Cas по настоящему изобретению.

Lowder et al. (Plant Physiol. 2015 Aug 21. pii: pp.00636.2015) также разработали набор инструментов CRISPR/Cas9, который обеспечивает мультиплексное редактирование генома и регуляцию транскрипции экспрессируемых, выключенных или некодирующих генов в растениях. Этот набор инструментов обеспечивает исследователей протоколом и реагентами для быстрой и эффективной сборки функциональных конструкций T-ДНК CRISPR/Cas9 для однодольных и двудольных с помощью способов клонирования Golden Gate и Gateway. Он поставляется вместе с полным набором возможностей, в том числе мультиплексного редактирования генов и активации или репрессии транскрипции эндогенных генов растений. Технология трансформации на основе T-ДНК является фундаментальной для современной биотехнологии, генетики, молекулярной биологии и физиологии растений. В связи с этим заявители разработали способ сборки Cas9 (WT, никазы или dCas9) и gRNA в представляющий интерес вектор назначения T-ДНК. Способ сборки основан на сборке Golden Gate и рекомбинации MultiSite Gateway. Для сборки требуется три модуля. Первый модуль представляет собой входящий вектор Cas9, который содержит Cas9 без промотора или его производные гены, фланкированные сайтами attL1 и attR5. Второй модуль представляет собой входящий вектор gRNA, который содержит входящие кассеты экспрессии на основе gRNA, фланкированные сайтами attL5 и attL2. Третий модуль включает attR1-attR2-содержащие векторы назначения T-ДНК, которые предусматривают предпочтительные промоторы для экспрессии Cas9. Набор инструментов Lowder et al. может быть применен по отношению к системе CRISPR Cas9 по настоящему изобретению.

Petersen ("Towards precisely glycol engineered plants," Plant Biotech Denmark Annual meeting 2015, Copenhagen, Denmark) разработал способ применения CRISPR/Cas9 для конструирования геномных изменений в арабидопсисе, например, глико-конструирования арабидопсиса для получения белков и продуктов, имеющий желаемые посттрансляционные модификации. Hebelstrup et al. (Front Plant Sci. 2015 Apr 23; 6:247) описывает биоинженерию крахмала в растениях, предусматривающую сельскохозяйственные культуры, которые экспрессируют модифицирующие крахмал ферменты и непосредственно дают продукты, которые обычно изготовлены с помощью промышленных химических и/или физических способов обработки крахмалов. Способы Petersen and Hebelstrup могут быть применимы к системе CRISPR-Cas9 по настоящему изобретению.

В предпочтительном варианте осуществления растение может представлять собой дерево. В настоящем изобретении может также применяться раскрытая в данном документе система CRISPR Cas для систем на основе травянистых растений (см., например, Belhaj et al., Plant Methods 9: 39 and Harrison et al., Genes & Development 28: 1859-1872). В особо предпочтительном варианте осуществления система CRISPR Cas по настоящему изобретению может быть направлена на однонуклеотидный полиморфизм (SNP) у деревьев (см., например, Zhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015). В исследовании Zhou et al. авторы применяли систему CRISPR Cas для древовидного многолетнего Populus в случае семейства генов 4-кумарат:лигаза CoA (4CL) в качестве примера применения и достигли 100% мутационной эффективности для двух целевых генов 4CL, при этом каждый исследуемый трансформант обладал биаллельными модификациями. В исследовании Zhou et al. система CRISPR/Cas9 была высокочувствительной по отношению к однонуклеотидным полиморфизмам (SNP), поскольку расщепление для третьего гена 4CL было отменено в результате SNP в целевой последовательности.

Способы Zhou et al. (New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015) могут быть применены по отношению к настоящему изобретению следующим образом. Два гена 4CL, 4CL1 и 4CL2, ассоциированные с биосинтезом лигнина и флавоноидов соответственно, являются мишенями для редактирования с помощью CRISPR/Cas9. Клон 717-1B4 Populus tremula × alba, обычно используемый для трансформации, отличается от Populus trichocarpa с секвенированным геномом. Таким образом, gRNA 4CL1 и 4CL2, разработанные исходя из эталонного генома, детально исследуют в соответствии с внутренними данными секвенирования РНК 717 с целью обеспечения отсутствия SNP, которые могли бы ограничить эффективность Cas. Также включена третья gRNA, разработанная для 4CL5, геномной дупликации 4CL1. Соответствующая последовательность 717 содержит один SNP в каждом аллеле возле/в PAM, оба из которых, как предполагается, устраняют нацеливание со стороны 4CL5-gRNA. Все три целевые сайта gRNA расположены в первом экзоне. Для трансформации последовательности 717 gRNA экспрессируется из промотора Medicago U6.6 совместно с кодон-оптимизированным Cas человека под контролем промотора CaMV 35S в бинарном векторе. Трансформация вектором, содержащим только Cas, может выступать в качестве контроля. Случайным образом выбранные линии 4CL1 и 4CL2 подвергают секвенированию ампликонов. Затем данные обрабатывают и биаллельные мутации подтверждают во всех случаях.

У растений патогены часто являются специфичными по отношению к хозяину. Например, Fusarium oxysporum f. sp. lycopersici вызывает фузариозный вилт томата, но поражает только томат, а F. oxysporum f. dianthii и Puccinia graminis f. sp. tritici поражают только пшеницу. Растения обладают присущими и индуцированными защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может наблюдаться устойчивость видов, не относящихся к хозяевам, например, хозяин и патоген являются несовместимыми. Также может наблюдаться горизонтальная устойчивость, например, частичная устойчивость ко всем расам патогена, обычно контролируемая многими генами, и вертикальная устойчивость, например, полная устойчивость к некоторым расам патогена, но не к другим расам, обычно контролируемая несколькими генами. На уровне взаимодействия генов растения и патогены эволюционируют совместно, а генетические изменения одного уравновешивают изменения другого. Соответственно, используя естественную изменчивость, селекционеры комбинируют гены, наиболее полезные для урожайности, качества, однородности, выносливости, устойчивости. Источники генов устойчивости включают нативные или чужеродные сорта, старинные сорта, родственные дикорастущие растения и индуцированные мутации, например, при обработке растительного материала мутагенными средствами. Применяя настоящее изобретение, селекционеры растений получают новый инструмент для индукции мутаций. Соответственно, специалист в данной области может проанализировать геном источников генов устойчивости, а в отношении сортов, имеющих желаемые характеристики или признаки, использовать настоящее изобретение для индукции появления генов устойчивости с большей точностью, чем в случае применявшихся ранее мутагенных средств, и, следовательно, для ускорения и улучшения программ селекции растений.

Варианты применения по отношению к растениям и дрожжам; варианты применения по отношению к биотопливу

Применение системы Cas9-CRISPR по отношению к растениям и дрожжам

Определения

В целом, термин "растение" относится к любому отличающемуся друг от друга фотосинтезирующему, эукариотическому, одноклеточному или многоклеточному организму царства Растения, характерным образом растущему путем клеточного деления, содержащему хлоропласты и имеющему клеточные стенки, состоящие из целлюлозы. Термин "растение" охватывает однодольные и двудольные растения. В частности, растения содержат без ограничения покрытосеменные и голосеменные растения, такие как акация, люцерна, амарант, яблоня, абрикос, артишок, ясень, спаржа, авокадо, банан, ячмень, бобы, свекла, береза, бук, ежевика, голубика, брокколи, брюссельская капуста, капуста, канола, канталупа, морковь, маниок, цветная капуста, кедр, злак, сельдерей, каштан, вишня, китайская капуста, цитрус, клементин, клевер, кофе, кукуруза, хлопчатник, коровий горох, огурец, кипарис, баклажан, вяз, цикорий салатный, эвкалипт, фенхель, инжир, пихта, герань, виноград, грейпфрут, земляной орех, вишня кустарниковая, эвкалипт, болиголов, кария, браунколь, киви, кольраби, лиственница, салат-латук, лук-порей, лимон, лайм, робиния, адиантум, маис, манго, клен, дыня, просо, гриб, горчица, орехи, дуб, овес, масличная пальма, окра, лук репчатый, апельсин, декоративное растение, цветущее растение или дерево, папайя, пальма, петрушка, пастернак, горох, персик, арахис, груша, торф, перец, хурма, голубиный орех, сосна, ананас, подорожник, слива, гранат, картофель, тыква, радиккио, редис, рапс, малина, рис, рожь, сорго, сафлор, ива, соя, шпинат, ель, тыква гигантская, клубника, сахарная свекла, сахарный тростник, подсолнечник, батат, сахарная кукуруза, мандарин, чай, табак, томат, деревья, тритикале, мох, турнепс, ползучее растение, грецкий орех, кресс водяной, арбуз, пшеница, ямс, тис и тыква обыкновенная. Термин "растение" также охватывает водоросли, которые представляют собой главным образом фотоавтотрофов, объединенных преимущественно в связи с отсутствием у них корней, листьев и других органов, которые характеризуют высшие растения.

Способы редактирования генома с помощью системы CRISPR/Cas9, как описано в данном документе, могут быть использованы для придания желаемых признаков практически любому растению. Широкий спектр растений и систем растительных клеток может быть сконструировано с целью желаемых физиологических и агрономических характеристик, описанных в данном документе, с помощью конструкций нуклеиновой кислоты по настоящему раскрытию и различных способов трансформации, упомянутых выше. В предпочтительных вариантах осуществления целевые растения и растительные клетки для конструирования включают без ограничения такие однодольные и двудольные растения, как зерновые культуры (например, пшеницу, маис, рис, просо, ячмень), плодовые культуры (например, томат, яблоня, груша, клубника, апельсин), кормовые культуры (например, люцерна), корнеплодные овощные культуры (например, морковь, картофель, сахарная свекла, ямс), лиственные овощные культуры (например, салат-латук, шпинат); цветущие растения (например, петуния, роза, хризантема), хвойные и сосновые деревья (например, сосна, пихта, ель); растения, используемые в фиторемедеации (например, растения, поглощающие тяжелые металлы); масляные культуры (например, подсолнечник, рапс) и растения, используемые для экспериментальных целей (например, Arabidopsis). Таким образом, способы и системы CRISPR-Cas могут быть применимы по отношению к широкому диапазону растений, таких как, например, двудольные растения, принадлежащие к порядкам Магнолиецветные, Иллициевые, Лавроцветные, Перечноцветные, Кирказоновые, Кувшинкоцветные, Лютикоцветные, Макоцветные, Саррацениевые, Троходендровые, Гамамелисовые, Эвкомисовые, Лейтнериевые, Мириковые, Букоцветные, Казуариновые, Гвоздичноцветные, Баталовые, Гречихоцветные, Плюмбаговые, Диллениевые, Чайные, Мальвоцветные, Крапивоцветные, Лецитисоцветные, Фиалкоцветные, Ивовые, Каперсоцветные, Верескоцветные, Диапенсиевые, Эбеновые, Примулоцветные, Розоцветные, Бобовоцветные, Подостемовые, Сланоягодникоцветные, Миртоцветные, Кизилоцветные, Протеецветные, Санталоцветные, Раффлезиевые, Бересклетоцветные, Молочаецветные, Крушиновые, Сапиндоцветные, Орехоцветные, Гераниецветные, Истодовые, Аралиецветные, Горечавкоцветные, Синюхоцветные, Ясноткоцветные, Подорожниковые, Норичникоцветные, Колокольчикоцветные, Мареноцветные, Ворсянкоцветные и Астроцветные; способы и системы CRISPR-Cas могут быть применимы по отношению к однодольным растениям, таким как принадлежащие к порядкам Частухоцветные, Панданоцветные, Наядовые, Триурисовые, Коммелиноцветные, Эриокаулоновые, Рестиевые, Тонконогоцветные, Ситниковые, Осокоцветные, Рогозовые, Бромелиецветные, Имбирецветные, Пальмоцветные, Циклантовые, Панданоцветные, Аронниковые, Лилиецветные и Орхидноцветные, или растениям, принадлежащим к голосеменным, например, принадлежащим к порядкам Сосновые, Гинкговые, Саговниковидные, Араукариевые, Кипарисовые и Гнетовидные.

Системы и способы применения CRISPR/Cas9, описанные в данном документе, могут быть применимы по отношению к широкому диапазону видов растений, включенных в неограничивающий перечень двудольных, однодольных или голосеменных родов, приведенных ниже: Atropa, Alseodaphne, Anacardium, Arachis, Beilschmiedia, Brassica, Carthamus, Cocculus, Croton, Cucumis, Citrus, Citrullus, Capsicum, Catharanthus, Cocos, Coffea, Cucurbita, Daucus, Duguetia, Eschscholzia, Ficus, Fragaria, Glaucium, Glycine, Gossypium, Helianthus, Hevea, Hyoscyamus, Lactuca, Landolphia, Linum, Litsea, Lycopersicon, Lupinus, Manihot, Majorana, Malus, Medicago, Nicotiana, Olea, Parthenium, Papaver, Persea, Phaseolus, Pistacia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Senecio, Sinomenium, Stephania, Sinapis, Solanum, Theobroma, Trifolium, Trigonella, Vicia, Vinca, Vilis, и Vigna; и родов Allium, Andropogon, Aragrostis, Asparagus, Avena, Cynodon, Elaeis, Festuca, Festulolium, Heterocallis, Hordeum, Lemna, Lolium, Musa, Oryza, Panicum, Pannesetum, Phleum, Poa, Secale, Sorghum, Triticum, Zea, Abies, Cunninghamia, Ephedra, Picea, Pinus, и Pseudotsuga.

Системы и способы применения CRISPR/Cas9 могут быть также применимы по отношению к широкому диапазону "водорослей" или "клеток водорослей", в том числе, например, водорослей, выбранных из нескольких эукариотических отделов, в том числе Rhodophyta (красные водоросли), Chlorophyta (зеленые водоросли), Phaeophyta (коричневые водоросли), Bacillariophyta (диатомовые водоросли), Eustigmatophyta и динофлагелляты, а также прокариотическому отделу Cyanobacteria (сине-зеленые водоросли). Термин "водоросли" включает, например, водоросли, выбранные из Amphora, Anabaena, Anikstrodesmis, Botryococcus, Chaetoceros, Chlamydomonas, Chlorella, Chlorococcum, Cyclotella, Cylindrotheca, Dunaliella, Emiliana, Euglena, Hematococcus, Isochrysis, Monochrysis, Monoraphidium, Nannochloris, Nannnochloropsis, Navicula, Nephrochloris, Nephroselmis, Nitzschia, Nodularia, Nostoc, Oochromonas, Oocystis, Oscillartoria, Pavlova, Phaeodactylum, Playtmonas, Pleurochrysis, Porhyra, Pseudoanabaena, Pyramimonas, Stichococcus, Synechococcus, Synechocystis, Tetraselmis, Thalassiosira и Trichodesmium.

Часть растения, т.е. "растительная ткань", может быть обработана в соответствии со способами по настоящему изобретению с целью получения улучшенного растения. Растительная ткань также охватывает растительные клетки. Термин "растительная клетка" как используется в данном документе, относится к отдельным единицам живого растения, как в интактном целом растении, так и в выделенной форме, выращенной в in vitro культурах тканей, на среде или агаре, в суспензии в среде для выращивания или буфере или в виде части более высокоорганизованных единиц, таких как, например, растительная ткань, орган растения или целое растение.

"Протопласт" относится к растительной клетке, у которой защитная клеточная стенка была полностью или частично удалена с помощью, например, механических или ферментативных способов, в результате чего образовалась интактная биохимическая компетентная единица живого растения, которая может сформировать заново свою клеточную стенку, пролиферировать и регенерировать в целое растение в соответствующих условиях роста.

Термин "трансформация" в широком смысле относится к процессу, с помощью которого растение-хозяин генетически модифицируют введением ДНК с помощью Agrobacteria или ряда химических или физических способов. Используемый в данном документе термин "растение-хозяин" относится к любым клеткам, тканям, органам или потомству растений. Многие подходящие растительные ткани или растительные клетки могут быть трансформированы и включают без ограничения протопласты, соматические эмбрионы, пыльцу, листья, сеянцы, стебли, каллус, столоны, микроклубни и побеги. Растительная ткань также относится к любому клону такого растения, семенам, потомству, побегам, полученным половым или бесполым путем, и потомкам любых из них, таких как черенки или семена.

Термин "трансформированный", как используется в данном документе, относится к клетке, ткани, органу или организму, в которые была введена чужеродная молекула ДНК, такая как конструкция. Введенная молекула ДНК может быть интегрирована в геномную ДНК реципиентной клетки, ткани, органа или организма таким образом, что введенная молекула ДНК передается последующим потокам. В этих вариантах осуществления "трансформированная" или "трансгенная" клетка или растение могут также включать потомство клетки или растения и потомство, полученное в результате программы селекции с применением такой трансформированной клетки в качестве родителя в скрещивании, и характеризующееся измененным фенотипом, полученным в результате присутствия введенной молекулы ДНК. Предпочтительно трансгенное растение является фертильным и способно передавать введенную ДНК потомству в результате полового размножения.

Термин "потомство", такое как потомство трансгенного растения, представляет собой потомство, рожденное, произведенное или полученное из растения или трансгенного растения. Введенная молекула ДНК может также быть временно введенной в реципиентную клетку таким образом, что введенная молекула ДНК не наследуется последующим потомством, и, таким образом, она не считается "трансгенной". Соответственно, как используется в данном документе, "нетрансгенное растение" или растительная клетка представляют собой растение, которое не содержит чужеродную ДНК, стабильно интегрированную в его геном.

Термин "растительный промотор", как используется в данном документе, представляет собой промотор, способный инициировать транскрипцию в растительных клетках, вне зависимости от того, происходит ли он из растительной клетки. Иллюстративные подходящие растительные промоторы включают без ограничения таковые, которые получены из растений, вирусов растений и бактерий, таких как агробактерии или ризобактерии, которые содержат гены, экспрессируемые в растительных клетках.

Используемое в данном документе выражение "грибная клетка" относится к любому типу эукариотической клетки в царстве грибов. Отделы в царстве грибов включают Ascomycota, Basidiomycota, Blastocladiomycota, Chytridiomycota, Glomeromycota, Microsporidia и Neocallimastigomycota. Грибные клетки могут включать дрожжи, плесени и нитчатые грибы. В некоторых вариантах осуществления грибная клетка представляет собой клетку дрожжей.

Используемый в данном документе термин "клетка дрожжей" относится к любой грибной клетке в пределах отделов Ascomycota и Basidiomycota. Клетки дрожжей могут включать почкующиеся клетки дрожжей, делящиеся клетки дрожжей и плесневые клетки. Не ограничиваясь этими организмами, многие типы дрожжей, используемые в лабораторных и промышленных условиях, являются частью отдела Ascomycota. В некоторых вариантах осуществления клетка дрожжей представляет собой клетку S. cerervisiae, Kluyveromyces marxianus или Issatchenkia orientalis. Другие типы клеток дрожжей могут включать без ограничения Candida spp. (например, Candida albicans), Yarrowia spp. (например, Yarrowia lipolytica), Pichia spp. (например, Pichia pastoris), Kluyveromyces spp. (например, Kluyveromyces lactis и Kluyveromyces marxianus), Neurospora spp. (например, Neurospora crassa), Fusarium spp. (например, Fusarium oxysporum) и Issatchenkia spp. (например, Issatchenkia orientalis, также известный как Pichia kudriavzevii, и Candida acidothermophilum). В некоторых вариантах осуществления грибная клетка представляет собой клетку нитчатого гриба. Используемое в данном документе термин "клетка нитчатого гриба" относится к любому типу грибной клетки, которая растет за счет филаментов, т.е. гифов или мицелия. Примеры клеток нитчатых грибов включают без ограничения Aspergillus spp. (например, Aspergillus niger), Trichoderma spp. (например, Trichoderma reesei), Rhizopus spp. (например, Rhizopus oryzae) и Mortierella spp. (например, Mortierella isabellina).

В некоторых вариантах осуществления грибная клетка представляет собой промышленный штамм. Используемое в данном документе выражение "промышленный штамм" относится к любому штамму грибной клетки, используемому в промышленном способе или выделенному из него, например, получении продукта в коммерческом или промышленном масштабе. Промышленный штамм может относиться к виду гриба, который обычно используют в промышленном способе, или он может относиться к изоляту вида гриба, который может быть также использован для некоммерческих целей (например, лабораторное исследование). Примеры промышленных способов могут включать сбраживание (например, при получении пищевых продуктов питания и питьевых продуктов), дистилляцию, получение биотоплива, получение соединения и получение полипептида. Примеры промышленных штаммов могут включать без ограничения JAY270 и ATCC4124.

В некоторых вариантах осуществления грибная клетка представляет собой полиплоидную клетку. Используемое в данном документе выражение "полиплоидная" клетка может относиться к любой клетке, геном которой присутствует в более чем одной копии. Полиплоидная клетка может относиться к типу клетки, которая встречается в природе в полиплоидном состоянии или может относиться к клетке, которая была индуцирована с целью существования в полиплоидном состоянии (например, в результате специфичной регуляции, изменения, инактивации, активации или модификации мейоза, цитокинеза или репликации ДНК). Полиплоидная клетка может относиться к клетке, весь геном которой является полиплоидным, или может относиться к клетке, которая является полиплоидной в определенном представляющем интерес локусе генома. Не желая ограничиваться теорией, считается, что избыток направляющей РНК может чаще представлять собой компонент ограничения скорости при конструировании геномов полиплоидных клеток, а не гаплоидных клеток, и, таким образом, способы применения системы CRISPR/Cas9, описанные в данном документе, могут характеризоваться преимуществом применения определенного типа грибной клетки.

В некоторых вариантах осуществления грибная клетка представляет собой диплоидную клетку. Используемое в данном документе выражение "диплоидная" клетка может относиться к любой клетке, геном которой присутствует в двух копиях. Диплоидная клетка может относиться к типу клетки, которая встречается в природе в диплоидном состоянии, или может относиться к клетке, которая была индуцирована с целью существования в диплоидном состоянии (например, в результате специфичной регуляции, изменения, инактивации, активации или модификации мейоза, цитокинеза или репликации ДНК). Например, штамм S228C S. cerevisiae может поддерживаться в гаплоидном или диплоидном состоянии. Диплоидная клетка может относиться к клетке, весь геном которой является диплоидным, или может относиться к клетке, которая является диплоидной в определенном представляющем интерес локусе генома. В некоторых вариантах осуществления грибная клетка представляет собой гаплоидную клетку. Используемое в данном документе выражение "гаплоидная" клетка может относиться к любой клетке, геном которой присутствует в одной копии. Гаплоидная клетка может относиться к типу клетки, которая встречается в природе в гаплоидном состоянии или может относиться к клетке, которая была индуцирована с целью существования в гаплоидном состоянии (например, в результате специфичной регуляции, изменения, инактивации, активации или модификации мейоза, цитокинеза или репликации ДНК). Например, штамм S228C S. cerevisiae может поддерживаться в гаплоидном или диплоидном состоянии. Гаплоидная клетка может относиться к клетке, весь геном которой является гаплоидным, или может относиться к клетке, которая является гаплоидной в определенном представляющем интерес локусе генома.

Используемое в данном документе выражение "дрожжевой вектор экспрессии" относится к нуклеиновой кислоте, которая содержит одну или несколько последовательностей, кодирующих РНК и/или полипептид, и может дополнительно содержать любые требуемые элементы, которые контролируют экспрессию нуклеиновой кислоты(нуклеиновых кислот), а также любые элементы, которые обеспечивают репликацию и поддержание вектора экспрессии в клетке дрожжей. Многие подходящие дрожжевые векторы экспрессии и их характеристики известны в данной области; например, различные векторы и методики проиллюстрированы в Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007) и Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72. Дрожжевые векторы могут содержать без ограничения центромерную (CEN) последовательность, автономную последовательность репликации (ARS), промотор, такой как промотор РНК-полимеразы III, функционально связанный с представляющими интерес последовательностью или геном, терминатором, таким как терминатор РНК-полимеразы III, точкой начала репликации и маркерным геном (например, селектируемыми маркерами ауксотрофов, селектируемыми маркерами к антибиотикам или другими селектируемыми маркерами). Примеры векторов экспрессии для применения в дрожжах могут включать плазмиды, искусственные хромосомы дрожжей, 2 мкм-плазмиды, дрожжевые интегративные плазмиды, дрожжевые репликативные плазмиды, челночные векторы и эписомальные плазмиды.

Стабильная интеграция компонентов системы CRISPR/Cas9 в геном растений и растительных клеток

В конкретных вариантах осуществления предусмотрено, что полинуклеотиды, кодирующие компоненты системы CRISPR/Cas9, вводят с целью стабильной интеграции в геном растительной клетки. В этих вариантах осуществления разработка вектора трансформации или системы экспрессии может быть откорректирована в зависимости от того, когда, где и при каких условиях chi/sgRNA и/или ген Cas9 экспрессируются.

В конкретных вариантах осуществления предусмотрено стабильное введение компонентов системы CRISPR/Cas9 в геномную ДНК растительной клетки. Дополнительно или альтернативно предусмотрено введение компонентов системы CRISPR/Cas9 с целью стабильной интеграции в ДНК органеллы растения, такой как без ограничения пластида, митохондрия или хлоропласт.

Система экспрессии для стабильной интеграции в геном растительной клетки может содержать один или несколько из следующих элементов: промоторный элемент, который может быть использован для экспрессии РНК и/или фермента Cas9 в растительной клетке; 5' нетранслируемая область для усиления экспрессии; интронный элемент для дополнительного усиления экспрессии в определенных клетках, таких как клетки однодольных растений; сайт множественного клонирования для обеспечения удобных сайтов рестрикции для вставки последовательностей chi/sgRNA и/или гена Cas9 и другие требуемые элементы; и 3'-нетранслируемая область для обеспечения эффективной терминации экспрессируемого транскрипта.

Элементы системы экспрессии могут находиться в одной или нескольких конструкциях экспрессии, которые являются кольцевыми, такими как плазмида или вектор трансформации, или некольцевыми, такими как линейная двухнитевая ДНК.

В конкретных вариантах осуществления система экспрессии CRISPR-Cas9 содержит по меньшей мере

нуклеотидную последовательность, кодирующую направляющую последовательность или chi/sgRNA, которая гибридизируется с целевой последовательностью в растении, и где направляющая последовательность или chi/sgRNA содержит направляющую последовательность и последовательность прямого повтора, и

нуклеотидную последовательность, кодирующую белок Cas9,

где компоненты (a) или (b) расположены в одной и той же или различных конструкциях, и где различные нуклеотидные последовательности могут находиться под контролем одного и того же или различных регуляторных элементов, функционирующих в клетке.

Конструкция (конструкции) ДНК, содержащая (содержащие) компоненты системы CRISPR/Cas9 и при необходимости матричную последовательность, могут быть введены в геном растения, части растения или растительной клетки с помощью ряда стандартных методик. Этот процесс, как правило, предусматривает стадии отбора подходящей клетки-хозяина или ткани-хозяина, введения конструкции (конструкций) в клетку-хозяина или ткань-хозяина и восстановление из них растительных клеток или растений.

В конкретных вариантах осуществления конструкция ДНК может быть введена в растительную клетку с помощью методик, таких как без ограничения электропорация, микроинъекция, введение с помощью аэрозольного пучкового инжектора протопластов растительных клеток, или конструкции ДНК могут быть введены непосредственно в растительную ткань с помощью биолистических способов, таких как бомбардировка частицами с ДНК (см. также Fu et al., Transgenic Res. 2000 Feb;9(1):11-9). Основой бомбардировки частицами является ускорение частиц, покрытых представляющим интерес геном/представляющими интерес генами, в клетки, что приводит к проникновению частиц в протоплазму и, как правило, стабильной интеграции в геном. (См., например, Klein et al, Nature (1987), Klein et al., Bio/Technology (1992), Casas et al., Proc. Natl. Acad. Sci. USA (1993).).

В конкретных вариантах осуществления конструкции ДНК, содержащие компоненты системы CRISPR/Cas9, могут быть введены в растение с помощью опосредованной Agrobacterium трансформации. Конструкции ДНК могут быть комбинированы с подходящими фланкирующими областями T-ДНК и введены в стандартный вектор-хозяин Agrobacterium tumefaciens. Чужеродная ДНК может быть включена в геном растений путем инфицирования растений или инкубирования протопластов растений бактериями Agrobacterium, содержащими одну или несколько Ti (опухоль-индуцирующих) плазмид. (См., например, Fraley et al., (1985), Rogers et al., (1987) и патент США № 5 563 055).

Растительные промоторы

С целью обеспечения подходящей экспрессии в растительной клетке компоненты системы CRISPR/Cas9, описанные в данном документе, как правило, помещают под контроль растительного промотора, т.е. промотора, функционирующего в растительных клетках. Предусмотрено применение различных типов промоторов.

Конститутивный растительный промотор представляет собой промотор, который способен экспрессировать открытую рамку считывания (ORF), который контролирует ее во всех или почти во всех растительных тканях во время всех или почти всех стадий развития растения (так называемая "конститутивная экспрессия"). Одним неограничивающим примером конститутивного промотора является промотор вируса мозаики цветной капусты 35S. "Регуляторный промотор" относится к промоторам, которые управляют экспрессией генов не конститутивно, а путем временной и/или пространственной регуляции, и включает тканеспецифичные, тканепредпочтительные и индуцируемые промоторы. Различные промоторы могут управлять экспрессией гена в различных тканях или типах клеток, или на различных стадиях развития, или в ответ на различные средовые факторы. В конкретных вариантах осуществления один или несколько из компонентов CRISPR/Cas9 экспрессируются под контролем конститутивного промотора, такого как промотор вируса мозаики цветной капусты 35S, тканеспецифичные промоторы могут быть использованы для нацеливания усиленной экспрессии в определенных типах клеток в конкретной растительной ткани, например, сосудистых тканях или определенных клетках семени. Примеры конкретных промоторов для применения в системе CRISPR/Cas9 встречаются в Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Yamamoto et al., (1997) Plant J 12:255-65; Hire et al, (1992) Plant Mol Biol 20:207-18, Kuster et al, (1995) Plant Mol Biol 29:759-72, и Capana et al., (1994) Plant Mol Biol 25:681 -91.

Примеры промоторов, которые являются индуцируемыми и которые обеспечивают пространственно-временной контроль редактирования генов или экспрессии генов, могут использовать определенную форму энергии. Форма энергии может включать без ограничения звуковую энергию, электромагнитную энергию, химическую энергию и/или тепловую энергию. Примеры индуцируемых систем включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), двухгибридные системы активации транскрипции с использованием малых молекул (FKBP, ABA и т.д.) или индуцируемые светом системы (фитохром, домены LOV или криптохром), такие как индуцируемый светом транскрипционный эффектор (LITE), который управляет изменениями транскрипционной активности специфичным к последовательности образом. Компоненты индуцируемой светом системы могут включать фермент CRISPR/Cas9, чувствительный к свету гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых ДНК-связывающих белков и способы их применения представлены в US 61/736465 и US 61/721283, которые включены в данный документ посредством ссылки во всей полноте.

В конкретных вариантах осуществления транзиентная или индуцируемая экспрессия может быть достигнута, например, с помощью регулируемых химическим путем промоторов, т.е. в случае, когда применение экзогенного химического соединения индуцирует экспрессию генов. Модулирование экспрессии генов также может быть получено с помощью репрессируемого химическим путем промотора, где применение химического соединения репрессирует экспрессию генов. Индуцированные химическим путем промоторы включают без ограничения промотор маиса ln2-2, активируемый антидотами гербицидов на основе бензолсульфамидов (De Veylder et al., (1997) Plant Cell Physiol 38:568-77), промотор маиса GST (GST-ll-27, WO93/01294), активируемый гидрофобными электрофильными соединениями, используемыми в качестве предвсходовых гербицидов, и промотор табака PR-1 (Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7), активируемый салициловой кислотой. Промоторы, которые регулируются антибиотиками, такими как индуцируемые тетрациклином и репрессируемые тетрациклином промоторы (Gatz et al., (1991 ) Mol Gen Genet 227:229-37; патенты США №№ 5814618 и 5789156), также могут быть использованы в данном документе.

Транслокация и/или экспрессия в конкретных органеллах растений

Система экспрессии может содержать элементы для транслокации и/или экспрессии в конкретной органелле растения.

Нацеливание на хлоропласты

В конкретных вариантах осуществления предусмотрено, что система CRISPR/Cas9 используется для специфичной модификации генов хлоропластов или для обеспечения экспрессии в хлоропласте. С этой целью используются способы трансформации хлоропластов или компартментализации компонентов системы CRISPR/Cas9 в хлоропласте. Например, введение генетических модификаций в геном пластиды может уменьшить проблемы биобезопасности, такие как поток генов через пыльцу.

Способы трансформации хлоропластов известны в данной области и включают бомбардировку частицами, обработку PEG и микроинъекцию. Кроме того, способы, включающие транслокацию кассет для трансформации из ядерного генома в пластиду, могут быть использованы, как описано в WO2010061186.

Альтернативно предусмотрено нацеливание одного или нескольких компонентов системы CRISPR/Cas9 на хлоропласт растения. Это достигается включением в конструкцию экспрессии последовательности, кодирующей транзитный пептид хлоропласта (CTP) или транзитный пептид пластиды, функционально связанный с 5'-областью последовательности, кодирующей белок Cas9. CTP удаляется на этапе процессинга во время транслокации в хлоропласт. Нацеливание на хлоропласты экспрессируемых белков хорошо известно специалисту в данной области (см., например, Protein Transport into Chloroplasts, 2010, Annual Review of Plant Biology,Vol. 61: 157-180). В таких вариантах осуществления также является желательным нацеливание на chi/sgRNA хлоропласта растения. Способы и конструкции, которые могут быть использованы для транслокации chi/sgRNA в хлоропласт с помощью последовательности локализации в хлоропласте описаны, например, в US 20040142476, включенном в данный документ посредством ссылки. Такие вариации конструкций могут быть включены в системы экспрессии по настоящему изобретению для эффективной транслокации Cas9-chi/sgRNA.

Введение полинуклеотидов, кодирующих систему CRISPR-Cas9, в клетки водорослей

Трансгенные водоросли (или другие растения, такие как рапс) могут быть особенно полезными в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол), или других продуктов. Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.

В US 8945839 описан способ конструирования микроводорослей (виды клеток Chlamydomonas reinhardtii) с помощью Cas9. Аналогично система CRISPR/Cas9, описанная в данном документе, может быть применима по отношению к виду Chlamydomonas и другим водорослям. В конкретных вариантах осуществления Cas9 и chi/sgRNA вводят в синтезирующие водоросли с помощью вектора, который экспрессирует Cas9 под контролем конститутивного промотора, такого как Hsp70A-Rbc S2, или промотора бета 2-тубулина. Chi/sgRNA необязательно доставляют с помощью вектора, содержащего промотор T7. Альтернативно мРНК Cas9 и in vitro транскрибируемая chi/sgRNA могут быть доставлены в клетки водорослей. Протоколы электропорации доступны специалисту в данной области, такие как стандартный рекомендованный протокол из набора GeneArt Chlamydomonas Engineering.

В конкретных вариантах осуществления эндонуклеаза, используемая в данном документе, представляет собой фермент Split Cas9. Ферменты Split Cas9 предпочтительно используют в водорослях для целевой геномной модификации, как было описано в WO 2015086795. Применение системы Cas9 split является особенно подходящим для индуцируемого способа управления геномом, и в результате этого избегают потенциального токсического эффекта сверхэкспрессии Cas9 в клетке водорослей. В конкретных вариантах осуществления указанные домены Cas9 split (домены RuvC и HNH) могут быть одновременно или последовательно введены в клетку таким образом, что указанный домен(указанные домены) split Cas9 обрабатывает(обрабатывают) целевую последовательность нуклеиновой кислоты в клетке водорослей. Уменьшенный размер split Cas9 по сравнению с Cas9 дикого типа облегчает другие способы доставки системы CRISPR в клетки, такие как применение проникающих пептидов, как описано в данном документе. Этот способ представляет особый интерес для получения генетически модифицированных водорослей.

Введение полинуклеотидов, кодирующих компоненты Cas9, в клетки дрожжей

В конкретных вариантах осуществления настоящее изобретение относится к применению системы CRISPR/Cas9 для редактирования геномов клеток дрожжей. Способы трансформации клеток дрожжей, которые могут быть использованы для введения полинуклеотидов, кодирующих компоненты системы CRISPR/Cas9, хорошо известны специалисту в данной области и описаны в Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403). Неограничивающие примеры включают трансформацию клеток дрожжей с помощью обработки ацетатом лития (которая может дополнительно включать обработку ДНК-носителем и PEG), бомбардировки или с помощью электропорации.

Транзиентная экспрессия компонентов системы Cas9 CRISP в растениях и растительных клетках

В конкретных вариантах осуществления предусмотрено, что chi/sgRNA и/или ген Cas9 транзиентно экспрессируются в растительной клетке. В этих вариантах осуществления система CRISPR/Cas9 может обеспечивать модификацию целевого гена только в случае, когда как chi/sgRNA, так и белок Cas9 присутствуют в клетке, таким образом геномную модификацию можно дополнительно контролировать. Поскольку экспрессия фермента Cas9 является транзиентной, то растения, регенерированные из таких растительных клеток, как правило, не содержат чужеродной ДНК. В конкретных вариантах осуществления фермент Cas9 стабильно экспрессируется растительной клеткой, а направляющая последовательность экспрессируется транзиентно.

В конкретных вариантах осуществления компоненты системы CRISPR/Cas9 могут быть введены в растительные клетки с помощью вектора на основе вируса растений (Scholthof et al., 1996, Annu Rev Phytopathol. 1996;34:299-323). В дополнительных конкретных вариантах осуществления указанный вирусный вектор представляет собой вектор из ДНК-содержащего вируса. Например, геминивирус (например, вирус курчавости капустного листа, вирус желтой карликовости бобов, вирус карликовости пшеницы, вирус курчавости томатного листа, вирус полосы кукурузы, вирус курчавости листа табака или вирус золотистой мозаики томата) или нановирус (например, вирус желтого некроза конских бобов). В других конкретных вариантах осуществления указанный вирусный вектор представляет собой вектор из РНК-содержащего вируса. Например, тобравирус (например, вирус погремковости табака, вирус табачной мозаики), потексвирус (например, Х-вирус картофеля) или хордейвирус (например, вирус штриховой мозаики ячменя). Реплицирующиеся геномы растительных вирусов представляют собой неинтегративные векторы.

В конкретных вариантах осуществления вектор, используемый для транзиентной экспрессии конструкций CRISPR/Cas9, представляет собой, например, вектор pEAQ, который подходит для опосредованной Agrobacterium транзиентной экспрессии (Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93) в протопласте. Точное нацеливание на локализацию в геноме было показано с помощью вектора на основе модифицированного вируса курчавости капустного листа (CaLCuV) с целью экспрессии gRNA в стабильных трансгенных растениях, экспрессирующих фермент CRISPR (Scientific Reports 5, номер статьи: 14926 (2015), doi:10.1038/srep14926).

В конкретных вариантах осуществления фрагменты двухнитевой ДНК, кодирующие chi/sgRNA и /или ген Cas9, могут быть транзиентно введены в растительную клетку. В таких вариантах осуществления введенные фрагменты двухнитевой ДНК предусмотрены в достаточном количестве с целью модификации клетки, однако не сохраняются по прошествии предусмотренного периода времени или после одного или нескольких клеточных делений. Способы прямого переноса ДНК в растения известны специалисту в данной области (см., например, Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85.)

В других вариантах осуществления РНК-полинуклеотид, кодирующий белок Cas9, вводят в растительную клетку, который затем транслируется и процессируется клеткой-хозяином, образующей белок в достаточном количестве для модификации клетки (в присутствии по меньшей мере одной chi/sgRNA), но который не сохраняется по происшествию предусмотренного периода времени или после одного или нескольких клеточных делений. Способы введения мРНК в протопласты растений для транзиентной экспрессии известны специалисту в данной области (см., например, в Gallie, Plant Cell Reports (1993), 13;119-122).

Также предусмотрены комбинации различных способов, описанных выше.

Доставка компонентов CRISPR/Cas9 в растительную клетку

В конкретных вариантах осуществления представляет интерес доставка одного или нескольких компонентов системы CRISPR/Cas9 непосредственно в растительную клетку. Это представляет интерес, помимо прочего, для получения нетрансгенных растений (см. ниже). В конкретных вариантах осуществления один или несколько компонентов Cas9 получают за пределами растения или растительной клетки и доставляют в клетку. Например, в конкретных вариантах осуществления белок Cas9 получают in vitro до введения в растительную клетку. Белок Cas9 может быть получен с помощью различных способов, известных специалисту в данной области, в том числе рекомбинантного получения. После экспрессии белок Cas9 выделяют, при необходимости повторно подвергают фолдингу, очищают и необязательно обрабатывают для удаления любых меток, таких как His-метка. Непосредственно после получения неочищенного, частично очищенного или более полно очищенного белка Cas9 белок может быть введен в растительную клетку.

В конкретных вариантах осуществления белок Cas9 смешивают с chi/sgRNA, нацеленной на представляющий интерес ген с получением предварительно собранного рибонуклеопротеина.

Отдельные компоненты или предварительно собранный рибонуклеопротеин могут быть введены в растительную клетку с помощью электропорации, с помощью бомбардировки частицами, покрытыми продуктом гена, ассоциированного с Cas9, с помощью химической трансфекции или с помощью других средств транспорта через клеточную мембрану. Например, была показана трансфекция протопласта растения предварительно собранным рибонуклеопротеином CRISPR с целью обеспечения целевой модификации генома растения (как описано Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389).

В конкретных вариантах осуществления компоненты системы CRISPR/Cas9 вводят в растительные клетки с помощью наночастиц. Компоненты, как в виде белка, так в виде нуклеиновой кислоты или их комбинации, могут быть нагружены или упакованы в наночастицы и нанесены на растения (такие как, например, описаны в WO 2008042156 и US 20130185823). В частности, варианты осуществления по настоящему изобретению предусматривают наночастицы, нагруженные или упакованные молекулой(молекулами) ДНК, кодирующей(кодирующими) белок Cas9, молекулами ДНК, кодирующими chi/sgRNA и/или выделенную chi/sgRNA, как описано в WO2015089419.

Дополнительные средства введения одного или нескольких компонентов системы CRISPR/Cas9 в растительную клетку предусматривают проникающие пептиды (CPP). Соответственно, в частности, варианты осуществления по настоящему изобретению предусматривают проникающий пептид, связанный с белком Cas9. В конкретных вариантах осуществления настоящего изобретения белок Cas9 и/или chi/sgRNA связаны с одним или несколькими CPP с целью эффективной транспортировки в протопласты клеток (как описано Ramakrishna (2014 Genome Res. 2014 Jun;24(6):1020-7 в случае Cas9 в человеческих клетках). В других вариантах осуществления ген Cas9 и/или chi/sgRNA кодируются одной или несколькими кольцевой(кольцевыми) или некольцевой(некольцевыми) молекулой(молекулами) ДНК, которые связаны с одним или несколькими CPP для доставки в протопласты растений. Протопласты растений затем регенерируют до растительных клеток и затем до растений. CPP, как правило, описаны в виде коротких пептидов из менее чем 35 аминокислот, полученных как из белков, так и из химерных последовательностей, которые способны транспортировать биомолекулы через клеточную мембрану рецепторно-зависимым образом. CPP может представлять собой катионные пептиды, пептиды, имеющие гидрофобные последовательности, амфипатические пептиды, пептиды, имеющие последовательность с высоким содержанием пролина и антимикробную последовательность, и химерные или состоящие из двух частей пептиды (Pooga and Langel 2005). CPP способны проникать через биологические мембраны и таким образом вызывать движение различных биомолекул через клеточные мембраны в цитоплазму, и улучшать внутриклеточное движение, и, таким образом, облегчать взаимодействие биомолекулы с мишенью. Примеры CPP включают среди прочего Tat, ядерный белок транскрипционный активатор для вирусной репликации HIV 1 типа, пенетратин, сигнальную пептидную последовательность на основе фактора роста фибробластов Капоши (FGF), сигнальную пептидную последовательность на основе интегрина β3; Arg-последовательность на основе полиаргининового пептида, молекулярные транспортеры с высоким содержанием гуанина, пептид "sweet arrow" и др.

Применение системы CRISPR/Cas9 для получения генетически модифицированных нетрансгенных растений

В конкретных вариантах осуществления способы, описанные в данном документе, используются для модификации эндогенных генов или для модификации их экспрессии без перманентного введения в геном растения какого-либо чужеродного гена, в том числе кодирующих компонентов CRISPR, с тем, чтобы избежать присутствия чужеродной ДНК в геноме растения. Это может представлять интерес, поскольку регуляторные требования для нетрансгенных растений являются менее жесткими.

В конкретных вариантах осуществления это обеспечивается транзиентной экспрессией компонентов CRISPR/Cas9. В конкретных вариантах осуществления один или несколько из компонентов CRISPR экспрессируются одним или несколькими вирусными векторами, которые продуцируют достаточно белка Cas9 и chi/sgRNA для стабильного обеспечения модификации представляющего интерес гена в соответствии со способом, описанным в данном документе.

В конкретных вариантах осуществления транзиентная экспрессия конструкций CRISPR/Cas9 обеспечивается в протопластах растений и, таким образом, не интегрирована в геном. Ограниченное окно экспрессии может быть достаточным для обеспечения того, чтобы система CRISPR/Cas9 обеспечила модификацию целевого гена, как описано в данном документе.

В конкретных вариантах осуществления различные компоненты системы CRISPR/Cas9 вводят в растительную клетку, протопласт или растительную ткань, как раздельно, так и в смеси, с целью раздельной доставки молекул, таких как наночастицы или молекулы CPP, как описано в данном документ выше.

Экспрессия компонентов CRISPR/Cas9 может индуцировать целевую модификацию генома, как путем непосредственной активности нуклеазы Cas9 и необязательного введения матричной ДНК, так и путем модификации целевых генов с помощью системы CRISPR/Cas9, как описано в данном документе. Различные стратегии, описанные в данном документе выше, обеспечивают Cas9-опосредованное целевое редактирование генома, требующее введения компонентов CRISPR/Cas9 в геном растений. Компоненты, которые транзиентно вводят в растительную клетку, как правило, удаляют при селекции.

Выявление модификаций в растительных геном-селектируемых маркерах

В конкретных вариантах осуществления, где способ включает модификацию эндогенного целевого гена генома растения, для определения может быть применен любой подходящий способ после того, как растение, часть растения или растительную клетку инфицируют или трансфицируют системой CRISPR/Cas9, вне зависимости от того, произошло или не произошло нацеливание на ген или направленный мутагенез в целевом сайте. Если способ предусматривает введение трансгена, то трансформированная растительная клетка, каллюс, ткань или растение могут быть идентифицированы и выделены с помощью отбора или скрининга сконструированного растительного материала на наличие трансгена или признаков, кодируемых трансгеном. Физические и биохимические способы могут быть использованы для выявления трансформантов растений или растительных клеток, содержащих вставленные генные конструкции или модификацию эндогенной ДНК. Эти способы включают без ограничения: 1) саузерн-анализ или ПЦР-амплификацию для выявления и определения структуры вставки рекомбинантной ДНК или модифицированных эндогенных генов; 2) нозерн-блоттинг, защиту от S1 РНКазы, достройку праймера или ПЦР-апмлификацию с помощью обратной транскриптазы для выявления и исследования РНК-транскриптов генных конструкций; 3) ферментативные анализы для выявления активности ферментов или рибозимов, где такие продукты генов кодируются генной конструкцией, или экспрессия нарушена в результате генетической модификации; 4) гель-электрофорез белка, методики вестерн-блоттинга, иммуноосаждение или иммуноанализы с иммобилизованными ферментами, где генная конструкция или продукты эндогенных генов представляют собой белки. Дополнительные методики, такие как гибридизация in situ, ферментативное окрашивание и иммуноокрашивание, также могут быть использованы для выявления наличия или экспрессии рекомбинантной конструкции или выявления модификации эндогенного гена в конкретных органах или тканях растений. Способы для выполнения всех этих анализов хорошо известны специалистам в данной области.

Кроме того (или альтернативно), систему экспрессии, кодирующую компоненты CRISPR/Cas9, обычно разрабатывают с целью содержания одного или нескольких селектируемых или выявляемых маркеров, которые обеспечивают средство для выделения или эффективного отбора клеток, которые содержат систему CRISPR/Cas9 и/или были модифицированы ей на ранней стадии и в большом объеме.

В случае опосредованной Agrobacterium трансформации кассета с маркерами может находиться вблизи границ фланкирующей T-ДНК или между ними и содержаться в бинарном векторе. В другом варианте осуществления кассета с маркерами может находиться за пределами Т-ДНК. Кассета с селектируемыми маркерами может также находиться на границах той же самой T-ДНК, что и кассета экспрессии, или вблизи них и может находиться в каком-то другом месте во второй Т-ДНК в бинарном векторе (например, системе 2 T-ДНК).

В случае бомбардировки частицами или трансформации протопласта система экспрессии может содержать один или несколько выделенных линейных фрагментов или может быть частью более крупной конструкции, которая должна содержать элементы репликации бактерий, селектируемые маркеры бактерий или другие выявляемые элементы. Кассета(кассеты) экспрессии, содержащая(содержащие) полинуклеотиды, кодирующие направляющую последовательность и/или Cas9, может(могут) быть физически связана(связаны) с кассетой с маркерами или может(могут) быть смешана(смешаны) со второй молекулой нуклеиновой кислоты, кодирующей кассету с маркерами. Кассета с маркерами состоит из необходимых элементов для экспрессии выявляемого или селектируемого маркера, который обеспечивает эффективный отбор трансформированных клеток.

Процедура отбора в случае клеток на основании селектируемого маркера будет зависеть от природы маркерного гена. В конкретных вариантах осуществления применяют селектируемый маркер, т.е. маркер, который обеспечивает непосредственный отбор клеток на основе экспрессии маркера. Селектируемый маркер может обеспечивать положительный или отрицательный отбор и зависит или не зависит от наличия внешних субстратов (Miki et al., 2004, 107(3): 193-232). Как правило, гены устойчивости к антибиотикам или гербицидам используют в качестве маркеров, при этом отбор должен выполняться в зависимости от роста сконструированного растительного материала на средах, содержащих ингибирующее количество антибиотика или гербицида, к которому маркерный ген придает устойчивость. Примерами таких генов являются гены, которые придают устойчивость к антибиотикам, таким как гигромицин (hpt) и канамицин (nptII), и гены, которые придают устойчивость к гербицидам, таким как фосфинотрицин (bar) и хлорсульфурон (als).

Трансформированные растения и растительные клетки могут также быть идентифицированы с помощью скрининга на виды активности видимого маркера, как правило, фермента, способного обработать окрашенный субстрат (например, β-глюкоронидазу, люциферазу, гены B или C1). Такие методики отбора и скрининга хорошо известны специалистам в данной области.

Культуры и регенерация растений

В конкретных вариантах осуществления растительные клетки имеют модифицированный геном, и те, которые образованы или получены с помощью любого из способов, описанных в данном документе, могут быть культивированы с регенерацией целого растения, которое обладает трансформированным или модифицированным генотипом и, таким образом, желаемым фенотипом. Стандартные методики регенерации хорошо известны специалистам в данной области. Конкретные примеры таких методик регенерации основаны на действии определенных фитогормонов в среде для роста культуры тканей, и, как правило, основаны на биоцидном и/или гербицидном маркере, который был введен совместно с требуемыми нуклеотидными последовательностями. В дополнительных конкретных вариантах осуществления регенерация растений осуществляется исходя из культивируемых протопластов, каллюса, эксплантов, органов, пыльцы, эмбрионов растений или их частей (см., например, Evans et al. (1983), Handbook of Plant Cell Culture, Klee et al. (1987) Ann. Rev. of Plant Phys.).

В конкретных вариантах осуществления трансформированные или улучшенные растения, как описано в данном документе, могут быть самоопылены с получением семян для гомозитных улучшенных растений по настоящему изобретению (гомозиготных для модификации ДНК) или скрещены с нетрансгенными растениями или различными улучшенными растениями с получением семян для гетерозиготных растений. Если рекомбинантная ДНК была внесена в растительную клетку, то полученное в результате такой селекции растение представляет собой растение, которое является гетерозиготным по рекомбинантной молекуле ДНК. Оба такие гомозиготное и гетерозиготное растения, полученные при скрещивании от улучшенных растений и содержащие генетическую модификацию (которая может представлять собой рекомбинантную ДНК), называются в данном документе "потомство". Дочерние растения представляют собой растения, происходящие от исходного родительского растения и содержащие модификацию генома или молекулу рекомбинантной ДНК, введенную с помощью способов, предусмотренных в данном документе. Альтернативно генетически модифицированные растения могут быть получены с помощью одного из способов, описанных выше, с применением Cas9, где чужеродная ДНК не вводится в геном. Потомство таких растений, полученных с помощью дополнительной селекции, также может содержать генетическую модификацию. Скрещивания выполняют с помощью любых способов селекции, которые широко применяют для различных сельскохозяйственных культур (например, Allard, Principles of Plant Breeding, John Wiley & Sons, NY, U. of CA, Davis, CA, 50-98 (1960).

Получение растений с улучшенными агрономическими характеристиками

Системы CRISPR на основе Cas9, предусмотренные в данном документе, могут быть использованы для введения целевых двунитевых или однонитевых разрывов и/или для введения систем активаторов и/или репрессоров генов и без ограничения могут быть использованы для целенправленного воздействия на гены, замещения генов, направленного мутагенеза, целевых делеций или вставок, целевых инверсий и/или целевых транслокаций. С помощью коэкспрессии нескольких нацеливающих РНК, направленных на получение нескольких модификаций в одной клетке, может быть обеспечена мультиплексная модификация геномов. Эта технология может быть использована для высокоточного конструирования растений с улучшенными характеристиками, в том числе повышенной пищевой ценностью, повышенной устойчивостью к биотическому и абиотическому стрессу и повышенной продукцией коммерчески ценных растительных продуктов или гетерологичных соединений.

В конкретных вариантах осуществления система CRISPR/Cas9, как описано в данном документе, используется для введения целевых двунитевых разрывов (DSB) в последовательность эндогенной ДНК. DSB активирует клеточные пути репарации ДНК, которые могут быть использованы для достижения требуемых модификаций последовательности ДНК возле сайта разрыва. Это представляет интерес, если инактивация эндогенных генов может придавать желаемый признак или способствует его появлению. В конкретных вариантах осуществления гомологичная рекомбинация матричной последовательностью активизируется в сайте DSB с целью введения представляющего интерес гена.

В конкретных вариантах осуществления система CRISPR/Cas9 может быть использована в качестве генерического связывающегося с нуклеиновой кислотой белка при слиянии или при функциональном связывании с функциональным доменом для активации и/или репрессии эндогенных генов растений. Иллюстративные функциональные домены могут включать без ограничения инициатор трансляции, активатор трансляции, репрессор трансляции, нуклеазы, в частности, рибонуклеазы, сплайсосому, гранулы, индуцируемый/контролируемый светом домен или химически индуцируемый/контролируемый домен. Как правило, в этих вариантах осуществления белок Cas9 содержит по меньшей мере одну мутацию, например, он характеризуется не более чем 5% активности белка Cas9, не имеющего по меньшей мере одной мутации; chi/sgRNA содержит направляющую последовательность, способную к гибридизации с целевой последовательностью.

Способы, описанные в данном документе, как правило, приводят к получению "улучшенных растений" в том отношении, что они имеют один или несколько желаемых признаков по сравнению с растением дикого типа. В конкретных вариантах осуществления полученные растения, растительные клетки или части растения представляют собой трансгенные растения, содержащие последовательность экзогенной ДНК, включенную в геном всех или части клеток растения. В конкретных вариантах осуществления нетрансгенные генетически модифицированные растения, части растений или растительные клетки получают таким образом, что никакой последовательности экзогенной ДНК не включено в геном любой из растительных клеток растения. В таких вариантах осуществления улучшенные растения являются нетрансгенными. В случае, если обеспечивают только модификацию экзогенного гена и никаких чужеродных генов не вводят или не сохраняют в геноме растения, то полученные в результате генетически модифицированные сельскохозяйственные культуры не содержат чужеродных генов и могут, таким образом, по существу, считаться нетрансгенными. Различные варианты применения системы CRISPR/Cas9 для редактирования геномов растений описаны более подробно ниже.

a) Введение одного или нескольких чужеродных генов для придания представляющей интерес сельскохозяйственной характеристики

Настоящее изобретение относится к способам редактирования геномов или модификации последовательностей, ассоциированных с представляющим интерес целевым локусом или находящихся в нем, где способ включает введение комплекса эффекторного белка Cas9 в растительную клетку, при этом комплекс эффекторного белка Cas9 эффективно функционирует с целью интеграции вставки ДНК, например, кодирующей представляющий интерес чужеродный ген в геном растительной клетки. В предпочтительных вариантах осуществления интеграция вставки ДНК облегчается с помощью HR с экзогенно введенной ДНК-матрицей или матрицей для репарации. Как правило, экзогенно введенную ДНК-матрицу или матрицу для репарации доставляют совместно с комплексом эффекторного белка Cas9 или одного компонента или полинуклеотидного вектора для экспрессии компонента комплекса.

Системы CRISPR/Cas9, предусмотренные в данном документе, обеспечивают целевую доставку генов. Стало более ясно, что экспрессия представляющего интерес гена в большой степени определяется положением интеграции в геном. Способы настоящего изобретения обеспечивают подвергаемую нацеливанию интеграцию чужеродного гена в необходимое положение в геноме. Положение может быть выбрано на основе информации о ранее полученных событиях или может быть выбрано с помощью способов, раскрытых в других местах в данном документе.

В конкретных вариантах осуществления способы, предусмотренные в данном документе, предусматривают (a) введение в клетку комплекса CRISPR/Cas9, содержащего chi/sgRNA, содержащую прямой повтор и направляющую последовательность, где направляющая последовательность гибридизируется с целевой последовательностью, которая является эндогенной по отношению к растительной клетке; (b) введение в растительную клетку эффекторной молекулы Cas9, которая образует комплексы с chi/sgRNA, когда направляющая последовательность гибридизируется с целевой последовательностью и индуцирует двунитевой разрыв в последовательности, на которую нацеливается направляющая последовательность, или возле нее; и (c) введение в клетку нуклеотидной последовательности, кодирующей матрицу для репарации HDR, которая кодирует представляющий интерес ген и который вводят в положение DS разрыва в результате HDR. В конкретных вариантах осуществления стадия введения может предусматривать доставку в растительную клетку одного или нескольких полинуклеотидов, кодирующих эффекторный белок Cas9, chi/sgRNA и матрицу для репарации. В конкретных вариантах осуществления полинуклеотиды доставляют в клетку с помощью ДНК-содержащего вируса (например, гемнивируса) или РНК-содержащего вируса (например, тобравируса). В конкретных вариантах осуществления стадии введения предусматривают введение в растительную клетку T-ДНК, содержащей одну или несколько полинуклеотидных последовательностей, кодирующих эффекторный белок Cas9, chi/sgRNA и матрицу для репарации, где доставка осуществляется посредством Agrobacterium. Последовательность нуклеиновой кислоты, кодирующей эффекторный белок Cas9, может быть функционально связанной с промотором, таким как конститутивный промотор (например, промотор вируса мозаики цветной капусты 35S), или клеточноспецифический, или индуцируемый промотор. В конкретных вариантах осуществления полинуклеотид вводят с помощью бомбардировки микрочастицами. В конкретных вариантах осуществления способ дополнительно предусматривает скрининг растительной клетки после стадий введения с целью определения того, была ли введена матрица для репарации, т.е. представляющий интерес ген. В конкретных вариантах осуществления способы предусматривают стадию регенерации растения из растительной клетки. В дополнительных вариантах осуществления способы предусматривают кроссбридинг растения с получением генетически требуемой линии растений. Примеры чужеродных генов, кодирующих представляющий интерес признак, приведены ниже.

b) Редактирование эндогенных генов для придания представляющей интерес сельскохозяйственной характеристики

Настоящее изобретение относится к способам редактирования геномов или модификации последовательностей, ассоциированных с представляющим интерес целевым локусом, где способ включает введение комплекса эффекторного белка Cas9 в растительную клетку, при этом комплекс Cas9 модифицирует экспрессию эндогенного гена растения. Это может быть достигнуто различными путями. В конкретных вариантах осуществления устранение экспрессии эндогенного гена является желательным, и комплекс CRISPR/Cas9 используют для нацеливания на эндогенный ген с целью модификации экспрессии гена и его расщепления. В этих вариантах осуществления способы, предусмотренные в данном документе, предусматривают (a) введение в растительную клетку комплекса CRISPR/Cas9, содержащего chi/sgRNA, содержащую прямой повтор и направляющую последовательность, где направляющая последовательность гибридизируется с целевой последовательность в представляющем интерес гене в геноме растительной клетки; и (b) введение в клетку эффекторного белка Cas9, который при связывании с chi/sgRNA, содержащей направляющую последовательность, которая гибридизируется с целевой последовательностью, обеспечивает двунитевой разрыв в последовательности, на которую направляющая последовательность оказывает нацеливание, или возле нее. В конкретных вариантах осуществления стадия введения может предусматривать доставку в растительную клетку одного или нескольких полинуклеотидов, кодирующих эффекторный белок Cas9 и chi/sgRNA.

В конкретных вариантах осуществления полинуклеотиды доставляют в клетку с помощью ДНК-содержащего вируса (например, гемнивируса) или РНК-содержащего вируса (например, тобравируса). В конкретных вариантах осуществления стадии введения предусматривают введение в растительную клетку T-ДНК, содержащей одну или несколько полинуклеотидных последовательностей, кодирующих эффекторный белок Cas9 и chi/sgRNA, где доставка осуществляется посредством Agrobacterium. Полинуклеотидная последовательность, кодирующая компоненты системы CRISPR/Cas9, может быть функционально связанной с промотором, таким как конститутивный промотор (например, промотор вируса мозаики цветной капусты 35S), или клеточноспецифический, или индуцируемый промотор. В конкретных вариантах осуществления полинуклеотид вводят с помощью бомбардировки микрочастицами. В конкретных вариантах осуществления способ дополнительно предусматривает скрининг растительной клетки после стадий введения с целью определения того, была ли модифицирована экспрессия представляющего интерес гена. В конкретных вариантах осуществления способы предусматривают стадию регенерации растения из растительной клетки. В дополнительных вариантах осуществления способы предусматривают кроссбридинг растения с получением генетически требуемой линии растений.

В конкретных вариантах осуществления способов, описанных выше, устойчивые к болезням сельскохозяйственные растения получают с помощью целевой мутации генов подверженности к болезням или генов, кодирующих отрицательные регуляторы (например, ген Mlo), из генов, обеспечивающих защиту растений. В конкретном варианте осуществления устойчивые к гербицидам сельскохозяйственные растения получают с помощью целевой замены конкретных нуклеотидов в генах растений, таких как кодирующие ацетолактатсинтазу (ALS) и протопорфириногеноксидазу (PPO). В конкретных вариантах осуществления предусмотрено получение засухоустойчивых и солевыносливых сельскохозяйственных растений с помощью целевой мутации генов, кодирующих отрицательные регуляторы переносимости абиотического стресса, зерновых культур с низким содержанием амилозы с помощью мутации гена Waxy, риса или других зерновых культур со сниженной прогорклостью с помощью целевой мутации основных генов липазы в алейроновом слое и т.д. Более подробный перечень эндогенных генов, кодирующих представляющие интерес признаки, приведен ниже.

c) Модулирование эндогенных генов с помощью системы CRISPR/Cas9 для придания представляющего интерес сельскохозяйственного признака

В данном документе также предусмотрены способы модулирования (т.е. активации или репрессии) экспрессии эндогенного гена с помощью белка Cas9, предусмотренного в данном документе. В таких способах применяют различающаяся(различающиеся) последовательность(последовательности) РНК, которая(которые) нацеливаются на геном растений с помощью комплекса Cas9. В частности, различающаяся(различающиеся) последовательность(последовательности) РНК связывается(связываются) с двумя или более адаптерными белками (например, аптамерами), где каждый адаптерный белок ассоциирован с одним или несколькими функциональными доменами и где по меньшей мере один или несколько функциональных доменов, ассоциированных с адаптерным белком, имеют одну или несколько видов активности, предусматривающих метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновых кислот. Функциональные домены используют для модулирования экспрессии эндогенного гена растений для того, чтобы получить желаемый признак. Как правило, в этих вариантах осуществления эффекторный белок Cas9 имеет одну или несколько мутаций таким образом, что он имеет не более 5% нуклеазоной активности эффекторного белка Cas9, не имеющего по меньшей мере одной мутации.

В конкретных вариантах осуществления способы, предусмотренные в данном документе, предусматривают стадии (a) введения в клетку комплекса CRISPR/Cas9, содержащего chi/sgRNA, содержащую прямой повтор и направляющую последовательность, где направляющая последовательность гибридизируется с целевой последовательностью, которая является эндогенной по отношению к растительной клетке; (b) введения в растительную клетку эффекторной молекулы Cas9, которая образует комплексы с chi/sgRNA, когда направляющая последовательность гибридизируется с целевой последовательностью; и где chi/sgRNA модифицируют с целью содержания различающейся последовательности РНК (аптамера), связывающейся с функциональным доменом, и/или эффекторный белок Cas9 модифицируют таким образом, что он связывается с функциональным доменом. В конкретных вариантах осуществления стадия введения может предусматривать доставку в растительную клетку одного или нескольких полинуклеотидов, кодирующих (модифицированный) эффекторный белок Cas9 и (модифицированную) chi/sgRNA. Подробности о компонентах системы CRISPR/Cas9 для применения в этих способах описаны в других местах в данном документе.

В конкретных вариантах осуществления полинуклеотиды доставляют в клетку с помощью ДНК-содержащего вируса (например, гемнивируса) или РНК-содержащего вируса (например, тобравируса). В конкретных вариантах осуществления стадии введения предусматривают введение в растительную клетку T-ДНК, содержащей одну или несколько полинуклеотидных последовательностей, кодирующих эффекторный белок Cas9 и chi/sgRNA, где доставка осуществляется посредством Agrobacterium. Последовательность нуклеиновой кислоты, кодирующая один или несколько компонентов системы CRISPR/Cas9, может быть функционально связанной с промотором, таким как конститутивный промотор (например, промотор вируса мозаики цветной капусты 35S), или клеточноспецифический, или индуцируемый промотор. В конкретных вариантах осуществления полинуклеотид вводят с помощью бомбардировки микрочастицами. В конкретных вариантах осуществления способ дополнительно предусматривает скрининг растительной клетки после стадий введения с целью определения того, была ли модифицирована экспрессия представляющего интерес гена. В конкретных вариантах осуществления способы предусматривают стадию регенерации растения из растительной клетки. В дополнительных вариантах осуществления способы предусматривают кроссбридинг растения с получением генетически требуемой линии растений. Более подробный перечень эндогенных генов, кодирующих представляющий интерес признак, приведен ниже.

Применение Cas9 для модификации полиплоидных растений

Многие растения являются полиплоидными, что означает, что они несут двойные копии своих геномов — иногда до шести, как у пшеницы. Способы в соответствии с настоящим изобретением, в которых применяют эффекторный белок CRISPR/Cas9, могут быть "мультиплексными" с целью воздействия на все копии гена или нацеливания на несколько генов сразу. Например, в конкретных вариантах осуществления способы по настоящему изобретению применяют для одновременного обеспечения мутации потери функции в различных генах, ответственных за подавление защиты по отношению к болезни. В конкретных вариантах осуществления способы по настоящему изобретению применяют для одновременной супрессии экспрессии последовательности нуклеиновой кислоты TaMLO-Al, TaMLO-Bl и TaMLO-Dl в растительной клетке пшеницы и регенерации из нее растения пшеницы, чтобы обеспечить устойчивость растения пшеницы к мучнистой росе (см. также WO2015109752).

Иллюстративные гены, придающие агрономические признаки

Как описано в данном документе выше, в конкретных вариантах осуществления настоящее изобретение охватывает применение системы CRISPR/Cas9, как описано в данном документе, для вставки представляющей интерес ДНК, в том числе одного или нескольких экспрессируемых генов растения. В дополнительных конкретных вариантах осуществления настоящее изобретение охватывает способы и средства, в которых применяют систему Cas9, как описано в данном документе, для частичного или полного удаления одного или нескольких экспрессируемых генов растения. В других дополнительных вариантах осуществления настоящее изобретение охватывает способы и средства, в которых применяют систему Cas9, как описано в данном документе, для обеспечения модификации одного или нескольких экспрессируемых в растениях генов с помощью мутации, замены, вставки одного или нескольких нуклеотидов. В других вариантах осуществления настоящее изобретение охватывает применение системы CRISPR/Cas9, как описано в данном документе, для обеспечения модификации экспрессии одного или нескольких экспрессируемых в растениях генов с помощью специфической модификации одного или нескольких из регуляторных элементов, управляющих экспрессией указанных генов.

В конкретных вариантах осуществления настоящее изобретение охватывает способы, которые предусматривают введение экзогенных генов и/или воздействия на эндогенные гены и их регуляторные элементы, такие как приведенные ниже:

1. Гены, которые придают устойчивость к вредителям или болезням

Гены, придающие устойчивость к болезням растений. Растение может быть трансформировано клонированными генами устойчивости с целью конструирования растений, которые являются устойчивыми к специфическим патогенным штаммам. См., например, Jones et al., Science 266:789 (1994) (клонирование гена устойчивости томата Cf-9 к Cladosporium fulvum); Martin et al., Science 262:1432 (1993) (ген устойчивости томата Pto к Pseudomonas syringae pv. tomato кодирует протеинкиназу); Mindrinos et al., Cell 78:1089 (1994) (арабидопсис может иметь ген RSP2 устойчивости к Pseudomonas syringae).

Гены, придающие устойчивость к вредителю, такому как соевая цистообразующая нематода. См., например, заявку согласно PCT WO 96/30517; заявку согласно PCT WO 93/19181.

Белки Bacillus thuringiensis, см., например, в Geiser et al., Gene 48:109 (1986).

Лектины, см., например, в Van Damme et al., Plant Molec. Biol. 24:25 (1994).

Витамин-связывающий белок, такой как авидин, см. в заявке согласно PCT US93/06487, описывающей применение авидина и гомологов авидина в качестве ларвацидов против насекомых-вредителей.

Ингибиторы ферментов, такие как ингибиторы протеазы или протеиназы или ингибиторы амилазы. См., например, Abe et al., J. Biol. Chem. 262:16793 (1987), Huub et al., Plant Molec. Biol. 21:985 (1993)), Sumitani et al., Biosci. Biotech. Biochem. 57:1243 (1993) и патент США № 5494813.

Специфичные в отношении насекомых гормоны или феромоны, такие как экдистероид, или ювенильный гормон, его вариант, миметик на его основе или его антагонист или агонист. См., например, Hammock et al., Nature 344:458 (1990).

Специфичные в отношении насекомых пептиды или нейропептиды, которые при экспрессии нарушают физиологию пораженного вредителя. Например, Regan, J. Biol. Chem. 269:9 (1994) и Pratt et al., Biochem. Biophys. Res. Comm. 163:1243 (1989). См. также патент США № 5266317.

Специфичный в отношении насекомых яд, вырабатываемый в природе змеей, осой или любым другим организмом. Например, см. Pang et al., Gene 116: 165 (1992).

Ферменты, ответственные за гипераккумуляцию монотерпена, сесквитерпена, стероида, гидроксамовой кислоты, производного фенилпропаноида или другой небелковой молекулы с инсектицидной активностью.

Ферменты, участвующие в модификации, в том числе посттрансляционной модификации, биологически активной молекулы; например, гликолитический фермент, протеолитический фермент, липолитический фермент, нуклеаза, циклаза, трансаминаза, эстереза, гидролаза, фосфатаза, киназа, фосфорилаза, полимераза, эластаза, хитиназа и глюканаза, вне зависимости от того являются ли они натуральными или синтетическими. См. заявку согласно PCT WO93/02197, Kramer et al., Insect Biochem. Molec. Biol. 23:691 (1993) и Kawalleck et al., Plant Molec. Biol. 21 :673 (1993).

Молекулы, которые стимулируют передачу сигнала. Например, см. Botella et al., Plant Molec. Biol. 24:757 (1994) и Griess et al., Plant Physiol. 104:1467 (1994).

Вирусные инвазивные белки или сложный токсин, полученный из них. См. Beachy et al., Ann. rev. Phytopathol. 28:451 (1990).

Белки, останавливающие развитие, образуемые в природе патогеном или паразитом. См. Lamb et al., Bio/Technology 10:1436 (1992) и Toubart et al., Plant J. 2:367 (1992).

Белок, останавливающий развитие, образуемый в природе растением. Например, Logemann et al., Bio/Technology 10:305 (1992).

У растений патогены часто являются специфичными по отношению к хозяину. Например, некоторые виды Fusarium будут вызывать вилт томата, однако поражают только томат, в то время как другие виды Fusarium поражают только пшеницу. Растения обладают присущими и индуцированными защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может присутствовать нехозяйская устойчивость, например, хозяин и патоген несовместимы, или может присутствовать частичная устойчивость по отношению ко всем расам патогена, как правило, контролируемая многими генами, и/или также полная устойчивость к некоторым расам патогена, но не к другим расам. Такая устойчивость, как правило, контролируется несколькими генами. С помощью способов и компонентов системы CRISP-Cas9 в настоящее время существует новое средство для индукции предполагаемых мутаций. Соответственно, можно проанализировать геном источников генов устойчивости, и в растениях, имеющих желаемые характеристики или признаки, применять способ и компоненты системы CRISPR/Cas9 для индукции образования генов устойчивости. Системы настоящего изобретения могут выполнять это с большей точностью, чем применявшиеся ранее мутагенные средства, и, следовательно, ускорять и улучшать программы селекции растений.

2. Гены, участвующие в болезнях растений, таких как приведенные в WO 2013046247.

Болезни риса: Magnaporthe grisea, Cochliobolus miyabeanus, Rhizoctonia solani, Gibberella fujikuroi; болезни пшеницы: Erysiphe graminis, Fusarium graminearum, F. avenaceum, F. culmorum, Microdochium nivale, Puccinia striiformis, P. graminis, P. recondita, Micronectriella nivale, Typhula sp., Ustilago tritici, Tilletia caries, Pseudocercosporella herpotrichoides, Mycosphaerella graminicola, Stagonospora nodorum, Pyrenophora tritici-repentis; болезни ячменя: Erysiphe graminis, Fusarium graminearum, F. avenaceum, F. culmorum, Microdochium nivale, Puccinia striiformis, P. graminis, P. hordei, Ustilago nuda, Rhynchosporium secalis, Pyrenophora teres, Cochliobolus sativus, Pyrenophora graminea, Rhizoctonia solani; болезни маиса: Ustilago maydis, Cochliobolus heterostrophus, Gloeocercospora sorghi, Puccinia polysora, Cercospora zeae-maydis, Rhizoctonia solani;

болезни цитрусовых: Diaporthe citri, Elsinoe fawcetti, Penicillium digitatum, P. italicum, Phytophthora parasitica, Phytophthora citrophthora; болезни яблонь: Monilinia mali, Valsa ceratosperma, Podosphaera leucotricha, Alternaria alternata apple pathotype, Venturia inaequalis, Colletotrichum acutatum, Phytophtora cactorum;

болезни груш: Venturia nashicola, V. pirina, Alternaria alternata Japanese pear pathotype, Gymnosporangium haraeanum, Phytophtora cactorum;

болезни персиков: Monilinia fructicola, Cladosporium carpophilum, Phomopsis sp.;

болезни винограда: Elsinoe ampelina, Glomerella cingulata, Uninula necator, Phakopsora ampelopsidis, Guignardia bidwellii, Plasmopara viticola;

болезни хурмы: Gloesporium kaki, Cercospora kaki, Mycosphaerela nawae;

болезни тыквы бутылочной: Colletotrichum lagenarium, Sphaerotheca fuliginea, Mycosphaerella melonis, Fusarium oxysporum, Pseudoperonospora cubensis, Phytophthora sp., Pythium sp.;

болезни томата: Alternaria solani, Cladosporium fulvum, Phytophthora infestans;

болезни баклажана: Phomopsis vexans, Erysiphe cichoracearum;

болезни капустных овощей: Alternaria japonica, Cercosporella brassicae, Plasmodiophora brassicae, Peronospora parasitica;

болезни лука-батуна: Puccinia allii, Peronospora destructor;

болезни сои: Cercospora kikuchii, Elsinoe glycines, Diaporthe phaseolorum var. sojae, Septoria glycines, Cercospora sojina, Phakopsora pachyrhizi, Phytophthora sojae, Rhizoctonia solani, Corynespora casiicola, Sclerotinia sclerotiorum;

болезни турецких бобов: Colletrichum lindemthianum;

болезни арахиса: Cercospora personata, Cercospora arachidicola, Sclerotium rolfsii;

болезни гороха: Erysiphe pisi;

болезни картофеля: Alternaria solani, Phytophthora infestans, Phytophthora erythroseptica, Spongospora subterranean, f. sp. Subterranean;

болезни клубники: Sphaerotheca humuli, Glomerella cingulata;

болезни чая: Exobasidium reticulatum, Elsinoe leucospila, Pestalotiopsis sp., Colletotrichum theaesinensis;

болезни табака: Alternaria longipes, Erysiphe cichoracearum, Colletotrichum tabacum, Peronospora tabacina, Phytophthora nicotianae;

болезни рапса: Sclerotinia sclerotiorum, Rhizoctonia solani;

болезни хлопчатника: Rhizoctonia solani;

болезни свеклы: Cercospora beticola, Thanatephorus cucumeris, Thanatephorus cucumeris, Aphanomyces cochlioides;

болезни роз: Diplocarpon rosae, Sphaerotheca pannosa, Peronospora sparsa;

болезни хризантем и астровых: Bremia lactuca, Septoria chrysanthemi-indici, Puccinia horiana;

болезни различных растений: Pythium aphanidermatum, Pythium debarianum, Pythium graminicola, Pythium irregulare, Pythium ultimum, Botrytis cinerea, Sclerotinia sclerotiorum;

болезни редиса: Alternaria brassicicola;

болезни цойсии: Sclerotinia homeocarpa, Rhizoctonia solani;

болезни банана: Mycosphaerella fijiensis, Mycosphaerella musicola;

болезни подсолнечника: Plasmopara halstedii;

болезни семян и болезни на начальных стадиях роста различных растений, вызванные Aspergillus spp., Penicillium spp., Fusarium spp., Gibberella spp., Tricoderma spp., Thielaviopsis spp., Rhizopus spp., Mucor spp., Corticium spp., Rhoma spp., Rhizoctonia spp., Diplodia spp. и т.п.;

вирусные болезни различных растений, опосредованные Polymixa spp., Olpidium spp. и т.п.

3. Примеры генов, которые придают устойчивость к гербицидам

Устойчивость к гербицидам, которые ингибируют точку роста или меристему, такие как имидазолинон или сульфомочевина, например, Lee et al., EMBO J. 7:1241 (1988), и Miki et al., Theor. Appl. Genet. 80:449 (1990) соответственно.

Переносимость глифосата (устойчивость, придаваемая, например, генами мутантной 5-енолпирувилшикимат-3-фосфатсинтазы (EPSPS), генами aroA и генами глифосатацетилтрансферазы (GAT) соответственно), или устойчивость к другим фосфоновым соединениям, например, с помощью генов глюфосината (фосфинотрицинацетилтрансферазы (PAT) от видов Streptomyces, в том числе Streptomyces hygroscopicus и Streptomyces viridichromogenes), и к пиридинокси- или феноксипропионовым кислотам и циклогексонам с помощью генов, кодирующих ингибиторы ACCазы. См., например, патент США № 4940835 и патент США № 6248876, патент США № 4769061, EP № 0333033 и патент США № 4975374. См. также EP № 0242246, DeGreef et al., Bio/Technology 7:61 (1989), Marshall et al., Theor. Appl. Genet. 83:435 (1992), WO 2005012515 от Castle et. al. и WO 2005107437.

Устойчивость к гербицидам, которые ингибируют фотосинтез, такие как триазин (гены psbA и gs+) или бензонитрил (ген нитрилазы), и глутатион-S-трансфераза, в Przibila et al., Plant Cell 3:169 (1991), патент США № 4810648, и Hayes et al., Biochem. J. 285: 173 (1992).

Гены, кодирующие ферменты, детоксифицирующие гербицид, или мутантный фермент глутаминсинтазу, которая устойчива к ингибированию, например, в заявке на патент США с серийным № 11/760602. Или детоксифицирующий фермент представляет собой фермент, кодирующий фосфинотрицинацетилтрансферазу (такую как белок bar или pat от видов Streptomyces). Фосфинотрицинацетилтрансферазы описаны, например, в патентах США №№ 5561236; 5648477; 5646024; 5273894; 5637489; 5276268; 5739082; 5908810 и 7112665.

Ингибиторы гидроксифенилпируватдиоксигеназ (HPPD), т.е. встречающиеся в природе устойчивые к HPPD ферменты, или гены, кодирующие мутированный или химерный фермент HPPD, как описано в WO 96/38567, WO 99/24585 и WO 99/24586, WO 2009/144079, WO 2002/046387 или патенте США № 6768044.

4. Примеры генов, участвующих в переносимости абиотического стресса

Трансген, способный с ослаблению экспрессии и/или активности гена поли(ADP-рибозо)полимеразы (PARP) в растительных клетках или растениях, как описано в WO 00/04173 или WO/2006/045633.

Трансгены, способные с ослаблению экспрессии и/или активности кодирующих PARG генов растений или растительных клеток, как описано в WO 2004/090140.

Трансгены, кодирующие функциональный в растениях фермент пути утилизации и синтеза никотинамидадениндинуклеотида, в том числе никотинамидазу, никотинатфосфорибозилтрансферазу, мононуклеотидаденилтрансферазу никотиновой кислоты, никотинамидадениндинуклеотидсинтетазу или никотинамидфосфорибозилтрансферзазу, как описано в EP 04077624.7, WO 2006/133827, PCT/EP07/002,433, EP 1999263 или WO 2007/107326.

Ферменты, участвующие в биосинтезе углеводов, включают описанные например, в EP 0571427, WO 95/04826, EP 0719338, WO 96/15248, WO 96/19581, WO 96/27674, WO 97/11188, WO 97/26362, WO 97/32985, WO 97/42328, WO 97/44472, WO 97/45545, WO 98/27212, WO 98/40503, WO99/58688, WO 99/58690, WO 99/58654, WO 00/08184, WO 00/08185, WO 00/08175, WO 00/28052, WO 00/77229, WO 01/12782, WO 01/12826, WO 02/101059, WO 03/071860, WO 2004/056999, WO 2005/030942, WO 2005/030941, WO 2005/095632, WO 2005/095617, WO 2005/095619, WO 2005/095618, WO 2005/123927, WO 2006/018319, WO 2006/103107, WO 2006/108702, WO 2007/009823, WO 00/22140, WO 2006/063862, WO 2006/072603, WO 02/034923, EP 06090134.5, EP 06090228.5, EP 06090227.7, EP 07090007.1, EP 07090009.7, WO 01/14569, WO 02/79410, WO 03/33540, WO 2004/078983, WO 01/19975, WO 95/26407, WO 96/34968, WO 98/20145, WO 99/12950, WO 99/66050, WO 99/53072, патенте США № 6734341, WO 00/11192, WO 98/22604, WO 98/32326, WO 01/98509, WO 01/98509, WO 2005/002359, патенте США № 5824790, патенте США № 6013861, WO 94/04693, WO 94/09144, WO 94/11520, WO 95/35026 или WO 97/20936, или ферменты, участвующие в образовании полифруктозы, в частности, из инулина или леванов, как раскрыто в EP 0663956, WO 96/01904, WO 96/21023, WO 98/39460 и WO 99/24593, образовании альфа-1,4-глюканов, как раскрыто в WO 95/31553, US 2002031826, патенте США № 6284479, патенте США № 5712107, WO 97/47806, WO 97/47807, WO 97/47808 и WO 00/14249, образовании альфа-1,6 разветвленных альфа-1,4-глюканов, как раскрыто в WO 00/73422, образовании альтернана, как раскрыто, например, в WO 00/47727, WO 00/73422, EP 06077301.7, патенте США № 5908975 и EP 0728213, образовании гиалуронана, например, как раскрыто в WO 2006/032538, WO 2007/039314, WO 2007/039315, WO 2007/039316, JP 2006304779 и WO 2005/012529.

Гены, которые повышают засухоустойчивость. Например, в WO 2013122472 раскрыто, что отсутствие или сниженный уровень функционального белка убиквитинпротеинлигазы (UPL), в частности, UPL3, приводит к сниженной потребности в воде или повышенной устойчивости к засухе указанного растения. Другие примеры трансгенных растений с повышенной переносимостью засухи раскрыты, например, в US 2009/0144850, US 2007/0266453 и WO 2002/083911. В US2009/0144850 описано растение, проявляющее фенотип переносимости засухи в результате измененной экспрессии нуклеиновой кислоты DR02. В US 2007/0266453 описано растение, проявляющее фенотип переносимости засухи в результате измененной экспрессии нуклеиновой кислоты DR03, и в WO 2002/08391 1 описано растение, имеющее повышенную переносимость стресса, вызванного засухой, в результате ослабленной активности АВС-транспортера, который экспрессируется в замыкающих клетках. Другим примером является исследование Kasuga и соавторов (1999), которые описывают, что сверхэкспрессия кДНК, кодирующей DREB1 A в трансгенных растениях, активировала экспрессию многих генов переносимости стресса при нормальных условиях роста и приводила к повышенной устойчивости к засухе, солевой нагрузке и замораживанию. Однако экспрессия DREB1A также приводила к тяжелой задержке роста при нормальных условиях роста (Kasuga (1999) Nat Biotechnol 17(3) 287-291).

В дополнительных конкретных вариантах осуществления сельскохозяйственные растения могут быть улучшены под влиянием определенных признаков растений. Например, при разработке растений, устойчивых к пестицидам, повышении устойчивости к заболеваниям у растений, повышении устойчивости к вредным для растений насекомым и нематодам, повышении устойчивости растений к паразитирующим сорнякам, повышении засухоустойчивости растений, повышении пищевой ценности растений, повышении переносимости стресса растений, избегании самоопыления, повышении перевариваемости кормовых растений, биомассы, урожая зерна и др. Несколько конкретных неограничивающих примеров предусмотрены в данном документе ниже.

Кроме целевой мутации единичных генов, комплексы Cas9CRISPR могут быть разработаны для обеспечения целевой мутации нескольких генов, делеции хромосомного фрагмента, сайт-специфической интеграции трансгена, сайт-направленного мутагенеза in vivo и точного замещения гена или замены аллелей у растений. Таким образом, способы, описанные в данном документе, имеют широкие варианты применения при обнаружении и валидации генов, мутационной и цисгенной селекции и гибридной селекции. Эти варианты применения облегчают получение нового поколения генетически модифицированных сельскохозяйственных культур с различными улучшенными агрономическими признаками, такими как устойчивость к гербицидам, устойчивость к болезням, переносимость абиотического стресса, высокая урожайность и отличное качество.

Применение гена Cas9 для получения мужских стерильных растений

Гибридные растения, как правило, имеют предпочтительные агрономические признаки по сравнению с инбредными растениями. Однако для самоопылящихся растений получение гибридов может быть проблематичным. У различных типов растений были идентифицированы гены, которые важны для фертильности растений, в частности, мужской фертильности. Например, у маиса были идентифицированы по меньшей мере два гена, которые важны для фертильности (Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies Technology Development And Regulation, Oct 9-10, 2014, Jaipur, India; Svitashev et al. Plant Physiol. 2015 Oct;169(2):931-45; Djukanovic et al. Plant J. 2013 Dec;76(5):888-99). Способы, предусмотренные в данном документе, могут быть использованы для нацеливания на гены, необходимые для мужской фертильности, для того, чтобы получить мужские стерильные растения, которые могут быть легко скрещены с получением гибридов. В конкретных вариантах осуществления система CRISPR/Cas9, предусмотренная в данном документе, используется для направленного мутагенеза цитохром P450-подобного гена (MS26) или гена мегануклеазы (MS45), тем самым придавая мужскую стерильность растению маиса. Растения маиса, которые по этой причине генетически изменены, можно применять в программах селекции гибридов.

Повышение стадии фертильности у растений

В конкретных вариантах осуществления способы, предусмотренные в данном документе, используют для продления стадии фертильности растения, такого как растение риса. Например, на ген стадии фертильности риса, такой как Ehd3, можно нацеливаться с получением мутации в гене, а сеянцы могут быть отобраны в отношении продленной стадии фертильности при регенерации растений (как описано в CN 104004782)

Применение Cas9 для получения генетической вариации у представляющего интерес сельскохозяйственного растения

Доступность идиоплазмы дикого типа и генетические вариации в сельскохозяйственных растениях является ключевым моментом для программ улучшения сельскохозяйственных культур, однако доступная изменчивость идиоплазм от сельскохозяйственных культур является ограниченной. Настоящее изобретение предусматривает способы получения разнообразия генетических вариаций представляющей интерес идиоплазмы. В настоящей заявке системы CRISPR/Cas9 предусмотрена библиотека chi/sgRNA, нацеленных на различные локусы в геноме растений, и ее вводят в растительные клетки совместно с эффекторным белком Cas9. В этом отношении может быть получена коллекция геномных точковых мутаций и генных нокаутов. В конкретных вариантах осуществления способы включают получение части растения или растения из клеток, полученных таким образом, и скрининг клеток на наличие представляющего интерес признака. Целевые гены могут включать кодирующие и некодирующие области. В конкретных вариантах осуществления признак представляет собой переносимость стресса, а способ представляет собой способ получения сортов сельскохозяйственных растений с переносимостью стресса.

Применение Cas9 для воздействия на созревание плодов

Созревание представляет собой нормальную фазу в процессе созревания плодов и овощей. Лишь спустя несколько дней после своего начала оно делает плод или овощ несъедобным. Этот процесс приносит значительные убытки как фермерам, так и потребителям. В конкретных вариантах осуществления способы по настоящему изобретению используют для ослабления образования этилена. Это достигается при обеспечении одного или нескольких из следующего. a. Подавления экспрессии гена ACC-синтазы. ACC-(1-аминоциклопропан-1-карбоновая кислота)-синтаза представляет собой фермент, ответственный за превращение S-аденозилметионина (SAM) в ACC, происходящее со второй до последней стадии в биосинтезе этилена. Экспрессия ферментов нарушена, если антисмысловая ("зеркльное отображение") или усеченная копия гена синтазы вставлена в геном растения; b. вставки гена ACC-дезаминазы. Ген, кодирующий фермент, получают из Pseudomonas chlororaphis, распространенной непатогенной почвенной бактерии. Он превращает ACC в другое соединение, тем самым снижая количество ACC, доступное для образования этилена; c. вставки гена SAM-гидролазы. Этот подход является аналогичным в случае ACC-дезаминазы, где образования этилена нарушается, когда количество его метаболита-предшественника снижено; в этом случае SAM превращается в гомосерин. Ген, кодирующий фермент, получают из бактериофага E. coli T3, и d. супрессии экспрессии гена ACC-оксидазы. ACC-оксидаза представляет собой фермент, который катализирует окисление ACC в этилен, являющееся последней стадией в пути биосинтеза этилена. С помощью способов, описанных в данном документе, снижение экспрессии гена ACC-оксидазы приводит к подавлению образования этилена, тем самым происходит задержка созревания плодов. В конкретных вариантах осуществления дополнительно или альтернативно к модификациям, описанным в данном документе, применяют способы, описанные в данном документе, для модификации этиленовых рецепторов с тем, чтобы нарушить сигналы от этилена, получаемые плодом. В конкретных вариантах осуществления экспрессия гена ETR1, кодирующего этилен-связывающий белок, является модифицированной, в частности, супрессированной. В конкретных вариантах осуществления дополнительно или альтернативно к модификациям, описанным в данном документе, используют способы, описанные в данном документе, для модификации экспрессии гена, кодирующего полигалактуроназу (PG), которая представляет собой фермент, ответственный за разрушение пектина, соединения, которое поддерживает целостность клеточных стенок растений. Разрушение пектина происходит в начале процесса созревания, приводя к размягчению плода. Соответственно, в конкретных вариантах осуществления способы, описанные в данном документе, используют для введения мутации в ген PG или для супрессии активации гена PG с целью снижения количества образующегося фермента PG, тем самым задерживая разрушение пектина.

Таким образом, в конкретных вариантах осуществления способы включают применение системы CRISPR/Cas9 для обеспечения одной или нескольких модификаций генома растительной клетки, таких как описаны выше, и регенерации из нее растения. В конкретных вариантах осуществления растение представляет собой растения томата.

Повышение срока хранения растений

В конкретных вариантах осуществления способы по настоящему изобретению используют для модификации генов, участвующих в образовании соединений, которые влияют на срок годности растения или части растений. В частности, модификацию выполняют в гене, которая предупреждает накопление восстанавливающих сахаров в клубнях картофеля. При обработке высокой температурой эти восстанавливающие сахара реагируют со свободными аминокислотами, приводя к образованию продуктов коричневого цвета с горьким вкусом и повышенных уровней акриламида, который является потенциальным канцерогеном. В конкретных вариантах осуществления способы, предусмотренные в данном документе, используют для ослабления или ингибирования экспрессии гена вакуолярной инвертазы (VInv), который кодирует белок, который разрушает сахарозу до глюкозы и фруктозы (Clasen et al. DOI: 10.1111/pbi.12370).

Применение системы CRISPR/Cas9 для обеспечения признака с дополнительным эффектом

В конкретных вариантах осуществления систему CRISPR/Cas9 используют для получения сельскохозяйственных культур с улучшенными питательными свойствами. В конкретных вариантах осуществления способы, предусмотренные в данном документе, адаптированы к получению "функциональных продуктов питания", т.е. модифицированного продукта питания или продуктового компонента, которые могут обеспечивать пользу для здоровья помимо традиционных нутриентов, которые он содержит, или "нутрицевтиков", т.е. веществ, которые могут рассматриваться продуктом питания или частью продукта питания, и обеспечивают пользу для здоровья, в том числе предупреждение и лечения заболевания. В конкретных вариантах осуществления нутрицевтик является полезным для предупреждения и/или лечения одного или нескольких из рака, диабета, сердечно-сосудистого заболевания или гипертензии.

Примеры сельскохозяйственных культур с улучшенными питательными свойствами включают (Newell-McGloughlin, Plant Physiology, July 2008, Vol. 147, pp. 939-953):

модифицированное качество белка, содержание и/состав аминокислот, например, как описано для гречки заметной (Luciani et al. 2005, Florida Genetics Conference Poster), канолы (Roesler et al., 1997, Plant Physiol 113 75-81), маиса (Cromwell et al, 1967, 1969 J Anim Sci 26 1325-1331, O'Quin et al. 2000 J Anim Sci 78 2144-2149, Yang et al. 2002, Transgenic Res 11 11-20, Young et al. 2004, Plant J 38 910-922), картофеля (Yu J and Ao, 1997 Acta Bot Sin 39 329-334; Chakraborty et al. 2000, Proc Natl Acad Sci USA 97 3724-3729; Li et al. 2001) Chin Sci Bull 46 482-484, Rice (Katsube et al. 1999, Plant Physiol 120 1063-1074), сои (Dinkins et al. 2001, Rapp 2002, In Vitro Cell Dev Biol Plant 37 742-747), батата (Egnin and Prakash 1997, In Vitro Cell Dev Biol 33 52A).

Cодержание незаменимых аминокислот, например, как описано для канолы (Falco et al. 1995, Bio/Technology 13 577-582), Lupin (White et al. 2001, J Sci Food Agric 81 147-154), маиса (Lai and Messing, 2002, Agbios 2008 GM crop database (March 11, 2008)), картофеля (Zeh et al. 2001, Plant Physiol 127 792-802), сорго (Zhao et al. 2003, Kluwer Academic Publishers, Dordrecht, The Netherlands, pp 413-416), сои (Falco et al. 1995 Bio/Technology 13 577-582; Galili et al. 2002 Crit Rev Plant Sci 21 167-204).

Масла и жирные кислоты, например, для канолы (Dehesh et al. (1996) Plant J 9 167-172 [PubMed] ; Del Vecchio (1996) INFORM International News on Fats, Oils and Related Materials 7 230-243; Roesler et al. (1997) Plant Physiol 113 75-81 [PMC free article] [PubMed]; Froman and Ursin (2002, 2003) Abstracts of Papers of the American Chemical Society 223 U35; James et al. (2003) Am J Clin Nutr 77 1140-1145 [PubMed]; Agbios (2008, выше); хлопчатника (Chapman et al. (2001). J Am Oil Chem Soc 78 941-947; Liu et al. (2002) J Am Coll Nutr 21 205S-211S [PubMed]; O'Neill (2007) Australian Life Scientist. http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2 (June 17, 2008), льна (Abbadi et al., 2004, Plant Cell 16: 2734-2748), маиса (Young et al., 2004, Plant J 38 910-922), масличной пальмы (Jalani et al. 1997, J Am Oil Chem Soc 74 1451-1455; Parveez, 2003, AgBiotechNet 113 1-8), риса (Anai et al., 2003, Plant Cell Rep 21 988-992), сои (Reddy and Thomas, 1996, Nat Biotechnol 14 639-642; Kinney and Kwolton, 1998, Blackie Academic and Professional, London, pp 193-213), подсолнечника (Arcadia, Biosciences 2008).

Углеводы, такие как фруктаны, описанные, например, для цикория (Smeekens (1997) Trends Plant Sci 2 286-287, Sprenger et al. (1997) FEBS Lett 400 355-358, Sévenier et al. (1998) Nat Biotechnol 16 843-846), маиса (Caimi et al. (1996) Plant Physiol 110 355-363), картофеля (Hellwege et al. ,1997 Plant J 12 1057-1065), сахарной свеклы (Smeekens et al. 1997, выше), инулин, например, как описано для картофеля (Hellewege et al. 2000, Proc Natl Acad Sci USA 97 8699-8704), крахмал, например, как описано для риса (Schwall et al. (2000) Nat Biotechnol 18 551-554, Chiang et al. (2005) Mol Breed 15 125-143),

Витамины и каротиноиды, например, описанные для канолы (Shintani and DellaPenna (1998) Science 282 2098-2100), маиса (Rocheford et al. (2002). J Am Coll Nutr 21 191S-198S, Cahoon et al. (2003) Nat Biotechnol 21 1082-1087, Chen et al. (2003) Proc Natl Acad Sci USA 100 3525-3530), семени горчицы (Shewmaker et al. (1999) Plant J 20 401-412, картофеля (Ducreux et al., 2005, J Exp Bot 56 81-89), риса (Ye et al. (2000) Science 287 303-305, клубники (Agius et al. (2003), Nat Biotechnol 21 177-181 ), томата (Rosati et al. (2000) Plant J 24 413-419, Fraser et al. (2001) J Sci Food Agric 81 822-827, Mehta et al. (2002) Nat Biotechnol 20 613-618, Díaz de la Garza et al. (2004) Proc Natl Acad Sci USA 101 13720-13725, Enfissi et al. (2005) Plant Biotechnol J 3 17-27, DellaPenna (2007) Proc Natl Acad Sci USA 104 3675-3676.

Функциональные вторичные метаболиты, например, описанные для яблони (стильбены, Szankowski et al. (2003) Plant Cell Rep 22: 141-149), люцерны (ресвератрол, Hipskind and Paiva (2000) Mol Plant Microbe Interact 13 551-562), киви (ресвератрол, Kobayashi et al. (2000) Plant Cell Rep 19 904-910), маиса и сои (флавоноиды, Yu et al. (2000) Plant Physiol 124 781-794), картофеля (антоцианин, алкалоид и гликозид, Lukaszewicz et al. (2004) J Agric Food Chem 52 1526-1533), риса (флавоноиды и ресвератрол, Stark-Lorenzen et al. (1997) Plant Cell Rep 16 668-673, Shin et al. (2006) Plant Biotechnol J 4 303-315), томата (+ресвератрол, хлорогеновая кислота, флавоноиды, стильбен; Rosati et al. (2000) выше, Muir et al. (2001) Nature 19 470-474, Niggeweg et al. (2004) Nat Biotechnol 22 746-754, Giovinazzo et al. (2005) Plant Biotechnol J 3 57-69), пшеницы (кофеиновая и феруловая кислоты, ресвератрол; United Press International (2002)); и

доступность минеральных компонентов, например, как описано для люцерны (фитаза, Austin-Phillips et al. (1999) http://www.molecularfarming.com/nonmedical.html), салата-латука (железо, Goto et al. (2000) Theor Appl Genet 100 658-664), риса (железо, Lucca et al. (2002) J Am Coll Nutr 21 184S-190S), маиса, сои и пшеницы (фитаза, Drakakaki et al. (2005) Plant Mol Biol 59 869-880, Denbow et al. (1998) Poult Sci 77 878-881, Brinch-Pedersen et al. (2000) Mol Breed 6 195-206).

В конкретных вариантах осуществления признак с дополнительным эффектом относится к предусмотренной пользе для здоровья соединений, присутствующих в растении. Например, в конкретных вариантах осуществления сельскохозяйственную культуру с дополнительным эффектом получают с помощью способов по настоящему изобретению для обеспечения модификации и/или индукции/повышения синтеза одного или нескольких из следующих соединений.

Каротиноиды, такие как α-каротин, присутствующие в моркови, нейтрализуют свободные радикалы, которые могут вызвать разрушение клеток, или β-каротин, присутствующий в различных плодах и овощах, который нейтрализует свободные радикалы.

Лютеин, присутствующий в зеленых овощах, который способствует сохранению нормального зрения.

Ликопин, присутствующий в томате и томатных продуктах, который, как считается, снижает риск возникновения рака предстательной железы.

Зеаксантин, присутствующий в цитрусовых и маисе, который способствует сохранению нормального зрения.

Пищевые волокна, такие как нерастворимые волокна, присутствующие в пшеничных отрубях, которые могут снижать риск возникновения рака молочной железы и/или рака кишечника, и β-глюкан, присутствующий в овсе, растворимые волокна, присутствующие в псиллуме и цельных зернах, которые могут снижать риск возникновения сердечно-сосудистого заболевания (CVD).

Жирные кислоты, такие как ω-3 жирные кислоты, которые могут снижать риск возникновения CVD и улучшать умственные и зрительные функции, конъюгированная линолевая кислота, которая может улучшать состав организма, может снижать риск возникновения определенных видов рака, и GLA, которая может снижать риск возникновения воспаления, рака и CVD, может улучшать состав организма.

Флавоноиды, такие как гидроксициннаматы, присутствующие в пшенице, которые имеют подобную антиоксидантной активность, могут снижать риск возникновения дегенеративных заболеваний, флавонолы, катехины и таннины, присутствующие в плодах и овощах, которые нейтрализуют свободные радикалы и могут снижать риск возникновения рака.

Глюкозинолаты, индолы, изотиоцианаты, такие как сульфорафан, присутствующие в овощах семейства крестоцветных (брокколи, браунколь), редьке, которые нейтрализуют свободные радикалы, могут снижать риск возникновения рака.

Фенольные смолы, такие как стильбены, присутствующие в винограде, которые могут снижать риск возникновения дегенеративных заболеваний, заболевания сердца и рака, могут влиять на долгожительство, кофеиновая кислота и ферулиновая кислота, присутствующие в овощах и цитрусовых, которые имеют подобную антиоксидантной активность, могут снижать риск возникновения дегенеративных заболеваний, заболевания сердца и заболевания глаз, и эпикатехин, присутствующий в какао, который имеет подобную антиоксидантной активность, может снижать риск возникновения дегенеративных заболеваний и заболевания сердца.

Растительные станолы/стеролы, присутствующие в маисе, сое, пшенице, и древесные смолы могут снижать риск возникновения коронарного заболевания сердца в результате снижения уровней холестерина в крови.

Фруктаны, инулины, фруктоолигосахариды, присутствующие в топинамбуре, шалоте, луковом порошке, которые могут улучшить состояние желудочно-кишечного тракта.

Сапонины, присутствующие в сое, которые могут снижать уровень холестерина LDL.

Белок сои, присутствующий в сое, который может снижать риск возникновения заболевания сердца.

Фитоэстрогены, такие как изофлавоны, присутствующие в сое, могут снижать симптомы менопаузы, такие как приливы, могут ослаблять остеопороз и CVD, и лигнаны, присутствующие во льне, ржи и овощах, которые могут защищать от заболевания сердца и некоторых видов рака, могут снижать уровень холестерина LDL, общего холестерина.

Сульфиды и тиолы, такие как диаллил сульфид, присутствующие в луке, чесноке, маслине, луке-порее и зеленом луке, и аллилметилтрисульфид, дитиотионы, присутствующие в овощах семейства крестоцветные, которые могу снижать уровень холестерина LDL, способствуют поддержанию иммунной системы.

Таннины, такие как проантоцианидины, присутствующие в клюкве, какао, которые могут улучшать состояние мочевыводящих путей, могут снижать риск возникновения CVD и повышенного кровяного давления

и др.

Кроме того, способы по настоящему изобретению также предусматривают модификацию функциональных свойств белков/крахмалов, срока хранения, вкуса/эстетических характеристик, качества волокон, и признаков, связанных со снижением аллергенов, антинутриентов и токсинов.

В одном варианте осуществления растение может представлять собой бобовое растение. В настоящем изобретении можно применять раскрытую в данном документе систему CRISP-Cas9 для исследования и модификации, например, без ограничения сои, гороха и арахиса. Curtin et al. предусматривает набор средств для функциональной геномики бобовых растений. (См. Curtin et al., "A genome engineering toolbox for legume Functional genomics," International Plant and Animal Genome Conference XXII 2014). Curtin использовал генетическую трансформацию CRISPR для нокаута/нокдауна одной копии и дуплицированных генов бобовых в системах корневых волосков и целых растений. Некоторые из целевых генов были выбраны с целью исследования и оптимизации характеристик систем нокаута/нокдауна (например, фитоендесатураза), в то время как другие были идентифицированы с помощью гомологии сои с Dicer-подобными генами арабидопсиса или с помощью исследований полногеномных ассоциаций при образовании клубеньков у Medicago.

Аллергические реакции на арахис и аллергические реакции на бобовые растения, как правило, являются реальной и серьезной проблемной для здоровья. Система эффекторного белка CRISPR-Cas9 по настоящему изобретению может быть использована для выявления и последующего редактирования или сайленсинга генов, кодирующих аллергенные белки таких бобовых растений. Не ограничиваясь такими генами и белками, Nicolaou et al. выявили аллергенные белки в арахисе, сое, чечевице, горохе, люпине, зеленой фасоли и золотистой фасоли. См. Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222).

Соответственно, настоящее изобретение охватывает способы получения растений с дополнительным питательным эффектом, при этом указанные способы предусматривают введение в растительную клетку гена, кодирующего фермент, участвующий в образовании компонента с дополнительным питательным эффектом с помощью системы CRISPR/Cas9, как описано в данном документе, и регенерацию растения из указанной растительной клетки, указанного растения, характеризующегося повышением экспрессии указанного компонента с дополнительным питательным эффектом. В конкретных вариантах осуществления систему CRISPR/Cas9 используют для модификации эндогенного синтеза этих соединений опосредованно, например, с помощью модификации одного или нескольких факторов транскрипции, которые контролируют метаболизм этого соединения. Способы введения представляющего интерес гена в растительную клетку и/или модификации эндогенного гена с помощью системы CRISPR/Cas9 описаны в данном документе выше.

Некоторые конкретные примеры модификаций в растениях, которые были модифицированы для придания признаков с дополнительным эффектом, представляют собой растения с модифицированным метаболизмом жирных кислот, например, с помощью трансформации растения антисмысловым геном стеарил-ACP-десатуразы с целью повышения содержания стеариновой кислоты в растении. См. Knultzon et al., Proc. Natl. Acad. Sci. U.S.A. 89:2624 (1992). Другой пример включает снижение содержания фитата, например, с помощью клонирования и последующего введения ДНК, связанной с одним аллелем, который может отвечать за мутанты маиса, характеризующиеся низким содержанием фитиновой кислоты. См. Raboy et al, Maydica 35:383 (1990).

Аналогично экспрессия Tfs C1 и R маиса (Zea mays), которые регулируют образование флавоноидов в алейроновых слоях маиса под контролем сильного промотора, приводила к высокой скорости накопления антоцианинов в арабидопсисе (Arabidopsis thaliana), предположительно в результате активации всего пути (Bruce et al., 2000, Plant Cell 12:65-80). DellaPenna (Welsch et al., 2007 Annu Rev Plant Biol 57: 711-738) обнаружил, что Tf RAP2.2 и его взаимодействующий элемент SINAT2 повышали каротиногенез в листьях арабидопсиса. Экспрессия Tf Dof1 индуцировала повышение экспрессии генов, кодирующих ферменты для образования углеродных скелетов, выраженное повышение содержания аминокислот и снижение уровня Glc в трансгенном арабидопсисе (Yanagisawa, 2004 Plant Cell Physiol 45: 386-391), а DOF Tf AtDof1.1 (OBP2) активировал все стадии в пути биосинтеза глюкозинолата в арабидопсисе (Skirycz et al., 2006 Plant J 47: 10-24).

Снижение аллергенов в растениях

В конкретных вариантах осуществления способы, предусмотренные в данном документе, применяют для получения растений со сниженным уровнем аллергенов, делая их более безопасными для потребителя. В конкретных вариантах осуществления способы включают модификацию экспрессии одного или нескольких генов, ответственных за образование растительных аллергенов. Например, в конкретных вариантах осуществления способы включают снижение экспрессии гена Lol p5 в растительной клетке, такой как растительная клетка райграса, и регенерацию из нее растения, с целью снижения аллергенности пыльцы указанного растения (Bhalla et al. 1999, Proc. Natl. Acad. Sci. USA Vol. 96: 11676-11680).

Способы скрининга представляющих интерес эндогенных генов

Способы, предусмотренные в данном документе, дополнительно обеспечивают выявление ценных генов, кодирующих ферменты, участвующие в образовании компонента с дополнительным питательным эффектом, или в целом генов, влияющих на представляющие интерес агрономические признаки, в пределах вида, типа и растительного царства. В результате избирательного нацеливания, например, на гены, кодирующие ферменты метаболических путей в растениях с помощью системы CRISPR/Cas9, как описано в данном документе, могут быть идентифицированы гены, ответственные за определенные питательные аспекты растения. Аналогично в результате избирательного нацеливания на гены, которые могут влиять на желаемый агрономический признак, могут быть идентифицированы соответствующие гены. Соответственно, настоящее изобретение охватывает способы скрининга генов, кодирующих ферменты, участвующие в образовании соединений с определенной пищевой ценностью и/или агрономическими признаками.

Дополнительные варианты применения системы CRISPR/Cas9 в растениях и дрожжах

Применение системы CRISPR/Cas9 в получении биотоплива

Термин "биотопливо", как используется в данном документе, представляет собой альтернативное топливо, полученное из растительных ресурсов или ресурсов растительного происхождения. Восполняемые виды биотоплива могут быть экстрагированы из органического вещества, энергия которого была получена в процессе фиксации углерода, или получены в результате использования или превращения биомассы. Эта биомасса может быть использована непосредственно для видов биотоплива или может быть превращена в удобные содержащие энергию вещества с помощью теплового превращения, химического превращения или биохимического превращения. Это превращение биомассы может приводить к образованию топлива в твердой, жидкой или газообразной форме. Существует два типа биотоплива: биоэтанол и биодизель. Биоэтанол образуется главным образом в результате процесса сбраживания сахаров из целлюлозы (крахмала), которую преимущественно получают из маиса и сахарного тростника. Биодизель, с другой стороны, главным образом образуется из масляных сельскохозяйственных культур, таких как рапс, пальма и соя. Биотоплива используют главным образом для транспортных средств.

Улучшение свойств растений для получения биотоплива

В конкретных вариантах осуществления способы с использованием системы CRISPR/Cas9, как описано в данном документе, применяют для изменения свойств клеточной стенки с целью облегчения доступа с помощью основных гидролизующих средств для более эффективного высвобождения сахаров для сбраживания. В конкретных вариантах осуществления модифицируют биосинтез целлюлозы и/или лигнина. Целлюлоза является основным компонентом клеточной стенки. Биосинтез целлюлозы и лигнина корегулируют. При снижении доли лигнина в растении доля целлюлозы может быть повышена. В конкретных вариантах осуществления способы, описанные в данном документе, используют для снижения биосинтеза лигнина в растении с целью повышения содержания сбраживаемых углеводов. В частности, способы, описанные в данном документе, используют для снижения экспрессии по меньшей мере первого гена биосинтеза лигнина, выбранного из группы, состоящей из 4-кумарат 3-гидроксилазы (C3H), фенилаланин аммонийлиазы (PAL), циннамат 4-гидроксилазы (C4H), гидроксициннамоилтрансферазы (HCT), О-метилтрансферазы кофеиновой кислоты (COMT), кафеол CoA 3-O-метилтрансферазы (CCoAOMT), ферулат 5-гидроксилазы (F5H), циннамилалкогольдегидрогеназы (CAD), циннамоил CoA-редуктазы (CCR), 4-кумарат-CoA лигазы (4CL), монолигнол-лигнин-специфичной гликозилтрансферазы и альдегиддегидрогеназы (ALDH), как раскрыто в WO 2008064289 A2.

В конкретных вариантах осуществления способы, описанные в данном документе, применяют для получения растительной массы, которая приводит к образованию более низких уровней уксусной кислоты во время сбраживания (см. также WO 2010096488). В частности, способы, раскрытые в данном документе, используют для получения мутаций в гомологах CaslL с целью снижения ацетилирования полисахаридов.

Модификация дрожжей для получения биотоплива

В конкретных вариантах осуществления фермент Cas9, предусмотренный в данном документе, используют для получения биотоплива с помощью рекомбинантных микроорганизмов. Например, Cas9 может быть использован для конструкции микроорганизмов, таких как дрожжи, с целью получения биотоплива или биополимеров из сбраживаемых сахаров и необязательно способности к разрушению лигноцеллюлозы растительного происхождения, полученной из сельскохозяйственных остатков, в качестве источника сбраживаемых сахаров. В частности, настоящее изобретение относится к способам, где применяют комплекс CRISPR/Cas9 для введения чужеродных генов, требуемых для получения биотоплива, в микроорганизмы, и/или для модификации эндогенных генов, которые могут нарушать синтез биотоплива. В частности, способы предусматривают введение в микроорганизм, такой как дрожжи, одной или нескольких нуклеотидных последовательностей, кодирующих ферменты, участвующие в превращении пирувата в этанол или другой представляющий интерес продукт. В конкретных вариантах осуществления способы предусматривают введение одного или нескольких ферментов, которые способствуют разрушению микроорганизмом целлюлозы, такого как целлюлаза. В еще одних дополнительных вариантах осуществления комплекс CRISPR/Cas9 применяют для модификации эндогенных метаболических путей, которые конкурируют с путем образования биотоплива.

Соответственно, в более конкретных вариантах осуществления способы, описанные в данном документе, применяют для модификации микроорганизма следующим образом:

- введения по меньшей мере одной гетерологичной нуклеиновой кислоты или повышения экспрессии по меньшей мере одной эндогенной нуклеиновой кислоты, кодирующей фермент для разрушения растительной клеточной стенки, таким образом, что указанный микроорганизм способен экспрессировать указанную нуклеиновую кислоту и образовывать и секретировать указанный фермент для разрушения растительной клеточной стенки;

- введения по меньшей мере одной гетерологичной нуклеиновой кислоты или повышения экспрессии по меньшей мере одной эндогенной нуклеиновой кислоты, кодирующей фермент, который превращает пируват в ацетальдегид, необязательно в сочетании по меньшей мере с одной гетерологичной нуклеиновой кислотой, кодирующей фермент, который превращает ацетальдегид в этанол, таким образом, что указанная клетка-хозяин способна экспрессировать указанную нуклеиновую кислоту; и/или

- модификации по меньшей мере одной нуклеиновой кислоты, кодирующей фермент в метаболическом пути в указанной клетке-хозяине, где указанный путь приводит к образованию метаболита, отличного от ацетальдегида, из пирувата или этанола из ацетальдегида, и где указанная модификация приводит к уменьшенному образованию указанного метаболита, или введения по меньшей мере одной нуклеиновой кислоты, кодирующей ингибитор указанного фермента.

Модификация водорослей и растений для получения растительных масел или видов биотоплива

Трансгенные водоросли или другие растения, такие как рапс, могут быть особенно полезными в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол). Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.

В US 8945839 описан способ конструирования микроводорослей (виды клеток Chlamydomonas reinhardtii) с помощью Cas9. С помощью аналогичных средств способы системы CRISPR/Cas9, описанной в данном документе, могут быть применимы по отношению к виду Chlamydomonas и другим водорослям. В конкретных вариантах осуществления Cas9 и chi/sgRNA вводят в синтезирующие водоросли с помощью вектора, который экспрессирует Cas9 под контролем конститутивного промотора, такого как Hsp70A-Rbc S2, или промотора бета 2-тубулина. Chi/sgRNA будет доставлена с помощью вектора, содержащего промотор T7. Альтернативно мРНК Cas9 и in vitro транскрибируемая chi/sgRNA могут быть доставлены в клетки водорослей. Протокол электропорации следует стандартному рекомендованному протоколу для набора GeneArt Chlamydomonas Engineering kit.

Применение Cas9 при получении микроорганизмов, способных к продуцированию жирных кислот

В конкретных вариантах осуществления способы по настоящему изобретению применяют для получения генетически модифицированных микроорганизмов, способных к образованию жирных сложных эфиров, таких как метиловые сложные эфиры жирных кислот ("FAME") и этиловые сложные эфиры жирных кислот ("FAEE").

В конкретных вариантах осуществления предусмотрено специфично модифицировать гены, которые участвуют в модификации количества липидов и/или качества липидов, образованных клеткой водорослей. Примеры генов, кодирующих ферменты, участвующие в путях синтеза жирных кислот, могут кодировать белки, имеющие, например, активность ацетил-CoA карбоксилазы, синтазы жирных кислот, 3-кетоацил-синтазы III ацил-белка переносчика, глицерол-3-фосфатдегидрогеназы (G3PDH), еноил-ацил-редуктазы белка-переносчика (еноил-ACP-редуктазы), глицерол-3-фосфатацилтрансферазы, лизофосфатидин ацилтрансферазы или диацилглицеролацилтрансферазы, фосфолипид:диацилглицеролацилтрансферазы, фосфатидинфосфатазы, тиоэстеразы жирной кислоты, такой как пальмитоилпротеинтиоэстеразы, или малатдегидрогеназы. В дополнительных вариантах осуществления предусмотрено получение диатомовых водорослей, которые характеризуются повышенным накоплением липидов. Это может быть достигнуто с помощью нацеливания на гены, которые снижают катаболизм липидов. Особого интереса для применения в способах по настоящему изобретению заслуживают гены, участвующие в активации триглецерола и свободных жирных кислот, а также генов, непосредственно участвующих в β-окислении жирных кислот, таких как ацил-CoA синтетаза, 3-кетоацил-CoA тиолаза, ацил-CoA оксидаза и фосфоглюкомутаза. Система Cas9 и способы, описанные в данном документе, могут быть использованы для специфической активации таких генов в диатомовых водорослях с целью повышения содержания в них липидов.

Как правило, клетки-хозяева могут быть сконструированы таким образом, чтобы образовывать жирные сложные эфиры из источника углерода, такого как спирт, присутствующий в среде, в результате экспрессии или сверхэкспрессии гена, кодирующего тиоэстеразу, гена, кодирующего ацил-CoA синтазу, и гена, кодирующего синтазу сложных эфиров. Соответственно, способы, предусмотренные в данном документе, применяют для модификации микроорганизмов с целью сверхэкспрессии или введения гена тиоэстеразы, гена, кодирующего ацит-CoA синтазу и гена, кодирующего синтазу сложных эфиров. В конкретных вариантах осуществления ген тиоэстеразы выбран из tesA, 'tesA, tesB, fatB, fatB2, fatB3, fatAl или fatA. В конкретных вариантах осуществления ген, кодирующий ацил-CoA синтазу, выбран из fadDJadK, BH3103, pfl-4354, EAV15023, fadDl, fadD2, RPC_4074,fadDD35, fadDD22, faa39 или идентифицированного гена, кодирующего фермент, имеющий те же самые свойства. В конкретных вариантах осуществления ген, кодирующий синтазу сложных эфиров, представляет собой ген, кодирующий синтазу/ацил-CoA:диацилглицерилацилтрансферазу из Simmondsia chinensis, Acinetobacter sp. ADP, Alcanivorax borkumensis, Pseudomonas aeruginosa, Fundibacter jadensis, Arabidopsis thaliana или Alkaligenes eutrophus или их вариантов.

Дополнительно или альтернативно способы, предусмотренные в данном документе, применяют для снижения экспрессии в указанном микроорганизме по меньшей мере одного гена, кодирующего ацил-CoA дегидрогеназу, гена, кодирующего рецептор белка наружной мембраны, и гена, кодирующего регулятор транскрипции биосинтеза жирных кислот. В конкретных вариантах осуществления один или несколько генов являются инактивированными, например, с помощью введения мутации. В конкретных вариантах осуществления ген, кодирующий ацил-CoA дегидрогеназу, представляет собой fadE. В конкретных вариантах осуществления ген, кодирующий регулятор транскрипции биосинтеза жирных кислот, кодирует репрессор транскрипции ДНК, например, fabR.

Дополнительно или альтернативно указанный микроорганизм модифицируют с целью снижения экспрессии по меньшей мере одного гена, кодирующего пируватформатлиазу, гена, кодирующего лактатдегидрогеназу, или обоих. В конкретных вариантах осуществления ген, кодирующий пируватформатлиазу, представляет собой pflB. В конкретных вариантах осуществления ген, кодирующий лактатдегидрогеназу, представляет собой IdhA. В конкретных вариантах осуществления один или несколько генов являются инактивированными, например, с помощью введения в них мутации.

В конкретных вариантах осуществления микроорганизм выбран из рода Escherichia, Bacillus, Lactobacillus, Rhodococcus, Synechococcus, Synechoystis, Pseudomonas, Aspergillus, Trichoderma, Neurospora, Fusarium, Humicola, Rhizomucor, Kluyveromyces, Pichia, Mucor, Myceliophtora, Penicillium, Phanerochaete, Pleurotus, Trametes, Chrysosporium, Saccharomyces, Stenotrophamonas, Schizosaccharomyces, Yarrowia или Streptomyces.

Применение Cas9 при получении микроорганизмов, способных к продуцированию органических кислот

Способы, предусмотренные в данном документе, дополнительно применяют для конструирования микроорганизмов, способных к продуцированию органических кислот, в частности, из пентозы или гексозных сахаров. В конкретных вариантах осуществления способы включают введение в микроорганизм эндогенного гена LDH. В конкретных вариантах осуществления продуцирование органических кислот в указанных микроорганизмах дополнительно или альтернативно повышается при инактивации эндогенных генов, кодирующих белки, участвующие в эндогенном метаболическом пути, который приводит к образованию метаболита, отличного от представляющей интерес органической кислоты, и/или в случае, когда в эндогенном метаболическом пути потребляется органическая кислота. В конкретных вариантах осуществления модификация обеспечивает то, что образование метаболита, отличного от представляющей интерес органической кислоты, снижается. В соответствии с конкретными вариантами осуществления применяют способы для введения по меньшей мере одной сконструированной делеции гена и/или инактивации эндогенного пути, в котором органическая кислота потребляется, или гена, кодирующего продукт, участвующий в эндогенном пути, который приводит к образованию метаболита, отличного от представляющей интерес органической кислоты. В конкретных вариантах осуществления по меньшей мере одна сконструированная делеция или инактивация гена находится в одном или нескольких генах, кодирующих фермент, выбранный из группы, состоящей из пируватдекарбоксилазы (pdc), фумаратредуктазы, алкогольдегидрогеназы (adh), ацетальдегиддегидрогеназы, фосфоенолпируваткарбоксилазы (ppc), D-лактатдегидрогеназы (d-ldh), L-лактатдегидрогеназы (l-ldh), лактат-2-монооксигеназы. В дополнительных вариантах осуществления по меньшей мере одна сконструированная делеция и/или инактивация гена находятся в эндогенном гене, кодирующем пируватдекарбоксилазу (pdc).

В дополнительных вариантах осуществления микроорганизм конструируют с образованием молочной кислоты, и по меньшей мере одна сконструированная делеция гена и/или инактивация находятся в эндогенном гене, кодирующем лактатдегидрогеназу. Дополнительно или альтернативно микроорганизм содержит по меньшей мере одну сконструированную делецию гена или инактивацию эндогенного гена, кодирующего цитохром-зависимую лактатдегидрогеназу, такую как цитохром B2-зависимая L-лактатдегидрогеназа.

Применение Cas9 при получении улучшенных штаммов дрожжей, утилизирующих ксилозу или целлобиозу

В конкретных вариантах осуществления система CRISPR/Cas9 может быть применима для выбора улучшенных штаммов дрожжей, утилизирующих ксилозу или целлобиозу. ПЦР сниженной точности может быть использована для амплификации одного (или нескольких) генов, участвующих в путях утилизации ксилозы или целлобиозы. Примеры генов, участвующих в путях утилизации ксилозы и путях утилизации целлобиозы, могут включать без ограничения описанные в Ha, S.J., et al. (2011) Proc. Natl. Acad. Sci. USA 108(2):504-9 и Galazka, J.M., et al. (2010) Science 330(6000):84-6. Полученные библиотеки двухнитевых молекул ДНК, каждая из которых содержит случайную мутацию в таком определенном гене, могли быть котрансформированы компонентами системы CRISPR/Cas9 в штамм дрожжей (например, S288C) и могут быть отобраны штаммы с повышенной способностью к утилизации ксилозы или целлобиозы, как описано в WO2015138855.

Применение Cas9 при получении улучшенных штаммов дрожжей для использования при биосинтезе изопреноидов

Tadas Jakočiūnas et al. описали успешное применение мультиплексной системы CRISPR/Cas9 для конструирования генома из различных геномных локусов в количестве до 5 на одной стадии трансформации в пекарских дрожжах Saccharomyces cerevisiae (Metabolic Engineering Volume 28, March 2015, Pages 213-222), при этом были получены штаммы с высокой продукцией мевалоната, ключевого посредника для промышленно важного пути биосинтеза изопреноидов. В конкретных вариантах осуществления система CRISPR/Cas9 может быть применена в способе конструирования мультиплексного генома, как описано в данном документе, для идентификации дополнительных высокопродуктивных штаммов дрожжей для применения в синтезе изопреноидов.

Применение Cas9 при получении штаммов дрожжей, продуцирующих молочную кислоту

В другом варианте осуществления охватывается успешное применение мультиплексной системы CRISPR/Cas9. По аналогии с Vratislav Stovicek et al. (Metabolic Engineering Communications, Volume 2, December 2015, Pages 13-22) улучшенные штаммы, продуцирующие молочную кислоту, могут быть разработаны и получены в одном событии трансформации. В конкретном варианте осуществления систему CRISPR/Cas9 применяют для одновременной вставки гетерологичного гена лактатдегидрогеназы и разрыва двух эндогенных генов PDC1 и PDC5.

Дополнительные варианты применения системы CRISPR/Cas9 в растениях

В конкретных вариантах осуществления система CRISPR и предпочтительно система CRISPR/Cas9, описанные в данном документе, могут быть использованы для визуализации динамики генетических элементов. Например, с помощью отображения CRISPR можно визуализировать как повторяющиеся, так и неповторяющиеся геномные последовательности, описывать изменение длины теломеров и движения теломеров и контролировать динамику генных локусов во время клеточного цикла (Chen et al., Cell, 2013). Эти способы могут быть применимы к растениям.

Другие варианты применения системы CRISPR и предпочтительно системы CRISPR/Cas9, описанной в данном документе, предусматривают скрининг относительно положительной селекции нарушения функционирования целевого гена in vitro и in vivo (Malina et al., Genes and Development, 2013). Эти способы могут быть применимы к растениям.

В конкретных вариантах осуществления слияние неактивных эндонуклеаз Cas9 с модифицирующими гистоны ферментами может вводить специфические изменения в сложном эпигеноме (Rusk et al., Nature Methods, 2014). Эти способы могут быть применимы к растениям.

В конкретных вариантах осуществления система CRISPR и предпочтительно система CRISPR/Cas9, описанная в данном документе, могут быть использованы для очистки конкретного участка хроматина и выявления ассоциированных белков, при этом устанавливается их регуляторная роль в транскрипции (Waldrip et al., Epigenetics, 2014). Эти способы могут быть применимы к растениям.

В конкретных вариантах осуществления настоящее изобретение может быть использовано в качестве терапии для удаления вируса в растительных системах, поскольку можно расщеплять как вирусную ДНК, так и РНК. Предыдущие исследования в человеческих системах показали успех применения CRISPR при нацеливании на содержащий однонитевую РНК вирус гепатита С (A. Price, et al., Proc. Natl. Acad. Sci, 2015), а также на содержащий двухнитевую ДНК вирус гепатита B (V. Ramanan, et al., Sci. Rep, 2015). Эти способы могут быть адаптированы для применения системы CRISPR/Cas9 у растений.

В конкретных вариантах осуществления настоящее изобретение могло бы быть применимо для изменения вариабельности генома. В дополнительных конкретных вариантах осуществления система CRISPR и предпочтительно система CRISPR/Cas9, описанная в данном документе, могут быть использованы для нарушения или изменения числа хромосом и получения гаплоидных растений, которые содержат хромосомы только от одного родителя. Такие растения могут быть индуцированы с целью осуществления хромосомной дупликации и превращены в диплоидные растения, содержащие только гомозиготные аллели (Karimi-Ashtiyani et al., PNAS, 2015; Anton et al., Nucleus, 2014). Эти способы могут быть применимы к растениям.

В конкретных вариантах осуществления система CRISPR/Cas9, описанная в данном документе, может быть использована для саморасщепления. Описанный промотор фермента Cas9 и sgRNA представляет собой конститутивный промотор, а вторую sgRNA вводят в ту же самую кассету трансформации, но контролируют с помощью индуцируемого промотора. Эта вторая sgRNA может быть сконструирована с целью индукции сайт-специфического расщепления в гене Cas9 с получением нефункционального Cas9. В дополнительном конкретном варианте осуществления вторая sgRNA индуцирует расщепление на обоих концах кассеты для трансформации, приводя к удалению кассеты из генома хозяина. Эта система обеспечивает контролируемую продолжительность воздействия на клетку фермента Cas и дополнительно сводит к минимуму нецелевое редактирование. Кроме того, расщепление обоих концов кассеты CRISPR/Cas может быть использовано для получения не содержащих трансгенов растений T0 с биаллельными мутациями (например, Moore et al., Nucleic Acids Research, 2014; Schaeffer et al., Plant Science, 2015). Способы Moore et al. могут быть применены по отношению к системам CRISPR/Cas9, описанным в данном документе.

Улучшенные растения

Настоящее изобретение также предусматривает растения и дрожжевые клетки, получаемые и полученные с помощью способов, предусмотренных в данном документе. Улучшенные растения, полученные с помощью способов, описанных в данном документе, могут быть полезны при получении продуктов питания и кормов посредством экспрессии генов, которые, например, обеспечивают переносимость вредителей растений, гербицидов, засухи, низких или высоких температур, избытка воды и др.

Улучшенные растения, полученные с помощью способов, описанных в данном документе, в частности, сельскохозяйственные культуры и водоросли, могут быть полезны в производстве продуктов питания и кормов посредством синтеза, например, более высоких уровней белка, углеводов, нутриентов или витаминов, чем в норме наблюдались бы при диком типе. В этом отношении улучшенные растения, в частности, зернобобовые и клубнеплоды, являются предпочтительными.

Улучшенные водоросли или другие растения, такие как рапс, могут быть особенно полезными в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол). Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.

Настоящее изобретение также предусматривает улучшенные части растения. Части растений включают без ограничения листья, стебли, корни, клубни, семена, эндосперм, семяпочку и пыльцу. Части растений, как предусмотрено в данном документе, могут быть жизнеспособными, нежизнеспособными, регенерируемыми и/или нерегенерируемыми.

В данном документе также охвачены растительные клетки и растения в соответствии со способами по настоящему изобретению. Гаметы, семена, эмбрионы, как зиготические, так и соматические, потомство или гибриды растений, содержащих генетическую модификацию, которые получены с помощью традиционных способов селекции, также включены в объем настоящего изобретения. Такие растения могут содержать гетерологичную последовательность или последовательность чужеродной ДНК, вставленные в целевую последовательность или вместо нее. Альтернативно такие растения могут содержать только изменение (мутацию, делецию, вставку, замену) в одном или нескольких нуклеотидах. Например, такие растения будут отличаться только от своих растений-предшественников по наличию определенной модификации.

Сельскохозяйственные и продуктивные животные

Таким образом, настоящее изобретение относится к растению, животному или клетке, полученным с помощью способа по настоящему изобретению, или их потомству. Потомство может представлять собой клон полученного растения или животного, или его можно получить с помощью полового размножения посредством скрещивания с другими индивидами того же вида для придания дополнительных желаемых признаков их потомкам. Клетка может находиться in vivo или ex vivo в случае многоклеточных организмов, в частности, животных или растений.

Организмы и животные; способы

Настоящая заявка также может распространяться на другие варианты сельскохозяйственного применения, такие как, например, сельскохозяйственные и продуктивные животные. Например, свиньи имеют многие характеристики, которые делают их привлекательными в качестве биомедицинских моделей, в частности, в регенеративной медицине. В частности, свиньи с тяжелым комбинированным иммунодефицитом (SCID) могут обеспечивать полезные модели для регенеративной медицины, ксенотрансплантации и опухолевого развития и будут способствовать разработке лекарственных препаратов для пациентов-людей с SCID. Lee et al. (Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5) использовали направляемую репортером систему эффекторной нуклеазы, подобной активаторам транскрипции (TALEN), по отношению к полученным целевым модификациям гена, активирующего рекомбинацию (RAG) 2, в соматических клетках с высокой эффективностью, в том числе некоторым, которые влияли на оба аллеля. Система CRISPR Cas может быть применима к аналогичной системе.

Способы Lee et al., (Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5) могут быть применимы по отношению к настоящему изобретению следующим образом. Мутированных свиней получают с помощью целевой модификации RAG2 в фибробластах плода, после чего происходит SCNT и перенос эмбрионов. Конструкции, кодирующие CRISPR Cas и репортер, электропорируют в фибробласты, полученные из плода. Через 48 часов трансфицированные клетки, экспрессирующие зеленый флуоресцентный белок, сортируют в отдельные лунки 96-луночного планшета при предполагаемом разведении одна клетка на лунку. Целевые модификации RAG2 подвергают скринингу с помощью амплификации фрагмента геномной ДНК, фланкирующей любые сайты рестрикции CRISPR Cas, после чего выполняют секвенирование ПЦР-продуктов. После скрининга и обеспечения отсутствия нецелевых мутаций клетки, несущие целевую модификацию RAG2, используют для SCNT. Полярное тельце вместе с частью прилегающей цитоплазмы ооцита, предположительно содержащего метафазную пластинку II, удаляют, и донорскую клетку помещают в перивителлин. Реконструированные эмбрионы затем электропорируют для слияния донорской клетки с ооцитом и затем химически активируют. Активированные эмбрионы инкубируют в среде для развития свиных зигот 3 (PZM3) с 0,5 мкМ скриптаидом (S7817; Sigma-Aldrich) в течение 14-16 часов. Эмбрионы затем промывают с удалением скриптаида и культивируют в PZM3 до тех пор, пока они не будут перенесены в маточные трубы суррогатных свиней.

Настоящее изобретение также применимо к модификации SNP других животных, таких как коровы. Tan et al. (Proc Natl Acad Sci U S A. 2013 Oct 8; 110(41): 16526-16531) расширили набор для редактирования генов крупного рогатого скота с включением репарации с участием гомологичной рекомбинации (HDR), стимулированной эффекторной нуклеазой, подобной активаторам транскрипции (TAL) (TALEN) и коротких палиндромных повторов, регулярно расположенных группами (CRISPR)/Cas9, с использованием плазмиды, rAAV и олигонуклеотидных матриц. Геноспецифические последовательности gRNA были клонированы в вектор на основе gRNA Church lab (Addgene ID: 41824) в соответствии с их способами (Mali P, et al. (2013) RNA-Guided Human Genome Engineering via Cas9. Science 339(6121):823-826). Нуклеазу Cas9 получали с помощью котрансфекции плазмиды hCas9 (Addgene ID: 41815) или синтезировали с помощью мРНК из RCIScript-hCas9. Эта система RCIScript-hCas9 была сконструирована с помощью субклонирования фрагмента XbaI-AgeI из плазмиды hCas9 (охватывающей кДНК hCas9) в плазмиду RCIScript.

Heo et al. (Stem Cells Dev. 2015 Feb 1;24(3):393-402. doi: 10.1089/scd.2014.0278. Epub 2014 Nov 3) описали высокоэффективное нацеливание на ген в бычьем геноме с использованием бычьих плюрипотентных клеток и коротких палиндромных повторов, регулярно расположенных группами, (CRISPR)/нуклеазы Cas9. Впервые Heo et al. получили индуцированные плюрипотентные стволовые клетки (iPSC) из бычьих соматических фибробластов с помощью эктопической экспрессии факторов Яманаки и обработки ингибитором GSK3β и MEK (2i). Heo et al. наблюдали, что эти бычьи iPSC очень похожи на наивные плюрипотентные стволовые клетки в отношении экспрессии генов и потенциала развития в тератомы. Кроме того, нуклеаза CRISPR/Cas9, которая была специфичной по отношению к бычьему локусу NANOG, характеризовалась высокоэффективным редактированием бычьего генома в бычьих iPSC и эмбрионах.

Igenity® предусматривает профильный анализ животных, таких как коровы, для проявления и передачи генов экономически важных признаков, таких как состав туши, качество туши, материнские и репродуктивные признаки и средний суточный прирост. Анализ полного профиля Igenity® начинается с обнаружения ДНК-маркеров (чаще всего однонуклеотидных полиморфизмов или SNP). Все маркеры в рамках профиля Igenity® были обнаружены независимыми учеными в исследовательских институтах, в том числе университетах, исследовательских организациях и государственных организациях, таких как USDA. Затем маркеры анализировали с помощью Igenity® в популяциях для валидации. В Igenity® используют популяции из нескольких ресурсов, которые отражают различные условия производственной среды и биологические типы, при этом часто выполняют работы с промышленными партнерами из маточного, скотоводческого, откормочного и/или упаковочного сегментов скотоводческой промышленности для сбора фенотипов, которые обычно не доступны. Базы данных геномов крупного рогатого скота являются широко доступными, см., например, NAGRP Cattle Genome Coordination Program (http://www.animalgenome.org/cattle/maps/db.html). Таким образом, настоящее изобретение может быть применено для нацеливания на бычьи SNP. Специалист в данной области может использовать вышеупомянутые протоколы для нацеливания на SNP и применения их по отношению к бычьим SNP, как, например, Tan et al. или Heo et al.

Qingjian Zou et al. (Journal of Molecular Cell Biology Advance Access, опубликовано 12 октября 2015 г.) показали повышение мышечной массы у собак с помощью нацеливания на первый экзон гена миостатина собаки (MSTN) (отрицательный регулятор скелетной мышечной массы). Прежде всего, валидировали эффективность sgRNA с помощью котрансфекции sgRNA, нацеленной на MSTN, с помощью вектора Cas9 в собачьих эмбриональных фибробластах (CEF). Затем собак MSTN KO получали с помощью микроинъекции эмбрионам с нормальной морфологией смеси мРНК Cas9 и sgRNA MSTN и аутотрансплантации зигот в маточную трубу той же самой суки. Нокаутированные щенки проявляли выраженный мышечный фенотип в области бедер по сравнению со своим однопометником дикого типа.

Домашний скот - свиньи

Вирусные мишени в домашнем скоте могут включать в некоторых вариантах осуществления свиной CD163, например, на свиных макрофагах. CD163 ассоциирован с инфекцией (предположительно в результате вхождения вируса в клетку) в результате PRRSv (вируса свиного репродуктивного и респираторного синдрома, артеривируса). Инфекция в результате PRRSv, в частности, свиных альвеолярных макрофагов (встречающихся в легких), приводит к ранее неизлечимому свиному синдрому ("таинственная болезнь свиней" или "болезнь синего уха"), который вызывает болезнь, в том числе репродуктивную недостаточность, потерю веса и высокую смертность у домашних свиней. Оппортунистические инфекции, такие как энзоотическая пневмония, менингит и отечность ушей, часто наблюдаются в результате иммунодефицита вследствие потери активности макрофагов. Это также имеет значительные экономические и средовые последствия в связи с повышенным применением антибиотиков и финансовым ущербом (по оценкам 660 млн. дол. в год).

Как было описано Kristin M Whitworth and Dr Randall Prather et al. (Nature Biotech 3434, опубликовано онлайн 07 декабря 2015 г.) в Университете штата Миссури и в сотрудничестве с Genus Plc, CD163 подвергали нацеливанию CRISPR-Cas9 и потомство "редактированных" свиней было устойчиво при воздействии PRRSv. Одного хряка-основателя и одну свиноматку-основательницу, оба из которых имели мутации в экзоне 7 CD163, скрещивали с получением потомства. Хряк-основатель характеризовался делецией из 11 п. о. в экзоне 7 в одном аллеле, которая приводила к мутации типа сдвига рамки и миссенс-трансляции в аминокислоте 45 в домене 5 и последующему преждевременному стоп-кодону по аминокислоте 64. Другой аллель характеризовался добавлением из 2 п.о. в экзоне 7 и делецией из 377 п.о. в предшествующем интроне, которые, как предполагалось, приводили к экспрессии первых 49 аминокислот домена 5, затем преждевременного стоп-кодона в аминокислоте 85. Свиноматка характеризовалась добавлением из 7 п.о. в одном аллеле, которое при трансляции, как предполагалось, экспрессировало первые 48 аминокислот домена 5, затем преждевременный стоп-кодон в аминокислоте 70. Другой аллель свиноматки был неамплифицированным. Некоторые потомки, как предполагалось, представляли собой нуль-животное (CD163-/-), т.е. нокаут по CD163.

Соответственно, в некоторых вариантах осуществления свиные альвеолярные макрофаги могут быть подвергнуты нацеливанию белка CRISPR. В некоторых вариантах осуществления свиной CD163 может быть подвергнут нацеливанию белка CRISPR. В некоторых вариантах осуществления свиной CD163 может быть нокаутирован посредством индукции DSB или в результате вставок или делеций, например, нацеливания на делецию или модификацию экзона 7, в том числе одного или нескольких из описанных выше, или в других областях гена, например, делецию или модификацию экзона 5.

Также предусмотрены "редактированная" свинья и ее потомство, например, нокаутированная по CD163 свинья. Это может быть предусмотрено для целей скотоводства, селекции и моделирования (т.е. свиная модель). Также предусмотрена семенная жидкость, содержащая нокаут гена.

CD163 представляет собой представителя суперсемейства фагоцитарных рецепторов с высоким содержанием цистеина (SRCR). На основе in vitro исследований SRCR домен 5 белка представляет собой домен, ответственный за распаковку и высвобождение вирусного генома. Например, другие представители суперсемейства SRCR также могут быть подвергнуты нацеливанию для получения устойчивости к другим вирусам. PRRSV также представляет собой представителя группы артеривирусов млекопитающих, которая также включает вирус, повышающий уровень лактат-дегидрогеназы у мышей, вирус геморрагической лихорадки обезьян и вирус артерита лошадей. Артеривирусы имеют общие важные свойства патогенеза, в том числе макрофагальный тропизм и способность вызывать как тяжелую болезнь, так и хроническую инфекцию. Соответственно, артеривирусы и, в частности, вирус, вызывающий повышение уровня лактат-дегидрогеназы у мышей, вирус геморрагической лихорадки обезьян и вирус артерита лошадей, могут быть подвергнуты нацеливанию, например, свиного CD163 или его гомологов у других видов, и также предусмотрены мышиные, обезьяньи и лошадиные модели и нокаут.

Действительно, этот подход может быть распространен на вирусы или бактерии, которые вызывают другие заболевания домашнего скота, которые могут передаваться человеку, такие как штаммы вируса свиного гриппа (SIV), которые включают грипп C и подтипы гриппа A, известные как H1N1, H1N2, H2N1, H3N1, H3N2 и H2N3, а также пневмонию, менингит и отечность, упомянутые выше.

Ксенотрансплантация, ксенотрансплантаты

Настоящее изобретение также предусматривает применение системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, для получения РНК-направляемых ДНК-нуклеаз, адаптированных для использования с целью получения модифицированных тканей для трансплантации. Например, РНК-направляемые ДНК-нуклеазы могут быть использованы для нокаута, нокдауна или разрыва определенных генов у животного, такого как трансгенная свинья (такая как линия трансгенных свиней с гемоксигеназой-1 человека), например, для нарушения экспрессии генов, которые кодируют эпитопы, распознаваемые иммунной системой человека, т.е. генами ксеноантигенов. Кандидатные свиные гены для разрыва, например, могут включать гены α(l,3)-галактозилтрансферазы и гидролазы цитидинмонофосфат-N-ацетилнейраминовой кислоты (см. публикацию заявки на патент согласно PCT WO 2014/066505). Кроме того, гены, кодирующие эндогенные ретровирусы, могут быть разорваны, например, гены, кодирующие все свиные эндогенные ретровирусы (см. Yang et al., 2015, Genome-wide inactivation of porcine endogenous retroviruses (PERVs), Science 27 November 2015: Vol. 350 no. 6264, pp. 1101-1104). Кроме того, РНК-направляемые ДНК-нуклеазы могут быть использованы для нацеливания на сайт с целью интеграции дополнительных генов у животных-доноров с ксенотрансплантатами, таких как ген человеческого CD55, для повышения защиты против сверхострого отторжения.

Генные драйвы и применение по отношению к комарам и малярии

Настоящее изобретение также предусматривает применение системы CRISPR-Cas, описанной в данном документе, например, систем эффекторных белков Cas9, для обеспечения РНК-направляемых генных драйвов, например, в системах, аналогичных генным драйвам, описанным в публикации заявки на патент согласно PCT WO 2015/105928. Системы этого типа, например, могут предусматривать способы изменения эукариотических клеток зародышевой линии с помощью введения в клетку зародышевой линии последовательности нуклеиновой кислоты, кодирующей РНК-направляемую ДНК-нуклеазу и одну или несколько направляющих РНК. Направляющие РНК могут быть разработаны так, что являются комплементарными одной или нескольким целевым локусам в геномной ДНК клетки зародышевой линии. Последовательность нуклеиновой кислоты, кодирующая РНК-направляемую ДНК-нуклеазу, и последовательность нуклеиновой кислоты, кодирующая направляющие РНК, могут быть получены в конструкциях между фланкирующими последовательностями, с промоторами, расположенными таким образом, что клетка зародышевой линии может экспрессировать РНК-направляемую ДНК-нуклеазу и направляющие РНК, совместно с любыми требуемыми кодирующими молекулы-карго последовательностями, которые также расположены между фланкирующими последовательностями. Фланкирующие последовательности будут, как правило, включать последовательность, которая является идентичной соответствующей последовательности на определенной хромосоме, таким образом, что фланкирующие последовательности функционируют с компонентами, кодируемыми конструкцией для облегчения вставки чужеродных последовательностей конструкций нуклеиновой кислоты в геномную ДНК в целевом сайте для разрезания с помощью механизмов, таких как гомологичная рекомбинация, для воспроизведения клетки зародышевой линии, гомозиготной по чужеродной последовательности нуклеиновой кислоты. Таким образом, системы генного драйва способны к интрогрессии требуемых генов во всей популяции производителей (Gantz et al., 2015, Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi, PNAS 2015, электронная публикация, предшествующая печатной, от 23 ноября 2015 г., doi:10.1073/pnas.1521077112; Esvelt et al., 2014, Concerning RNA-guided gene drives for the alteration of wild populations eLife 2014;3:e03401). В определенных вариантах осуществления могут быть отобраны целевые последовательности, которые имеют мало потенциальных нецелевых сайтов в геноме. Целевое воздействие на несколько сайтов в целевом локусе с помощью нескольких направляющих РНК может повышать частоту разрезания и замедлять эволюцию устойчивых к драйву генов. Усеченные направляющие РНК могут снижать нецелевое разрезание. Парные никазы могут быть использованы вместо одной нуклеазы для дополнительного повышения специфичности. Конструкции для генного драйва могут включать последовательности молекул-карго, кодирующие регуляторы транскрипции, например, для активации гомологичных рекомбинантных генов и/или репрессии негомологичного соединения концов. Целевые сайты могут быть выбраны в важном гене таким образом, что события негомологичного соединения концов могут вызывать летальность, а не образование устойчивого к драйву аллеля. Конструкции для генного драйва могут быть сконструированы для функционирования в ряде хозяев при диапазоне температур (Cho et al. 2013, Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule, PLoS ONE 8(8): e72393. doi:10.1371/journal.pone.0072393).

FISH и иллюстративные способы применения инактивированных ферментов CRISPR Cas9

В одном аспекте настоящее изобретение относится к сконструированной не встречающуюся в природе системе CRISPR-Cas, содержащей каталитически неактивный белок Cas, описанный в данном документе, предпочтительно инактивированный Cas9 (dCas9), и применение в этой системе флуоресцентной гибридизации in situ (FISH). dCas9, который не обладает способностью выполнять разрывы в двух нитях ДНК, может быть слит с флуоресцентным белком, таким как усиленный зеленый флуоресцентный белок (eEGFP), и коэкспрессировать с малыми направляющими РНК для нацеливания на перицентрические, центрические и телоцентрические повторы in vivo. Система dCas9 может быть использована для визуализации повторяющихся последовательностей и отдельных генов в геноме человека. Такие новые варианты применения меченых систем dCas9 CRISPR-cas могут быть важными в визуализации клеток и изучении функциональной ядерной архитектуры, особенно в случаях с небольшим объемом ядра или сложными 3-D-структурами. (Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li GW, Park J, Blackburn EH, Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system. Cell 155(7):1479-91. doi: 10.1016/j.cell.2013.12.001.)

Терапевтическое нацеливание с помощью РНК-направляемого комплекса эффекторного белка

Как будет понятно, предусматривается, что настоящую систему можно использовать для целенаправленного воздействия на любую представляющую интерес полинуклеотидную последовательность. Настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, или одному или нескольким полинуклеотидам, кодирующим компоненты указанной композиции, или вектору или системам доставки, содержащим один или несколько полинуклеотидов, кодирующих компоненты указанной композиции, для применения при модификации целевой клетки in vivo, ex vivo или in vitro, и они могут быть выполнены при помощи способа, который изменяет клетку таким образом, что после модификации потомство или линия клеток клетки, модифицированной при помощи CRISPR, сохраняет измененный фенотип. Модифицированные клетки и потомство могут быть частью многоклеточного организма, такого как растение или животное, с применением ex vivo или in vivo системы CRISPR по отношению к желаемым типам клеток. Изобретение CRISPR может представлять собой терапевтический способ лечения. Терапевтический способ лечения может включать редактирование гена или генома или генную терапию.

Лечение патогенов, например, бактериальных, грибковых и паразитарных патогенов

Настоящее изобретение также может быть применимо к лечению бактериальных, грибковых и паразитарных патогенов. Большинство исследовательских усилий было сосредоточено на создании новых антибиотиков, которые после создания все равно стали бы предметом аналогичных проблем, связанных с устойчивостью к лекарственному средству. Настоящее изобретение относится к новым альтернативам на основе CRISPR, которые преодолевают эти сложности. Кроме того, в отличие от существующих антибиотиков варианты лечения на основе CRISPR могут быть проведены специфично по отношению к патогенам, с индукцией клеточной смерти целевого патогена, при этом не затрагиваются полезные бактерии.

Jiang et al. ("RNA-guided editing of bacterial genomes using CRISPR-Cas systems," Nature Biotechnology vol. 31, p. 233-9, March 2013) использовали систему CRISPR-Cas9 для мутирования или уничтожения S. pneumoniae и E. coli. Исследование, в результате которого происходило введение точных мутаций в геномы, опиралось на расщепление в целевом сайте генома под управлением системы двойная РНК:Cas9 для уничтожения немутированных клеток и устраняло необходимость в селектируемых маркерах или системах негативного отбора. Системы CRISPR были использованы для обращения устойчивости к антибиотикам и устранения переноса устойчивости между штаммами. Bickard et al. показали, что Cas9, перепрограммированный для нацеливания на гены вирулентности, уничтожают вирулентный, а не авирулентный, S. aureus. Перепрограммирование нуклеазы для нацеливания на гены устойчивости к антибиотиками разрушало плазмиды стафилококков, которые имели гены устойчивости к антибиотикам, и иммунизировало против распространения плазмидных генов устойчивости. (см., Bikard et al., "Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials," Nature Biotechnology vol. 32, 1146-1150, doi:10.1038/nbt.3043, опубликовано онлайн 5 октября 2014 г.) Bikard показал, что антимикробные средства на основе CRISPR-Cas9 функционируют in vivo для уничтожения S. aureus в мышиной модели колонизации кожи. Аналогично Yosef et al. использовали систему CRISPR для нацеливания на гены, кодирующие ферменты, которые придают устойчивость к β-лактамным антибиотикам (см. Yousef et al., "Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria," Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267-7272, doi: 10.1073/pnas.1500107112, опубликовано онлайн 18 мая 2015 г.).

Системы CRISPR могут быть использованы для редактирования геномов паразитов, которые являются устойчивыми к другим генетическим подходам. Например, система CRISPR-Cas9, как было показано, вводит двухнитевые разрывы в геном Plasmodium yoelii (см., Zhang et al., "Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 System," mBio. vol. 5, e01414-14, Jul-Aug 2014). Ghorbal et al. ("Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 system," Nature Biotechnology, vol. 32, p. 819-821, doi: 10.1038/nbt.2925, опубликовано онлайн 1 июня 2014 г.) модифицировали последовательности двух генов, orc1 и kelch13, которые имеют предположительные функции сайленсинга генов и возникновения устойчивости к артемизинину соответственно. Паразиты, которые были изменены в подходящих сайтах, были восстановлены с очень высокой эффективностью, несмотря на отсутствие прямого отбора в отношении модификации, указывая на то, что нейтральные или даже вредные мутации могут быть получены с помощью этой системы. Систему CRISPR-Cas9 также используют для модификации других патогенных паразитов, в том числе Toxoplasma gondii (см. Shen et al., "Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9," mBio vol. 5:e01114-14, 2014; and Sidik et al., "Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9," PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450, опубликовано онлайн 27 июня 2014 г.).

Vyas et al. ("A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families," Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, от 3 апреля 2015 г.) использовали систему CRISPR для преодоления долго существующих препятствий для генной инженерии в C. albicans и эффективного мутирования в одном эксперименте обеих копий нескольких различных генов. В организме, где несколько механизмов способствуют устойчивости к лекарственному средству, Vyas получал гомозиготные двойные мутанты, которые больше не проявляли гиперустойчивость к флуконазолу или циклогексимиду, обнаруживаемую родительским клиническим изолятом Can90. Vyas также получал гомозиготные мутации потери функции в важных генах C. albicans с помощью создания условных аллелей. Нуль-аллели DCR1, который требуется для процессинга рибосомальной РНК, являются летальными при низкой температуре, но жизнеспособными при высокой температуре. Vyas использовал матрицу для репарации, которая вводила нонсенс-мутацию, и выделял мутантов dcr1/dcr1, которые не могли расти при 16°C.

Система CRISPR по настоящему изобретению для применения в P. falciparum посредством разрыва хромосомных локусов. Ghorbal et al. ("Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system", Nature Biotechnology, 32, 819-821 (2014), DOI: 10.1038/nbt.2925, от 1 июня 2014 г.) использовали систему CRISPR для введения специфических нокаутов генов и однонуклеотидных замен в геном малярийного плазмодия. Для адаптации системы CRISPR-Cas9 по отношению к P. falciparum Ghorbal et al. получали векторы экспрессии для контроля регуляторных элементов плазмодия в эписоме pUF1-Cas9, которая также несет селектируемый в отношении лекарственного препарата маркер ydhodh, который придает устойчивость к DSM1, ингибитору дигидрооротатдегидрогензы (PfDHODH) P. falciparum, и для транскрипции sgRNA использовали регуляторные элементы малых ядерных (sn)RNA U6 P. falciparum, помещая направляющую РНК и донорскую ДНК-матрицу для гомологичной рекомбинационной репарации на одну и ту же плазмиду pL7. См. также Zhang C. et al. ("Efficient editing of malaria parasite genome using the CRISPR/Cas9 system", MBio, 2014 Jul 1; 5(4):E01414-14, doi: 10.1128/MbIO.01414-14) и Wagner et al. ("Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum, Nature Methods 11, 915-918 (2014), DOI: 10.1038/nmeth.3063).

Лечение патогенов, аналогичных вирусным патогенам, таким как HIV

Cas-опосредованное редактирование генома может быть использовано для введения защитных мутаций в соматические ткани для лечения негенетических или сложных заболеваний. Например, NHEJ-опосредованная инактивация рецептора CCR5 в лимфоцитах (Lombardo et al., Nat Biotechnol. 2007 Nov; 25(11):1298-306) может представлять собой эффективную стратегию для устранения инфекции, обусловленной HIV, в то время как делеция PCSK9 (Cohen et al., Nat Genet. 2005 Feb; 37(2):161-5) или ангиопоэтина (Musunuru et al., N Engl J Med. 2010 Dec 2; 363(23):2220-7) может обеспечивать терапевтические эффекты по отношению к устойчивой к статинам гиперхолестеринемии или гиперлипидемии. Несмотря на то, что эти мишени могут также подвергаться воздействию с помощью siRNA-опосредованного нокдауна белков, уникальное преимущество NHEJ-опосредованной инактивации генов заключается в способности достигать долговременного терапевтического эффекта без необходимости в продолжении лечения. Как и в случае всех видов генной терапии, это будет, безусловно, важным для установления того, что каждое предлагаемое терапевтическое применение имеет эффективное соотношение "риск-польза".

Гидродинамическая доставка плазмидной ДНК, кодирующей Cas9 и направляющую РНК совместно с матрицей для репарации, в печень в модели тирозинемии у взрослых мышей, как было показано, способна корректировать мутантный ген Fah и восстанавливать экспрессию белка Fah дикого типа в ∼1 из 250 клеток (Nat Biotechnol. 2014 Jun; 32(6):551-3). Кроме того, в клинических исследованиях успешно применяли нуклеазы ZF для лечения инфекции, обусловленной HIV, с помощью ex vivo нокаута рецептора CCR5. У всех пациентов уровни ДНК HIV снижались, и у одного из четырех пациентов РНК HIV становилась невыявляемой (Tebas et al., N Engl J Med. 2014 Mar 6; 370(10):901-10). Оба из этих результата показывают потенциал программируемых нуклеаз в качестве новой терапевтической платформы.

В другом варианте осуществления самоинактивирующиеся лентивирусные векторы с siRNA, нацеленной на общий экзон, который имеет tat/rev HIV, сигналом ядрышковой локализации TAR-ловушкой и специфичным к CCR5 рибозимом в виде головки молотка (см., например, DiGiusto et al. (2010) Sci Transl Med 2:36ra43) можно использовать и/или адаптировать для системы CRISPR-Cas9 по настоящему изобретению. Не менее 2,5 × 106 CD34+ клеток на килограмм веса пациента можно собирать и предварительно стимулировать в течение 16-20 часов в среде X-VIVO 15 (Lonza), содержащей 2 мкмоль/L-глутамина, фактор стволовых клеток (100 нг/мл), лиганд Flt-3 (Flt-3L) (100 нг/мл) и тромбопоэтин (10 нг/мл) (CellGenix), при плотности 2 × 106 клеток/мл. Предварительно стимулированные клетки можно трансдуцировать лентивирусом при множественности заражения 5 в течение 16-24 часов во флаконах с культурой тканей на 75 см2, покрытых фибронектином (25 мг/см2) (RetroNectin, Takara Bio Inc.).

Специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC в отношении состояния иммунодефицита, такого как HIV/AIDS, включая приведение HSC в контакт с системой CRISPR-Cas9, которая целенаправленно воздействует на CCR5 и приводит к его нокауту. Направляющую РНК (и преимущественно подход с двумя направляющими последовательностями, например, парой различных РНК; например, направляющих РНК, нацеленных на два клинически значимых гена, B2M и CCR5, в первичных CD4+ T-клетках человека и CD34+ гемопоэтических стволовых клетках и клетках-предшественниках (HSPC)), которая нацеливается и нокаутирует частицу, содержащую CCR5 и белок Cas9, приводят в контакт с HSC. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. См. также Kiem, "Hematopoietic stem cell-based gene therapy for HIV disease," Cell Stem Cell. Feb 3, 2012; 10(2): 137-147; включенную в данный документ посредством ссылки вместе с документами, которые в ней перечислены; Mandal et al, "Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cells using CRISPR/Cas9," Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014; включенную в данный документ посредством ссылки вместе с документами, которые в ней перечислены. Также упоминается публикация Ebina, "CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA" SCIENTIFIC REPORTS |3 : 2510| DOI: 10.1038/srep02510, включенная в данный документ посредством ссылки вместе с документами, которые в ней перечислены, в качестве иных средств борьбы с HIV/AIDS с применением системы CRISPR-Cas9.

Основание для редактирования генома для лечения HIV исходит из наблюдения того, что индивидуумы, гомозиготные по мутациям с потерей функции в CCR5, клеточном корецепторе для вируса, обладают высокой устойчивостью к инфекции и, в иных случаях, здоровы, что дает основание предполагать, что имитирование этой мутации с редактированием генома может быть безопасной и эффективной терапевтической стратегией [Liu, R., et al. Cell 86, 367-377 (1996)]. Эта идея была подтверждена клинически, когда инфицированному HIV пациенту пересаживали аллогенный трансплантат костного мозга от донора, гомозиготного по мутации с потерей функции в CCR5, что приводило к необнаруживаемым уровням HIV и восстановлению нормальных значений числа клеток CD4 T [Hutter, G., et al. The New England journal of medicine 360, 692-698 (2009)]. Хотя трансплантация костного мозга не является приемлемой стратегией лечения для большинства пациентов с HIV в связи со стоимостью и потенциальной реакцией "трансплантат против хозяина", виды терапии HIV, которые трансформируют собственные T-клетки пациента в CCR5, являются желательными.

Ранние исследования с применением ZFN и NHEJ для нокаута CCR5 в гуманизированных мышиных моделях HIV показали, что трансплантация CD4 T-клеток с отредактированным CCR5 улучшала вирусную нагрузку и значения числа клеток CD4 T [Perez, E.E., et al. Nature biotechnology 26, 808-816 (2008)]. Важно, что данные модели также показали, что инфекция, обусловленная HIV, приводила к отбору нуль-клеток по CCR5, свидетельствуя о том, что редактирование обеспечивает преимущество пригодности и потенциально предоставляет возможность небольшому количеству редактированных клеток создавать терапевтический эффект.

Как результат данного и других многообещающих доклинических исследований, терапия с применением редактирования генома, которая обеспечивает нокаут CCR5 в T-клетках пациентов, в настоящее время проходит тестирование на людях [Holt, N., et al. Nature biotechnology 28, 839-847 (2010); Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013)]. В недавно проведенной I фазе клинического испытания CD4+ T-клетки отбирали у пациентов с HIV, редактировали с помощью ZFN, сконструированными для нокаута гена CCR5, и аутологически трансплантировали обратно пациентам [Tebas, P., et al. The New England journal of medicine 370, 901-910 (2014)].

В другом исследовании (Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, от 6 ноября 2014 г.) система CRISPR-Cas9 нацеливалась на два клинически значимых гена, B2M и CCR5, в CD4+ T-клетках и CD34+ гемопоэтических стволовых и клетках-предшественниках человека (HSPC). Применение одиночных направляющих РНК приводило к высокоэффективному мутагенезу в HSPC, но не в T-клетках. Подход с двумя направляющими последовательностями повышал эффективность удаления гена в обоих типах клеток. HSPC, которые подвергались редактированию генома с помощью CRISPR-Cas9, сохраняли способность к мультилинейности. Предполагаемые целевые и нецелевые мутации были исследованы посредством целевого секвенирования с захватом в HSPC и низкие уровни нецелевого мутагенеза наблюдали лишь в одном сайте. Эти результаты показывают, что система CRISPR-Cas9 может эффективно удалять гены в HSPC с минимальным нецелевым мутагенезом, что имеет широкую применимость для терапии на основе гемопоэтических клеток.

Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987) подвергали сайленсингу CCR5 посредством CRISPR-ассоциированного белка 9 (Cas9) и одиночных направляющих РНК (направяющих РНК) с лентивирусными векторами, экспрессирующими направляющие РНК для Cas9 и CCR5. Wang et al. показали, что трансдукция за один цикл лентивирусных векторов, экспрессирующих направляющие РНК Cas9 и CCR5, в восприимчивых к HIV-1 CD4+ клетках человека приводит к высоким частотам нарушения функционирования гена CCR5. Клетки с разорванным геном CCR5 являются не только устойчивыми к R5-тропному HIV-1, в том числе изолятам передаваемых вирусов/вирусов-основателей (T/F) HIV-1, но также имеют селективное преимущество над клетками с неразорванным геном CCR5 во время инфекции R5-тропным HIV-1. Геномные мутации в потенциальных нецелевых сайтах, которые являются высокогомологичными этим направляющим РНК для CCR5, в стабильно трансдуцированных клетках даже через 84 дня после трансдукции не были обнаружены с помощью анализа T7 эндонуклеазы I.

Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) идентифицировали двухкассетную систему, экспрессирующую части белка Cas9 S. pyogenes (SpCas9), который подвергался сплайсингу в клетке с образованием функционального белка, способного к сайт-специфичному расщеплению ДНК. С помощью специфических направляющих нитей CRISPR Fine et al. показали эффективность этой системы в расщеплении генов HBB и CCR5 в клетках HEK-293T человека в виде одного Cas9 и пары никаз Cas9. Транс-сплайсированный SpCas9 (tsSpCas9) характеризовался ~35% от нуклеазной активности по сравнению с SpCas9 дикого типа (wtSpCas9) при стандартных дозах для трансфекции, однако имел значительно сниженную активность при более низких уровнях доз. Существенно уменьшенная длина открытой рамки считывания tsSpCas9 по отношению к wtSpCas9 потенциально способствует упаковке более сложных и длинных генетических элементов в вектор на основе AAV, в том числе тканеспецифичных промоторов, экспрессии мультиплексной направляющей РНК и слиянию эффекторных доменов с SpCas9.

Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8) показали, что система CRISPR-Cas9 может эффективно опосредовать редактирование локуса CCR5 в линиях клеток, приводя к нокауту экспрессии CCR5 на клеточной поверхности. При секвенировании следующего поколения было обнаружено, что различные мутации вводили возле предполагаемого сайта расщепления CCR5. Для каждой из трех наиболее эффективных направляющих РНК, которые были проанализированы, значительных нецелевых эффектов выявлено не было в 15 потенциальных сайтах с наивысшими баллами. С помощью конструирования химерных аденовирусов Ad5F35, несущих компоненты CRISPR-Cas9, Li et al. эффективно трансдуцировали первичные CD4+ T-лимфоциты и нарушали экспрессию CCR5, а положительно трансдуцированным клеткам придавали устойчивость к HIV-1.

Следует упомянуть WO 2015/148670 и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этого документа, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генной терапии подразумеваются способы и композиции для редактирования целевой последовательности, связанной или находящейся в связи с вирусом иммунодефицита человека (HIV) и синдром приобретенного иммунодефицита (AIDS). В связанном аспекте настоящее изобретение, описанное в данном документе, подразумевает предупреждение и лечение инфекции, обусловленной HIV, и AIDS с помощью введения одной или нескольких мутаций в гене рецептора C-C-хемокина 5 типа (CCR5). Ген CCR5 также известен как CKR5, CCR-5, CD195, CKR-5, CCCKR5, CMKBR5, IDDM22 и CC-CKR-5. В дополнительном аспекте настоящее изобретение, описанное в данном документе, подразумевает применение с целью предупреждения или уменьшения инфекции, обусловленной HIV, и/или предупреждения или уменьшения способности HIV попадать в клетки-хозяева, например, у субъектов, которые уже инфицированы. Иллюстративные клетки-хозяева для HIV включают без ограничения CD4-клетки, T-клетки, лимфоидную ткань, ассоциированную с кишечником (GALT), макрофаги, дендритные клетки, миелоидные клетки-предшественники и микроглию. Попадание вируса в клетки-хозяева требует взаимодействия вирусных гликопротеинов gp41 и gp120 с CD4-рецептором и корецептором, например, CCR5. Если корецептор, например, CCR5, не присутствует на поверхности клеток-хозяев, то вирус не может связаться и попасть в клетки-хозяева. Таким образом, прогрессирование заболевания затрудняется. С помощью нокаута или нокдауна CCR5 в клетках-хозяевах, например, при введении защитной мутации (такой как мутация CCR5 дельта 32), предупреждают попадание вируса HIV в клетки-хозяева.

Специалист в данной области может воспользоваться вышеописанными исследованиями, например, Holt, N., et al. Nature biotechnology 28, 839-847 (2010), Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013), Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014, Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987), Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) и Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8), для нацеливания на CCR5 с помощью системы CRISPR Cas9 по настоящему изобретению.

Лечение патогенов, аналогичных вирусным патогенам, таким как HBV

Хроническая инфекция вируса гепатита B (HBV) является распространенной, смертельной и редко излечимой в связи с устойчивостью вирусной эписомальной ДНК (cccDNA) в инфицированных клетках. Ramanan et al. (Ramanan V, Shlomai A, Cox DB, Schwartz RE, Michailidis E, Bhatta A, Scott DA, Zhang F, Rice CM, Bhatia SN, Sci Rep. 2015 Jun 2;5:10833. doi: 10.1038/srep10833, опубликовано онлайн 2 июня 2015 г.) показали, что система CRISPR/Cas9 может специфично нацеливаться и расщеплять консервативные области в геноме HBV, приводя к устойчивой супрессии экспрессии и репликации генов. При длительной экспрессии Cas9 и соответствующим образом выбранных направляющих РНК они показали расщепление cccDNA с помощью Cas9 и существенное снижение cccDNA и других параметров экспрессии и репликации вирусных генов. Таким образом, они показали, что непосредственное нацеливание на эписомальную ДНК является новым терапевтическим подходом к контролю вируса и, возможно, излечению пациентов. Это также описано в WO2015089465 A1, от имени The Broad Institute (института Броада) et al., содержание которого тем самым включено в данный документ посредством ссылки.

Настоящее изобретение также можно применять для лечения вируса гепатита B (HBV). Однако система CRISPR-Cas должна быть приспособлена для того, чтобы избежать недостатков RNAi, таких как риск перенасыщения эндогенных путей малых РНК, с помощью, например, оптимизации дозы и последовательности (см., например, Grimm et al., Nature vol. 441, 26 May 2006). Например, предусматриваются низкие дозы, такие как приблизительно 1-10 x 1014 частиц на человека. В другом варианте осуществления систему CRISPR-Cas, направленную против HBV, можно вводить в липосомах, таких как стабильная частица из нуклеиновой кислоты и липидов (SNALP) (см., например, Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005). Предусматриваются ежедневные внутривенные инъекции приблизительно 1, 3 или 5 мг/кг/день CRISPR Cas, целенаправленно воздействующей на РНК HBV в SNALP. Обработку можно осуществлять ежедневно в течение приблизительно трех дней, а затем еженедельно в течение приблизительно пяти недель. В других вариантах осуществления систему согласно Chen et al. (Gene Therapy (2007) 14, 11-19) можно применять к системе CRISPR-Cas согласно настоящему изобретению и/или адаптировать к ней. Chen et al. использовали двухнитевой псевдотипированный вектор на основе аденоассоциированного вируса 8 (dsAAV2/8) для доставки shRNA. Однократное введение вектора dsAAV2/8 (1 x 1012 векторных геномов на мышь), несущего специфичную к HBV shRNA, эффективно подавляло стабильный уровень белка, мРНК и репликативной ДНК HBV в печени трансгенных мышей с HBV, что приводило к снижению нагрузки HBV в кровотоке на вплоть до 2-3 log10. Значительное подавление HBV продолжалось в течение по меньшей мере 120 дней после введения вектора. Терапевтический эффект shRNA зависел от целевой последовательности и не включал активацию интерферона. В соответствии с настоящим изобретением систему CRISPR-Cas, направленную в отношении HBV, можно клонировать в вектор на основе AAV, например, вектор на основе dsAAV2/8, и вводить человеку, например, в дозе от приблизительно 1 x 1015 векторных геномов до приблизительно 1 x 1016 векторных геномов на человека. В другом варианте осуществления способ согласно Wooddell et al. (Molecular Therapy vol. 21 no. 5, 973-985 May 2013) можно применять к системе CRISPR-Cas согласно настоящему изобретению и/или адаптировать к ней. Woodell et al. продемонстрировали, что простая совместная инъекция целенаправленно воздействующего на гепатоциты, конъюгированного с N-ацетилгалактозамином мелиттин-подобного пептида (NAG-MLP) с тропной к печени конъюгированной с холестерином siRNA (chol-siRNA), целенаправленно воздействующей на фактор коагуляции VII (F7), приводит в результате к эффективному нокдауну F7 у мышей и приматов, отличных от человека, без изменений клинических химических показателей или индукции цитокинов. Используя временные и трансгенные мышиные модели инфекции, обусловленной HBV, Wooddell et al. продемонстрировали, что однократная совместная инъекция NAG-MLP с активной chol-siRNA, целенаправленно воздействующей на консервативные последовательности HBV, приводила в результате к многократной репрессии вирусной РНК, белков и вирусной ДНК с большой продолжительностью эффекта. Внутривенные совместные инъекции, например, приблизительно 6 мг/кг NAG-MLP и 6 мг/кг специфичной к HBV CRISPR-Cas, могут быть предусмотрены в настоящем изобретении. В альтернативном случае приблизительно 3 мг/кг NAG-MLP и 3 мг/кг специфичной к HBV CRISPR-Cas могут доставляться в первый день с последующим введением приблизительно 2-3 мг/кг NAG-MLP и 2-3 мг/кг специфичной к HBV CRISPR-Cas две недели спустя.

Lin et al. (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38) разработали восемь gRNA к HBV генотипа A. с помощью специфичных к HBV gRNA система CRISPR-Cas9 значительно снижала образование коровых и поверхностных белков HBV в клетках Huh-7, трансфицированных вектором экспрессии на основе HBV. Среди восьми подвергнутых скринингу gRNA были идентифицированы две эффективные. Одна gRNA, нацеленная на консервативную последовательность HBV, действовала против различных генотипов. С использованием гидродинамической мышиной модели устойчивости HBV Lin et al. дополнительно продемонстрировали, что эта система могла расщеплять плазмиду, содержащую геном HBV, в печени и облегчать ее клиренс in vivo, приводя к снижению уровней поверхностных антигенов сыворотки. Эти данные свидетельствуют о том, что система CRISPR-Cas9 могла разрывать HBV-экспрессирующие матрицы как in vitro, так и in vivo, указывая на потенциал в устранении хронической инфекции, обусловленной HBV.

Dong et al. (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3) использовали систему CRISPR-Cas9 для нацеливания на геном HBV и эффективного ингибирования инфекции, обусловленной HBV. Dong et al. синтезировали четыре одиночные направляющие РНК (направляющие РНК), нацеливающиеся на консервативные области HBV. Экспрессия этих направляющих РНК с Cas9 снижала образование вирусов в клетках Huh7, а также в клетках HepG2.2.15, реплицирующих HBV. Dong et al. дополнительно продемонстрировали, что непосредственное расщепление системой CRISPR-Cas9 и опосредованный расщеплением мутагенез происходили в cccDNA HBV трансфицированных клеток. В мышиной модели cccDNA, несущей HBV, инъекция плазмид на основе направляющей РНК и Cas9 в хвостовую вену приводила к низкому уровню cccDNA и белка HBV.

Liu et al. (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22) разработали восемь направляющих РНК (gRNA), которые нацеливались на консервативные области различных генотипов HBV, которые могли значительно ингибировать репликацию HBV как in vitro, так и in vivo, с целью исследования возможности применения системы CRISPR-Cas9 для разрыва ДНК-матриц HBV. Специфичная к HBV система gRNA/Cas9 могла ингибировать репликацию HBV различных генотипов в клетках, а уровень вирусной ДНК значительно снижался в результате действия системы одиночной gRNA/Cas9, и она выводилась в результате комбинации различных систем gRNA/Cas9.

Wang et al. (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) разработали 15 gRNA к HBV генотипов A-D. Были выбраны одиннадцать комбинаций из двух вышеуказанных gRNA (двойные gRNA), охватывающие регуляторную область HBV. Эффективность каждой gRNA и 11 двойных gRNA по отношению к супрессии репликации HBV (генотипы A-D) исследовали с помощью измерения поверхностного антигена HBV (HBsAg) или антигена e (HBeAg) в супернатанте культуры. Разрушение HBV-экспрессирующих векторов исследовали в клетках HuH7, котрансфицированных вектором, экспрессирующим двойные gRNA и HBV, с помощью метода полимеразной цепной реакции (ПЦР) и секвенирования, а разрушение cccDNA исследовали в клетках HepAD38 с помощью осаждения KCl, переваривания АТФ-зависимой ДНКазой, безопасной для плазмиды (PSAD), комбинированного способа амплификации по типу катящегося кольца и количественной ПЦР. Цитотоксичность этих gRNA определяли с помощью анализа тетразолия в митохондриях. Все из gRNA могли значительно снижать образование HBsAg или HBeAg в супернатанте культуры, которое зависело от области направленности gRNA. Все из двойных gRNA могли эффективно супрессировать образование HBsAg и/или HBeAg в случае HBV генотипов A-D, и эффективность двойных gRNA в супрессии образования HBsAg и/или HBeAg значительно повышалась при сравнении с использованием только одиночных gRNA. Кроме того, с помощью прямого ПЦР-секвенирования авторы настоящего изобретения подтвердили, что эти двойные gRNA могли специфично разрушать HBV-экспрессирующие матрицы посредством удаления фрагмента между сайтами расщепления двух используемых gRNA. Что более важно, комбинация gRNA-5 и gRNA-12 не только могла эффективно супрессировать образование HBsAg и/или HBeAg, но также разрушать запасы cccDNA в клетках HepAD38.

Karimova et al. (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734) идентифицировали консервативные последовательности HBV между генотипами в S и X области генома HBV, которые были подвергнуты нацеливанию специфичного и эффективного расщепления с помощью никазы Cas9. С помощью этого подхода нарушали не только эписомальные cccDNA и интегрированные в хромосомы целевые сайты HBV в репортерных линиях клеток, но также репликацию HBV в линиях клеток гепатомы с хронической и de novo инфекцией.

Специалист в данной области может воспользоваться вышеприведенными исследованиями, например, Lin et al. (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38), Dong et al. (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3), Liu et al. (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22), Wang et al. (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) и Karimova et al. (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734) для нацеливания на HBV с помощью системы CRISPR Cas по настоящему изобретению.

Способы персонифицированного скрининга пациентов

Систему CRISPR-Cas, которая целенаправленно воздействуют на нуклеотиды, например, на тринуклеотидные повторы, можно использовать для проведения скрининга пациентов или образцов пациентов на присутствие таких повторов. Повторы могут представлять собой мишень для РНК системы CRISPR-Cas, и если происходит их связывание с системой CRISPR-Cas, то связывание можно выявить, что указывает тем самым на присутствие такого повтора. Таким образом, систему CRISPR-Cas можно использовать для скрининга пациентов или образцов пациентов на присутствие повторов. Пациенту затем можно вводить подходящее соединение(подходящие соединения), направленное(направленные) на состояние; или можно вводить систему CRISPR-Cas для связывания с нуклеотидом и осуществления вставки, делеции или мутации и облегчения тяжести состояния.

Лечение заболеваний с генетическими и эпигенетическими аспектами

Системы CRISPR-Cas9 по настоящему раскрытию могут быть использованы для коррекции генетических мутаций, в отношении которых ранее предпринимались попытки с ограниченным успехом с помощью TALEN и ZFN и которые были идентифицированны в качестве потенциальных мишеней для систем Cas9, в том числе, как в опубликованных заявках на патент Editas Medicine, описывающих способы применения систем Cas9 для нацеливания на локусы с целью терапевтической направленности на заболевания с помощью генной терапии, в том числе WO 2015/048577 CRISPR-RELATED METHODS AND COMPOSITIONS Gluckmann et al.; WO 2015/070083 CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS Glucksmann et al.

Следует упомянуть WO 2015/134812 CRISPR/CAS-RELATED METHODS AND COMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA, Maeder et al. В идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генная терапия заболеваний зрения и слуха, способы и композиции для лечения синдрома Ушера и пигментного ретинита могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению (см., например, WO 2015/134812). В одном варианте осуществления WO 2015/134812 предусматривает лечение или задержку наступления или прогрессирования синдрома Ушера IIA типа (USH2A, USH11A) и пигментного ретинита 39 типа (RP39) с помощью редактирования генов, например, с помощью способов, опосредованных системой CRISPR-Cas9, с целью коррекции делеции гуанина в положении 2299 в гене USH2A (например, замены удаленного гуанинового остатка в положении 2299 в гене USH2A). В связанном аспекте мутация повергается нацеливанию с помощью расщепления одной или несколькими нуклеазами, одной или несколькими никазами или их комбинацией, например, для индукции HDR с донорской матрицей, которая корректирует точковую мутацию (например, однонуклеотидную, например, гуаниновую, делецию). Изменение или коррекция мутантного гена USH2A может быть опосредована любым механизмом. Иллюстративные механизмы, которые могут быть ассоциированы с изменением (например, коррекцией) мутантного гена HSH2A, включают без ограничения негомологичное соединение концов, опосредованное микрогомологией связывание концов (MMEJ), репарацию с участием гомологичной рекомбинации (например, опосредованную эндогенной донорской матрицей), SDSA (синтез-зависимый отжиг нитей), однонитевой отжиг и однонитевую инвазию. В варианте осуществления способ, применяемый для лечения синдрома Ушера и пигментного ретинита, может включать получение информации о мутации, переносимой субъектом, например, с помощью секвенирования соответствующего участка гена USH2A.

В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика первичной открытоугольной глаукомы (POAG). Мишенью предпочтительно является ген MYOC. Это описано в WO 2015/153780, раскрытие которого включено в данный документ посредством ссылки.

Следует упомянуть WO 2015/138510 и в идеях, изложенных в данном документе, настоящее изобретение (с помощью системы CRISPR-Cas9) подразумевает обеспечение лечения или задержку наступления или прогрессирования врожденного амавроза Лебера 10 типа (LCA 10). LCA 10 вызван мутацией в гене CEP290, например, c.2991+1655, мутацией аденина в гуанин в гене CEP290, который приводит к образованию криптического сайта сплайсинга в интроне 26. Это мутация в нуклеотиде 1655 интрона 26 CEP290, например, мутация A в G. CEP290 также известен как CT87; MKS4; POC3; rd16; BBS14; JBTS5; LCAJO; NPHP6; SLSN6 и 3H11Ag (см., например, WO 2015/138510). В одном аспекте генной терапии настоящее изобретение предусматривает введение одного или нескольких разрывов возле сайта целевого положения LCA (например, c.2991 + 1655; A в G) в по меньшей мере одном аллеле гена CEP290. Изменение целевого положения LCA10 относится к (1) индуцированному разрывом введению вставок/делеций (также обозначаемому в данном документе как NHEJ-опосредованное введение вставок/делеций) в непосредственной близости к целевому положению LCA10 или включая его (например, c.2991+1655 A в G), или (2) индуцированной разрывом делеции (также обозначаемой как NHEJ-опосредованная делеция) геномной последовательности, в том числе мутацию в целевом положении LCA10 (например, c.2991+1655 A в G). Оба подхода приводят к потере функции или разрушению криптического сайта сплайсинга, образующегося в результате мутации в целевом положении LCA 10.

В одном аспекте настоящее изобретение (с помощью системы CRISPR-Cas9) подразумевает обеспечение лечения или задержку наступления или прогрессирования врожденного амавроза Лебера 10 типа (LCA 10). LCA 10 вызван мутацией в гене CEP290, например, c.2991+1655, мутацией аденина в гуанин в гене CEP290, который приводит к образованию криптического сайта сплайсинга в интроне 26. Это мутация в нуклеотиде 1655 интрона 26 CEP290, например, мутация A в G. CEP290 также известен как CT87; MKS4; POC3; rd16; BBS14; JBTS5; LCAJO; NPHP6; SLSN6 и 3H11Ag (см., например, WO 2015/138510). В одном аспекте генной терапии настоящее изобретение предусматривает введение одного или нескольких разрывов возле сайта целевого положения LCA (например, c.2991 + 1655; A в G) в по меньшей мере одном аллеле гена CEP290. Изменение целевого положения LCA10 относится к (1) индуцированному разрывом введению вставок/делеций (также обозначаемому в данном документе как NHEJ-опосредованное введение вставок/делеций) в непосредственной близости к целевому положению LCA10 или включая его (например, c.2991+1655 A в G), или (2) индуцированной разрывом делеции (также обозначаемой как NHEJ-опосредованная делеция) геномной последовательности, в том числе мутацию в целевом положении LCA10 (например, c.2991+1655 A в G). Оба подхода приводят к потере функции или разрушению криптического сайта сплайсинга, образующегося в результате мутации в целевом положении LCA 10.

Исследователи рассматривают вопрос о том, можно ли применять генную терапию для лечения широкого диапазона заболеваний. Системы CRISPR по настоящему изобретению, основанные на эффекторном белке Cas9, предусмотрены для таких вариантов терапевтического применения, включая без ограничения дополнительные приведенные в примерах области и способы доставки, приведенные ниже. Некоторые примеры состояний или заболеваний, которые можно эффективно лечить с использованием системы по настоящему изобретению, включенные в примеры генов и ссылок, включенных в данный документ, и в настоящее время ассоциированные с такими состояниями, также предусмотрены в данном документе. Приведенные в качестве примеров гены и состояния не являются исчерпывающими.

Лечение заболеваний сердечно-сосудистой системы

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas9, в частности, новых систем эффекторного белка CRISPR, описанных в данном документе, в кровь или гемопоэтические стволовые клетки. Экзосомы плазмы крови согласно Wahlgren et al. (Nucleic Acids Research, 2012, Vol. 40, No. 17 e130) были описаны ранее, и их можно использовать для доставки системы CRISPR Cas9 в кровь. Система нацеливания на нуклеиновую кислоту по настоящему изобретению также предусматривается для лечения гемоглобинопатий, таких как формы талассемии и серповидноклеточной анемии. См., например, международную публикацию заявки на патент WO 2013/126794 в отношении потенциальных мишеней, на которые может нацеливаться система CRISPR Cas9 по настоящему изобретению.

В публикации Drakopoulou, "Review Article, The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia", Stem Cells International, Volume 2011, Article ID 987980, 10 pages, doi:10.4061/2011/987980, включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены так, если бы они были изложены в полном объеме, обсуждается модификация HSC с применением лентивируса, который доставляет ген β-глобина или γ-глобина. В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно β-талассемии с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для β-глобина или γ-глобина, преимущественно β-глобина или γ-глобина несерповидных форм эритроцитов); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к β-талассемии, и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии β-глобина или γ-глобина. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии β-глобина или γ-глобина; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. В этом отношении следует упомянуть публикацию Cavazzana "Outcomes of Gene Therapy for β-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral βA-T87Q-Globin Vector." tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf; Cavazzana-Calvo "Transfusion independence and HMGA2 activation after gene therapy of human β-thalassaemia", Nature 467, 318-322 (16 сентября 2010) doi:10.1038/nature09328; Nienhuis "Development of Gene Therapy for Thalassemia, Cold Spring Harbor Perspectives in Medicine, doi: 10.1101/cshperspect.a011833 (2012), LentiGlobin BB305, лентивирусный вектор, содержащий сконструированный ген β-глобина (βA-T87Q); и Xie et al. "Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback" Genome Research gr.173427.114 (2014) http://www.genome.org/cgi/doi/10.1101/gr.173427.114 (Cold Spring Harbor Laboratory Press); который является предметом исследования Cavazzana, включая β-талассемию человека, и предметом исследования Xie, причем все включены в данный документ посредством ссылки, вместе со всеми документами, которые в них перечислены или связаны с ними. В настоящем изобретении матрица для HDR может обеспечивать экспрессию HSC сконструированного гена β-глобина (например, βA-T87Q) или β-глобина, указанного у Xie.

Xu et al. (Sci Rep. 2015 Jul 9;5:12065. doi: 10.1038/srep12065) разработали TALEN и CRISPR-Cas9 для непосредственного нацеливания на сайт IVS2-654 мутации интрона 2 в гене глобина. Xu et al. наблюдали различные частоты двунитевых разрывов (DSB) в локусах IVS2-654 при применении TALEN и CRISPR-Cas9, и TALEN опосредовали более высокую эффективность нацеливания на гомологичные гены по сравнению с CRISPR-Cas9 при комбинировании с донором транспозона piggyBac. Кроме того, более очевидные нецелевые события наблюдали в случае CRISPR-Cas9 по сравнению с TALEN. В конечном итоге, откорректированные с помощью TALEN клоны iPSC отбирали на предмет дифференциации эритробластов с помощью системы кокультивирования OP9 и выявляли относительно высокую транскрипцию HBB по сравнению с неоткорректированными клетками.

Song et al. (Stem Cells Dev. 2015 May 1;24(9):1053-65. doi: 10.1089/scd.2014.0347. Epub 2015 Feb 5) использовали систему CRISPR/ Cas9 для коррекции iPSC с β-Thal; клетки с откорректированными генами характеризовались нормальными кариотипами и полной плюрипотентностью, поскольку эмбриональные стволовые клетки человека (hESC) не проявляли нецелевых эффектов. Впоследствии Song et al. оценивали эффективность дифференцировки iPSC с β-Thal с откорректированными генами. Song et al. обнаружили, что во время дифференцировки гемопоэтических клеток iPSC с β-Thal с откорректированными генами характеризовались повышенным соотношением эмбриоидных телец и различными процентами гемопоэтических клеток-предшественников. Гораздо более важно, линии iPSC с β-Thal с откорректированными генами восстанавливали экспрессию HBB и снижали образование активных форм кислорода по сравнению с неоткорректированной группой. Исследование Song et al. свидетельствовало о том, что эффективность гемопоэтической дифференцировки iPSC с β-Thal была значительно повышена непосредственно после коррекции с помощью системы CRISPR-Cas9. Аналогичные способы могут осуществляться с помощью систем CRISPR-Cas9, описанных в данном документе, например, систем, содержащих эффекторные белки Cas9.

Следует упомянуть WO 2015/148860, в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генная терапия заболеваний, связанных с кровеносной системой, способы и композиции для лечения бета-талассемии могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению (см., например, WO 2015/148860). В одном варианте осуществления WO 2015/148860 предусматривает лечение или предупреждение бета-талассемии, или ее симптомов, например, с помощью изменения гена B-клеточного CLL/лимфомы 11A (BCL11A). Ген BCL11A также известен как ген B-клеточного CLL/лимфомы 11A, BCL11A -L, BCL11A -S, BCL11AXL, CTIP 1, HBFQTL5 и ZNF. BCL11A кодирует белок "цинковый палец", который участвует в регуляции экспрессии генов глобинов. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы заболевания бета-талассемии.

Серповидноклеточная анемия представляет собой аутосомно-рецессивное наследственное заболевание, при котором красные кровяные тельца приобретают серповидную форму. Оно вызывается заменой одного основания в гене β-глобина, который локализован на коротком плече хромосомы 11. Как результат, валин продуцируется вместо глутаминовой кислоты, что вызывает продуцирование гемоглобина серповидных клеток (HbS). Это приводит к образованию искривленной формы эритроцитов. В связи с аномальной формой небольшие кровеносные сосуды могут блокироваться, вызывая серьезное повреждение кости, селезенки и тканей кожи. Это может приводить к приступам боли, частым инфекциям, ладонно-подошвенному синдрому или даже полиорганной недостаточности. Искривленные эритроциты также являются более восприимчивыми к гемолизу, что приводит к серьезной анемии. Как в случае β-талассемии, серповидноклеточную анемию можно корректировать путем модификации HSC с использованием системы CRISPR-Cas9. Данная система обеспечивает возможность специфического редактирования генома клетки путем разрезания ее ДНК с обеспечением после этого ее самовосстановления. Белок Cas9 вставляют и направляют направляющей РНК в точку мутации, а затем он разрезает ДНК в этой точке. Одновременно вставляют нормальный вариант последовательности. Данная система используется собственной системой репарации для исправления индуцированного разреза. В этом отношении система CRISPR-Cas9 обеспечивает возможность коррекции мутации в ранее полученных стволовых клетках. Специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно серповидноклеточной анемии с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для β-глобина, преимущественно β-глобина не серповидных форм эритроцитов); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к серповидноклеточной анемии, и HDR может обеспечивать кодирование, приводящее к правильной экспрессии β-глобина. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии β-глобина; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. Матрица для HDR может обеспечивать экспрессию HSC сконструированного гена β-глобина (например, βA-T87Q) или β-глобина, указанного у Xie.

Следует упомянуть WO 2015/148863, и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, которые могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению. В аспекте лечения или предупреждения серповидноклеточной анемии, которая представляет собой наследственное гематологическое заболевание крови, WO 2015/148863 предусматривает изменение гена BCL11A. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы серповидноклеточной анемии.

В публикации Williams "Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies," Cell Stem Cell 13:263-264 (2013), включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены, так, если бы были изложены в полном объеме, сообщается об опосредованном лентивирусами переносе генов в клетки HSC/P из пациентов с лизосомной болезнью накопления, метахроматической лейкодистрофией (MLD), наследственным заболеванием, вызванным дефицитом арилсульфатазы A (ARSA), приводящей к демиелинизации нервов; и опосредованном лентивирусами переносе генов в HSC пациентов с синдром Вискотта-Олдрича (WAS) (пациентов с дефектным белком WAS, эффектором малой ГТФазы CDC42, которая регулирует функцию цитоскелета в линиях клеток крови и, таким образом, они страдают от иммунодефицита при рецидивирующих инфекциях, симптомов аутоиммунных заболеваний и тромбоцитопении с аномально мелкими и функционально неэффективными тромбоцитами, что приводит к обильному кровотечению и повышенному риску возникновения лейкоза и лимфомы). В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно MLD (недостаточность арилсульфатазы A (ARSA)) с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (недостаточность арилсульфатазы A (ARSA)) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для ARSA); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к MLD (недостаточность ARSA), и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии ARSA. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии ARSA; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно WAS с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (недостаточность белка WAS) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для белка WAS); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к WAS (дефектный белок WAS), и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии белка WAS. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии белка WAS; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier.

В одном аспекте настоящего изобретения способы и композиции, которые включают редактирование целевой последовательности нуклеиновой кислоты или модулирование экспрессии целевой последовательности нуклеиновой кислоты, и варианты их применения в связи с иммунотерапией рака понимают путем адаптации системы CRISPR-Cas по настоящему изобретению. Ссылаются на применение генной терапии в WO 2015/161276, который предусматривает способы и композиции, которые могут быть использованы для нарушения пролиферации, выживания и/или функции T-клеток в результате изменения одного или нескольких экспрессируемых T-клетками генов, например, одного или нескольких из генов FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC и/или TRBC. В связанных аспектах пролиферация T-клеток может быть нарушена при изменении одного или нескольких экспрессируемых T-клетками генов, например, гена CBLB и/или PTPN6, гена FAS и/или BID, гена CTLA4, и/или PDCDI, и/или TRAC, и/или TRBC.

T-клетки с химерным антигенным рецептором (CAR)19 характеризуются антилейкозными эффектами в злокачественных образованиях пациентов. Однако пациенты с лейкозом часто имеют недостаточно T-клеток для сбора, следовательно, лечение должно включать модифицированные T-клетки от доноров. Соответственно, существует интерес создания банка донорских T-клеток. Qasim et al. ("First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL" ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (https://ash.confex.com/ash/2015/webprogram/Paper81653.html, опубликовано онлайн в ноябре 2015 г.) описывают модификацию T-клеток с CAR19 с целью устранения риска возникновения реакции "трансплантат против хозяина" посредством нарушения экспрессии T-клеточных рецепторов и нацеливания на CD52. Кроме того, клетки с CD52 были подвергнуты нацеливанию таким образом, что они стали невосприимчивыми к алемтузумабу, и, таким образом, способствовали тому, что алемтузумаб предупреждал опосредованное хозяином отторжение T-клеток с CAR19, несоответствующих лейкоцитарным антигенам человека (HLA). Исследователи использовали самоинактивирующийся лентивирусный вектор третьего поколения, кодирующий 4g7 CAR19 (CD19 scFv-4-1BB-CD3ζ), связанный с RQR8, затем электропорировали клетки с помощью двух пар мРНК TALEN для мультиплексного нацеливания на локус константной альфа-цепи T-клеточного рецептора (TCR) и локус гена CD52. Клетки, которые по-прежнему экспрессировали TCR после ex vivo разращения, подвергали истощению в результате истощения α/β TCR CliniMacs, приводя к образованию T-клеточного продукта (UCART19) с <1% экспрессией TCR, 85% которых приходились на CAR19, а 64% стали негативными по отношению к CD52. Модифицированные T-клетки с CAR19 вводили для лечения рецидивирующего острого лимфобластного лейкоза у пациентов. Идеи, предусмотренные в данном документе, предусматривают эффективные способы модифицирования клеток, например, для удаления и модулирования CD52 или других мишеней, таким образом, их можно применять в сочетании с модификацией введения T-клеток или других клеток пациентам для лечения злокачественных новообразований.

В публикации Watts "Hematopoietic Stem Cell Expansion and Gene Therapy" Cytotherapy 13(10):1164-1171. doi:10.3109/14653249.2011.620748 (2011), включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены, так, если бы были изложены в полном объеме, обсуждается генная терапия кроветворных стволовых клеток (HSC), например, опосредованная вирусами генная терапия HSC, как весьма перспективный вариант лечения многих нарушений, в том числе гематологических состояний, типов иммунодефицита, в том числе HIV/AIDS, и других наследственных нарушений, таких как лизосомные болезни накопления, в том числе SCID-X1, ADA-SCID, β-талассемия, сцепленная с Х-хромосомой CGD, синдром Вискотта-Олдрича, анемия Фанкони, адренолейкодистрофия (ALD) и метахроматическая лейкодистрофия (MLD).

Публикации заявок на патенты США №№ 20110225664, 20110091441, 20100229252, 20090271881 и 20090222937, закрепленные за Cellectis, относятся к вариантам CREI, где по меньшей мере один из двух мономеров I-CreI имеет по меньшей мере две замены, по одной в каждом из двух функциональных субдоменов сердцевинного домена LAGLIDADG, расположенных соответственно в положениях 26-40 и 44-77 I-CreI, при этом указанный вариант способен расщеплять целевую последовательность ДНК гена гамма-цепи рецептора интерлейкина-2 человека (IL2RG), также называемого геном общей гамма-цепи рецепторов цитокинов или геном гамма-C. Целевые последовательности, указанные в публикациях заявок на патенты США №№ 20110225664, 20110091441, 20100229252, 20090271881 и 20090222937, могут быть использованы для системы нацеливания на нуклеиновую кислоту по настоящему изобретению.

Тяжелый комбинированный иммунодефицит (SCID) возникает в результате нарушения созревания T-лимфоцитов, во всех случаях ассоциированного с нарушением функционирования B-лимфоцитов (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). Общая заболеваемость по оценкам составляет 1 на 75 000 родившихся. Пациенты с нелеченым SCID подвержены множественным инфекциям, вызываемым условно-патогенными микроорганизмами, и живут, как правило, не более одного года. SCID можно лечить путем аллогенного переноса кроветворных стволовых клеток от донора-родственника. Степень гистосовместимости с донором может варьировать в широких пределах. В случае аденозиндезаминазной (ADA) недостаточности, одной из форм SCID, пациентов можно лечить с помощью инъекции рекомбинантного фермента аденозиндезаминазы.

Поскольку было показано, что ген ADA у пациентов с SCID является мутированным (Giblett et al., Lancet, 1972, 2, 1067-1069), были идентифицированы некоторые другие гены, вовлеченные в SCID (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). Существуют четыре основные причины SCID. (i) Наиболее часто встречающуюся форму SCID, SCID-X1 (SCID, сцепленный с X-хромосомой, или X-SCID), вызывает мутация в гене IL2RG, которая приводит к отсутствию зрелых T-лимфоцитов и NK-клеток. IL2RG кодирует белок гамма-C (Noguchi, et al., Cell, 1993, 73, 147-157), общий компонент по меньшей мере пяти рецепторных комплексов интерлейкинов. Данные рецепторы активируют несколько мишеней с помощью киназы JAK3 (Macchi et al., Nature, 1995, 377, 65-68), инактивация которой приводит к возникновению того же синдрома, что и инактивация гамма-C. (ii) Мутация в гене ADA приводит к нарушению метаболизма пуринов, вызывающему гибель предшественников лимфоцитов, что, в свою очередь, приводит к кажущемуся отсутствию B-, T- и NK-клеток. (iii) V(D)J-рекомбинация является существенным этапом созревания иммуноглобулинов и рецепторов T-лимфоцитов (TCR). Мутации в генах, активирующих рекомбинацию, 1 и 2 (RAG1 и RAG2) и Artemis, трех генах, участвующих в этом процессе, приводят к отсутствию зрелых T- и B-лимфоцитов. (iv) Также сообщали о мутациях в других генах, таких как CD45, участвующих в специфичной передаче сигналов в T-клетках, хотя они представляют меньшинство случаев (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). С тех пор, как были идентифицированы их генетические основы, различные формы SCID стали модельными для подходов к генной терапии (Fischer et al., Immunol. Rev., 2005, 203, 98-109) по двум основным причинам. Во-первых, как и при всех заболеваниях крови, может быть предусмотрено лечение ex vivo. Можно выделить гемопоэтические стволовые клетки (HSC) из костного мозга и сохранять их свойства плюрипотентности в течение нескольких клеточных делений. Таким образом, их можно обрабатывать in vitro, а затем повторно инъецировать пациенту, где они повторно заселяют костный мозг. Во-вторых, поскольку созревание лимфоцитов у пациентов с SCID ухудшено, скорректированные клетки имеют селективное преимущество. Таким образом, небольшое количество скорректированных клеток может восстановить функционирование иммунной системы. Данную гипотезу подтверждали несколько раз (i) частичным восстановлением иммунных функций, связанным с реверсией мутаций у пациентов с SCID (Hirschhorn et al., Nat. Genet., 1996, 13, 290-295; Stephan et al., N. Engl. J. Med., 1996, 335, 1563-1567; Bousso et al., Proc. Natl., Acad. Sci. USA, 2000, 97, 274-278; Wada et al., Proc. Natl. Acad. Sci. USA, 2001, 98, 8697-8702; Nishikomori et al., Blood, 2004, 103, 4565-4572), (ii) коррекцией форм недостаточности SCID-X1 in vitro в гемапоэтических клетках (Candotti et al., Blood, 1996, 87, 3097-3102; Cavazzana-Calvo et al., Blood, 1996, Blood, 88, 3901-3909; Taylor et al., Blood, 1996, 87, 3103-3107; Hacein-Bey et al., Blood, 1998, 92, 4090-4097), (iii) коррекцией SCID-X1 (Soudais et al., Blood, 2000, 95, 3071-3077; Tsai et al., Blood, 2002, 100, 72-79), JAK-3 (Bunting et al., Nat. Med., 1998, 4, 58-64; Bunting et al., Hum. Gene Ther., 2000, 11, 2353-2364) и RAG2 (Yates et al., Blood, 2002, 100, 3942-3949) in vivo в животных моделях и (iv) результатом клинических испытаний генной терапии (Cavazzana-Calvo et al., Science, 2000, 288, 669-672; Aiuti et al., Nat. Med., 2002; 8, 423-425; Gaspar et al., Lancet, 2004, 364, 2181-2187).

Публикация заявки на патент США № 20110182867, закрепленная за Children's Medical Center Corporation и президентом и членами управляющего совета Гарвардского университета, относится к способам модулирования экспрессии фетального гемоглобина (HbF) и ее применениям в гемопоэтических клетках-предшественниках с помощью ингибиторов экспрессии или активности BCL11A, таких как средства для RNAi и антитела. Мишени, раскрытые в публикации заявки на патент США № 20110182867, такие как BCL11A, могут быть подвергнуты нацеливанию с помощью системы CRISPR Cas9 по настоящему изобретению для модулирования экспрессии фетального гемоглобина. См. также Bauer et al. (Science 11 October 2013: Vol. 342 no. 6155 pp. 253-257) и Xu et al. (Science 18 November 2011: Vol. 334 no. 6058, pp. 993-996) в отношении дополнительных мишеней BCL11A.

При наличии знаний в данной области и идей настоящего изобретения специалист в данной области может корректировать HSC по отношению к наследственному гематологическому нарушению, например, β-талассемии, гемофилии или генетической лизосомной болезни накопления.

Лечение заболеваний мозга, центральной нервной системы и иммунной системы

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas в головной мозг или нейроны. Например, РНК-интерференция (RNAi) предоставляет терапевтические возможности для лечения этого нарушения посредством уменьшения экспрессии HTT, гена, приводящего к развитию болезни Гентингтона (см., например, McBride et al., Molecular Therapy vol. 19 no. 12 Dec. 2011, pp. 2152-2162), следовательно, автор настоящего изобретения предполагает, что ее можно использовать с системой CRISPR-Cas и/или приспособить к ней. Систему CRISPR-Cas можно получить с использованием алгоритма для уменьшения возможности нецелевого воздействия антисмысловых последовательностей. Последовательности CRISPR-Cas могут целенаправленно воздействовать на последовательность в экзоне 52 гентингтина мыши, макака-резуса или человека и экспрессироваться вирусным вектором, например, на основе AAV. Животным, в том числе человеку, можно вводить путем приблизительно трех микроинъекций на полушарие (всего шесть инъекций): первая на 1 мм рострально от передней спайки (12 мкл) и две оставшиеся инъекции (12 мкл и 10 мкл соответственно) на расстоянии 3 и 6 мм каудально по отношению к первой инъекции, причем с 1e12 vg/мл AAV при скорости приблизительно 1 мкл/минута, при этом иглу оставляли на месте в течение дополнительных 5 минут для обеспечения диффузии вводимого вещества с наконечника иглы.

DiFiglia et al. (PNAS, October 23, 2007, vol. 104, no. 43, 17204-17209) наблюдали, что однократное введение в полосатое тело взрослого организма siRNA, целенаправленно воздействующей на Htt, может привести к сайленсингу мутированного Htt, ослаблению нейрональной патологии и задержке развития аномального поведенческого фенотипа, наблюдаемого в модели HD на трансгенных мышах, полученной с использованием вируса, с быстрым началом проявления. DiFiglia инъецировал мышам в полосатое тело 2 мкл Cy3-меченых cc-siRNA-Htt или неконъюгированных siRNA-Htt при 10 мкМ. Аналогичная доза CRISPR-Cas, нацеленной на Htt, может быть предусмотрена в настоящем изобретении для человека, например, приблизительно 5-10 мл 10 мкМ CRISPR-Cas, нацеленной на Htt, можно инъецировать в полосатое тело.

В другом примере Boudreau et al. (Molecular Therapy vol. 17 no. 6 june 2009) инъецировали в полосатое тело 5 мкл векторов на основе рекомбинантного AAV серотипа 2/1, экспрессирующих htt-специфичный вирус для RNAi (при 4 x 1012 вирусных геномов/мл). Аналогичная доза CRISPR-Cas, нацеленной на Htt, может быть предусмотрена в настоящем изобретении для человека, например, приблизительно 10-20 мл 4 x 1012 вирусных геномов/мл, причем CRISPR-Cas, нацеленную на Htt, можно инъецировать в полосатое тело.

В другом примере CRISPR-Cas, нацеленную на HTT, можно вводить непрерывно (см., например, Yu et al., Cell 150, 895-908, August 31, 2012). Yu et al. использовали доставку с помощью осмотических насосов, обеспечивающих скорость 0,25 мл/ч (модель 2004), для доставки 300 мг/день ss-siRNA или фосфатно-солевого буферного раствора (PBS) (Sigma Aldrich) в течение 28 дней и насосы, выполненные с возможностью доставки 0,5 мкл/ч (модель 2002), использовали для доставки 75 мг/день MOE ASO положительного контроля в течение 14 дней. Насосы (Durect Corporation) заполняли ss-siRNA или MOE, разведенным стерильным PBS, а затем инкубировали при 37 C в течение 24 или 48 (Model 2004) часов перед имплантацией. Мышей анестезировали 2,5% изофлураном и делали срединный разрез у основания черепа. Используя стереотаксические зонды имплантировали канюлю в боковой правый желудочек и закрепляли с помощью клея Loctite. Катетер, прикрепленный к осмотическому мининасосу Alzet, прикрепляли к канюле, и насос размещали подкожно между лопатками. Разрез закрывали швами, используя нейлон 5,0. Аналогичная доза CRISPR-Cas, целенаправленно воздействующей на Htt, может предусматриваться в настоящем изобретении для человека, например, можно вводить от приблизительно 500 до 1000 г/день CRISPR-Cas, целенаправленно воздействующей на Htt.

В другом примере непрерывной инфузии Stiles et al (Experimental Neurology 233 (2012) 463-471) имплантировали интрапаренхиматозный катетер с титановым наконечником иглы в правую скорлупу. Катетер подсоединяли к насосу SynchroMed® II (Medtronic Neurological, Миннеаполис, Миннесота), подкожно имплантированному в области живота. После 7 дней инфузии фосфатно-солевого буферного раствора при 6 мкл/день насосы повторно заполняли исследуемым препаратом и программировали на непрерывную доставку в течение 7 дней. От приблизительно 2,3 до 11,52 мг/день siRNA вводили путем инфузии при различных значениях скорости инфузии от приблизительно 0,1 до 0,5 мкл/мин. Аналогичная доза CRISPR-Cas, целенаправленно воздействующей на Htt, может предусматриваться в настоящем изобретении для человека, например, можно вводить от приблизительно 20 до 200 мг/день CRISPR-Cas, целенаправленно воздействующей на Htt. В другом примере способы согласно публикации патентного документа США № 20130253040 (WO2013130824), закрепленной за Sangamo, также можно адаптировать от TALES к системе CRISPR-Cas согласно настоящему изобретению для лечения болезни Гентингтона. WO2015089354 A1 от имени The Broad Institute (института Броада) et al., включенный в данном документ посредством ссылки, описывает мишени для болезни Гентингтона (HP). При болезни Гентингтона потенциальные гены-мишени для комплекса CRISPR: PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4 и TGM2.

Соответственно, один или более из PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4 и TGM2 могут быть выбраны в качестве мишеней для болезни Гентингтона в некоторых вариантах осуществления по настоящему изобретению.

Другие нарушения тринуклеотидных повторов. Они могут включать любое из следующего. Категория I включает болезнь Гентингтона (HD) и спиноцеребеллярные атаксии; экспансии категории II являются фенотипически разнообразными с гетерогенными экспансиями, которые, как правило, являются небольшими по величине, но также встречаются в экзонах генов; и категория III включает синдром ломкой X-хромосомы, миотоническую дистрофию, две из спиноцеребеллярных атаксий, ювенильную миоклонус-эпилепсию и атаксию Фридрейха.

Дополнительный аспект настоящего изобретения относится к использованию системы CRISPR-Cas для корригирования дефектов в генах EMP2A и EMP2B, которые, как было обнаружено, ассоциированы с болезнью Лафора. Болезнь Лафора представляет собой аутосомно-рецессивное состояние, которое характеризуется прогрессирующей миоклонус-эпилепсией, которая может начинаться в виде эпилептических приступов в подростковом возрасте. Некоторые случаи заболевания могут быть вызваны мутациями в генах, которые уже были идентифицированы. Заболевание вызывает приступы, мышечные спазмы, затрудненную ходьбу, слабоумие и в конечном итоге смерть. В настоящее время не существует терапии, которая показала эффективность при прогрессировании заболевания. На другие генетические расстройства, ассоциированные с эпилепсией, также можно целенаправленно воздействовать с помощью системы CRISPR-Cas, и лежащие в основе генетические механизмы дополнительно описаны в Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009).

Способы согласно публикации патентного документа США № 20110158957, закрепленного за Sangamo BioSciences, Inc., связанные с инактивацией генов T-клеточного рецептора (TCR), также можно модифицировать для применения с системой CRISPR-Cas согласно настоящему изобретению. В другом примере способы согласно публикации заявки на патент США № 20100311124, закрепленной за Sangamo BioSciences, Inc., и публикации заявки на патент США № 20110225664, закрепленной за Cellectis, оба из которых связаны с инактивацией экспрессии гена глутаминсинтетазы, также можно модифицировать для применения с системой CRISPR-Cas согласно настоящему изобретению.

Лечение заболеваний, связанных со слухом

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas в одно ухо или оба уха.

Исследователи рассматривают вопрос о том, можно ли применять генную терапию для содействия существующим способам лечения глухоты - а именно, применению кохлеарных имплантатов. Глухоту часто вызывают утрата или повреждение волосковых клеток, которые не могут передавать сигналы слуховым нейронам. В таких случаях можно применять кохлеарные имплантаты для обеспечения реакции на звук и передачи электрических сигналов нервным клеткам. Однако эти нейроны часто дегенерируют и подвергаются ретракции отростков в улитке, поскольку пораженные волосковые клетки высвобождают меньше факторов роста.

В заявке на патент США 20120328580 описана инъекция фармацевтической композиции в ухо (например, путем ушного введения), как, например, в просветы улитки (например, в проток улитки, лестницу преддверия и барабанную лестницу улитки), например, с помощью шприца, например, шприца c однократной дозой. Например, одно или несколько соединений, описанных в данном документе, можно вводить путем интратимпанальной инъекции (например, в среднее ухо) и/или инъекций в наружное, среднее и/или внутреннее ухо. Такие способы регулярно применяются в данной области, например, для введения стероидов и антибиотиков в уши людей. Инъекцию можно осуществлять, например, через круглое окно уха или через капсулу улитки. Из уровня техники известны и другие способы введения во внутреннее ухо (см., например, Salt and Plontke, Drug Discovery Today, 10:1299-1306, 2005).

В другом способе введения фармацевтическую композицию можно вводить in situ с помощью катетера или насоса. Катетер или насос могут, например, направлять фармацевтическую композицию в просветы улитки, или круглое окно уха, и/или просвет толстой кишки. Иллюстративный аппарат для доставки лекарственных средств и способы, подходящие для введения одного или нескольких соединений, описанных в данном документе, в ухо, например, в ухо человека, описаны McKenna et al. (публикация заявки на патент США № 2006/0030837) и Jacobsen et al. (патент США № 7206639). В некоторых вариантах осуществления катетер или насос могут быть расположены, например, в ухе (например, в наружном, среднем и/или внутреннем ухе) пациента во время хирургического вмешательства. В некоторых вариантах осуществления катетер или насос могут быть расположены, например, в ухе (например, в наружном, среднем и/или внутреннем ухе) пациента без необходимости в хирургическом вмешательстве.

Альтернативно или в дополнение, одно или несколько соединений, описанных в данном документе, можно вводить в сочетании с механическим устройством, таким как кохлеарный имплантат или слуховой аппарат, которое носят в наружном ухе. Иллюстративный кохлеарный имплантат, подходящий для применения в настоящем изобретении, описан Edge et al. (публикация заявки на патент США № 2007/0093878).

В некоторых вариантах осуществления способы введения, описанные выше, можно комбинировать в любом порядке и можно применять одновременно или попеременно.

Альтернативно или в дополнение, настоящее изобретение можно применять согласно любому из способов, одобренных Управлением по контролю качества пищевых продуктов и лекарственных средств, например, описанных в справочнике стандартов CDER, версия номер 004 (доступном по адресу fda.give/cder/dsm/DRG/drg00301.htm).

В целом, способы клеточной терапии, описанные в заявке на патент США 20120328580, можно применять для стимуляции полной или частичной дифференцировки клеток в определенный тип зрелых клеток внутреннего уха (например, в волосковые клетки) или в его направлении in vitro. Клетки, полученные в результате осуществления таких способов, можно затем трансплантировать или имплантировать пациенту, нуждающемуся в таком лечении. Способы культивирования клеток, необходимые для осуществления на практике этих способов, включающие способы идентификации и отбора подходящих типов клеток, способы стимуляции полной или частичной дифференцировки выбранных клеток, способы идентификации полностью или частично дифференцированных типов клеток и способы имплантации полностью или частично дифференцированных клеток, описаны ниже.

Клетки, подходящие для применения в настоящем изобретении, включают без ограничения клетки, способные к полной или частичной дифференцировке в зрелые клетки внутреннего уха, например, в волосковые клетки (например, внутренние и/или наружные волосковые клетки), при контакте, например, in vitro, с одним или несколькими соединениями, описанными в данном документе. Иллюстративные клетки, способные к дифференцировке в волосковые клетки, включают без ограничения стволовые клетки (например, стволовые клетки внутреннего уха, взрослые стволовые клетки, стволовые клетки, полученные из костного мозга, эмбриональные стволовые клетки, мезенхимальные стволовые клетки, стволовые клетки кожи, iPS-клетки и стволовые клетки, полученные из жировой ткани), клетки-предшественники (например, клетки-предшественники внутреннего уха), поддерживающие клетки (например, клетки Дейтерса, столбовые клетки, внутренние фаланговые клетки, тектальные клетки и клетки Гензена) и/или зародышевые клетки. Применение стволовых клеток для замещения чувствительных клеток внутреннего уха описано Li et al. (публикация заявки на патент США № 2005/0287127) и Li et al. (патент США с регистрационным № 11/953797). Применение стволовых клеток, полученных из костного мозга, для замещения чувствительных клеток внутреннего уха описано Edge et al. в PCT/US2007/084654. iPS-клетки описаны, например, в Takahashi et al., Cell, Volume 131, Issue 5, Pages 861-872 (2007); Takahashi and Yamanaka, Cell 126, 663-76 (2006); Okita et al., Nature 448, 260-262 (2007); Yu, J. et al., Science 318(5858):1917-1920 (2007); Nakagawa et al., Nat. Biotechnol. 26:101-106 (2008); и Zaehres and Scholer, Cell 131(5):834-835 (2007). Такие подходящие клетки можно идентифицировать путем анализа (например, качественного или количественного) наличия одного или нескольких тканеспецифичных генов. Например, экспрессию гена можно выявить путем выявления белкового продукта одного или нескольких тканеспецифичных генов. Методики выявления белков включают окрашивание белков (например, с использованием клеточных экстрактов или цельных клеток) с помощью антител к соответствующему антигену. В данном случае соответствующий антиген является белковым продуктом экспрессии тканеспецифичного гена. Хотя, в принципе, меченым может быть первое антитело (т.е. антитело, связывающее антиген), более распространенным (и улучшающим визуализацию) является применение второго антитела, направленного против первого (например, антитела к IgG). Данное второе антитело конъюгируют с флуорохромами, или соответствующими ферментами для колориметрических реакций, или гранулами золота (для электронной микроскопии), или с системой биотин-авидин, так что можно определить местоположение первичного антитела и, следовательно, антигена.

Молекулы CRISPR-Cas по настоящему изобретению можно доставлять в ухо путем непосредственного нанесения фармацевтической композиции на наружное ухо с применением модифицированных композиций из опубликованной заявки на патент США 20110142917. В некоторых вариантах осуществления фармацевтическую композицию вносят в наружный слуховой проход. Доставка в ухо может также называться внутриушной или ушной доставкой.

В некоторых вариантах осуществления молекулы РНК по настоящему изобретению доставляют в липосомных составах или составах на основе Lipofectin и им подобных, и их можно получить с помощью способов, хорошо известных специалистам в данной области. Такие способы описаны, например, в патентах США №№ 5593972, 5589466 и 5580859, включенных в данный документ посредством ссылки.

Были разработаны системы доставки, специально предназначенные для повышения эффективности и улучшения доставки siRNA в клетки млекопитающих (см., например, Shen et al., FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 и Simeoni et al., NAR 2003, 31, 11: 2717-2724), и их можно применять в настоящем изобретении. Недавно siRNA успешно применяли для ингибирования экспрессии генов у приматов (см., например, Tolentino et al., Retina 24(4):660, которая также может быть применена по отношению к настоящему изобретению).

Qi et al. раскрывают способы эффективного введения siRNA во внутреннее ухо через неповрежденное круглое окно путем трансфекции с помощью новой технологии доставки протеидов, которая может быть применена по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению (см., например, Qi et al., Gene Therapy (2013), 1-9). В частности, успешным было применение доменов TAT, связывающих двухнитевую РНК (TAT-DRBD), с помощью которых можно трансфицировать меченную Cy3 siRNA в клетки внутреннего уха, в том числе внутренние и наружные волосковые клетки, ампулярный гребешок, пятно эллиптического мешочка и пятно сферического мешочка, посредством проникновения через неповрежденное круглое окно, для доставки двухнитевых siRNA in vivo для лечения различных болезней внутреннего уха и сохранения слуховой функции. Приблизительно 40 мкл 10 мМ РНК может быть предусмотрено в качестве дозы для введения в ухо.

В соответствии с Rejali et al. (Hear Res. 2007 Jun;228(1-2):180-7), функционирование кохлеарных имплантатов можно улучшить путем надлежащего сохранения нейронов спирального ганглия, которые являются мишенью для электростимуляции имплантатом, и ранее было показано, что нейротрофический фактор головного мозга (BDNF) повышает выживаемость спирального ганглия в ушах с экспериментально индуцированной глухотой. Rejali et al. тестировали модифицированную конструкцию электрода кохлеарного имплантата, имеющего покрытие из клеток-фибробластов, трансдуцированных вирусным вектором со вставкой гена BDNF. Для осуществления данного типа переноса генов ex vivo Rejali et al. трансдуцировали фибробласты морской свинки аденовирусом со вставкой кассеты с геном BDNF, и определили, что эти клетки секретируют BDNF, а затем прикрепили клетки, секретирующие BDNF, к электроду кохлеарного имплантата с помощью агарозного геля и имплантировали электрод в барабанную лестницу улитки. Rejali et al. определили, что электроды с экспрессией BDNF были способны обеспечивать сохранение значительно большего количества нейронов спирального ганглия в базальных витках улитки через 48 дней после имплантации по сравнению с контрольными электродами и демонстрировали возможность осуществления терапии с применением кохлеарных имплантатов в комбинации с переносом генов ex vivo для повышения выживаемости нейронов спирального ганглия. Такую систему можно применять для доставки системы нацеливания на нуклеиновую кислоту по настоящему изобретению в ухо.

Mukherjea et al. (Antioxidants & Redox Signaling, Volume 13, Number 5, 2010) документально подтверждают, что нокдаун NOX3 с помощью короткой интерферирующей (si) РНК нейтрализовал ототоксичность цисплатина, о чем свидетельствует защита OHC от повреждения и снижение величин сдвига порогов слуховых вызванных потенциалов ствола мозга (ABR). Крысам вводили различные дозы siNOX3 (0,3, 0,6 и 0,9 мкг) и экспрессию NOX3 оценивали с помощью RT-PCR в режиме реального времени. Наименьшая применяемая доза siRNA для NOX3 (0,3 мкг) не демонстрировала какого-либо ингибирования мРНК NOX3 по сравнению с транстимпанальным введением скремблированной siRNA или отсутствием обработки улиток. Однако введение более высоких доз siRNA для NOX3 (0,6 и 0,9 мкг) снижало экспрессию NOX3 по сравнению с контрольной скремблированной siRNA. Такую систему можно применять для транстимпанального введения системы CRISPR-Cas по настоящему изобретению в дозе от приблизительно 2 мг до приблизительно 4 мг CRISPR-Cas для введения человеку.

Jung et al. (Molecular Therapy, vol. 21 no. 4, 834-841 apr. 2013) демонстрируют, что уровни Hes5 в эллиптическом мешочке снижались после внесения siRNA и что количество волосковых клеток в этих эллиптических мешочках было значительно большим, чем после контрольной обработки. Данные позволяют предположить, что технология siRNA может быть применимой для индукции восстановления и регенерации во внутреннем ухе и что сигнальный путь Notch является потенциально применимой мишенью для ингибирования экспрессии конкретного гена. Jung et al. инъецировали 8 мкг siRNA для Hes5 в объеме 2 мкл, полученном путем добавления стерильного нормального физиологического раствора к лиофилизированной siRNA, в вестибулярный эпителий уха. Такую систему можно применять для введения системы, нацеленной на нуклеиновую кислоту, по настоящему изобретению в вестибулярный эпителий уха в дозе от приблизительно 1 до приблизительно 30 мг CRISPR-Cas для введения человеку.

Лечение заболеваний глаза

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas9 в один глаз или оба глаза.

В еще одном аспекте настоящего изобретения систему CRISPR-Cas9 можно использовать для коррекции дефектов глаз, которые являются результатом нескольких генетических мутаций, дополнительно описанных в Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.

Для введения в глаз особенно предпочтительными являются лентивирусные векторы, в частности, вирусы инфекционной анемии лошадей (EIAV).

В другом варианте осуществления также предусмотрены минимальные лентивирусные векторы для отличных от приматов организмов на основе вируса инфекционной анемии лошадей (EIAV), особенно для генной терапии заболеваний глаз (см., например, Balagaan, J Gene Med 2006; 8: 275 - 285, опубликовано онлайн 21 ноября 2005 г. в Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845). Предусмотрено, что векторы имеют промотор цитомегаловируса (CMV), управляющий экспрессией целевого гена. Также предусмотрена любая из внутрикамерной, субретинальной, внутриглазной и интравитреальной инъекций (см., например, Balagaan, J Gene Med 2006; 8: 275 - 285, опубликовано онлайн 21 ноября 2005 г. в Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845). Внутриглазные инъекции можно осуществлять с помощью операционного микроскопа. В случае субретинальной и интравитреальной инъекций можно выпятить глаза путем осторожного надавливания пальцами и визуализировать глазное дно с помощью системы контактных линз, состоящей из капли раствора контактной среды на роговице, накрытой покровным стеклом для микропрепаратов. При субретинальных инъекциях наконечник иглы 34 калибра на 10 мм, закрепленной на 5-мкл шприце Hamilton, можно при непосредственной визуализации продвигать через экваториальную область верхней части склеры тангенциально к заднему полюсу глазного яблока, пока в субретинальном пространстве не будет видна апертура иглы. Затем можно инъецировать 2 мкл суспензии вектора, вызывая буллезное верхнее отслоение сетчатки, что, таким образом, подтверждает субретинальное введение вектора. В данном подходе производят самогерметизирующийся разрез склеры, позволяющий суспензии вектора удерживаться в субретинальном пространстве до поглощения ее RPE, обычно в течение 48 ч. после процедуры. Эту процедуру можно повторить в нижнем полушарии, вызывая нижнее отслоение сетчатки. Данная методика обуславливает воздействие суспензии вектора на приблизительно 70% нейросенсорной части сетчатки и RPE. В случае интравитреальных инъекций можно продвигать наконечник иглы через склеру на 1 мм кзади от корнеосклерального лимба и инъецировать 2 мкл суспензии вектора в полость стекловидного тела. В случае внутрикамерных инъекций можно продвигать наконечник иглы через парацентез корнеосклерального лимба в направлении центральной части роговицы и можно инъецировать 2 мкл суспензии вектора. В случае внутрикамерных инъекций можно продвигать наконечник иглы через парацентез корнеосклерального лимба в направлении центральной части роговицы и можно инъецировать 2 мкл суспензии вектора. Эти векторы можно инъецировать в титрах 1,0-1,4 × 1010 или 1,0-1,4 × 109 трансдуцирующих единиц (ТЕ)/мл.

В другом варианте осуществления также предусмотрен RetinoStat®, лентивирусный вектор на основе вируса инфекционной анемии лошадей для генной терапии, экспрессирующий ангиостатические белки эндостатин и ангиостатин, который доставляют посредством субретинальной инъекции для лечения влажной формы возрастной дегенерации желтого пятна (см., например, Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)). Такой вектор может быть модифицирован для системы CRISPR-Cas9 по настоящему изобретению. Каждый глаз можно обрабатывать любым RetinoStat® в дозе, составляющей 1,1 x 105 трансдуцирующих единиц на глаз (ТЕ/глаз), в общем объеме 100 мкл.

В одном варианте осуществления следует упомянуть WO 2015/153780, который предусматривает лечение или предупреждение первичной остроугольной глаукомы (POAG) с помощью нацеливания на кодирующую последовательность гена MYOC. Некоторые из целевых мутаций, которые приводят к POAG, включают без ограничения P370 (например, P370L); I477 (например, I477N или I477S); T377 (например, TE77R); Q368 (Q368stop) -- все в гене MYOC. Целевая мутация также может включать горячую точку мутагенеза между положениями аминокислотных последовательностей 246-252 в гене MYOC. В одном варианте осуществления целевая мутация представляет собой горячую точку мутагенеза между положениями аминокислотных последовательностей, например, аминокислотами 368-380, аминокислотами 368-370 + 377-380, аминокислотами 364-380 или аминокислотами 347-380 в гене MYOC. В одном варианте осуществления целевая мутация представляет собой горячую точку мутагенеза между положениями аминокислотных последовательностей 423-437 (например, аминокислотами 423-426, аминокислотами 423-427 и аминокислотами 423-437) в гене MYOC. В одном варианте осуществления целевая мутация представляет собой горячую точку мутагенеза между положениями аминокислотных последовательностей 477-502 в гене MYOC (см., например, WO 2015/153780).

В другом варианте осуществления может быть предусмотрен аденовирусный вектор с делецией E1 и частичной делецией E3 и E4 для доставки в глаз. Двадцать восемь пациентов с неоваскулярной возрастной дегенерацией желтого пятна на поздней стадии (AMD) получали однократную интравитреальную инъекцию аденовирусного вектора с делецией E1 и частичной делецией E3 и E4, экспрессирующего фактор пигментного эпителия человека (AdPEDF.ll) (см., например, Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)). Исследовали дозы, варьирующие в диапазоне от 106 до 109,5 единичных частиц (PU), и не наблюдали серьезных нежелательных событий, связанных с AdPEDF.ll, и дозолимитирующей токсичности (см., например, Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)). Опосредованный аденовирусными векторами перенос генов в глаза, по-видимому, является действенным подходом для лечения нарушений со стороны органов зрения и может быть применен по отношению к системе CRISPR Cas9.

В другом варианте осуществления систему sd-rxRNA® от RXi Pharmaceuticals можно применять для доставки CRISPR Cas9 в глаз и/или приспосабливать к ней. В этой системе однократное интравитреальное введение 3 мкг sd-rxRNA приводит к специфичному относительно последовательности снижению уровней мРНК PPIB в течение 14 дней. Систему sd-rxRNA® можно применять по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению, предусматривая введение человеку дозы CRISPR, составляющей приблизительно 3-20 мг.

Millington-Ward et al. (Molecular Therapy, vol. 19 no. 4, 642-649 apr. 2011) описывают векторы на основе аденоассоциированного вируса (AAV) для доставки супрессора родопсина, функционирующего на основе РНК-интерференции (RNAi), и замещающего гена родопсина с модифицированными кодонами, устойчивого к супрессии в связи с нуклеотидными изменениями в вырожденных положениях в целевом сайте для RNAi. Осуществляли субретинальную инъекцию либо 6,0 x 108 vp, либо 1,8 x 1010 vp AAV в глаза согласно Millington-Ward et al. Векторы на основе AAV согласно Millington-Ward et al. можно применять в отношении системы CRISPR Cas9 по настоящему изобретению, предусматривая введение человеку дозы от приблизительно 2 x 1011 до приблизительно 6 x 1013 vp.

Dalkara et al. (Sci Transl Med 5, 189ra76 (2013)) также обращаются к направленной эволюции in vivo для конструирования вектора на основе AAV, доставляющего варианты дефектных генов дикого типа по всей сетчатке после безвредной инъекции в жидкую часть стекловидного тела глаза. Dalkara описывает дисплейную библиотеку 7-мерных пептидов и библиотеку AAV, сконструированную посредством ДНК-шаффлинга генов cap AAV1, 2, 4, 5, 6, 8 и 9. Упаковывали библиотеки rcAAV и векторы на основе rAAV, экспрессирующие GFP под контролем промотора CAG или Rho, и с помощью количественной ПЦР получали титры геномов, устойчивых к действию дезоксирибонуклеаз. Библиотеки объединяли, и проводили два цикла эволюции, каждый из которых состоял из диверсификации исходной библиотеки с последующими тремя этапами отбора in vivo. На каждом таком этапе мышам P30, экспрессирующим rho-GFP, интравитреально инъецировали 2 мл очищенной йодиксанолом и подвергнутой диализу против фосфатно-солевого буфера (PBS) библиотеки с титром геномов приблизительно 1 × 1012 vg/мл. Векторы на основе AAV согласно Dalkara et al. можно применять по отношению системы нацеливания на нуклеиновые кислоты по настоящему изобретению, предусматривая введение человеку дозы, составляющей от приблизительно 1 x 1015 до приблизительно 1 x 1016 vg/мл.

В другом варианте осуществления можно нацеливаться на ген родопсина для лечения пигментного ретинита (RP), где систему согласно публикации заявки на патент США № 20120204282, закрепленной за Sangamo BioSciences, Inc., можно модифицировать по образу системы CRISPR Cas9 по настоящему изобретению.

В другом варианте осуществления способы согласно публикации заявки на патент США № 20130183282, закрепленной за Cellectis, направленной на способы расщепления целевой последовательности гена родопсина человека, можно также модифицировать для системы нацеливания на нуклеиновую кислоту по настоящему изобретению.

Публикация заявки на патент США № 20130202678, закрепленная за Academia Sinica, относится к способам лечения форм ретинопатии и офтальмологических нарушений с угрозой потери зрения, относящимся к доставке гена Puf-A (экспрессируемого в ганглиозных и пигментных клетках сетчатки в тканях глаза и проявляющего уникальную антиапоптотическую активность) в субретинальное или интравитреальное пространство глаза. В частности, желаемые мишени представляют собой zgc:193933, prdm1a, spata2, tex10, rbb4, ddx3, zp2.2, Blimp-1 и HtrA2, на все из которых можно нацеливаться с помощью системы нацеливания на нуклеиновую кислоту по настоящему изобретению.

Wu (Cell Stem Cell,13:659-62, 2013) разработал направляющую РНК, которая нацеливает Cas9 на местоположение мутации в одной паре оснований, вызывающей формы катаракты у мышей, где он индуцирует расщепление ДНК. Затем с помощью другого аллеля дикого типа или олигонуклеотидов, вводимых в зиготы, механизмы репарации корректируют последовательность поврежденного аллеля и корректируют генетический дефект, вызывающий катаракту, у мутантной мыши.

В публикации заявки на патент США № 20120159653 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с дегенерацией желтого пятна (MD). Дегенерация желтого пятна (MD) является основной причиной ухудшения зрения у лиц пожилого возраста, однако также является характерным симптомом детских заболеваний, таких как болезнь Штаргардта, дистрофия глазного дна Сорсби и летальные детские нейродегенеративные заболевания, при этом начало заболеваний проявляется уже в младенческом возрасте. Дегенерация желтого пятна приводит к потере зрения в центре поля зрения (желтом пятне) по причине поражения сетчатки. Существующие в настоящее время животные модели не воспроизводят основные отличительные признаки заболевания, как это наблюдается у людей. В доступных животных моделях, содержащих мутантные гены, кодирующие белки, ассоциированные с MD, также получают крайне изменчивые фенотипы, переходя к проблематике заболевания человека и разработке способов терапии.

Один аспект публикации заявки на патент США № 20120159653 относится к редактированию любых хромосомных последовательностей, которые кодируют белки, ассоциированные с MD, что можно применять в отношении системы нацеливания на нуклеиновую кислоту по настоящему изобретению. Белки, ассоциированные с MD, как правило, выбирают, исходя из экспериментально установленной взаимосвязи белка, ассоциированного с MD, при нарушении MD. Например, скорость образования или циркулирующая концентрация белка, связанного с MD, может быть повышенной или пониженной в популяции с нарушением с MD по сравнению с популяцией без нарушения с MD. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с MD, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

В качестве неограничивающего примера белки, ассоциированные с MD, включают без ограничения следующие белки: представитель 4 (ABCA4) подсемейства A (ABC1) АТФ-связывающей кассеты, ACHM1 - белок 1, ассоциированный с ахроматопсией (палочковым монохроматизмом), ApoE - аполипопротеин E (ApoE), C1QTNF5 (CTRP5) - C1q/белок 5, родственный фактору некроза опухолей (C1QTNF5), C2 - компонент 2 системы комплемента (C2), компонент C3 системы комплемента (C3), CCL2 - хемокиновый лиганд 2 (с мотивом C-C) (CCL2), CCR2 - рецептор хемокина 2 (с мотивом C-C) (CCR2), CD36 - кластер дифференцировки 36, CFB - фактор B системы комплемента, CFH - фактор H системы комплемента (CFH), CFHR1 - белок 1, родственный фактору H системы комплемента, CFHR3 - белок 3, родственный фактору H системы комплемента, CNGB3 - бета-3-субъединица ионного канала, регулируемого циклическими нуклеотидами, CP - церулоплазмин (CP), CRP - C-реактивный белок (CRP) CST3 - цистатин C или цистатин 3 (CST3), CTSD - катепсин D (CTSD), CX3CR1 - рецептор хемокина 1 (с мотивом C-X3-C), ELOVL4 - белок 4, отвечающий за удлинение жирных кислот с очень длинной цепью, ERCC6 - белок эксцизионной репарации, вступающий в перекрестную комплементацию, корректирующий дефицит репарации у грызунов, комплементационная группа 6, FBLN5 - фибулин-5, FBLN5 - фибулин 5, FBLN6 - фибулин 6, FSCN2 - фасцин (FSCN2), HMCN1 - гемицентрин 1, HMCN1 - гемицентрин 1, HTRA1 - сериновая пептидаза HtrA 1 (HTRA1), HTRA1 - сериновая пептидаза HtrA 1, IL-6 - интерлейкин 6, IL-8 - интерлейкин 8, LOC387715 - гипотетический белок, PLEKHA1 - белок, содержащий плекстрин-гомологичный домен, представитель 1 семейства A (PLEKHA1), PROM1 - проминин 1 (PROM1 или CD133), PRPH2 - периферин-2, RPGR - регулятор ГТФазы, ассоциированный с пигментным ретинитом, SERPING1 - ингибитор сериновой пептидазы, представитель 1 клады G (C1-ингибитор), TCOF1 - Treacle, TIMP3 - ингибитор 3 металлопротеиназ (TIMP3), TLR3 - Toll-подобный рецептор 3.

Идентичность белка, ассоциированного с MD, редактирование хромосомной последовательности которого осуществляют, может и будет варьировать. В предпочтительном варианте осуществления белки, ассоциированные с MD, редактирование хромосомных последовательностей которых осуществляют, могут представлять собой белок представитель 4 (ABCA4) подсемейства A (ABC1) АТФ-связывающей кассеты, кодируемый геном ABCR, белок аполипопротеин E (APOE), кодируемый геном APOE, белок хемокиновый лиганд 2 (с мотивом C-C) (CCL2), кодируемый геном CCL2, белок рецептор хемокина 2 (с мотивом C-C) (CCR2), кодируемый геном CCR2, белок церулоплазмин (CP), кодируемый геном CP, белок катепсин D (CTSD), кодируемый геном CTSD, или белок ингибитор 3 металлопротеиназ (TIMP3), кодируемый геном TIMP3. В иллюстративном варианте осуществления генетически модифицированное животное представляет собой крысу, и редактируемые хромосомные последовательности, кодирующие белок, ассоциированный с MD, могут быть следующими: NM_000350 (ABCA4) для представителя 4 подсемейства A (ABC1) АТФ-связывающей кассеты, NM_138828 (APOE) для аполипопротеина E APOE, NM_031530 (CCL2) для хемокинового лиганда 2 (с мотивом C-C) CCL2, NM_021866 (CCR2) для рецептора хемокина 2 (с мотивом C-C) CCR2, NM_012532 (CP) для церулоплазмина CP, NM_134334 (CTSD) для катепсина D CTSD, NM_012886 (TIMP3) для ингибитора 3 металлопротеиназ TIMP3. Животное или клетка могут содержать 1, 2, 3, 4, 5, 6, 7 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с MD, и ноль, 1, 2, 3, 4, 5, 6, 7 или более интегрированных в хромосомы последовательностей, кодирующих белок с нарушенной структурой, ассоциированный с MD.

Отредактированную или интегрированную хромосомную последовательность можно модифицировать так, чтобы она кодировала измененный белок, ассоциированный с MD. Некоторые мутации в хромосомных последовательностях, связанных с MD, были ассоциированы с MD. Неограничивающие примеры мутаций в хромосомных последовательностях, ассоциированных с MD, включают те мутации, которые могут вызывать MD, в том числе в белке ABCR - E471K (т.е. глутамат в положении 471 заменен на лизин), R1129L (т.е. аргинин в положении 1129 заменен на лейцин), T1428M (т.е. треонин в положении 1428 заменен на метионин), R1517S (т.е. аргинин в положении 1517 заменен на серин), I1562T (т.е. изолейцин в положении 1562 заменен на треонин) и G1578R (т.е. глицин в положении 1578 заменен на аргинин); в белке CCR2 - V64I (т.е. валин в положении 192 заменен на изолейцин); в белке CP - G969B (т.е. глицин в положении 969 заменен на аспарагин или аспартат); в белке TIMP3 - S156C (т.е. серин в положении 156 заменен на цистеин), G166C (т.е. глицин в положении 166 заменен на цистеин), G167C (т.е. глицин в положении 167 заменен на цистеин), Y168C (т.е. тирозин в положении 168 заменен на цистеин), S170C (т.е. серин в положении 170 заменен на цистеин), Y172C (т.е. тирозин в положении 172 заменен на цистеин) и S181C (т.е. серин в положении 181 заменен на цистеин). Из уровня техники известны и другие взаимосвязи генных вариантов генов, ассоциированных с MD, и заболевания.

Лечение сердечно-сосудистых и мышечных заболеваний

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, в сердце. Для сердца предпочтительным является тропный к миокарду аденоассоциированный вирус (AAVM), в частности, AAVM41, при использовании которого продемонстрирован преимущественный перенос генов в сердце (см., например, Lin-Yanga et al., PNAS, March 10, 2009, vol. 106, no. 10). Введение может быть системным или местным. Доза приблизительно 1-10 x 1014 векторных геномов предусматривается для системного введения. См. также, например, Eulalio et al. (2012) Nature 492: 376 и Somasuntharam et al. (2013) Biomaterials 34: 7790.

Например, в публикации заявки на патент США № 20110023139 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с сердечно-сосудистым заболеванием. Сердечно-сосудистые заболевания, как правило, включают высокое кровяное давление, сердечные приступы, сердечную недостаточность и инсульт, а также TIA. Любую хромосомную последовательность, связанную с сердечно-сосудистым заболеванием, или белок, кодируемый любой хромосомной последовательностью, связанной с сердечно-сосудистым заболеванием, можно использовать в способах, описанных в настоящем изобретении. Белки, связанные с сердечно-сосудистым заболеванием, как правило, выбирают на основании экспериментально установленной ассоциации белка, связанного с сердечно-сосудистым заболеванием, с развитием сердечно-сосудистого заболевания. Например, скорость образования или концентрация в кровотоке белка, связанного с сердечно-сосудистым заболеванием, может быть повышенной или пониженной в популяции с сердечно-сосудистым заболеванием по сравнению с популяцией без сердечно-сосудистого заболевания. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, связанные с сердечно-сосудистым заболеванием, можно идентифицировать путем получения профилей генной экспрессии для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

В качестве примера хромосомная последовательность может включать без ограничения IL1B (интерлейкин 1, бета), XDH (ксантиндегидрогеназу), TP53 (опухолевый белок p53), PTGIS (простагландин 12 (простациклин) синтазу), MB (миоглобин), IL4 (интерлейкин 4), ANGPT1 (ангиопоэтин 1), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8), CTSK (катепсин K), PTGIR (рецептор простангландина 12 (простациклина) (IP)), KCNJ11 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 11), INS (инсулин), CRP (C-реактивный белок, связанный с пентраксином), PDGFRB (тромбоцитарный фактор роста, бета-полипептид), CCNA2 (циклин A2), PDGFB (гомолог онкогена бета-полипептида тромбоцитарного фактора роста (вируса саркомы обезьян (v-sis))), KCNJ5 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 5), KCNN3 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 3), CAPN10 (кальпаин 10), PTGES (простагландин E синтаза), ADRA2B (альфа-2B-адренергический рецептор), ABCG5 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 5), PRDX2 (пероксиредоксин 2), CAPN5 (кальпаин 5), PARP14 (семейство поли (АДФ-рибозо) полимераз, представитель 14), MEX3C (гомолог C mex-3 (C. elegans)), ACE ангиотензин I-конвертирующий фермент (пептидил-дипептидазу A) 1), TNF (фактор некроза опухоли (суперсемейство TNF, представитель 2)), IL6 (интерлейкин 6 (интерферон, бета 2)), STN (статин), SERPINE1 (ингибитор серпинпептидазы, клада E (нексин, ингибитор активатора плазминогена 1 типа), представитель 1), ALB (альбумин), ADIPOQ (адипонектин, содержащий C1Q и коллагеновый домен), APOB (аполипопротеин B (в том числе антиген Ag(x))), APOE (аполипопротеин E), LEP (лептин), MTHFR (5,10-метилентетрагидрофолатредуктаза (NADPH)), APOA1 (аполипопротеин A-I), EDN1 (эндотелин 1), NPPB (предшественник натрийуретического пептида B), NOS3 (синтазу оксида азота 3 типа (эндотелиальная клетка)), PPARG (гамма-рецептор, активируемый пролифератором пероксисом), PLAT (активатор плазминогена, тканевой), PTGS2 (простагландин-эндопероксидсинтазу 2 типа (простагландин G/H синтазу и циклооксигеназу)), CETP (транспортный белок холестериновых эфиров, плазменный), AGTR1 (рецептор антиотензина II, 1 тип), HMGCR (3-гидрокси-3-метилглутарил-кофермент A редуктазу), IGF1 (инсулинподобный фактор роста 1 (соматомедин C)), SELE (селектин E), REN (ренин), PPARA (альфа-рецептор, активируемый пролифератором пероксисом), PON1 (параоксоназу 1), KNG1 (кининоген 1), CCL2 (хемокиновый лиганд 2 (с мотивом C-C)), LPL (липопротеинлипазу), VWF (фактор фон Виллебранда), F2 (фактор коагуляции II (тромбин)), ICAM1 (молекулу межклеточной адгезии 1), TGFB1 (трансформирующий фактор роста, бета 1), NPPA (предшественник натрийуретического пептида A), IL10 (интерлейкин 10), EPO (эритропоэтин), SOD1 (супероксиддисмутазу 1, растворимую), VCAM1 (молекулу адгезии эндотелия сосудов 1 типа), IFNG (интерферон, гамма), LPA (липопротеин, Lp(a)), MPO (миелопероксидазу), ESR1 (эстрогеновый рецептор 1), MAPK1 (митоген-активируемую протеинкиназу 1), HP (гаптоглобин), F3 (фактор коагуляции III (тромбопластин, тканевой фактор)), CST3 (цистатин C), COG2 (компонент олигомерного комплекса Гольджи 2 типа), MMP9 (матриксную металлопептидазу 9 (желатиназу B, желатиназу размером 92 кДа, коллагеназу IV типа размером 92 кДа)), SERPINC1 (ингибитор серпинпептидазы, клада C (антитромбин), представитель 1), F8 (фактор коагуляции VIII, прокоагулянтный компонент), HMOX1 (гемоксигеназу (дециклическую) 1 типа), APOC3 (аполипопротеин C-III), IL8 (интерлейкин 8), PROK1 (прокинетицин 1), CBS (цистатионин-бета-синтазу), NOS2 (синтазу оксида натрия 2 типа, индуцируемую), TLR4 (toll-подобный рецептор 4 типа), SELP (селектин P (гранульный мембранный белок размером 140 кДа, антиген CD62)), ABCA1 (АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1), AGT (ангиотензин (ингибитор серпинпептидазы, клада A, представитель 8)), LDLR (рецептор липопротеина низкой плотности), GPT (глутамат-пируваттрансаминазу (аланинаминотрансферазу)), VEGFA (фактор роста эндотелия сосудов A), NR3C2 (ядерный рецептор, подсемейство 3, группа C, представитель 2), IL18 (интерлейкин 18 (фактор индукции интерферона гамма)), NOS1 (синтазу оксида азота 1 типа (нейрональную)), NR3C1 (ядерный рецептор, подсемейство 3, группа C, представитель 1 (глюкокортикоидный рецептор)), FGB (бета-цепь фибриногена), HGF (фактор роста гепатоцитов (гепатопоэтин A; рассеивающий фактор)), IL1A (интерлейин 1, альфа), RETN (резистин), AKT1 (гомолог онкогена вируса тимомы мышей 1 типа v-akt), LIPC (липазу, печеночную), HSPD1 (белок теплового шока 1 типа размером 60 кДА (шаперонин)), MAPK14 (митоген-активируемую протеинкиназу 14), SPP1 (секретируемый фосфопротеин 1), ITGB3 (интегрин, бета 3 (тромбоцитарный гликопротеин 111a, антиген CD61)), CAT (каталазу), UTS2 (уротензин 2), THBD (тромбомодулин), F10 (фактор коагуляции X), CP (церулоплазмин (ферроксидазу)), TNFRSF11B (суперсемейство фактора некроза опухоли, представитель 11b), EDNRA (рецептор эндотелина типа A), EGFR (рецептор эпидермального фактора роста (гомолог онкогена вируса эритробластического лейкоза (v-erb-b), птичьего)), MMP2 (матриксную металлопептидазу 2 (желатиназу A, желатиназу с массой 72 кДа, коллагеназу IV типа размером 72 кДа)), PLG (плазминоген), NPY (нейропептид Y), RHOD (семейство генов гомологов ras, представитель D), MAPK8 (митоген-активируемую протеинкиназу 8), MYC (гомолог онкогена вируса миелоцистоматоза v-myc (птичьего)), FN1 (фибронектин 1), CMA1 (химазу 1, тучная клетка), PLAU (активатор плазминогена, урокиназу), GNB3 (гуанин-нуклеотид-связывающий белок (G-белок), бета-полипептид 3 типа), ADRB2 (адренергический бета-2-рецептор, поверхностный), APOA5 (аполипопротеин A-V), SOD2 (супероксиддисмутазу 2, митохондриальную), F5 (фактор коагуляции V (проакселерин, лабильный фактор)), VDR (рецептор витамина D (1,25-дигидроксивитамина D3), ALOX5 (арахидонат 5-липооксигеназу), HLA-DRB1 (главный комплекс гистосовместимости, класс II, DR бета 1), PARP1 (поли (АДФ-рибозо) полимеразу 1 типа), CD40LG (лиганд CD40), PON2 (параоксоназу 2), AGER (рецептор, специфичный к конечным продуктам дополнительного гликозилирования), IRS1 (субстрат для инсулинового рецептора 1 типа), PTGS1 (простагландин-эндопероксидсинтазу 1 типа (простагландин G/H синтазу и циклооксигеназу)), ECE1 (эндотелин-превращающий фермент 1 типа), F7 (фактор коагуляции VII (сывороточный ускоритель превращения тромбина)), URN (антагонист рецептора интерлейкина 1), EPHX2 (эпоксидгидролазу 2 типа, цитоплазматическую), IGFBP1 (связывающий белок инсулинподобного фактора роста 1 типа), MAPK10 (митоген-активируемую протеинкиназу 10), FAS (Fas (суперсемейство рецепторов TNF, представитель 6)), ABCB1 (АТФ-связывающую кассету, подсемейство B (MDR/TAP), представитель 1), JUN (онкоген jun), IGFBP3 (связывающий белок инсулинподобного фактора роста 3 типа), CD14 (молекулу CD14), PDE5A (фосфодиэстеразу 5A, cGMP-специфичную), AGTR2 (рецептор ангиотензина II, 2 тип), CD40 (молекулу CD40, представитель 5 суперсемейства рецепторов TNF), LCAT (лецитин-холестерин-ацилтрансферазу), CCR5 (хемокиновый рецептор 5 типа (с мотивом C-C)), MMP1 (матриксную металлопептидазу 1 (интерстициальную коллагеназу)), TIMP1 (ингибитор металлопептидазы TIMP 1 типа), ADM (адреномедуллин), DYT10 (дистонию 10), STAT3 (передатчик сигнала и активатор транскрипции 3 типа (фактор ответа острой фазы)), MMP3 (матриксную металлопептидазу 3 (стромелизин 1, прожелатиназу)), ELN (эластин), USF1 (фактор транскрипции, связывающийся перед сайтом инициации транскрипции 1), CFH (фактор комплемента H), HSPA4 (белок теплового шока 4 размером 70 кДа), MMP12 (матриксную металлопептидазу 12 (макрофагальную эластазу)), MME (мембранную металлоэндопептидазу), F2R (рецептор фактора коагуляции II (тромбина)), SELL (селектин L), CTSB (катепсин B), ANXA5 (аннексин A5), ADRB1 (адренергический бета-1-рецептор), CYBA (цитохром b-245, альфа-пептид), FGA (альфа-цепь фибриногена), GGT1 (гамма-глутамилтрансферазу 1), LIPG (липазу, эндотелиальную), HIF1A (фактор, индуцируемый гипоксией 1, альфа-субъединицу (фактор транскрипции основной структуры спираль-петля-спираль)), CXCR4 (хемокиновый рецептор 4 (с мотивом C-X-C)), PROC (белок C (инактиватор факторов коагуляции Va и VIIIa)), SCARB1 (фагоцитарный рецептор, класс B, представитель 1), CD79A (молекулу CD79a, иммуноглобулин-ассоциированную альфа), PLTP (белок переноса фосфолипидов), ADD1 (аддуцин 1 (альфа)), FGG (гамма-цепь фибриногена), SAA1 (сывороточный амилоид A1), KCNH2 (калиевый потенциалзависимый канал, семейство H (eag-связанный), представитель 2), DPP4 (дипептидилпептидазу 4), G6PD (глюкозо-6-фосфатдегидрогеназу), NPR1 (натрийуретический пептидный рецептор A/гуанилатциклазу A (атрионатрийуретический пептидный рецептор A)), VTN (витронектин), KIAA0101 (KIAA0101), FOS (гомолог онкогена вируса остеосаркомы мышей FBJ), TLR2 (toll-подобный рецептор 2), PPIG (пептидилпролинизомеразу G (циклопролин G)), IL1R1 (рецептор интерлейкина I типа), AR (андрогеновый рецептор), CYP1A1 (цитохром P450, семейство 1, подсемейство A, полипептид 1), SERPINA1 (ингибитор серпинпептидазы, клада A (альфа-1 антипротеиназу, антитрипсин), представитель 1), MTR (5-метилтетрагидрофолат-госоцистеинметилтрансферазу), RBP4 (ретинол-связывающий белок 4 типа, плазменный), APOA4 (аполипопротеин A-IV), CDKN2A (циклин-зависимый ингибитор киназы 2A (меланома, p16, ингибирует CDK4)), FGF2 (фактор роста фибробластов 2 (основной)), EDNRB (эндотелиновый рецептор B типа), ITGA2 (интегрин, альфа 2 (CD49B, альфа 2 субъединицу VLA-2 рецептора)), CABIN1 (кальцинейрин-связывающий белок 1), SHBG (глобулин, связывающийся с половыми гормонами), HMGB1 (группу белков с высокой подвижностью 1 типа), HSP90B2P (белок теплового шока размером 90 кДА, бета (Grp94), представитель 2 (псевдоген)), CYP3A4 (цитохром P450, семейство 3, подсемейство A, полипептид 4), GJA1 (белок межклеточных щелевых контактов, альфа 1, 43 кДа), CAV1 (кавеолин 1, белок кавеол, 22 кДа), ESR2 (эстрогеновый рецептор 2 (ER бета)), LTA (лимфотоксин альфа (суперсемейство TNF, представитель 1)), GDF15 (фактор роста и дифференцировки 15), BDNF (нейротрофический фактор головного мозга), CYP2D6 (цитохром P450, семейство 2, подсемейство D, полипептид 6), NGF (фактор роста нервов (бета-полипептид)), SP1 (фактор транкрипции Sp1), TGIF1 (TGFB-индуцируемый фактор гомеобокс 1), SRC (гомолог онкогена вируса саркомы v-src (Schmidt-Ruppin A-2) (птичьего)), EGF (эпидермальный фактор роста (бета-урогастрон)), PIK3CG (фосфоинозитид-3-киназу, каталитическую, гамма-полипептид), HLA-A (основной комплекс гистосовместимости, класс I, A), KCNQ1 (калиевый потенциалзависимый канал, KQT-подобное семейство, представитель 1), CNR1 (каннабиноидный рецептор 1 (головной мозг)), FBN1 (фибриллин 1), CHKA (холинкиназу альфа), BEST1 (бестрофин 1), APP (белок-предшественник амилоида бета (A4)), CTNNB1 (катенин (кадгерин-ассоциированный беок), бета 1, 88 кДа), IL2 (интерлейкин 2), CD36 (молекулу CD36 (тромбоспондиновый рецептор)), PRKAB1 (протеинкиназу, AMФ-активируемую, бета 1 некаталитическую субъединицу), TPO (тиреоидную перокидазу), ALDH7A1 (семейство альдегиддегидрогеназы 7, представитель A1), CX3CR1 (хемокиновый рецептор 1 (с мотивом C-X3-C)), TH (тирозингидроксилазу), F9 (фактор коагуляции IX), GH1 (гормон роста 1), TF (трансферрин), HFE (гемохроматоз), IL17A (интерлейкин 17A), PTEN (гомолог фосфатазы и тензина), GSTM1 (глутатион S-трансферазу мю 1), DMD (дистрофин), GATA4 (GATA связывающий белок 4 типа), F13A1 (фактор коагуляции XIII, полипептид A1), TTR (транстиретин), FABP4 (связывающий белок жирных кислот 4 типа, адипоцитарный), PON3 (параоксоназу 3), APOC1 (аполипопротеин C-I), INSR (инсулиновый рецептор), TNFRSF1B (суперсемейство рецепторов фактора некроза опухоли, представитель 1B), HTR2A (5-гидрокситриптаминовый (серотониновый) рецептор 2A), CSF3 (колониестимулирующий фактор 3 (гранулоцитарный)), CYP2C9 (цитохром P450, семейство 2, подсемейство C, полипептид 9), TXN (тиоредоксин), CYP11B2 (цитохром P450, семейство 11, подсемейство B, полипептид 2), PTH (паратиреоидный гормон), CSF2 (колониестимулирующий фактор 2 (гранулоцитарно-макрофагальный)), KDR (рецептор, содержащий домен вставки киназы (рецептор тирозинкиназы III типа)), PLA2G2A (фосфолипазу A2, группа IIA (тромбоциты, синовиальная жидкость)), B2M (бета-2-микроглобулин), THBS1 (тромбоспондин 1), GCG (глюкагон), RHOA (семейство генов гомологов ras, представитель A), ALDH2 (семейство альдегиддегидрогеназы 2 (митохондриальной)), TCF7L2 (фактор транскрипции 7, подобный фактору 2 (специфичный по отношению к T-клеткам, HMG-бокс)), BDKRB2 (брадикининовый рецептор B2), NFE2L2 (фактор 2, подобный ядерному фактору (эритроидный 2)), NOTCH1 (гомолог Notch 1, ассоциированный с транслокациями (дрозофилиный)), UGT1A1 (UDP-глюкуронилтрансферазу семейства 1, полипипетид A1), IFNA1 (интерферон, альфа 1), PPARD (дельта-рецептор, активируемый пролифератором пероксисом), SIRT1 (сиртуин 1 (гомолог 2 регуляции молчащей информации совпадающего типа) (S. cerevisiae)), GNRH1 (гонадотропин-рилизинг гормон 1 (лютеинизирующий-рилизинг гормон)), PAPPA (ассоциированный с беременностью белок A плазмы, папализин 1), ARR3 (аррестин 3, ретинальный (X-аррестин)), NPPC (предшественник натрийуретического пептида C), AHSP (альфа-гемоглобин-стабилизирующий белок), PTK2 (протеинтирозинкиназу 2 типа PTK2), IL13 (интерлейкин 13), MTOR (мишень механизма действия рапамицина (серин/треоринкиназу)), ITGB2 (интергрин, бета 2 (субъединицу рецептора 3 и 4 компонента 3 комплемента)), GSTT1 (глутатион-S-трансферазу тета 1), IL6ST (передатчик сигнала интерлейкина 6 (gp130, рецептор онкостатина М)), CPB2 (карбоксипептидазу B2 (плазменную)), CYP1A2 (цитохром P450, семейство 1, подсемейство A, полипептид 2), HNF4A (ядерный фактор гепатоцитов 4, альфа), SLC6A4 (семейство переносчиков растворенных веществ 6 (переносчик нейромедиаторов, серотонина), представитель 4), PLA2G6 (фосфолипазу A2, группа VI (цитозольную, кальций-независимую)), TNFSF11 (суперсемейство фактора роста опухоли (лиганд), представитель 11), SLC8A1 (семейство переносчиков растворенных веществ 8 (натрий-кальциевый антипортер), представитель 1), F2RL1 (рецептор-подобный фактор коагуляции II 1 (тромбин)), AKR1A1 (семейство альдокеторедуктаз 1, представитель A1 (алдегидредуктазу)), ALDH9A1 (семейство альдегиддегирогензы 9, представитель A1), BGLAP (белок гамма-карбоксиглутамата (gla)), MTTP (микросомальный белок переноса триглицеридов), MTRR (редуктаза 5-метилтетрагидрофолат-гомоцистеинметилтрансферазы), SULT1A3 (семейство сульфотрансфераз, цитозолоный, 1A, фенол-предпочтительный, представитель 3), RAGE (антиген опухоли почек), C4B (компонент 4В комплемента (группа крови Chido), P2RY12 (пуринергический рецептор P2Y, связанный с G-белком, 12), RNLS (реналазу, FAD-зависимую аминооксидазу), CREB1 (белок 1, связывающий чувствительный к cAMP элемент), POMC (проопиомеланокортин), RAC1 (связанный с ras субстрат 1 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac1)), LMNA (ламин NC), CD59 (молекулу CD59, регуляторный белок комплемента), SCN5A (натриевый канал, потенциалзависимый, V типа, альфа-субъединицу), CYP1B1 (цитохром P450, семейство 1, подсемейство B, полипептид 1), MIF (фактор ингибирования миграции макрофагов (фактор, ингибирующий гликозилирование)), MMP13 (матриксную метталлопептидазу 13 (коллагеназу 3)), TIMP2 (ингибитор металлопептидазы 2 TIMP), CYP19A1 (цитохром P450, семейство 19, подсемейство A, полипептид 1), CYP21A2 (цитохром P450, семейство 21, подсемейство A, полипептид 2), PTPN22 (протеинтирозинфосфатазу, нерецепторную, 22 типа (лимфоидную)), MYH14 (миозин, тяжелую цепь 14, немышечный), MBL2 (маннозо-связывающий лектин (белок C) 2, растворимый (дефект опсонина)), SELPLG (лиганд селектина P), AOC3 (аминоксидазу, медь-содержащую 3 (белок 1 адгезии сосудов)), CTSL1 (катепсин L1), PCNA (ядерный антиген пролиферирующих клеток), IGF2 (инсулинподобный фактор роста 2 (соматомедин A)), ITGB1 (интегрин, бета 1 (фибронектиновый рецептор, бета-полипептид, антиген CD29 включает MDF2, MSK12)), CAST (кальпастатин), CXCL12 (хемокиновый лиганд 12 (с мотивом C-X-C) (стромальный клеточный фактор 1)), IGHE (константную область тяжелой эпсилон-цепи иммуноглобулина), KCNE1 (калиевый потенциалзависимый канал, Isk-связанное семейство, представитель 1), TFRC (трансферриновый рецептор (p90, CD71)), COL1A1 (коллаген 1 типа, альфа 1), COL1A2 (коллаген, I типа, альфа 2), IL2RB (рецептор интерлейкина 2, бета), PLA2G10 (фрсфолипидазу A2, группа X), ANGPT2 (ангиопоэтин 2), PROCR (рецептор протеина C, эндотелиальный (EPCR)), NOX4 (NADPH-оксидазу 4), HAMP (гепцидиновый антимикробный пептид), PTPN11 (протеинтирозинфосфатазу, нерецепторную, 11 типа), SLC2A1 (семейство переносчиков растворенных веществ 2 (переносчик глюкозы посредством облегченной диффузии), представитель 1), IL2RA (рецептор интерлейкина 2, альфа), CCL5 (хемокиновый лиганд 5 (с мотивом C-C)), IRF1 (регуляторный фактор интерферона 1), CFLAR (CASP8 и FADD-подобный регулятор апоптоза), CALCA (кальцитонин-связанный полипептид альфа), EIF4E (фактор инициации трансляции эукариот 4E), GSTP1 (пи-1-глутатин-S-трансферазу), JAK2 (Янус-киназу 2), CYP3A5 (цитохром P450, семейство 3, подсемейство A, полипептид 5), HSPG2 (гепаринсульфатпротеогликан 2), CCL3 (хемокиновый лиганд 3 (с мотивом C-C)), MYD88 (ген первичного ответа миелоидной дифференциации (88)), VIP (вазоактивный пептид кишечника), SOAT1 (стерол-O-ацилтрансферазу 1), ADRBK1 (адренергическую, бета, рецепторную киназу 1), NR4A2 (подсемейство ядерных рецепторов 4, группа A, представитель 2), MMP8 (матриксную металлопептидазу 8 (нейтрофильную коллагеназу)), NPR2 (рецептор натрийуретического пептида B/гуанилатциклазу B (рецептор атрионатрийуретического пептида B)), GCH1 (GTP гидролазу 1), EPRS (глутамил-пропил-тРНК-синтетазу), PPARGC1A (гамма-рецептор, активируемый пролифератором пероксисом, коактиватор 1 альфа), F12 (фактор коагуляции XII (фактор Хагемана)), PECAM1 (молекулу адгезии тромбоцитов/эндотелиальных клеток), CCL4 (хемокиновый лиганд 4 (с мотивом C-C)), SERPINA3 (ингибитор серпинпептидазы, клада A (альфа-1-антипротеиназу, антитрипсин), представитель 3), CASR (кальций-чувствительный рецептор), GJA5 (белок межклеточных щелевых контактов, альфа 5, 40 кДа), FABP2 (связывающий белок жирных кислот 2 типа, кишечный), TTF2 (фактор терминации транскрипции, РНК-полимеразу II), PROS1 (белок S (альфа)), CTF1 (кардиотропин 1), SGCB (саркогликан, бета (дистрофин-ассоциированный гликопротеин размером 43 кДа)), YME1L1 (YME1-подобный фактор 1 (S. cerevisiae)), CAMP (кателицидиновый антимикробный пептид), ZC3H12A (содержащий фактор типа CCCH с цинковыми пальцами 12A), AKR1B1 (семейство альдокеторедуктазы 1, представитель B1 (альдоредуктазу)), DES (десмин), MMP7 (матриксную металлопептидазу 7 (матрилизин, маточный)), AHR (арил-углеводородный рецептор), CSF1 (колониестимулирующий фактор 1 (макрофагальный)), HDAC9 (гистон-деацетилазу 9), CTGF (фактор роста соединительной ткани), KCNMA1 (калиевый, активируемый кальцием канал высокого проведения, подсемейство M, альфа, представитель 1), UGT1A (UDP-глюкуронилтрансферазу семейства 1, локус комплекса полипептида A), PRKCA (протеинкиназу C, альфа), COMT (катехол-бета-метилтрансферазу), S100B (S100 кальций-связывающий белок B), EGR1 (фактор роста раннего ответа 1), PRL (пролактин), IL15 (интерлейкин 15), DRD4 (дофаминовый рецептор D4), CAMK2G (кальций/кальмодулинзависимую протеинкиназу II гамма), SLC22A2 (семейство переносчиков растворенных веществ 22 (переносчик органических катионов), представитель 2), CCL11 (хемокиновый лиганд 11 (с мотивом C-C)), PGF (плацентартный фактор роста B321), THPO (тромбопоэтин), GP6 (гликопротеин VI (тромбоцитарный)), TACR1 (тахикиновый рецептор 1), NTS (нейротензин), HNF1A (HNF1 гомеобокс A), SST (соматостатин), KCND1 (калиевый потенциалзависимый канал, связанное с Shal подсемейство, представитель 1), LOC646627 (ингибитор фосфолипазы), TBXAS1 (тромбоксан A синтазу 1 (тромбоцитарную)), CYP2J2 (цитохром P450, семейство 2, подсемейство J, полипептид 2), TBXA2R (рецептор тромбоксана A2), ADH1C (алкогольдегидрогеназу 1C (класс I), гамма-полипептид), ALOX12 (арахидонат 12-липогеназу), AHSG (альфа-2-HS-гликопротеин), BHMT (бетаин-гомоцистеинметилтрансферазу), GJA4 (белок щелевых межклеточных контактов, альфа 4, 37 кДа), SLC25A4 (семейство переносчиков растворенных веществ 25 (митохондриальный переносчик; аденин-нуклеотид транслокатор), представитель 4), ACLY (АТФ-цитратлиазу), ALOX5AP (белок, активирующий арахидонат-5-липооксигеназу), NUMA1 (ядерный белок митотического аппарата 1), CYP27B1 (цитохром P450, семейство 27, подсемейство B, полипептид 1), CYSLTR2 (цистеинил-лейкотриеновый рецептор 2), SOD3 (супероксиддисмутазу 3, внеклеточную), LTC4S (лейкотриен C4-синтазу), UCN (урокортин), GHRL (препропептид грелина/обестатина), APOC2 (аполипопротеин C-II), CLEC4A (семейство 4 домена лектина C-типа, представитель A), KBTBD10 (содержащий kelch-повтор и домен BTB (POZ) 10), TNC (тенаскин C), TYMS (тимидилатсинтетазу), SHCl (SHC-трансформирующий белок 1 (содержащий домен 2 с Src-гомологией)), LRP1 (белок 1, связанный с рецепторами липопротеина низкой плотности), SOCS3 (супрессор 3 передачи сигнала с участием цитокинов), ADH1B (алкогольдегидрогеназу 1B (I класс), бета-полипептид), KLK3 (связанную с калликреином пептидазу 3), HSD11B1 (гидроксистероид (11-бета) дегидрогеназу 1), VKORC1 (витамин K эпоксид-редуктазный комплекс, субъединица 1), SERPINB2 (ингибитор серпинпептидазы, клада B (овальбумин), представитель 2), TNS1 (тензин 1), RNF19A (белок "цинковый палец" типа ring 19A), EPOR (эритропоэтиновый рецептор), ITGAM (интегрин, альфа M (субъединицу рецептора 3 компонента 3 комплемента)), PITX2 (подобный парному гомеодомен 2), MAPK7 (митоген-активированную протеинкиназу 7), FCGR3A (Fc-фрагмент IgG, с низкой аффинностью 111a, рецептор (CD16a)), LEPR (лептиновый рецептор), ENG (эндоглин), GPX1 (глутатионпероксидазу 1), GOT2 (щавелево-уксусную трансаминазу глутаминовой кислоты 2 типа, митохондриальную (аспартатаминотрансферазу 2 типа)), HRH1 (гистаминовый рецептор H1), NR112 (семейство ядерных рецепторов 1, I группа, представитель 2), CRH (кортикотропин-рилизинг гормон), HTR1A (5-гидрокситриптаминовый (серотониновый) рецептор 1A), VDAC1 (потенциалзависимый анионный канал 1), HPSE (гепараназу), SFTPD (поверхностно-активный белок D), TAP2 (переносчик 2, АТФ-связывающая кассета, подсемейство B (MDR/TAP)), RNF123 (белок "цинковый палец" типа ring 123), PTK2B (PTK2B протеинтирозинкиназу 2 бета), NTRK2 (нейротрофическую тирозинкиназу, рецептор, 2 тип), IL6R (рецептор интерлейкина 6), ACHE (ацетилхолинэстеразу (группу крови Yt)), GLP1R (рецептор глюкагон-подобного пептида 1), GHR (рецептор гормона роста), GSR (глутатионредуктазу), NQO1 (NAD(P)H-дегидрогеназу, хинон 1), NR5A1 (семейство ядерных рецепторов 5, группа A, представитель 1), GJB2 (белок межклеточных щелевых контактов, бета 2, 26 кДа), SLC9A1 (семейство переносчиков растворенных веществ 9 (натрий-водородный антипортер), представитель 1), MAOA (моноаминоксидазу A), PCSK9 (пропротеинконвертазу субтилизин-кексинового 9 типа), FCGR2A (Fc-фрагмент IgG, с низкой аффинностью IIa, рецептор (CD32)), SERPINF1 (ингибитор серпинпептидазы, клада F (альфа-2-антиплазмин, фактор пигментного эпителия), представитель 1), EDN3 (эндотелин 3), DHFR (дигидрофолатредуктазу), GAS6 (специфичный к задержке роста фактор 6), SMPD1 (сфингомиелинфосфодиэстеразу 1, кислую лизосомальную), UCP2 (неспаренный белок 2 (митохондриальный, переносчик протонов)), TFAP2A (транспортный фактор AP-2 альфа (активирующий энхансер связывающий белок 2 альфа)), C4BPA (связывающий белок 4 компонента комплемента, альфа), SERPINF2 (ингибитор серпинпептидазы, клада F (альфа-2-антилазмин, фактор пигментного эпителия), представитель 2), TYMP (тимидинфосфорилазу), ALPP (щелочную фосфатазу, плацентарную (изозим Регана)), CXCR2 (хемокиновый рецептор 2 (с мотивом C-X-C)), SLC39A3 (семейство переносчиков растворенных веществ 39 (переносчик цинка), представитель 3), ABCG2 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 2), ADA (аденозиндезаминазу), JAK3 (Янус-киназу 3), HSPA1A (белок теплового шока 1А размером 70 кДа), FASN (синтазу жирных кислот), FGF1 (фактор роста фибробластов 1 (кислотный)), F11 (фактор коагуляции XI), ATP7A (АТФазу, транспортирование Cu++, альфа-полипептид), CR1 (рецептор 1 компонента комплемента (3b/4b) (группы крови Knops)), GFAP (глиофибриллярный щелочной белок), ROCK1 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 1), MECP2 (метил CpG-связывающий белок 2 (синдром Ретта)), MYLK (легкую цепь миозина), BCHE (бутирилхолинэстеразу), LIPE (липазу, гормончувствительную), PRDX5 (пероксиредоксин 5), ADORA1 (рецептор аденозина A1), WRN (синдром Вернера, RecQ, подобный хеликазе), CXCR3 (хемокиновый рецептор 3 (с мотивом C-X-C)), CD81 (молекулу CD81), SMAD7 (семейство SMAD, представитель 7), LAMC2 (ламинин, гамма 2), MAP3K5 (митоген-активируемую протеинкиназу киназы 5), CHGA (хромогранин A (паратиреоридный секреторный белок 1)), IAPP (островковый амилоидный пептид), RHO (родопсин), ENPP1 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 1), PTHLH (подобный паратиреоидному гормону гормон), NRG1 (нейрегулин 1), VEGFC (фактор роста эндотелия сосудов C), ENPEP (глутамиламинопептидазу (аминопептидазу A)), CEBPB (CCAAT/энхансерный связывающий белок (C/EBP), бета), NAGLU (N-ацетилглюкозаминидазу, альфа-), F2RL3 (фактор коагуляции II (тромбин), рецептор-подобный 3), CX3CL1 (хемокиновый лиганд 1 (с мотивом C-X3-C)), BDKRB1 (брадикиновый рецептор B1), ADAMTS13 (ADAM металлопептидазу с тромбоспондиновым мотивом 1 типа, 13), ELANE (эластазу, экспрессируемую в нейтрофилах), ENPP2 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 2), CISH (индуцируемый цитокином SH2-содержащий белок), GAST (гастрин), MYOC (миоцилин, индуцируемый трабекулярной сетью глюкокортикоидный ответ), ATP1A2 (АТФазу, Na+/K+ транспорт, альфа 2 полипептид), NF1 (нейрофибромин 1), GJB1 (белок межклеточных щелевых контактов, бета 1, 32 кДа), MEF2A (миоцитарный энхансорный фактор 2A), VCL (винкулин), BMPR2 (рецептор костного морфогенетического белка, тип II (серин/треонинкиназу)), TUBB (тубулин, бета), CDC42 (фактор клеточного цикла 42 (GTP-связывающий белок, 25 кДа)), KRT18 (кератин 18), HSF1 (фактор транскрипции белка теплового шока 1), MYB (гомолог онкогена вируса миелобластоза v-myb (птичьего)), PRKAA2 (протеинкиназу, AMP-активируемую, каталитическую субъединицу альфа 2), ROCK2 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 2), TFPI (ингибитор пути тканевого фактора (липопротеин-ассоциированный ингибитор коагуляции)), PRKG1 (протеинкиназу, cGMP-зависимую, I тип), BMP2 (костный морфогенетический белок 2), CTNND1 (катенин (кадгерин-ассоциированный белок), дельта 1), CTH (цистатионазу (цистатионин-гамма-лиазу)), CTSS (катепсин S), VAV2 (фактор обмена гуаниновых нуклеотидов vav 2), NPY2R (рецептор Y2 нейропептида Y), IGFBP2 (связывающий белок 2 инсулин-подобного фактора роста, 36 кДа), CD28 (молекулу CD28), GSTA1 (глутатион-S-трансферазу, альфа 1), PPIA (пептидилпролилизомеразу A (циклофилин A)), APOH (аполипопротеин H (бета-2-гликопротеин I)), S100A8 (S100 кальций-связывающий белок A8), IL11 (интерлейкин 11), ALOX15 (арахидонат-15-липоксигеназу), FBLN1 (фибулин 1), NR1H3 (семейство ядерных рецепторов 1, группа H, представитель 3), SCD (стеароил-CoA десатуразу (дельта-9-десатуразу)), GIP (желудочный ингибиторный пептид), CHGB (хромогранин B (секретогранин 1)), PRKCB (протеинкиназу C, бета), SRD5A1 (стероид-5-альфа-редуктазу, альфа-полипептид 1 (3-оксо-5 альфа-стероид дельта-4-дегидрогеназу альфа 1)), HSD11B2 (гидроксистероид (11-бета) дегидрогеназу 2), CALCRL (подобный кальцитониновому рецептору), GALNT2 (UDP-N-ацетил-альфа-D-галактозамин:полипептид N-ацетилгалактозаминилтрансферазу 2 (GalNAc-T2)), ANGPTL4 (ангиопоэтинподобный 4), KCNN4 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 4), PIK3C2A (фосфоинозитидин-3-киназу, класс 2, альфа-полипептид), HBEGF (гепарин-связывающий EGF-подобный фактор роста), CYP7A1 (цитохром P450, семейство 7, подсемейство A, полипептид 1), HLA-DRB5 (главный комплекс гистосовместимости, класс II, DR бета 5), BNIP3 (белок 3 с массой 19 кДа, взаимодействующий с BCL2/аденовирусом E1B), GCKR (регулятор глюкокиназы (гексокиназы 4)), S100A12 (S100 кальций-связывающий белок A12), PADI4 (пептидиларгининдеиминазу, тип IV), HSPA14 (белок 14 теплового шока с массой 70 кДа), CXCR1 (хемокиновый рецептор 1 (с мотивом C-X-C)), H19 (H19, экспрессируемый пептид, импринтированный со стороны матери (некодирующий белок)), KRTAP19-3 (кератин-ассоциированный белок 19-3), IDDM2 (фактор инсулин-зависимого сахарного диабета 2 типа), RAC2 (ras-связанный субстрат 2 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac2)), RYR1 (рианодиновый рецептор 1 (мышечный)), CLOCK (гомолог гена (мышиный)), NGFR (рецептор фактора роста нервов (суперсемейство TNFR, представитель 16)), DBH (дофамин бета-гидроксилазу (дофамин бета-монооксигеназу)), CHRNA4 (холинергический рецептор, никотиновый, альфа 4), CACNA1C (кальциевый канал, потенциалзависимый, типа L, субъединицу альфа 1C), PRKAG2 (протеинкиназу, AMP-активированную, гамма 2 некаталическую субъединицу), CHAT (холинацетилтрансферазу), PTGDS (простагландин D2 синтазу размером 21 кДа (головного мозга)), NR1H2 (семейство 1 ядерных рецепторов, группа H, представитель 2), TEK (TEK тирозинкиназу, эндотелиальную), VEGFB (фатор роста эндотелия сосудов B), MEF2C (миоцитарный энхансерный фактор 2C), MAPKAPK2 (протеинкиназу 2, активированную митоген-активированной протеинкиназой), TNFRSF11A (суперсемейство рецепторов фактора некроза опухоли, представитель 11a, активатор NFKB), HSPA9 (белок 9 теплового шока размером 70 кДа (морталин)), CYSLTR1 (цистеинил-лейкотриеновый рецептор 1), MAT1A (метионинаденозилтрансферазу I, альфа), OPRL1 (подобный опиатному рецептору 1), IMPA1 (инизитол(мио)-1(или 4)-монофосфатазу 1), CLCN2 (канал-переносчик для ионов хлора 2), DLD (дигидролипоамиддегидрогеназу), PSMA6 (протеасомную субъединицу (просому, макропаин), тип альфа, 6), PSMB8 (протеасомную субъединицу (просому, макропаин), тип бета, 8 (большую мультифункциональную пептидазу 7)), CHI3L1 (фактор 1, подобный хитиназе 3 (хрящевой гликопротеин 39)), ALDH1B1 (альдегиддегидрогеназу, семейство 1, представитель B1), PARP2 (поли (АДФ-рибозо) полимеразу 2), STAR (стероидогенный острый регуляторный белок), LBP (липополисахарид-связывающий белок), ABCC6 (АТФ-связывающую кассету, подсемейство C (CFTR/MRP), представитель 6), RGS2 (регулятор передачи сигнала с участием G-белка 2, 24 кДа), EFNB2 (эфрин-B2), GJB6 (белок межклеточных щелевых контактов, бета 6, 30 кДа), APOA2 (аполипопротеин A-II), AMPD1 (аденозинмонофосфатдезаминазу 1), DYSF (дисферлин, тазо-плечевая мышечная дистрофия 2B (аутосомно-рецессивная)), FDFT1 (фарнезил-дифосфатфарнелизтрансферазу 1), EDN2 (эндотелин 2), CCR6 (хемокиновый рецептор 6 (с мотивом C-C)), GJB3 (белок межклеточных щелевых контактов, бета 3, 31 кДа), IL1RL1 (фактор 1, подобный рецептору интерлейкина 1), ENTPD1 (эктонуклеозидтрифосфат-дифосфогидролазу 1), BBS4 (фактор 4 синдром Барде-Бидля), CELSR2 (кадгерин, семиканальный рецептор 2 G-типа EGF LAG (гомолог flamingo, дрозофилиный)), F11R (рецептор F11), RAPGEF3 (фактор обмена гуаниновых нуклеотидов Rap (GEF) 3), HYAL1 (гиалуроноглюкозаминидазу 1), ZNF259 (белок "цинковый палец" 259), ATOX1 (гомолог антиоксидантного белка 1 ATX1 (дрожжевой)), ATF6 (фактор активации транскрипции 6), KHK (кетогексокиназу (фруктокиназу)), SAT1 (спермидин/спермин N1-ацетилтрансферазу 1), GGH (гамма-глутамилгидролазу (конъюгазу, фолилполигаммаглутамингидролазу)), TIMP4 (ингибитор TIMP металлопептидазы 4), SLC4A4 (семейство переносчиков растворенных белков 4, бикарбонат-натриевый контранспортер, представитель 4), PDE2A (фосфодиэстеразу 2A, cGMP-стимулированную), PDE3B (фосфодиэстеразу 3B, cGMP-ингибированную), FADS1 (десатуразу 1 жирных кислот), FADS2 (десатуразу 2 жирных кислот), TMSB4X (тимозин бета 4, X-сцепленный), TXNIP (белок, взаимодействующий с тиоредоксином), LIMS1 (домены 1, подобные LIM и антигену стареющих клеток), RHOB (семейство генов гомологов ras, представитель B), LY96 (лимфоцитарный антиген 96), FOXO1 (forkhead-бокс О1), PNPLA2 (фактор 2, содержащий домен пататин-подобной фосфолипидазы), TRH (тиротропин-рилизинг гормон), GJC1 (белок межклеточных щелевых контактов, гамма 1, 45 кДа), SLC17A5 (семейство переносчиков растворенных веществ 17 (переносчик анионов и сахаров), представитель 5), FTO (фактор, ассоциированный с жировой массой и ожирением), GJD2 (белок межклеточных щелевых контактов, дельта 2, 36 кДа), PSRC1 (двуспиральный фактор с высоким содержанием пролина и серина 1), CASP12 (каспазу 12 (ген/псевдоген)), GPBAR1 (рецептор 1 желчных кислот, связанный с G-белком), PXK (серин/треонинкиназу, содержащую домен PX), IL33 (интерлейкин 33), TRIB1 (гомолог tribbles 1 (дрозофилиный)), PBX4 (гомеобокс 4 пре-B-клеточного лейкоза), NUPR1 (ядерный белок, регулятор транскрипции, 1), 15-Sep (селенопротеин размером 15 кДа), CILP2 (белок промежуточного слоя хряща 2), TERC (РНК-компонент теломеразы), GGT2 (гамма-глутамилтрансферазу 2), MT-CO1 (цитохром c оксидазу I, кодируемую митохондриальным геномом) и UOX (уратоксидазу, псевдоген). Любая из данных последовательностей может быть мишенью для системы CRISPR-Cas, например, для изучения мутации.

В дополнительном варианте осуществления хромосомная последовательность также может быть выбрана из следующих: Pon1 (параоксоназа 1), LDLR (рецептор LDL), ApoE (аполипопротеин E), Apo B-100 (аполипопротеин B-100), ApoA (аполипопротеин(a)), ApoA1 (аполипопротеин A1), CBS (цистатион-B-синтаза), гликопротеин IIb/IIb, MTHRF (5,10-метилентетрагидрофолатредуктаза (NADPH) и их комбинаций. В одном случае хромосомные последовательности и белки, кодируемые хромосомными последовательностями, связанные с сердечно-сосудистым заболеванием, могут быть выбраны из Cacna1C, Sod1, Pten, Ppar(альфа), Apo E, лептина и их комбинаций в качестве мишени(мишеней) для системы CRISPR-Cas.

Лечение заболеваний печени и почек

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, в печень и/или почки. Стратегии доставки для индукции поглощения клетками терапевтической нуклеиновой кислоты предусматривают использование физических сил или векторных систем, например доставку с использованием вирусов, липидов, или комплексов, или наноносителей. Исходя из первоначальных вариантов применения, имеющих незначительную возможную клиническую значимость, в случае доставки нуклеиновых кислот в клетки почки с помощью гидродинамической системной инъекции с созданием высокого давления, широкий диапазон вирусных терапевтических носителей и носителей, отличных от вирусных, уже применяется для нацеливания на посттранскрипционные события в различных животных моделях заболевания почек in vivo (Csaba Révész and Péter Hamar (2011). Delivery Methods to Target RNAs in the Kidney, Gene Therapy Applications, Prof. Chunsheng Kang (Ed.), ISBN: 978-953-307-541-9, InTech, доступно по ссылке: http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney). Способы доставки в почки могут включать таковые в Yuan et al. (Am J Physiol Renal Physiol 295: F605-F617, 2008) исследовали, может ли in vivo доставка малых интерферирующих РНК (siRNA), целенаправленно воздействующих на 12/15-липоксигеназный (12/15-LO) путь метаболизма арахидоновой кислоты, приводить к уменьшению повреждения почек и диабетической нефропатии (DN) в модели диабета 1 типа на мышах, которым вводили стрептозотоцин путем инъекции. Для достижения большей in vivo доступности и экспрессии siRNA в почке Yuan et al. использовали двухнитевые олигонуклеотиды siRNA к 12/15-LO, конъюгированные с холестерином. Приблизительно 400 мкг siRNA вводили мышам путем подкожной инъекции. Способ согласно Yuang et al. можно применять по отношению к системе CRISPR-Cas по настоящему изобретению, что предусматривает подкожную инъекцию человеку 1-2 г CRISPR-Cas, конъюгированной с холестерином, для доставки в почки.

Molitoris et al. (J Am Soc Nephrol 20: 1754-1764, 2009) использовали клетки проксимальных канальцев (PTC) в качестве сайта реабсорбции олигонуклеотидов в почке для исследования эффективности siRNA, целенаправленно воздействующей на p53, ключевой белок в апоптическом пути, для предупреждения повреждения почки. "Оголенная" синтетическая siRNA к p53, которую вводили путем внутривенной инъекции через 4 ч после ишемического повреждения, обеспечивала максимальную защиту как PTC, так и функции почки. Данные Molitoris et al. указывают, что после внутривенного введения следует быстрая доставка siRNA в клетки проксимальных канальцев. Для анализа зависимости эффекта от дозы крысам инъецировали дозы siP53 0,33; 1, 3 или 5 мг/кг, которые вводили в те же четыре момента времени, что давало в результате суммарные дозы 1,32, 4, 12 и 20 мг/кг соответственно. Все протестированные дозы siRNA приводили к эффекту снижения SCr, в день один, причем более высокие дозы являлись эффективными в течение приблизительно пяти дней по сравнению с обработанными PBS контрольными крысами с ишемией. Суммарные дозы 12 и 20 мг/кг обеспечивали наилучший защитный эффект. Способ согласно Molitoris et al. можно применять по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению, что предусматривает введение человеку суммарных доз 12 и 20 мг/кг для доставки в почки.

Thompson et al. (Nucleic Acid Therapeutics, Volume 22, Number 4, 2012) сообщили о токсикологических и фармакокинетических свойствах синтетических малых интерферирующих РНК I5NP после внутривенного введения грызунам и приматам, отличным от человека. I5NP разработан так, чтобы действовать посредством пути РНК-интерференции (RNAi) для временного ингибирования экспрессии проапоптического белка p53 и создан для защиты клеток от повреждений, связанных с острой ишемией/реперфузией, как, например, острое повреждение почки, которое может возникать при обширной операции на сердце, и отсроченная функция трансплантата, которая может возникать после пересадки почки. Дозы 800 мг/кг I5NP для грызунов и 1000 мг/кг I5NP для приматов, отличных от человека, требовались для того, чтобы вызвать нежелательные эффекты, которые у обезьян сводились к непосредственному воздействию на кровь, чтовключало бессимптомную активацию комплемента и несколько увеличенное время свертывания крови. У крыс не наблюдали дополнительных нежелательных эффектов при использовании аналога I5NP, предназначенного для крыс, что указывало на то, что эти эффекты, вероятно, представляют собой эффекты, связанные с классом синтетических РНК-дуплексов, а не с токсичностью, обусловленной целевой фармакологической активностью I5NP. Взятые вместе, эти данные согласуются с клиническим исследованием с внутривенным введением I5NP для сохранения функции почек после повреждения, связанного с острой ишемией/реперфузией. Уровень, при котором не наблюдали нежелательных эффектов (NOAEL) у обезьян, составлял 500 мг/кг. Не наблюдали эффектов в отношении параметров сердечно-сосудистой, дыхательной и нервной системы у обезьян после внутривенного введения при уровнях дозы до 25 мг/кг. Следовательно, аналогичная доза может предусматриваться для внутривенного введения CRISPR-Cas в почки человека.

Shimizu et al. (J Am Soc Nephrol 21: 622-633, 2010) разработали систему для целенаправленной доставки siRNA в клубочки с помощью средств на основе поли(этиленгликоля) и поли(L-лизина). Диаметр комплекса siRNA/наноноситель составлял от приблизительно 10 до 20 нм, причем данный размер будет позволять ему проходить через окончатый эндотелий для того, чтобы попасть в мезангий. После интраперитонеальной инъекции флуоресцентно меченых комплексов siRNA/наноноситель Shimizu et al. выявляли siRNA в кровотоке в течение длительного времени. Повторное интраперитонеальное введение комплекса siRNA к митоген-активируемой протеинкиназе 1 (MAPK1)/наноноситель подавляло экспрессию мРНК и белка MAPK1 в клубочках в мышиной модели гломерулонефрита. Для исследования накопления siRNA Cy5-меченые siRNA в комплексе с PIC наноносителями (0,5 мл, содержание siRNA 5 нмоль), "оголенные" Cy5-меченые siRNA (0,5 мл, 5 нмоль) или Cy5-меченые siRNA, инкапсулированные в HVJ-E (0,5 мл, содержание 5 нмоль siRNA), вводили мышам BALBc. Способ согласно Shimizu et al. можно применять по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению, что предусматривает дозу приблизительно 10-20 мкмоль CRISPR-Cas в комплексе с наноносителями на приблизительно 1-2 литра для интраперитонеального введения человеку и доставки в почки.

Лечение заболеваний эпителия и легких

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем Cas9, в одно легкое или в оба легких.

Несмотря на то, что векторы на основе AAV-2 были изначально предложены для доставки CFTR в дыхательные пути при CF, другие серотипы, например AAV-1, AAV-5, AAV-6 и AAV-9, демонстрировали улучшенную эффективность переноса генов в ряде моделей эпителия легких (см., например, Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009). Было продемонстрировано, что AAV-1 являлся в ~100 раз более эффективным, чем AAV-2 и AAV-5 при трансдукции эпителиальных клеток дыхательных путей человека in vitro, хотя эффективность трансдукции эпителия воздухоносных путей трахеи мышей in vivo при использовании помощи AAV-1 была равной таковой для AAV-5. Другие исследования продемонстрировали, что AAV-5 являлся в 50 раз более эффективным, чем AAV-2, при доставке генов в эпителий дыхательных путей человека (HAE) in vitro и значительно более эффективным в эпителии воздухоносных путей легких мышей in vivo. Также было продемонстрировано, что AAV-6 являлся более эффективным, чем AAV-2, в эпителиальных клетках дыхательных путей человека in vitro и дыхательных путях мышей in vivo. Как было показано, изолят, обнаруженный позже, AAV-9, продемонстрировал большую эффективность переноса генов, чем AAV-5, в назальном и альвеолярном эпителии мышей in vivo, причем экспрессию гена выявляли в течение более 9 месяцев, что позволяет предположить, что AAV может обеспечивать длительную экспрессию генов in vivo, являющуюся необходимым свойством для вектора для доставки гена CFTR. Более того, было продемонстрировано, что AAV-9 можно повторно вводить в легкие мышей без потери экспрессии CFTR и с минимальными последствиями, связанными с иммунной системой. Культуры HAE с CF и без CF можно инокулировать на апикальной поверхности с использованием 100 мкл векторов на основе AAV в течение нескольких часов (см., например, Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009). MOI может варьировать от 1 × 103 до 4 × 105 векторных геномов/клетка, в зависимости от концентрации вируса и целей экспериментов. Упомянутые выше векторы предусматриваются для доставки и/или введения согласно настоящему изобретению.

Zamora et al. (Am J Respir Crit Care Med Vol 183. pp 531-538, 2011) представили пример применения терапевтического средства на основе РНК-интерференции для лечения инфекционных заболеваний человека, а также рандомизированного исследования противовирусного лекарственного средства у реципиентов трансплантата легкого, инфицированного респираторным синцитиальным вирусом (RSV). Zamora et al. провели рандомизированное, двойное слепое, плацебо-контролируемое исследование у реципиентов LTX с инфекцией дыхательных путей RSV. Пациентам давали возможность получать стандартное лечение против RSV. ALN-RSV01 в форме аэрозоля (0,6 мг/кг) или плацебо вводили ежедневно в течение 3 дней. Это исследование продемонстрировало, что терапевтическое средство на основе RNAi, целенаправленно воздействующее на RSV, можно вводить без риска реципиентам LTX с инфекцией RSV. Три ежедневные дозы ALN-RSV01 не приводили в результате к какому-либо обострению симптомов в дыхательных путях или к нарушению функции легких и не проявляли каких-либо системных провоспалительных эффектов, таких как индукция цитокинов или CRP. Фармакокинетические исследования продемонстрировали только низкий уровень временного системного воздействия после ингаляции, что согласуется с данными доклинических исследований на животных, демонстрирующих, что ALN-RSV01, вводимый внутривенно или путем ингаляции, подвергается быстрому клиренсу из кровотока с помощью опосредованного экзонуклеазами расщепления и почечной экскреции. Способ согласно Zamora et al. можно применять в отношении системы нацеливания на нуклеиновую кислоту по настоящему изобретению, и при этом CRISPR-Cas в форме аэрозоля, например, при дозе 0,6 мг/кг, может предусматриваться в соответствии с настоящим изобретением.

Schwank et al. (Cell Stem Cell, 13:653-58, 2013) использовали CRISPR-Cas9 для коррекции дефекта, ассоциированного с муковисцидозом, в стволовых клетках человека. Целью исследователей являлся ген ионного канала, рецептора трансмембранной проводимости при муковисцидозе (CFTR). Делеция в CFTR приводит к неправильной укладке белка у пациентов с муковисцидозом. С использованием культивируемых стволовых клеток кишечника, полученных из образцов клеток от двух детей с муковисцидозом, Schwank et al. смогли скорректировать дефект с использованием CRISPR вместе с донорной плазмидой, содержащей репаративную последовательность, подлежащую вставке. Исследователи затем вырастили клетки до "органоидов" кишечника или кишок небольшого размера и продемонстрировали, что они нормально функционировали. В этом случае приблизительно половина клональных органоидов подвергалась надлежащей коррекции наследственного материала.

Лечение заболеваний мышечной системы

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем Cas9, в мышцу(мышцы).

Bortolanza et al. (Molecular Therapy vol. 19 no. 11, 2055-2064 Nov. 2011) продемонстрировали, что системная доставка кассет экспрессии для РНК-интерференции у мышей FRG1 после начала проявления плече-лопаточно-лицевой мышечной дистрофии (FSHD) приводила к дозозависимому длительному нокдауну FRG1 без симптомов токсичности. Bortolanza et al. обнаружили, что однократная внутривенная инъекция 5 × 1012 vg (векторных геномов) rAAV6-sh1FRG1 восстанавливает гистопатологические характеристики мышц и функцию мышц у мышей FRG1. Более подробно, 200 мкл, содержащие 2 × 1012 или 5 × 1012 vg вектора в физиологическом растворе, вводили путем инъекции в хвостовую вену с использованием шприца Terumo с иглой 25-ого калибра. Способ согласно Bortolanza et al. можно применять в отношении AAV, экспрессирующему CRISPR Cas, и вводить его человеку путем инъекции в дозе приблизительно 2 × 1015 или 2 × 1016 vg вектора.

Dumonceaux et al. (Molecular Therapy vol. 18 no. 5, 881-887 May 2010) осуществляли ингибирование пути миостатина с применением методики РНК-интерференции, направленной против мРНК рецептора миостатина AcvRIIb (sh-AcvRIIb). Восстановление квази-дистрофина было опосредовано методикой направленного U7 пропуска экзона (U7-DYS). Векторы на основе аденоассоциированных вирусов, несущие либо только конструкцию sh-AcvrIIb, либо только конструкцию U7-DYS, или комбинацию обоих конструкций, вводили путем инъекции в переднюю большеберцовую (TA) мышцу мышей mdx с дистрофией. Инъекции осуществляли с использованием 1011 геномов вируса AAV. Способ согласно Dumonceaux et al. можно применять в отношении AAV, экспрессирующему CRISPR Cas, и вводить его человеку путем инъекции, например, в дозе от приблизительно 1014 до приблизительно 1015 vg вектора.

Kinouchi et al. (генная терапия (2008) 15, 1126-1130) сообщили об эффективности доставки siRNA in vivo в скелетные мышцы нормальных или больных мышей посредством образования наночастиц из химически не модифицированных siRNA с ателоколлагеном (ATCOL). ATCOL-опосредованное местное применение siRNA, целенаправленно воздействующей на миостатин, отрицательный регулятор роста скелетных мышц, при введении в скелетные мышцы мышей или внутривенно приводило к существенному увеличению мышечной массы в течение нескольких недель после применения. Эти результаты указывают на то, что ATCOL-опосредованное применение siRNA является мощным инструментом для дальнейшего терапевтического применения для лечения заболеваний, в том числе мышечной атрофии. Mst-siRNA (конечная концентрация, 10 мМ) смешивали с ATCOL (конечная концентрация для местного введения, 0,5%) (AteloGene, Kohken, Токио, Япония) в соответствии с инструкциями производителя. После проведения анестезии мышей (самцы C57BL/6 в возрасте 20 недель) с помощью нембутала (25 мг/кг, интраперитонеально) комплекс Mst-siRNA/ATCOL инъецировали в жевательные мышцы и двуглавую мышцу бедра. Способ согласно Kinouchi et al. можно применять в отношении CRISPR-Cas и вводить ее человеку путем инъекции, например, в дозе от приблизительно 500 до 1000 мл 40 мкМ раствора в мышцу. Hagstrom et al. (Molecular Therapy Vol. 10, No. 2, August 2004) описывали интраваскулярную методику без использования вируса, которая обеспечивает эффективную и воспроизводимую доставку нуклеиновых кислот в мышечные клетки (мышечные волокна) мышц конечности млекопитающих. Методика включает инъекцию "оголенной" плазмидной ДНК или siRNA в вену дистальной части конечности, временно изолированную с помощью жгута или пневматической манжеты. Доставка нуклеиновой кислоты в мышечные волокна обеспечивается посредством ее быстрого введения путем инъекции при объеме, достаточном для обеспечения просачивания раствора нуклеиновой кислоты в мышечную ткань. Высокие уровни экспрессии трансгена в скелетной мышце достигались как у мелких, так и у крупных животных при минимальной токсичности. Также были получены доказательства доставки siRNA в мышцу конечности. Для внутривенной инъекции плазмидной ДНК макаку-резусу трехходовый кран присоединяли к двум шприцевым насосам (Model PHD 2000; Harvard Instruments), в каждый из которых помещали один шприц. Через пять минут после инъекции папаверина вводили путем инъекции pDNA (15,5-25,7 мг в 40-100 мл физиологического раствора) при скорости 1,7 или 2,0 мл/с. Это можно воспроизводить в увеличенном масштабе для плазмидной ДНК, экспрессирующей CRISPR Cas согласно настоящему изобретению, причем с инъекцией человеку от приблизительно 300 до 500 мг в 800-2000 мл физиологического раствора. Для инъекции аденовирусного вектора крысе 2 × 109 инфекционных частиц в 3 мл физиологического солевого раствора (NSS) вводили путем инъекции. Это можно воспроизводить в увеличенном масштабе для аденовирусного вектора, экспрессирующего CRISPR Cas согласно настоящему изобретению, причем с инъекцией человеку приблизительно 1 × 1013 инфекционных частиц в 10 литрах NSS. Что касается siRNA, крысе вводили путем инъекции в большую подкожную вену 12,5 мкг siRNA, а примату вводили путем инъекции в большую подкожную вену 750 мкг siRNA. Это можно воспроизводить в увеличенном масштабе для CRISPR Cas согласно настоящему изобретению, например, путем инъекции от приблизительно 15 до приблизительно 50 мг в большую подкожную вену человека.

См. также, например, опубликованную заявку Duke University WO2013163628 A2 "Генетическая коррекция мутированных генов", в которой описаны попытки коррекции, например, мутации по типу сдвига рамки считывания, которая вызывает появление преждевременного стоп-кодона и усечение продукта гена, которую можно откорректировать посредством опосредованного нуклеазами негомологичного соединения концов, как, например, обуславливающей мышечную дистрофию Дюшенна ("DMD"), рецессивное смертельное сцепленное с X-хромосомой нарушение, приводящее к мышечной дегенерации в связи с мутациями гена дистрофина. Большинство мутаций гена дистрофина, вызывающих DMD, представляют собой делеции экзонов, нарушающие рамку считывания и вызывающие преждевременную терминацию трансляции гена дистрофина. Дистрофин представляет собой цитоплазматический белок, обеспечивающий стабильность структуры дистрогликанового комплекса клеточной мембраны, отвечающего за регуляцию целостности и функционирования мышечных клеток. Ген дистрофина или "ген DMD", как взаимозаменяемо используется в данном документе, образован 2,2 миллионами пар оснований в локусе Xp21. Размер первичного транскрипта составляет приблизительно 2400 т.п.о., при этом размер зрелой мРНК составляет приблизительно 14 т.п.о. 79 экзонов кодируют белок, образованный более 3500 аминокислотами. Экзон 51 часто является смежным с положениями делеций, нарушающих рамку считывания, у пациентов с DMD, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. Недавно в клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщали о значительном положительном функциональном эффекте в течение 48 недель со средним количеством дистрофин-положительных волокон 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством редактирования генома на основе NHEJ.

Способы согласно публикации заявки на патент США № 20130145487, закрепленной за Cellectis, которые относятся к вариантам мегануклеаз для расщепления целевой последовательности гена дистрофина человека (DMD), также можно модифицировать для системы нацеливания на нуклеиновую кислоту по настоящему изобретению.

Лечение заболеваний кожи

Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, в кожу.

Hickerson et al. (Molecular Therapy—Nucleic Acids (2013) 2, e129) обращаются к снабженному приводом устройству с матрицей микроигл для доставки в кожу, предназначенному для самостоятельной (sd) доставки siRNA в кожу человека и мыши. Основной проблемой, связанной с переносом терапевтических средств на основе siRNA для кожи в клиническую практику, является разработка эффективных систем доставки. Значительные усилия были приложены к созданию ряда методик доставки в кожу, причем с ограниченным успехом. В клиническом исследовании, в котором кожу обрабатывали siRNA, острая боль, связанная с инъекцией с помощью иглы для подкожных инъекций, препятствовала включению дополнительных пациентов в исследование, что придает большое значение потребности в улучшенных, более "удобных для пациента" (т.е. причиняющих слабую боль или не причиняющих ее) средствах доставки. Микроиглы представляют эффективный способ доставки крупных заряженных молекул-карго, включающих siRNA, через первичный барьер, роговой слой, и, как правило, считаются причиняющими меньшую боль, чем обычные иглы для подкожных инъекций. Снабженные приводом устройства "штамповочного типа" с микроиглами, в том числе снабженное приводом устройство с сеткой микроигл (MMNA), используемое Hickerson et al., как было продемонстрировано, были безопасными в исследованиях на бесшерстных мышах и причиняли слабую боль или не причиняли боли, о чем свидетельствует (i) широкое применение в косметологии и (ii) ограниченное тестирование, в котором практически все добровольцы считали применение устройства причиняющим намного меньшую боль, чем при вакцинации против гриппа, что позволяет предположить, что доставка siRNA с применением этого устройства будет намного менее болезненной, чем испытываемая в предшествующих клинических исследованиях с применением игл для подкожных инъекций. Устройство MMNA (имеющееся в продаже как Triple-M или Tri-M от Bomtech Electronic Co, Сеул, Южная Корея) адаптировали для доставки siRNA в кожу мыши и человека. Раствор sd-siRNA (до 300 мкл 0,1 мг/мл РНК) вводили в камеру одноразового инъекционного картриджа с иглами Tri-M (Bomtech), которые устанавливали на глубину 0,1 мм. Для обработки кожи человека деидентифицированную кожу (полученную непосредственно после хирургических вмешательств) растягивали вручную и прикалывали к пробковому столу перед обработкой. Все интрадермальные инъекции осуществляли с помощью инсулинового шприца с 0,5-дюймовой иглой 28 калибра. Устройство MMNA и способ согласно Hickerson et al. можно применять и/или приспосабливать для доставки CRISPR-Cas согласно настоящему изобретению, например, в дозе до 300 мкл 0,1 мг/мл CRISPR-Cas, в кожу.

В Leachman et al. (Molecular Therapy, vol. 18 no. 2, 442-446 Feb. 2010) изложено клиническое исследование фазы Ib, направленное на лечение редкого нарушения кожи врожденной пахионихии (PC), аутосомно-доминантного синдрома, которое предусматривает блокирование подошвенной кератодермии, с использованием первого терапевтического средства на основе короткой интерферирующей РНК (siRNA) для кожи. Эта siRNA, под названием TD101, специфично и эффективно целенаправленно воздействует на мРНК мутантного кератина 6a (K6a) N171K, не оказывая влияния на мРНК K6a дикого типа.

Zheng et al. (PNAS, July 24, 2012, vol. 109, no. 30, 11975-11980) продемонстрировали, что конъюгаты сферических наночастиц с нуклеиновой кислотой (SNA-NC), являющиеся ядрами из золота окружеными плотной оболочкой из строго ориентированных, ковалентно иммобилизованных siRNA, свободно проникают практически в 100% кератиноцитов in vitro, в кожу мыши и в эпидермис человека в течение нескольких часов после применения. Zheng et al. продемонстрировали, что однократное применение 25 нМ SNA-NC к рецептору эпидермального фактора роста (EGFR) в течение 60 ч продемонстрировало эффективный нокдаун гена в коже человека. Аналогичная доза может предусматриваться для CRISPR-Cas, иммобилизованной в SNA-NC для введения в кожу.

Общие положения генной терапии

Примеры ассоциированных с заболеваниями генов и полинуклеотидов и конкретная информация в отношении заболеваний доступна от Института генетической медицины МакКьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information), Национальной библиотеки медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет.

Мутации в этих генах и путях могут приводить к продуцированию несоответствующих белков или белков в несоответствующих количествах, которые воздействуют на функцию. Дополнительные примеры генов, заболеваний и белков, таким образом, включены с помощью ссылки из предварительной заявки на патент США 61/736527, поданной 12 декабря 2012 г. Такие гены, белки и пути могут быть целевым полинуклеотидом для комплекса CRISPR по настоящему изобретению.

Варианты осуществления настоящего изобретения также относятся к способам и композициям, связанным с нокаутированием генов, амплифицированием генов и репарацией конкретных мутаций, ассоциированных с нестабильностью ДНК-повторов и неврологическими нарушениями (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological заболевания, Second Edition, Academic Press, Oct 13, 2011 - Medical). Как было обнаружено, определенные аспекты последовательностей тандемных повторов ответственны за более чем двадцать заболеваний человека (New insights into repeat instability: role of RNA•DNA hybrids. McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8). Системы эффекторного белка по настоящему изобретению могут быть приспособлены для коррекции таких дефектов геномной нестабильности.

Некоторые дополнительные аспекты настоящего изобретения касаются коррекции дефектов, ассоциированных с широким спектром наследственных заболеваний, которые дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания" ("Genetic Disorders") (веб-сайт по адресу health.nih.gov/topic/GeneticDisorders). Наследственные заболевания головного мозга могут включать без ограничения адренолейкодистрофию, агенезию мозолистого тела, синдром Айкарди, синдром Альперса, болезнь Альцгеймера, синдром Барта, болезнь Баттена, CADASIL, мозжечковую дегенерацию, болезнь Фабри, синдром Герстмана-Штраусслера-Шейнкера, болезнь Гентингтона и другие связанные с триплетными повторами нарушения, болезнь Лея, синдром Леша-Найхана, болезнь Менкеса, типы митохондриальной миопатии и кольпоцефалию по критериям NINDS. Такие заболевания дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания головного мозга" ("Genetic Brain Disorders").

Иллюстративные способы применения системы CRISPR Cas

Настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, или одному или нескольким полинуклеотидам, кодирующим компоненты указанной композиции, или вектору или системам доставки, содержащим один или несколько полинуклеотидов, кодирующих компоненты указанной композиции, для применения при модификации целевой клетки in vivo, ex vivo или in vitro, и они могут быть выполнены при помощи способа, который изменяет клетку таким образом, что после модификации потомство или линия клеток клетки, модифицированной при помощи CRISPR, сохраняет измененный фенотип. Модифицированные клетки и потомство могут быть частью многоклеточного организма, такого как растение или животное, с применением ex vivo или in vivo системы CRISPR по отношению к желаемым типам клеток. Изобретение CRISPR может представлять собой терапевтический способ лечения. Терапевтический способ лечения может включать редактирование гена или генома или генную терапию.

Модификация мишени с помощью системы или комплекса CRISPR-Cas

В одном аспекте настоящее изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.

В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.

В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения.

Действительно, в любом аспекте настоящего изобретения комплекс CRISPR может содержать фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизируеющейся или способной к гибридизации с целевой последовательностью, где указанная направляющая последовательность может быть связана с парной tracr-последовательностью, которая, в свою очередь, может гибридизироваться с tracr-последовательностью.

Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Таким образом, в любом из не встречающихся в природе ферментов CRISPR, описанных в данном документе, содержится по меньшей мере одна модификация, и тем самым фермент характеризуется определенными улучшенными свойствами. В частности, любой из ферментов способен образовывать комплекс CRISPR с направляющей РНК. При образовании такого комплекса направляющая РНК способна связываться с целевой полинуклеотидной последовательностью, и фермент способен модифицировать целевой локус. Кроме того, фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом.

Кроме того, модифицированные ферменты CRISPR, описанные в данном документе, охватывают ферменты, где в комплексе CRISPR фермент характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. Такая функция может быть предусмотрена отдельно или предусмотрена в сочетании с вышеописанной функцией сниженной способности модифицировать один или несколько нецелевых локусов. Любые такие ферменты могут быть предусмотрены с одной из дополнительных модификаций фермента CRISPR, как описано в данном документе, например, в сочетании с активностью, обеспечиваемой одним или несколькими ассоциированными гетерологичными функциональными доменами, любыми дополнительными мутациями с целью снижения нуклеазной активности и т.п.

В предпочтительных вариантах осуществления настоящего изобретения предусмотрен модифицированный фермент CRISPR со сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом и повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. В сочетании с дополнительными модификациями фермента можно достичь существенно повышенной специфичности. Например, предусмотрена комбинация таких предпочтительных вариантов осуществления с одной или несколькими дополнительными мутациями, где одна или несколько дополнительных мутаций находятся в одном или нескольких каталитически активных доменах. Такие дополнительные каталитические мутации могут придавать функциональные свойства никаз, как описано подробно в других частях данного документа. В таких ферментах повышенная специфичность может быть достигнута за счет повышенной специфичности с точки зрения ферментативной активности.

Модификации для снижения нецелевых эффектов и/или повышения целевых эффектов, как описано выше, могут быть выполнены с аминокислотными остатками, расположенными в положительно заряженной области/бороздке, находящейся между доменами RuvC-III и HNH. Предполагается, что любой из функциональных эффектов, описанных выше, может быть достигнут с помощью модификации аминокислот в вышеупомянутой бороздке, однако также с помощью модификации аминокислот вблизи бороздки или за ее пределами.

Дополнительные функциональные свойства, которые могут быть сконструированы в модифицированных ферментах CRISPR, как описано в данном документе, могут включать следующее. 1. Модифицированные ферменты CRISPR, которые нарушают взаимодействие ДНК и белка без нарушения третичной или вторичной структуры белков. Это включает остатки, которые контактируют с любой частью дуплекса РНК:ДНК. 2. Модифицированные ферменты CRISPR, которые ослабляют взаимодействия между белками, удерживающими Cas9 в конформации, необходимой для разрезания нуклеазами в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая незначительно ингибирует, но по-прежнему обеспечивает конформацию нуклеазы домена HNH (располагается в поддающемся разрезанию фосфате). 3. Модифицированные ферменты CRISPR, которые усиливают взаимодействия между белками, удерживающими Cas9 в конформации, ингибирующей активность в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая стабилизирует домен HNH в конформации за пределами поддающегося разрезанию фосфата. Любое такое дополнительное функциональное усиление может быть предусмотрено в комбинации с любой другой модификацией фермента CRISPR, как описано подробно в других местах данного документа.

Любые из описанных в данном документе улучшенных функциональных свойств могут быть выполнены по отношению к любому ферменту CRISPR, такому как фермент Cas9. Ферменты Cas9, описанные в данном документе, получают из ферментов Cas9 от S. pyogenes и S. aureus. Однако предполагается, что любое из функциональных свойств, описанных в данном документе, может быть сконструировано в ферментах Cas9 от других ортологов, в том числе химерных ферментов, содержащих фрагменты из нескольких ортологов.

Нуклеиновые кислоты, аминокислоты и белки, регуляторные последовательности, векторы и прочие

В настоящем изобретении нуклеиновые кислоты используются для связывания целевых последовательностей ДНК. Это является преимущественным, поскольку получать нуклеиновые кислоты намного легче и дешевле, чем белки, и специфичность может варьировать в зависимости от длины фрагмента, если необходима гомология. Например, не требуется сложное 3-D определение положений многочисленных доменов. Термин "полинуклеотид", "нуклеотид", "нуклеотидная последовательность", "нуклеиновая кислота" и "олигонуклеотид" используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующие участки гена или фрагмента гена, локусы(локус), определенные(ый) в результате анализа сцепления, экзоны, интроны, матричная РНК (мРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенные ДНК любой последовательности, выделенные РНК любой последовательности, нуклеиновые кислоты-зонды и праймеры. Термин также охватывает структуры, подобные нуклеиновым кислотам с синтетическими каркасами, см., например, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997 и Samstag, 1996. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем соединения с компонентом для мечения. Используемый в данном документе термин "дикий тип" является термином из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которая встречаются в природе в отличие от мутантных или вариантных форм. "Дикий тип" представляет основу. Используемый в данном документе термин "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от встречающегося в природе. Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один иной компонент, с которым они естественным образом связаны в природе и встречаются в природе. "Комплементарность" означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты с помощью либо традиционного образования пар по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). "Точная комплементарность" означает, что все непрерывные остатки последовательности нуклеиновой кислоты будут связаны водородными связями с таким же количеством непрерывных остатков во второй последовательности нуклеиновой кислоты. Используемое в данном документе выражение "практически комплементарный" означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизируются при жестких условиях. Используемое в данном документе выражение"жесткие условия" в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с не подвергаемыми нацеливанию последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. В целом, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется со своей целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y. Если предполагается полинуклеотидная последовательность, то также предусматриваются комплементарные или частично комплементарные последовательности. Эти последовательности предпочтительно способны гибридизироваться с эталонной последовательностью при условиях высокой жесткости. Как правило, для доведения скорости гибридизации до максимума, выбирают условия гибридизации относительно низкой жесткости: температура на приблизительно 20-25°C ниже температуры точки плавления (Tm). Tm представляет собой температуру, при которой 50% специфичной целевой последовательности гибридизируется с точно комплементарным зондом в растворе при определенной ионной силе и pH. Как правило, если требуется по меньшей мере приблизительно 85% нуклеотидная комплементарность гибридизированных последовательностей, выбирают очень жесткие условия отмывки с температурой на приблизительно 5-15°C ниже, чем Tm. Если требуется по меньшей мере приблизительно 70% нуклеотидная комплементарность гибридизированных последовательностей, выбирают умеренно жесткие условия отмывки с температурой на приблизительно 15-30°C ниже, чем Tm. Высоко пермиссивные (очень низкой жесткости) условия отмывки могут характеризоваться наименьшей температурой на 50°C ниже Tm, что допускает высокий уровень несовпадений между гибридизированными последовательностями. Специалисты в данной области поймут, что другие физические и химические параметры на стадиях гибридизации и отмывки также можно изменять для того, чтобы повлиять на получаемый в результате выявляемый сигнал гибридизации исходя из конкретного уровня гомологии между целевой последовательностью и последовательностью зонда. Предпочтительные условия высокой жесткости предусматривают инкубацию в 50% формамиде, 5×SSC и 1% SDS при 42°C, или инкубацию при 5×SSC и 1% SDS при 65°C с отмывкой в 0,2×SSC и 0,1% SDS при 65°C. "Гибридизация" относится к реакции, в которой один или несколько полинуклеотидов вступают в реакцию с образованием комплекса, который стабилизирован посредством образования водородных связей между основаниями остатков нуклеотидов. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или посредством любого другого специфичного к последовательности способа. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида с помощью фермента. Последовательность, способную к гибридизации с данной последовательностью, называют "комплементарной последовательностью" для данной последовательности. Используемый в данном документе термин "локус генома" или "локус" (форма множественного числа локусы) представляет собой конкретное положение гена или последовательности ДНК на хромосоме. "Ген" относится к фрагментам ДНК или РНК, которые кодируют цепь полипептида или РНК, которые играют функциональную роль в организме, и, следовательно, он представляет собой молекулярную единицу наследственности в живых организмах. Для цели настоящего изобретения может считаться, что гены содержат участки, которые регулируют образование продукта гена, независимо от того являются ли регуляторные последовательности смежными с кодирующими и/или транскрибируемыми последовательностями или нет. Соответственно, ген содержит, но без обязательного ограничения, промоторные последовательности, терминаторы, регуляторные последовательности трансляции, например, сайты связывания рибосомы и сайты внутренней посадки рибосомы, энхансеры, сайленсеры, инсуляторы, граничные элементы, точки начала репликации, сайты прикрепления к матриксу и регуляторные участки локуса. Используемый в данном документе термин "экспрессия локуса генома" или "экспрессия гена" относится к процессу, в ходе которого информация гена используется в синтезе функционального продукта гена. Продукты экспрессии генов часто представляют собой белки, но у генов, не кодирующих белки, например генов rRNA или генов tRNA, продукт представляет собой функциональную РНК. Процесс экспрессии генов используется всеми известными живыми организмами - эукариотами (в том числе многоклеточными организмами), прокариотами (бактериями и археями) и вирусами для образования функциональных продуктов, необходимых для выживания. Как используется в данном документе, "экспрессия" гена или нуклеиновой кислоты охватывает не только экспрессию генов в клетках, но также транскрипцию и трансляцию нуклеиновой(нуклеиновых) кислоты(кислот) в системах клонирования и в любом другом контексте. Используемый в данном документе термин "экспрессия" также означает процесс, посредством которого полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или процесс, с помощью которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг мРНК в эукариотической клетке. Термины "полипептид", "пептид" и "белок" используются в данном документе взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Термины также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, как, например, соединением с компонентом для мечения. Используемое в данном документе выражение "аминокислота" включает природные и/или отличные от природных или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналоги аминокислот, и пептидомиметики. Используемое в данном документе выражение "домен" или "белковый домен" относится к части последовательности белка, которая может существовать и функционировать независимо от остальной части белковой цепи. Как описано в аспектах согласно настоящему изобретению, идентичность последовательности относится к гомологии последовательности. Сравнения гомологии можно проводить на глаз или, что делается чаще, с помощью легко доступных программ для сравнения последовательностей. С помощью этих коммерчески доступных компьютерных программ можно рассчитывать процент (%) гомологии между двумя или более последовательностями, а также можно рассчитывать идентичность последовательности между двумя или более аминокислотными последовательностями или последовательностями нуклеиновых кислот.

В аспектах по настоящему изобретению термин "направляющая РНК" относится к полинуклеотидной последовательности, содержащей одну или несколько предположительных или идентифицированных tracr-последовательностей или предположительных или выявленных последовательностей crRNA или направляющих последовательностей. В конкретных вариантах осуществления "направляющая РНК" содержит предположительную или идентифицированную последовательность crRNA или направляющую последовательность. В дополнительных вариантах осуществления направляющая РНК не содержит предположительной или идентифицированной tracr-последовательности.

Используемый в данном документе термин "дикий тип" является термином из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которая встречаются в природе в отличие от мутантных или вариантных форм. "Дикий тип" представляет основу.

Используемый в данном документе термин "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от встречающегося в природе.

Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один иной компонент, с которым они естественным образом связаны в природе и встречаются в природе. Во всех аспектах и вариантах осуществления, вне зависимости от того, включают ли они эти выражения, ясно, что предпочтительно они могут быть необязательными и, таким образом, предпочтительно включены или не предпочтительно не включены. Кроме того, выражения "не встречающийся в природе" и "сконструированный" можно употреблять взаимозаменяемо, и, таким образом, можно использовать по отдельности или в сочетании, и одно или другое может замещать упоминание обоих совместно. В частности, "сконструированный" является предпочтительным вместо "не встречающийся в природе" или "не встречающийся в природе и/или сконструированный".

Значения гомологии последовательности можно получить с помощью любой из ряда компьютерных программ, известных из уровня техники, например, BLAST или FASTA и т.д. Подходящей компьютерной программой для осуществления такого выравнивания является пакет программ GCG Wisconsin Bestfit (Университет Висконсина, США; Devereux et al., 1984, Nucleic Acids Research 12:387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (см. Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410) и пакет программ GENEWORKS в качестве средств для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999 ibid, pages 7-58 - 7-60). Однако, предпочтительным является использование программы GCG Bestfit. Процентное значение (%) гомологии последовательности можно рассчитывать для непрерывных последовательностей, т.е. одну последовательность выравнивают с другой последовательностью и каждую аминокислоту или нуклеотид в одной последовательности непосредственно сравнивают с соответствующей аминокислотой или нуклеотидом в другой последовательности, один остаток за один раз. Это называется выравниванием "без гэпов". Как правило, такие выравнивания без гэпов осуществляют только для относительно малого числа остатков. Несмотря на то, что этот способ является очень простым и последовательным, при его применении не учитывается то, что, например, в паре последовательностей, которые в остальном являются идентичными, одна вставка или делеция может привести к тому, что следующие за ней аминокислотные остатки не будут учитываться при выравнивании, что, таким образом, потенциально приводит в результате к значительному уменьшению % гомологии при осуществлении глобального выравнивания. Следовательно, большинство способов сравнения последовательностей разработаны для получения оптимальных выравниваний, в которых учитываются возможные вставки и делеции без наложения чрезмерного штрафа на общую гомологию или балл идентичности. Это достигается путем вставки "гэпов" в выравнивание последовательностей в попытке доведения до максимума локальной гомологии или идентичности. Однако в этих более сложных способах назначаются "штрафы за внесения гэпа" для каждого гэпа, который встречается при выравнивании, таким образом, для одинакового количества идентичных аминокислот выравнивание последовательностей с наименьшим возможным количеством гэпов, что отражает более высокую степень родства между двумя сравниваемыми последовательностями, может привести в результате к более высокому баллу, чем выравнивание с большим количеством гэпов. Как правило, используют "значения аффинного штрафа за внесение гэпа для родственных последовательностей", с использованием которых начисляют относительно высокое значение за существование гэпа и меньший штраф за каждый последующий остаток в гэпе. Это наиболее часто используемая система оценки гэпов. Конечно, высокие штрафы за внесение гэпа могут привести к оптимизированным выравниваниям с меньшим количеством гэпов. В большинстве программ выравнивания допускается изменение штрафов за внесение гэпа. Однако предпочтительно использовать значения по умолчанию при использовании такого программного обеспечения для сравнений последовательностей. Например, при использовании пакета программ GCG Wisconsin Bestfit штраф за внесение гэпа по умолчанию для аминокислотных последовательностей составляет -12 для гэпа и -4 за каждый остаток его продолжения. Для расчета максимального % гомологии, следовательно, изначально требуется получение оптимального выравнивания с учетом штрафов за внесение гэпа. Подходящая компьютерная программа для осуществления такого выравнивания представляет собой пакет программ GCG Wisconsin Bestfit (Devereux et al., 1984 Nuc. Acids Research 12, p. 387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (cм. Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. - Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410) и пакет программ GENEWORKS в качестве инструментов для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 - 7-60). Однако для некоторых задач предпочтительно использовать программу GCG Bestfit. Новый инструмент под названием BLAST 2 Sequences также доступен для сравнения белковых и нуклеотидных последовательностей (см. FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 и веб-сайт Национального центра биотехнологической информации на веб-сайте Национальных институтов здравоохранения). Несмотря на то, что конечный % гомологии можно измерять в единицах идентичности, способ выравнивания сам по себе, как правило, не основывается на сравнении пар по типу "все или ничего". Вместо этого, как правило, используется матрица замен со шкалой сходства, с использованием которой назначаются баллы для каждого попарного сравнения на основании химического сходства или эволюционного расстояния. Примером такой матрицы, используемой чаще всего, является матрица BLOSUM62 - матрица по умолчанию для набора программ BLAST. В программах GCG Wisconsin, как правило, используются либо общедоступные значения по умолчанию, либо специальные таблицы сравнения символов, если предоставляются (дополнительные подробности см. в руководстве пользователя). Для некоторых задач предпочтительным является применение общедоступных значений по умолчанию для пакета программ GCG или, в случае другого программного обеспечения, матрицы по умолчанию, например BLOSUM62. Альтернативно процентные значения гомологии можно рассчитывать с использованием функции множественного выравнивания в DNASISTM (Hitachi Software) с применением алгоритма, аналогичного CLUSTAL (Higgins DG & Sharp PM (1988), Gene 73(1), 237-244). После того, как программное обеспечение предоставит оптимальное выравнивание, возможно рассчитать % гомологии, предпочтительно % идентичности последовательности. Программное обеспечение, как правило, осуществляет это в ходе сравнения последовательностей и выдает численный результат. Последовательности также могут иметь делеции, вставки или замены аминокислотных остатков, которые приводят к молчащему изменению и приводят в результате к функционально эквивалентному веществу. Преднамеренные аминокислотные замены могут быть сделаны исходя из сходства свойств аминокислот (например, полярность, заряд, растворимость, гидрофобность, гидрофильность и/или амфипатическая природа остатков) и, следовательно, они являются применимыми для того, чтобы сгруппировать аминокислоты в функциональные группы. Аминокислоты можно сгруппировать исходя из свойств только их боковых цепей. Однако, также более полезно включить данные о мутациях. Группы аминокислот, полученные таким образом, вероятно, будут консервативными по структурным причинам. Эти группы могут быть описаны в форме диаграммы Венна (Livingstone C.D. and Barton G.J. (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756) (Taylor W.R. (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218). Консервативные замены могут быть сделаны, например, в соответствии с таблицей, представленной ниже, в которой описывается общепринятая группировка аминокислот в форме диаграммы Венна.

Группа Подгруппа
Гидрофобные F W Y H K M I L V A G C Ароматическая F W Y H
Алифатическая I L V
Полярная W Y H K R E D C S T N Q Заряженная H K R E D
Положительно заряженная H K R
Отрицательно заряженная E D
Небольшая V C A G S P T N D Маленькая A G S

Термины "субъект", "индивидуум" и "пациент" используются в данном документе взаимозаменяемо для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают без ограничения мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro.

Термины "терапевтическое средство", "оказывающее терапевтический эффект средство" или "средство для лечения" используются взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает возможность осуществления диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.

Как используется в данном документе, "лечение", или "осуществление лечения", или "временное ослабление", или "облегчение" используются взаимозаменяемо. Эти термины обозначают подход для получения благоприятных или требуемых результатов, в том числе без ограничения терапевтического эффекта и/или профилактического эффекта. Под терапевтическим эффектом понимают любое терапевтически значимое улучшение или воздействие в отношении одного или нескольких заболеваний, состояний или симптомов, лечение которых осуществляют. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.

Термин "эффективное количество" или "терапевтически эффективное количество" означает количество средства, которого достаточно для обеспечения благоприятных или желательных результатов. Терапевтически эффективное количество может изменяться в зависимости от одного или нескольких из: субъекта и болезненного состояния, которые подлежат лечению, веса и возраста субъекта, тяжести болезненного состояния, способа введения и подобного, что специалист в данной области легко может определить. Термин также применим к дозе, с помощью которой можно получить изображение для определения любым одним из способов визуализации, описанных в данном документе. Конкретная доза может изменяться в зависимости от одного или нескольких из: конкретного выбранного средства, режима дозирования, которому следуют, того, вводят ли его в комбинации с другими средствами, выбора времени введения, визуализируемой ткани и физической системы доставки, в которой оно заключено.

Практическое осуществление настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL и ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).

Некоторые аспекты настоящего изобретения касаются векторных систем, содержащих один или несколько векторов, или векторов как таковых. Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, например Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE экспрессия TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Альтернативно рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, с помощью регуляторных последовательностей промотора T7 и полимеразы T7.

Варианты осуществления согласно настоящему изобретению охватывают последовательности (как полинуклеотидные, так и полипептидные), которые могут содержать гомологичную замену (используемые в данном документе как замена, так и замещение означают обмен существующего аминокислотного остатка или нуклеотида на альтернативный остаток или нуклеотид), которая может происходить, т.е. в случае аминокислот, замену на аналогичную, например, основной на основную, кислой на кислую, полярной на полярную и т.д. Также может происходить негомологичная замена, т.е. остатка из одного класса на остаток из другого или, в альтернативном случае, связанная с включением аминокислот, отличных от природных, например, орнитина (далее в данном документе называемого Z), орнитиндиаминомасляной кислоты (далее в данном документе называемой B), норлейцинорнитина (далее в данном документе называемого O), пиридилаланина, тиенилаланина, нафтилаланина и фенилглицина. Вариантные аминокислотные последовательности могут содержать подходящие спейсерные группы, которые могут быть вставлены между любыми двумя аминокислотными остатками последовательности, в том числе алкильные группы, например, метильную, этильную или пропильную группы, в дополнение к аминокислотным спейсерам, таким как глициновые или β-аланиновые остатки. Другая форма вариации, которая включает присутствие одного или нескольких аминокислотных остатков в пептоидной форме, может быть хорошо понятна специалистам в данной области. Для того, чтобы избежать неопределенности, "пептоидная форма" используется для обозначения вариантных аминокислотных остатков, где замещающая группа для α-углерода расположена на атоме азота остатка, а не на α-углероде. Способы получения пептидов в пептоидной форме известны из уровня техники, например, Simon RJ et al., PNAS (1992) 89(20), 9367-9371 и Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134.

Моделирование гомологии. Соответствующие остатки в других ортологах Cas9 можно идентифицировать с помощью способов Zhang et al., 2012 (Nature; 490(7421): 556-60) и Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248) - компьютерного способа взаимодействия белок-белок (PPI) для прогнозирования взаимодействий, опосредованных границами домен-мотив. PrePPI (прогнозируемое PPI), структура на основе способа прогнозирования PPI, объединяет структурные доказательства с неструктурными доказательствами с использованием концепции байесовой статистики. Способ включает взятие пары белков и применение структурного выравнивания с целью выявления структурных элементов, которые соответствуют либо по своим экспериментально определенным структурам, либо по гомологичным моделям. Структурное выравнивание дополнительно используют для выявления как расположенных вблизи, так и удаленных структурных соседствующих элементов посредством общих и локальных геометрических связей. Во всех случаях, когда два соседствующих элемента из структурных элементов образуют комплекс, описанный в Protein Data Bank, он определяет матрицу для моделирования взаимодействия между двумя исследуемыми белками. Модели комплекса создают с помощью накладывания структур элементов на их соответствующий структурный соседствующий элемент в матрице. Этот подход дополнительно описан в Dey et al., 2013 (Prot Sci; 22: 359-66).

Для целей настоящего изобретения амплификация означает любой способ с использованием праймера и полимеразы, способной обеспечивать репликацию целевой последовательности с достаточной точностью. Амплификацию можно осуществлять с помощью природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli и обратная транскриптаза. Предпочтительным способом амплификации является ПЦР.

В определенных аспектах настоящее изобретение охватывает векторы. Как используется в данном документе, "вектор" представляет собой инструмент, который позволяет или облегчает перенос объекта из одной среды в другую. Он представляет собой репликон, такой как плазмида, фаг или космида, в который может быть встроен другой сегмент ДНК для осуществления таким образом репликации встроенного сегмента. Как правило, вектор способен к репликации, если ассоциирован с соответствующими элементами контроля. В целом, термин "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы (AAV)). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина). Что касается способов рекомбинации и клонирования, следует упомянуть заявку на патент США № 10/815730, опубликованную 2 сентября 2004 г. как US 2004-0171156 A1, содержание которой включено в данный документ посредством ссылки в полном объеме.

Аспекты настоящего изобретения относятся к бицистронным векторам для химерной РНК и Cas9. Бицистронные векторы экспрессии для химерной РНК и Cas9 являются предпочтительными. В целом и конкретно в данном варианте осуществления Cas9 предпочтительно управляется промотором CBh. Химерная РНК предпочтительно может управляться промотором Pol III, таким как промотор U6. Оптимальным является их сочетание. Химерная направляющая РНК, как правило, состоит из направляющей последовательности (Ns) из 20 п. о., которая может быть соединена с tracr-последовательностью (проходящей от первого "U" в нижней нити к концу транскрипта). В разных указанных положениях tracr-последовательность может быть усечена. Направляющие и tracr-последовательности разделены парной tracr-последовательностью, которая может представлять собой GUUUUAGAGCUA. За ней может следовать показанная последовательность петли GAAA. Обе из них являются предпочтительными примерами. Авторы настоящего изобретения продемонстрировали Cas9-опосредованные вставки/делеции в локусах EMX1 и PVALB человека с помощью анализов с использованием нуклеазы SURVEYOR. ChiRNA показаны путем обозначения их "+n", а crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде отдельных транскриптов. По всей данной заявке химерная РНК также может называться одиночной направляющей или синтетической направляющей РНК (sgRNA).

В некоторых вариантах осуществления предусмотрена петля в направляющей РНК. Она может представлять собой петлю на стебле или тетра-петлю. Петля предпочтительно представляет собой GAAA, но не ограничивается этой последовательностью, или действительно ее длина составляет только 4 п.о. Действительно, предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах имеют длину четыре нуклеотида и наиболее предпочтительно имеют последовательность GAAA. Однако, можно применять более длинные или более короткие последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, C или G). Примеры петлеобразующих последовательностей включают CAAA и AAAG. При осуществлении на практике любых способов, раскрытых в данном документе, подходящий вектор можно вводить в клетку или эмбрион посредством одного или нескольких способов, известных из уровня техники, в том числе без ограничения микроинъекции, электропорации, сонопорации, баллистической трансфекции, трансфекции, опосредованной фосфатом кальция, трансфекции с помощью катионных липидных частиц, липосомной трансфекции, трансфекции с помощью дендримеров, трансфекции посредством теплового шока, трансфекции посредством нуклеофекции, магнитофекции, липофекции, импалефекции, оптической трансфекции, поглощения нуклеиновых кислот, стимулируемого проприетарным средством, и доставки с помощью липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах вектор вводят в эмбрион посредством микроинъекции. Можно осуществлять микроинъекцию вектора или векторов в ядро или цитоплазму эмбриона. В некоторых способах вектор или векторы можно вводить в клетку посредством нуклеофекции.

Термин "регуляторный элемент" предназначен для охвата промоторов, энхансеров, сайтов внутренней посадки рибосомы (IRES) и других контролирующих экспрессию элементов (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.). По отношению к регуляторным последовательностям следует упомянуть заявку на патент США № 10/491026, содержание которой включено в данный документ посредством ссылки в полном объеме. По отношению к промоторам следует упомянуть PCT-публикацию WO 2011/028929 и заявку на патент США № 12/511940, содержание которых включено в данный документ посредством ссылки во их полноте.

Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE экспрессия TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Альтернативно рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, с помощью регуляторных последовательностей промотора T7 и полимеразы T7.

Векторы можно вводить и размножать в прокариоте или прокариотической клетке. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяина. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с помощью векторов, содержащих конститутивные или индуцируемые промоторы, управляющие экспрессией либо слитых белков, либо белков, отличных от слитых белков. В слитых векторах добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как, например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка путем функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолитического расщепления вводят в место соединения слитого фрагмента и рекомбинантного белка для облегчения отделения рекомбинантного белка от слитого фрагмента после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Xa, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRIT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых соответственно глутатион-S-трансфераза (GST), мальтоза-связывающий белок E или белок A слиты с целевым рекомбинантным белком. Примеры подходящих индуцируемых не являющихся слитыми векторов экспрессии для E. coli включают pTrc (Amrann et al., (1988) Gene 69:301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). В некоторых вариантах осуществления вектор является дрожжевым вектором экспрессии. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния). В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых с помощью бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).

В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих с помощью вектора экспрессии для млекопитающих. Примеры векторов экспрессии для млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании в клетках млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, обезьяньего вируса 40 и других, раскрытых в данном документе и известных из уровня техники. Что касается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.

В некоторых вариантах осуществления рекомбинантные векторы экспрессии для млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны из уровня техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (специфичный к печени; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов T-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США № 4873316 и публикация европейской заявки № 264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Gruss, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). Что касается этих прокариотических и эукариотических векторов, следует упомянуть патент США № 6750059, содержание которого включено в данный документ посредством ссылки во всей его полноте. Другие варианты осуществления по настоящему изобретению могут относиться к вирусным векторам, которые упоминаются в заявке на патент США № 13/092085, содержание которой включено в данный документ посредством ссылки во всей ее полноте. Тканеспецифичные регуляторные элементы известны из уровня техники и, в связи с этим, следует упомянуть патент США № 7776321, содержание которого включено в данный документ посредством ссылки во всей его полноте. В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR так, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (прерываемые спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у E. coli (Ishino et al., J. Bacteriol., 169:5429-5433 [1987]; и Nakata et al., J. Bacteriol., 171:3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см. Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]; и Mojica et al., Mol. Microbiol., 17:85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]; и Mojica et al., Mol. Microbiol., 36:244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182:2393-2401 [2000]). Локусы CRISPR идентифицировали у более чем 40 прокариотов (см., например, Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]; и Mojica et al., [2005]), в том числе без ограничения Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.

В целом, "система нацеливания на нуклеиновую кислоту", как используется в настоящей заявке, относится собирательно к транскриптам и другим элементам, участвующим в экспрессии или управляющих активностью CRISPR-ассоциированных ("Cas") генов нацеливания на нуклеиновую кислоту (также называемых в данном документе эффекторный белок), в том числе последовательностям, кодирующим белок Cas (эффекторный) нацеливания на нуклеиновую кислоту и направляющую РНК (содержащую последовательность crRNA и последовательность транс-активирующей РНК (tracrRNA) системы CRISPR/Cas), или другим последовательностям и транскриптам из локуса CRISPR нацеливания на нуклеиновую кислоту. В некоторых вариантах осуществления один или несколько элементов системы нацеливания на нуклеиновую кислоту получены из системы CRISPR типа V/типа VI нацеливания на нуклеиновую кислоту. В некоторых вариантах осуществления один или несколько элементов системы нацеливания на нуклеиновую кислоту получены из конкретного организма, содержащего эндогенную систему CRISPR нацеливания на нуклеиновую кислоту. В целом, система нацеливания на нуклеиновую кислоту характеризуется элементами, которые способствуют образованию комплекса нацеливания на нуклеиновую кислоту в сайте целевой последовательности. В контексте образования комплекса нацеливания на нуклеиновую кислоту "целевая последовательность" относится к последовательности, по отношению к которой направляющая последовательность сконструирована так, чтобы обладать комплементарностью, где гибридизация между целевой последовательностью и направляющей РНК способствует образованию комплекса нацеливания на ДНК или РНК. Полная комплементарность не обязательна при условии, что имеет место достаточная комплементарность для осуществления гибридизации и способствования образованию комплекса нацеливания на нуклеиновую кислоту. Целевая последовательность может содержать полинуклеотиды РНК. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления целевая последовательность может находиться в органелле эукариотической клетки, например, митохондрии или хлоропласте. Последовательность или матрицу, которую можно применять для рекомбинации в целевом локусе, содержащем целевые последовательности, называют "матрицей редактирования", или "РНК для редактирования" или "последовательностью для редактирования". В аспектах настоящего изобретения экзогенную матричную ДНК можно называть матрицей редактирования. В одном аспекте настоящего изобретения рекомбинация является гомологичной рекомбинацией.

Как правило, в контексте эндогенной системы нацеливания на нуклеиновую кислоту образование комплекса нацеливания на нуклеиновую кислоту (содержащего направляющую РНК, гибридизирующуюся с целевой последовательностью и образующую комплекс с одним или несколькими эффекторными белками для нацеливания на нуклеиновую кислоту) приводит к расщеплению одной или обеих нитей РНК в (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы нацеливания на нуклеиновую кислоту, вводят в клетку-хозяина, так что экспрессия элементов системы нацеливания на нуклеиновую кислоту управляет образованием комплекса нацеливания на нуклеиновую кислоту на одном или нескольких целевых сайтах. Например, и эффекторный белок для нацеливания на нуклеиновую кислоту, и направляющая РНК могут быть функционально связаны с отдельными регуляторными элементами на отдельных векторах. Альтернативно два или более элементов, экспрессируемых с одних и тех же или различных регуляторных элементов, можно объединять в одном векторе, при этом один или несколько дополнительных векторов обеспечивают любые компоненты системы нацеливания на нуклеиновую кислоту, не включенные в первый вектор. Элементы системы нацеливания на нуклеиновую кислоту, которые объединены в одном векторе, могут быть размещены в любой подходящей ориентации, как, например, один элемент, расположенный с 5'-конца ("выше") относительно второго элемента или 3'-конца ("ниже") относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на одной и той же или противоположной нити по отношению к кодирующей последовательности второго элемента и ориентирована в одном и том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего эффекторный белок для нацеливания на нуклеиновую кислоту и направляющую РНК, встроенных в одну или несколько интронных последовательностей (к примеру, каждая в разном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту и направляющая РНК функционально связаны с одним и тем же промотором и экспрессированы от такового.

В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с применением подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с помощью любого подходящего алгоритма для выравниваемых последовательностей, неограничивающие примеры которого включают алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (к примеру, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на soap.genomics.org.cn) и Maq (доступный на maq.sourceforge.net). В некоторых вариантах осуществления длина направляющей последовательности составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления длина направляющей последовательности составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы нацеливания на нуклеиновую кислоту, достаточные для образования комплекса нацеливания на нуклеиновую кислоту, в том числе направляющая последовательность, подлежащая тестированию, могут быть доставлены в клетку-хозяина с соответствующей целевой последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности нацеливания на нуклеиновую кислоту CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности или рядом с ней, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично расщепление целевой полинуклеотидной последовательности (или последовательности рядом с ней) может быть оценено в пробирке путем обеспечения целевой последовательности, компонентов комплекса нацеливания на нуклеиновую кислоту, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления в целевой последовательности или рядом с ней в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области.

Направляющая последовательность может быть выбрана для целенаправленного воздействия на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность представляет собой последовательность в пределах транскрипта или мРНК.

В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки.

В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в направляющей последовательности. Вторичную структуру можно определить с помощью любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного способа (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24 и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Дополнительные алгоритмы можно найти в заявке на патент США с серийным номером 61/836080); включенной в данный документ посредством ссылки.

В некоторых вариантах осуществления также предусмотрена матрица для рекомбинации. Матрица для рекомбинации может быть компонентом другого вектора, который описан в данном документе, может содержаться в отдельном векторе или предусматриваться в виде отдельного полинуклеотида. В некоторых вариантах осуществления матрица для рекомбинации разработана так, чтобы служить в качестве матрицы при гомологичной рекомбинации, как, например, в пределах целевой последовательности или рядом с ней, надрезанной или расщепленной ферментом с помощью эффекторного белка для нацеливания на нуклеиновую кислоту в качестве части комплекса нацеливания на нуклеиновую кислоту. Матричный полинуклеотид может иметь любую подходящую длину, как, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 нуклеотидов или более. В некоторых вариантах осуществления матричный полинуклеотид комплементарен части полинуклеотида, содержащего целевую последовательность. При оптимальном выравнивании матричный полинуклеотид может перекрываться с одним или несколькими нуклеотидами целевых последовательностей (к примеру, с приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 или более нуклеотидами). В некоторых вариантах осуществления при оптимальном выравнивании матричной последовательности и полинуклеотида, содержащего целевую последовательность, наиболее близкий нуклеотид матричного полинуклеотида находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от целевой последовательности.

В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к эффекторному белку нацеливания на нуклеиновую кислоту). В некоторых вариантах осуществления эффекторный белок/фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают без ограничения эпитопные метки, последовательности из генов-репортеров и белковые домены с одной или несколькими из следующих видов активности: метилазная активность, деметилазная активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК и активность связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гистидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (HA), Myc-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают без ограничения глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуоресцирующие белки, в том числе синий флуоресцентный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулами ДНК или связываются с другими клеточными молекулами, в том числе без ограничения связывающий мальтозу белок (MBP), S-метка, продукты слияния Lex A и ДНК-связывающего домена (DBD), продукты слияния GAL4 и ДНК-связывающего домена и продукты слияния белка BP16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US20110059502, включенном в данный документ с помощью ссылки. В некоторых вариантах осуществления меченый фермент CRISPR используют для идентификации расположения целевой последовательности.

В некоторых вариантах осуществления фермент CRISPR может образовывать компонент индуцируемой системы. Индуцируемая природа системы будет обеспечивать возможность пространственно-временного контроля редактирования генов или экспрессии генов с использованием определенной формы энергии. Форма энергии может включать, но без ограничения, электромагнитное излучение, звуковую энергию, химическую энергию и тепловую энергию. Примеры индуцируемой системы включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), двухгибридные системы активации транскрипции с использованием малых молекул (FKBP, ABA и т.д.) или индуцируемые светом системы (фитохром, домены LOV или криптохром). В одном варианте осуществления фермент CRISPR может быть частью индуцируемого светом транскрипционного эффектора (LITE) для управления изменениями транскрипционной активности специфичным к последовательности образом. Компоненты индуцируемой светом системы могут включать фермент CRISPR, чувствительный к свету гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых ДНК-связывающих белков и способы их применения представлены в US 61/736465 и US 61/721283 и WO 2014/018423 и US8889418, US8895308, US20140186919, US20140242700, US20140273234, US20140335620, WO2014093635, которые включены в данный документ посредством ссылки во всей полноте.

В некоторых аспектах настоящее изобретение относится к способам, включающим доставку в клетку-хозяина одного или нескольких полинуклеотидов, как, например, или одного, или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного или нескольких белков, транскрибируемых с них. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные с помощью таких способов, и организмы (такие как животные, растения или грибы), содержащие такие клетки или полученные из них. В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту в комбинации с (и необязательно образующий комплекс с) направляющей РНК доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы нацеливания на нуклеиновую кислоту, в клетки в культуре или в организме-хозяине. Системы доставки на основе невирусных векторов включают плазмидные ДНК, РНК (например, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, таким как липосома. Системы доставки на основе вирусного вектора включают ДНК- и РНК-содержащие вирусы, которые имеют либо геномы в эписомальной форме, либо интегрированные геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., в Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995); и Yu et al., Gene Therapy 1:13-26 (1994).

Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, нуклеофекцию, микроинъекцию, баллистическую трансфекцию, виросомы, липосомы, иммунолипосомы, поликатион или конъюгаты липид:нуклеиновая кислота, "оголенную" ДНК, искусственные вирионы и повышенное с помощью средства поглощение ДНК. Липофекция описана, например, в патентах США №№ 5049386, 4946787 и 4897355, и реагенты для липофекции реализуют в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции с узнаванием рецепторов полинуклеотидов, включают липиды из Felgner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, введение in vitro или ex vivo) или целевые ткани (к примеру, введение in vivo).

Получение комплексов липид:нуклеиновая кислота, в том числе нацеливающих липосом, таких как иммунолипидные комплексы, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США №№ 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).

При применении систем на основе РНК- или ДНК-содержащих вирусов для доставки нуклеиновых кислот используют преимущества тщательно разработанных способов обеспечения нацеливания вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo), или их можно использовать для обработки клеток in vitro, и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов для переноса генов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса. Интеграция в геном хозяина возможна с применением способов переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.

Тропизм ретровируса может быть изменен путем включения чужеродных белков оболочки с расширением возможной целевой популяции целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансдуцировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 т. п. о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко используемые ретровирусные векторы включают такие векторы, как основанные на вирусе лейкоза мышей (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HIV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700). В применениях, в которых транзиентная экспрессия является предпочтительной, можно применять системы на основе аденовирусов. Аденовирусные векторы способны проявлять очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С применением таких векторов были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе. Векторы на основе аденоассоциированного вируса ("AAV") также можно использовать для трансдукции в клетки целевых нуклеиновых кислот, к примеру, при получении in vitro нуклеиновых кислот и пептидов и для процедур генной терапии in vivo и ex vivo (см., к примеру, West et al., Virology 160:38-47 (1987); патент США № 4797368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Создание рекомбинантных векторов на основе AAV описано в ряде публикаций, в том числе в патенте США № 5173414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); и Samulski et al., J. Virol. 63:03822-3828 (1989).

Доставка в целом

Настоящее изобретение также охватывает по меньшей мере один компонент комплекса CRISPR, например, РНК, доставленную посредством по меньшей мере одного комплекса на основе наночастиц. В некоторых аспектах настоящее изобретение относится к способам, включающим доставку в клетку-хозяина одного или нескольких полинуклеотидов, как, например, или одного, или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного или нескольких белков, транскрибируемых с них. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные с помощью таких способов, и животных, содержащих такие клетки или полученных из них. В некоторых вариантах осуществления фермент CRISPR в комбинации с (и необязательно образующий комплекс с) направляющей последовательностью доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы CRISPR, в клетки в культуре или в организме-хозяине. Системы доставки на основе невирусных векторов включают плазмидные ДНК, РНК (например, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, таким как липосома. Системы доставки на основе вирусного вектора включают ДНК- и РНК-содержащие вирусы, которые имеют либо геномы в эписомальной форме, либо интегрированные геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al. в Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995) и Yu et al., Gene Therapy 1:13-26 (1994).

Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, микроинъекцию, баллистическую трансфекцию, доставка с помощью виросом, липосом, иммунолипосом, поликатион или конъюгатов липид:нуклеиновая кислота, "оголенной" ДНК, искусственных вирионов и повышенное с помощью определенного средства поглощение ДНК. Липофекция описана, например, в патентах США №№ 5049386, 4946787 и 4897355, и реагенты для липофекции реализуют в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции с узнаванием рецепторов полинуклеотидов, включают липиды из Felgner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, введение in vitro или ex vivo) или целевые ткани (к примеру, введение in vivo).

Получение комплексов липид:нуклеиновая кислота, в том числе нацеливающих липосом, таких как иммунолипидные комплексы, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США №№ 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).

При применении систем на основе РНК- и ДНК-содержащих вирусов для доставки нуклеиновых кислот используют тщательно разработанные способы обеспечения нацеливания вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo), или их можно использовать для обработки клеток in vitro, и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов для переноса генов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса. Интеграция в геном хозяина возможна с применением способов переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.

Тропизм ретровируса может быть изменен путем включения чужеродных белков оболочки с расширением возможной целевой популяции целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансдуцировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 т.п.о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко используемые ретровирусные векторы включают такие векторы, как основанные на вирусе лейкоза мышей (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HIV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700).

В другом варианте осуществления предусматриваются псевдотипированные ретровирусные векторные частицы на основе оболочки везикуловируса Кокал (см., например, публикацию заявки на патент США № 20120164118, закрепленной за Онкологическим исследовательским центром Фреда Хатчинсона). Вирус Кокал относится к роду Vesiculovirus и является возбудителем везикулярного стоматита у млекопитающих. Вирус Кокал изначально был выделен из клещей в Тринидаде (Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964)), и инфекции были идентифицированы в Тринидаде, Бразилии и Аргентине у насекомых, крупного рогатого скота и лошадей. Многие везикуловирусы, которые инфицируют млекопитающих, были выделены у инфицированных в естественных условиях членистоногих, что позволяет предположить, что они являются передаваемыми переносчиками. Антитела к везикуловирусам распространены у людей, живущих в сельской местности, где вирусы являются эндемичными и внутрилабораторными; причем инфекции у людей обычно приводят к гриппоподобным симптомам. Гликопротеин оболочки вируса Кокал обладает идентичностью 71,5% на аминокислотном уровне с VSV-G Индианы, причем филогенетическое сравнение генов оболочки везикуловирусов показало, что вирус Кокал серологически отличается от VSV-G штаммов Индиана, но из везикуловирусов является наиболее близкородственным с ними. Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964) и Travassos da Rosa et al., Am. J. Tropical Med. & Hygiene 33:999-1006 (1984). Псевдотипированные ретровирусные векторные частицы на основе оболочки везикуловируса Кокал могут включать, например, лентивирусные, альфаретровирусные, бетаретровирусные, гаммаретровирусные, дельтаретровирусные и эпсилонретровирусные векторные частицы, которые могут содержать ретровирусный Gag, Pol и/или один или несколько акцессорных белков и белок оболочки везикуловируса Кокал. В определенных аспектах этих вариантов осуществления Gag, Pol и дополнительные белки являются лентивирусными и/или гамма-ретровирусными. Настоящее изобретение предусматривает AAV, который содержит или состоит фактически из экзогенной молекулы нуклеиновой кислоты, кодирующей систему CRISPR, например, множество кассет, содержащих или состоящих из первой кассеты, содержащей или состоящей фактически из промотора, молекулы нуклеиновой кислоты, кодирующей CRISPR-ассоциированный (Cas) белок (предполагаемые нуклеазные или хеликазные белки), например Cas9, и терминатора, и две или более, преимущественно до предела упаковки вектора, например, всего (включая первую кассету) пять кассет, содержащих или состоящих фактически из промотора, молекулы нуклеиновой кислоты, кодирующей направляющую РНК (gRNA), и терминатора (например, каждая кассета схематически представлена как промотор-gRNA1-терминатор, промотор-gRNA2-терминатор ... промотор-gRNA(N)-терминатор (где N является количеством, которое можно встроить, находящееся на верхней границе предела упаковки вектора)), или два или более отдельных rAAV, причем каждый содержит одну или несколько кассет системы CRISPR, например первый rAAV, содержащий первую кассету, содержащую или состоящую фактически из промотора, молекулы нуклеиновой кислоты, кодирующей Cas, например, Cas (Cas9), и терминатора, и второй rAAV, содержащий несколько, четыре кассеты, кассет, содержащих или состоящих фактически из промотора, молекулы нуклеиновой кислоты, кодирующей направляющую РНК (gRNA), и терминатора (например, каждая кассета схематически представлена как промотор-gRNA1-терминатор, промотор-gRNA2-терминатор ... промотор-gRNA(N)-терминатор (где N является количеством, которое можно встроить, находящееся на верхней границе предела упаковки вектора)). Поскольку rAAV представляет собой ДНК-содержащий вирус, молекулы нуклеиновой кислоты в изложенном в данном документе обсуждении в отношении AAV или rAAV преимущественно представляют собой ДНК. В некоторых вариантах осуществления промотор преимущественно представляет собой промотор синапсина I человека (hSyn). Дополнительные способы доставки нуклеиновых кислот в клетки известны специалистам в данной области. См., например, US20030087817, включенный в данный документ посредством ссылки.

В некоторых вариантах осуществления клетка-хозяин транзиентно или нетранзиентно трасфицирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетку трансфицируют, когда она находится в естественных условиях у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, получена от субъекта. В некоторых вариантах осуществления клетка происходит из клеток, полученных от субъекта, как, например, линии клеток. Из уровня техники известен целый ряд линий клеток, применяемых в качестве культуры тканей. Примеры линий клеток включают без ограничения C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, клетки BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN/OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линию клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные разновидности. Линии клеток доступны из множества источников, известных специалистам в данной области (см., например, Американская коллекция типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную с помощью одного или нескольких векторов, описанных в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную с помощью компонентов системы CRISPR, описанной в данном документе (как, например, путем транзиентной трансфекции с помощью одного или нескольких векторов или трансфекции с использованием РНК), и модифицированную с помощью активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки с модификацией, но без любой другой экзогенной последовательности. В некоторых вариантах осуществления клетки, транзиентно или нетранзиентно трансфицированные с помощью одного или нескольких векторов, описанных в данном документе, или линии клеток, полученные из таких клеток, применяют в оценке одного или нескольких тестируемых соединений.

В некоторых вариантах осуществления один или несколько векторов, описанных в данном документе, используют для получения отличного от человека трансгенного животного или трансгенного растения. В некоторых вариантах осуществления трансгенным животным является млекопитающее, как, например, мышь, крыса или кролик. Способы получения трансгенных животных и растений известны из уровня техники и, как правило, начинаются со способа трансфекции клетки, такого как описанный в данном документе. В другом варианте осуществления может предусматриваться устройство для доставки жидкости с матрицей игл (см., например, публикацию заявки на патент США № 20110230839, закрепленной за Онкологическим исследовательским центром Фреда Хатчинсона), для доставки CRISPR-Cas в плотную ткань. Устройство согласно публикации заявки на патент США № 20110230839 для доставки жидкости в плотную ткань может содержать множество игл, расположенных в виде матрицы; множество емкостей, каждая из которых находится в жидкостном соединении с соответствующей одной иглой из множества игл; и множество приводов, функционально связанных с соответствующими емкостями из множества емкостей и выполненных с возможностью регулирования давления жидкости в емкости. В определенных вариантах осуществления каждый из множества приводов может содержать один из множества поршней, причем первая концевая часть каждого из множества поршней находится в соответствующей одной емкости из множества емкостей, и в определенных дополнительных вариантах осуществления поршни из множества поршней функционально связаны вместе по соответствующим вторым концевым частям с обеспечением возможности одновременного нажатия. В определенных других дополнительных вариантах осуществления может предусматриваться управляющий элемент для поршней, сконфигурированный с возможностью нажатия всех из множества поршней с выборочно изменяющейся скоростью. В других вариантах осуществления каждый из множества приводов может содержать одну из множества жидкостных поточных линий, имеющих первую и вторую концевые части, причем первая концевая часть каждой из множества жидкостных поточных линий соединена с соответствующей одной емкостью из множества емкостей. В других вариантах осуществления устройство может содержать источник давления жидкости, и при этом каждый из множества приводов предусматривает гидравлическую муфту между источником давления жидкости и соответствующей одной емкостью из множества емкостей. В дополнительных вариантах осуществления источник давления жидкости может предусматривать по меньшей мере одно из следующих: компрессора, вакуумного накопителя, перистальтического насоса, основного цилиндра, микроструного насоса и клапана. В другом варианте осуществления каждая из множества игл может содержать множество отверстий, распределенных вдоль ее длины.

Доставка в почки

Способы доставки в почку обобщены ниже.

Способ доставки Носитель Целевая РНК Заболевание Модель Функциональные анализы Автор
Гидродинами-ческий/липидный Система для доставки генов In Vivo TransIT, DOTAP p85α Острое повреждение почек Ишемия-реперфузия Поглощение, биораспределе-ние Larson et al., Surgery, (Aug 2007), Vol. 142, No. 2, pp. (262-269)
Гидродинами-ческий/липидный Липофектамин 2000 Fas Острое повреждение почек Ишемия-реперфузия Азот мочевины в крови, иммуногистохи-мия Fas, апоптоз, гистологическое оценивание Hamar et al., Proc Natl Acad Sci, (Oct 2004), Vol. 101, No. 41, pp. (14883-14888)
Гидродинами-ческий Не применимо Элементы апоптозного каскада Острое повреждение почек Ишемия-реперфузия Не применимо Zheng et al., Am J Pathol, (Oct 2008), Vol. 173, No. 4, pp. (973-980)
Гидродинами-ческий Не применимо Ядерный фактор каппа-би (NFkB) Острое повреждение почек Ишемия-реперфузия Не применимо Feng et al., Transplantation, (May 2009), Vol. 87, No. 9, pp. (1283-1289)
Гидродинами-ческий/вирус-ный Липофектамин 2000 Транскрипци-онный фактор, противодействующий апоптозу (AATF) Острое повреждение почек Ишемия-реперфузия Апоптоз, окислительный стресс, активация каспаз, перекисное окисление мембранных липидов Xie & Guo, Am Soc Nephrol, (Dec 2006), Vol. 17, No. 12, pp. (3336-3346)
Гидродинами-ческий Гидродинамичес-кая система доставки pBAsi mU6 Neo/TransIT-EE Гремлин Диабетичес-кая нефропатия Стрептозо-тозин-индуцированный диабет Протеинурия, сывороточный креатинин, диаметр клубочков и канальцев, экспрессия коллагена типа IV/BMP7 Q. Zhang et al., PloS ONE, (Jul 2010), Vol. 5, No. 7, e11709, pp. (1-13)
Вирусный/
липидный
Вектор pSUPER/Lipofectamine Рецептор TGF-β II типа Интерстици-альный фиброз почек Односто-ронняя обструкция мочеиспускательного канала Экспрессия α-SMA, содержание коллагена Kushibikia et al., J Controlled Release, (Jul 2005), Vol. 105, No. 3, pp. (318-331)
Вирусный Аденоассоцииро-ванный вирус-2 Минералокортикоидный рецептор Поражение почек, вызванное гипертензии-ей Гипертензия, вызванная холодовым воздействии-ем Кровяное давление, сывороточный альбумин, азот мочевины в сыворотке, сывороточный креатинин, вес почки, натрий в моче Wang et al., Gene Therapy, (Jul 2006), Vol. 13, No. 14, pp. (1097-1103)
Гидродинами-ческий/
вирусный
Вектор pU6 Люцифераза Не применимо Не применимо Поглощение Kobayashi et al., Journal of Pharmacology and Experimental Therapeutics, (Feb 2004), Vol. 308, No. 2, pp. (688-693)
Липидный Липопротеины, альбумин apoB1, apoM Не применимо Не применимо Поглощение, аффинность связывания с липопротеинами и альбумином Wolfrum et al., Nature Biotechnology, (Sep 2007), Vol. 25, No. 10, pp. (1149-1157)
Липидный Липофектамин 2000 p53 Острое повреждение почек Острое поврежде-ние, индуциро-ванное ишемией и цисплатином Гистологическое оценивание, апоптоз Molitoris et al., J Am Soc Nephrol, (Aug 2009), Vol. 20, No. 8,
pp. (1754-1764)
Липидный DOTAP/DOPE, DOTAP/DOPE/DOPE-PEG2000 COX-2 Аденокар-цинома молочной железы Мышь, несущая ксенотрансплантат опухоли молочной железы MDA-MB-231 Жизнеспособ-ность клеток, поглощение Mikhaylova et al., Cancer Gene Therapy, (Mar 2011), Vol. 16, No. 3, pp. (217-226)
Липидный Холестерин 12/15-липоксиге-наза Диабетичес-кая нефропатия Стрептозо-тоцин-индуциро-ванный диабет Альбуминурия, креатинин в моче, гистологическое исследование, коллаген типа I и IV, TGF-β, фибронектин, ингибитор 1 активатора плазминогена Yuan et al., Am J Physiol Renal Physiol, (Jun 2008), Vol. 295, pp. (F605-F617)
Липидный Липофектамин 2000 Белок 44 митохондриа-льной мембраны (TIM44) Диабетичес-кая нефропатия Стрептозо-тоцин-индуциро-ванный диабет Пролиферация и апоптоз клеток, гистологическое исследование, ROS, митохондриаль-ный импорт Mn-SOD и глутатионперок-сидазы, поляризация клеточной мембраны Y. Zhang et al., J Am Soc Nephrol, (Apr 2006), Vol. 17, No. 4, pp. (1090-1101)
Гидродинами-ческий/
липидный
Протеолипосома RLIP76 Карцинома почки Мышь, несущая ксенотранс-плантат опухоли почки Caki-2 Поглощение Singhal et al., Cancer Res, (May 2009), Vol. 69, No. 10, pp. (4244-4251)
Полимерный Пегилированный PEI Люцифераза pGL3 Не применимо Не применимо Поглощение, биораспределе-ние, агрегация эритроцитов Malek et al., Toxicology and Applied Pharmacology, (Apr 2009), Vol. 236, No. 1, pp. (97-108)
Полимерный Пегилированный
поли-L-лизин
MAPK1 Волчаноч-ный гломеруло-нефрит Гломеруло-нефрит Протеинурия, гломерулоскле-роз, TGF-β, фибронектин, ингибитор 1 активатора плазминогена Shimizu et al., J Am Soc Nephrology, (Apr 2010), Vol. 21, No. 4, pp. (622-633)
Полимерный/с помощью наночастиц Гиалуроновая кислота/квантовая точка/PEI VEGF Рак почки/
меланома
Мышь, несущая меланому B16F1 Биораспределе-ние, цитотоксичность, объем опухоли, эндоцитоз Jiang et al., Molecular Pharmaceutics, (May-Jun 2009), Vol. 6, No. 3, pp. (727-737)
Полимерный/с помощью наночастиц Пегилированное поликапролакто-новое нановолокно GAPDH Не применимо Не применимо Жизнеспособ-ность клеток, поглощение Cao et al., J Controlled Release, (Jun 2010), Vol. 144, No. 2, pp. (203-212)
Аптамерный Шпигельмер
mNOX-E36
Лиганд 2 CC-хемокина Гломеруло-склероз Односто-ронне нефрэктоми-зированная мышь Альбумин в моче, креатинин в моче, гистопатологиче-ское исследование, скорость клубочковой фильтрации, число макрофагов, сывороточный уровень Ccl2, Mac- 2+, Ki-67+ Ninichuk et al., Am J Pathol, (Mar 2008), Vol. 172, No. 3, pp. (628-637)
Аптамерный Аптамер NOX-F37 Вазопрессин (AVP) Застойная сердечная недостаточ-ность Не применимо Аффинность связывания с D-AVP, ингибирование AVP-сигналинга, осмоляльность мочи и концентрация натрия Purschke et al., Proc Natl Acad Sci, (Mar 2006), Vol. 103, No. 13, pp. (5173-5178)

Доставка в мозг

Варианты доставки в головной мозг включают инкапсулирование фермента CRISPR и направляющей РНК в форме ДНК или РНК в липосомы и конъюгацию с "молекулярными троянскими конями" для доставки через гематоэнцефалический барьер (BBB). Было показано, что "молекулярные троянские кони" являются эффективными для доставки векторов экспрессии B-gal в головной мозг отличных от человека приматов. Этот же подход можно применять для доставки векторов, содержащих фермент CRISPR и направляющую РНК. Например, Xia CF and Boado RJ, Pardridge WM ("Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology." Mol Pharm. 2009 May-Jun;6(3):747-51. doi: 10.1021/mp800194) описывают возможность доставки коротких интерферирующих РНК (siRNA) в клетки в культуре и in vivo в случае комбинированного применения моноклонального антитела (mAb), специфичного к рецептору, и авидин-биотиновой технологии. Авторы также сообщают, что, поскольку в случае применения авидин-биотиновой технологии связь между нацеливающим mAb и siRNA является устойчивой, и после внутривенного введения целенаправленно воздействующей siRNA наблюдаются эффекты RNAi in vivo в отдаленных участках, таких как головной мозг.

Zhang et al. (Mol Ther. 2003 Jan;7(1):11-8.)) описывают, как экспрессионные плазмиды, кодирующие репортеры, такие как люцифераза, инкапсулировали во внутреннее пространство "искусственного вируса", включающего пегилированную иммунолипосому размером 85 нм, нацеливаемую на головной мозг макака-резуса in vivo с помощью моноклонального антитела (MAb) к рецептору инсулина человека (HIR). MAb к HIR позволяет липосоме, несущей экзогенный ген, подвергаться трансцитозу через гематоэнцефалический барьер и эндоцитозу через плазматическую мембрану нейронов после внутривенной инъекции. Уровень экспрессии гена люциферазы в головном мозге у макака-резуса был в 50 раз выше по сравнению с крысой. Широко распространенная экспрессия гена бета-галактозидазы в нейронах головного мозга приматов была продемонстрирована с помощью как гистохимического анализа, так и конфокальной микроскопии. Авторы указывают, что данный подход позволяет достичь обратимой экспрессии трансгена у взрослых животных в течение 24 часов. Соответственно, применение иммунолипосом является предпочтительным. Их можно использовать в сочетании с антителами для нацеливания на конкретные ткани или белки клеточной поверхности.

HSC-доставка в гемопоэтические стволовые клетки и редактирование в них; определенные условия

Термин "гемопоэтическая стволовая клетка" или "HSC" включает в широком смысле те клетки, которые считаются HSC, например, клетки крови, которые приводят к образованию всех других клеток крови и получены из мезодермы; расположены в красном костном мозге, содержащемся во внутренней части большинства костей. HSC по настоящему изобретению включают клетки, имеющие фенотип гемопоэтических стволовых клеток, идентифицированных по небольшому размеру, отсутствию линейных (lin) маркеров и маркеров, которые принадлежат к кластеру серий дифференцировки, например: CD34, CD38, CD90, CD133, CD105, CD45, а также c-kit, - рецептор фактора стволовых клеток. Гемопоэтические стволовые клетки являются отрицательными по отношению к маркерам, которые используют для выявления детерминации дифференцировки, и, таким образом, называются Lin-; и во время их очистки с помощью FACS ряда из до 14 включительно маркеров линий зрелых клеток крови, например, CD13 и CD33 для миелодиных, CD71 - для эритроидных, CD19 - для B-клеток, CD61 - для мегакариоцитарных клеток и т.д., например, для человека; и B220 (мышиный CD45) - для B-клеток, Mac-1 (CD11b/CD18) - для моноцитов, Gr-1 - для гранулоцитов, Ter119 - для эритроидных клеток, Il7Ra, CD3, CD4, CD5, CD8 - для T-клеток и т.д. Маркеры мышиных HSC: CD34lo/-, SCA-1+, Thy1.1+/lo, CD38+, C-kit+, lin-, и маркеры человеческих HSC: CD34+, CD59+, Thy1/CD90+, CD38lo/-, C-kit/CD117+ и lin-. HSC идентифицируют с помощью маркеров. Таким образом, в вариантах осуществления, описанных в данном документе, HSC могут представлять собой CD34+ клетки. HSC также могут представлять собой гемопоэтические стволовые клетки, которые являются CD34-/CD38-. Стволовые клетки, у которых может отсутствовать c-kit на клеточной поверхности, которые считаются в данной области в качестве HSC, находятся в объеме настоящего изобретения, а также CD133+ клетки, аналогично считаются HSC в данной области.

Система CRISPR-Cas (например, Cas9) может быть сконструирована для нацеливания на локус гена или локусы в HSC. Можно получить белок (например, Cas9), преимущественно кодон-оптимизированный по отношению к эукариотической клетке и, в частности, клетке млекопитающих, например, человеческой клетке, например, HSC, и sgRNA, нацеливающуюся на локус или локусы в HSC, например, ген EMX1. Их можно доставлять посредством частиц. Частицы могут образовываться с помощью белка Cas (например, Cas9) и добавляемой sgRNA. Смесь sgRNA и белка Cas (например, Cas9) можно смешивать, например, со смесью, содержащей или состоящей фактически из или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта, при этом могут образовываться частицы, содержащие sgRNA и белок Cas (например, Cas9). Настоящее изобретение охватывает образованные таким образом частицы и частицы, полученные с помощью такого способа, а также варианты их применения.

В более общем смысле частицы могут быть образованы с применением эффективного способа. Прежде всего, белок Cas (например, Cas9) и sgRNA, нацеленную на ген EMX1 или контрольный ген LacZ, можно смешивать вместе при подходящем молярном соотношении, например, 3:1-1:3, или 2:1-1:2, или 1:1, при подходящей температуре, например, 15-30C, например, 20-25C, например, комнатной температуре, в течение подходящего периода времени, например, 15-45, как, например, 30 минут, преимущественно в стерильном буфере без нуклеаз, например, 1X PBS. В отдельности, компоненты частиц, такие как или включающие поверхностно-активное вещество, например, катионный липид, например, 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); фосфолипид, например, димиристоилфосфатидилхолин (DMPC); биоразлагаемый полимер, такой как полимер этиленгликоля или PEG, и липопротеин, такой как липопротеин низкой плотности, например, холестерин, можно растворять в спирте, преимущественно C1-6 алкиловом спирте, таком как метанол, этанол, изопропанол, например, 100% этанол. Два раствора можно смешивать вместе с образованием частиц, содержащих комплексы Cas (например, Cas9)-sgRNA. В определенных вариантах осуществления частица может содержать матрицу для HDR. Это может быть частица, совместно введенная с частицей, содержащей sgRNA+белок Cas (например, Cas9), т.е. в дополнение к приведению HSC в контакт с частицей, содержащей sgRNA+белок Cas (например, Cas9), при этом HSC приводят в контакт с частицей, содержащей матрицу для HDR; или HSC приводят в контакт с частицей, содержащей все из sgRNA, Cas (например, Cas9) и матрицы для HDR. Матрицу для HDR можно вводить с помощью отдельного вектора, при этом в первом случае частица проникает в клетку HSC и отдельный вектор также проникает в клетку, где геном HSC модифицирован sgRNA+Cas (например, Cas9) и также присутствует матрица для HDR, при этом локус генома модифицирован посредством HDR; например, это может приводить к исправлению мутации.

После образования частиц HSC в 96-луночных планшетах можно трансфицировать с помощью 15 мкг белка Cas (например, Cas9) на лунку. Через три дня после трансфекции можно собирать HSC и определять количество вставок и делеций (вставок/делеций) в локусе EMX1.

Это иллюстрирует то, как HSC можно модифицировать с помощью CRISPR-Cas (например, Cas9), нацеливающейся на представляющий интерес локус генома или локусы в HSC. HSC, которые подлежат модификации, могут находиться in vivo, например, в организме, например, человеке или отличном от человека эукариотическом организме, например, животном, таком как рыба, например, данио-рерио, млекопитающем, например, примате, например, человекообразной обезьяне, шимпанзе, макаке, грызуне, например, мыши, кролике, крысе, кошке или собаке, домашнем скоте (корове/быке, баране/овце, козе или свинье), дикой или домашней птице, например, курице. HSC, которые подлежат модификации, могут находиться in vitro, т.е. за пределами такого организма. Также модифицированные HSC можно использовать ex vivo, т.е., одну или нескольких таких HSC такого организма можно получить или выделить из организма, необязательно HSC можно разращивать, HSC модифицируют с помощью композиции, содержащей CRISPR-Cas (например, Cas9), которая нацеливается на локус гена или локусы в HSC, например, при приведении HSC в контакт с композицией, например, где композиция содержит фермент CRISPR и одну или несколько sgRNA, которая нацеливается на локус гена или локусы в HSC, например, частица, полученная или получаемая при смешивании sgRNA и белка Cas (например, Cas9) со смесью, содержащей или состоящей фактически или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта (где одна или несколько sgRNA нацеливаются на локус гена или локусы в HSC), необязательно разращивать полученные модифицированные HSC и вводить в организм полученные модифицированные HSC. В некоторых примерах выделенные или полученные HSC могут происходить из первого организма, такого как организм того же самого вида, что и второй организм, и второй организм может представлять собой организм, в который вводят полученные модифицированные HSC, например, первый организм может быть донором (например, родственником, как в случае родителя или сибса) для второго организма. Модифицированные HSC могут иметь генетические мутации для лечения, облегчения или ослабления симптомов заболевания или состояния индивидуума, или субъекта, или пациента. Модифицированные HSC, например, в случае, когда первый организм является донором для второго организма, могут иметь генетические модификации с тем, чтобы HSC имели один или несколько белков, например, поверхностных маркеров или белков, которые более подобны, чем у второго организма. Модифицированные HSC могут иметь генетические модификации для имитации заболевания или состояния индивидуума, или субъекта, или пациента и могут быть повторно введены в отличный от человека организм с получением животной модели. Разращивание HSC находится в пределах компетенции специалиста в данной области исходя из настоящего изобретения и знаний в данной области, см., например, Lee, "Improved ex vivo expansion of adult hematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4." Blood. 2013 May 16;121(20):4082-9. doi: 10.1182/blood-2012-09-455204. Epub 2013 Mar 21.

Как указано, для повышения активности sgRNA можно обеспечивать предварительное образование комплекса sgRNA с белком Cas (например, Cas9) перед составлением целого комплекса в частице. Составы можно получать с различным молярным соотношением различных компонентов, известных как способствующие доставке нуклеиновых кислот в клетки (например, 1,2-диолеоил-3-триметиламмоний-пропан (DOTAP), 1,2-дитетрадеканоил-sn-глицеро-3-фосфохолин (DMPC), полиэтиленгликоль (PEG) и холестерин). Например, молярные соотношения DOTAP: DMPC: PEG: холестерин могут быть следующими: DOTAP 100, DMPC 0, PEG 0, холестерин 0; или DOTAP 90, DMPC 0, PEG 10, холестерин 0; или DOTAP 90, DMPC 0, PEG 5, холестерин 5. DOTAP 100, DMPC 0, PEG 0, холестерин 0. Настоящее изобретение, соответственно, охватывает смешивание sgRNA, белка Cas (например, Cas9) и компонентов, которые образуют частицу; а также частицы в результате такого добавления.

В предпочтительном варианте осуществления частицы, содержащие комплекс Cas (например, Cas9)-sgRNA, могут быть образованы путем смешивания белка Cas (например, Cas9) и одной или нескольких sgRNA вместе, предпочтительно при молярном соотношении фермент:направляющая РНК 1:1. В отдельности, различные компоненты, известные как способствующие доставке нуклеиновых кислот (например, DOTAP, DMPC, PEG и холестерин), являются растворенными, предпочтительно в этаноле. Два раствора можно смешивают вместе с образованием частиц, содержащих комплексы Cas (например, Cas9)-sgRNA. После образования частиц комплексами Cas (например, Cas9)-sgRNA можно трансфицировать клетки (например HSC). Можно применять штрихкодирование. Частицы, Cas-9 и/или sgRNA можно штрихкодировать.

Настоящее изобретение в одном варианте осуществления предусматривает способ получения частицы, содержащей комплекс из sgRNA и белка Cas (например, Cas9), включающий перемешивание смеси sgRNA и белка Cas (например, Cas9) со смесью, содержащей, состоящей по сути из, или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта. Вариант осуществления охватывает частицу, содержащую комплекс из sgRNA и белка Cas (например, Cas9), полученную посредством данного способа. Настоящее изобретение в варианте осуществления охватывает применение частицы в способе модифицирования представляющего интерес локуса генома, или организма, или отличного от человека организма путем манипуляции с целевой последовательностью в представляющем интерес локусе генома, включающем приведение клетки, содержащей представляющий интерес локус генома, в контакт с частицей, где sgRNA осуществляет нацеливание на представляющий интерес локус генома; или способе модификации представляющего интерес локуса генома, или организма, или отличного от человека организма путем манипуляции с целевой последовательностью в представляющем интерес локусе генома, включающем приведение клетки, содержащей представляющий интерес локус генома, в контакт с частицей, где sgRNA осуществляет нацеливание на представляющий интерес локус генома. В этих вариантах осуществления представляющий интерес локус генома является предпочтительно локусом генома в HSC.

Факторы, которые следует учитывать для применений в терапии Фактор в терапии на основе редактирования генома представляет собой выбор специфичной по отношению к последовательностям нуклезы, такой как вариант нуклеазы Cas9. Каждый вариант нуклеазы может обладать своим собственным специфичным набором сильных и слабых сторон, многие из которых должны быть сбалансированы в контексте лечения для сведения к максимуму терапевтического эффекта. До настоящего времени два подхода редактирования с терапевтической целью с применением нуклеаз продемонстрировали значительные перспективы: нарушение функционирования гена и коррекция гена. Нарушение функционирования гена охватывает стимуляцию NHEJ для создания целенаправленных вставок/делеций в генетических элементах, часто приводящих к мутациям с потерей функций, которые являются полезными для пациентов. Напротив, при коррекции гена используется HDR для прямой регрессии мутаций, вызывающих заболевание, с восстановлением функции при сохранении физиологической регуляции cкорректированного элемента. HDR также может применяться для вставки терапевтического трансгена в определенный "безопасный" локус в геноме для восстановления отсутствующей функции гена. С целью обеспечения эффективности специфической терапии с применением редактирования должен достигаться достаточно высокий уровень модификации в целевых клеточных популяциях для вызова обратного развития симптомов заболевания. Этот "порог" терапевтической модификации определяют путем определения пригодности редактированных клеток после обработки и количества продукта гена, необходимого для устранения симптомов. Что касается пригодности, редактирование предусматривает возникновение трех возможных результатов для обработанных клеток по сравнению с их нередактированными аналогами: повышенная, нейтральная или сниженная пригодность. В случае повышенной пригодности, например, при лечении SCID-X1, модифицированные кроветворные клетки-предшественники селективно разрастаются по сравнению с их нередактированными аналогами. SCID-X1 представляет собой заболевание, вызываемое мутациями в гене IL2RG, функция которого требуется для правильного развития лимфоцитарного ростка кроветворения [Leonard, W.J., et al. Immunological reviews 138, 61-86 (1994); Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010)]. В клинических испытаниях с пациентами, которые получали генную терапию с использованием вирусов для SCID-X1, и в редком примере спонтанной коррекции мутации SCID-X1 скорректированные кроветворные клетки-предшественники по сравнению с их пораженными заболеванием аналогами могли преодолевать это блокирование развития и разрастались, способствуя терапии [Bousso, P., et al. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000); Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004)]. В данном случае, когда редактированные клетки обладают преимуществом при отборе, даже небольшие количества редактированных клеток можно увеличивать посредством разрастания, обеспечивая терапевтический эффект для пациента. Напротив, редактирование в отношении других заболеваний системы кроветворения, таких как хроническая гранулематозная болезнь (CGD), не будет индуцировать изменений пригодности для редактированных кроветворных клеток-предшественников, повышая порог терапевтической модификации. CGD вызывается мутациями в генах, кодирующих белки фагоцитарной оксидазы, которые обычно используются нейтрофилами для образования активных форм кислорода, уничтожающих патогены [Mukherjee, S. & Thrasher, A.J. Gene 525, 174-181 (2013)]. Поскольку дисфункция этих генов не влияет на пригодность или развитие кроветворных клеток-предшественников, а только на способность гемопоэтических кроветворных зрелого типа бороться с инфекциями, вероятно, не будет наблюдаться предпочтительная экспансия отредактированных клеток при данном заболевании. Действительно, не наблюдалось преимущества при отборе в отношении скорректированных клеток CGD при испытаниях с генной терапией, что приводило к сложностям длительного приживления клеток [Malech, H.L., et al. Proceedings of the National Academy of Sciences of the United States of America 94, 12133-12138 (1997); Kang, H.J., et al. Molecular therapy: the journal of the American Society of Gene Therapy 19, 2092-2101 (2011)]. Как таковые, значительно более высокие уровни редактирования будут требоваться для лечения заболеваний, таких как CGD, где редактирование обуславливает преимущественно нейтральную пригодность, по сравнению с заболеваниями, где редактирование обуславливает повышенную пригодность целевых клеток. Если редактирование вносит недостаток пригодности, как это было бы в случае восстановления функции гена-супрессора опухолевого роста в раковых клетках, пораженные заболеванием аналоги будут вытеснять модифицированные клетки, в результате чего польза от лечения будет ниже по сравнению со скоростью редактирования. Этот последний класс заболеваний было бы особенно сложно лечить с помощью терапии с применением редактирования генома.

В дополнение к пригодности клеток количество продукта гена, необходимого для лечения заболевания, также влияет на минимальный уровень редактирования генома с терапевтической целью, который должен достигаться для обратного развития симптомов. Гемофилия B является одним из заболеваний, в котором небольшое изменение уровней продукта гена может приводить к значительным изменениям клинических результатов. Данное заболевание вызывается мутациями в гене, кодирующем фактор IX, белок, обычно секретируемый печенью в кровь, где он функционирует в качестве компонента каскада свертывания крови. Клиническая тяжесть гемофилии B связана с величиной активности фактора IX. Ввиду того, что заболевание тяжелой степени ассоциировано с активностью менее 1% от нормальной, более легкие формы заболеваний ассоциированы с более чем 1% активности фактора IX [Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010); Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]. Это позволяет предположить, что варианты терапии с применением редактирования, которые могут восстанавливать экспрессию фактора IX в клетках печени до даже небольшого процента, могут оказывать большое влияние на клинические результаты. Исследование с применением ZFN для коррекции мышиной модели гемофилии B вскоре после рождения продемонстрировало, что 3-7% коррекция была достаточной для устранения симптомов заболевания, обеспечивая доклиническое подтверждение данной гипотезы [Li, H., et al. Nature 475, 217-221 (2011)].

Нарушения, при которых небольшое изменение уровней продукта гена может влиять на клинические результаты, и заболевания, где имеет место преимущество пригодности редактированных клеток, представляют собой превосходные мишени для терапии с применением редактирования генома, поскольку порог терапевтической модификации является достаточно низким для обеспечения высокой вероятности успеха с учетом современных технологий. Целенаправленное воздействие на данные заболевания на сегодняшний день привело к успехам в терапии с применением редактирования на доклиническом уровне и в фазе I клинического испытания. Усовершенствования в манипуляции путем репарации DSB и доставкой нуклеаз необходимы для распространения данных многообещающих результатов на заболевания с преимуществом нейтральной пригодности отредактированных клеток, или где для лечения необходимы более значительные количества продукта гена. В таблице, приведенной ниже, показаны некоторые примеры вариантов применения редактирования генома по отношению к терапевтическим моделям и ссылки из приведенной ниже таблицы и документы, которые перечислены в этих ссылках, включены в данный документ посредством ссылки, как если бы они были изложены в полном объеме.

Тип заболевания Применяемая нуклеазная платформа Терапевтическая стратегия Ссылки
Гемофилия B ZFN Опосредованная HDR вставка правильной последовательности гена Li, H., et al. Nature 475, 217-221 (2011)
SCID ZFN Опосредованная HDR вставка правильной последовательности гена Genovese, P., et al. Nature 510, 235-240 (2014)
Наследственная тирозинемия CRISPR Опосредованная HDR коррекция мутации в печени Yin, H., et al. Nature biotechnology 32, 551-553 (2014)

Лечение каждого из таких состояний из предшествующей таблицы с помощью системы CRISPR-Cas (например, Cas9) для нацеливания с помощью HDR-опосредованной коррекции мутации или HDR-опосредованной вставки надлежащей последовательности гена, предпочтительно посредством системы доставки, как описано в данном документе, например, системы доставки частицы, находится в пределах компетенции специалиста в данной области, исходя из настоящего изобретения и знаний в данной области. Таким образом, вариант осуществления охватывает приведение HSC, несущей мутацию, приводящую к гемофилии B, SCID (например, SCID-X1, ADA-SCID) или врожденной тирозинемии, в контакт с sgRNA и белком Cas (например, Cas9), осуществляющими нацеливание нa представляющий интерес локус генома, связанный с гемофилией B, SCID (например, SCID-X1, ADA-SCID) или врожденной тирозинемией (например, как описано в Li, Genovese или Yin). Частица также может содержать подходящую матрицу для HDR для коррекции мутации; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. В этом отношении упоминается, что гемофилия B представляет собой сцепленное с Х-хромосомой рецессивное нарушение, вызванное мутациями с потерей функций в гене, кодирующем фактор IX, важный компонент каскада свертывания крови. Восстановление активности фактора IX до приблизительно 1% от его уровней у тяжело пораженных индивидуумов может трансформировать заболевание в значительно более легкую форму, поскольку профилактическая инфузия рекомбинантного фактора IX у таких пациентов с раннего возраста для получения таких уровней в значительной степени облегчает тяжесть клинических осложнений. Специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC в отношении гемофилии B с применением системы CRISPR-Cas (например, Cas9), которая нацеливается на мутацию и корректирует ее (сцепленное с Х-хромосомой рецессивное нарушение, вызванное мутациями с потерей функции гена, кодирующем фактор IX) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для фактора IX); в частности, sgRNA может осуществлять нацеливание на мутацию, которая приводит к возникновению гемофилии B, и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии фактора IX. sgRNA, которая нацеливается на мутацию и частицу, содержащую белок Cas (например, Cas9), контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии фактора IX; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier., описанный в данном документе.

В публикации Cartier "MINI-SYMPOSIUM: X-Linked Adrenoleukodystrophypa, Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy", Brain Pathology 20 (2010) 857-862, включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены так, если бы они были изложены в полном объеме, представлено подтверждение того, что аллогенную трансплантацию кроветворных стволовых клеток (HSCT) использовали для доставки нормального лизосомального фермента в головной мозг пациента с болезнью Гурлера, и описание генной терапии HSC для лечения ALD. У двух пациентов периферичные CD34+клетки собирали после активации гранулоцитарного колониестимулирующего фактора (G-CSF) и трансдуцировали лентивирусным вектором (MND)-ALD с энхансером миелопролиферативного вируса саркомы мышей, удаленным участком отрицательного контроля, замещенным сайтом связывания праймера dl587rev. CD34+ клетки пациентов трансдуцировали вектором MND-ALD в течение 16 ч в присутствии цитокинов в низких концентрациях. Трансдуцированные CD34+ клетки замораживали после трансдукции для выполнения на 5% клеток ряда испытаний на безопасность, которые включали, в частности, три анализа на присутствие компетентных по репликации лентивирусов (RCL). Эффективность трансдукции CD34+ клеток находилась в диапазоне от 35% до 50% со средним количеством интегрированных копий лентивируса 0,65-0,70. После размораживания трансдуцированных CD34+ клеток пациентам проводили повторную инфузию более чем 4,106 трансдуцированных CD34+ клеток/кг с последующим полным разрушением миелиновых оболочек с применением бусульфана и циклофосфамида. Разрушали HSC пациента, способствуя приживлению генетически скорректированных HSC. Гематологическое восстановление для двух пациентов наступало в дни 13-15. Почти полное иммунологическое восстановление наступало через 12 месяцев для первого пациента и через 9 месяцев для второго пациента. В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно ALD с применением системы CRISPR-Cas (Cas9), которая нацеливается на мутацию и корректирует ее (например, с помощью подходящей матрицы для HDR); в частности, sgRNA может осуществлять нацеливание на мутации в ABCD1, гене, который локализован на X-хромосоме, который кодирует ALD, мембранный транспортный белок пероксисом, и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии белка. sgRNA, которая нацеливается на мутацию и частицу, содержащую белок Cas (Cas9), контактирует с HSC, например, CD34+ клетками, несущими мутацию, как описано в Cartier. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью экспрессии пероксисомального мембранного белка-переносчика; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приводимые таким образом в контакт клетки необязательно можно обрабатывать, как описано в Cartier. Приводимые таким образом в контакт клетки можно вводить, как описано в Cartier.

Следует упомянуть WO 2015/148860, в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генная терапия заболеваний, связанных с кровеносной системой, способы и композиции для лечения бета-талассемии могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению (см., например, WO 2015/148860). В одном варианте осуществления WO 2015/148860 предусматривает лечение или предупреждение бета-талассемии, или ее симптомов, например, с помощью изменения гена B-клеточного CLL/лимфомы 11A (BCL11A). Ген BCL11A также известен как ген B-клеточного CLL/лимфомы 11A, BCL11A -L, BCL11A -S, BCL11AXL, CTIP 1, HBFQTL5 и ZNF. BCL11A кодирует белок "цинковый палец", который участвует в регуляции экспрессии генов глобинов. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы заболевания бета-талассемии.

Следует упомянуть WO 2015/148863, и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, которые могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению. В аспекте лечения или предупреждения серповидноклеточной анемии, которая представляет собой наследственное гематологическое заболевание крови, WO 2015/148863 предусматривает изменение гена BCL11A. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы серповидноклеточной анемии.

В одном аспекте настоящего изобретения способы и композиции, которые включают редактирование целевой последовательности нуклеиновой кислоты или модулирование экспрессии целевой последовательности нуклеиновой кислоты, и варианты их применения в связи с иммунотерапией рака понимают путем адаптации системы CRISPR-Cas по настоящему изобретению. Ссылаются на применение генной терапии в WO 2015/161276, который предусматривает способы и композиции, которые могут быть использованы для нарушения пролиферации, выживания и/или функции T-клеток в результате изменения одного или нескольких экспрессируемых T-клетками генов, например, одного или нескольких из генов FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC и/или TRBC. В связанных аспектах пролиферация T-клеток может быть нарушена при изменении одного или нескольких экспрессируемых T-клетками генов, например, гена CBLB и/или PTPN6, гена FAS и/или BID, гена CTLA4, и/или PDCDI, и/или TRAC, и/или TRBC.

T-клетки с химерным антигенным рецептором (CAR)19 характеризуются антилейкозными эффектами в злокачественных образованиях пациентов. Однако пациенты с лейкозом часто имеют недостаточно T-клеток для сбора, следовательно, лечение должно включать модифицированные T-клетки от доноров. Соответственно, существует интерес создания банка донорских T-клеток. Qasim et al. ("First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL" ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (https://ash.confex.com/ash/2015/webprogram/Paper81653.html, опубликовано онлайн в ноябре 2015 г.) описывают модификацию T-клеток с CAR19 с целью устранения риска возникновения реакции "трансплантат против хозяина" посредством нарушения экспрессии T-клеточных рецепторов и нацеливания на CD52. Кроме того, клетки с CD52 были подвергнуты нацеливанию таким образом, что они стали невосприимчивыми к алемтузумабу, и, таким образом, способствовали тому, что алемтузумаб предупреждал опосредованное хозяином отторжение T-клеток с CAR19, несоответствующих лейкоцитарным антигенам человека (HLA). Исследователи использовали самоинактивирующийся лентивирусный вектор третьего поколения, кодирующий 4g7 CAR19 (CD19 scFv-4-1BB-CD3ζ), связанный с RQR8, затем электропорировали клетки с помощью двух пар мРНК TALEN для мультиплексного нацеливания на локус константной альфа-цепи T-клеточного рецептора (TCR) и локус гена CD52. Клетки, которые по-прежнему экспрессировали TCR после ex vivo разращения, подвергали истощению в результате истощения α/β TCR CliniMacs, приводя к образованию T-клеточного продукта (UCART19) с <1% экспрессией TCR, 85% которых приходились на CAR19, а 64% стали негативными по отношению к CD52. Модифицированные T-клетки с CAR19 вводили для лечения рецидивирующего острого лимфобластного лейкоза у пациентов. Идеи, представленные в данном документе, предусматривают эффективные способы получения модифицированных гемопоэтических стволовых клеток и их потомства, в том числе без ограничения клеток миелоидной и лимфоидной линии крови, в том числе T-клеток, B-клеток, моноцитов, макрофагов, нейтрофилов, базофилов, эозинофилов, эритроцитов, дендритных клеток и мегакариоцитов или тромбоцитов, и натуральных клеток-киллеров и их предшественников и потомков. Такие клетки можно модифицировать с помощью нокаута, нокина или иного модулирования мишеней, например, с удалением или модулированием CD52, как описано в данном документе, и других мишеней, таких как без ограничения CXCR4 и PD-1. Такие композиции, клетки и способ по настоящему изобретению можно применять для модулирования иммунных ответов и для лечения без ограничения злокачественных новообразований, вирусных инфекций и иммунных нарушений, в сочетании с введением T-клеток или других клеток пациентам.

Следует упомянуть WO 2015/148670 и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этого документа, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генной терапии подразумеваются способы и композиции для редактирования целевой последовательности, связанной или находящейся в связи с вирусом иммунодефицита человека (HIV) и синдром приобретенного иммунодефицита (AIDS). В связанном аспекте настоящее изобретение, описанное в данном документе, подразумевает предупреждение и лечение инфекции, обусловленной HIV, и AIDS с помощью введения одной или нескольких мутаций в гене рецептора C-C-хемокина 5 типа (CCR5). Ген CCR5 также известен как CKR5, CCR-5, CD195, CKR-5, CCCKR5, CMKBR5, IDDM22 и CC-CKR-5. В дополнительном аспекте настоящее изобретение, описанное в данном документе, подразумевает применение с целью предупреждения или уменьшения инфекции, обусловленной HIV, и/или предупреждения или уменьшения способности HIV попадать в клетки-хозяева, например, у субъектов, которые уже инфицированы. Иллюстративные клетки-хозяева для HIV включают без ограничения CD4-клетки, T-клетки, лимфоидную ткань, ассоциированную с кишечником (GALT), макрофаги, дендритные клетки, миелоидные клетки-предшественники и микроглию. Попадание вируса в клетки-хозяева требует взаимодействия вирусных гликопротеинов gp41 и gp120 с CD4-рецептором и корецептором, например, CCR5. Если корецептор, например, CCR5, не присутствует на поверхности клеток-хозяев, то вирус не может связаться и попасть в клетки-хозяева. Таким образом, прогрессирование заболевания затрудняется. С помощью нокаута или нокдауна CCR5 в клетках-хозяевах, например, при введении защитной мутации (такой как мутация CCR5 дельта 32), предупреждают попадание вируса HIV в клетки-хозяева.

Сцепленная с Х-хромосомой хроническая гранулематозная болезнь (CGD) представляет собой наследственное нарушение иммунной защиты организма в связи с отсутствующей или сниженной активностью фагоцитарной NADPH-оксидазы. С помощью системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (отсутствующая или сниженная активность фагоцитарной NADPH-оксидазы) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для фагоцитарной NADPH-оксидазы); в частности, sgRNA может осуществлять нацеливание на мутацию, которая приводит к CGD (дефектная фагоцитарная NADPH-оксидаза), а HDR может обеспечивать кодирование для надлежащей экспрессии фагоцитарной NADPH-оксидазы. sgRNA, которая нацеливается на мутацию и частицу, содержащую белок Cas (Cas9), контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии фагоцитарной NADPH-оксидазы; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier.

Анемия Фанкони Мутации по меньшей мере в 15 генах (FANCA, FANCB, FANCC, FANCD1/BRCA2, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCJ/BACH1/BRIP1, FANCL/PHF9/POG, FANCM, FANCN/PALB2, FANCO/Rad51C и FANCP/SLX4/BTBD12) могут вызывать анемию Фанкони. Белки, продуцируемые в результате экспрессии этих генов, вовлечены в клеточный процесс, известный как путь FA. Путь FA запускается (активируется), когда процесс создания новых копий ДНК, называемый “репликация ДНК”, блокируется в результате повреждения ДНК. Путь FA направляет определенные белки в область повреждения, которые запускают репарацию ДНК, поэтому репликация ДНК может продолжаться. Путь FA, в частности, реагирует на определенный тип повреждения ДНК, известный как межнитевые поперечные сшивки (ICL). ICL происходит, когда структурные элементы ДНК (нуклеотиды) на противоположных нитях ДНК аномально соединяются или связываются друг с другом, что останавливает репликацию ДНК. ICL могут вызываться накоплением токсических веществ, продуцируемых в организме, или при лечении определенными противоопухолевыми лекарственными средствами. Восемь белков ассоциируются с группой анемии Фанкони с образованием комплекса, известного как коровый комплекс FA. Коровый комплекс FA активирует два белка под названием FANCD2 и FANCI. Активация данных двух белков приводит к доставке белков для репарации ДНК в область ICL, так что поперечная сшивка может быть удалена и репликация ДНК может продолжаться с помощью корового комплекса FA. Более конкретно, коровый комплекс FA, представляющий собой ядерный мультипротеиновый комплекс, состоящий из FANCA, FANCB, FANCC, FANCE, FANCF, FANCG, FANCL и FANCM, функционирует в качестве убиквитинлигазы E3 и опосредует активацию комплекса ID, который представляет собой гетеродимер, состоящий из FANCD2 и FANCI. После моноубиквитинирования он взаимодействует с классическими супрессорами опухолевого роста ниже по пути FA, включая FANCD1/BRCA2, FANCN/PALB2, FANCJ/BRIP1 и FANCO/Rad51C, и, таким образом, участвует в репарации ДНК посредством гомологичной рекомбинации (HR). От восьмидесяти до 90 процентов случаев FA обусловлены мутациями в одном из трех генов, FANCA, FANCC и FANCG. Эти гены несут информацию для продуцирования компонентов корового комплекса FA. Мутации в таких генах, ассоциированные с коровым комплексом FA, будут приводить к потере комплексом функциональности и к разрушению всего пути FA. Как результат, повреждение ДНК не подвергается эффективной репарации, и со временем происходит накопление ICL. В публикации Geiselhart "Review Article, Disrupted Signaling through the Fanconi Anemia Pathway Leads to Dysfunctional Hematopoietic Stem Cell Biology: Underlying Mechanisms and Potential Therapeutic Strategies," Anemia Volume 2012 (2012), Article ID 265790, http://dx.doi.org/10.1155/2012/265790, обсуждается FA и эксперимент с животными, включающий интрафеморальное введение лентивируса, кодирующего ген FANCC, что приводило к коррекции HSC in vivo. С помощью системы CRISPR-Cas (Cas9), которая нацеливается на одну или несколько мутаций, ассоциированных с FA, например, системы CRISPR-Cas (Cas9), имеющей sgRNA и матрицу(матрицы) для HDR, которые соответственно нацеливаются на одну или несколько из мутаций FANCA, FANCC или FANCG, которые приводят к FA и обеспечивают откорректированную экспрессию одного или нескольких из FANCA, FANCC или FANCG; например, sgRNA может нацеливаться на мутацию, например, FANCC, и HDR может обеспечивать кодирование надлежащей экспрессии FANCC. sgRNA, которая нацеливается на мутацию(мутации) (например, одну или несколько, участвующих в FA, такие как мутация(мутации) в частице, содержащей любую один или несколько из FANCA, FANCC или FANCG) и белок Cas (Cas9), контактирует с HSC, несущими мутацию(мутации). Частица также может содержать подходящую(подходящие) матрицу(матрицы) для HDR для коррекции мутации с целью надлежащей экспрессии одного или нескольких из белков, участвующих в FA, таких как один или несколько из FANCA, FANCC или FANCG; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier.

Частица в описании данного документа (например, содержащая sgRNA и Cas (Cas9), необязательно матрицу(матрицы) для HDR, или матрицу(матрицы) для HDR; например, в случае гемофилии B, SCID, SCID-X1, ADA-SCID, наследственной тирозинемии, β-талассемии, сцепленной с X-хромосомой CGD, синдрома Вискотта-Ольдрича, анемии Фанкони, адренолейкодистрофии (ALD), метахроматической лейкодистрофии (MLD), HIV/AIDS, иммунодефицита, гематологичекого состояния или генетической лизосомной болезни накопления) предпочтительно получена или может быть получена в результате смешивания смеси sgRNA и белка Cas (Cas9) (при этом необязательно содержит матрицу(матрицы) для HDR, или такая смесь только содержит матрицу(матрицы) для HDR в случае, если отдельные частицы по отношению к матрице(матрицам) являются желательными) со смесью, содержащей, или состоящей фактически из, или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта (где одна или несколько sgRNA нацеливаются на локус гена или локусы в HSC).

Действительно, настоящее изобретение особенно подходит для лечения гемопоэтических наследственных нарушений с помощью редактирования генома и иммунодефицитов, таких как наследственные иммунодефициты, особенно с помощью технологии на основе частиц, описанной в данном документе. Наследственные иммунодефициты представляют собой заболевания, где процедуры редактирования генома по настоящему изобретению могут быть успешными. Причинами является то, что гемопоэтические клетки, подгруппой которых являются иммунные клетки, являются терапевтически доступными. Их можно удалить из организма и трансплантировать аутологически или аллогенически. Кроме того, определенные наследственные иммунодефициты, например, тяжелый комбинированный иммунодефицит (SCID), приводят к дефекту пролиферации иммунных клеток. Коррекция наследственных нарушений, вызывающих SCID, в результате редких спонтанных "обратных" мутаций указывает на то, что коррекция даже одного предшественника лимфоцита может быть достаточной для восстановления иммунной функции у пациентов .../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx - _ENREF_1, см. Bousso, P., et al. Diversity, functionality, and stability of the T cell repertoire derived in vivo from a single human T cell precursor. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000). Селективное преимущество редактированных клеток обеспечивает то, что даже низкие уровни редактирования приводят к терапевтическому эффекту. Этот эффект по настоящему изобретению может наблюдаться при SCID, синдроме Вискотта-Олдрича и других состояниях, упомянутых в данном документе, в том числе наследственных гемопоэтических нарушениях, таких как альфа- и бета-талассемия, где недостаточности гемоглобина отрицательно влияют на пригодность предшественников эритроцитов.

Активность репарации DSB с помощью NHEJ и HDR значительно варьирует в зависимости от типа клетки и состояния клетки. NHEJ не подвергается четкой регуляции клеточным циклом и является эффективным во всех типах клеток, обеспечивая наличие высоких уровней нарушения функционирования гена в доступных целевых клеточных популяциях. Напротив, HDR действует, главным образом, в течение фазы S/G2, и, таким образом, ограничена клетками, которые активно делятся, с ограничением применения видов лечения, которые требуют точных модификаций генома до митотических клеток [Ciccia, A. & Elledge, S.J. Molecular cell 40, 179-204 (2010); Chapman, J.R., et al. Molecular cell 47, 497-510 (2012)].

Эффективность коррекции с применением HDR может контролироваться по эпигенетическому состоянию или последовательности подверженного целенаправленному воздействию локуса или применяемой конфигурации специфической матрицы для репарации (однонитевые по сравнению с двухнитевыми, длинные по сравнению с короткими гомологичными плечами) [Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004); Beumer, K.J., et al. G3 (2013)]. Относительная активность механизмов NHEJ и HDR в целевых клетках может также оказывать влияние на эффективность коррекции гена, поскольку данные пути могут конкурировать за устранение DSB [Beumer, K.J., et al. Proceedings of the National Academy of Sciences of the United States of America 105, 19821-19826 (2008)]. HDR также вносит проблему доставки, не наблюдаемую при применении стратегий с NHEJ, поскольку она требует одновременой доставки нуклеаз и матриц для репарации. На практике данные ограничения до настоящего времени привели к низким уровням HDR в терапевтически значимых типах клеток. Переход к клиническому применению, таким образом, был в основном сосредоточен на стратегиях NHEJ для лечения заболевания, хотя доклинические исследования обоснованности концепции только что были описаны для мышиных моделей гемофилии B и врожденной тирозинемии [Li, H., et al. Nature 475, 217-221 (2011); Yin, H., et al. Nature biotechnology 32, 551-553 (2014)].

Любое из приведенных применений редактирования генома может включать комбинации белков, малые молекулы РНК и/или матрицы для репарации, что делает доставку данных нескольких частей значительно более проблематичной, чем доставку низкомолекулярных лекарственных средств. Разрабатывали две основные стратегии доставки инструментов для редактирования генома: ex vivo и in vivo. В видах лечения ex vivo пораженные болезнью клетки удаляют из организма, редактируют и затем трансплантируют обратно пациенту. Редактирование ex vivo имеет преимущество в обеспечении возможности должного определения целевой популяции клеток и точного определения дозирования терапевтических молекул. Последний фактор, который следует учитывать, может быть особенно важным, когда нецелевые модификации представляют особый интерес, поскольку подбор количества нуклеазы может приводить к снижению уровня таких мутаций (Hsu et al., 2013). Другим преимуществом подходов ex vivo являются обычно высокие показатели редактирования, которые могут быть достигнуты в связи с разработкой эффективных систем доставки для белков и нуклеиновых кислот в клетки, находящиеся в культуре, для применений в научных исследованиях и генной терапии.

Может быть два основных недостатка подходов ex vivo, которые ограничивают их применение в отношении небольшого числа заболеваний. Например, целевые клетки должны быть способны выживать при манипуляции вне организма. Для многих тканей, как, например, для головного мозга, культивирование клеток вне организма представляет собой большую проблему, поскольку клетки либо не в состоянии выжить, либо теряют свойства, необходимые для их функционирования in vivo. Таким образом, с точки зрения настоящего изобретения и знаний в данной области терапия ex vivo по отношению к тканям с популяциями взрослых стволовых клеток, поддающихся ex vivo культивированию и манипуляциям, таким как гемопоэтическая система, с помощью системы CRISPR-Cas (Cas9) является возможной [Bunn, H.F. & Aster, J. Pathophysiology of blood disorders, (McGraw-Hill, New York, 2011)].

Редактирование генома in vivo охватывает прямую доставку систем редактирования в их нативные ткани. Редактирование in vivo допускает лечение заболеваний, в которых пораженная популяция клеток не пригодна для манипуляции ex vivo. Более того, доставка нуклеаз в клетки in situ создает возможность для лечения многих тканей и типов клеток. Данные свойства, вероятно, обеспечивают применение лечения in vivo по отношению к более широкому спектру заболеваний, чем видов терапии ex vivo.

До настоящего времени редактирования in vivo в значительной степени достигали посредством применения вирусных векторов с определенным, специфичным к тканям тропизмом. Такие векторы в настоящее время ограничены по вместимости и тропизму, ограничивая данный вид терапии системами органов, где трансдукция клинически применимыми векторами является эффективной, как, например, печень, мышцы и глаза [Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Nguyen, T.H. & Ferry, N. Gene therapy 11 Suppl 1, S76-84 (2004); Boye, S.E., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 509-519 (2013)].

Главным потенциальным барьером для доставки in vivo является иммунный ответ, который может быть сформирован в ответ на большие количества вируса, необходимого для лечения, но это явление не является уникальным для редактирования генома и наблюдается при других видах генной терапии на основе вирусов [Bessis, N., et al. Gene therapy 11 Suppl 1, S10-17 (2004)]. Также вероятно, что пептиды из осуществляющих редактирование нуклеаз сами по себе презентируются на молекулах MHC класса I для стимулирования иммунного ответа, хотя существует мало доказательств, подтверждающих, что это происходит на доклиническом уровне. Другой основной трудностью данного вида терапии является контроль распространения и, следовательно, дозировки нуклеаз для редактирования генома in vivo, приводящие к образованию профилей нецелевых мутаций, прогнозирование которых может быть затруднительным. Однако с точки зрения настоящего изобретения и знаний в данной области, в том числе применения видов терапии на основе вирусов и частиц, используемых при лечении онкологических заболеваний, in vivo модификация HSC, например, с помощью доставки частицы или вируса, находится в пределах компетенции специалиста в данной области.

Терапия с применением редактирования ex vivo Длительная клиническая экспертиза с очисткой, культивированием и трансплантацией кроветворных клеток определила заболевания, поражающие систему крови, такие как SCID, анемия Фанкони, синдром Вискотта-Олдрича и серповидноклеточная анемия, в приоритетную область терапии с применением редактирования ex vivo. Другой причиной сосредоточения внимания на кроветворных клетках является то, что благодаря предыдущим усилиям по разработке генной терапии нарушений со стороны крови уже существуют системы доставки с относительно высокой эффективностью. С учетом этих преимуществ этот вид терапии может быть применим при заболеваниях, где редактированные клетки обладают преимуществом пригодности, так что небольшое количество прижившихся, редактированных клеток могут размножаться и обеспечивать лечение заболевания. Одним таким заболеванием является HIV, при котором инфекция приводит к недостатку пригодности CD4+ T-клеток.

Терапию с применением редактирования ex vivo в недавнем времени расширили путем включения стратегий коррекции генов. Барьеры для HDR ex vivo были преодолены, что показано в недавней работе Genovese и соавт., которые добивались коррекции мутированного гена IL2RG в гемопоэтических стволовых клетках (HSC), полученных от пациента, страдающего от SCID-X1 [Genovese, P., et al. Nature 510, 235-240 (2014)]. Genovese et. al. осуществляли коррекцию гена в HSC с применением мультимодальной стратегии. Во-первых, HSC трансдуцировали с использованием лентивируса с дефектом интеграции, содержащего матрицу для HDR, кодирующую терапевтическую cDNA для IL2RG. После трансдукции клетки подвергали электропорации с применением мРНК, кодирующей ZFN, целенаправленно воздействующие на горячую точку мутагенеза в IL2RG для стимулирования коррекции гена, основанной на HDR. Для повышения показателей HDR условия культивирования оптимизировали путем использования малых молекул, способствующих делению HSC. С применением оптимизированных условий культивирования, нуклеаз и матриц для HDR, HSC со скорректированными генами от пациента с SCID-X1 получали в культуре при терапевтически значимых уровнях. HSC от непораженных индивидуумов, которых подвергали той же процедуре коррекции генов, могли поддерживать длительное кроветворение у мышей, что является золотым стандартом функционирования HSC. HSC способны давать начало всем типам кроветворных клеток, и их можно подвергать аутологической трансплантации, что делает их чрезвычайно важной популяцией клеток для всех наследственных нарушений кроветворения [Weissman, I.L. & Shizuru, J.A. Blood 112, 3543-3553 (2008)]. В принципе, HSC со корректированными генами можно применять для лечения широкого cпектра генетических нарушений со стороны крови, что делает данное исследование важным открытием для редактирования генома с терапевтической целью.

Терапия с применением редактирования in vivo. Редактирование in vivo можно применять преимущественно исходя из настоящего изобретения и знаний в данной области. Для систем органов, доставка в которые является эффективной, уже существует ряд впечатляющих доклинических терапевтических успехов. Первый пример успешной терапии in vivo с применением редактирования был продемонстрирован на мышиной модели гемофилии B [Li, H., et al. Nature 475, 217-221 (2011)]. Как было отмечено ранее, гемофилия B представляет собой сцепленное с Х-хромосомой рецессивное нарушение, вызванное мутациями с потерей функций в гене, кодирующем фактор IX, важный компонент каскада свертывания крови. Восстановление активности фактора IX до приблизительно 1% от его уровней у тяжело пораженных индивидуумов может трансформировать заболевание в значительно более легкую форму, поскольку профилактическая инфузия рекомбинантного фактора IX у таких пациентов с раннего возраста для получения таких уровней в значительной степени облегчает тяжесть клинических осложнений [Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]. Таким образом, крайне низкие уровни коррекции гена, опосредованной HDR, являются необходимы для изменения клинических результатов у пациентов. Кроме того, фактор IX синтезируется и секретируется печенью, органом, который может быть эффективно трансдуцирован вирусными векторами, кодирующими системы для редактирования.

С применением гепатотропных серотипов аденоассоциированного вируса (AAV), кодирующих ZFN и корректирующую матрицу для HDR, получали до 7% коррекции мутированного, гуманизированного гена фактора IX в печени мыши [Li, H., et al. Nature 475, 217-221 (2011)]. Это приводило к улучшению кинетики свертывания крови, меры функционирования каскада свертывания крови, впервые демонстрируя, что терапия in vivo с применением редактирования является не только возможной, но и эффективной Как описано в данном документе, специалист в данной области ориентируется на основе идей данного документа и знаний в данной области, например, Li в случае лечения гемофилии B частицей, содержащей матрицу для HDR и систему CRISPR-Cas (Cas9), которая нацеливается на мутацию сцепленного с X-хромосомой рецессивного нарушения для обращения мутации потери функции.

Основываясь на данном исследовании, другие группы с недавнего времени применяют редактирование генома в печени in vivo с использованием CRISPR-Cas для успешного лечения мышиной модели врожденной тирозинемии и для создания мутаций, которые обеспечивают защиту от сердечно-сосудистого заболевания. Эти два отдельных применения демонстрируют универсальность данного подхода для нарушений, которые охватывают дисфункцию печени [Yin, H., et al. Nature biotechnology 32, 551-553 (2014); Ding, Q., et al. Circulation research 115, 488-492 (2014)]. Применения редактирования in vivo других систем органов необходимы для подтверждения того, что данная стратегия широко применима. В настоящее время усилия для оптимизации как вирусных векторов, так и векторов, отличных от вирусных, находятся на пути реализации для расширения спектра нарушений, которые можно лечить с использованием данного метода терапии [Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Yin, H., et al. Nature reviews. Genetics 15, 541-555 (2014)]. Как описано в данном документе, специалист в данной области ориентируется на основе идей данного документа и знаний в данной области, например, Yin в случае лечения наследственной тирозинемии частицей, содержащей матрицу для HDR и систему CRISPR-Cas (Cas9), которая нацеливается на мутацию.

Целенаправленная делеция, варианты терапевтического применения. Целенаправленная делеция генов может быть предпочтительной. Таким образом, предпочтительными являются гены, участвующие в иммунодефиците, гематологическом состоянии или генетической лизосомной болезни накопления, например, гемофилии B, SCID, SCID-X1, ADA-SCID, наследственной тирозинемии, β-талассемии, сцепленной с X-хромосомой CGD, синдроме Вискотта-Олдрича, анемии Фанкони, адренолейкодистрофии (ALD), метахромацитной лейкодистрофии (MLD), HIV/AIDS, других метаболических нарушениях, гены, кодирующие неправильно свернутые белки, участвующие в заболеваниях, гены, приводящие к потере функции, участвующей в заболевании, мутации, которые могут подвергаться нацеливанию в HSC, с помощью любой из описанных в данном документе систем доставки, при этом система с использованием частиц является предпочтительной.

В настоящем изобретении иммуногенность фермента CRISPR, в частности, можно снизить, следуя подходу, впервые изложенному Tangri et al. в отношении эритропоэтина и впоследствии получившему развитие. Соответственно, для снижения иммуногенности фермента CRISPR (например, Cas9) у вида-хозяина (человека или другого вида) можно применять направленную эволюцию или рациональное конструирование.

Редактирование генома. Системы CRISPR/Cas (Cas9) по настоящему изобретению можно применять для коррекции генетических мутаций, попытки которой с ограниченным успехом ранее предпринимались с применением TALEN и ZFN, а также лентивирусов, в том числе, как описано в данном документе; см. также WO2013163628.

Виды адоптивной клеточной терапии

Настоящее изобретение также предусматривает применение системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, для модификации клеток с целью адоптивных видов терапии. Аспекты по настоящему изобретению включают адоптивный перенос клеток иммунной системы, таких как T-клетки, специфичных в отношении определенных антигенов, таких как опухоль-ассоциированные антигены (см. Maus et al., 2014, Adoptive Immunotherapy for Cancer or Viruses, Annual Review of Immunology, Vol. 32: 189-225; Rosenberg and Restifo, 2015, Adoptive cell transfer as personalized immunotherapy for human cancer, Science Vol. 348 no. 6230 pp. 62-68; Restifo et al., 2015, Adoptive immunotherapy for cancer: harnessing the T cell response. Nat. Rev. Immunol. 12(4): 269-281; и Jenson and Riddell, 2014, Design and implementation of adoptive therapy with chimeric antigen receptor-modified T cells. Immunol Rev. 257(1): 127-144). Например, различные стратегии можно использовать для генетической модификации T-клеток с помощью изменения специфичности T-клеточного рецептора (TCR), например, посредством введения новых α- и β-цепей TCR со специфичностью по отношению к определенным пептидам (см. патент США №8697854; публикации заявок на патент согласно PCT: WO2003020763, WO2004033685, WO2004044004, WO2005114215, WO2006000830, WO2008038002, WO2008039818, WO2004074322, WO2005113595, WO2006125962, WO2013166321, WO2013039889, WO2014018863, WO2014083173; патент США № 8088379).

В качестве альтернативы или дополнительно к модификациям TCR химерные антигенные рецепторы (CAR) можно использовать с целью получения иммунореактивных клеток, таких как T-клетки, специфичные по отношению к определенным мишеням, таким как злокачественные клетки, с широким разнообразием описанных рецепторных химерных конструкций (см. патенты США №№ 5843728; 5851828; 5912170; 6004811; 6284240; 6392013; 6410014; 6753162; 8211422 и публикацию согласно PCT WO9215322). Альтернативные конструкции CAR можно охарактеризовать как принадлежащие к последующим поколениям. CAR первого поколения, как правило, состоят из однонитевого вариабельного фрагмента антитела, специфичного по отношению к антигену, например, содержащего VL, связанную с VH конкретного антитела, связанного с помощью гибкого линкера, например, с помощью шарнирного домена CD8α и трансмембранного домена CD8α с трансмембранными доменами и доменами внутриклеточной передачи сигнала CD3ζ или FcRγ (scFv-CD3ζ или scFv-FcRγ; см. патент США №7741465; патент США №5912172; патент США №5906936). CAR второго поколения охватывают внутриклеточные домены одной или нескольких костимулирующих молекул, таких как CD28, OX40 (CD134) или 4-1BB (CD137) в эндодомене (например, scFv-CD28/OX40/4-1BB-CD3ζ; см. патенты США №№ 8911993; 8916381; 8975071; 9101584; 9102760; 9102761). CAR третьего поколения включают комбинацию костимулирующих эндодоменов, таких как сигнальные домены CD3ζ-цепи, CD97, GDI la-CD18, CD2, ICOS, CD27, CD154, CDS, OX40, 4-1BB или CD28 (например, scFv-CD28-4-1BB-CD3ζ или scFv-CD28-OX40-CD3ζ; см. патент США № 8906682; патент США № 8399645; патент США № 5686281; публикацию согласно PCT № WO2014134165; публикацию согласно PCT № WO2012079000). Альтернативно костимиляцию можно регулировать с помощью экспрессии CAR в антиген-специфичных T-клетках, выбранных с целью активации и размножения в результате вовлечения их нативных αβTCR, например, с помощью антигена на профессиональных антиген-представляющих клетках с помощью сопутствующей костимуляции. Кроме того, дополнительные сконструированные рецепторы могут быть предусмотрены на иммунореактивных клетках, например, для улучшения нацеливания T-клеточной атаки и/или сведения к минимуму побочных эффектов.

Альтернативные методики можно применять для трансформации целевых иммунореактивных клеток, такие как слияние протопласта, липофекция, трансфекция или электропорация. Можно использовать широкое разнообразие векторов, таких как ретровирусные векторы, лентивирусные векторы, аденовирусные векторы, аденоассоциированные вирусные векторы, плазмиды или транспозоны, такие как транспозон "Спящая красавица" (см. патенты США №№ 6489458; 7148203; 7160682; 7985739; 8227432), их можно использовать для введения CAR, например, с помощью получения антиген-специфичных CAR 2-го поколения, передающих сигналы с участием CD3ζ и CD28 или CD137. Вирусные векторы, могут, например, включать векторы на основе HIV, SV40, EBV, HSV или BPV.

Клетки, которые подвергаются нацеливанию с целью трансформации, могут включать, например, T-клетки, натуральные клетки-киллеры (NK), цитотоксические T-лимфоциты (CTL), регуляторные T-клетки, человеческие эмбриональные стволовые клетки, инфильтрующие опухоль лимфоциты (TIL) или плюрипотентную стволовую клетку, из которой лимфоидные клетки могут дифференцироваться. T-клетки, экспрессирующие желаемый CAR, можно, например, выбрать посредством кокультивирования с γ-облученными активирующими и делящимися клетками (AaPC), которые коэкспрессируют раковый антиген и костимулирующие молекулы. Сконструированные CAR Т-клетки можно размножать, например, с помощью кокультивирования на AaPC в присутствии растворенных факторов, таких как IL-2 и IL-21. Такое разращивание, можно, например, проводить с целью получения CAR+ T-клеток памяти (которые можно, например, анализировать с помощью неферментативного цифрового массива и/или многопанельной проточной цитометрии ). В этом отношении можно получить CAR T-клетки, которые характеризуются специфичной цитотоксической активностью по отношению к антиген-несущим опухолям (необязательно в сочетании с образованием желаемых хемокинов, таких как интерферон-γ). CAR T-клетки этого типа, например, можно использовать в животных моделях, например, для лечения ксенотрансплантатов опухолей.

Подходы, такие как вышеизложенные, можно адаптировать для обеспечения способов лечения и/или повышения выживаемости субъекта, имеющего заболевание, такое как новообразование, например, с помощью введения эффективного количества иммунореактивных клеток, содержащих распознающий антиген рецептор, которые связывается с определенным антигеном, где связывание активирует иммунореактивную клетку, тем самым при этом осуществляется лечение или предупреждение заболевания (такого как новообразование, патогенная инфекция, аутоиммунное заболевание или реакция на аллогенный трансплантат). Дозирование в видах лечения на основе CAR T-клеток может, например, предусматривать введение от 106 до 109 клеток/кг, с курсом или без курса противолимфомной терапии, например, с помощью циклофосфамида.

В одном варианте осуществления лечение можно назначать пациентам, проходящим иммуносупрессивное лечение. Клетки или популяцию клеток можно сделать устойчивыми по меньшей мере к одному иммуносупрессивному средству в результате инактивации гена, кодирующего рецептор для такого иммуносупрессивного средства. Не ограничиваясь теорией, иммуносупрессивное лечение должно облегчать отбор и разращивание иммунореактивных клеток или T-клеток в соответствии с настоящим изобретением у пациента.

Введение клеток или популяции клеток в соответствии с настоящим изобретением можно выполнять любым удобным способом, в том числе с помощью аэрозольной ингаляции, инъекции, поглощения, трансфузии, имплантации или трансплантации. Клетки или популяцию клеток можно вводить пациенту подкожно, внутрикожно, внутрь опухоли, внутрь узла, интрамедуллярно, внутримышечно, с помощью внутривенной или внутрилимфатической инъекции или внутрибрюшинно. В одном варианте осуществления клеточные композиции по настоящему изобретению предпочтительно вводят с помощью внутривенной инъекции.

Введение клеток или популяции клеток может состоять из введения 104- 109 клеток на кг массы тела, предпочтительно от 105 до 106 клеток/кг массы тела, включая целые значения числа клеток в пределах этих диапазонов. Дозирование в видах лечения на основе CAR T-клеток может, например, предусматривать введение от 106 до 109 клеток/кг, с курсом или без курса противолимфомной терапии, например, с помощью циклофосфамида. Клетки или популяцию клеток можно вводить в одной или нескольких дозах. В другом варианте осуществления эффективное количество клеток вводят в виде одной дозы. В другом варианте осуществления эффективное количество клеток вводят в виде более чем одной дозы в течение периода времени. Определение времени введения находится в пределах компетенции лечащего врача и зависит от клинического состояния пациента. Клетки или популяцию клеток можно получать из любого источника, такого как банк крови или донор. Принимая во внимание то, что потребности индивидуумов варьируют, определение оптимальных диапазонов эффективных количеств определенного типа клеток для определенных заболеваний или состояний находится в пределах компетенции специалиста в данной области. Эффективное количество означает количество, которое обеспечивает терапевтическое или профилактическое преимущество. Вводимая доза может зависеть от возраста, состояния здоровья и веса реципиента, вида сопутствующего лечения, при необходимости, частоты лечения и природы желаемого эффекта.

В другом варианте осуществления эффективное количество клеток или композиции, содержащей такие клетки, вводят парентерально. Введение может представлять собой внутривенное введение. Введение может быть выполнено непосредственно с помощью инъекции в опухоль.

Для предупреждения возможных побочных реакций сконструированные иммунореактивные клетки могут быть оснащены предохранителем в форме трансгена, который делает клетки восприимчивыми к воздействию специфического сигнала. Например, в этом отношении можно использовать ген тимидинкиназы вируса простого герпеса (TK), например, с помощью введения в аллогенные T-лимфоциты, используемые в качестве инфузий донорских лимфоцитов после трансплантации стволовых клеток (Greco, et al., Improving the safety of cell therapy with the TK-suicide gene. Front. Pharmacol. 2015; 6: 95). В таких клетках введение пролекарства на основе нуклеозидов, такого как ганцикловир или ацикловир, вызывает клеточную смерть. Альтернативные конструкции предохранителей включают индуцируемую каспазу 9, например, активируемую введением низкомолекулярного димера, который соединяет две нефункциональные молекулы icasp9 с образованием активного фермента. Было описано широкое разнообразие альтернативных подходов для осуществления контроля пролиферации клеток (см. публикацию заявки на патент США № 20130071414; публикацию заявки на патент согласно PCT WO2011146862; публикацию заявки на патент согласно PCT WO2014011987; публикацию заявки на патент согласно PCT WO2013040371; Zhou et al. BLOOD, 2014, 123/25:3895 - 3905; Di Stasi et al., The New England Journal of Medicine 2011; 365:1673-1683; Sadelain M, The New England Journal of Medicine 2011; 365:1735-173; Ramos et al., Stem Cells 28(6):1107-15 (2010)).

При дополнительном усовершенствовании видов адоптивной терапии редактирование генома можно применять для приспособления иммунореактивных клеток к альтернативным вариантам осуществления, например, с получением отредактированных CAR T-клеток (см. Poirot et al., 2015, Multiplex genome edited T-cell manufacturing platform for "off-the-shelf" adoptive T-cell immunotherapies, Cancer Res 75 (18): 3853). Клетки можно редактировать с помощью системы CRISPR и способа ее применения, описанного в данном документе. Системы CRISPR могут быть доставлены в иммунную клетку с помощью любого способа, описанного в данном документе. В предпочтительных вариантах осуществления клетки редактируют ex vivo и переносят в субъекта, нуждающегося в этом. Можно редактировать иммунореактивные клетки, CAR T-клетки или любые клетки для адоптивного клеточного переноса. Редактирование можно выполнять с целью устранения потенциальных аллореактивных T-клеточных рецепторов (TCR), нарушения мишени хемотерапевтического средства, блокирования иммунной контрольной точки, активации T-клетки и/или повышения дифференцировки и/или пролиферации функционально истощенных или дисфункциональных CD8+ T-клеток (см. публикации на патент согласно PCT WO2013176915, WO2014059173, WO2014172606, WO2014184744 и WO2014191128). Редактирование может приводить к инактивации гена.

Под инактивацией гена предполагается, что представляющий интерес ген не экспрессируется в форме функционального белка. В конкретном варианте осуществления система CRISPR специфично катализирует расщепление в одном целевом гене, тем самым инактивируя указанный целевой ген. Вызванные разрывы нити нуклеиновой кислоты обычно репарируются с помощью различных механизмов гомологичной рекомбинации или негомологичного соединения концов (NHEJ). Однако NHEJ представляет собой несовершенный процесс репарации, который часто приводит к изменениям последовательности ДНК в сайте расщепления. Репарация посредством негомологичного соединения концов (NHEJ) часто приводит к небольшим вставкам или делециям (вставкам/делециям) и может быть использована для получения определенных нокаутов генов. Клетки, в которых произошло явление индуцированного расщеплением мутагенеза, можно идентифицировать и/или отобрать с помощью общеизвестных способов в данной области.

T-клеточные рецепторы (TCR) представляют собой рецепторы клеточной поверхности, которые участвуют в активации T-клеток в ответ на представление антигена. TCR, как правило, состоит из двух цепей, α и β, которые собираются с образованием гетеродимера, и связывается с CD3-трансдуцирующими субъединицами, с образованием комплекса T-клеточного рецептора, присутствующего на клеточной поверхности. Каждая α- и β-цель TCR состоит из иммуноглобулин-подобной N-концевой вариабельной (V) и константной (C) области, гидрофобного трансмембранного домена и короткого цитоплазматического участка. Как в случае иммуноглобулиновых молекул, вариабельную область α- и β-целей получают с помощью V(D)J рекомбинации, создавая большое разнообразие антигенных специфичностей в пределах популяции T-клеток. Однако в отличие от иммуноглобулинов, которые распознают интактный антиген, T-клетки активируются с помощью процессированных пептидных фрагментов в сочетании с молекулой MHC, вводящей дополнительную область для распознавания антигенов T-клетками, известную как MHC-рестрикция. Распознавание несовпадений MHC между донором и реципиентом посредством T-клеточного рецептора приводит к T-клеточной пролиферации и потенциальному развитию реакции "трансплантат против хозяина" (GVHD). Инактивация TCRα или TCRβ может приводить к элиминации TCR с поверхности T-клеток, предупреждая распознавание аллоантигена и, таким образом, GVHD. Однако нарушение TCR, как правило, приводит к элиминации CD3 сигнального компонента и изменяет способы дальнейшего разращивания T-клеток.

Аллогенные клетки быстро отторгаются иммунной системой хозяина. Было показано, что аллогенные лейкоциты, присутствующие в необлученных продуктах крови, сохраняются не более 5-6 дней (Boni, Muranski et al. 2008 Blood 1;112(12):4746-54). Таким образом, для предупреждения отторжения аллогенных клеток, иммунную систему хозяина, как правило, необходимо подавлять до некоторой степени. Однако в случае адоптивного клеточного переноса применение иммуносупрессивных препаратов также оказывает вредное воздействие на введенные с терапевтической целью T-клетки. Таким образом, для эффективного применения подхода на основе адоптивной иммунотерапии в этих условиях введенные клетки должны быть устойчивыми к иммуносупрессивному лечению. Таким образом, в конкретном варианте осуществления настоящее изобретение дополнительно предусматривает стадию модификации T-клеток для придания им устойчивости к иммуносупрессивному средству, предпочтительно с помощью инактивации по меньшей мере одного гена, кодирующего иммуносупрессивное средство. Иммуносупрессивное средство представляет собой средство, которое подавляет иммунную функцию посредством одного из нескольких механизмов действия. Иммуносупрессивное средство может представлять собой без ограничения ингибитор кальциневрина, мишень для рапамицина, блокатор α-цепи рецептора интерлейкина 2, ингибитор инозинмонофосфатдегидрогеназы, ингибитор редуктазы дигидрофолиевой кислоты, кортикостероид или иммуносупрессивный антиметаболит. Настоящее изобретение предусматривает придание T-клеткам устойчивости к иммуносупрессорам с целью иммунотерапии с помощью инактивации мишени иммуносупрессивного средства в T-клетках. В качестве неограничивающих примеров мишени для иммуносупрессивного средства могут представлять собой рецептор для иммуносупрессивного средства, такой как CD52, глюкокортикоидный рецептор (GR), представитель семейства генов FKBP и представитель семейства генов циклофилина.

Иммунные контрольные точки представляют собой ингибирующие пути, которые замедляют или останавливают иммунные реакции и предупреждают избыточное разрушение тканей в результате неконтролируемой активности иммунных клеток. В определенных вариантах осуществления целевая иммунная контрольная точка представляет собой ген программируемой смерти 1 (PD-1 или CD279) (PDCD1). В других вариантах осуществления иммунная контрольная точка, на которую оказывают воздействие, представляет собой антиген, ассоциированный с цитотоксическим T-лимфоцитом (CTLA-4). В дополнительных вариантах осуществления целевая иммунная контрольная точка представляет собой другой представитель суперсемейства CD28 и CTLA4 Ig, такой как BTLA, LAG3, ICOS, PDL1 или KIR. В дополнительных вариантах осуществления целевая иммунная контрольная точка представляет собой представителя суперсемейства TNFR, такой как CD40, OX40, CD137, GITR, CD27 или TIM-3.

Дополнительные иммунные контрольные точки включают содержащую домен с гомологией 2 Src протеинтирозинфосфатазу 1 (SHP-1) (Watson HA, et al., SHP-1: the next checkpoint target for cancer immunotherapy? Biochem Soc Trans. 2016 Apr 15;44(2):356-62). SHP-1 представляет собой широко экспрессируемую ингибирующую протеинтирозинфосфатазу (PTP). В T-клетках она является отрицательным регулятором антигензависимой активации и пролиферации. Она представляет собой цитозольный белок и поэтому не пригодна для опосредованных антителами видов терапии, однако ее роль в активации и пролиферации делает ее привлекательной мишенью для генетической манипуляции в стратегиях адоптивного переноса, например, Т-клеток с химерными антигенными рецепторами (CAR). Иммунные контрольные точки могут также включать T-клеточный иммунорецептор с Ig и ITIM доменами (TIGIT/Vstm3/WUCAM/VSIG9) и VISTA (Le Mercier I, et al., (2015) Beyond CTLA-4 and PD-1, the generation Z of negative checkpoint regulators. Front. Immunol. 6:418).

WO2014172606 относится к применению ингибиторов MT1 и/или MT1 для повышения пролиферации и/или активности истощенных CD8+ T-клеток и для снижения CD8+ T-клеточного истощения (например, снижения функциональных свойств истощенных или невосприимчивых CD8+ иммунных клеток). В определенных вариантах осуществления металлотионеины подвергаются нацеливанию с помощью редактирования генов в адоптивно перенесенных T-клетках.

В определенных вариантах осуществления мишени редактирования генов могут представлять собой по меньшей мере один целевой локус, участвующий в экспрессии белка иммунной контрольной точки. Такие мишени могут включают без ограничения CTLA4, PPP2CA, PPP2CB, PTPN6, PTPN22, PDCD1, ICOS (CD278), PDL1, KIR, LAG3, HAVCR2, BTLA, CD160, TIGIT, CD96, CRTAM, LAIR1, SIGLEC7, SIGLEC9, CD244 (2B4), TNFRSF10B, TNFRSF10A, CASP8, CASP10, CASP3, CASP6, CASP7, FADD, FAS, TGFBRII, TGFRBRI, SMAD2, SMAD3, SMAD4, SMAD10, SKI, SKIL, TGIF1, IL10RA, IL10RB, HMOX2, IL6R, IL6ST, EIF2AK4, CSK, PAG1, SIT1, FOXP3, PRDM1, BATF, VISTA, GUCY1A2, GUCY1A3, GUCY1B2, GUCY1B3, MT1, MT2, CD40, OX40, CD137, GITR, CD27, SHP-1 или TIM-3. В предпочтительных вариантах осуществления генный локус, участвующий в экспрессии генов PD-1 или CTLA-4, является целевым. В других предпочтительных вариантах осуществления комбинации генов являются целевыми, такие как без ограничения PD-1 и TIGIT.

В других вариантах осуществления по меньшей мере два гена редактируют. Пары генов могут включать без ограничения PD1 и TCRα, PD1 и TCRβ, CTLA-4 и TCRα, CTLA-4 и TCRβ, LAG3 и TCRα, LAG3 и TCRβ, Tim3 и TCRα, Tim3 и TCRβ, BTLA и TCRα, BTLA и TCRβ, BY55 и TCRα, BY55 и TCRβ, TIGIT и TCRα, TIGIT и TCRβ, B7H5 и TCRα, B7H5 и TCRβ, LAIR1 и TCRα, LAIR1 и TCRβ, SIGLEC10 и TCRα, SIGLEC10 и TCRβ, 2B4 и TCRα, 2B4 и TCRβ.

Вне зависимости от того, является ли модификация Т-клеток предварительной или последующей, T-клетки можно активировать и размножать, как правило, с помощью способов, описанных, например, в патентах США 6352694; 6534055; 6905680; 5858358; 6887466; 6905681; 7144575; 7232566; 7175843; 5883223; 6905874; 6797514; 6867041 и 7572631. T-клетки можно размножать in vitro или in vivo.

Практическое осуществление настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989) (Sambrook, Fritsch and Maniatis); MOLECULAR CLONING: A LABORATORY MANUAL, 4th edition (2012) (Green and Sambrook); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (1987) (F. M. Ausubel, et al. eds.); серию METHODS IN ENZYMOLOGY (Academic Press, Inc.); PCR 2: A PRACTICAL APPROACH (1995) (M.J. MacPherson, B.D. Hames and G.R. Taylor eds.); ANTIBODIES, A LABORATORY MANUAL (1988) (Harlow and Lane, eds.); ANTIBODIES A LABORATORY MANUAL, 2nd edition (2013) (E.A. Greenfield ed.); and ANIMAL CELL CULTURE (1987) (R.I. Freshney, ed.).

Практическое осуществление настоящего изобретения предусматривает, если не указано иное, стандартные методики получения генетически модифицированных мышей. См. Marten H. Hofker and Jan van Deursen, TRANSGENIC MOUSE METHODS AND PROTOCOLS, 2nd edition (2011).

ALS

В публикации заявки на патент США № 20110023144 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с заболеванием амиотрофическим латеральным склерозом (ALS). ALS характеризуется постепенной прогрессирующей дегенерацией определенных нервных клеток в коре головного мозга, стволе головного мозга и спинном мозге, связанных с произвольными движениями.

Что касается нарушения, связанного с двигательными нейронами, белки, ассоциированные с этими нарушениями, представляют собой разнородную группу белков, которые оказывают влияние на восприимчивость к развитию нарушения, связанного с двигательными нейронами, наличие нарушения, связанного с двигательными нейронами, тяжесть нарушения, связанного с двигательными нейронами, или любую их комбинацию. Настоящее раскрытие предусматривает редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с заболеванием, связанным с ALS, специфическим нарушением, связанным с двигательными нейронами. Белки, ассоциированные с ALS, как правило, выбирают исходя из экспериментально установленной взаимосвязи белков, связанных с ALS, с нарушением по типу ALS. Например, скорость образования или концентрация в кровотоке белка, ассоциированного с ALS, может быть повышенной или пониженной в популяции с ALS по сравнению с популяцией без ALS. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с ALS, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

В качестве неограничивающего примера белки, ассоциированные с ALS, включают без ограничения следующие белки: SOD1 - растворимая супероксиддисмутаза 1, ALS3 - белок 3, связанный с амиотрофическим латеральным склерозом, SETX - сенатаксин, ALS5 - белок 5, связанный с амиотрофическим латеральным склерозом, FUS - РНК-связывающий белок FUS (слит при саркоме), ALS7 - белок 7, связанный с амиотрофическим латеральным склерозом, ALS2 - белок 2, связанный с амиотрофическим латеральным склерозом, DPP6 - дипептидилпептидаза 6, NEFH - тяжелый полипептид нейрофиламента, PTGS1 - простагландин-эндопероксидсинтазы 1, SLC1A2 - семейство 1 переносчиков растворенных веществ (глутаматный транспортер глиальных клеток с высоким сродством), представитель 2, TNFRSF10B - фактор некроза опухоли, суперсемейство рецепторов, представитель 10b, PRPH - периферин, HSP90AA1 - 90 кДа белок теплового шока альфа (цитозольный), класс A представитель 1, GRIA2 - глутаматный рецептор, ионотропный, AMPA 2, IFNG - интерферон, гамма, S100B - S100, кальций-связывающий белок B, FGF2 - фактор 2 роста фибробластов, AOX1 - альдегидоксидаза 1, CS - цитратсинтаза, TARDBP - TAR ДНК-связывающий белок, TXN - тиоредоксин, RAPH1 - Ras-ассоциированный белок, (RaIGDS/AF-6) и киназа 5 с доменами 1, характеризующимися гомологией с плекстрином, MAP3K5 - митоген-активируемая протеинкиназа, NBEAL1 - белок 1, подобный нейробичину, GPX1 - глутатионпероксидаза 1, ICA1L - подобный 1,69 кДа-аутоантигену островковых клеток, RAC1 - ras-родственный белок, подобный субстрату 1 ботулинического C3 токсина, MAPT - белок tau, ассоциированный с микротрубочками, ITPR2 - рецептор инозитол-1,4,5-трифосфата, тип 2, ALS2CR4 - кандидатный участок 4 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), GLS - глутаминаза, ALS2CR8 - кандидатный участок 8 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), CNTFR - рецептор для цилиарного нейротрофического фактора, ALS2CR11 - кандидатный участок 11 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), FOLH1 - фолатгидролаза 1, FAM117B - семейство белков со сходством последовательности с белком 117, представитель B, P4HB - пролил-4-гидроксилаза, полипептид бета, CNTF - цилиарный нейротрофический фактор, SQSTM1 - секвестосома 1, STRADB - STE20-родственная киназа, бета-адаптерная, NAIP - семейство NLR, связанный с апоптозом ингибиторный белок, YWHAQ - тирозиназа/триптофан-5-монооксигеназа активирующий белок, полипептид тета, SLC33A1 - семейство 33 переносчиков растворенных веществ (ацетил-CoA транспортеры), представитель 1, TRAK2 - транспортный белок, кинезин-связывающий 2, фиг. 4, гомолог, содержащий домен фосфатазы липидов SAC1, NIF3L1 - NIF3 NGG1-взаимодействующий фактор 3, подобный 1, INA - интернексин, нейрональный промежуточный филаментный белок, альфа, PARD3B - белок par-3 (partitioning defective 3), гомолога B, COX8A - цитохром c оксидаза, субъединица VIIIA, CDK15 - циклин-зависимая киназа, HECW1 HECT - белок, содержащий домен C2 и WW 15, E3 - лигаза 1 убиквитинового белка, NOS1 - синтаза 1 оксида азота, MET - протоонкоген met, SOD2 - митохондриальная супероксиддисмутаза 2, HSPB1 - 27 кДа белок 1 теплового шока, NEFL - легкий полипептид нейрофиламента, CTSB - катепсин B, ANG - ангиогенин, рибонуклеаза ANG - ангиогенин, рибонуклеаза, РНКаза семейства 5, HSPA8 - 70 кДа белок теплового шока 8, VAPB VAMP (ассоциированный с везикулами мембранный белок)-ассоциированные белки B и C, ESR1 - эстрогеновый рецептор 1, SNCA -синуклеин, альфа, HGF - фактор роста гепатоцитов, CAT - каталаза, ACTB - актин, бета, NEFM - среднего размера полипептид нейрофиламента, TH - тирозингидроксилаза, BCL2 - белок 2 B-клеток, связанный с CLL/лимфомой, FAS - Fas (суперсемейство рецепторов TNF, представитель 6), CASP3 - каспаза 3, связанная с апоптозом цистеинпептидаза, CLU - кластерин, SMN1 - белок, связанный с выживанием двигательных нейронов, G6PD - глюкозо-6-фосфатдегидрогеназа 1, BAX BCL2-ассоциированный белок X, HSF1 - транскрипционный фактор 1 белка теплового шока, RNF19A - белок 19A с доменом ring, JUN - онкоген jun, ALS2CR12 - кандидатный участок 12 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), HSPA5 - 70 кДа белок 5 теплового шока, MAPK14 - митоген-активируемая протеинкиназа 14, IL10 - интерлейкин 10, APEX1 - APEX-нуклеаза (мультифункциональный фермент репарации ДНК), TXNRD1 - тиоредоксинредуктаза 1, NOS2 - индуцируемая синтаза 2 оксида азота, TIMP1 - TIMP - ингибитор 1 металлопептидазы, CASP9 - каспаза 9, связанная с апоптозом цистеинпептидаза, XIAP - сцепленный с X-хромосомой ингибитор апоптоза, GLG1 - гликопротеин 1 комплекса Гольджи, EPO - эритропоэтин, VEGFA - фактор роста эндотелия сосудов A, ELN - эластин, GDNF - нейротрофический фактор, полученный из глиальных клеток, NFE2L2 - белок 2, подобный ядерному фактору (эритроидному), SLC6A3 - представитель 3 семейства 6 переносчиков растворенных веществ (транспортер нейротрансмиттеров, допаминовый), HSPA4 - 70 кДа белок 4 теплового шока, APOE - аполипопротеин E, PSMB8 - субъединица протеасомы (просома, макропаин), тип бета, 8, DCTN1 - динактин 1, TIMP3 - TIMP - ингибитор 3 металлопептидазы, KIFAP3 - кинезин-ассоциированный белок 3, SLC1A1 - представитель 1 семейства 1 переносчиков растворенных веществ (глутаматный транспортер нейронов/эпителиальных клеток с высоким сродством, система Xag), SMN2 - центромерный белок 2 выживания двигательных нейронов, CCNC - циклин C, MPP4 - пальмитоилированный мембранный белок 4, STUB1 - белок 1, гомологичный STIP1 и содержащий U-box, ALS2 - белок-предшественник амилоида бета (A4), PRDX6 - пероксиредоксин 6, SYP - синаптофизин, CABIN1 - кальциневрин-связывающий белок 1, CASP1 - каспаза 1, связанная с апоптозом цистеинпептидаза, GART - фосфорибозилглицинамидформилтрансфераза, фосфорибозилглицинамидсинтетаза, фосфорибозиламиноимидазолсинтетаза, CDK5 - циклин-зависимая киназа 5, ATXN3 - атаксин 3, RTN4 - ретикулон 4, C1QB компонент комплемента 1, субкомпонент q, цепь B, VEGFC - рецептор фактора роста нервов, HTT - хантингтин, PARK7 - белок 7, связанный с болезнью Паркинсона, XDH - ксантиндегидрогеназа, GFAP - глиальный фибриллярный кислый белок, MAP2 - белок 2, ассоциированный с микротрубочками, CYCS - цитохром c, соматические клетки, FCGR3B - Fc-фрагмент рецептора IIIb для IgG с низким сродством, CCS - медь-содержащий шаперон супероксиддисмутазы, UBL5 - белок 5, подобный убиквитину, MMP9 - матриксная металлопептидаза 9, SLC18A3 - представитель 3 семейства 18 переносчиков растворенных веществ (везикулярный, ацетилхолиновый), TRPM7 - катионный канал транзиентного рецепторного потенциала, подсемейство M, представитель 7, HSPB2 - 27 кДа белок 2 теплового шока, AKT1 - гомолог 1 онкогена v-akt вируса тимомы мышей, DERL1- представитель 1 семейства белков с Der1-подобным доменом, CCL2 - лиганд 2 хемокина (C--C мотив), NGRN - неугрин, ассоциированный с ростом аксонов, GSR - глутатионредуктаза, TPPP3 - представитель 3 семейства белков, способствующих полимеризации тубулина, APAF1 - фактор 1, активирующий апоптическую пептидазу, BTBD10 - белок 10, содержащий домен BTB (POZ), GLUD1 - глутаматдегидрогеназа 1, CXCR4 - рецептор 4 хемокина (C--X--C мотив), SLC1A3 - представитель 3 семейства 1 переносчиков растворенных веществ (глутаматный транспортер глиальных клеток с высоким сродством), FLT1 - тирозинкиназа 1, родственная fms, PON1 - параоксоназа 1, AR - андрогеновый рецептор, LIF - ингибиторный фактор, связанный с лейкозом, ERBB3 - гомолог 3 онкогена v-erb-b2 вируса эритробластического лейкоза, LGALS1 - лектин, галактозид-связывающий, растворимый, белок 1, CD44 - молекула CD44, TP53 - опухолевый белок p53, TLR3 - толл-подобный рецептор 3, GRIA1 - глутаматный рецептор, ионотропный, AMPA 1, GAPDH - глицеральдегид-3-фосфатдегидрогеназа, GRIK1 - глутаматный рецептор, ионотропный, каинатный белок 1, DES - десмин, CHAT - холинацетилтрансфераза, FLT4 - тирозинкиназа 4, родственная fms, CHMP2B - белок 2B, модифицирующий хроматин, BAG1 - BCL2-ассоциированный атаноген, MT3 - металлотионеин 3, CHRNA4 - холинергический рецептор, никотиновый, альфа 4, GSS - глутатионсинтетаза, BAK1 - BCL2-антагонист/киллер 1, KDR - рецептор вставочного домена киназы (рецептор тирозинкиназы III типа), GSTP1 - глутатион-S-трансфераза пи 1, OGG1 - 8-оксогуанин-ДНК-гликозилаза, IL6 - интерлейкин 6 (интерферон, бета 2).

Животное или клетка могут содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с ALS, и нуль, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более интегрированных в хромосомы последовательностей, кодирующих белок с нарушенной структурой, ассоциированный с ALS. Предпочтительные белки, ассоциированные с ALS, включают SOD1 (супероксиддисмутазу 1), ALS2 (белок 2, ассоциированный с боковым амиотрофическим склерозом), FUS (РНК-связывающий белок FUS), TARDBP (TAR-ДНК связывающий белок), VAGFA (фактор роста эндотелия сосудов A), VAGFB (фактор роста эндотелия сосудов B) и VAGFC (фактор роста эндотелия сосудов C) и любую их комбинацию.

Аутизм

В публикации заявки на патент США № 20110023145 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с расстройствами аутистического спектра (ASD). Расстройства аутистического спектра (ASD) представляют собой группу расстройств, характеризующихся качественным нарушением социального взаимодействия и коммуникации, а также ограниченными повторяющимися и стереотипными формами поведения, интересов и видов деятельности. Три расстройства, аутизм, синдром Аспергера (AS) и неспецифическое первазивное расстройство развития (PDD-NOS) относятся к одному и тому же расстройству с различными степенями тяжести, ассоциированными с умственной деятельностью и медицинскими состояниями. ASD преимущественно являются расстройствами, которые предопределены наследственными факторами, с наследуемостью приблизительно 90%.

В публикации заявки на патент США № 20110023145 предусматривается редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с ASD, что можно применять по отношению к системе CRISPR-Cas согласно настоящему изобретению. Белки, ассоциированные с ASD, как правило, выбирают исходя из экспериментально установленной ассоциации белка, ассоциированного с ASD, с возникновением или симптомом ASD. Например, скорость образования или концентрация в кровотоке белка, связанного с ASD, может быть повышенной или пониженной в популяции с ASD по сравнению с популяцией без ASD. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с ASD, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

Неограничивающие примеры болезненных состояний или расстройств, которые могут быть ассоциированы с белками, ассоциированными с ASD, включают аутизм, синдром Аспергера (AS), неспецифическое первазивное расстройство развития (PDD-NOS), синдром Ретта, туберозный склероз, фенилкетонурию, синдром Смита-Лемли-Опица и синдром ломкой X-хромосомы. В качестве неограничивающего примера белки, ассоциированные с ASD, включают без ограничения следующие белки: ATP10C - аминофосфолипид-транспортирующую АТФазу (ATP10C), MET - MET-рецепторную тирозинкиназу, BZRAP1, MGLUR5 (GRM5) - метаботропный глутаматный рецептор 5 (MGLUR5), CDH10 - кадгерин-10, MGLUR6 (GRM6) - метаботропный глутаматный рецептор 6 (MGLUR6), CDH9 - кадгерин-9, NLGN1 - нейролигин-1, CNTN4 - контактин-4, NLGN2 - нейролигин-2, CNTNAP2 - белок 2, подобный контактин-ассоциированному белку (CNTNAP2), SEMA5A - нейролигин-3, DHCR7 - 7-дегидрохолестеринредуктазу (DHCR7), NLGN4X - нейролигин-4 X-связанный, NLGN4Y - нейролигин-4 Y-связанный, DOC2A - альфа-белок, содержащий двойной C2-подобный домен, DPP6 - белок 6, подобный дипептидиламинопептидазе, NLGN5 - нейролигин-5, EN2 - белок 2, кодируемый гомеобоксом (EN2), NRCAM - молекулу адгезии нейронов (NRCAM), MDGA2, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (MDGA2), NRXN1 - нейрексин-1, FMR2 (AFF2) - представитель 2 семейства AF4/FMR2, OR4M2 - рецептор обонятельных луковиц 4M2, FOXP2 - белок, кодируемый Forkhead-боксом P2 (FOXP2), OR4N4 - рецептор обонятельных луковиц 4N4, FXR1 - аутосомный гомолог 1, связанный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR1), OXTR - окситоциновый рецептор (OXTR), FXR2 - аутосомный гомолог 2, связанный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR2), PAH - фенилаланингидроксилазу (PAH), GABRA1 - субъединицу альфа-1 рецептора гамма-аминомасляной кислоты (GABRA1), PTEN - гомолог фосфатазы и тензина (PTEN), GABRA5 - субъединицу альфа-5 рецептора GABAA (гамма-аминомасляной кислоты) (GABRA5), PTPRZ1 - протеиновую тирозинфосфатазу-дзета рецепторного типа (PTPRZ1), GABRB1 - субъединицу бета-1 рецептора гамма-аминомасляной кислоты (GABRB1), RELN - рилин, GABRB3 - субъединицу бета-3 рецептора GABAA (гамма-аминомасляной кислоты) (GABRB3), RPL10 - рибосомальный белок 60S L10, GABRG1 - субъединицу гамма-1 рецептора гамма-аминомасляной кислоты (GABRG1), SEMA5A - семафорин-5A (SEMA5A), HIRIP3 - HIRA-взаимодействующий белок 3, SEZ6L2 - белок 2, подобный гомологу белка 6, связанного с приступами (мышь), HOXA1 - белок, кодируемый гомеобоксом Hox-A1 (HOXA1), SHANK3 - белок 3, содержащий SH3 и несколько повторяющихся доменов анкирина (SHANK3), IL6 - интерлейкин-6, SHBZRAP1 - белок 3, содержащий SH3 и несколько повторяющихся доменов анкирина (SHBZRAP1), LAMB1 - ламинин, субъединицу бета-1 (LAMB1), SLC6A4 - серотониновый транспортер (SERT), MAPK3 - митоген-активируемую протеинкиназу 3, TAS2R1 - вкусовой рецептор типа 2, представитель 1 (TAS2R1), MAZ - Myc-ассоциированный белок с "цинковыми пальцами", TSC1 - белок 1, ассоциированный с туберозным склерозом, MDGA2 - гликозилфосфатидилинозитол-связанный белок 2, якорная форма 2, содержащий домен MAM (MDGA2), TSC2 - белок 2, ассоциированный с туберозным склерозом, MECP2 - метил-CpG-связывающий белок 2 (MECP2), UBE3A - убиквитинпротеинлигазу E3A (UBE3A), MECP2 - метил-CpG-связывающий белок 2 (MECP2), WNT2 - сайт интеграции MMTV типа Wingless, представитель 2 семейства (WNT2).

Идентичность белка, ассоциированного с ASD, редактирование хромосомной последовательности которого осуществляют, может и будет варьировать. В предпочтительных вариантах осуществления белки, ассоциированные с ASD, редактирование хромосомной последовательности которых осуществляют, могут представлять собой белок 1, ассоциированный с периферическим бензодиазепиновым рецептором (BZRAP1), кодируемый геном BZRAP1, белок-представитель 2 семейства AF4/FMR2 (AFF2), кодируемый геном AFF2 (также называемый MFR2), белок-аутосомный гомолог 1, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR1), кодируемый геном FXR1, или белок-аутосомный гомолог 2, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR2), кодируемый геном FXR2, гликозилфосфатидилинозитол-связанный белок, содержащий домен MAM, якорная форма 2 (MDGA2), кодируемый геном MDGA2, метил-CpG связывающий белок 2 (MECP2), кодируемый геном MECP2, метаботропный глутаматный рецептор 5 (MGLUR5), кодируемый геном MGLUR5-1 (также называемый GRM5), белок нейрексин 1, кодируемый геном NRXN1, или белок семафорин-5A (SEMA5A), кодируемый геном SEMA5A. В иллюстративном варианте осуществления генетически модифицированным животным является крыса, и редактируемые хромосомные последовательности, кодирующие белок, ассоциированный с ASD, перечислены ниже: BZRAP1 - белок 1, ассоциированный с (периферическим) бензодиазепиновым рецептором (BZRAP1) - XM_002727789, XM_213427, XM_002724533, XM_001081125, AFF2 (FMR2) - представитель 2 семейства AF4/FMR2 (AFF2) - XM_219832, XM_001054673, FXR1 - аутосомный гомолог 1, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR1) - NM_001012179, FXR2 - аутосомный гомолог 2, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR2) - NM_001100647, MDGA2 - гликозилфосфатидилинозитол-связанный белок, содержащий домен MAM, якорная форма 2 (MDGA2) - NM_199269, MECP2 - метил-CpG-связывающий белок 2 (MECP2) - NM_022673, MGLUR5 - метаботропный глутаматный рецептор 5 (GRM5) (MGLUR5) - NM_017012, NRXN1 - нейрексин-1 - NM_021767, SEMA5A - семафорин-5A (SEMA5A) - NM_001107659.

Нарушения, связанные с экспансией тринуклеотидных повторов (TRE)

В публикации заявки на патент США № 20110016540 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с нарушениями, связанными с экспансией тринуклеотидных повторов. Нарушения, связанные с экспансией тринуклеотидных повторов, являются комплексными прогрессирующими нарушениями, затрагивающими биологию развития нервной системы и часто нарушающими когнитивные функции, а также сенсомоторные функции.

Белки, связанные с экспансией тринуклеотидных повторов, представляют собой разнородную группу белков, ассоциированных с восприимчивостью к развитию нарушения, связанного с экспансией тринуклеотидных повторов, наличием нарушения, связанного с экспансией тринуклеотидных повторов, тяжестью нарушения, связанного с экспансией тринуклеотидных повторов, или любой их комбинацией. Нарушения, связанные с экспансией тринуклеотидных повторов, подразделяют на две категории, определяемые типом повтора. Наиболее распространенным повтором является триплет CAG, который, в случае наличия в кодирующем участке гена, кодирует аминокислоту глутамин (Q). Таким образом, эти нарушения называются нарушениями, связанными с экспансией полиглутаминовых повторов (поли-Q), и включают следующие заболевания: болезнь Гентингтона (HD); спинобульбарную мышечную атрофию (SBMA); формы спинально-церебеллярной атаксии (SCA типов 1, 2, 3, 6, 7 и 17) и дентато-рубро-паллидо-льюисову атрофию (DRPLA). Остальные нарушения, связанные с экспансией тринуклеотидных повторов, при которых триплет CAG не вовлечен, либо триплет CAG находится не в кодирующем участке гена, называются, таким образом, нарушениями, не связанными с экспансией полиглутаминовых повторов. Нарушения, не связанные с экспансией полиглутаминовых повторов, включают синдром ломкой X-хромосомы (FRAXA); синдром умственной отсталости, сцепленный с ломкой X-хромосомой (FRAXE); атаксию Фридрейха (FRDA); миотоническую дистрофию (DM) и формы спинально-церебеллярной атаксии (SCA типов 8 и 12).

Белки, ассоциированные с нарушениями, связанными с экспансией тринуклеотидных повторов, как правило, выбирают на основании экспериментально установленной ассоциации белка, ассоциированного с нарушением, связанным с экспансией тринуклеотидных повторов, и нарушения, связанного с экспансией тринуклеотидных повторов. Например, скорость образования или концентрация в кровотоке белка, ассоциированного с нарушением, связанным с экспансией тринуклеотидных повторов, может быть повышенной или пониженной в популяции, имеющей нарушение, связанное с экспансией тринуклеотидных повторов, по сравнению с популяцией, не имеющей нарушения, связанного с экспансией тринуклеотидных повторов. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с нарушениями, обусловленными экспансией тринуклеотидных повторов, можно идентифицировать путем получения профилей генной экспрессии для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

Неограничивающие примеры белков, ассоциированных с нарушениями, связанными с экспансией тринуклеотидных повторов, включают AR (андрогенный рецептор), FMR1 (белок 1, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой), HTT (гентингтин), DMPK (протеинкиназу, ассоциированную с миотонической дистрофией), FXN (фратаксин), ATXN2 (атаксин 2), ATN1 (атрофин 1), FEN1 (структуроспецифичную флэп-эндонуклеазу 1), TNRC6A (белок, кодируемый геном 6A, содержащим тринуклеотидные повторы), PABPN1 (ядерный поли(A)-связывающий белок 1), JPH3 (юнктофилин 3), MED15 (субъединицу 15 медиаторного комплекса), ATXN1 (атаксин 1), ATXN3 (атаксин 3), TBP (TATA-бокс-связывающий белок), CACNA1A (альфа-1A-субъединицу потенциал-зависимого кальциевого канала P/Q-типа), ATXN80S (белок, синтезируемый с противоположной нити ATXN8 (не кодирующей белок)), PPP2R2B (бета-изоформу регуляторной субъединицы B протеинфосфатазы 2), ATXN7 (атаксин 7), TNRC6B (белок, кодируемый геном 6B, содержащим тринуклеотидные повторы), TNRC6C (белок, кодируемый геном 6C, содержащим тринуклеотидные повторы), CELF3 (CUGBP, представитель 3 семейства Elav-подобных белков), MAB21L1 (mab-21-подобный белок 1 (C. elegans)), MSH2 (гомолог 2 mutS, ассоциированный с неполипозным колоректальным раком 1 типа (E. coli)), TMEM185A (трансмембранный белок 185A), SIX5 (белок, кодируемый гомеобоксом 5 SIX), CNPY3 (гомолог Canopy 3 (данио-рерио)), FRAXE (белок, ассоциированный с "редким" ломким сайтом, проявляющимся при недостатке фолиевой кислоты, fra(X)(q28) E), GNB2 (бета-полипептид 2 белка, связывающего гуаниновые нуклеотиды (G-белка)), RPL14 (рибосомный белок L14), ATXN8 (атаксин 8), INSR (инсулиновый рецептор), TTR (транстиретин), EP400 (E1A-связывающий белок p400), GIGYF2 (белок GYF 2, взаимодействующий с GRB10), OGG1 (8-оксогуанин-ДНК-гликозилазу), STC1 (станниокальцин 1), CNDP1 (карнозиндипептидазу 1 (металлопептидазу семейства M20)), C10orf2 (белок, кодируемый открытой рамкой считывания 2 хромосомы 10), MAML3 (mastermind-подобный белок 3 (Drosophila)), DKC1 (белок 1, ассоциированный с врожденным дискератозом, дискерин), PAXIP1 (белок 1, взаимодействующий с PAX (с доменом активации транскрипции)), CaSK (кальций/кальмодулин-зависимую сериновую протеинкиназу (семейства MAGUK)), MAPT (белок tau, ассоциированный с микротрубочками), SP1 (фактор транскрипции Sp1), POLG (полимеразу гамма (ДНК-направленную)), AFF2 (представитель 2 семейства AF4/FMR2), THBS1 (тромбоспондин 1), TP53 (опухолевый белок p53), ESR1 (эстрогеновый рецептор 1), CGGBP1 (белок 1, связывающий триплетный повтор CGG), ABT1 (активатор 1 базальной транскрипции), KLK3 (родственную калликреину пептидазу 3), PRNP (белок приона), JUN (онкоген jun), KCNN3 (кальций-активируемый калиевый канал средней/малой проводимости, представитель 3 подсемейства N), BAX (BCL2-ассоциированный белок X), FRAXA (белок, ассоциированный с "редким" ломким сайтом, проявляющимся при недостатке фолиевой кислоты, fra(X)(q27.3) A (макроорхидизм, умственная отсталость)), KBTBD10 (белок 10, содержащий повтор Kelch и домен BTB (POZ)), MBNL1 (muscleblind-подобный белок (Drosophila)), RAD51 (гомолог RAD51 (гомолог RecA, E. coli) (S. cerevisiae)), NCOA3 (коактиватор 3 ядерных рецепторов), ERDA1 (белок с экспансией повторяющихся доменов, CAG/CTG 1), TSC1 (белок 1, ассоциированный с туберозным склерозом), COMP (олигомерный матриксный белок хряща), GCLC (каталитическую субъединицу глутаматцистеинлигазы), RRAD (Ras-родственный белок, ассоциированный с сахарным диабетом), MSH3 (гомолог 3 mutS (E. coli)), DRD2 (дофаминовый рецептор D2), CD44 (молекулу CD44 (система групп крови Indian)), CTCF (CCCTC-связывающий фактор (белок с "цинковыми пальцами")), CCND1 (циклин D1), CLSPN (гомолог класпина (Xenopus laevis)), MEF2A (энхансерный фактор 2A миоцитов), PTPRU (протеинтирозинфосфатазу рецепторного типа U), GAPDH (глицеральдегид-3-фосфатдегидрогеназу), TRIM22 (белок 22, содержащий тройной мотив), WT1 (белок 1 опухоли Вильмса), AHR (арил-углеводородный рецептор), GPX1 (глутатионпероксидазу 1), TPMT (тиопурин-S-метилтрансферазу), NDP (белок, ассоциированный с болезнью Норри (псевдоглиомой)), ARX (белок, кодируемый гомеобоксом гена, родственного aristaless), MUS81 (гомолог эндонуклеазы MUS81 (S. cerevisiae)), TYR (тирозиназу (глазокожный альбинизм IA)), EGR1 (белок 1 раннего ростового ответа), UNG (урацил-ДНК-гликозилазу), NUMBL (белок, подобный гомологу numb (Drosophila)), FABP2 (белок 2, связывающий жирные кислоты в кишечнике), EN2 (белок, кодируемый гомеобоксом engrailed 2), CRYGC (гамма-C-кристаллин), SRP14 (гомологичный РНК-связывающий белок Alu размером 14 кДа из частицы узнавания сигнала), CRYGB (гамма-B-кристаллин), PDCD1 (белок 1 запрограммированной гибели клеток), HOXA1 (белок, кодируемый гомеобоксом A1), ATXN2L (атаксин-2-подобный белок), PMS2 (PMS2, белок 2, противодействующий повышению уровня постмейотической сегрегации (S. cerevisiae)), GLA (альфа-галактозидазу), CBL (белок, кодируемый последовательностью, трансформирующей с экотропным ретровирусом Cas-Br-M (мышей)), FTH1 (полипептид 1 тяжелой субъединицы ферритина), IL12RB2 (бета-2-субъединицу рецептора интерлейкина 12), OTX2 (белок, кодируемый гомеобоксом orthodenticle 2), HOXA5 (белок, кодируемый гомеобоксом A5), POLG2 (вспомогательную гамма-2-субъединицу полимеразы (ДНК-направленной)), DLX2 (белок, кодируемый гомеобоксом distal-less 2), SIRPA (сигнально-регуляторный белок альфа), OTX1 (белок, кодируемый гомеобоксом orthodenticle 1), AHRR (репрессор арил-углеводородного рецептора), MANF (мезэнцефальный нейротрофический фактор, происходящий из астроцитов), TMEM158 (трансмембранный белок 158 (ген/псевдоген)) и ENSG00000078687.

Предпочтительные белки, ассоциированные с нарушениями, обусловленными экспансией тринуклеотидных повторов, включают HTT (гентингтин), AR (андрогенный рецептор), FXN (фратаксин), Atxn3 (атаксин), Atxn1 (атаксин), Atxn2 (атаксин), Atxn7 (атаксин), Atxn10 (атаксин), DMPK (протеинкиназу, ассоциированную с миотонической дистрофией), Atn1 (атрофин 1), CBP (creb-связывающий белок), VLDLR (рецептор липопротеинов очень низкой плотности) и их любую комбинацию.

Болезнь Альцгеймера

В публикации заявки на патент США № 20110023153 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с болезнью Альцгеймера. После модификации клетки и животных можно дополнительно исследовать с применением известных способов для исследования воздействия целенаправленных мутаций на развитие и/или прогрессирование AD с использованием показателей, обычно применяемых в исследовании AD - таких как без ограничения обучение и память, тревожность, депрессия, привыкание и сенсомоторные функции, а также анализов, с помощью которых измеряют поведенческие, функциональные, патологические, метаболические и биохимические характеристики.

Настоящее раскрытие предусматривает редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с AD. Белки, связанные с AD, обычно выбирают исходя из экспериментально подтвержденной ассоциации белка, связанного с AD, с заболеванием AD. Например, скорость образования или концентрация в кровотоке белка, связанного с AD, может быть повышенной или пониженной в популяции с заболеванием AD по сравнению с популяцией без заболевания AD. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, связанные с AD, можно идентифицировать путем получения профилей генной экспрессии для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

Примеры ассоциированных с болезнью Альцгеймера белков могут включать, например, белок-рецептор липопротеинов очень низкой плотности (VLDLR), кодируемый геном VLDLR, фермент 1, активирующий убиквитин-подобный модификатор (UBA1), кодируемый геном UBA1, или белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (UBE1C), кодируемый геном UBA3.

В качестве неограничивающего примера, белки, ассоциированные с AD, включают без ограничения белки, перечисленные ниже: кодируемый хромосомной последовательностью белок ALAS2, дельта-аминолевулинатсинтаза 2 (ALAS2), ABCA1 - ATФ-связывающий кассетный транспортер (ABCA1), ACE - ангиотензин I-превращающий фермент (ACE), APOE - предшественник аполипопротеина E (APOE), APP - белок-предшественник амилоида (APP), AQP1 - белок аквапорин 1 (AQP1), BIN1 - Myc-бокс-зависимый взаимодействующий белок 1 или адаптерный белок-интегратор 1 (BIN1), BDNF - нейротрофический фактор головного мозга (BDNF), BTNL8 - белок 8, подобный бутирофилину (BTNL8), C1ORF49 - белок, кодируемый открытой рамкой считывания 49 хромосомы 1, CDH4 - кадгерин-4, CHRNB2 - нейрональный ацетилхолиновый рецептор, субъединица бета-2, CKLFSF2 - CKLF-подобный белок 2, содержащий трансмембранный домен MARVEL (CKLFSF2), CLEC4E - лектиновый домен C-типа, семейство 4, представитель e (CLEC4E), CLU - кластериновый белок (также известный как аполипопротеин J) CR1 - эритроцитарный рецептор комплемента 1 (CR1, также известный как CD35, рецептор C3b/C4b и рецептор иммунной адгезии), CR1L - эритроцитарный рецептор комплемента 1 (CR1L), CSF3R - рецептор гранулоцитарного колониестимулирующего фактора 3 (CSF3R), CST3 - цистатин C или цистатин 3, CYP2C - цитохром P450 2C, DAPK1 - ассоциированная с клеточной гибелью протеинкиназа 1 (DAPK1), ESR1 - эстрогеновый рецептор 1, FCAR - Fc-фрагмент рецептора для IgA (FCAR, также известный как CD89), FCGR3B - Fc-фрагмент рецептора IIIb для IgG, с низким сродством (FCGR3B или CD16b), FFA2 - рецептор 2 свободных жирных кислот (FFA2), FGA - фибриноген (фактор I), GAB2 - GRB2-ассоциированный связывающий белок 2 (GAB2), GAB2 - GRB2-ассоциированный связывающий белок 2 (GAB2), GALP - галанин-подобный пептид, GAPDHS - глицеральдегид-3-фосфатдегидрогеназа сперматогенных клеток (GAPDHS), GMPB - GMBP, HP - гаптоглобин (HP), HTR7 - 5-гидрокситриптаминовый (серотониновый) рецептор 7 (сопряженный с аденилатциклазой), IDE - фермент, разрушающий инсулин IF127 IF127, IFI6 - интерферон альфа-индуцируемый белок 6 (IFI6), IFIT2 - интерферон-индуцируемый белок с тетратрикопептидными повторами 2 (IFIT2), IL1RN - антагонист рецептора интерлейкина-1 (IL-1RA), IL8RA - рецептор интерлейкина 8, альфа (IL8RA или CD181), IL8RB - рецептор интерлейкина 8, бета (IL8RB), JAG1 - белок Jagged 1 (JAG1), KCNJ15 - входящий калиевый канал, подсемейство J, представитель 15 (KCNJ15), LRP6 - белок 6, родственный рецептору липопротеинов низкой плотности (LRP6), MAPT - белок tau, ассоциированный с микротрубочками (MAPT), MARK4 - киназа 4 MAP/регулирующая сродство к микротрубочкам (MARK4), MPHOSPH1 - фосфобелок 1 M-фазы, MTHFR - 5,10-метилентетрагидрофолатредуктазу, MX2 - интерферон-индуцируемый GTP-связывающий белок Mx2, NBN - нибрин, также известный как NBN, NCSTN - никастрин, NIACR2 - рецептор 2 ниацина (NIACR2, также известный как GPR109B), NMNAT3 - никотинамиднуклеотидаденилилтрансфераза 3, NTM - нейротримин (или HNT), ORM1 - орозомукоид 1 (ORM1) или альфа-1-кислый гликопротеин 1, P2RY13 - пуринергический рецептор P2Y 13 (P2RY13), PBEF1 - никотинамидфосфорибозилтрансфераза (NAmPRTазу или Nampt), также известная как колониестимулирующий фактор 1 пре-B-клеток (PBEF1) или висфатин, PCK1 - -фосфоенолпируваткарбоксикиназа, PICALM - фосфатидилинозит-cвязывающий белок, вовлеченный в формирование клатриновых комплексов (PICALM), PLAU - активатор плазминогена урокиназного типа (PLAU), PLXNC1 - плексин C1 (PLXNC1), PRNP - прионный белок, PSEN1 - белок пресенилин 1 (PSEN1), PSEN2 - белок пресенилин 2 (PSEN2), PTPRA - белок, представляющий собой рецепторную протеинтирозинфосфатазу типа A (PTPRA), RALGPS2 - Ral GEF с доменом PH и SH3-связывающим мотивом 2 (RALGPS2), RGSL2 - белок 2, подобный регулятору передачи сигнала с помощью G-белка (RGSL2), SELENBP1 - селенсвязывающий белок 1 (SELNBP1), SLC25A37 - митоферрин-1, SORL1 - родственный сортилину рецептор L (класс DLR), белок, содержащий повторы A (SORL1), TF - трансферрин, TFAM - митохондриальный транскрипционный фактор A, TNF - фактор некроза опухоли, TNFRSF10C - суперсемейство рецепторов фактора некроза опухоли, представитель 10C (TNFRSF10C), TNFSF10 - суперсемейство рецепторов фактора некроза опухоли (TRAIL), представитель 10a (TNFSF10), UBA1 - фермент 1, активирующий убиквитин-подобный модификатор (UBA1), UBA3 - белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (UBE1C), UBB - белок убиквитин B (UBB), UBQLN1 - убиквилин-1, UCHL1 - белок эстеразу карбокси-конца убиквитина L1 (UCHL1), UCHL3 - белок-изофермент L3 гидролазы карбокси-конца убиквитина (UCHL3), VLDLR - белок-рецептор липопротеинов очень низкой плотности (VLDLR).

В иллюстративных вариантах осуществления белки, ассоциированные с AD, редактирование хромосомной последовательности которых осуществляют, могут представлять собой белок рецептора липопротеинов очень низкой плотности (VLDLR), кодируемый геном VLDLR, фермент 1, активирующий убиквитин-подобный модификатор (UBA1), кодируемый геном UBA1, белок каталитической субъединицы NEDD8-активирующего фермента E1 (UBE1C), кодируемый геном UBA3, белок аквапорин 1 (AQP1), кодируемый геном AQP1, белок эстеразы карбокси-конца убиквитина L1 (UCHL1), кодируемый геном UCHL1, белок, относящийся к изоферменту L3 гидролазы карбокси-конца убиквитина (UCHL3), кодируемый геном UCHL3, белок убиквитин B (UBB), кодируемый геном UBB, белок tau, ассоциированный с микротрубочками (MAPT), кодируемый геном MAPT, белок рецептора тирозинфосфатазы типа A (PTPRA), кодируемый геном PTPRA, фосфатидилинозит-cвязывающий белок, вовлеченный в формирование клатриновых комплексов (PICALM), кодируемый геном PICALM, кластериновый белок (также известный как аполипопротеин J), кодируемый геном CLU, белок пресенилин 1, кодируемый геном PSEN1, белок пресенилин 2, кодируемый геном PSEN2, родственный сортилину рецептор L (класс DLR), белок, содержащий повторы A (SORL1), кодируемый геном SORL1, белок-предшественник амилоида (APP), кодируемый геном APP, предшественник аполипопротеина E (APOE), кодируемый геном APOE, или нейротрофический фактор головного мозга (BDNF), кодируемый геном BDNF. В иллюстративном варианте осуществления генетически модифицированное животное представляет собой крысу, и редактируемые хромосомные последовательности, кодирующие белок, ассоциированный с AD, являются следующими: APP - белок-предшественник амилоида (APP) - NM_019288, AQP1 - белок аквапорин 1 (AQP1) - NM_012778, BDNF - нейротрофический фактор головного мозга - NM_012513, CLU - кластериновый белок (также известный как аполипопротеин J) - NM_053021, MAPT - белок tau, ассоциированный с микротрубочками (MAPT) - NM_017212, PICALM - фосфатидилинозит-cвязывающий белок, вовлеченный в формирование клатриновых комплексов (PICALM) - NM_053554, PSEN1 - белок пресенилин 1 (PSEN1) - NM_019163, PSEN2 - белок пресенилин 2 (PSEN2) - NM_031087, PTPRA - белок, представляющий собой рецепторную протеинтирозинфосфатазу типа A (PTPRA) - NM_012763, SORL1 - родственный сортилину рецептор L (класс DLR), белок, содержащий повторы A (SORL1) - NM_053519, XM_001065506, XM_217115, UBA1 - фермент 1, активирующий убиквитин-подобный модификатор (UBA1) - NM_001014080, UBA3 - белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (UBE1C) - NM_057205, UBB - белок убиквитин B (UBB) - NM_138895, UCHL1 - белок эстераза карбокси-конца убиквитина L1 (UCHL1) - NM_017237, UCHL3 - белок-изофермент L3 гидролазы карбокси-конца убиквитина (UCHL3) - NM_001110165, VLDLR - белок-рецептор липопротеинов очень низкой плотности (VLDLR) - NM_013155.

Животное или клетка может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с AD, и ноль, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 или более интегрированных в хромосомы последовательностей, кодирующих белок, ассоциированный с AD.

Отредактированную или интегрированную хромосомную последовательность можно модифицировать так, чтобы она кодировала измененный белок, ассоциированный с AD. Ряд мутаций в хромосомных последовательностях, связанных с AD, были ассоциированы с AD. Например, миссенс-мутация V7171 (т.е. валин в положении 717 заменен на изолейцин) в APP приводит к семейной форме AD. Несколько мутаций в белке пресенилин-1, например, H163R (т.е. гистидин в положении 163 заменен на аргинин), A246E (т.е. аланин в положении 246 заменен на глутамат), L286V (т.е. лейцин в положении 286 заменен на валин) и C410Y (т.е. цистеин в положении 410 заменен на тирозин) приводят к семейной форме болезни Альцгеймера 3 типа. Мутации в белке пресенилин-2, например, N141I (т.е. аспарагин в положении 141 заменен на изолейцин), M239V (т.е. метионин в положении 239 заменен на валин) и D439A (т.е. аспартат в положении 439 заменен на аланин) приводят к семейной форме болезни Альцгеймера 4 типа. Другие ассоциации генных вариантов генов, ассоциированных с AD, и заболевания известны из уровня техники. См., например, публикацию Waring et al. (2008) Arch. Neurol. 65:329-334, раскрытие которой включено в данный документ посредством ссылки во всей своей полноте.

Примеры связанных с заболеваниями генов

Примеры ассоциированных с заболеваниями генов и полинуклеотидов приведены в таблицах A и B. Примеры ассоциированных с биохимическими путями передачи сигналов генов и полинуклеотидов приведены в таблице C.

Таблица A
ЗАБОЛЕВАНИЕ/НАРУШЕНИЯ ГЕН(ГЕНЫ)
Неоплазия PTEN; ATM; ATR; EGFR; ERBB2; ERBB3; ERBB4;
Notch1; Notch2; Notch3; Notch4; AKT; AKT2; AKT3; HIF;
HIF1a; HIF3a; Met; HRG; Bcl2; PPAR альфа; PPAR
гамма; WT1 (опухоль Вильмса); представители семейства рецепторов FGF
(5 представителей: 1, 2, 3, 4, 5); CDKN2a; APC; RB
(ретинобластома); MEN1; VHL; BRCA1; BRCA2; AR
(андрогеновый рецептор); TSG101; IGF; рецептор IGF; Igf1 (4
варианта); Igf2 (3 варианта); рецептор Igf 1; рецептор Igf 2;
Bax; Bcl2; семейство каспаз (9 представителей:
1, 2, 3, 4, 6, 7, 8, 9, 12); Kras; Apc
Возрастная дегенерация Abcr; Ccl2; Cc2; cp (церулоплазмин); Timp3; катепсин D;
желтого пятна Vldlr; Ccr2
Шизофренические Нейрегулин 1 (Nrg1); Erb4 (рецептор для нейрегулина);
Комплексин 1 (Cplx1); Tph1, триптофан-гидроксилаза; Tph2,
триптофан-гидроксилаза 2; нейрексин 1; GSK3; GSK3a;
GSK3b
нарушения 5-HTT (Slc6a4); COMT; DRD (Drd1a); SLC6A3; DAOA;
DTNBP1; Dao (Dao1)
Связанные с тринуклеотидными повторами HTT (болезнь Гентингтона); SBMA/SMAX1/AR (болезнь
нарушения Кеннеди); FXN/X25 (атаксия Фридрейха); ATX3 (болезнь Мачадо-
Джозефа); ATXN1 и ATXN2 (формы спинально-церебеллярной
атаксии); DMPK (миотоническая дистрофия); атрофин-1 и Atn1
(заболевание DRPLA); CBP (Creb-BP - общая нестабильность); VLDLR
(Альцгеймера); Atxn7; Atxn10
Синдром ломкой X-хромосомы FMR2; FXR1; FXR2; mGLUR5
Связанные с активностью секретазы APH-1 (альфа и бета); пресенилин (Psen1); никастрин
нарушения (Ncstn); PEN-2
Другие Nos1; Parp1; Nat1; Nat2
Связанные с прионами нарушения Prp
ALS SOD1; ALS2; STEX; FUS; TARDBP; VEGF (VEGF-a;
VEGF-b; VEGF-c)
Привыкание к наркотическим средствам Prkce (алкоголь); Drd2; Drd4; ABAT (алкоголь); GRIA2;
Grm5; Grin1; Htr1b; Grin2a; Drd3; Pdyn; Gria1 (алкоголь)
Аутизм Mecp2; BZRAP1; MDGA2; Sema5A; нейрексин 1; ломкая X
(FMR2 (AFF2); FXR1; FXR2; Mglur5)
Болезнь Альцгеймера E1; CHIP; UCH; UBB; Tau; LRP; PICALM; кластерин; PS1;
SORL1; CR1; Vldlr; Uba1; Uba3; CHIP28 (Aqp1,
аквапорин 1); Uchl1; Uchl3; APP
Воспаление IL-10; IL-1 (IL-1a; IL-1b); IL-13; IL-17 (IL-17a (CTLA8); IL-
17b; IL-17c; IL-17d; IL-17f); II-23; Cx3cr1; ptpn22; TNFa;
NOD2/CARD15 для IBD; IL-6; IL-12 (IL-12a; IL-12b);
CTLA4; Cx3cl1
Болезнь Паркинсона x-синуклеин; DJ-1; LRRK2; паркин; PINK1
Таблица B
Заболевания и нарушения, связанные с кровеносной системой и свертыванием крови Анемия (CDAN1, CDA1, RPS19, DBA, PKLR, PK1, NT5C3, UMPH1, PSN1, RHAG, RH50A, NRAMP2, SPTB, ALAS2, ANH1, ASB, ABCB7, ABC7, ASAT); синдром "голых" лимфоцитов (TAPBP, TPSN, TAP2, ABCB3, PSF2, RING11, MHC2TA, C2TA, RFX5, RFXAP, RFX5), нарушения свертываемости крови (TBXA2R, P2RX1, P2X1); фактор H и фактор H-подобный 1 (HF1, CFH, HUS); фактор V и фактор VIII (MCFD2); недостаток фактора VII (F7); недостаток фактора X (F10); недостаток фактора XI (F11); недостаток фактора XII (F12, HAF); недостаток фактора XIIIA (F13A1, F13A); недостаток фактора XIIIB (F13B); синдром Фанкони (FANCA, FACA, FA1, FA, FAA, FAAP95, FAAP90, FLJ34064, FANCB, FANCC, FACC, BRCA2, FANCD1, FANCD2, FANCD, FACD, FAD, FANCE, FACE, FANCF, XRCC9, FANCG, BRIP1, BACH1, FANCJ, PHF9, FANCL, FANCM, KIAA1596); нарушения по типу гемофагоцитарного лимфогистиоцитоза (PRF1, HPLH2, UNC13D, MUNC13-4, HPLH3, HLH3, FHL3); гемофилия A (F8, F8C, HEMA); гемофилия B (F9, HEMB), геморрагические нарушения (PI, ATT, F5); связанные с лейкоцитами недостаточности и нарушения (ITGB2, CD18, LCAMB, LAD, EIF2B1, EIF2BA, EIF2B2, EIF2B3, EIF2B5, LVWM, CACH, CLE, EIF2B4); серповидно-клеточная анемия (HBB); талассемия (HBA2, HBB, HBD, LCRB, HBA1).
Связанные с клеточной дисрегуляцией заболевания и нарушения и онкологические заболевания и нарушения B-клеточная неходжкинская лимфома (BCL7A, BCL7); лейкоз (TAL1, TCL5, SCL, TAL2, FLT3, NBS1, NBS, ZNFN1A1, IK1, LYF1, HOXD4, HOX4B, BCR, CML, PHL, ALL, ARNT, KRAS2, RASK2, GMPS, AF10, ARHGEF12, LARG, KIAA0382, CALM, CLTH, CEBPA, CEBP, CHIC2, BTL, FLT3, KIT, PBT, LPP, NPM1, NUP214, D9S46E, CAN, CAIN, RUNX1, CBFA2, AML1, WHSC1L1, NSD3, FLT3, AF1Q, NPM1, NUMA1, ZNF145, PLZF, PML, MYL, STAT5B, AF10, CALM, CLTH, ARL11, ARLTS1, P2RX7, P2X7, BCR, CML, PHL, ALL, GRAF, NF1, VRNF, WSS, NFNS, PTPN11, PTP2C, SHP2, NS1, BCL2, CCND1, PRAD1, BCL1, TCRA, GATA1, GF1, ERYF1, NFE1, ABL1, NQO1, DIA4, NMOR1, NUP214, D9S46E, CAN, CAIN).
Связанные с воспалением и иммунной системой заболевания и нарушения AIDS (KIR3DL1, NKAT3, NKB1, AMB11, KIR3DS1, IFNG, CXCL12, SDF1); аутоиммунный лимфопролиферативный синдром (TNFRSF6, APT1, FAS, CD95, ALPS1A); комбинированный иммунодефицит (IL2RG, SCIDX1, SCIDX, IMD4); HIV-1 (CCL5, SCYA5, D17S136E, TCP228), восприимчивость к HIV или HIV-инфекция (IL10, CSIF, CMKBR2, CCR2, CMKBR5, CCCKR5 (CCR5)); типы иммунодефицита (CD3E, CD3G, AICDA, AID, HIGM2, TNFRSF5, CD40, UNG, DGU, HIGM4, TNFSF5, CD40LG, HIGM1, IGM, FOXP3, IPEX, AIID, XPID, PIDX, TNFRSF14B, TACI); воспаление (IL-10, IL-1 (IL-1a, IL-1b), IL-13, IL-17 (IL-17a (CTLA8), IL-17b, IL-17c, IL-17d, IL-17f), II-23, Cx3cr1, ptpn22, TNFa, NOD2/CARD15 для IBD, IL-6, IL-12 (IL-12a, IL-12b), CTLA4, Cx3cl1); типы тяжелого комбинированного иммунодефицита (SCID) (JAK3, JAKL, DCLRE1C, ARTEMIS, SCIDA, RAG1, RAG2, ADA, PTPRC, CD45, LCA, IL7R, CD3D, T3D, IL2RG, SCIDX1, SCIDX, IMD4).
Метаболические, печеночные, почечные и связанные с обменом белка заболевания и нарушения Амилоидная невропатия (TTR, PALB); амилоидоз (APOA1, APP, AAA, CVAP, AD1, GSN, FGA, LYZ, TTR, PALB); цирроз (KRT18, KRT8, CIRH1A, NAIC, TEX292, KIAA1988); муковисцидоз (CFTR, ABCC7, CF, MRP7); болезни накопления гликогена (SLC2A2, GLUT2, G6PC, G6PT, G6PT1, GAA, LAMP2, LAMPB, AGL, GDE, GBE1, GYS2, PYGL, PFKM); аденома печени, 142330 (TCF1, HNF1A, MODY3), печеночная недостаточность, с ранним началом и с неврологическим нарушением (SCOD1, SCO1), недостаточность печеночной липазы (LIPC), гепатобластома, рак и формы карциномы (CTNNB1, PDGFRL, PDGRL, PRLTS, AXIN1, AXIN, CTNNB1, TP53, P53, LFS1, IGF2R, MPRI, MET, CASP8, MCH5); заболевание по типу медуллярной кистозной нефропатии (UMOD, HNFJ, FJHN, MCKD2, ADMCKD2); фенилкетонурия (PAH, PKU1, QDPR, DHPR, PTS); поликистоз почек и печени (FCYT, PKHD1, ARPKD, PKD1, PKD2, PKD4, PKDTS, PRKCSH, G19P1, PCLD, SEC63).
Мышечные/костные заболевания и нарушения Миопатия Беккера (DMD, BMD, MYF6), миопатия Дюшенна (DMD, BMD); мышечная дистрофия Эмери-Дрейфуса (LMNA, LMN1, EMD2, FPLD, CMD1A, HGPS, LGMD1B, LMNA, LMN1, EMD2, FPLD, CMD1A); плече-лопаточно-лицевая миопатия (FSHMD1A, FSHD1A); мышечная дистрофия (FKRP, MDC1C, LGMD2I, LAMA2, LAMM, LARGE, KIAA0609, MDC1D, FCMD, TTID, MYOT, CAPN3, CANP3, DYSF, LGMD2B, SGCG, LGMD2C, DMDA1, SCG3, SGCA, ADL, DAG2, LGMD2D, DMDA2, SGCB, LGMD2E, SGCD, SGD, LGMD2F, CMD1L, TCAP, LGMD2G, CMD1N, TRIM32, HT2A, LGMD2H, FKRP, MDC1C, LGMD2I, TTN, CMD1G, TMD, LGMD2J, POMT1, CAV3, LGMD1C, SEPN1, SELN, RSMD1, PLEC1, PLTN, EBS1); остеопороз (LRP5, BMND1, LRP7, LR3, OPPG, VBCH2, CLCN7, CLC7, OPTA2, OSTM1, GL, TCIRG1, TIRC7, OC116, OPTB1); мышечная атрофия (VAPB, VAPC, ALS8, SMN1, SMA1, SMA2, SMA3, SMA4, BSCL2, SPG17, GARS, SMAD1, CMT2D, HEXB, IGHMBP2, SMUBP2, CATF1, SMARD1).
Неврологические и нейрональные заболевания и нарушения ALS (SOD1, ALS2, STEX, FUS, TARDBP, VEGF (VEGF-a, VEGF-b, VEGF-c); болезнь Альцгеймера (APP, AAA, CVAP, AD1, APOE, AD2, PSEN2, AD4, STM2, APBB2, FE65L1, NOS3, PLAU, URK, ACE, DCP1, ACE1, MPO, PACIP1, PAXIP1L, PTIP, A2M, BLMH, BMH, PSEN1, AD3); аутизм (Mecp2, BZRAP1, MDGA2, Sema5A, нейрексин 1, GLO1, MECP2, RTT, PPMX, MRX16, MRX79, NLGN3, NLGN4, KIAA1260, AUTSX2); синдром ломкой X-хромосомы (FMR2, FXR1, FXR2, mGLUR5); болезнь Гентингтона и подобные этому заболеванию нарушения (HD, IT15, PRNP, PRIP, JPH3, JP3, HDL2, TBP, SCA17); болезнь Паркинсона (NR4A2, NURR1, NOT, TINUR, SNCAIP, TBP, SCA17, SNCA, NACP, PARK1, PARK4, DJ1, PARK7, LRRK2, PARK8, PINK1, PARK6, UCHL1, PARK5, SNCA, NACP, PARK1, PARK4, PRKN, PARK2, PDJ, DBH, NDUFV2); синдром Ретта (MECP2, RTT, PPMX, MRX16, MRX79, CDKL5, STK9, MECP2, RTT, PPMX, MRX16, MRX79, x-синуклеин, DJ-1); шизофрения (нейрегулин 1 (Nrg1), Erb4 (рецептор для нейрегулина), комплексин 1 (Cplx1), Tph1, триптофангидроксилаза, Tph2, триптофангидроксилаза 2, нейрексин 1, GSK3, GSK3a, GSK3b, 5-HTT (Slc6a4), COMT, DRD (Drd1a), SLC6A3, DAOA, DTNBP1, Dao (Dao1)); связанные с активностью секретазы нарушения (APH-1 (альфа и бета), пресенилин (Psen1), никастрин, (Ncstn), PEN-2, Nos1, Parp1, Nat1, Nat2); связанные с тринуклеотидным повтором нарушения (HTT (болезнь Гентингтона), SBMA/SMAX1/AR (болезнь Кеннеди), FXN/X25 (атаксия Фридрейха), ATX3 (болезнь Мачадо-Джозефа), ATXN1 и ATXN2 (формы спинально-церебеллярной атаксии), DMPK (миотоническая дистрофия), атрофин-1 и Atn1 (заболевание по типу DRPLA), CBP (Creb-BP - общая нестабильность), VLDLR (болезнь Альцгеймера), Atxn7, Atxn10).
Заболевания и нарушения глаз возрастная дегенерация желтого пятна (Abcr, Ccl2, Cc2, cp (церулоплазмин), Timp3, катепсин D, Vldlr, Ccr2); катаракта (CRYAA, CRYA1, CRYBB2, CRYB2, PITX3, BFSP2, CP49, CP47, CRYAA, CRYA1, PAX6, AN2, MGDA, CRYBA1, CRYB1, CRYGC, CRYG3, CCL, LIM2, MP19, CRYGD, CRYG4, BFSP2, CP49, CP47, HSF4, CTM, HSF4, CTM, MIP, AQP0, CRYAB, CRYA2, CTPP2, CRYBB1, CRYGD, CRYG4, CRYBB2, CRYB2, CRYGC, CRYG3, CCL, CRYAA, CRYA1, GJA8, CX50, CAE1, GJA3, CX46, CZP3, CAE3, CCM1, CAM, KRIT1); помутнение и дистрофия роговицы (APOA1, TGFBI, CSD2, CDGG1, CSD, BIGH3, CDG2, TACSTD2, TROP2, M1S1, VSX1, RINX, PPCD, PPD, KTCN, COL8A2, FECD, PPCD2, PIP5K3, CFD); врожденная плоская роговица (KERA, CNA2); глаукома (MYOC, TIGR, GLC1A, JOAG, GPOA, OPTN, GLC1E, FIP2, HYPL, NRP, CYP1B1, GLC3A, OPA1, NTG, NPG, CYP1B1, GLC3A); амавроз Лебера (CRB1, RP12, CRX, CORD2, CRD, RPGRIP1, LCA6, CORD9, RPE65, RP20, AIPL1, LCA4, GUCY2D, GUC2D, LCA1, CORD6, RDH12, LCA3); макулярная дистрофия (ELOVL4, ADMD, STGD2, STGD3, RDS, RP7, PRPH2, PRPH, AVMD, AOFMD, VMD2).
Таблица C
КЛЕТОЧНАЯ ФУНКЦИЯ ГЕНЫ
Передача сигнала с участием PI3K/AKT PRKCE; ITGAM; ITGA5; IRAK1; PRKAA2; EIF2AK2;
PTEN; EIF4E; PRKCZ; GRK6; MAPK1; TSC1; PLK1;
AKT2; IKBKB; PIK3CA; CDK8; CDKN1B; NFKB2; BCL2;
PIK3CB; PPP2R1A; MAPK8; BCL2L1; MAPK3; TSC2;
ITGA1; KRAS; EIF4EBP1; RELA; PRKCD; NOS3;
PRKAA1; MAPK9; CDK2; PPP2CA; PIM1; ITGB7;
YWHAZ; ILK; TP53; RAF1; IKBKG; RELB; DYRK1A;
CDKN1A; ITGB1; MAP2K2; JAK1; AKT1; JAK2; PIK3R1;
CHUK; PDPK1; PPP2R5C; CTNNB1; MAP2K1; NFKB1;
PAK3; ITGB3; CCND1; GSK3A; FRAP1; SFN; ITGA2;
TTK; CSNK1A1; BRAF; GSK3B; AKT3; FOXO1; SGK;
HSP90AA1; RPS6KB1
Передача сигнала с участием ERK/MAPK PRKCE; ITGAM; ITGA5; HSPB1; IRAK1; PRKAA2;
EIF2AK2; RAC1; RAP1A; TLN1; EIF4E; ELK1; GRK6;
MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8; CREB1;
PRKCI; PTK2; FOS; RPS6KA4; PIK3CB; PPP2R1A;
PIK3C3; MAPK8; MAPK3; ITGA1; ETS1; KRAS; MYCN;
EIF4EBP1; PPARG; PRKCD; PRKAA1; MAPK9; SRC;
CDK2; PPP2CA; PIM1; PIK3C2A; ITGB7; YWHAZ;
PPP1CC; KSR1; PXN; RAF1; FYN; DYRK1A; ITGB1;
MAP2K2; PAK4; PIK3R1; STAT3; PPP2R5C; MAP2K1;
PAK3; ITGB3; ESR1; ITGA2; MYC; TTK; CSNK1A1;
CRKL; BRAF; ATF4; PRKCA; SRF; STAT1; SGK
Передача сигнала RAC1; TAF4B; EP300; SMAD2; TRAF6; PCAF; ELK1;
с участием глюкокортикоидного рецептора MAPK1; SMAD3; AKT2; IKBKB; NCOR2; UBE2I;
PIK3CA; CREB1; FOS; HSPA5; NFKB2; BCL2;
MAP3K14; STAT5B; PIK3CB; PIK3C3; MAPK8; BCL2L1;
MAPK3; TSC22D3; MAPK10; NRIP1; KRAS; MAPK13;
RELA; STAT5A; MAPK9; NOS2A; PBX1; NR3C1;
PIK3C2A; CDKN1C; TRAF2; SERPINE1; NCOA3;
MAPK14; TNF; RAF1; IKBKG; MAP3K7; CREBBP;
CDKN1A; MAP2K2; JAK1; IL8; NCOA2; AKT1; JAK2;
PIK3R1; CHUK; STAT3; MAP2K1; NFKB1; TGFBR1;
ESR1; SMAD4; CEBPB; JUN; AR; AKT3; CCL2; MMP1;
STAT1; IL6; HSP90AA1
Передача сигнала для аксонального наведения PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; ADAM12;
IGF1; RAC1; RAP1A; EIF4E; PRKCZ; NRP1; NTRK2;
ARHGEF7; SMO; ROCK2; MAPK1; PGF; RAC2;
PTPN11; GNAS; AKT2; PIK3CA; ERBB2; PRKCI; PTK2;
CFL1; GNAQ; PIK3CB; CXCL12; PIK3C3; WNT11;
PRKD1; GNB2L1; ABL1; MAPK3; ITGA1; KRAS; RHOA;
PRKCD; PIK3C2A; ITGB7; GLI2; PXN; VASP; RAF1;
FYN; ITGB1; MAP2K2; PAK4; ADAM17; AKT1; PIK3R1;
GLI1; WNT5A; ADAM10; MAP2K1; PAK3; ITGB3;
CDC42; VEGFA; ITGA2; EPHA8; CRKL; RND1; GSK3B;
AKT3; PRKCA
Передача сигнала с участием эфринового рецептора PRKCE; ITGAM; ROCK1; ITGA5; CXCR4; IRAK1;
PRKAA2; EIF2AK2; RAC1; RAP1A; GRK6; ROCK2;
MAPK1; PGF; RAC2; PTPN11; GNAS; PLK1; AKT2;
DOK1; CDK8; CREB1; PTK2; CFL1; GNAQ; MAP3K14;
CXCL12; MAPK8; GNB2L1; ABL1; MAPK3; ITGA1;
KRAS; RHOA; PRKCD; PRKAA1; MAPK9; SRC; CDK2;
PIM1; ITGB7; PXN; RAF1; FYN; DYRK1A; ITGB1;
MAP2K2; PAK4; AKT1; JAK2; STAT3; ADAM10;
MAP2K1; PAK3; ITGB3; CDC42; VEGFA; ITGA2;
EPHA8; TTK; CSNK1A1; CRKL; BRAF; PTPN13; ATF4;
AKT3; SGK
Передача сигнала ACTN4; PRKCE; ITGAM; ROCK1; ITGA5; IRAK1;
с участием актинового цитоскелета PRKAA2; EIF2AK2; RAC1; INS; ARHGEF7; GRK6;
ROCK2; MAPK1; RAC2; PLK1; AKT2; PIK3CA; CDK8;
PTK2; CFL1; PIK3CB; MYH9; DIAPH1; PIK3C3; MAPK8;
F2R; MAPK3; SLC9A1; ITGA1; KRAS; RHOA; PRKCD;
PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A; ITGB7;
PPP1CC; PXN; VIL2; RAF1; GSN; DYRK1A; ITGB1;
MAP2K2; PAK4; PIP5K1A; PIK3R1; MAP2K1; PAK3;
ITGB3; CDC42; APC; ITGA2; TTK; CSNK1A1; CRKL;
BRAF; VAV3; SGK
Передачи сигнала PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4; TGM2;
при болезни Гентингтона MAPK1; CAPNS1; AKT2; EGFR; NCOR2; SP1; CAPN2;
PIK3CA; HDAC5; CREB1; PRKCI; HSPA5; REST;
GNAQ; PIK3CB; PIK3C3; MAPK8; IGF1R; PRKD1;
GNB2L1; BCL2L1; CAPN1; MAPK3; CASP8; HDAC2;
HDAC7A; PRKCD; HDAC11; MAPK9; HDAC9; PIK3C2A;
HDAC3; TP53; CASP9; CREBBP; AKT1; PIK3R1;
PDPK1; CASP1; APAF1; FRAP1; CASP2; JUN; BAX;
ATF4; AKT3; PRKCA; CLTC; SGK; HDAC6; CASP3
Передача сигнала при апоптозе PRKCE; ROCK1; BID; IRAK1; PRKAA2; EIF2AK2; BAK1;
BIRC4; GRK6; MAPK1; CAPNS1; PLK1; AKT2; IKBKB;
CAPN2; CDK8; FAS; NFKB2; BCL2; MAP3K14; MAPK8;
BCL2L1; CAPN1; MAPK3; CASP8; KRAS; RELA;
PRKCD; PRKAA1; MAPK9; CDK2; PIM1; TP53; TNF;
RAF1; IKBKG; RELB; CASP9; DYRK1A; MAP2K2;
CHUK; APAF1; MAP2K1; NFKB1; PAK3; LMNA; CASP2;
BIRC2; TTK; CSNK1A1; BRAF; BAX; PRKCA; SGK;
CASP3; BIRC3; PARP1
Передача сигнала с участием B-клеточного рецептора RAC1; PTEN; LYN; ELK1; MAPK1; RAC2; PTPN11;
AKT2; IKBKB; PIK3CA; CREB1; SYK; NFKB2; CAMK2A;
MAP3K14; PIK3CB; PIK3C3; MAPK8; BCL2L1; ABL1;
MAPK3; ETS1; KRAS; MAPK13; RELA; PTPN6; MAPK9;
EGR1; PIK3C2A; BTK; MAPK14; RAF1; IKBKG; RELB;
MAP3K7; MAP2K2; AKT1; PIK3R1; CHUK; MAP2K1;
NFKB1; CDC42; GSK3A; FRAP1; BCL6; BCL10; JUN;
GSK3B; ATF4; AKT3; VAV3; RPS6KB1
Передача сигнала ACTN4; CD44; PRKCE; ITGAM; ROCK1; CXCR4; CYBA;
при диапедезе лейкоцитов RAC1; RAP1A; PRKCZ; ROCK2; RAC2; PTPN11;
MMP14; PIK3CA; PRKCI; PTK2; PIK3CB; CXCL12;
PIK3C3; MAPK8; PRKD1; ABL1; MAPK10; CYBB;
MAPK13; RHOA; PRKCD; MAPK9; SRC; PIK3C2A; BTK;
MAPK14; NOX1; PXN; VIL2; VASP; ITGB1; MAP2K2;
CTNND1; PIK3R1; CTNNB1; CLDN1; CDC42; F11R; ITK;
CRKL; VAV3; CTTN; PRKCA; MMP1; MMP9
Передача сигнала с участием интегрина ACTN4; ITGAM; ROCK1; ITGA5; RAC1; PTEN; RAP1A;
TLN1; ARHGEF7; MAPK1; RAC2; CAPNS1; AKT2;
CAPN2; PIK3CA; PTK2; PIK3CB; PIK3C3; MAPK8;
CAV1; CAPN1; ABL1; MAPK3; ITGA1; KRAS; RHOA;
SRC; PIK3C2A; ITGB7; PPP1CC; ILK; PXN; VASP;
RAF1; FYN; ITGB1; MAP2K2; PAK4; AKT1; PIK3R1;
TNK2; MAP2K1; PAK3; ITGB3; CDC42; RND3; ITGA2;
CRKL; BRAF; GSK3B; AKT3
Передача сигнала IRAK1; SOD2; MYD88; TRAF6; ELK1; MAPK1; PTPN11;
при острофазном ответе AKT2; IKBKB; PIK3CA; FOS; NFKB2; MAP3K14;
PIK3CB; MAPK8; RIPK1; MAPK3; IL6ST; KRAS;
MAPK13; IL6R; RELA; SOCS1; MAPK9; FTL; NR3C1;
TRAF2; SERPINE1; MAPK14; TNF; RAF1; PDK1;
IKBKG; RELB; MAP3K7; MAP2K2; AKT1; JAK2; PIK3R1;
CHUK; STAT3; MAP2K1; NFKB1; FRAP1; CEBPB; JUN;
AKT3; IL1R1; IL6
Передача сигнала с участием PTEN ITGAM; ITGA5; RAC1; PTEN; PRKCZ; BCL2L11;
MAPK1; RAC2; AKT2; EGFR; IKBKB; CBL; PIK3CA;
CDKN1B; PTK2; NFKB2; BCL2; PIK3CB; BCL2L1;
MAPK3; ITGA1; KRAS; ITGB7; ILK; PDGFRB; INSR;
RAF1; IKBKG; CASP9; CDKN1A; ITGB1; MAP2K2;
AKT1; PIK3R1; CHUK; PDGFRA; PDPK1; MAP2K1;
NFKB1; ITGB3; CDC42; CCND1; GSK3A; ITGA2;
GSK3B; AKT3; FOXO1; CASP3; RPS6KB1
Передача сигнала с участием p53 PTEN; EP300; BBC3; PCAF; FASN; BRCA1; GADD45A;
BIRC5; AKT2; PIK3CA; CHEK1; TP53INP1; BCL2;
PIK3CB; PIK3C3; MAPK8; THBS1; ATR; BCL2L1; E2F1;
PMAIP1; CHEK2; TNFRSF10B; TP73; RB1; HDAC9;
CDK2; PIK3C2A; MAPK14; TP53; LRDD; CDKN1A;
HIPK2; AKT1; PIK3R1; RRM2B; APAF1; CTNNB1;
SIRT1; CCND1; PRKDC; ATM; SFN; CDKN2A; JUN;
SNAI2; GSK3B; BAX; AKT3
Передача сигнала HSPB1; EP300; FASN; TGM2; RXRA; MAPK1; NQO1;
с участием арил-гидрокарбонового рецептора NCOR2; SP1; ARNT; CDKN1B; FOS; CHEK1;
SMARCA4; NFKB2; MAPK8; ALDH1A1; ATR; E2F1;
MAPK3; NRIP1; CHEK2; RELA; TP73; GSTP1; RB1;
SRC; CDK2; AHR; NFE2L2; NCOA3; TP53; TNF;
CDKN1A; NCOA2; APAF1; NFKB1; CCND1; ATM; ESR1;
CDKN2A; MYC; JUN; ESR2; BAX; IL6; CYP1B1;
HSP90AA1
Передача сигнала PRKCE; EP300; PRKCZ; RXRA; MAPK1; NQO1;
при метаболизме ксенобиотиков NCOR2; PIK3CA; ARNT; PRKCI; NFKB2; CAMK2A;
PIK3CB; PPP2R1A; PIK3C3; MAPK8; PRKD1;
ALDH1A1; MAPK3; NRIP1; KRAS; MAPK13; PRKCD;
GSTP1; MAPK9; NOS2A; ABCB1; AHR; PPP2CA; FTL;
NFE2L2; PIK3C2A; PPARGC1A; MAPK14; TNF; RAF1;
CREBBP; MAP2K2; PIK3R1; PPP2R5C; MAP2K1;
NFKB1; KEAP1; PRKCA; EIF2AK3; IL6; CYP1B1;
HSP90AA1
Передача сигнала с участием SAPK/JNK PRKCE; IRAK1; PRKAA2; EIF2AK2; RAC1; ELK1;
GRK6; MAPK1; GADD45A; RAC2; PLK1; AKT2; PIK3CA;
FADD; CDK8; PIK3CB; PIK3C3; MAPK8; RIPK1;
GNB2L1; IRS1; MAPK3; MAPK10; DAXX; KRAS;
PRKCD; PRKAA1; MAPK9; CDK2; PIM1; PIK3C2A;
TRAF2; TP53; LCK; MAP3K7; DYRK1A; MAP2K2;
PIK3R1; MAP2K1; PAK3; CDC42; JUN; TTK; CSNK1A1;
CRKL; BRAF; SGK
Передача сигнала с участием PPAr/RXR PRKAA2; EP300; INS; SMAD2; TRAF6; PPARA; FASN;
RXRA; MAPK1; SMAD3; GNAS; IKBKB; NCOR2;
ABCA1; GNAQ; NFKB2; MAP3K14; STAT5B; MAPK8;
IRS1; MAPK3; KRAS; RELA; PRKAA1; PPARGC1A;
NCOA3; MAPK14; INSR; RAF1; IKBKG; RELB; MAP3K7;
CREBBP; MAP2K2; JAK2; CHUK; MAP2K1; NFKB1;
TGFBR1; SMAD4; JUN; IL1R1; PRKCA; IL6; HSP90AA1;
ADIPOQ
Передача сигнала с участием NF-KB IRAK1; EIF2AK2; EP300; INS; MYD88; PRKCZ; TRAF6;
TBK1; AKT2; EGFR; IKBKB; PIK3CA; BTRC; NFKB2;
MAP3K14; PIK3CB; PIK3C3; MAPK8; RIPK1; HDAC2;
KRAS; RELA; PIK3C2A; TRAF2; TLR4; PDGFRB; TNF;
INSR; LCK; IKBKG; RELB; MAP3K7; CREBBP; AKT1;
PIK3R1; CHUK; PDGFRA; NFKB1; TLR2; BCL10;
GSK3B; AKT3; TNFAIP3; IL1R1
Передача сигнала с участием нейрегулина ERBB4; PRKCE; ITGAM; ITGA5; PTEN; PRKCZ; ELK1;
MAPK1; PTPN11; AKT2; EGFR; ERBB2; PRKCI;
CDKN1B; STAT5B; PRKD1; MAPK3; ITGA1; KRAS;
PRKCD; STAT5A; SRC; ITGB7; RAF1; ITGB1; MAP2K2;
ADAM17; AKT1; PIK3R1; PDPK1; MAP2K1; ITGB3;
EREG; FRAP1; PSEN1; ITGA2; MYC; NRG1; CRKL;
AKT3; PRKCA; HSP90AA1; RPS6KB1
Передача сигнала CD44; EP300; LRP6; DVL3; CSNK1E; GJA1; SMO;
с участием Wnt и бета-катенина AKT2; PIN1; CDH1; BTRC; GNAQ; MARK2; PPP2R1A;
WNT11; SRC; DKK1; PPP2CA; SOX6; SFRP2; ILK;
LEF1; SOX9; TP53; MAP3K7; CREBBP; TCF7L2; AKT1;
PPP2R5C; WNT5A; LRP5; CTNNB1; TGFBR1; CCND1;
GSK3A; DVL1; APC; CDKN2A; MYC; CSNK1A1; GSK3B;
AKT3; SOX2
Передача сигнала с участием инсулинового рецептора PTEN; INS; EIF4E; PTPN1; PRKCZ; MAPK1; TSC1;
PTPN11; AKT2; CBL; PIK3CA; PRKCI; PIK3CB; PIK3C3;
MAPK8; IRS1; MAPK3; TSC2; KRAS; EIF4EBP1;
SLC2A4; PIK3C2A; PPP1CC; INSR; RAF1; FYN;
MAP2K2; JAK1; AKT1; JAK2; PIK3R1; PDPK1; MAP2K1;
GSK3A; FRAP1; CRKL; GSK3B; AKT3; FOXO1; SGK;
RPS6KB1
Передача сигнала с участием IL-6 HSPB1; TRAF6; MAPKAPK2; ELK1; MAPK1; PTPN11;
IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK3;
MAPK10; IL6ST; KRAS; MAPK13; IL6R; RELA; SOCS1;
MAPK9; ABCB1; TRAF2; MAPK14; TNF; RAF1; IKBKG;
RELB; MAP3K7; MAP2K2; IL8; JAK2; CHUK; STAT3;
MAP2K1; NFKB1; CEBPB; JUN; IL1R1; SRF; IL6
Печеночный холестаз PRKCE; IRAK1; INS; MYD88; PRKCZ; TRAF6; PPARA;
RXRA; IKBKB; PRKCI; NFKB2; MAP3K14; MAPK8;
PRKD1; MAPK10; RELA; PRKCD; MAPK9; ABCB1;
TRAF2; TLR4; TNF; INSR; IKBKG; RELB; MAP3K7; IL8;
CHUK; NR1H2; TJP2; NFKB1; ESR1; SREBF1; FGFR4;
JUN; IL1R1; PRKCA; IL6
Передача сигнала с участием IGF-1 IGF1; PRKCZ; ELK1; MAPK1; PTPN11; NEDD4; AKT2;
PIK3CA; PRKCI; PTK2; FOS; PIK3CB; PIK3C3; MAPK8;
IGF1R; IRS1; MAPK3; IGFBP7; KRAS; PIK3C2A;
YWHAZ; PXN; RAF1; CASP9; MAP2K2; AKT1; PIK3R1;
PDPK1; MAP2K1; IGFBP2; SFN; JUN; CYR61; AKT3;
FOXO1; SRF; CTGF; RPS6KB1
NRF2-опосредованный ответ на PRKCE; EP300; SOD2; PRKCZ; MAPK1; SQSTM1;
окислительный стресс NQO1; PIK3CA; PRKCI; FOS; PIK3CB; PIK3C3; MAPK8;
PRKD1; MAPK3; KRAS; PRKCD; GSTP1; MAPK9; FTL;
NFE2L2; PIK3C2A; MAPK14; RAF1; MAP3K7; CREBBP;
MAP2K2; AKT1; PIK3R1; MAP2K1; PPIB; JUN; KEAP1;
GSK3B; ATF4; PRKCA; EIF2AK3; HSP90AA1
Фиброз печени/активация EDN1; IGF1; KDR; FLT1; SMAD2; FGFR1; MET; PGF;
звездчатых клеток печени SMAD3; EGFR; FAS; CSF1; NFKB2; BCL2; MYH9;
IGF1R; IL6R; RELA; TLR4; PDGFRB; TNF; RELB; IL8;
PDGFRA; NFKB1; TGFBR1; SMAD4; VEGFA; BAX;
IL1R1; CCL2; HGF; MMP1; STAT1; IL6; CTGF; MMP9
Передача сигнала с участием PPAR EP300; INS; TRAF6; PPARA; RXRA; MAPK1; IKBKB;
NCOR2; FOS; NFKB2; MAP3K14; STAT5B; MAPK3;
NRIP1; KRAS; PPARG; RELA; STAT5A; TRAF2;
PPARGC1A; PDGFRB; TNF; INSR; RAF1; IKBKG;
RELB; MAP3K7; CREBBP; MAP2K2; CHUK; PDGFRA;
MAP2K1; NFKB1; JUN; IL1R1; HSP90AA1
Передача сигнала с участием Fc-эпсилон-RI PRKCE; RAC1; PRKCZ; LYN; MAPK1; RAC2; PTPN11;
AKT2; PIK3CA; SYK; PRKCI; PIK3CB; PIK3C3; MAPK8;
PRKD1; MAPK3; MAPK10; KRAS; MAPK13; PRKCD;
MAPK9; PIK3C2A; BTK; MAPK14; TNF; RAF1; FYN;
MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1; AKT3;
VAV3; PRKCA
Передача сигнала с участием рецептора, PRKCE; RAP1A; RGS16; MAPK1; GNAS; AKT2; IKBKB;
сопряженных с G-белком PIK3CA; CREB1; GNAQ; NFKB2; CAMK2A; PIK3CB;
PIK3C3; MAPK3; KRAS; RELA; SRC; PIK3C2A; RAF1;
IKBKG; RELB; FYN; MAP2K2; AKT1; PIK3R1; CHUK;
PDPK1; STAT3; MAP2K1; NFKB1; BRAF; ATF4; AKT3;
PRKCA
Метаболизм PRKCE; IRAK1; PRKAA2; EIF2AK2; PTEN; GRK6;
инозитолфосфата MAPK1; PLK1; AKT2; PIK3CA; CDK8; PIK3CB; PIK3C3;
MAPK8; MAPK3; PRKCD; PRKAA1; MAPK9; CDK2;
PIM1; PIK3C2A; DYRK1A; MAP2K2; PIP5K1A; PIK3R1;
MAP2K1; PAK3; ATM; TTK; CSNK1A1; BRAF; SGK
Передача сигнала с участием PDGF EIF2AK2; ELK1; ABL2; MAPK1; PIK3CA; FOS; PIK3CB;
PIK3C3; MAPK8; CAV1; ABL1; MAPK3; KRAS; SRC;
PIK3C2A; PDGFRB; RAF1; MAP2K2; JAK1; JAK2;
PIK3R1; PDGFRA; STAT3; SPHK1; MAP2K1; MYC;
JUN; CRKL; PRKCA; SRF; STAT1; SPHK2
Передача сигнала с участием VEGF ACTN4; ROCK1; KDR; FLT1; ROCK2; MAPK1; PGF;
AKT2; PIK3CA; ARNT; PTK2; BCL2; PIK3CB; PIK3C3;
BCL2L1; MAPK3; KRAS; HIF1A; NOS3; PIK3C2A; PXN;
RAF1; MAP2K2; ELAVL1; AKT1; PIK3R1; MAP2K1; SFN;
VEGFA; AKT3; FOXO1; PRKCA
Передача сигнала с участием клеток натуральных киллеров PRKCE; RAC1; PRKCZ; MAPK1; RAC2; PTPN11;
KIR2DL3; AKT2; PIK3CA; SYK; PRKCI; PIK3CB;
PIK3C3; PRKD1; MAPK3; KRAS; PRKCD; PTPN6;
PIK3C2A; LCK; RAF1; FYN; MAP2K2; PAK4; AKT1;
PIK3R1; MAP2K1; PAK3; AKT3; VAV3; PRKCA
Регуляция в контрольной точке клеточного цикла: HDAC4; SMAD3; SUV39H1; HDAC5; CDKN1B; BTRC;
G1/S ATR; ABL1; E2F1; HDAC2; HDAC7A; RB1; HDAC11;
HDAC9; CDK2; E2F2; HDAC3; TP53; CDKN1A; CCND1;
E2F4; ATM; RBL2; SMAD4; CDKN2A; MYC; NRG1;
GSK3B; RBL1; HDAC6
Передача сигнала с участием T-клеточного рецептора RAC1; ELK1; MAPK1; IKBKB; CBL; PIK3CA; FOS;
NFKB2; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS;
RELA; PIK3C2A; BTK; LCK; RAF1; IKBKG; RELB; FYN;
MAP2K2; PIK3R1; CHUK; MAP2K1; NFKB1; ITK; BCL10;
JUN; VAV3
Передача сигнала с участием рецептора смерти CRADD; HSPB1; BID; BIRC4; TBK1; IKBKB; FADD;
FAS; NFKB2; BCL2; MAP3K14; MAPK8; RIPK1; CASP8;
DAXX; TNFRSF10B; RELA; TRAF2; TNF; IKBKG; RELB;
CASP9; CHUK; APAF1; NFKB1; CASP2; BIRC2; CASP3;
BIRC3
Передача сигнала с участием FGF RAC1; FGFR1; MET; MAPKAPK2; MAPK1; PTPN11;
AKT2; PIK3CA; CREB1; PIK3CB; PIK3C3; MAPK8;
MAPK3; MAPK13; PTPN6; PIK3C2A; MAPK14; RAF1;
AKT1; PIK3R1; STAT3; MAP2K1; FGFR4; CRKL; ATF4;
AKT3; PRKCA; HGF
Передача сигнала с участием GM-CSF LYN; ELK1; MAPK1; PTPN11; AKT2; PIK3CA; CAMK2A;
STAT5B; PIK3CB; PIK3C3; GNB2L1; BCL2L1; MAPK3;
ETS1; KRAS; RUNX1; PIM1; PIK3C2A; RAF1; MAP2K2;
AKT1; JAK2; PIK3R1; STAT3; MAP2K1; CCND1; AKT3;
STAT1
Передача сигнала BID; IGF1; RAC1; BIRC4; PGF; CAPNS1; CAPN2;
при амиотрофическом латеральном
склерозе
PIK3CA; BCL2; PIK3CB; PIK3C3; BCL2L1; CAPN1;
PIK3C2A; TP53; CASP9; PIK3R1; RAB5A; CASP1;
APAF1; VEGFA; BIRC2; BAX; AKT3; CASP3; BIRC3
Передача сигнала с участием JAK/Stat PTPN1; MAPK1; PTPN11; AKT2; PIK3CA; STAT5B;
PIK3CB; PIK3C3; MAPK3; KRAS; SOCS1; STAT5A;
PTPN6; PIK3C2A; RAF1; CDKN1A; MAP2K2; JAK1;
AKT1; JAK2; PIK3R1; STAT3; MAP2K1; FRAP1; AKT3;
STAT1
Метаболизм PRKCE; IRAK1; PRKAA2; EIF2AK2; GRK6; MAPK1;
никотинола и никотинамида PLK1; AKT2; CDK8; MAPK8; MAPK3; PRKCD; PRKAA1;
PBEF1; MAPK9; CDK2; PIM1; DYRK1A; MAP2K2;
MAP2K1; PAK3; NT5E; TTK; CSNK1A1; BRAF; SGK
Передача сигнала с участием хемокина CXCR4; ROCK2; MAPK1; PTK2; FOS; CFL1; GNAQ;
CAMK2A; CXCL12; MAPK8; MAPK3; KRAS; MAPK13;
RHOA; CCR3; SRC; PPP1CC; MAPK14; NOX1; RAF1;
MAP2K2; MAP2K1; JUN; CCL2; PRKCA
Передача сигнала с участием IL-2 ELK1; MAPK1; PTPN11; AKT2; PIK3CA; SYK; FOS;
STAT5B; PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS;
SOCS1; STAT5A; PIK3C2A; LCK; RAF1; MAP2K2;
JAK1; AKT1; PIK3R1; MAP2K1; JUN; AKT3
Долговременное синаптическое PRKCE; IGF1; PRKCZ; PRDX6; LYN; MAPK1; GNAS;
подавление PRKCI; GNAQ; PPP2R1A; IGF1R; PRKD1; MAPK3;
KRAS; GRN; PRKCD; NOS3; NOS2A; PPP2CA;
YWHAZ; RAF1; MAP2K2; PPP2R5C; MAP2K1; PRKCA
Передача сигнала TAF4B; EP300; CARM1; PCAF; MAPK1; NCOR2;
с участием эстрогенового рецептора SMARCA4; MAPK3; NRIP1; KRAS; SRC; NR3C1;
HDAC3; PPARGC1A; RBM9; NCOA3; RAF1; CREBBP;
MAP2K2; NCOA2; MAP2K1; PRKDC; ESR1; ESR2
Путь TRAF6; SMURF1; BIRC4; BRCA1; UCHL1; NEDD4;
убиквитинирования белков CBL; UBE2I; BTRC; HSPA5; USP7; USP10; FBXW7;
USP9X; STUB1; USP22; B2M; BIRC2; PARK2; USP8;
USP1; VHL; HSP90AA1; BIRC3
Передача сигнала с участием IL-10 TRAF6; CCR1; ELK1; IKBKB; SP1; FOS; NFKB2;
MAP3K14; MAPK8; MAPK13; RELA; MAPK14; TNF;
IKBKG; RELB; MAP3K7; JAK1; CHUK; STAT3; NFKB1;
JUN; IL1R1; IL6
Активация VDR/RXR PRKCE; EP300; PRKCZ; RXRA; GADD45A; HES1;
NCOR2; SP1; PRKCI; CDKN1B; PRKD1; PRKCD;
RUNX2; KLF4; YY1; NCOA3; CDKN1A; NCOA2; SPP1;
LRP5; CEBPB; FOXO1; PRKCA
Передача сигнала с участием TGF-бета EP300; SMAD2; SMURF1; MAPK1; SMAD3; SMAD1;
FOS; MAPK8; MAPK3; KRAS; MAPK9; RUNX2;
SERPINE1; RAF1; MAP3K7; CREBBP; MAP2K2;
MAP2K1; TGFBR1; SMAD4; JUN; SMAD5
Передача сигнала с участием Toll-подобного рецептора IRAK1; EIF2AK2; MYD88; TRAF6; PPARA; ELK1;
IKBKB; FOS; NFKB2; MAP3K14; MAPK8; MAPK13;
RELA; TLR4; MAPK14; IKBKG; RELB; MAP3K7; CHUK;
NFKB1; TLR2; JUN
Передача сигнала с участием p38 MAPK HSPB1; IRAK1; TRAF6; MAPKAPK2; ELK1; FADD; FAS;
CREB1; DDIT3; RPS6KA4; DAXX; MAPK13; TRAF2;
MAPK14; TNF; MAP3K7; TGFBR1; MYC; ATF4; IL1R1;
SRF; STAT1
Передача сигнала с участием нейротрофинов/TRK NTRK2; MAPK1; PTPN11; PIK3CA; CREB1; FOS;
PIK3CB; PIK3C3; MAPK8; MAPK3; KRAS; PIK3C2A;
RAF1; MAP2K2; AKT1; PIK3R1; PDPK1; MAP2K1;
CDC42; JUN; ATF4
Активация FXR/RXR INS; PPARA; FASN; RXRA; AKT2; SDC1; MAPK8;
APOB; MAPK10; PPARG; MTTP; MAPK9; PPARGC1A;
TNF; CREBBP; AKT1; SREBF1; FGFR4; AKT3; FOXO1
Долговременное синаптическое PRKCE; RAP1A; EP300; PRKCZ; MAPK1; CREB1;
потенцирование PRKCI; GNAQ; CAMK2A; PRKD1; MAPK3; KRAS;
PRKCD; PPP1CC; RAF1; CREBBP; MAP2K2; MAP2K1;
ATF4; PRKCA
Передача сигнала с участием кальция RAP1A; EP300; HDAC4; MAPK1; HDAC5; CREB1;
CAMK2A; MYH9; MAPK3; HDAC2; HDAC7A; HDAC11;
HDAC9; HDAC3; CREBBP; CALR; CAMKK2; ATF4;
HDAC6
Передача сигнала с участием EGF ELK1; MAPK1; EGFR; PIK3CA; FOS; PIK3CB; PIK3C3;
MAPK8; MAPK3; PIK3C2A; RAF1; JAK1; PIK3R1;
STAT3; MAP2K1; JUN; PRKCA; SRF; STAT1
Передача сигнала при гипоксии в EDN1; PTEN; EP300; NQO1; UBE2I; CREB1; ARNT;
сердечно-сосудистой системе HIF1A; SLC2A4; NOS3; TP53; LDHA; AKT1; ATM;
VEGFA; JUN; ATF4; VHL; HSP90AA1
LPS/IL-1 опосредованное ингибирование IRAK1; MYD88; TRAF6; PPARA; RXRA; ABCA1;
функции RXR MAPK8; ALDH1A1; GSTP1; MAPK9; ABCB1; TRAF2;
TLR4; TNF; MAP3K7; NR1H2; SREBF1; JUN; IL1R1
Активация LXR/RXR FASN; RXRA; NCOR2; ABCA1; NFKB2; IRF3; RELA;
NOS2A; TLR4; TNF; RELB; LDLR; NR1H2; NFKB1;
SREBF1; IL1R1; CCL2; IL6; MMP9
Процессинг амилоида PRKCE; CSNK1E; MAPK1; CAPNS1; AKT2; CAPN2;
CAPN1; MAPK3; MAPK13; MAPT; MAPK14; AKT1;
PSEN1; CSNK1A1; GSK3B; AKT3; APP
Передача сигнала с участием IL-4 AKT2; PIK3CA; PIK3CB; PIK3C3; IRS1; KRAS; SOCS1;
PTPN6; NR3C1; PIK3C2A; JAK1; AKT1; JAK2; PIK3R1;
FRAP1; AKT3; RPS6KB1
Регуляция при повреждении ДНК EP300; PCAF; BRCA1; GADD45A; PLK1; BTRC;
в контрольной точке клеточного цикла: CHEK1; ATR; CHEK2; YWHAZ; TP53; CDKN1A;
G2/M PRKDC; ATM; SFN; CDKN2A
Передача сигнала с участием оксида азота в KDR; FLT1; PGF; AKT2; PIK3CA; PIK3CB; PIK3C3;
сердечно-сосудистой системе CAV1; PRKCD; NOS3; PIK3C2A; AKT1; PIK3R1;
VEGFA; AKT3; HSP90AA1
Метаболизм пуринов NME2; SMARCA4; MYH9; RRM2; ADAR; EIF2AK4;
PKM2; ENTPD1; RAD51; RRM2B; TJP2; RAD51C;
NT5E; POLD1; NME1
cAMP-опосредованная передача сигнала RAP1A; MAPK1; GNAS; CREB1; CAMK2A; MAPK3;
SRC; RAF1; MAP2K2; STAT3; MAP2K1; BRAF; ATF4
Митохондриальная дисфункция SOD2; MAPK8; CASP8; MAPK10; MAPK9; CASP9;
PARK7; PSEN1; PARK2; APP; CASP3
Передача сигнала с участием Notch HES1; JAG1; NUMB; NOTCH4; ADAM17; NOTCH2;
PSEN1; NOTCH3; NOTCH1; DLL4
Путь при стрессе, связанном с HSPA5; MAPK8; XBP1; TRAF2; ATF6; CASP9; ATF4;
эндоплазматическим ретикулумом EIF2AK3; CASP3
Метаболизм пиримидинов NME2; AICDA; RRM2; EIF2AK4; ENTPD1; RRM2B;
NT5E; POLD1; NME1
Передача сигнала при болезни Паркинсона UCHL1; MAPK8; MAPK13; MAPK14; CASP9; PARK7;
PARK2; CASP3
Передача сигнала GNAS; GNAQ; PPP2R1A; GNB2L1; PPP2CA; PPP1CC;
в клетках сердечной мышцы и с участием бета-адренергических рецепторов PPP2R5C
Гликолиз/гликонеогенез HK2; GCK; GPI; ALDH1A1; PKM2; LDHA; HK1
Передача сигнала с участием интерферона IRF1; SOCS1; JAK1; JAK2; IFITM1; STAT1; IFIT3
Передача сигнала с участием Sonic Hedgehog ARRB2; SMO; GLI2; DYRK1A; GLI1; GSK3B; DYRK1B
Метаболизм PLD1; GRN; GPAM; YWHAZ; SPHK1; SPHK2
глицерофосфолипидов
Разрушение фосфолипидов PRDX6; PLD1; GRN; YWHAZ; SPHK1; SPHK2
Метаболизм триптофана SIAH2; PRMT5; NEDD4; ALDH1A1; CYP1B1; SIAH1
Разрушение лизина SUV39H1; EHMT2; NSD1; SETD7; PPP2R5C
Путь ERCC5; ERCC4; XPA; XPC; ERCC1
при эксцизионной репарации нуклеотидов
Метаболизм UCHL1; HK2; GCK; GPI; HK1
крахмала и сахарозы
Метаболизм аминосахаров NQO1; HK2; GCK; HK1
Метаболизм PRDX6; GRN; YWHAZ; CYP1B1
арахидоновой кислоты
Передача сигнала с вовлечением околосуточного ритма CSNK1E; CREB1; ATF4; NR1D1
Коагулирующая система BDKRB1; F2R; SERPINE1; F3
Передача сигнала PPP2R1A; PPP2CA; PPP1CC; PPP2R5C
с участием допаминового рецептора
Метаболизм глутатиона IDH2; GSTP1; ANPEP; IDH1
Метаболизм глицеролипидов ALDH1A1; GPAM; SPHK1; SPHK2
Метаболизм линолевой кислоты PRDX6; GRN; YWHAZ; CYP1B1
Метаболизм метионина DNMT1; DNMT3B; AHCY; DNMT3A
Метаболизм пирувата GLO1; ALDH1A1; PKM2; LDHA
Метаболизм ALDH1A1; NOS3; NOS2A
аскорбата и альдарата
Передача сигнала с участием эйкозаноидов PRDX6; GRN; YWHAZ
Метаболизм HK2; GCK; HK1
фруктозы и маннозы
Метаболизм галактозы HK2; GCK; HK1
Биосинтез стильбена, кумарина и PRDX6; PRDX1; TYR
лигнина
Путь CALR; B2M
при презентации антигена
Биосинтез стероидов NQO1; DHCR7
Метаболизм бутаноата ALDH1A1; NLGN1
Цикл цитрата IDH2; IDH1
Метаболизм жирных кислот ALDH1A1; CYP1B1
Метаболизм PRDX6; CHKA
глицерофосфолипидов
Метаболизм гистидина PRMT5; ALDH1A1
Метаболизм инозитола ERO1L; APEX1
Метаболизм ксенобиотиков GSTP1; CYP1B1
Метаболизм метана
с участием цитохрома p450 PRDX6; PRDX1
Метаболизм фенилаланина PRDX6; PRDX1
Метаболизм пропаноата ALDH1A1; LDHA
Метаболизм PRMT5; AHCY
селеноаминокислоты
Метаболизм сфинголипидов SPHK1; SPHK2
Метаболизм PRMT5
аминофосфоната
Метаболизм PRMT5
андрогена и эстрогена
Метаболизм ALDH1A1
аскорбата и альдарата
Биосинтез желчных кислот ALDH1A1
Метаболизм цистеина LDHA
Биосинтез жирных кислот FASN
с участием глутаматного рецептора GNB2L1
Передача сигнала
NRF2-опосредованный ответ на PRDX1
окислительный стресс
Пентозофосфатный GPI
путь
Взаимное превращение UCHL1
Взаимное превращение
Метаболизм ретинола ALDH1A1
Метаболизм рибофлавина TYR
Метаболизм тирозина PRMT5, TYR
Биосинтез убихинона PRMT5
Разрушение валина, лейцина и ALDH1A1
изолейцина
Метаболизм глицина, серина и CHKA
треонина
Разрушение лизина ALDH1A1
Боль/вкус TRPM5; TRPA1
Боль TRPM7; TRPC5; TRPC6; TRPC1; Cnr1; cnr2; Grk2;
Trpa1; Pomc; Cgrp; Crf; Pka; Era; Nr2b; TRPM5; Prkaca;
Prkacb; Prkar1a; Prkar2a
Митохондриальная функция AIF; CytC; SMAC (Diablo); Aifm-1; Aifm-2
Неврология развития BMP-4; хордин (Chrd); ноггин (Nog); WNT (Wnt2;
Wnt2b; Wnt3a; Wnt4; Wnt5a; Wnt6; Wnt7b; Wnt8b;
Wnt9a; Wnt9b; Wnt10a; Wnt10b; Wnt16); бета-катенин;
Dkk-1; связанные с ожогом белки; Otx-2; Gbx2; FGF-8;
Reelin; Dab1; unc-86 (Pou4f1 или Brn3a); Numb; Reln

Перечень иллюстративных целевых генов, целевых локусов, целевых полинуклеотидов

В качестве примера хромосомная последовательность может включать без ограничения IL1B (интерлейкин 1, бета), XDH (ксантиндегидрогеназу), TP53 (опухолевый белок p53), PTGIS (простагландин 12 (простациклин) синтазу), MB (миоглобин), IL4 (интерлейкин 4), ANGPT1 (ангиопоэтин 1), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8), CTSK (катепсин K), PTGIR (рецептор простангландина 12 (простациклина) (IP)), KCNJ11 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 11), INS (инсулин), CRP (C-реактивный белок, связанный с пентраксином), PDGFRB (тромбоцитарный фактор роста, бета-полипептид), CCNA2 (циклин A2), PDGFB (гомолог онкогена бета-полипептида тромбоцитарного фактора роста (вируса сарпкомы обезьян (v-sis))), KCNJ5 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 5), KCNN3 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 3), CAPN10 (кальпаин 10), PTGES (простагландин E синтаза), ADRA2B (альфа-2B-адренергический рецептор), ABCG5 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 5), PRDX2 (пероксиредоксин 2), CAPN5 (кальпаин 5), PARP14 (семейство поли (АДФ-рибозо) полимераз, представитель 14), MEX3C (гомолог C mex-3 (C. elegans)), ACE ангиотензин I-конвертирующий фермент (пептидил-дипептидазу A) 1), TNF (фактор некроза опухоли (суперсемейство TNF, представитель 2)), IL6 (интерлейкин 6 (интерферон, бета 2)), STN (статин), SERPINE1 (ингибитор серпинпептидазы, клада E (нексин, ингибитор активатора плазминогена 1 типа), представитель 1), ALB (альбумин), ADIPOQ (адипонектин, содержащий C1Q и коллагеновый домен), APOB (аполипопротеин B (в том числе антиген Ag(x))), APOE (аполипопротеин E), LEP (лептин), MTHFR (5,10-метилентетрагидрофолатредуктаза (NADPH)), APOA1 (аполипопротеин A-I), EDN1 (эндотелин 1), NPPB (предшественник натрийуретического пептида B), NOS3 (синтазу оксида азота 3 типа (эндотелиальная клетка)), PPARG (гамма-рецептор, активируемый пролифератором пероксисом), PLAT (активатор плазминогена, тканевой), PTGS2 (простагландин-эндопероксидсинтазу 2 типа (простагландин G/H синтазу и циклооксигеназу)), CETP (транспортный белок холестериновых эфиров, плазменный), AGTR1 (рецептор антиотензина II, 1 тип), HMGCR (3-гидрокси-3-метилглутарил-кофермент A редуктазу), IGF1 (инсулинподобный фактор роста 1 (соматомедин C)), SELE (селектин E), REN (ренин), PPARA (альфа-рецептор, активируемый пролифератором пероксисом), PON1 (параоксоназу 1), KNG1 (кининоген 1), CCL2 (хемокиновый лиганд 2 (с мотивом C-C)), LPL (липопротеинлипазу), VWF (фактор фон Виллебранда), F2 (фактор коагуляции II (тромбин)), ICAM1 (молекулу межклеточной адгезии 1), TGFB1 (трансформирующий фактор роста, бета 1), NPPA (предшественник натрийуретического пептида A), IL10 (интерлейкин 10), EPO (эритропоэтин), SOD1 (супероксиддисмутазу 1, растворимую), VCAM1 (молекулу адгезии эндотелия сосудов 1 типа), IFNG (интерферон, гамма), LPA (липопротеин, Lp(a)), MPO (миелопероксидазу), ESR1 (эстрогеновый рецептор 1), MAPK1 (митоген-активируемую протеинкиназу 1), HP (гаптоглобин), F3 (фактор коагуляции III (тромбопластин, тканевой фактор)), CST3 (цистатин C), COG2 (компонент олигомерного комплекса Гольджи 2 типа), MMP9 (матриксную металлопептидазу 9 (желатиназу B, желатиназу размером 92 кДа, коллагеназу IV типа размером 92 кДа)), SERPINC1 (ингибитор серпинпептидазы, клада C (антитромбин), представитель 1), F8 (фактор коагуляции VIII, прокоагулянтный компонент), HMOX1 (гемоксигеназу (дециклическую) 1 типа), APOC3 (аполипопротеин C-III), IL8 (интерлейкин 8), PROK1 (прокинетицин 1), CBS (цистатионин-бета-синтазу), NOS2 (синтазу оксида натрия 2 типа, индуцируемую), TLR4 (toll-подобный рецептор 4 типа), SELP (селектин P (гранульный мембранный белок размером 140 кДа, антиген CD62)), ABCA1 (АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1), AGT (ангиотензин (ингибитор серпинпептидазы, клада A, представитель 8)), LDLR (рецептор липопротеина низкой плотности), GPT (глутамат-пируваттрансаминазу (аланинаминотрансферазу)), VEGFA (фактор роста эндотелия сосудов A), NR3C2 (ядерный рецептор, подсемейство 3, группа C, представитель 2), IL18 (интерлейкин 18 (фактор индукции интерферона гамма)), NOS1 (синтазу оксида азота 1 типа (нейрональную)), NR3C1 (ядерный рецептор, подсемейство 3, группа C, представитель 1 (глюкокортикоидный рецептор)), FGB (бета-цепь фибриногена), HGF (фактор роста гепатоцитов (гепатопоэтин A; рассеивающий фактор)), IL1A (интерлейин 1, альфа), RETN (резистин), AKT1 (гомолог онкогена вируса тимомы мышей 1 типа v-akt), LIPC (липазу, печеночную), HSPD1 (белок теплового шока 1 типа размером 60 кДА (шаперонин)), MAPK14 (митоген-активируемую протеинкиназу 14), SPP1 (секретируемый фосфопротеин 1), ITGB3 (интегрин, бета 3 (тромбоцитарный гликопротеин 111a, антиген CD61)), CAT (каталазу), UTS2 (уротензин 2), THBD (тромбомодулин), F10 (фактор коагуляции X), CP (церулоплазмин (ферроксидазу)), TNFRSF11B (суперсемейство фактора некроза опухоли, представитель 11b), EDNRA (рецептор эндотелина типа A), EGFR (рецептор эпидермального фактора роста (гомолог онкогена вируса эритробластического лейкоза (v-erb-b), птичьего)), MMP2 (матриксную металлопептидазу 2 (желатиназу A, желатиназу с массой 72 кДа, коллагеназу IV типа размером 72 кДа)), PLG (плазминоген), NPY (нейропептид Y), RHOD (семейство генов гомологов ras, представитель D), MAPK8 (митоген-активируемую протеинкиназу 8), MYC (гомолог онкогена вируса миелоцистоматоза v-myc (птичьего)), FN1 (фибронектин 1), CMA1 (химазу 1, тучная клетка), PLAU (активатор плазминогена, урокиназу), GNB3 (гуанин-нуклеотид-связывающий белок (G-белок), бета-полипептид 3 типа), ADRB2 (адренергический бета-2-рецептор, поверхностный), APOA5 (аполипопротеин A-V), SOD2 (супероксиддисмутазу 2, митохондриальную), F5 (фактор коагуляции V (проакселерин, лабильный фактор)), VDR (рецептор витамина D (1,25-дигидроксивитамина D3), ALOX5 (арахидонат 5-липооксигеназу), HLA-DRB1 (главный комплекс гистосовместимости, класс II, DR бета 1), PARP1 (поли (АДФ-рибозо) полимеразу 1 типа), CD40LG (лиганд CD40), PON2 (параоксоназу 2), AGER (рецептор, специфичный к конечным продуктам дополнительного гликозилирования), IRS1 (субстрат для инсулинового рецептора 1 типа), PTGS1 (простагландин-эндопероксидсинтазу 1 типа (простагландин G/H синтазу и циклооксигеназу)), ECE1 (эндотелин-превращающий фермент 1 типа), F7 (фактор коагуляции VII (сывороточный ускоритель превращения тромбина)), URN (антагонист рецептора интерлейкина 1), EPHX2 (эпоксидгидролазу 2 типа, цитоплазматическую), IGFBP1 (связывающий белок инсулинподобного фактора роста 1 типа), MAPK10 (митоген-активируемую протеинкиназу 10), FAS (Fas (суперсемейство рецепторов TNF, представитель 6)), ABCB1 (АТФ-связывающую кассету, подсемейство B (MDR/TAP), представитель 1), JUN (онкоген jun), IGFBP3 (связывающий белок инсулинподобного фактора роста 3 типа), CD14 (молекулу CD14), PDE5A (фосфодиэстеразу 5A, cGMP-специфичную), AGTR2 (рецептор ангиотензина II, 2 тип), CD40 (молекулу CD40, представитель 5 суперсемейства рецепторов TNF), LCAT (лецитин-холестерин-ацилтрансферазу), CCR5 (хемокиновый рецептор 5 типа (с мотивом C-C)), MMP1 (матриксную металлопептидазу 1 (интерстициальную коллагеназу)), TIMP1 (ингибитор металлопептидазы TIMP 1 типа), ADM (адреномедуллин), DYT10 (дистонию 10), STAT3 (передатчик сигнала и активатор транскрипции 3 типа (фактор ответа острой фазы)), MMP3 (матриксную металлопептидазу 3 (стромелизин 1, прожелатиназу)), ELN (эластин), USF1 (фактор транскрипции, связывающийся перед сайтом инициации транскрипции 1), CFH (фактор комплемента H), HSPA4 (белок теплового шока 4 размером 70 кДа), MMP12 (матриксную металлопептидазу 12 (макрофагальную эластазу)), MME (мембранную металлоэндопептидазу), F2R (рецептор фактора коагуляции II (тромбина)), SELL (селектин L), CTSB (катепсин B), ANXA5 (аннексин A5), ADRB1 (адренергический бета-1-рецептор), CYBA (цитохром b-245, альфа-пептид), FGA (альфа-цепь фибриногена), GGT1 (гамма-глутамилтрансферазу 1), LIPG (липазу, эндотелиальную), HIF1A (фактор, индуцируемый гипоксией 1, альфа-субъединицу (фактор транскрипции основной структуры спираль-петля-спираль)), CXCR4 (хемокиновый рецептор 4 (с мотивом C-X-C)), PROC (белок C (инактиватор факторов коагуляции Va и VIIIa)), SCARB1 (фагоцитарный рецептор, класс B, представитель 1), CD79A (молекулу CD79a, иммуноглобулин-ассоциированную альфа), PLTP (белок переноса фосфолипидов), ADD1 (аддуцин 1 (альфа)), FGG (гамма-цепь фибриногена), SAA1 (сывороточный амилоид A1), KCNH2 (калиевый потенциалзависимый канал, семейство H (eag-связанный), представитель 2), DPP4 (дипептидилпептидазу 4), G6PD (глюкозо-6-фосфатдегидрогеназу), NPR1 (натрийуретический пептидный рецептор A/гуанилатциклазу A (атрионатрийуретический пептидный рецептор A)), VTN (витронектин), KIAA0101 (KIAA0101), FOS (гомолог онкогена вируса остеосаркомы мышей FBJ), TLR2 (toll-подобный рецептор 2), PPIG (пептидилпролинизомеразу G (циклопролин G)), IL1R1 (рецептор интерлейкина I типа), AR (андрогеновый рецептор), CYP1A1 (цитохром P450, семейство 1, подсемейство A, полипептид 1), SERPINA1 (ингибитор серпинпептидазы, клада A (альфа-1 антипротеиназу, антитрипсин), представитель 1), MTR (5-метилтетрагидрофолат-госоцистеинметилтрансферазу), RBP4 (ретинол-связывающий белок 4 типа, плазменный), APOA4 (аполипопротеин A-IV), CDKN2A (циклин-зависимый ингибитор киназы 2A (меланома, p16, ингибирует CDK4)), FGF2 (фактор роста фибробластов 2 (основной)), EDNRB (эндотелиновый рецептор B типа), ITGA2 (интегрин, альфа 2 (CD49B, альфа 2 субъединицу VLA-2 рецептора)), CABIN1 (кальцинейрин-связывающий белок 1), SHBG (глобулин, связывающийся с половыми гормонами), HMGB1 (группу белков с высокой подвижностью 1 типа), HSP90B2P (белок теплового шока размером 90 кДА, бета (Grp94), представитель 2 (псевдоген)), CYP3A4 (цитохром P450, семейство 3, подсемейство A, полипептид 4), GJA1 (белок межклеточных щелевых контактов, альфа 1, 43 кДа), CAV1 (кавеолин 1, белок кавеол, 22 кДа), ESR2 (эстрогеновый рецептор 2 (ER бета)), LTA (лимфотоксин альфа (суперсемейство TNF, представитель 1)), GDF15 (фактор роста и дифференцировки 15), BDNF (нейротрофический фактор головного мозга), CYP2D6 (цитохром P450, семейство 2, подсемейство D, полипептид 6), NGF (фактор роста нервов (бета-полипептид)), SP1 (фактор транкрипции Sp1), TGIF1 (TGFB-индуцируемый фактор гомеобокс 1), SRC (гомолог онкогена вируса саркомы v-src (Schmidt-Ruppin A-2) (птичьего)), EGF (эпидермальный фактор роста (бета-урогастрон)), PIK3CG (фосфоинозитид-3-киназу, каталитическую, гамма-полипептид), HLA-A (основной комплекс гистосовместимости, класс I, A), KCNQ1 (калиевый потенциалзависимый канал, KQT-подобное семейство, представитель 1), CNR1 (каннабиноидный рецептор 1 (головной мозг)), FBN1 (фибриллин 1), CHKA (холинкиназу альфа), BEST1 (бестрофин 1), APP (белок-предшественник амилоида бета (A4)), CTNNB1 (катенин (кадгерин-ассоциированный беок), бета 1, 88 кДа), IL2 (интерлейкин 2), CD36 (молекулу CD36 (тромбоспондиновый рецептор)), PRKAB1 (протеинкиназу, AMФ-активируемую, бета 1 некаталитическую субъединицу), TPO (тиреоидную перокидазу), ALDH7A1 (семейство альдегиддегидрогеназы 7, представитель A1), CX3CR1 (хемокиновый рецептор 1 (с мотивом C-X3-C)), TH (тирозингидроксилазу), F9 (фактор коагуляции IX), GH1 (гормон роста 1), TF (трансферрин), HFE (гемохроматоз), IL17A (интерлейкин 17A), PTEN (гомолог фосфатазы и тензина), GSTM1 (глутатион S-трансферазу мю 1), DMD (дистрофин), GATA4 (GATA связывающий белок 4 типа), F13A1 (фактор коагуляции XIII, полипептид A1), TTR (транстиретин), FABP4 (связывающий белок жирных кислот 4 типа, адипоцитарный), PON3 (параоксоназу 3), APOC1 (аполипопротеин C-I), INSR (инсулиновый рецептор), TNFRSF1B (суперсемейство рецепторов фактора некроза опухоли, представитель 1B), HTR2A (5-гидрокситриптаминовый (серотониновый) рецептор 2A), CSF3 (колониестимулирующий фактор 3 (гранулоцитарный)), CYP2C9 (цитохром P450, семейство 2, подсемейство C, полипептид 9), TXN (тиоредоксин), CYP11B2 (цитохром P450, семейство 11, подсемейство B, полипептид 2), PTH (паратиреоидный гормон), CSF2 (колониестимулирующий фактор 2 (гранулоцитарно-макрофагальный)), KDR (рецептор, содержащий домен вставки киназы (рецептор тирозинкиназы III типа)), PLA2G2A (фосфолипазу A2, группа IIA (тромбоциты, синовиальная жидкость)), B2M (бета-2-микроглобулин), THBS1 (тромбоспондин 1), GCG (глюкагон), RHOA (семейство генов гомологов ras, представитель A), ALDH2 (семейство альдегиддегидрогеназы 2 (митохондриальной)), TCF7L2 (фактор транскрипции 7, подобный фактору 2 (специфичный по отношению к T-клеткам, HMG-бокс)), BDKRB2 (брадикининовый рецептор B2), NFE2L2 (фактор 2, подобный ядерному фактору (эритроидный 2)), NOTCH1 (гомолог Notch 1, ассоциированный с транслокациями (дрозофилиный)), UGT1A1 (UDP-глюкуронилтрансферазу семейства 1, полипипетид A1), IFNA1 (интерферон, альфа 1), PPARD (дельта-рецептор, активируемый пролифератором пероксисом), SIRT1 (сиртуин 1 (гомолог 2 регуляции молчащей информации совпадающего типа) (S. cerevisiae)), GNRH1 (гонадотропин-рилизинг гормон 1 (лютеинизирующий-рилизинг гормон)), PAPPA (ассоциированный с беременностью белок A плазмы, папализин 1), ARR3 (аррестин 3, ретинальный (X-аррестин)), NPPC (предшественник натрийуретического пептида C), AHSP (альфа-гемоглобин-стабилизирующий белок), PTK2 (протеинтирозинкиназу 2 типа PTK2), IL13 (интерлейкин 13), MTOR (мишень механизма действия рапамицина (серин/треоринкиназу)), ITGB2 (интергрин, бета 2 (субъединицу рецептора 3 и 4 компонента 3 комплемента)), GSTT1 (глутатион-S-трансферазу тета 1), IL6ST (передатчик сигнала интерлейкина 6 (gp130, рецептор онкостатина М)), CPB2 (карбоксипептидазу B2 (плазменную)), CYP1A2 (цитохром P450, семейство 1, подсемейство A, полипептид 2), HNF4A (ядерный фактор гепатоцитов 4, альфа), SLC6A4 (семейство переносчиков растворенных веществ 6 (переносчик нейромедиаторов, серотонина), представитель 4), PLA2G6 (фосфолипазу A2, группа VI (цитозольную, кальций-независимую)), TNFSF11 (суперсемейство фактора роста опухоли (лиганд), представитель 11), SLC8A1 (семейство переносчиков растворенных веществ 8 (натрий-кальциевый антипортер), представитель 1), F2RL1 (рецептор-подобный фактор коагуляции II 1 (тромбин)), AKR1A1 (семейство альдокеторедуктаз 1, представитель A1 (алдегидредуктазу)), ALDH9A1 (семейство альдегиддегирогензы 9, представитель A1), BGLAP (белок гамма-карбоксиглутамата (gla)), MTTP (микросомальный белок переноса триглицеридов), MTRR (редуктаза 5-метилтетрагидрофолат-гомоцистеинметилтрансферазы), SULT1A3 (семейство сульфотрансфераз, цитозолоный, 1A, фенол-предпочтительный, представитель 3), RAGE (антиген опухоли почек), C4B (компонент 4В комплемента (группа крови Chido), P2RY12 (пуринергический рецептор P2Y, связанный с G-белком, 12), RNLS (реналазу, FAD-зависимую аминооксидазу), CREB1 (белок 1, связывающий чувствительный к cAMP элемент), POMC (проопиомеланокортин), RAC1 (связанный с ras субстрат 1 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac1)), LMNA (ламин NC), CD59 (молекулу CD59, регуляторный белок комплемента), SCN5A (натриевый канал, потенциалзависимый, V типа, альфа-субъединицу), CYP1B1 (цитохром P450, семейство 1, подсемейство B, полипептид 1), MIF (фактор ингибирования миграции макрофагов (фактор, ингибирующий гликозилирование)), MMP13 (матриксную метталлопептидазу 13 (коллагеназу 3)), TIMP2 (ингибитор металлопептидазы 2 TIMP), CYP19A1 (цитохром P450, семейство 19, подсемейство A, полипептид 1), CYP21A2 (цитохром P450, семейство 21, подсемейство A, полипептид 2), PTPN22 (протеинтирозинфосфатазу, нерецепторную, 22 типа (лимфоидную)), MYH14 (миозин, тяжелую цепь 14, немышечный), MBL2 (маннозо-связывающий лектин (белок C) 2, растворимый (дефект опсонина)), SELPLG (лиганд селектина P), AOC3 (аминоксидазу, медь-содержащую 3 (белок 1 адгезии сосудов)), CTSL1 (катепсин L1), PCNA (ядерный антиген пролиферирующих клеток), IGF2 (инсулинподобный фактор роста 2 (соматомедин A)), ITGB1 (интегрин, бета 1 (фибронектиновый рецептор, бета-полипептид, антиген CD29 включает MDF2, MSK12)), CAST (кальпастатин), CXCL12 (хемокиновый лиганд 12 (с мотивом C-X-C) (стромальный клеточный фактор 1)), IGHE (константную область тяжелой эпсилон-цепи иммуноглобулина), KCNE1 (калиевый потенциалзависимый канал, Isk-связанное семейство, представитель 1), TFRC (трансферриновый рецептор (p90, CD71)), COL1A1 (коллаген 1 типа, альфа 1), COL1A2 (коллаген, I типа, альфа 2), IL2RB (рецептор интерлейкина 2, бета), PLA2G10 (фрсфолипидазу A2, группа X), ANGPT2 (ангиопоэтин 2), PROCR (рецептор протеина C, эндотелиальный (EPCR)), NOX4 (NADPH-оксидазу 4), HAMP (гепцидиновый антимикробный пептид), PTPN11 (протеинтирозинфосфатазу, нерецепторную, 11 типа), SLC2A1 (семейство переносчиков растворенных веществ 2 (переносчик глюкозы посредством облегченной диффузии), представитель 1), IL2RA (рецептор интерлейкина 2, альфа), CCL5 (хемокиновый лиганд 5 (с мотивом C-C)), IRF1 (регуляторный фактор интерферона 1), CFLAR (CASP8 и FADD-подобный регулятор апоптоза), CALCA (кальцитонин-связанный полипептид альфа), EIF4E (фактор инициации трансляции эукариот 4E), GSTP1 (пи-1-глутатин-S-трансферазу), JAK2 (Янус-киназу 2), CYP3A5 (цитохром P450, семейство 3, подсемейство A, полипептид 5), HSPG2 (гепаринсульфатпротеогликан 2), CCL3 (хемокиновый лиганд 3 (с мотивом C-C)), MYD88 (ген первичного ответа миелоидной дифференциации (88)), VIP (вазоактивный пептид кишечника), SOAT1 (стерол-O-ацилтрансферазу 1), ADRBK1 (адренергическую, бета, рецепторную киназу 1), NR4A2 (подсемейство ядерных рецепторов 4, группа A, представитель 2), MMP8 (матриксную металлопептидазу 8 (нейтрофильную коллагеназу)), NPR2 (рецептор натрийуретического пептида B/гуанилатциклазу B (рецептор атрионатрийуретического пептида B)), GCH1 (GTP гидролазу 1), EPRS (глутамил-пропил-тРНК-синтетазу), PPARGC1A (гамма-рецептор, активируемый пролифератором пероксисом, коактиватор 1 альфа), F12 (фактор коагуляции XII (фактор Хагемана)), PECAM1 (молекулу адгезии тромбоцитов/эндотелиальных клеток), CCL4 (хемокиновый лиганд 4 (с мотивом C-C)), SERPINA3 (ингибитор серпинпептидазы, клада A (альфа-1-антипротеиназу, антитрипсин), представитель 3), CASR (кальций-чувствительный рецептор), GJA5 (белок межклеточных щелевых контактов, альфа 5, 40 кДа), FABP2 (связывающий белок жирных кислот 2 типа, кишечный), TTF2 (фактор терминации транскрипции, РНК-полимеразу II), PROS1 (белок S (альфа)), CTF1 (кардиотропин 1), SGCB (саркогликан, бета (дистрофин-ассоциированный гликопротеин размером 43 кДа)), YME1L1 (YME1-подобный фактор 1 (S. cerevisiae)), CAMP (кателицидиновый антимикробный пептид), ZC3H12A (содержащий фактор типа CCCH с цинковыми пальцами 12A), AKR1B1 (семейство альдокеторедуктазы 1, представитель B1 (альдоредуктазу)), DES (десмин), MMP7 (матриксную металлопептидазу 7 (матрилизин, маточный)), AHR (арил-углеводородный рецептор), CSF1 (колониестимулирующий фактор 1 (макрофагальный)), HDAC9 (гистон-деацетилазу 9), CTGF (фактор роста соединительной ткани), KCNMA1 (калиевый, активируемый кальцием канал высокого проведения, подсемейство M, альфа, представитель 1), UGT1A (UDP-глюкуронилтрансферазу семейства 1, локус комплекса полипептида A), PRKCA (протеинкиназу C, альфа), COMT (катехол-бета-метилтрансферазу), S100B (S100 кальций-связывающий белок B), EGR1 (фактор роста раннего ответа 1), PRL (пролактин), IL15 (интерлейкин 15), DRD4 (дофаминовый рецептор D4), CAMK2G (кальций/кальмодулинзависимую протеинкиназу II гамма), SLC22A2 (семейство переносчиков растворенных веществ 22 (переносчик органических катионов), представитель 2), CCL11 (хемокиновый лиганд 11 (с мотивом C-C)), PGF (плацентартный фактор роста B321), THPO (тромбопоэтин), GP6 (гликопротеин VI (тромбоцитарный)), TACR1 (тахикиновый рецептор 1), NTS (нейротензин), HNF1A (HNF1 гомеобокс A), SST (соматостатин), KCND1 (калиевый потенциалзависимый канал, связанное с Shal подсемейство, представитель 1), LOC646627 (ингибитор фосфолипазы), TBXAS1 (тромбоксан A синтазу 1 (тромбоцитарную)), CYP2J2 (цитохром P450, семейство 2, подсемейство J, полипептид 2), TBXA2R (рецептор тромбоксана A2), ADH1C (алкогольдегидрогеназу 1C (класс I), гамма-полипептид), ALOX12 (арахидонат 12-липогеназу), AHSG (альфа-2-HS-гликопротеин), BHMT (бетаин-гомоцистеинметилтрансферазу), GJA4 (белок щелевых межклеточных контактов, альфа 4, 37 кДа), SLC25A4 (семейство переносчиков растворенных веществ 25 (митохондриальный переносчик; аденин-нуклеотид транслокатор), представитель 4), ACLY (АТФ-цитратлиазу), ALOX5AP (белок, активирующий арахидонат-5-липооксигеназу), NUMA1 (ядерный белок митотического аппарата 1), CYP27B1 (цитохром P450, семейство 27, подсемейство B, полипептид 1), CYSLTR2 (цистеинил-лейкотриеновый рецептор 2), SOD3 (супероксиддисмутазу 3, внеклеточную), LTC4S (лейкотриен C4-синтазу), UCN (урокортин), GHRL (препропептид грелина/обестатина), APOC2 (аполипопротеин C-II), CLEC4A (семейство 4 домена лектина C-типа, представитель A), KBTBD10 (содержащий kelch-повтор и домен BTB (POZ) 10), TNC (тенаскин C), TYMS (тимидилатсинтетазу), SHCl (SHC-трансформирующий белок 1 (содержащий домен 2 с Src-гомологией)), LRP1 (белок 1, связанный с рецепторами липопротеина низкой плотности), SOCS3 (супрессор 3 передачи сигнала с участием цитокинов), ADH1B (алкогольдегидрогеназу 1B (I класс), бета-полипептид), KLK3 (связанную с калликреином пептидазу 3), HSD11B1 (гидроксистероид (11-бета) дегидрогеназу 1), VKORC1 (витамин K эпоксид-редуктазный комплекс, субъединица 1), SERPINB2 (ингибитор серпинпептидазы, клада B (овальбумин), представитель 2), TNS1 (тензин 1), RNF19A (белок "цинковый палец" типа ring 19A), EPOR (эритропоэтиновый рецептор), ITGAM (интегрин, альфа M (субъединицу рецептора 3 компонента 3 комплемента)), PITX2 (подобный парному гомеодомен 2), MAPK7 (митоген-активированную протеинкиназу 7), FCGR3A (Fc-фрагмент IgG, с низкой аффинностью 111a, рецептор (CD16a)), LEPR (лептиновый рецептор), ENG (эндоглин), GPX1 (глутатионпероксидазу 1), GOT2 (щавелево-уксусную трансаминазу глутаминовой кислоты 2 типа, митохондриальную (аспартатаминотрансферазу 2 типа)), HRH1 (гистаминовый рецептор H1), NR112 (семейство ядерных рецепторов 1, I группа, представитель 2), CRH (кортикотропин-рилизинг гормон), HTR1A (5-гидрокситриптаминовый (серотониновый) рецептор 1A), VDAC1 (потенциалзависимый анионный канал 1), HPSE (гепараназу), SFTPD (поверхностно-активный белок D), TAP2 (переносчик 2, АТФ-связывающая кассета, подсемейство B (MDR/TAP)), RNF123 (белок "цинковый палец" типа ring 123), PTK2B (PTK2B протеинтирозинкиназу 2 бета), NTRK2 (нейротрофическую тирозинкиназу, рецептор, 2 тип), IL6R (рецептор интерлейкина 6), ACHE (ацетилхолинэстеразу (группу крови Yt)), GLP1R (рецептор глюкагон-подобного пептида 1), GHR (рецептор гормона роста), GSR (глутатионредуктазу), NQO1 (NAD(P)H-дегидрогеназу, хинон 1), NR5A1 (семейство ядерных рецепторов 5, группа A, представитель 1), GJB2 (белок межклеточных щелевых контактов, бета 2, 26 кДа), SLC9A1 (семейство переносчиков растворенных веществ 9 (натрий-водородный антипортер), представитель 1), MAOA (моноаминоксидазу A), PCSK9 (пропротеинконвертазу субтилизин-кексинового 9 типа), FCGR2A (Fc-фрагмент IgG, с низкой аффинностью IIa, рецептор (CD32)), SERPINF1 (ингибитор серпинпептидазы, клада F (альфа-2-антиплазмин, фактор пигментного эпителия), представитель 1), EDN3 (эндотелин 3), DHFR (дигидрофолатредуктазу), GAS6 (специфичный к задержке роста фактор 6), SMPD1 (сфингомиелинфосфодиэстеразу 1, кислую лизосомальную), UCP2 (неспаренный белок 2 (митохондриальный, переносчик протонов)), TFAP2A (транспортный фактор AP-2 альфа (активирующий энхансер связывающий белок 2 альфа)), C4BPA (связывающий белок 4 компонента комплемента, альфа), SERPINF2 (ингибитор серпинпептидазы, клада F (альфа-2-антилазмин, фактор пигментного эпителия), представитель 2), TYMP (тимидинфосфорилазу), ALPP (щелочную фосфатазу, плацентарную (изозим Регана)), CXCR2 (хемокиновый рецептор 2 (с мотивом C-X-C)), SLC39A3 (семейство переносчиков растворенных веществ 39 (переносчик цинка), представитель 3), ABCG2 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 2), ADA (аденозиндезаминазу), JAK3 (Янус-киназу 3), HSPA1A (белок теплового шока 1А размером 70 кДа), FASN (синтазу жирных кислот), FGF1 (фактор роста фибробластов 1 (кислотный)), F11 (фактор коагуляции XI), ATP7A (АТФазу, транспортирование Cu++, альфа-полипептид), CR1 (рецептор 1 компонента комплемента (3b/4b) (группы крови Knops)), GFAP (глиофибриллярный щелочной белок), ROCK1 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 1), MECP2 (метил CpG-связывающий белок 2 (синдром Ретта)), MYLK (легкую цепь миозина), BCHE (бутирилхолинэстеразу), LIPE (липазу, гормончувствительную), PRDX5 (пероксиредоксин 5), ADORA1 (рецептор аденозина A1), WRN (синдром Вернера, RecQ, подобный хеликазе), CXCR3 (хемокиновый рецептор 3 (с мотивом C-X-C)), CD81 (молекулу CD81), SMAD7 (семейство SMAD, представитель 7), LAMC2 (ламинин, гамма 2), MAP3K5 (митоген-активируемую протеинкиназу киназы 5), CHGA (хромогранин A (паратиреоридный секреторный белок 1)), IAPP (островковый амилоидный пептид), RHO (родопсин), ENPP1 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 1), PTHLH (подобный паратиреоидному гормону гормон), NRG1 (нейрегулин 1), VEGFC (фактор роста эндотелия сосудов C), ENPEP (глутамиламинопептидазу (аминопептидазу A)), CEBPB (CCAAT/энхансерный связывающий белок (C/EBP), бета), NAGLU (N-ацетилглюкозаминидазу, альфа-), F2RL3 (фактор коагуляции II (тромбин), рецептор-подобный 3), CX3CL1 (хемокиновый лиганд 1 (с мотивом C-X3-C)), BDKRB1 (брадикиновый рецептор B1), ADAMTS13 (ADAM металлопептидазу с тромбоспондиновым мотивом 1 типа, 13), ELANE (эластазу, экспрессируемую в нейтрофилах), ENPP2 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 2), CISH (индуцируемый цитокином SH2-содержащий белок), GAST (гастрин), MYOC (миоцилин, индуцируемый трабекулярной сетью глюкокортикоидный ответ), ATP1A2 (АТФазу, Na+/K+ транспорт, альфа 2 полипептид), NF1 (нейрофибромин 1), GJB1 (белок межклеточных щелевых контактов, бета 1, 32 кДа), MEF2A (миоцитарный энхансорный фактор 2A), VCL (винкулин), BMPR2 (рецептор костного морфогенетического белка, тип II (серин/треонинкиназу)), TUBB (тубулин, бета), CDC42 (фактор клеточного цикла 42 (GTP-связывающий белок, 25 кДа)), KRT18 (кератин 18), HSF1 (фактор транскрипции белка теплового шока 1), MYB (гомолог онкогена вируса миелобластоза v-myb (птичьего)), PRKAA2 (протеинкиназу, AMP-активируемую, каталитическую субъединицу альфа 2), ROCK2 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 2), TFPI (ингибитор пути тканевого фактора (липопротеин-ассоциированный ингибитор коагуляции)), PRKG1 (протеинкиназу, cGMP-зависимую, I тип), BMP2 (костный морфогенетический белок 2), CTNND1 (катенин (кадгерин-ассоциированный белок), дельта 1), CTH (цистатионазу (цистатионин-гамма-лиазу)), CTSS (катепсин S), VAV2 (фактор обмена гуаниновых нуклеотидов vav 2), NPY2R (рецептор Y2 нейропептида Y), IGFBP2 (связывающий белок 2 инсулин-подобного фактора роста, 36 кДа), CD28 (молекулу CD28), GSTA1 (глутатион-S-трансферазу, альфа 1), PPIA (пептидилпролилизомеразу A (циклофилин A)), APOH (аполипопротеин H (бета-2-гликопротеин I)), S100A8 (S100 кальций-связывающий белок A8), IL11 (интерлейкин 11), ALOX15 (арахидонат-15-липоксигеназу), FBLN1 (фибулин 1), NR1H3 (семейство ядерных рецепторов 1, группа H, представитель 3), SCD (стеароил-CoA десатуразу (дельта-9-десатуразу)), GIP (желудочный ингибиторный пептид), CHGB (хромогранин B (секретогранин 1)), PRKCB (протеинкиназу C, бета), SRD5A1 (стероид-5-альфа-редуктазу, альфа-полипептид 1 (3-оксо-5 альфа-стероид дельта-4-дегидрогеназу альфа 1)), HSD11B2 (гидроксистероид (11-бета) дегидрогеназу 2), CALCRL (подобный кальцитониновому рецептору), GALNT2 (UDP-N-ацетил-альфа-D-галактозамин:полипептид N-ацетилгалактозаминилтрансферазу 2 (GalNAc-T2)), ANGPTL4 (ангиопоэтинподобный 4), KCNN4 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 4), PIK3C2A (фосфоинозитидин-3-киназу, класс 2, альфа-полипептид), HBEGF (гепарин-связывающий EGF-подобный фактор роста), CYP7A1 (цитохром P450, семейство 7, подсемейство A, полипептид 1), HLA-DRB5 (главный комплекс гистосовместимости, класс II, DR бета 5), BNIP3 (белок 3 с массой 19 кДа, взаимодействующий с BCL2/аденовирусом E1B), GCKR (регулятор глюкокиназы (гексокиназы 4)), S100A12 (S100 кальций-связывающий белок A12), PADI4 (пептидиларгининдеиминазу, тип IV), HSPA14 (белок 14 теплового шока с массой 70 кДа), CXCR1 (хемокиновый рецептор 1 (с мотивом C-X-C)), H19 (H19, экспрессируемый пептид, импринтированный со стороны матери (некодирующий белок)), KRTAP19-3 (кератин-ассоциированный белок 19-3), IDDM2 (фактор инсулин-зависимого сахарного диабета 2 типа), RAC2 (ras-связанный субстрат 2 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac2)), RYR1 (рианодиновый рецептор 1 (мышечный)), CLOCK (гомолог гена (мышиный)), NGFR (рецептор фактора роста нервов (суперсемейство TNFR, представитель 16)), DBH (дофамин бета-гидроксилазу (дофамин бета-монооксигеназу)), CHRNA4 (холинергический рецептор, никотиновый, альфа 4), CACNA1C (кальциевый канал, потенциалзависимый, типа L, субъединицу альфа 1C), PRKAG2 (протеинкиназу, AMP-активированную, гамма 2 некаталическую субъединицу), CHAT (холинацетилтрансферазу), PTGDS (простагландин D2 синтазу размером 21 кДа (головного мозга)), NR1H2 (семейство 1 ядерных рецепторов, группа H, представитель 2), TEK (TEK тирозинкиназу, эндотелиальную), VEGFB (фатор роста эндотелия сосудов B), MEF2C (миоцитарный энхансерный фактор 2C), MAPKAPK2 (протеинкиназу 2, активированную митоген-активированной протеинкиназой), TNFRSF11A (суперсемейство рецепторов фактора некроза опухоли, представитель 11a, активатор NFKB), HSPA9 (белок 9 теплового шока размером 70 кДа (морталин)), CYSLTR1 (цистеинил-лейкотриеновый рецептор 1), MAT1A (метионинаденозилтрансферазу I, альфа), OPRL1 (подобный опиатному рецептору 1), IMPA1 (инизитол(мио)-1(или 4)-монофосфатазу 1), CLCN2 (канал-переносчик для ионов хлора 2), DLD (дигидролипоамиддегидрогеназу), PSMA6 (протеасомную субъединицу (просому, макропаин), тип альфа, 6), PSMB8 (протеасомную субъединицу (просому, макропаин), тип бета, 8 (большую мультифункциональную пептидазу 7)), CHI3L1 (фактор 1, подобный хитиназе 3 (хрящевой гликопротеин 39)), ALDH1B1 (альдегиддегидрогеназу, семейство 1, представитель B1), PARP2 (поли (АДФ-рибозо) полимеразу 2), STAR (стероидогенный острый регуляторный белок), LBP (липополисахарид-связывающий белок), ABCC6 (АТФ-связывающую кассету, подсемейство C (CFTR/MRP), представитель 6), RGS2 (регулятор передачи сигнала с участием G-белка 2, 24 кДа), EFNB2 (эфрин-B2), GJB6 (белок межклеточных щелевых контактов, бета 6, 30 кДа), APOA2 (аполипопротеин A-II), AMPD1 (аденозинмонофосфатдезаминазу 1), DYSF (дисферлин, тазо-плечевая мышечная дистрофия 2B (аутосомно-рецессивная)), FDFT1 (фарнезил-дифосфатфарнелизтрансферазу 1), EDN2 (эндотелин 2), CCR6 (хемокиновый рецептор 6 (с мотивом C-C)), GJB3 (белок межклеточных щелевых контактов, бета 3, 31 кДа), IL1RL1 (фактор 1, подобный рецептору интерлейкина 1), ENTPD1 (эктонуклеозидтрифосфат-дифосфогидролазу 1), BBS4 (фактор 4 синдром Барде-Бидля), CELSR2 (кадгерин, семиканальный рецептор 2 G-типа EGF LAG (гомолог flamingo, дрозофилиный)), F11R (рецептор F11), RAPGEF3 (фактор обмена гуаниновых нуклеотидов Rap (GEF) 3), HYAL1 (гиалуроноглюкозаминидазу 1), ZNF259 (белок "цинковый палец" 259), ATOX1 (гомолог антиоксидантного белка 1 ATX1 (дрожжевой)), ATF6 (фактор активации транскрипции 6), KHK (кетогексокиназу (фруктокиназу)), SAT1 (спермидин/спермин N1-ацетилтрансферазу 1), GGH (гамма-глутамилгидролазу (конъюгазу, фолилполигаммаглутамингидролазу)), TIMP4 (ингибитор TIMP металлопептидазы 4), SLC4A4 (семейство переносчиков растворенных белков 4, бикарбонат-натриевый контранспортер, представитель 4), PDE2A (фосфодиэстеразу 2A, cGMP-стимулированную), PDE3B (фосфодиэстеразу 3B, cGMP-ингибированную), FADS1 (десатуразу 1 жирных кислот), FADS2 (десатуразу 2 жирных кислот), TMSB4X (тимозин бета 4, X-сцепленный), TXNIP (белок, взаимодействующий с тиоредоксином), LIMS1 (домены 1, подобные LIM и антигену стареющих клеток), RHOB (семейство генов гомологов ras, представитель B), LY96 (лимфоцитарный антиген 96), FOXO1 (forkhead-бокс О1), PNPLA2 (фактор 2, содержащий домен пататин-подобной фосфолипидазы), TRH (тиротропин-рилизинг гормон), GJC1 (белок межклеточных щелевых контактов, гамма 1, 45 кДа), SLC17A5 (семейство переносчиков растворенных веществ 17 (переносчик анионов и сахаров), представитель 5), FTO (фактор, ассоциированный с жировой массой и ожирением), GJD2 (белок межклеточных щелевых контактов, дельта 2, 36 кДа), PSRC1 (двуспиральный фактор с высоким содержанием пролина и серина 1), CASP12 (каспазу 12 (ген/псевдоген)), GPBAR1 (рецептор 1 желчных кислот, связанный с G-белком), PXK (серин/треонинкиназу, содержащую домен PX), IL33 (интерлейкин 33), TRIB1 (гомолог tribbles 1 (дрозофилиный)), PBX4 (гомеобокс 4 пре-B-клеточного лейкоза), NUPR1 (ядерный белок, регулятор транскрипции, 1), 15-Sep (селенопротеин размером 15 кДа), CILP2 (белок промежуточного слоя хряща 2), TERC (РНК-компонент теломеразы), GGT2 (гамма-глутамилтрансферазу 2), MT-CO1 (цитохром c оксидазу I, кодируемую митохондриальным геномом) и UOX (уратоксидазу, псевдоген). Любая из данных последовательностей может быть мишенью для системы CRISPR-Cas, например, для изучения мутации.

В дополнительном варианте осуществления хромосомная последовательность также может быть выбрана из следующих: Pon1 (параоксоназа 1), LDLR (рецептор LDL), ApoE (аполипопротеин E), Apo B-100 (аполипопротеин B-100), ApoA (аполипопротеин(a)), ApoA1 (аполипопротеин A1), CBS (цистатион-B-синтаза), гликопротеин IIb/IIb, MTHRF (5,10-метилентетрагидрофолатредуктаза (NADPH) и их комбинаций. В одном случае хромосомные последовательности и белки, кодируемые хромосомными последовательностями, связанные с сердечно-сосудистым заболеванием, могут быть выбраны из Cacna1C, Sod1, Pten, Ppar(альфа), Apo E, лептина и их комбинаций в качестве мишени(мишеней) для системы CRISPR-Cas.

Нарушения, связанные с активностью секретазы

В публикации заявки на патент США № 20110023146 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с нарушением, связанным с активностью секретазы. Секретазы необходимы для процессинга белков-предшественников с образованием их биологически активных форм. Дефекты различных компонентов секретазных путей связаны со многими нарушениями, в частности, с характерным амилоидогенезом или амилоидными бляшками, например, болезнь Альцгеймера (AD).

Что касается нарушения, связанного с активностью секретазы, белки, ассоциированные с этими нарушениями, представляют собой разнородную группу белков, которые оказывают влияние на восприимчивость ко многим нарушениям, наличие нарушения, тяжесть нарушения или любую их комбинацию. Настоящее раскрытие предусматривает редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с нарушением, связанным с активностью секретазы. Белки, ассоциированные с нарушением, связанным с активностью секретазы, как правило, выбирают исходя из экспериментально установленной ассоциации белков, родственных секретазе, с развитием нарушения, связанного с активностью секретазы. Например, скорость образования или концентрация в кровотоке белка, ассоциированного с нарушением, связанным с активностью секретазы, может быть повышенной или пониженной в популяции с нарушением, связанным с активностью секретазы, по сравнению с популяцией без нарушения, связанного с активностью секретазы. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белок, ассоциированный с нарушением, связанным с активностью секретазы, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).

В качестве неограничивающего примера белки, ассоциированные с нарушением, связанным с активностью секретазы, включают PSENEN (гомолог 2 энхансера пресенилина (C. elegans)), CTSB (катепсин B), PSEN1 (пресенелин 1), APP (предшественник белка амилоида бета (A4)), APH1B (гомолог В дефекта переднего отдела гортани 1 (C. elegans)), PSEN2 (пресенилин 2 (болезнь Альцгеймера 4 типа)), BACE1 (бета-сайт APP-расщепляющий фермент 1), ITM2B (интегральный мембранный белок 2B), CTSD (катепсин D), NOTCH1 (гомолог 1 Notch, ассоциированный с транслокацией (дрозофилиный)), TNF (фактор некроза опухоли (семейство TNF, представитель 2)), INS (инсулин), DYT10 (фактор 10 дистонии), ADAM17 (домен 17 ADAM металлопептидазы), APOE (аполипопротеин E), ACE (ангиотензин I превращающий фермент (пептидил-дипептидазу A) 1), STN (статин), TP53 (опухолевый белок p53), IL6 (интерлейкин 6 (интерферон, бета 2)), NGFR (рецептор фактора роста нервов (семейство TNFR, представитель 16)), IL1B (интерлейкин 1, бета), ACHE (ацетилхолинэстеразу (группа крови Yt)), CTNNB1 (катенин (кадгерин-ассоциированный белок), бета 1, 88 кДа), IGF1 (инсулин-подобный фактор роста 1 (соматомедин C)), IFNG (интерферон, гамма), NRG1 (неурегулин 1), CASP3 (каспазу 3, связанную с апоптозом цистеинпептидазу), MAPK1 (митоген-активируемую протеинкиназу 1), CDH1 (кадгерин 1, 1 тип, E-кадгерин (эпителиальный)), APBB1 (протеин-связывающий предшественник амилоида бета (A4), семейство B, представитель 1 (Fe65)), HMGCR (3-гидрокси-3-метилглутарил-кофермент A редуктазу), CREB1 (связывающий белок 1 чувствительного к cAMP элемента), PTGS2 (простагландин-эндопероксидсинтазу 2 (простагландин G/H синтазу и циклооксигеназу)), HES1 (белок "hairy and enhancer of split 1", (дрозофилиный)), CAT (каталазу), TGFB1 (трансформирующий фактор роста, бета 1), ENO2 (энолазу 2 (гамма, нейрональную)), ERBB4 (гомолог 4 онкогена вируса эритробластического лейкоза v-erb-a (птичий)), TRAPPC10 (комплекс миграции белковых частиц 10), MAOB (моноаминоксидазу B), NGF (фактор роста нервов (бета-полпипептид)), MMP12 (матриксную металлопептидазу 12 (макрофагальную эластазу)), JAG1 (jagged 1 (синдром Алажиля)), CD40LG (лиганд к CD40), PPARG (гамма-рецептор, активируемый пролифератором пероксисом), FGF2 (фактор роста фибробластов 2 (основной)), IL3 (интерлейкин 3 (колониестимулирующий фактор, множественный)), LRP1 (белок 1, связанный с рецептором липопротеина низкой плотности), NOTCH4 (гомолог 4 Notch (дрозофилиный)), MAPK8 (митоген-активируемую протеинкиназу 8), PREP (пролилэндопептидазу), NOTCH3 (гомолог 3 Notch 3 (дрозофилиный)), PRNP (прионный белок), CTSG (катапсин G), EGF (эпидермальный фактор роста (бета-урогастрон)), REN (ренин), CD44 (молекулу CD44 (группа крови системы Indian)), SELP (селектин P (гранулярный мембранный белок с массой 140 кДа, антиген CD62)), GHR (рецептор гормона роста), ADCYAP1 (полипептид 1, активирующий адентилатциклазу 1 (гипофизарный)), INSR (инсулиновый рецептор), GFAP (глиофибриллярный кислый белок), MMP3 (матриксную металлопептидазу 3 (стромелизин 1, прожелатиназу)), MAPK10 (митоген-актвированную протеинкиназу 10), SP1 (фактор транскрипции Sp1), MYC (гомолог онкогена вируса миелоцитоматоза v-myc (птичий)), CTSE (катепсин E), PPARA (альфа-рецептор, активируемый пролифератором пероксисом), JUN (онкоген jun), TIMP1 (ингибитор TIMP металлопептидазы 1), IL5 (интерлейкин 5 (колониестимулирующий фактор, эозинофильный)), IL1A (интерлейкин 1, альфа), MMP9 (матриксную металлопептидазу 9 (желатиназу B, желатиназу с массой 92 кДа, коллагеназу IV типа с массой 92 кДа)), HTR4 (5-гидрокситриптамин (серотониновый) рецептор 4 типа), HSPG2 (гепарансульфат-протеогликан 2), KRAS (гомолог онкогена вируса саркомы крыс Kirsten v-Ki-ras2), CYCS (цитохром c, соматический), SMG1 (гомолог SMG1, киназу, связанную с фосфатидилинозитол-3-киназой (C. elegans)), IL1R1 (рецептор интерлейкина 1, I тип), PROK1 (прокинетицин 1), MAPK3 (митоген-активируемую протеинкиназу 3), NTRK1 (нейротрофическую тирозинкиназу, рецептор, 1 тип), IL13 (интерлейкин 13), MME (мембранную металлоэндопептидазу), TKT (транскетолазу), CXCR2 (хемокиновый рецептор 2 (с мотивом C-X-C)), IGF1R (рецептор 1 инсулин-подобного фактора роста), RARA (рецептор ретиноевой кислоты, альфа), CREBBP (CREB связывающий белок), PTGS1 (простагландин-эндопероксидсинтазу 1 (простагландин G/H синтазу и циклооксигеназу)), GALT (галактозо-1-фосфатуридилтрансферазу), CHRM1 (холинергический рецептор, мускариновый 1), ATXN1 (атаксин 1), PAWR (PRKC, апоптический, WT1, регулятор), NOTCH2 (гомолог 2 Notch (дрозофилиный)), M6PR (маннозо-6-фосфатный рецептор (катион-зависимый)), CYP46A1 (цитохром P450, семейство 46, подсемейство A, полипептид 1), CSNK1 D (казеинкиназу 1, дельта), MAPK14 (митоген-активируемую протеинкиназу 14), PRG2 (протеогликан 2, костномозговой (активатор натуральных клеток-киллеров, главный основной белок эозинофильных гранул)), PRKCA (протеинкиназу C, альфа), L1 CAM (молекулу клеточной адгезии L1), CD40 (молекулу CD40, представитель 5 суперсемейства рецепторов TNF), NR1I2 (семейство 1 ядерных рецепторов, I группа, представитель 2), JAG2 (jagged 2), CTNND1 (катенин (кадгерин-ассоциированный белок), дельта 1), CDH2 (кадгерин 2, 1 тип, N-кадгерин (нейрональный)), CMA1 (химазу 1, тучных клеток), SORT1 (сортилин 1), DLK1 (дельта-подобный 1 гомолог (дрозофилиный)), THEM4 (представитель 4 семейства тиоэстераз 4), JUP (плакоглобин межклеточных контактов), CD46 (молекулу CD46, регуляторный белок комплемента), CCL11 (хемокиновый лиганд 11 (с мотивом C-C)), CAV3 (кавеолин 3), RNASE3 (рибонуклеазу, РНКазу, семейство A, 3 (эозинофильный катионный белок)), HSPA8 (белок 8 теплового шока, с массой 70 кДа), CASP9 (каспазу 9, связанную с апоптозом цистеинпептидазу), CYP3A4 (цитохром P450, семейство 3, подсемейство A, полипептид 4), CCR3 (хемокиновый рецептор 3 (с мотивом C-C)), TFAP2A (фактор транскрипции AP-2 альфа (активирующий энхансер связывающий белок 2 альфа)), SCP2 (белок-переносчик стеринов 2), CDK4 (циклин-зависимую киназу 4), HIF1A (индуцируемый гипоксией фактор 1, альфа-субъединица (основной фактор транскрипции спираль-петля-спираль)), TCF7L2 (фактор 2, подобный фактору транскрипции 7 (специфичный по отношению к T-клеткам, HMG-бокс)), IL1R2 (рецептор интерлейкина 1, II тип), B3GALTL (факторы, подобный бета 1,3-галактолизтрансферазе), MDM2 (гомолог Mdm2 p53-связывающего белка (мышиный)), RELA (гомолог онкогена А вируса ретикулоэндотелиоза v-rel (птичий)), CASP7 (каспазу 7, связанную с апоптозом цистеинпептидазу), IDE (разрушающий инсулин фермент), FABP4 (белок 4, связывающий жирные кислоты, адипоцитарный), CASK (кальций/кальмодулин-зависимую протеинкиназу (семейство MAGUK)), ADCYAP1R1 (аденилатциклазный активирующий рецептор полипептида 1 (гипофизарный), I тип), ATF4 (активирующий фактор транскрипции 4 (чувствительный к tax энхансерный элемент B67)), PDGFA (тромбоцитарный фактор роста, альфа-полипептид), C21 или f33 (открытая рамка считывания 33 хромосомы 21), SCG5 (секретогранин V (белок 7B2)), RNF123 (белок "цинковый палец" типа ring 123), NFKB1 (ядерный фактор энхансера гена каппа-полипептида легкой цепи в B-клетках 1 типа), ERBB2 (гомолог онкогена 2 вируса эритробластного лейкоза v-erb-b2, гомолог онкогена нейро-/глиобластомного происхождения (птичий)), CAV1 (кавеолин 1, белок кавеол, 22 кДа), MMP7 (матриксную металлопептидазу 7 (матрилизин, маточный)), TGFA (трансформирующий фактор роста, альфа), RXRA (ретиноидный X-рецептор, альфа), STX1A (синтаксин 1A (головного мозга)), PSMC4 (протеасомную субъединицу 26S (просому, макропаин), АТФазу, 4), P2RY2 (пиринергический рецептор P2Y, связанный с G-белком, 2), TNFRSF21 (семейство рецепторов фактора некроза опухоли, представитель 21), DLG1 (discs, большой гомолог 1 (дрозофилиный)), NUMBL (гомолог, подобный numb (дрозофилиный)), SPN (сиалофорин), PLSCR1 (фосфолипидскрамблазу 1), UBQLN2 (убиквитин 2), UBQLN1 (убиквитин 1), PCSK7 (пропротеинконвертазу субтилизин/кексин 7 типа), SPON1 (спондин 1, белок внеклеточного матрикса), SILV (гомолог silver (мышиный)), QPCT (глутаминил-пептид-циклотрансферазу), HESS (белок "hairy and enhancer of split 5" (дрозофилиный)), GCC1 (содержащий GRIP двуспиральный домен 1) и их комбинацию.

Генетически модифицированные животное или клетка может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с нарушением, связанным с активностью секретазы, и ноль, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более интегрированных в хромосомы последовательностей, кодирующих белок с нарушенной структурой, ассоциированный с нарушением, связанным с активностью секретазы.

Нацеливание на печень и клетки печени; гемофилия

Предусмотрено нацеливание на клетки печени. Его можно осуществлять in vitro или in vivo. Гепатоциты являются предпочтительными. Доставка белка CRISPR может осуществляться посредством вирусных векторов, особенно векторов на основе AAV (и, в частности, AAV2/6). Их можно вводить с помощью внутривенной инъекции.

Предпочтительной мишенью для печени, вне зависимости in vitro или in vivo, является ген альбумина. Он представляет собой так называемую "зону безопасности", поскольку альбумин экспрессируется при очень высоких уровнях, и поэтому некоторое снижение продукции альбумина после успешного редактирования генов является допустимым. Он также является предпочтительным, поскольку высокие уровни экспрессии, наблюдаемые при работе промотора/энхансера альбумина, обеспечивают достижение полезных уровней корректной или трансгенной продукции (из вставленной донорской матрицы) даже в случае, если редактируют лишь небольшую часть гепатоцитов.

Интрон 1 альбумина, как было показано Wechsler et al. (представлено на 57-м ежегодном собрании и выставке Американского общества гематологии - резюме доступно онлайн по адресу https://ash.confex.com/ash/2015/webprogram/Paper86495.html и размещено 6 декабря 2015 г.), является подходящим целевым сайтом. В их исследовании были использованы "цинковые пальцы" для разрезания ДНК в целевом сайте, и подходящие направляющие последовательности можно получить для управления расщеплением в том же сайте с помощью белка CRISPR.

Использование мишеней в высокоэкспрессируемых генах (генах с высокоактивными энхансерами/промоторами), такими как альбумин, может также обеспечивать использование не содержащей промоторов донорской матрицы, как описано Wechsler et al., и это также является широко применимым за пределами нацеливания на печень. Известны другие примеры высокоэкспрессируемых генов.

Нарушения со стороны крови, связанные с печенью, в частности, гемофилия, а именно гемофилия B

Успешное редактирование генов гепатоцитов было достигнуто у мышей (как in vitro, так и in vivo) и у отличных от человека приматов (in vivo), показывающее, что лечение нарушений со стороны крови посредством редактирования гена/конструирования генома в гепатоцитах является возможным. В частности, экспрессия человеческого гена F9 (hF9) в гепатоцитах была показана у отличных от человека приматов, указывая на возможность лечения гемофилии B у людей.

Wechsler et al. представили на 57-м ежегодном собрании и выставке Американского общества гематологии (резюме размещено 6 декабря 2015 г. и доступно онлайн по адресу https://ash.confex.com/ash/2015/webprogram/Paper86495.html), что они успешно экспрессировали человеческий F9 (hF9) из гепатоцитов, взятых у отличных от человека приматов, посредством редактирования гена in vivo. Это было достигнуто с помощью 1) двух нуклеаз с "цинковыми пальцами" (ZFN), нацеливающихся на интрон 1 локуса альбумина, и 2) конструкции донорской матрицы человеческого F9. ZFN и донорскую матрицу кодировали на отдельных векторах на основе гепатотропного аденоассоциированного вируса серотипа 2/6 (AAV2/6), вводили внутривенно, что приводило к целевой вставке откорректированной копии гена hF9 в локус альбумина в части гепатоцитов печени.

Локус альбумина выбирали в качестве "предохранителя", поскольку продукция этого наиболее представленного белка плазмы превышает 10 г/день, и умеренные снижения таких уровней являются хорошо переносимыми. Гепатоциты с отредактированным геномом продуцировали hFIX (hF9) в терапевтических количествах, в отличие от альбумина, управляемого высокоактивным энхансером/промотором. Была показана подвергаемая нацеливанию интеграция трансгена hF9 в локус альбумина и сплайсинг этого гена в транскрипт альбумина.

Исследования у мышей: мышам C57BL/6 вводили основу (n=20) или векторы на основе AAV2/6 (n=25), кодирующие мышиные суррогатные реагенты, при 1,0x1013 векторных геномов (vg)/кг посредством инъекции в хвостовую вену. Анализ ELISA hFIX плазмы у обработанных мышей показал максимальные уровни 50-1053 нг/мл, которые сохранялись в течение 6-месячного исследования. Анализ активности FIX из плазмы мышей подтвердил биоактивность, соразмерную уровням экспрессии.

Исследования у отличных от человека приматов (NHP): одна внутривенная совместная инфузия векторов на основе AAV2/6, кодирующих нацеленные на альбумин-специфичные ZFN NHP, и донорской матрицы человеческого F9 при 1,2x1013 vg/кг (n=5/группа) приводила к уровню >50 нг/мл (>1% от нормы) в этой модели с участием крупных животных. Применение более высоких доз AAV2/6 (до 1,5x1014 vg/кг включительно) приводило к уровням hFIX до 1000 нг/мл включительно (или 20% от нормы) у нескольких животных и до 2000 нг/мл (или 50% от нормы) у одного животного в течение исследования (3 месяца).

Лечение хорошо переносилось у мышей и NHP, без значимых токсикологических результатов, связанных с лечением AAV2/6 ZFN + донор у обоих видов при терапевтических дозах. После этого Sangamo (Калифорния, США) подал заявку в FDA и получил разрешение на проведение первого в мире клинического исследования на человеке с целью применения редактирования генома in vivo. Оно проводится в дополнение к разрешению EMEA лечения на основе генной терапии Glybera недостаточности липопротеинлипазы.

Соответственно, предпочтительно в некоторых вариантах осуществления, что применяют любое или все из следующего:

векторы на основе AAV (в частности, AAV2/6), предпочтительно вводимые с помощью внутривенной инъекции;

альбумин в качестве мишени для редактирования гена/вставки трансгена/матрицы - особенно в интроне 1 альбумина;

донорскую матрицу человеческого F9; и/или

не содержащую промотора донорскую матрицу.

Гемофилия B

Соответственно, в некоторых вариантах осуществления предпочтительно, что настоящее изобретение применяют для лечения гемофилии B. Например, предпочтительно, что предусмотрена матрица, и что она представляет собой человеческий ген F9. Предполагается, что матрица hF9 содержит wt или "не содержащую ошибок" версию hF9, поэтому лечение является эффективным.

В альтернативном варианте осуществления версия F9, приводящая к гемофилии В, может быть доставлена с тем, чтобы создать модельный организм, клетку или линию клеток (например, модельный организм, клетку или линию клеток мыши или отличных от человека приматов), модельный организм, клетку или линию клеток, имеющую или несущую фенотип гемофилии B, т.е. неспособность продуцировать F9 wt.

Гемофилия A

В некоторых вариантах осуществления ген F9 (фактор IX) может быть замещен геном F8 (фактор VIII), описанным в данном документе, приводя к лечению гемофилии A (посредством получения не содержащего ошибок гена F8) и/или созданию модельного организма, клетки или линии клеток с гемофилией A (посредством получения содержащего ошибки гена F8, версии, приводящей к гемофилии А).

Гемофилия C

В некоторых вариантах осуществления ген F9 (фактор IX) может быть замещен геном F11 (фактор XI), описанным в данном документе, приводя к лечению гемофилии С (посредством получения не содержащего ошибок гена F11) и/или созданию модельного организма, клетки, или линии клеток с гемофилией С (посредством получения содержащего ошибки гена F11, версии, приводящей к гемофилии С).

Другие состояния

Муковисцидоз (CF)

В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика муковисцидоза. Мишенью предпочтительно является ген SCNN1A или CFTR. Это описано в WO2015157070, раскрытие которого включено в данный документ посредством ссылки.

Рак и CAR-T

В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика муковисцидоза. Мишенью предпочтительно является один или несколько из генов FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC или TRBC. Онкологическое заболевание может представлять собой одно или несколько из лимфомы, хронического лимфоцитарного лейкоза (CLL), B-клеточного острого лимфоцитарного лейкоза (B-ALL), острого лимфобластного лейкоза, острого миелоидного лейкоза, неходжкинской лимфомы (NHL), диффузной крупноклеточной лимфомы (DLCL), множественной миеломы, почечно-клеточной карциномы (RCC), нейробластомы, колоректального рака, рака молочной железы, рака яичников, меланомы, саркомы, рака предстательной железы, рака легких, рака пищевода, гепатоцеллюлярной карциномы, рака поджелудочной железы, астроцитомы, мезотелиомы, рака головы и шеи и медуллобластомы. Это можно осуществлять с помощью сконструированной Т-клетки с химерным антигенным рецептором (CAR). Это описано в WO2015161276, раскрытие которого включено в данный документ посредством ссылки.

Вирус простого герпеса 1 и 2 типа

В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика HSV-1 (вируса простого герпеса 1). Мишенью предпочтительно является ген UL19, UL30, UL48 или UL50 в HSV-1. Это описано в WO2015153789, раскрытие которого включено в данный документ посредством ссылки.

В других вариантах осуществления предусмотрено лечение, профилактика и диагностика HSV-2 (вируса простого герпеса 2). Мишенью предпочтительно является ген UL19, UL30, UL48 или UL50 в HSV-2. Это описано в WO2015153791, раскрытие которого включено в данный документ посредством ссылки.

Настоящее изобретение может быть дополнительно проиллюстрировано и расширено на основе аспекта разработки и применения CFISPR-Cas9, как изложено в следующих статьях, тем самым включенных в данный документ посредством ссылки и, в частности, он относится к доставке комплекса белка CRISPR и вариантам применения РНК-направляемой эндонуклеазы в клетках и организмах:

Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013);

RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang, W., Bikard, D., Cox, D., Zhang, F., Marraffini, L.A. Nat Biotechnol Mar; 31(3):233-9 (2013);

One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013);

Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013);

Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, FA., Hsu, PD., Lin, CY., Gootenberg, JS., Konermann, S., Trevino, AE., Scott, DA., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A);

DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013);

Genome engineering using the CRISPR-Cas9 system. Ran, FA., Hsu, PD., Wright, J., Agarwala, V., Scott, DA., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B);

Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Электронная публикация, предшествующая печатной];

Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014);

Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014);

CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014);

Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F., Cell. Jun 5;157(6):1262-78 (2014).

Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014);

Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014);

In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015);

Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015).

A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015);

Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015 (multiplex screen in mouse), и

In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015).

Shalem et al., "High-throughput functional genomics using CRISPR-Cas9," Nature Reviews Genetics 16, 299-311 (May 2015).

Xu et al., "Sequence determinants of improved CRISPR sgRNA design," Genome Research 25, 1147-1157 (August 2015).

Parnas et al., "A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks," Cell 162, 675-686 (July 30, 2015).

Ramanan et al., CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus," Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)

Nishimasu et al., Crystal Structure of Staphylococcus aureus Cas9," Cell 162, 1113-1126 (Aug. 27, 2015)

BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis, Canver et al., Nature 527(7577):192-7 (Nov. 12, 2015) doi: 10.1038/nature15521. Epub 2015 Sep 16.

Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System, Zetsche et al., Cell 163, 759-71 (Sep 25, 2015).

Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems, Shmakov et al., Molecular Cell, 60(3), 385-397 doi: 10.1016/j.molcel.2015.10.008 Epub October 22, 2015.

Rationally engineered Cas9 nucleases with improved specificity, Slaymaker et al., Science 2016 Jan 1 351(6268): 84-88 doi: 10.1126/science.aad5227. Электронная публикация 1 декабря 2015 г. [Электронная публикация, предшествующая печатной],

каждая из которых включена в данный документ посредством ссылки, может быть рассмотрена при практическом осуществлении настоящего изобретения и описана вкратце ниже.

Cong et al. сконструировали системы CRISPR-Cas II типа на основе как Cas9 Streptococcus thermophilus, так и Cas9 Streptococcus pyogenes для применения в эукариотических клетках и продемонстрировали, что нуклеазы Cas9 могут управляться короткими РНК с индукцией точного расщепления ДНК в клетках человека и мыши. Их исследование дополнительно показало, что Cas9, превращенный в фермент, вносящий однонитевой разрыв, можно применять для облегчения репарации с участием гомологичной рекомбинации в эукариотических клетках с минимальной мутагенной активностью. Кроме того, их исследование продемонстрировало, что в одном массиве CRISPR могут быть закодированы несколько направляющих последовательностей для обеспечения одновременного редактирования в нескольких сайтах эндогенных локусов генома в геноме млекопитающих, что демонстрирует легкую программируемость и широкое применение технологии нуклеаз, направляемых РНК. Эта возможность применения РНК для программирования специфичного к последовательности расщепления ДНК в клетках определила новый класс инструментов для конструирования генома. Данные исследования дополнительно показали, что другие локусы CRISPR, вероятно, можно пересадить в клетки млекопитающих, и они могут также опосредовать расщепление генома млекопитающих. Важно отметить, что можно предусмотреть дополнительное улучшение некоторых аспектов системы CRISPR-Cas для повышения ее эффективности и универсальности.

Jiang et al. применяли эндонуклеазу Cas9, ассоциированную с короткими палиндромными повторами, регулярно расположенными группами (CRISPR), образующую комплекс с двойными РНК для введения точных мутаций в геномы Streptococcus pneumoniae и Escherichia coli. Подход опирался на расщеплении в целевом сайте генома под управлением системы двойная РНК:Cas9 для уничтожения немутированных клеток и устранял необходимость в селектируемых маркерах или системах негативного отбора. В исследовании сообщалось о перепрограммировании специфичности системы двойная РНК:Cas9 путем изменения последовательности короткой РНК CRISPR (crRNA) для внесения одно- или многонуклеотидных изменений, выполняемых с помощью матриц редактирования. Исследование показало, что одновременное использование двух crRNA обеспечивало мультиплексный мутагенез. Кроме того, когда подход применяли в сочетании с рекомбинационной инженерией, у S. рneumoniа практически 100% клеток, извлеченных с помощью описанного подхода, содержали желаемую мутацию, а у E. сoli 65% извлеченных клеток содержали мутацию.

Wang et al. (2013) использовали систему CRISPR/Cas для одностадийного получения мышей, несущих мутации в нескольких генах, которых традиционно получали в несколько стадий, с помощью последовательной рекомбинации в эмбриональных стволовых клетках и/или продолжительного интеркроссинга мышей с одной мутацией. Система CRISPR/Cas будет значительно ускорять исследование функционально избыточных генов и эпистатических генных взаимодействий in vivo.

Konermann et al. (2013) изучали существующую в данной области необходимость в гибких и надежных технологиях, позволяющих осуществлять оптическое и химическое модулирование фермента Cas9 CRISPR на основе ДНК-связывающих доменов, а также эффекторов, подобных активаторам транскрипции.

Ran et al. (2013-А) описали подход, в котором мутантную никазу Cas9 применяли в сочетании с парными направляющими РНК для внесения целевых двухнитевых разрывов. Это относится к вопросу о том, что нуклеаза Cas9 из микробной системы CRISPR-Cas направляется на конкретные локусы генома направляющей последовательностью, которая может допускать некоторые несовпадения с ДНК-мишенью и, таким образом, способствует нежелательному нецелевому мутагенезу. Поскольку отдельные однонитевые разрывы в геноме подвергаются высокоточной репарации, одновременное внесение однонитевых разрывов с помощью соответствующим образом смещенных друг относительно друга направляющих РНК является необходимым для образования двухнитевых разрывов и увеличивает количество специфически распознаваемых оснований для расщепления мишени. Авторы продемонстрировали, что применение парного внесения однонитевых разрывов может снижать нецелевую активность в линиях клеток в 50-1500 раз и облегчать нокаут генов в зиготах мышей без уменьшения эффективности целевого расщепления. Данная гибкая стратегия обеспечивает большое разнообразие применений редактирования генома, требующих высокой специфичности.

Hsu et al. (2013) охарактеризовали специфичность целенаправленного воздействия SpCas9 в клетках человека, чтобы предоставить информацию для выбора целевых сайтов и избежать нецелевых эффектов. В исследовании оценивали >700 вариантов направляющей РНК и уровней мутаций по типу вставок/делеций, индуцированных SpCas9, в >100 прогнозируемых нецелевых локусах генома в клетках 293T и 293FT. Авторы показали, что SpCas9 допускает несовпадения между направляющей РНК и целевой ДНК в различных положениях в зависимости от последовательности с чувствительностью к количеству, положению и распределению несовпадений. Авторы дополнительно показали, что на опосредованное SpCas9 расщепление не влияет метилирование ДНК и что для сведения к минимуму нецелевых модификаций можно подобрать дозу SpCas9 и sgRNA. Кроме того, для облегчения применений в геномной инженерии млекопитающих авторы сообщили о получении инструментального программного обеспечения на веб-основе для управления выбором и подтверждением целевых последовательностей, а также анализов нецелевых явлений.

Ran et al. (2013-B) описали набор инструментов для опосредованного Cas9 редактирования генома посредством негомологичного соединения концов (NHEJ) или репарации с участием гомологичной рекомбинации (HDR) в клетках млекопитающих, а также создания модифицированных линий клеток для последующих функциональных исследований. Для сведения к минимуму нецелевого расщепления авторы дополнительно описали стратегию внесения двойных однонитевых разрывов с помощью мутантной никазы Cas9 с парными направляющими РНК. Протокол, представленный авторами, является полученным экспериментальным путем руководством по выбору целевых сайтов, оценке эффективности расщепления и анализу нецелевой активности. Исследования показали, что начиная с конструирования мишени, модификации генов можно достигнуть в течение всего лишь 1-2 недель, и модифицированные клональные линии клеток можно получить в течение 2-3 недель.

Shalem et al. описали новый способ исследования функций генов в полногеномном масштабе. Их исследования показали, что доставка библиотеки CRISPR-Cas9 для нокаута в масштабе генома (GeCKO), целенаправленно воздействующей на 18080 генов, с 64751 уникальной направляющей последовательностью обеспечивала скрининг путем как положительного, так и отрицательного отбора в клетках человека. Во-первых, авторы показали применение библиотеки GeCKO для идентификации генов, существенных для жизнеспособности клеток у раковых и плюрипотентных стволовых клеток. Далее, в модели меланомы, авторы провели скрининг генов, утрата функций которых вовлечена в устойчивость к вемурафенибу, терапевтическому средству, ингибирующему мутантную протеинкиназу BRAF. Их исследования показали, что кандидаты высшего ранга включали ранее подтвержденные гены NF1 и MED12, а также новые хиты NF2, CUL3, TADA2B и TADA1. Авторы наблюдали высокий уровень согласованности между независимыми направляющими РНК, осуществляющими нацеливание на один и тот же ген, и высоким показателем подтверждения хитов и, таким образом, продемонстрировали перспективность скрининга с помощью Cas9 в масштабе генома.

Nishimasu et al. сообщали о кристаллической структуре Cas9 Streptococcus pyogenes в комплексе с sgRNA и ее целевой ДНК при разрешающей способности в 2,5 A°. В структуре была выявлена двудольная архитектура, образованная долей распознавания мишени и нуклеазной долей, обеспечивающих размещение гетеродуплекса sgRNA:ДНК в положительно заряженной бороздке на поверхности их соприкосновения. При том, что лопасть распознавания является существенной для связывания sgRNA и ДНК, нуклеазная доля содержит нуклеазные домены HNH и RuvC, расположенные надлежащим образом для расщепления комплементарной и некомплементарной нитей целевой ДНК соответственно. Нуклеазная доля также содержит карбоксиконцевой домен, отвечающий за взаимодействие с мотивом, смежным с протоспейсером (PAM). Эти структурные анализы с высокой разрешающей способностью и сопутствующие функциональные анализы выявили молекулярный механизм целенаправленного воздействия Cas9, направляемых РНК, на ДНК, с созданием таким образом предпосылок для рационального конструирования новых универсальных технологий редактирования генома.

Wu et al. производили полногеномное картирование сайтов связывания для каталитически неактивного Cas9 (dCas9) из Streptococcus pyogenes, который вводили с одиночными направляющими РНК (sgRNA) в эмбриональные стволовые клетки мыши (mESC). Авторы показали, что каждая из четырех тестируемых sgRNA осуществляет нацеливание dCas9 на сайты генома в количестве от нескольких десятков до нескольких тысяч, что часто характеризуется наличием 5-нуклеотидного затравочного участка в sgRNA и мотива NGG, смежного с протоспейсером (PAM). Недоступность хроматина снижает связывание dCas9 с другими сайтами с последовательностями, комплементарными затравочной; таким образом, 70% нецелевых сайтов ассоциированы с генами. Авторы показали, что целенаправленное секвенирование 295 сайтов связывания для dCas9 в mESC, трансфицированных каталитически активным Cas9, выявило мутацию, превышающую фоновые уровни, только в одном сайте. Авторы предложили модель связывания с Cas9 и опосредованного им расщепления с двумя состояниями, в которой последовательность, комплементарная затравочной, запускает связывание, но для расщепления необходимо образование многочисленных пар с целевой ДНК.

Platt et al. получили Cre-зависимую мышь с нокином Cas9. Авторы показали редактирование генома in vivo, а также ex vivo с помощью доставки направляющей РНК на основе аденоассоциированного вируса (AAV), лентивируса или частиц в нейроны, иммунные клетки и эндотелиальные клетки.

Публикация Hsu et al. (2014) представляет собой обзорную статью, в которой описывается в целом история CRISPR-Cas9 от йогурта до редактирования генома, в том числе генетического скрининга клеток.

Публикация Wang et al. (2014) связана с подходом на основе объединенного генетического скрининга с изучением потери функции, применимого как для положительного, так и отрицательного отбора, в котором используется библиотека полногеномных лентивирусных одиночных направляющих РНК (sgRNA).

Doench et al. создали пул sgRNA, покрывающих все возможные целевые сайты панели из шести эндогенных мышиных и трех эндогенных человеческих генов и количественно оценили их способность образовывать нуль-аллели своего целевого гена с помощью окрашивания антител и проточной цитометрии. Авторы показали, что оптимизация PAM повышала активность и также обеспечивала онлайн-средство для конструирования sgRNA.

Swiech et al. показывают, что AAV-опосредованное редактирование генома SpCas9 может обеспечивать обратные генетические исследования функции гена в головном мозге.

Konermann et al. (2015) описывают способность присоединять множественные эффекторные домены, например, активатор транскрипции, функциональные и эпигеномные регуляторы в определенных положениях на ведущей последовательности, например, стволе или тетра-петле с линкерами и без них.

Zetsche et al. показывают, что фермент Cas9 может быть расщеплен на два и, таким образом, сборка Cas9 для активации может быть контролируемой.

Публикация Chen et al. связана с множественным скринингом посредством демонстрации того, что в результате полногеномного скрининга CRISPR-Cas9 in vivo у мышей обнаружены гены, регулирующие метастазирование в легких.

Публикация Ran et al. (2015) относится к SaCas9 и его способности редактировать геномы и демонстрирует невозможность экстраполяции исходя из биохимических анализов. Публикация Shalem et al. (2015) описывает пути, в которых слияния каталитически неактивного Cas9 (dCas9) используют для синтетической репрессии (CRISPRi) или активации (CRISPRa) экспрессии, показывая успехи применения Cas9 для полногеномного скрининга, в том числе упорядоченных и объединенных скринингов, подходов к нокауту, которые инактивируют геномные локусы, и стратегий, с помощью которых модулируют транскрипционную активность.

Публикация Shalem et al. (2015) описывает пути, в которых слияния каталитически неактивного Cas9 (dCas9) используют для синтетической репрессии (CRISPRi) или активации (CRISPRa) экспрессии, показывая успехи применения Cas9 для полногеномного скрининга, в том числе упорядоченных и объединенных скринингов, подходов к нокауту, которые инактивируют геномные локусы, и стратегий, с помощью которых модулируют транскрипционную активность.

Xu et al. (2015) оценивали характеристики ДНК-последовательности, которые способствуют эффективности одиночной направляющей РНК (sgRNA) при скрининге на основе CRISPR. Авторы исследовали эффективность нокаута с помощью CRISPR/Cas9 и нуклеотидного предпочтения в сайте расщепления. Авторы также обнаружили, что предпочтение последовательности для CRISPRi/a значительно отличается от таковой для нокаута с помощью CRISPR/Cas9.

Parnas et al. (2015) ввели полногеномные объединенные библиотеки CRISPR-Cas9 в дендритные клетки (DC) с целью выявления генов, которые контролируют индукцию фактора некроза опухоли (Tnf) с помощью бактериального липополисахарида (LPS). Известные регуляторы передачи сигналов с участием Tlr4 и ранее неизвестные кандидаты были идентифицированы и классифицированы на три функциональных модуля с различными эффектами по отношению к классическим ответам на LPS.

Ramanan et al (2015) показали расщепление вирусной эписомальной ДНК (cccDNA) в инфицированных клетках. Геном HBV существует в ядрах инфицированных гепатоцитов в виде двухнитевых эписомальных молекул ДНК с размером 3,2 т.о., называемых ковалентно связанной кольцевой ДНК (cccDNA), которая является основным компонентов в жизненном цикле HBV, репликация которого не ингибируется при применении существующих видов терапии. Авторы показали, что sgRNA, специфично нацеливающася на высококонсервативные области HBV, устойчиво подавляет вирусную репликацию и расщепляет cccDNA.

Nishimasu et al. (2015) описали кристаллические структуры SaCas9 в комплексе с одиночной РНК (sgRNA) и ее двухнитевыми ДНК-мишенями, содержащими 5'-TTGAAT-3' PAM и 5'-TTGGGT-3' PAM. Структурное сравнение SaCas9 с SpCas9 указало как на структурную консервативность, так и на изменчивость, объясняя их различные специфичности PAM и ортологическое распознавание sgRNA.

Canver et al. (2015) продемонстрировали функциональное исследование на основе CRISPR-Cas9 некодирующих геномных элементов. Авторы разработали объединенные библиотеки направляющей РНК CRISPR-Cas9 для выполнения in situ насыщающего мутагенеза человеческих и мышиных энхансеров BCL11A, которые обнаружили критические характеристики энхансеров.

Zetsche et al. (2015) описали характеристику Cpf1, нуклеазы CRISPR класса 2 из Francisella novicida U112, с признаками, отличными от Cas9. Cpf1 представляет собой одиночную направляемую РНК эндонуклеазу, у которой отсутствует tracrRNA, которая использует мотив, смежный с протоспейсером, с высоким содержанием T и расщепляет ДНК посредством ступенчатого разрыва двухнитевой ДНК.

Shmakov et al. (2015) описали три различных системы CRISPR-Cas класса 2. Ферменты двух систем CRISPR (C2c1 и C2c3) содержат RuvC-подобные эндонуклеазные домены, отличные от Cpf1. В отличие от Cpf1, C2c1 зависит как от crRNA, так и от tracrRNA, для расщепления ДНК. Третий фермент (C2c2) содержит два предполагаемых домена с HEPN РНКазой и является tracrRNA-независимым.

Slaymaker et al. (2016) описали применение направляемого структурой конструирования белков для улучшения специфичности Cas9 (SpCas9) Streptococcus pyogenes. Авторы разработали "повышенную специфичность" вариантов SpCas9 (eSpCas9), которые сохраняли устойчивое целевое расщепление при сниженных нецелевых эффектах.

Также публикация "Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014) относится к направляемым димерной РНК нуклеазам FokI, которые распознают продленные последовательности и могут редактировать эндогенные гены с высокой эффективностью в человеческих клетках.

По отношению к общей информации о системах CRISPR-Cas, все их компоненты и способы доставки таких компонентов, включая способы, материалы, средства доставки, векторы, частицы, AAV и их получение и применение с учетом количеств и составов являются применимыми в практическом осуществлении настоящего изобретения, ссылаясь настоящим на: патенты США №№ 8697359, 8771945, 8795965, 8865406, 8871445, 8889356, 8889418, 8895308, 8906616, 8932814, 8945839, 8993233 и 8999641; публикации заявки на патент США US 2014-0310830 (заявка на патент США с регистрационным номером 14/105031), US 2014-0287938 A1 (заявка на патент США с регистрационным номером 14/213991), US 2014-0273234 A1 (заявка на патент США с регистрационным номером 14/293,674), US2014-0273232 A1 (заявка на патент США с регистрационным номером 14/290575), US 2014-0273231 (заявка на патент США с регистрационным номером 14/259420), US 2014-0256046 A1 (заявка на патент США с регистрационным номером 14/226274), US 2014-0248702 A1 (заявка на патент США с регистрационным номером 14/258458), US 2014-0242700 A1 (заявка на патент США с регистрационным номером 14/222930), US 2014-0242699 A1 (заявка на патент США с регистрационным номером 14/183512), US 2014-0242664 A1 (заявка на патент США с регистрационным номером 14/104990), US 2014-0234972 A1 (заявка на патент США с регистрационным номером 14/183471), US 2014-0227787 A1 (заявка на патент США с регистрационным номером 14/256912), US 2014-0189896 A1 (заявка на патент США с регистрационным номером 14/105035), US 2014-0186958 (заявка на патент США с регистрационным номером 14/105017), US 2014-0186919 A1 (заявка на патент США с регистрационным номером 14/104977), US 2014-0186843 A1 (заявка на патент США с регистрационным номером 14/104900), US 2014-0179770 A1 (заявка на патент США с регистрационным номером 14/104837) и US 2014-0179006 A1 (заявка на патент США с регистрационным номером 14/183486), US 2014-0170753 (заявка на патент США с регистрационным номером 14/183429); US 2015-0184139 (заявка на патент США с регистрационным номером 14/324,960); 14/054414 заявки на европейские патенты EP 2 771 468 (EP13818570.7), EP 2 764 103 (EP13824232.6) и EP 2 784 162 (EP14170383.5); и публикации заявки на патенты согласно PCT WO 2014/093661 (PCT/US2013/074743), WO 2014/093694 (PCT/US2013/074790), WO 2014/093595 (PCT/US2013/074611), WO 2014/093718 (PCT/US2013/074825), WO 2014/093709 (PCT/US2013/074812), WO 2014/093622 (PCT/US2013/074667), WO 2014/093635 (PCT/US2013/074691), WO 2014/093655 (PCT/US2013/074736), WO 2014/093712 (PCT/US2013/074819), WO 2014/093701 (PCT/US2013/074800), WO 2014/018423 (PCT/US2013/051418), WO 2014/204723 (PCT/US2014/041790), WO 2014/204724 (PCT/US2014/041800), WO 2014/204725 (PCT/US2014/041803), WO 2014/204726 (PCT/US2014/041804), WO 2014/204727 (PCT/US2014/041806), WO 2014/204728 (PCT/US2014/041808), WO 2014/204729 (PCT/US2014/041809), WO 2015/089351 (PCT/US2014/069897), WO 2015/089354 (PCT/US2014/069902), WO 2015/089364 (PCT/US2014/069925), WO 2015/089427 (PCT/US2014/070068), WO 2015/089462 (PCT/US2014/070127), WO 2015/089419 (PCT/US2014/070057), WO 2015/089465 (PCT/US2014/070135), WO 2015/089486 (PCT/US2014/070175), PCT/US2015/051691, PCT/US2015/051830. Ссылка также делается на предварительные заявки на патенты США 61/758468; 61/802174; 61/806375; 61/814263; 61/819803 и 61/828130, поданные 30 января 2013 г.; 15 марта 2013 г.; 28 марта 2013 г.; 20 апреля 2013 г.; 6 мая 2013 г. и 28 мая 2013 г. соответственно. Ссылка также делается на предварительную заявку на патент США 61/836123, поданную 17 июня 2013 г. Ссылка дополнительно делается на предварительные заявки на патенты США 61/835931, 61/835936, 61/835973, 61/836080, 61/836101 и 61/836127, каждая из которых подана 17 июня 2013 г. Дополнительно ссылаются на предварительные заявки на патенты США 61/862468 и 61/862355, поданные 5 августа 2013 г.; 61/871301, поданную 28 августа 2013 г.; 61/960777, поданную 25 сентября 2013 г., и 61/961980, поданную 28 октября 2013 г. Ссылка еще дополнительно делается на: PCT/US2014/62558, поданный 28 октября 2014 г., и предварительные заявки на патенты США с серийными номерами 61/915148, 61/915150, 61/915153, 61/915203, 61/915251, 61/915301, 61/915267, 61/915260 и 61/915397, каждая из которых подана 12 декабря 2013 г.; 61/757972 и 61/768959, поданные 29 января 2013 г. и 25 февраля 2013 г.; 62/010888 и 62/010879, каждая из которых подана 11 июня 2014 г.; 62/010329, 62/010439 и 62/010441, каждая из которых подана 10 июня 2014 г.; 61/939228 и 61/939242, каждая из которых подана 12 февраля 2014 г.; 61/980012, поданная 15 апреля 2014 г.; 62/038358, поданная 17 августа 2014 г.; 62/055484, 62/055460 и 62/055487, каждая из которых подана 25 сентября 2014 г.; и 62/069243, поданная 27 октября 2014 г. Ссылаются на заявку согласно PCT, в которой, помимо прочих, указаны Соединенные Штаты Америки, заявку под № PCT/US14/41806, поданную 10 июня 2014 г. Ссылаются на предварительную заявку на патент США 61/930214, поданную 22 января 2014 г. Ссылаются на заявку согласно PCT, в которой, помимо прочих, указаны Соединенные Штаты Америки, заявку под № PCT/US14/41806, поданную 10 июня 2014 г.

Также упоминается заявка на патент США 62/180709, поданная 17 июня 2015 г., PROTECTED GUIDE RNAS (PGRNAS); заявка на патент США 62/091455, поданная 12 декабря 2014 г., PROTECTED GUIDE RNAS (PGRNAS); заявка на патент США 62/096708, поданная 24 декабря 2014 г., PROTECTED GUIDE RNAS (PGRNAS); заявки на патент США 62/091462, поданная 12 декабря 2014 г., 62/096324, поданная 23 декабря 2014 г., 62/180681, поданная 17 июня 2015 г., и 62/237496, поданная 5 октября 2015 г., DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; заявки на патент США 62/091456, поданная 12 декабря 2014 г. и 62/180692, поданная 17 июня 2015 г., ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS; заявки на патент США 62/091461, поданная 12 декабря 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS (HSC); заявка на патент США 62/094903, поданная 19 декабря 2014 г., UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING; заявка на патент США 62/096761, поданная 24 декабря 2014 г., ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION; заявка на патент США 62/098059, поданная 30 декабря 2014 г., 62/181641, поданная 18 июня 2015 г., и 62/181667, поданная 18 июня 2015 г., RNA-TARGETING SYSTEM; заявка на патент США 62/096656, поданная 24 декабря 2014 г., и 62/181151, поданная 17 июня 2015 г., CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS; заявка на патент США 62/096697, поданная 24 декабря 2014 г., CRISPR HAVING OR ASSOCIATED WITH AAV; заявка на патент США 62/098158, поданная 30 декабря 2014 г., ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS; заявка на патент США 62/151052, поданная 22 апреля 2015 г., CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING; заявка на патент США 62/054490, поданная 24 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS; заявка на патент США 61/939154, поданная 12 февраля 2014 г., SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/055484, поданная 25 сентября 2014 г., SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/087537, поданная 4 декабря 2014 г., SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/054651, поданная 24 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; заявка на патент США 62/067886, поданная 23 октября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; заявки на патент США 62/054675, поданная 24 сентября 2014 г., и 62/181002, поданная 17 июня 2015 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES; заявка на патент США 62/054528, поданная 24 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS; заявка на патент США 62/055454, поданная 25 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES (CPP); заявка на патент США 62/055460, поданная 25 сентября 2014 г., MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; заявка на патент США 62/087475, поданная 4 декабря 2014 г., и 62/181690, поданная 18 июня 2015 г., FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/055487, поданная 25 сентября 2014 г., FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявки на патент США 62/087546, поданная 4 декабря 2014 г., и 62/181687, поданная 18 июня 2015 г., MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; и заявка на патент США 62/098285, поданная 30 декабря 2014 г., CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS.

Упоминаются заявки на патенты США 62/181659, поданная 18 июня 2015 г., и 62/207318, поданная 19 августа 2015 г., ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS, ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION. Упоминаются заявки на патенты США 62/181663, поданная 18 июня 2015 г., и 62/245264, поданная 22 октября 2015 г., NOVEL CRISPR ENZYMES AND SYSTEMS, заявки на патенты США 62/181675, поданные 18 июня 2015 г., 62/285349, поданная 22 октября 2015 г., 62/296522, поданная 17 февраля 2016 г., и 62/320231, поданная 8 апреля 2016 г., NOVEL CRISPR ENZYMES AND SYSTEMS, заявка на патент США 62/232067, поданная 24 сентября 2015 г., заявка на патент США, поданная 14/975085, 18 декабря 2015 г., европейская заявка на патент №16150428.7, заявка на патент США 62/205733, поданная 16 августа 2015 г., заявка на патент США 62/201542, поданная 5 августа 2015 г., заявка на патент США 62/193507, поданная 16 июля 2015 г., и заявка на патент США 62/181739, поданная 18 июня 2015 г., каждая из которых имеет название NOVEL CRISPR ENZYMES AND SYSTEMS, и заявка на патент США 62/245270, поданная 22 октября 2015 г., NOVEL CRISPR ENZYMES AND SYSTEMS. Также упоминается заявка на патент США 61/939256, поданная 12 февраля 2014 г., и WO 2015/089473 (PCT/US2014/070152), поданная 12 декабря 2014 г., каждая из которых имеет название ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION. Также упоминается PCT/US2015/045504, поданная 15 августа 2015 г., заявка на патент США 62/180699, поданная 17 июня 2015 г., и заявка на патент США 62/038358, поданная 17 августа 2014 г., каждая из которых имеет название GENOME EDITING USING CAS9 NICKASES.

Каждое из данных патентов, публикаций патентов и заявок, а также все документы, цитируемые в них или во время их рассмотрения ("документы, цитируемые в заявке"), и все документы, цитируемые или упомянутые в документах, цитируемых в заявке, вместе с любыми инструкциями, описаниями, характеристиками продукта и технологическими картами для любых продуктов, упомянутыми в них или в любом документе, упомянутом в них и включенном с помощью ссылки в данный документ, настоящим включены в данный документ с помощью ссылки и могут быть использованы в практическом осуществлении настоящего изобретения. Все документы (например, данные патенты, публикации патентов и заявки, а также цитируемые в заявках документы) включены в данный документ посредством ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен посредством ссылки.

Кроме того, упоминается заявка согласно PCT PCT/US14/70057, ссылка на номер дела у патентного поверенного 47627.99.2060 и BI-2013/107, под названием "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS" (заявляется приоритет по одной или нескольких или всех из предварительных заявок на патент США: 62/054490, поданной 24 сентября 2014 г.; 62/010441, поданной 10 июня 2014 г.; и 61/915118, 61/915215 и 61/915148, каждая из которых подана 12 декабря 2013 г.) ("the Particle Delivery PCT"), включенная в данный документ посредством ссылки, в отношении способа получения комплекса sgRNA-и-белок Cas9, содержащего частицу, включающего добавление смеси, содержащей sgRNA и белок Cas9 (и необязательно матрицу для HDR) к смеси, содержащей, состоящей главным образом из или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта; и частицы из такого способа. Например, где белок Cas9 и sgRNA смешивали вместе при подходящем молярном соотношении, например, 3:1-1:3, или 2:1-1:2, или 1:1, при подходящей температуре, например, 15-30°C, например, 20-25°C, например, комнатной температуре, в течение подходящего периода времени, например, 15-45, как, например, 30 минут, преимущественно в стерильном буфере без нуклеаз, например, 1X PBS. В отдельности, компоненты частиц, такие как или включающие поверхностно-активное вещество, например, катионный липид, например, 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); фосфолипид, например, димиристоилфосфатидилхолин (DMPC); биоразлагаемый полимер, такой как полимер этиленгликоля или PEG, и липопротеин, такой как липопротеин низкой плотности, например, холестерин, растворяли в спирте, преимущественно C1-6алкиловом спирте, таком как метанол, этанол, изопропанол, например, 100% этанол. Два раствора смешивали вместе с образованием частиц, содержащих комплексы Cas9-sgRNA. Соответственно, можно обеспечивать предварительное образование комплекса sgRNA с белком Cas9 перед составлением целого комплекса в частице. Составы можно получать с различным молярным соотношением различных компонентов, известных как способствующие доставке нуклеиновой кислоты в клетки (например, 1,2-диолеоил-3-триметиламмоний-пропан (DOTAP), 1,2-дитетрадеканоил-sn-глицеро-3-фосфохолин (DMPC), полиэтиленгликоль (PEG) и холестерин). Например, молярные соотношения DOTAP: DMPC: PEG: холестерин могут быть следующими: DOTAP 100, DMPC 0, PEG 0, холестерин 0; или DOTAP 90, DMPC 0, PEG 10, холестерин 0; или DOTAP 90, DMPC 0, PEG 5, холестерин 5. DOTAP 100, DMPC 0, PEG 0, холестерин 0. Данная заявка, соответственно, охватывает смешивание sgRNA, белка Cas9 и компонентов, которые образуют частицу; а также частицы, полученные в результате такого добавления. Аспекты настоящего изобретения могут охватывать частицы; например, частицы с применением способа, аналогичного таковому в "Particle Delivery PCT", например, путем добавления смеси, содержащей sgRNA и/или Cas9, как в настоящем изобретении, и компоненты, которые образуют частицу, например, как в "Particle Delivery PCT", с образованием частицы и частиц в результате такого смешивания (или, конечно же, другие частицы, содержащие sgRNA и/или Cas9, как в настоящем изобретении).

Настоящее изобретение далее будет дополнительно описано с помощью следующих неограничивающих примеров.

Примеры

Следующие примеры служат для иллюстрации настоящего изобретения, описанного в данном документе. Также следует понимать, что научное обоснование, описанное ниже, которое послужило причиной исследований, не следует ограничивать объектом изобретения, заявляемым любым способом, или накладывать какое-либо механистическое или другое требование.

Научное обоснование

Без привязки к какой-либо теории, описанной в данном документе, авторы настоящего изобретения изобрели стратегию модификации Cas9 (SpCas9) Streptococcus pyogenes для получения модифицированных вариантов фермента SpCas9, которые характеризуется целевой специфичностью. То же самое обоснование может быть применимо к любому ортологу Cas9. Эта повышенная специфичность может быть достигнута в вариантах, которые характеризовались сниженной активностью по отношению к не подвергаемым нацеливанию (нецелевым) локусам, но в то же время сохраняли соответствующую активность по отношению к предполагаемому целевому локусу. Активность в анализах, описанных ниже, связанная с нуклеазной активностью, проявляется по расщеплению ДНК, что измеряется при образовании ВСТАВОК/ДЕЛЕЦИЙ. Предполагается, что такая активность связана со способностью комплекса CRISPR (другими словами, комплекса между ферментом Cas9 и направляющей РНК) связываться с соответствующим сайтом на ДНК. Таким образом, можно ожидать, что снижение активности в отношении не подвергаемого нацеливанию сайта, происходит в результате сниженного связывания комплекса CRISPR в этом сайте. Модифицированные ферменты Cas9, которые характеризуются сниженной активностью в отношении не подвергаемых нацеливанию локусов по сравнению с немодифицированными (например, дикого типа) ферментами, таким образом, могут связываться хуже с нецелевыми сайтами. Публикация Nishimasu et al. (Cell, 2014, 156(5), pp. 935-49) описывает кристаллическую структуру при разрешении 2,5Å вариантного фермента SpCas9 в комплексе с одиночной направляющей РНК (sgRNA), имеющей длину 98 нуклеотидов, и участком целевой ДНК, имеющим длину 23 нуклеотида. На основании этих структурных данных авторы настоящего изобретения идентифицировали положительно-заряженную область, расположенную между доменами RuvC-III и HNH. Авторы сделали заключение, что бороздка может приспосабливать не подвергаемую нацеливанию нить после нарушения нормального спаривания оснований по Уотсону и Крику при связывании фермента Cas9 с соответствующим участком ДНК. Положительно заряженные остатки этой области Cas9 могут функционировать для стабилизации взаимодействия между ферментом и ДНК в результате взаимодействия с отрицательно зараженным фосфодиэфирным остовом не подвергаемой нацеливанию нити ДНК. Авторы настоящего изобретения выдвигают гипотезу о том, что в результате замещения положительно заряженных остатков Cas9 взаимодействия с не подвергаемой нацеливанию нитью могут быть нарушены. Достаточное нарушение этого взаимодействия может сохранять соответствующую активность по отношению к целевым сайтам, однако снижать активность фермента по отношению к не подвергаемым нацеливанию сайтам (который, как обычно будет ожидаться, характеризуется более слабыми взаимодействиями с направляющей последовательностью за счет одного или нескольких ошибочно спаренных оснований по сравнению с целевой последовательностью). Авторы настоящего изобретения неожиданным образом обнаружили, что модификация Cas9 может действительно снижать нецелевую активность. См. также фигуру 1, и ее описание в данном документе.

Дополнительно к открытию того, что замена положительно заряженных остатков нарушает взаимодействия остова ДНК и приводит к сниженной активности фермента по отношению к не подвергаемым нацеливанию сайтам, при этом сохраняется соответствующая активность по отношению к целевым сайтам, упоминается публикация Kleinstiver BP et al. Авторы описывают вариант с тройной заменой (R661A/Q695A/Q926A) и вариант с четверной заменой (N497A/R661A/Q695A/Q926A) SpCas9, содержащие мутации в домене REC1. Замены включают остатки, которые сконструированы с целью разрыва водородных связей в фосфатном остове ДНК, и мутанты, как описано, имеют высокую целевую активность и минимальную нецелевую активность. (см., Kleinstiver BP et al., High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 2016 Jan 28;529(7587):490-5. doi: 10.1038/nature16526. Epub от 6 января 2016 г.

Кроме того, авторы настоящего изобретения выдвигают гипотезу о том, что может быть выполнена модификация аминокислотных остатков фермента CRISPR, которая может оказывать влияние на повышение стабильности взаимодействия между ферментом и не подвергаемой нацеливанию нитью после нарушения нормального спаривания основания по Уотсону и Крику при связывании фермента Cas9 с соответствующим участком ДНК. Например, замена положительно заряженной аминокислотой аминокислотного остатка, который в немодифицированном ферменте не заряжен положительно, может оказывать эффект стабилизации взаимодействия между ферментом и не подвергаемой нацеливанию нитью в результате повышения суммарного положительного заряда фермента. Таким образом, предполагается, что более высокий суммарный положительный заряд в соответствующих областях фермента обеспечивает более сильное взаимодействие с отрицательно заряженным фосфодиэфирным остовом не подвергаемой нацеливаню нити ДНК. Аминокислоты, которые в немодифицированном ферменте не являются положительно заряженными, могут представлять собой, например, аминокислоты, которые нейтрально заряжены, отрицательно заряжены, гидрофобные и т.д. Такие аминокислоты могут быть замещены положительно заряженной аминокислотой для достижения желаемого эффекта. Вышеописанные функциональные эффекты основаны на сложных и взаимосвязанных электростатических и термодинамических положениях. Таким образом, предполагается, что вышеописанные функциональные эффекты можно комбинировать. Таким образом, фермент CRISPR может быть модифицирован таким образом, что повышается активность фермента по отношению к мишени, а также снижается активность по отношению к одной или несколькими нецелевым элементам. Например, предполагается, что могут быть выполнены модификации, которые способствуют повышенной целевой активности, в то же время могут быть выполнены модификации которые снижают нецелевую активность. Таким образом, могут быть получены синергические эффекты.

Предполагается, что любой из функциональных эффектов, описанных выше, может быть достигнут с помощью модификации аминокислот в вышеупомянутой бороздке, однако также с помощью модификации аминокислот вблизи бороздки или за ее пределами.

Пример 1. - Материалы и способы

Получение мутантов SpCas9

Хотя это должно быть очевидно из полного контекста настоящего изобретения, аббревиатура "SpCas9" обозначает Cas9 Streptococcus pyogenes, а аббревиатура "SaCas9" обозначает Cas9 Staphyloccocus aureus. Модифицированные варианты SpCas9 и SaCas9, например, модифицированные аланиновые варианты, создавали с помощью мутагенеза на основе ПЦР с применением известных методик. Другие методики могут включать получение молекулы нуклеиновой кислоты, кодирующей Cas9, но при этом изменен(изменены) соответствующий(соответствующие) кодон(кодоны), ответственный(ответственные) за мутацию(мутации) или модификацию(модификации) белка, чтобы экспрессировался модифицированный или мутированный Cas9, например, с помощью векторной системы экспрессии, такой как бактериальная система экспрессии или система экспрессии на основе вирусного вектора. Затем модифицированный или мутированный Cas9, экспрессированный таким образом, можно легко очистить. Модифицированные или мутированные Cas9 по настоящему изобретению можно применять в системах CRISPR-Cas и в любом применении систем CRISPR-Cas; и предпочтительно они имеют преимущество, заключающееся в сниженных, или практически отсутствующих, или, по сути, отсутствующих, или отсутствующих нецелевых эффектах и/или повышенных целевых эффектах. В соответствии с этим, Cas9 по настоящему изобретению или систему CRISPR-Cas по настоящему изобретению с Cas9 по настоящему изобретению можно доставлять с помощью системы доставки, которая может представлять собой один или несколько векторов, включая обсуждаемый в данном документе.)

Система для тестирования активности модифицированных Cas9

Модифицированные ферменты Cas9 тестировали с помощью совместной трансфекции плазмиды, кодирующей мутантный Cas9, и плазмиды, кодирующей sgRNA (только целевую), в клетки HEK293T или HEK293FT. Клетки трансфицировали при конфлюэнтности 90-95% с применением Lipofectamine 2000, выращивали при 37°C и 5% CO2 в течение примерно 72 ч. и собирали. Целевые и нецелевые локусы генома амплифицировали с помощью ПЦР и анализировали с применением секвенирования нового поколения (NGS). % вставок/делеций для целевых и нецелевых локусов рассчитывали исходя из данных секвенирования. Мутантов SpCas9 тестировали с локусами генома, показанными в таблице A. Мутантов SaCas9 тестировали с помощью NGS с применением направляющей EMX101 и OT1 - OT3 из Ran at al., 2015. Биохимические анализы или анализы с использованием нуклеазы SURVEYOR не проводили (все данные получены на основании NGS; ср.. Sidi-Chen, "Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis," Cell 160(6): 1246-1260, DOI: http://dx.doi.org/10.1016/j.cell.2015.02.038, 12 March 2015).

Анализ вставок/делеций

Анализы вставок/делеций проводили с помощью нацеленного глубокого секвенирования и анализировали, как описано ранее (Hsu, P. D. et al. (2013) DNA targeting specificity of RNA-guided Cas9 nucleases. Nat. Biotechnol. 31, 827-832). Клетки собирали через примерно 3 дня после трансфекции. Геномную ДНК экстрагировали с применением набора для экстракции ДНК QuickExtract (Epicentre) путем ресуспендирования осажденных клеток в QuickExtract (80 мкл на лунку в 24-луночном планшете или 20 мкл на лунку в 96-луночном планшете), с последующей инкубацией при 65°C в течение 15 мин., 68°C в течение 15 мин. и 98°C в течение 10-15 мин. ПЦР-фрагменты для NGS-анализа получали в реакциях двухстадийной ПЦР. Вкратце, праймеры c ПЦР-основами для второго раунда амплификации применяли для амплификации представляющих интерес участков генома (таблица 2), с последующим применением способа ПЦР с перекрывающимися праймерами для прикрепления адапторов Illumina P5, а также уникальных специфичных для образца штрихкодов к продукту первого раунда ПЦР.

Пример 2. - Первоначальный анализ SpCas9 c одиночными мутациями (целевые последовательности EMX1 и VEGFA).

49 первоначальных SpCas9 с одиночными точечными мутациями получали и тестировали в отношении образования вставок/делеций. Целевые последовательности в данном примере представляли собой последовательности из генов EMX1 и VEGFA. Как целевые, так и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны жирным шрифтом и подчеркнуты. Результаты показаны на фигурах 2A и 2B.

Для следующих мутантов показана сниженная активность в отношении нецелевых сайтов по сравнению с ферментом дикого типа (см. фигуры 2A и 2B).

R63A

H415A

H447A

R778A

R780A

Q807A

K810A

R832A

K848A

K855A

K968A

R976A

H982A

K1000A

K1003A

K1047A

R1060A

K1107A

R1114A

K1118A

K1200A

Пример 3. - Дальнейший анализ SpCas9 с одиночными мутациями

Несколько модифицированных ферментов SpCas9 с одиночными точечными мутациями, идентифицированных в примере 2, дополнительно тестировали в отношении образования вставок/делеций с помощью третьей направляющей последовательности и дополнительных нецелевых локусов. Целевые и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны подчеркиванием и жирным шрифтом. Результаты показаны на фигуре 3. Модифицированные ферменты SpCas9, протестированные в данном примере, были следующими:

R780A

K810A

K848A

K855A

R976A

H982A

K1003A

R1060A

Как показано на фигуре 3, для всех восьми модифицированных ферментов показана сниженная активность в отношении нецелевых сайтов по сравнению с немодифицированным (дикого типа) ферментом (SpCas9).

Пример 4. - Дальнейший анализ SpCas9 с одиночными мутациями (целевая последовательность VEGFA1).

Несколько модифицированных ферментов SpCas9 с одиночными точечными мутациями, включая мутантов, описанных в примере 2, тестировали в отношении образования вставок/делеций для второй отличающейся целевой последовательности, в данном случае VEGFA1 представляет собой последовательность гена VEGFA. Модифицированные ферменты SpCas9, протестированные в данном примере, были следующими:

R780A

K810A

K848A

K855A

R976A

H982A

K1003A

R1060A

H1240A

H1311A

Целевые и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны подчеркиванием и жирным шрифтом. Результаты показаны на фигуре 3.

Пример 5. - Анализ комбинационных мутантов SpCas9

Двадцать четыре модифицированных фермента SpCas9 с двойными точечными мутациями и 14 модифицированных ферментов с тройными точечными мутациями получали и тестировали в отношении образования вставок/делеций для двух отличающихся целевых последовательностей, в данном случае последовательностей генов EMX1 и VEGFA (VEGFA3 представляет собой последовательность в VEGFA). Целевые и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны жирным шрифтом и подчеркнуты. Протестированные мутанты и результаты показаны на фигурах 4 и 5; звездочка на фигурах 4 и 5 указывает на вариант осуществления, который в настоящем изобретении считается преимущественным. Как показано на фигурах 4 и 5, для всех мутантов показано значительное снижение активности в отношении нецелевых локусов OT 46, OT4 и OT18 по сравнению с ферментом дикого типа. Для нескольких комбинационных мутантов дополнительно показано снижение активности в отношении всех четырех нецелевых локусов, при этом с сохранением целевой активности, аналогичной WT; они представляли собой следующие.

Мутант Остаток Остаток Остаток
1 K810A K848A
2 K848A K855A
3 R780A K1003A
4 K810A K1003A
5 R780A R1060A
6 K810A R1060A
7 K855A R1060A
8 H982A K1003A K1129E
9 R780A K1003A R1060A
10 K810A K1003A R1060A
11 K848A K1003A R1060A
12 K855A K1003A R1060A
13 K855A K1003A E610G

Таблица A. Направляющие для SpCas9 (целевые и нецелевые локусы для SpCas9; красным цветом указаны несовпадения в нецелевых последовательностях; вертикальная линия | указывает на сайт разреза SpCas9; нецелевые последовательности исключаются с помощью мутации/модификации по настоящему изобретению)

Таблица B. Описанные мутации в SpCas9 (процитированные документы включены посредством ссылки; сохраняется право в явной форме отказаться от любой из этих мутаций отдельно, и, следует обратить внимание, что ни для одной из известных мутаций не раскрыто или не высказано предположение, касающееся получения сниженного нецелевого эффекта и/или повышенной способности модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом, при этом оговаривается, что K1107A, KES GG и KES KG у Anders et al. могут обеспечивать специфичность в отношении несовпадений в положениях 1 и 2 sgRNA, НО за счет умеренно сниженной эффективности целевого разрезания, и они также не приводят более подробное описание характеристик специфичности, так что общее утверждение, что эти известные мутанты не являются раскрытыми или предполагаемыми, при этом настоящее изобретение остается действительным; и, оговаривается, что настоящее изобретение может включать любую мутацию/модификацию из таблицы, приведенной ниже, в сочетании с модификацией/мутацией, которая обеспечивает сниженный нецелевой эффект при условии, что добавление одной или нескольких из мутаций/модификаций, приведенных ниже, не оказывает неблагоприятного влияния на эффект, обеспечивающий сниженную способность модифицировать нецелевые локусы и/или повышенную способность модифицировать один или несколько целевых локусов, достигаемый в настоящем изобретении):

Пример 6. - Анализ дополнительных мутантов SpCas9 (целевая последовательность VEGFA3)

Получали несколько дополнительных модифицированных ферментов SpCas9 с одиночными точечными мутациями и тестировали их в отношении образования вставок/делеций с применением целевой последовательности VEGFA3, которая представляет собой последовательность гена VEGFA. Модифицированные ферменты SpCas9, протестированные в данном примере, были такими, как показано ниже:

Мутант Остаток
1 R403A
2 R63A
3 K782A
4 K890A
5 K1107A
6 R778A
7 K1200A
8 K1114A
9 K1118A
10 K890A
11 H415A

Как показано на фигуре 2, для нескольких мутантов показано значительное снижение активности в отношении обоих нецелевых локусов OT1 и OT4 по сравнению с ферментом дикого типа. Для нескольких мутантов дополнительно показано снижение активности в отношении всех трех нецелевых локусов по сравнению с ферментом дикого типа, они представляли собой следующее:

Мутант Остаток
1 R403A
2 R63A
3 K782A
5 K1107A
6 R778A
7 K1200A
11 H415A

Пример 7. - Анализ мутантов SaCas9 (целевая последовательность EMX101)

Получали несколько модифицированных ферментов SaCas9 с одиночными точечными мутациями и тестировали их в отношении образования вставок/делеций с применением целевой последовательности, которая представляет собой последовательность из гена EMX101. Целевые и нецелевые последовательности показаны в таблице C ниже, с указанием последовательности PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны жирным шрифтом и подчеркнуты. Модифицированные ферменты SaCas9, протестированные в данном примере, представляли собой аланиновых мутантов, показанных ниже:

K518A

K523A

K525A

H557A

R561A

K572A

R686A

K687A

K692A

R694A

H700A

K751A

Как показано на фигуре 6, для нескольких мутантов показано значительное снижение активности в отношении обоих нецелевых последовательностей OT2 и OT3 по сравнению с ферментом дикого типа. Для нескольких мутантов дополнительно показано снижение активности в отношении всех трех нецелевых локусов по сравнению с ферментом дикого типа, они представляли собой следующее:

K523A

K525A

R561A

K572A

R694A

H700A

Таблица C. Информация о последовательностях, включая PAM, для направляющих, применяемых для валидации мутаций SaCas9 (красным цветом указаны несовпадения в нецелевых последовательностях; нецелевые последовательности исключаются с помощью мутации/модификации по настоящему изобретению)

На фигуре 7 представлены дополнительные данные, касающиеся следующих мутантов SaCas9, раскрытых в данном документе.

Мутант Остаток
1 R245A
2 R480A
3 R497A
4 R499A
5 R617A
6 R630A
7 R634A
8 R644A
9 R650A
10 R654A
11 K736A

Мутанты R245A, R480A, R499A, R650A и R654A были эффективными в отношении снижения нецелевых эффектов, при этом R480A, R499A и R245A были особенно эффективными.

Пример 8. - Перечень модифицированных ферментов Cas9

Что касается SpCas9, одиночные и комбинационные мутанты, перечисленные в данном документе, включая вышеупомянутые примеры, на данный момент считаются преимущественными, поскольку продемонстрировали предпочтительное улучшение специфичности. Мутанты SpCas9 и SaCas9, включая протестированные и иным образом упомянутые в настоящем изобретении, перечислены ниже в таблицах 1-7.

Таблица 1. - Перечень четверных мутантов SpCas9

Мутант Остаток Остаток Остаток Остаток
QM1 R63A K855A R1060A E610G
QM2 R63A H982A K1003A K1129E
QM3 R63A K810A K1003A R1060A

Таблица 2. - Перечень одиночных мутантов SpCas9

Мутант Остаток и
замена
1 R63A
2 H415A
3 H447A
4 R778A
5 R780A
6 R783A
7 Q807A
8 K810A
9 R832A
10 K848A
11 K855A
12 K968A
13 R976A
14 H982A
15 K1000A
16 K1003A
17 K1047A
18 R1060A
19 K1107A
20 R1114A
21 K1118A
22 R403A
23 K1200A

Таблица 3. - Перечень двойных и тройных мутантов SpCas9

Мутант Остаток и замена
1 R780A R1060A
2 R780A K1003A
3 K810A K848A
4 K810A K855A
5 K848A K855A
6 K855A R1060A
7 R780A K1003A R1060A
8 K855A K1003A R1060A
9 H982A K1003A K1129E
10 K810A K1003A R1060A

Таблица 4. - Перечень одиночных мутантов SaCas9

Мутант Остаток
1 H700
2 R694
3 K692
4 R686
5 K687
6 K751
7 R561
8 H557
9 K572
10 K523
11 K518
12 K525

Таблица 5. - Перечень одиночных мутантов SaCas9

Мутант Остаток
2 R245
3 R480
4 R497
5 R499
6 R617
7 R630
8 R634
9 R644
10 R650
11 R654
12 K736

Типичные примеры мутантов SpCas9 перечислены в таблице 6 ниже.

Таблица 6. - Перечень одиночных мутантов SpCas9

Мутант Остаток и
замена
1 N14K
2 N776L
3 E781L
4 E809K
5 L813R
6 S845K
7 L847R
8 D849A
9 I852K
10 D859A
11 S964K
12 V975K
13 E977K
14 N978K

В таблице 7 ниже представлены мутанты, приведенные в качестве примера в настоящем изобретении, включая упомянутые в примерах.

Таблица 7. Типичные мутанты в рамках настоящего изобретения
Одиночные мутанты
Мутант Остаток Участок Мутант Остаток Участок
SM1 K775A Бороздка SM32 K1107A PL
SM2 R780A Бороздка SM33 E1108A PL
SM3 R780A Бороздка SM34 S1109A PL
SM4 K810A Бороздка SM35 ΔK1107 PL
SM5 R832A Бороздка SM36 ΔE1108 PL
SM6 K848A Бороздка SM37 ΔS1109 PL
SM7 K855A Бороздка SM38 ES_G PL
SM8 R859A Бороздка SM39 KES_GG PL
SM9 K862A Бороздка SM40 R778A DNA
SM10 K866A Бороздка SM41 K782A DNA
SM11 K961A Бороздка SM42 R783A DNA
SM12 K968A Бороздка SM43 K789A DNA
SM13 K974A Бороздка SM44 K797A DNA
SM14 R976A Бороздка SM45 K890A DNA
SM15 H982A Бороздка SM46 R1114A cDNA
SM16 H983A Бороздка SM47 K1118A cDNA
SM17 K1014A Бороздка SM48 K1200A cDNA
SM18 K1047A Бороздка SM49 R63A sgRNA
SM19 K1059A Бороздка SM50 K163A sgRNA
SM20 R1060A Бороздка SM51 R165A sgRNA
SM21 K1003A Бороздка SM52 R403A sgRNA
SM22 H1240A Бороздка SM53 H415A sgRNA
SM23 K1244A Бороздка SM54 R447A sgRNA
SM24 K1289A Бороздка SM55 K1000A Бороздка
SM25 K1296A Бороздка
SM26 H1297A Бороздка
SM27 R1298A Бороздка
SM28 K1300A Бороздка
SM29 R1303A Бороздка
SM30 H1311A Бороздка
SM31 K1325A Бороздка

Тройные мутанты

Пример 9. - Модификация Cas9 для усиления целевой активности

Изначально изобретатели осуществили модификации в отношении незаряженных аминокислот, расположенных в бороздке между доменами RuvC-III и HNH SpCas9. Аминокислоты, подлежащие модифицированию, включали аминокислоты с незаряженными боковыми цепями, включая серин, треонин, аспарагин и глутамин. Некоторые аминокислоты изменяли на положительно заряженные аминокислоты, такие как аргинин или лизин. Эффект таких изменений одиночных аминокислот в SpCas9 в отношении образования вставок/делеций в целевых локусах оценивали с помощью секвенирования нового поколения, как описано выше. Отбирали предпочтительные мутации с повышенной/усиленной целевой активностью по сравнению с немодифицированным ферментом. Изобретатели оценивали двойные и тройные мутации, описываемые выше. Отбирали особенно предпочтительные мутации с усиленной целевой активностью.

Изобретатели оценивали такие мутации в SaCas9 так же, как описано для SpCas9. Отбирали особенно предпочтительные мутации с усиленной целевой активностью.

Изобретатели расширили зону модификаций на незаряженные аминокислоты, расположенные вблизи бороздки между доменами RuvC-III и HNH SpCas9 и за ее пределами. И в этом случае эффект этих изменений в отношении образования вставок/делеций в целевых локусах оценивали с помощью анализа с использованием нуклеазы SURVEYOR, как описано выше. Отбирали предпочтительные мутации с повышенной/усиленной целевой активностью по сравнению с немодифицированным ферментом. Аналогичные анализы проводили для SaCas9.

Изобретатели комбинировали мутации SpCas9, которые демонстрировали усиленную целевую активность, с мутациями, которые демонстрировали сниженную нецелевую активность. И в этом случае эффект этих изменений в отношении образования вставок/делеций в целевых локусах оценивали с помощью анализа с использованием нуклеазы SURVEYOR, как описано выше. Отбирали особенно предпочтительные мутации с повышенной/усиленной целевой активностью и сниженной нецелевой активностью по сравнению с немодифицированным ферментом. Аналогичные анализы проводили для SpCas9.

Пример 10. - Анализ мутантов SpCas9 (множественные целевые последовательности)

Три мутанта, K855A (одиночная мутация), а также TM14 и TM15 (оба тройных мутанта), тестировали в отношении образования вставок/делеций с применением целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. Как показано на фигуре 10, для всех трех мутантов показана активность в отношении мишени и низкая нецелевая активность в отношении OT4.

Расширенную группу из одиночных, двойных и тройных мутантов тестировали в отношении образования вставок/делеций с применением целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. Мутанты включали E779L, R780A, K810A, K848A, K855A, R976A, H982A, DM11, DM17, DM19, DM20, DM23, DM24, DM25, DM35, DM40, TM14, TM15 и TM16. На фигуре 11 обобщена активность в отношении целевой последовательности и нецелевая активность в отношении OT4. Таким образом, наблюдалось снижение активности в отношении почти всех оцененных нецелевых локусов генома, а также в отношении обширной панели несовпадающих направляющих.

Пример 11. - Анализ мутантов SpCas9 (целевая последовательность VEGFA3 и нецелевые последовательности)

Получали несколько мутантных модифицированных ферментов SpCas9 и тестировали их в отношении образования вставок/делеций с применением целевой последовательности, которая представляет собой последовательность из гена VEGFA3. Модифицированные ферменты SpCas9, протестированные в данном примере, включали:

R780A

K848A

K1000A

K848A R1060A

R780A R1114A

H982A K1003A R1060A

R63A K848A R1060A

R63A K855A R1060A E610G

K1107A

T13I R63A K810A

R63A K855A

R63A H982A

G12D R63A R1060A

H415A K848A

H415A K848A

R780A R1114A

K848A K1107A

K848A E1108A

S1109A

R63A E610G K855A R1060A

R63A K848A R1060A

Как показано на фигурах 12 и 13, для нескольких мутантов показано значительное снижение активности в отношении одного или нескольких из трех нецелевых локусов OT1, OT4 и OT18 по сравнению с ферментом дикого типа. Для нескольких мутантов дополнительно показано снижение активности в отношении всех трех нецелевых локусов по сравнению с ферментом дикого типа. Они включали:

R780A R1114A

H982A K1003A K1129E

R63A K855A R1060A E610G

K1107A

R63A K855A

R63A H982A

K848A K1107A

R63A E610G K855A R1060A

R63A K848A R1060A

Пример 12. - Анализ мутантов SpCas9 (целевая последовательность EMX1.3 и нецелевые последовательности)

Несколько мутантных модифицированных ферментов SpCas9 тестировали в отношении образования вставок/делеций с применением целевой последовательности, которая представляет собой последовательность EMX1.3. Модифицированные ферменты SpCas9, протестированные в данном примере, включали:

N14K

E779L

E809K

L813R

S845K

L847R

D849A

D861K

E977K

I978K

N979L

N980K

Как показано на фигуре 14, для определенных мутантов показана высокая целевая активность, а среди них отличия в специфичности относительно нецелевых последовательностей OT14, OT23, OT35, OT46 и OT53. Для определенных мутантов продемонстрирована более высокая специфичность, чем у дикого типа, для других продемонстрирована высокая активность в отношении нецелевых последовательностей.

Пример 13. - Анализ мутантов SpCas9 (целевая последовательность EMX1.3)

Несколько мутантных модифицированных ферментов SpCas9 тестировали в отношении образования вставок/делеций с применением направляющих с несовпадениями, причем целевая последовательность представляет собой последовательность EMX1.3. Три модифицированных фермента SpCas9, протестированные в данном примере, включали:

K855A

K810A, K1003A, R1060A

K848A, K1003A, R1060A

Результаты показаны на фигуре 15.

Пример 14. - Усиленные мутанты Cas9 характеризуются высокой активностью и специфичностью

У шести из 29 точечных мутантов нецелевая активность снижалась по меньшей мере в 10 раз по сравнению с SpCas9 дикого типа (WT), при этом сохранялась эффективность целевого расщепления, а у 6 других специфичность улучшалась в 2-5 раз. У этих мутантов также проявлялась усиленная специфичность при тестировании на втором локусе, VEGFA(1) (фиг. 15D). Хотя некоторые точечные мутанты были более специфичными, чем SpCas9 WT при нацеливании на EMX1(1) и VEGFA(1), нецелевые вставки/делеции все еще обнаруживались (~0,1%) (фиг. 15D). Для дальнейшего улучшения специфичности заявители осуществляли комбинационный мутагенез с применением лучших точечных мутантов, идентифицированных в ходе первоначального скрининга. Восемь из 35 комбинационных мутантов сохраняли целевую активность, присущую дикому типу, и демонстрировали необнаруживаемые уровни нецелевых вставок/делеций в EMX1(1) OT1, VEGFA(1) OT1 и VEGFA(2) OT2 (фиг. 15E). Чтобы убедиться в том, что наблюдаемое повышение специфичности не было обусловлено сниженной целевой активностью, заявители измерили образование целевых вставок/делеций в 10 целевых локусах с применением 16 лучших мутантов (фиг. 15F), определенных по комбинации целевой и нецелевой активности. Заявители наблюдали высокую эффективность и специфичность в случае трех мутантов: SpCas9 (K855A), SpCas9 (K810A/K1003A/R1060A) (также называемого eSpCas9(1.0)) и SpCas9 (K848A/K1003A/R1060A) (также называемого eSpCas9(1.1)). Эти три варианта выбрали для дальнейшего анализа.

Для оценки того, сохраняли ли в целом SpCas9 (K855A), eSpCas9(1.0) и eSpCas9(1.1) эффективную нуклеазную активность, заявители измеряли образование целевых вставок/делеций в 24 целевых сайтах, охватывающих 10 различных локусов генома (фиг. 16A). Все три мутанта обеспечивали уровни вставок/делеций, аналогичные таковым для SpCas9 WT, в случае большинства целевых сайтов (фиг. 16B). Для тестирования того, могли ли улучшения специфичности быть объяснены сниженной экспрессией Cas9, заявители осуществили вестерн-блоттинг в отношении SpCas9 и обнаружили, что все три мутанта экспрессировались эквивалентно или на более высоких уровнях, чем SpCas9 WT (фиг. 16C). Это показало,что улучшения специфичности не были обусловлены сниженными уровнями экспрессии белка.

Затем заявители сравнили специфичность трех мутантов с SpCas9 WT с применением усеченных направляющих последовательностей (18 нуклеотидов для EMX1(1) и 17 нуклеотидов для VEGFA(1)), что, как было показано, снижает образование нецелевых вставок/делеций. Для всех трех мутантов наблюдали сниженное расщепление во всех оцененных нецелевых сайтах. Более того, eSpCas9(1.0) и eSpCas9(1.1) приводили к исключению 20 из 24 этих сайтов. В отличие от этого, SpCas9 WT с усеченными направляющими приводил к исключению 14 из 24 сайтов, но также к повышению нецелевой активности в 5 сайтах по сравнению с SpCas9 WT с направляющими полной длины.

Для оценки толерантности SpCas9 (K855A), eCas9(1.0) и eCas9(1.1) в отношении целевых сайтов с несовпадениями заявители систематически осуществляли мутирование направляющей последовательности VEGFA(1) для введения несовпадений одиночных и двойных оснований в различные положения (фиг. 17A-C). По сравнению с SpCas9 WT все три мутанта индуцировали более низкие уровни вставок/делеций при применении направляющих с несовпадениями. Следует отметить, что eSpCas9(1.0) и eSpCas9(1.1) индуцировали более низкие уровни вставок/делеций даже при несовпадениях одиночного основания, расположенных за пределами 7-12 п. о. затравочной последовательности. С учетом того, что заявители не наблюдали никаких отличий между eSpCas9(1.0) и eSpCas9(1.1) с точки зрения специфичности, SpCas9 (K855A) и eSpCas9(1.1) выбрали для дальнейшего анализа на основании целевой эффективности.

Специфичность полногеномного редактирования с помощью SpCas9 (K855A) и eSpCas9(1.1) оценивали с применением BLESS (прямое in situ мечение разрывов, обогащение на стрептавидине и секвенирование нового поколения, с помощью которого количественно оценивают двухнитевых разрывы (DSB) ДНК по всему геному (фиг. 17A). Клетки собирали через примерно 24 ч. после трансфекции и проводили BLESS. Вкратце, всего 10 миллионов клеток фиксировали для выделения ядер и пермеабилизации и затем обрабатывали с помощью протеиназы K в течение 4 мин при 37°C перед инактивацией с помощью PMSF. DSB в подвергнутых депротеинизации ядрах метили с помощью 200 мМ гибридизируемых проксимальных линкеров в течение ночи. После расщепления подвергнутых мечению ядер с помощью протеиназы K, хроматин механически рассекали с помощью 26G иглы перед обработкой ультразвуком (BioRuptor, 20 мин на высокой скорости, 50% коэффициент заполнения). В общей сложности 20 мкг рассеченного хроматина захватывали на гранулах со стрептавидином, промывали и лигировали с 200 мМ дистального линкера. Линкерные шпильки затем отщепляли с помощью расщепления под действием I-SceI в течение 4 ч при 37°C, и продукты подвергали обогащению с помощью ПЦР на протяжении 18 циклов перед переходом к получению библиотеки с помощью набора TruSeq Nano LT (Illumina). Для получения отрицательного контроля клетки подвергали ложной трансфекции с помощью Lipofectamine 2000 и ДНК pUC19 и обрабатывали параллельно на протяжении анализа.

Расчет балла DSB для отделения фоновых DSB от истинных разрывов, индуцированных Cas9, проводили как описано ранее (Ran et al, Nature 2015), и сортировка локусов на основании балла DSB выявила главные нецелевые сайты, которые были ранее идентифицированы для этих мишеней sgRNA. Чтобы обеспечить дополнительную возможность обнаружения за пределами этих главных нецелевых локусов, исходя из предварительных данных Cas9-BLESS, авторами настоящего изобретения было обнаружено, что алгоритм поиска гомологии мог помочь дополнительно идентифицировать настоящие DSB, индуцированные Cas9. С помощью алгоритма поиска гомологии осуществляли поиск направляющей последовательности с самым лучшим совпадением в пределах участка генома длиной 50 нуклеотидов по обе стороны от середины кластера DSB, идентифицированного в BLESS, для всех последовательностей PAM, представляющих собой NGG и NAG. Балл, основанный на гомологии, рассчитывали с помощью следующих весовых значений: совпадение между sgRNA и последовательностью генома дает балл +3, несовпадение составляет -1, тогда как вставка или делеция между sgRNA и последовательностью генома оценивается в -5. В связи с этим, целевая последовательность с полной направляющей длиной 20 п. о. + PAM будет иметь балл 69. Конечный балл гомологии для кластера DSB устанавливали как максимальный балл для всех возможных последовательностей. Путем применения этих взвешенных значений было эмпирически обнаружено, что истинные нецелевые локусы (для которых вставки/делеции идентифицировали с помощью нацеленного глубокого секвенирования) и фоновые DSB полностью разделялись, когда для балла гомологии применяли граничное значение >50. Применение данного критерия гомологии в отношении 200 главных локусов DSB, определенных с помощью BLESS, позволило дополнительно отличать нецелевые локусы от фоновых DSB.

Заявители проанализировали действие обоих мутантов на мишени EMX1(1) и VEGFA(1) и сравнили эти результаты с SpCas9 WT (фиг. 17B). Оба SpCas9(K855A) и eSpCas9(1.1) проявляли снижение нецелевого полногеномного расщепления и не приводили к образованию каких-либо новых нецелевых сайтов (фиг. 17C-D).

Пример 15. - Механизм нацеливания и нуклеазная активность Cas9

Нецелевое разрезание происходит, когда сила связывания Cas9 с не подвергаемой нацеливанию нитью ДНК превышает силы повторной гибридизации ДНК. В соответствии с данной моделью, мутации, разработанные для ослабления взаимодействий между Cas9 и некомплементарной нитью ДНК, приводят к существенному улучшению специфичности. Модель также позволяет предположить, что, наоборот, специфичность может быть снижена путем усиления взаимодействий между Cas9 и не подвергаемой нацеливанию нитью. В соответствии с данной моделью получали два мутанта, S845K и L847R, каждый из которых проявлял сниженную специфичность (фиг. 24).

Пример 16. - Специфичность Cas9 Staphylococcus aureus (SaCas9)

Аналогичные стратегии также можно применять для других белков семейства Cas9. Версию Cas9 (SaCas9) Staphylococcus aureus с улучшенной специфичностью получали аналогично eSpCas9. Мутантов по одиночным и двойным аминокислотным остаткам в бороздке между доменами RuvC и HNH подвергали скринингу на сниженное нецелевое разрезание. Мутантов с улучшенной специфичностью комбинировали с получением варианта SaCas9, который сохранял целевое разрезание сайта 7 EMX и характеризовался значительно сниженным нецелевым разрезанием (фиг. 25). На кристаллической структуре SaCas9 показана бороздка между доменами HNH и RuvC, которую подвергали мутированию для конструирования нуклеаз с улучшенной специфичностью.

Пример 17. - Активация HBG1

Комплексы, содержащие мутанты spCas9 или spCas9 c различными направляющими РНК, тестировали в отношении активации HBG1. На фигуре 31 показана активация под действием комплексов, содержащих молекулы Cas9, лишенные нуклеазной активности (например, dCas9, R780A/K810A и R780A/K855A; см. также фиг. 4), или под действием комплексов с нуклеаза-компетентными Cas9 (например, немутированными spCas9 (px165), R780A, K810A или K848A с укороченными (т.е. "длиной 15 п.о.") направляющими РНК. Мутант R780A является исключительным в том, что демонстрирует активацию при применении всех трех протестированных направляющих.

Приме 18. - Опосредованная частицами доставка компонентов CRISPR-Cas9 в гемопоэтические стволовые клетки (HSC)

Заявители продемонстрировали, что Cas9 может быть доставлен в клетки посредством частиц. Для многих терапевтических средств на основе нуклеиновой кислоты может требоваться одновременная доставка как одной или нескольких sgRNA, так и нуклеазы Cas9. В соответствии с этим, заявители продемонстрировали возможность доставки комплекса из модифицированного фермента Cas9 и sgRNA таким способом.

Модифицированный фермент Cas9 тестировали при совместной доставке с одной или несколькими направляющими РНК в клетки посредством частиц. sgRNA, нацеливающуюся на ген EMX1, смешивали с eSpCas9(1.1) (K848A, K1003A, R1060A) при молярном соотношении 1:1 при комнатной температуре в течение 30 минут в стерильном, не содержащем нуклеаз 1X PBS. Контроль представлял собой ту же sgRNA, смешанную с SpCas9. Отдельно в 100% этаноле растворяли DOTAP, DMPC, PEG и холестерин. Два раствора смешивали вместе с образованием частиц, содержащих комплексы Cas9-sgRNA. После образования частиц HSC в 96-луночных планшетах трансфицировали с помощью 15 мкг белка Cas9 на лунку. Через три дня после трансфекции HSC собирали и оценивали специфичность полногеномного редактирования с применением BLESS, а нецелевые локусы идентифицировали с помощью алгоритма поиска гомологии. Количественно оценивали число целевых вставок и делеций (вставок/делеций) в локусе EMX1 и вставок/делеций в множественных нецелевых сайтах. eSpCas9(1.1) проявлял снижение полногеномного нецелевого расщепления и отсутствие новых нецелевых сайтов.

Пример 19. Опосредованная частицами доставка компонентов CRISPR-Cas9 в гемопоэтические стволовые клетки (HSC) и репарация HBB

Две sgRNA, нацеливающиеся на последовательности по обе стороны от обычной точечной мутации GAG->GTG в гене бета-глобина (HBB), смешивали с eSpCas9(1.1) (K848A, K1003A, R1060A) при молярном соотношении sgRNA и фермента, составляющем 1:1, при комнатной температуре в течение 30 минут в стерильном, не содержащем нуклеаз 1X PBS. Контроль представлял собой ту же sgRNA, смешанную с SpCas9. Отдельно в 100% этаноле растворяли DOTAP, DMPC, PEG и холестерин. Эти два раствора и нуклеиновую кислоту-матрицу для исправления точечной мутации GAG->GTG смешивали для образования частиц, содержащих комплексы Cas9-sgRNA и матрицу. После образования частиц HSC в 96-луночных планшетах трансфицировали с помощью 15 мкг белка Cas9 на лунку. Через три дня после трансфекции HSC собирали и тестировали в отношении репарации точечной мутации GAG->GTG. Затем подвергнутые исправлению клетки оценивали в отношении специфичности полногеномного редактирования с применением BLESS, а нецелевые локусы идентифицировали с помощью алгоритма поиска гомологии. Количественно оценивали вставки/делеции в множественных нецелевых сайтах. eSpCas9(1.1) проявлял снижение полногеномного нецелевого расщепления и отсутствие новых нецелевых сайтов.

Таблица праймеров для получения мутаций
Название праймера для SpCas9 Последовательность
SPCAS9-N ATGGTCTCACCGGTGCCACCATGGACTATAAG
K775A_F ATGGTCTCAGGCGAACAGCCGCGAGAGAATGAAGCGGAT
R780A_F ATGGTCTCAGGCGATGAAGCGGATCGAAGAGGGCATCA
Q807A_F ATGGTCTCAGGCGAACGAGAAGCTGTACCTGTACTACCTG
K810A_F ATGGTCTCAGGCGCTGTACCTGTACTACCTGCAGAATGG
R832A_F ATGGTCTCAGCCCTGTCCGACTACGATGTGGACCATATC
K848A_F ATGGTCTCAGCCGACGACTCCATCGACAACAAGGTGCTGACC
K855A_F ATGGTCTCAGCAGTGCTGACCAGAAGCGACAAGAACCGGG
R859_F ATGGTCTCACGCAAGCGACAAGAACCGGGGCAAGAG
K862_F ATGGTCTCACGCGAACCGGGGCAAGAGCGACAAC
K866_F ATGGTCTCACGCGAGCGACAACGTGCCCTCCGAA
K961_F ATGGTCTCAGCGCTGGTGTCCGATTTCCGGAAGGATTTC
K968A_F ATGGTCTCAGCGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAAC
K974A_F ATGGTCTCACGCAGTGCGCGAGATCAACAACTACCACCA
R976A_F ATGGTCTCATGGCCGAGATCAACAACTACCACCACGCC
H982A_F ATGGTCTCACGCCCACGCCCACGACGCCTAC
H983A_F ATGGTCTCACGCCGCCCACGACGCCTACCTGAA
K1014A_F ATGGTCTCAGCGGTGTACGACGTGCGGAAGATGATCG
K1047A_F ATGGTCTCACGCGACCGAGATTACCCTGGCCAACG
K1059A_F ATGGTCTCAGCGCGGCCTCTGATCGAGACAAACGG
R1060A_F ATGGTCTCAGGCGCCTCTGATCGAGACAAACGGCG
K1003A_F ATGGTCTCAGCGCTGGAAAGCGAGTTCGTGTACGGC
H1240A_F ATGGTCTCACGCCTATGAGAAGCTGAAGGGCTCCCC
K1244A_F ATGGTCTCAGGCGCTGAAGGGCTCCCCCGAG
K1289A_F ATGGTCTCACGCAGTGCTGTCCGCCTACAACAAGCAC
K1296A_F ATGGTCTCACGCGCACCGGGATAAGCCCATCAGAG
H1297A_F ATGGTCTCAAGGCCCGGGATAAGCCCATCAGAGAGC
R1298A_F ATGGTCTCAGCGGATAAGCCCATCAGAGAGCAGGCC
K1300A_F ATGGTCTCAGCGCCCATCAGAGAGCAGGCCGAG
R1303A_F ATGGTCTCACGCAGAGCAGGCCGAGAATATCATCCACC
H1311A_F ATGGTCTCACGCCCTGTTTACCCTGACCAATCTGGGAG
K1325A_F ATGGTCTCACGCGTACTTTGACACCACCATCGACCGG
K1107A_F ATGGTCTCACGCCGAGTCTATCCTGCCCAAGAGGAACAG
E1108A_F ATGGTCTCAAGCCTCTATCCTGCCCAAGAGGAACAGCGA
S1109A_F ATGGTCTCAGGCCATCCTGCCCAAGAGGAACAGCGATAA
ΔK1107_F ATGGTCTCACGAGTCTATCCTGCCCAAGAGGAACAGCGA
ΔE1108_F ATGGTCTCAATCTATCCTGCCCAAGAGGAACAGCGATAA
ΔS1109_F ATGGTCTCAGATCCTGCCCAAGAGGAACAGCGATAAGCT
KES_KG_F ATGGTCTCAAGGCATCCTGCCCAAGAGGAACAGCGATAA
KES_GG_F ATGGTCTCACGGCATCCTGCCCAAGAGGAACAGCGATAA
R778A_F ATGGTCTCACGCCGAGAGAATGAAGCGGATCGAAGAGGG
K782A_F ATGGTCTCAGGCCCGGATCGAAGAGGGCATCAAAGAGCT
R783A_F ATGGTCTCAGGCCATCGAAGAGGGCATCAAAGAGCTGGG
K789A_F ATGGTCTCACGCCGAGCTGGGCAGCCAGATCCTGAAAGA
K797A_F ATGGTCTCAGGCCGAACACCCCGTGGAAAACACCCAGCT
K890A_F ATGGTCTCACGCCCTGATTACCCAGAGAAAGTTCGACAA
R1114A_F ATGGTCTCAGGCCAACAGCGATAAGCTGATCGCCAGAAA
K1118A_F ATGGTCTCATGCCCTGATCGCCAGAAAGAAGGACTGGGA
K1200A_F ATGGTCTCATGCCTACTCCCTGTTCGAGCTGGAAAACGG
R63A_F ATGGTCTCACGCCCTGAAGAGAACCGCCAGAAGAAGATA
K163A_F ATGGTCTCACGCCTTCCGGGGCCACTTCCTGATCGAGGG
R165A_F ATGGTCTCACGCCGGCCACTTCCTGATCGAGGGCGACCT
R403A_F ATGGTCTCAGGCCACCTTCGACAACGGCAGCATCCCCCA
H415A_F ATGGTCTCACGCCCTGGGAGAGCTGCACGCCATTCTGCG
R447A_F ATGGTCTCACGCCATCCCCTACTACGTGGGCCCTCTGGC
K1000A_F ATGGTCTCAAGCCTACCCTAAGCTGGAAAGCGAGTTCGT
SPCAS9-C ATGGTCTCAAATTCTTACTTTTTCTTTTTTGCCTGGCC
K775A_R ATGGTCTCACGCCTGTCCCTTCTGGGTGGTCTGG
R780A_R ATGGTCTCACGCCTCGCGGCTGTTCTTCTGTCCCT
Q807A_R ATGGTCTCACGCCAGCTGGGTGTTTTCCACGGGG
K810A_R ATGGTCTCACGCCTCGTTCTGCAGCTGGGTGTTTTCCA
R832A_R ATGGTCTCAGGGCGTTGATGTCCAGTTCCTGGTCCAC
K848A_R ATGGTCTCACGGCCAGAAAGCTCTGAGGCACGATATGGTCCAC
K855A_R ATGGTCTCACTGCGTTGTCGATGGAGTCGTCCTTCAGAAAGCTCTG
R859_R ATGGTCTCATGCGGTCAGCACCTTGTTGTCGATGGAGTC
K862_R ATGGTCTCACGCGTCGCTTCTGGTCAGCACCTTGTTG
K866_R ATGGTCTCACGCGCCCCGGTTCTTGTCGCTTCTG
K961_R ATGGTCTCAGCGCGGACTTCAGGGTGATCACTTTCACTTC
K968A_R ATGGTCTCACCGCCCGGAAATCGGACACCAGCTTG
K974A_R ATGGTCTCATGCGTAAAACTGGAAATCCTTCCGGAAATCGGACAC
R976A_R ATGGTCTCAGCCACTTTGTAAAACTGGAAATCCTTCCGGAAATCGG
H982A_R ATGGTCTCAGGCGTAGTTGTTGATCTCGCGCACTTTGTAAAACTG
H983A_R ATGGTCTCAGGCGTGGTAGTTGTTGATCTCGCGCACTTTG
K1014A_R ATGGTCTCACCGCGTAGTCGCCGTACACGAACTCG
K1047A_R ATGGTCTCACGCGAAAAAGTTCATGATGTTGCTGTAGAAGAAGTACTTGG
K1059A_R ATGGTCTCAGCGCCCGGATCTCGCCGTTGGC
R1060A_R ATGGTCTCACGCCTTCCGGATCTCGCCGTTGGC
K1003A_R ATGGTCTCAGCGCAGGGTACTTTTTGATCAGGGCGGTTC
H1240A_R ATGGTCTCAGGCGCTGGCCAGGTACAGGAAGTTCAC
K1244A_R ATGGTCTCACGCCTCATAGTGGCTGGCCAGGTACAG
K1289A_R ATGGTCTCATGCGTCCAGATTAGCGTCGGCCAGGATC
K1296A_R ATGGTCTCACGCGTTGTAGGCGGACAGCACTTTGTCC
H1297A_R ATGGTCTCAGCCTTGTTGTAGGCGGACAGCACTTTGTCC
R1298A_R ATGGTCTCACCGCGTGCTTGTTGTAGGCGGACAGC
K1300A_R ATGGTCTCAGCGCATCCCGGTGCTTGTTGTAGGCG
R1303A_R ATGGTCTCATGCGATGGGCTTATCCCGGTGCTTGTTGTAG
H1311A_R ATGGTCTCAGGCGATGATATTCTCGGCCTGCTCTCTGATG
K1325A_R ATGGTCTCACGCGAAGGCGGCAGGGGCTCC
K1107A_R ATGGTCTCAGGCGCTGAAGCCGCCTGTCTGCACCTCGGT
E1108A_R ATGGTCTCAGGCTTTGCTGAAGCCGCCTGTCTGCACCTC
S1109A_R ATGGTCTCAGGCCTCTTTGCTGAAGCCGCCTGTCTGCAC
ΔK1107_R ATGGTCTCACTCGCTGAAGCCGCCTGTCTGCACCTCGGT
ΔE1108_R ATGGTCTCAAGATTTGCTGAAGCCGCCTGTCTGCACCTC
ΔS1109_R ATGGTCTCAGATCTCTTTGCTGAAGCCGCCTGTCTGCAC
KES_KG_R ATGGTCTCAGCCTTTGCTGAAGCCGCCTGTCTGCACCTC
KES_GG_R ATGGTCTCAGCCGCCGCTGAAGCCGCCTGTCTGCACCTC
R778A_R ATGGTCTCAGGCGCTGTTCTTCTGTCCCTTCTGGGTGGT
K782A_R ATGGTCTCAGGCCATTCTCTCGCGGCTGTTCTTCTGTCC
R783A_R ATGGTCTCAGGCCTTCATTCTCTCGCGGCTGTTCTTCTG
K789A_R ATGGTCTCAGGCGATGCCCTCTTCGATCCGCTTCATTCT
K797A_R ATGGTCTCAGGCCAGGATCTGGCTGCCCAGCTCTTTGAT
K890A_R ATGGTCTCAGGCGGCGTTCAGCAGCTGCCGCCAGTAGTT
R1114A_R ATGGTCTCAGGCCTTGGGCAGGATAGACTCTTTGCTGAA
K1118A_R ATGGTCTCAGGCATCGCTGTTCCTCTTGGGCAGGATAGA
K1200A_R ATGGTCTCAGGCAGGCAGCTTGATGATCAGGTCCTTTTT
R63A_R ATGGTCTCAGGCGGTGGCCTCGGCTGTTTCGCCGCTGTC
K163A_R ATGGTCTCAGGCGATCATGTGGGCCAGGGCCAGATAGAT
R165A_R ATGGTCTCAGGCGAACTTGATCATGTGGGCCAGGGCCAG
R403A_R ATGGTCTCAGGCCTGCTTCCGCAGCAGGTCCTCTCTGTT
H415A_R ATGGTCTCAGGCGATCTGGTGGGGGATGCTGCCGTTGTC
R447A_R ATGGTCTCAGGCGAAGGTCAGGATCTTCTCGATCTTTTC
K1000A_R ATGGTCTCAGGCTTTGATCAGGGCGGTTCCCACGACGGC
Название праймера для SaCas9 Последовательность
SACAS9-N ATGAAGACTACCGGTGCCACCATGGCCC
K518A_F ATGAAGACTAGCGTACCTGATCGAGAAGATCAAGCTGCA
K523A_F ATGAAGACTAGCGATCAAGCTGCACGACATGCAGGA
K525A_F ATGAAGACTAGCGCTGCACGACATGCAGGAAGGC
H557A_F ATGAAGACTAGCCATCATCCCCAGAAGCGTGTCCTTC
R561A_F ATGAAGACTAGCAAGCGTGTCCTTCGACAACAGCTTC
K572A_F ATGAAGACTAGCGGTGCTCGTGAAGCAGGAAGAAAACA
R686A_F ATGAAGACTAGCGAAGTGGAAGTTTAAGAAAGAGCGGAACAA
K692A_F ATGAAGACTAGCAGAGCGGAACAAGGGGTACAAGCAC
R694A_F ATGAAGACTAGCGAACAAGGGGTACAAGCACCACGC
H700A_F ATGAAGACTAGCCCACGCCGAGGACGCCCTGA
K751A_F ATGAAGACTAGCAGAGATCTTCATCACCCCCCACCAG
R497A_F ATGAAGACTAGCCAACCGGCAGACCAACGAGCG
R499A;Q500K_F ATGAAGACTAGCAAAGACCAACGAGCGGATCGAGG
R634A_F ATGAAGACTAGCGTTCTCCGTGCAGAAAGACTTCATCAAC
R654A;G655R_F ATGAAGACTAGCCCGCCTGATGAACCTGCTGCGG
SACAS9-C ATGAAGACTAAATTCTTAAGCGTAATCTGGAACATCGTATGG
K518A_R ATGAAGACTAACGCGGCGTTCTCTTTGCCGGTGG
K523A_R ATGAAGACTATCGCCTCGATCAGGTACTTGGCGTTCTCTT
K525A_R ATGAAGACTAGCGCGATCTTCTCGATCAGGTACTTGGCGT
H557A_R ATGAAGACTATGGCGTCCACCTCATAGTTGAAGGGGTTGT
R561A_R ATGAAGACTATTGCGGGGATGATGTGGTCCACCTCATA
K572A_R ATGAAGACTACCGCGTTGTTGAAGCTGTTGTCGAAGGACA
R686A_R ATGAAGACTATCGCCCGCAGAAAGCTGGTGAAGCC
K692A_R ATGAAGACTACTGCCTTAAACTTCCACTTCCGCCGCA
R694A_R ATGAAGACTATCGCCTCTTTCTTAAACTTCCACTTCCGCC
H700A_R ATGAAGACTAGGGCCTTGTACCCCTTGTTCCGCTCTTTC
K751A_R ATGAAGACTACTGCGTACTCCTGCTCGGTTTCGATCTCG
R497A_R ATGAAGACTATGGCCTTCTGCATCTCGTTGATCATTTTCTG
R499A;Q500K_R ATGAAGACTATTGCGTTCCGCTTCTGCATCTCGTTGA
R634A_R ATGAAGACTAACGCGTTGATGTCCCGTTCTTCCAGCA
R654A;G655R_R ATGAAGACTAGGGCGGTGGCGTATCTGGTATCCACCA

Таблица направляющих последовательностей и праймеров для NGS

SpCas9 дикого типа

ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA

>K855A

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACGCGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA

eSpCas9(1.0)

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGGCCCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG

eSpCas9(1.1)

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGGCGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA

* * *

Имея, таким образом, подробное описание предпочтительных вариантов осуществления настоящего изобретения, следует понимать, что настоящее изобретение, определяемое в вышеприведенных разделах, не должно ограничиваться конкретными деталями, изложенными в вышеприведенном описании, поскольку возможны их многочисленные очевидные варианты без отступления от сущности или объема настоящего изобретения.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> THE BROAD INSTITUTE, INC.

MASSACHUSETTS INSTITUTE OF TECHNOLOGY

<120> CRISPR ENZYME MUTATIONS REDUCING OFF-TARGET EFFECTS

<130> 47627.99.2017

<140>

<141>

<150> 62/269,876

<151> 2015-12-18

<150> 62/255,256

<151> 2015-11-13

<150> 62/237,360

<151> 2015-10-05

<150> 62/207,312

<151> 2015-08-19

<150> 62/181,453

<151> 2015-06-18

<160> 547

<170> PatentIn version 3.5

<210> 1

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 1

Gly Gly Gly Ser

1

<210> 2

<211> 15

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 2

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 3

<211> 30

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 3

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

20 25 30

<210> 4

<211> 45

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 4

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

35 40 45

<210> 5

<211> 60

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 5

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

35 40 45

Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

50 55 60

<210> 6

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 6

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 7

<211> 15

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t or g

<220>

<221> modified_base

<222> (13)..(13)

<223> a, c, t, g, unknown or other

<400> 7

nnnnnnnnnn nnngg 15

<210> 8

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 8

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 9

<211> 14

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t or g

<220>

<221> modified_base

<222> (12)..(12)

<223> a, c, t, g, unknown or other

<400> 9

nnnnnnnnnn nngg 14

<210> 10

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(22)

<223> a, c, t, g, unknown or other

<400> 10

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 11

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t or g

<220>

<221> modified_base

<222> (13)..(14)

<223> a, c, t, g, unknown or other

<400> 11

nnnnnnnnnn nnnnagaaw 19

<210> 12

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(22)

<223> a, c, t, g, unknown or other

<400> 12

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 13

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t or g

<220>

<221> modified_base

<222> (12)..(13)

<223> a, c, t, g, unknown or other

<400> 13

nnnnnnnnnn nnnagaaw 18

<210> 14

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<220>

<221> modified_base

<222> (24)..(24)

<223> a, c, t, g, unknown or other

<400> 14

nnnnnnnnnn nnnnnnnnnn nggng 25

<210> 15

<211> 17

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t or g

<220>

<221> modified_base

<222> (13)..(13)

<223> a, c, t, g, unknown or other

<220>

<221> modified_base

<222> (16)..(16)

<223> a, c, t, g, unknown or other

<400> 15

nnnnnnnnnn nnnggng 17

<210> 16

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t or g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<220>

<221> modified_base

<222> (24)..(24)

<223> a, c, t, g, unknown or other

<400> 16

nnnnnnnnnn nnnnnnnnnn nggng 25

<210> 17

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t or g

<220>

<221> modified_base

<222> (12)..(12)

<223> a, c, t, g, unknown or other

<220>

<221> modified_base

<222> (15)..(15)

<223> a, c, t, g, unknown or other

<400> 17

nnnnnnnnnn nnggng 16

<210> 18

<211> 137

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 18

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60

gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120

tcgttattta atttttt 137

<210> 19

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 19

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120

ttt 123

<210> 20

<211> 110

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 20

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110

<210> 21

<211> 102

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 21

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102

<210> 22

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 22

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt gttttttt 88

<210> 23

<211> 76

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, unknown or other

<400> 23

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcatt tttttt 76

<210> 24

<211> 7

<212> PRT

<213> Simian virus 40

<400> 24

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 25

<211> 16

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

Nucleoplasmin bipartite NLS sequence"

<400> 25

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 26

<211> 9

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

C-myc NLS sequence"

<400> 26

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 27

<211> 11

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

C-myc NLS sequence"

<400> 27

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 28

<211> 38

<212> PRT

<213> Homo sapiens

<400> 28

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 29

<211> 42

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

IBB domain from importin-alpha sequence"

<400> 29

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 30

<211> 8

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

Myoma T protein sequence"

<400> 30

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 31

<211> 8

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

Myoma T protein sequence"

<400> 31

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 32

<211> 8

<212> PRT

<213> Homo sapiens

<400> 32

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 33

<211> 12

<212> PRT

<213> Mus musculus

<400> 33

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 34

<211> 5

<212> PRT

<213> Influenza virus

<400> 34

Asp Arg Leu Arg Arg

1 5

<210> 35

<211> 7

<212> PRT

<213> Influenza virus

<400> 35

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 36

<211> 10

<212> PRT

<213> Hepatitis delta virus

<400> 36

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 37

<211> 10

<212> PRT

<213> Mus musculus

<400> 37

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 38

<211> 20

<212> PRT

<213> Homo sapiens

<400> 38

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 39

<211> 17

<212> PRT

<213> Homo sapiens

<400> 39

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 40

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 40

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser

1 5 10

<210> 41

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 41

Ala Glu Ala Ala Ala Lys Ala

1 5

<210> 42

<211> 5

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 42

Gly Gly Gly Gly Ser

1 5

<210> 43

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 43

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 44

<211> 20

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 44

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser

20

<210> 45

<211> 25

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<400> 45

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser

20 25

<210> 46

<211> 35

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 46

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser

35

<210> 47

<211> 40

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 47

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser

35 40

<210> 48

<211> 50

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 48

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

35 40 45

Gly Ser

50

<210> 49

<211> 55

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polypeptide"

<400> 49

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

35 40 45

Gly Ser Gly Gly Gly Gly Ser

50 55

<210> 50

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

peptide"

<220>

<221> MOD_RES

<222> (2)..(2)

<223> Ahx

<220>

<221> MOD_RES

<222> (5)..(5)

<223> Ahx

<220>

<221> MOD_RES

<222> (8)..(8)

<223> Ahx

<220>

<221> MOD_RES

<222> (11)..(11)

<223> Ahx

<400> 50

Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg

1 5 10

<210> 51

<211> 20

<212> DNA

<213> Homo sapiens

<400> 51

gagtccgagc agaagaagaa 20

<210> 52

<211> 20

<212> DNA

<213> Homo sapiens

<400> 52

gagtcctagc aggagaagaa 20

<210> 53

<211> 20

<212> DNA

<213> Homo sapiens

<400> 53

gagtctaagc agaagaagaa 20

<210> 54

<211> 12

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 54

guuuuagagc ua 12

<210> 55

<211> 9

<212> PRT

<213> Unknown

<220>

<221> source

<223> /note="Description of Unknown:

LAGLIDADG family motif peptide"

<400> 55

Leu Ala Gly Leu Ile Asp Ala Asp Gly

1 5

<210> 56

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 56

gagtccgagc agaagaagaa ggg 23

<210> 57

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 57

gagtctaagc agaagaagaa gag 23

<210> 58

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 58

gagttagagc agaagaagaa agg 23

<210> 59

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 59

gggtgggggg agtttgctcc tgg 23

<210> 60

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 60

gggagggtgg agtttgctcc tgg 23

<210> 61

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 61

cgggggaggg agtttgctcc tgg 23

<210> 62

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 62

ggtgagtgag tgtgtgcgtg tgg 23

<210> 63

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 63

ggtgagtgag tgtgtgtgtg agg 23

<210> 64

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 64

agtgagtgag tgtgtgtgtg ggg 23

<210> 65

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 65

gctgagtgag tgtatgcgtg tgg 23

<210> 66

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 66

gttgagtgaa tgtgtgcgtg agg 23

<210> 67

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 67

tgtgggtgag tgtgtgcgtg agg 23

<210> 68

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 68

ggcctcccca aagcctggcc agggagt 27

<210> 69

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 69

gacctcccca tagcctggcc agggagg 27

<210> 70

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 70

ggcctgccca aggcctgacc aagggaa 27

<210> 71

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 71

ggcctcccaa agccaggcca ggggga 26

<210> 72

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 72

atggtctcac cggtgccacc atggactata ag 32

<210> 73

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 73

atggtctcag gcgaacagcc gcgagagaat gaagcggat 39

<210> 74

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 74

atggtctcag gcgatgaagc ggatcgaaga gggcatca 38

<210> 75

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 75

atggtctcag gcgaacgaga agctgtacct gtactacctg 40

<210> 76

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 76

atggtctcag gcgctgtacc tgtactacct gcagaatgg 39

<210> 77

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 77

atggtctcag ccctgtccga ctacgatgtg gaccatatc 39

<210> 78

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 78

atggtctcag ccgacgactc catcgacaac aaggtgctga cc 42

<210> 79

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 79

atggtctcag cagtgctgac cagaagcgac aagaaccggg 40

<210> 80

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 80

atggtctcac gcaagcgaca agaaccgggg caagag 36

<210> 81

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 81

atggtctcac gcgaaccggg gcaagagcga caac 34

<210> 82

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 82

atggtctcac gcgagcgaca acgtgccctc cgaa 34

<210> 83

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 83

atggtctcag cgctggtgtc cgatttccgg aaggatttc 39

<210> 84

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 84

atggtctcag cggatttcca gttttacaaa gtgcgcgaga tcaacaac 48

<210> 85

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 85

atggtctcac gcagtgcgcg agatcaacaa ctaccacca 39

<210> 86

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 86

atggtctcat ggccgagatc aacaactacc accacgcc 38

<210> 87

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 87

atggtctcac gcccacgccc acgacgccta c 31

<210> 88

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 88

atggtctcac gccgcccacg acgcctacct gaa 33

<210> 89

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 89

atggtctcag cggtgtacga cgtgcggaag atgatcg 37

<210> 90

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 90

atggtctcac gcgaccgaga ttaccctggc caacg 35

<210> 91

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 91

atggtctcag cgcggcctct gatcgagaca aacgg 35

<210> 92

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 92

atggtctcag gcgcctctga tcgagacaaa cggcg 35

<210> 93

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 93

atggtctcag cgctggaaag cgagttcgtg tacggc 36

<210> 94

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 94

atggtctcac gcctatgaga agctgaaggg ctcccc 36

<210> 95

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 95

atggtctcag gcgctgaagg gctcccccga g 31

<210> 96

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 96

atggtctcac gcagtgctgt ccgcctacaa caagcac 37

<210> 97

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 97

atggtctcac gcgcaccggg ataagcccat cagag 35

<210> 98

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 98

atggtctcaa ggcccgggat aagcccatca gagagc 36

<210> 99

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 99

atggtctcag cggataagcc catcagagag caggcc 36

<210> 100

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 100

atggtctcag cgcccatcag agagcaggcc gag 33

<210> 101

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 101

atggtctcac gcagagcagg ccgagaatat catccacc 38

<210> 102

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 102

atggtctcac gccctgttta ccctgaccaa tctgggag 38

<210> 103

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 103

atggtctcac gcgtactttg acaccaccat cgaccgg 37

<210> 104

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 104

atggtctcac gccgagtcta tcctgcccaa gaggaacag 39

<210> 105

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 105

atggtctcaa gcctctatcc tgcccaagag gaacagcga 39

<210> 106

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 106

atggtctcag gccatcctgc ccaagaggaa cagcgataa 39

<210> 107

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 107

atggtctcac gagtctatcc tgcccaagag gaacagcga 39

<210> 108

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 108

atggtctcaa tctatcctgc ccaagaggaa cagcgataa 39

<210> 109

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 109

atggtctcag atcctgccca agaggaacag cgataagct 39

<210> 110

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 110

atggtctcaa ggcatcctgc ccaagaggaa cagcgataa 39

<210> 111

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 111

atggtctcac ggcatcctgc ccaagaggaa cagcgataa 39

<210> 112

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 112

atggtctcac gccgagagaa tgaagcggat cgaagaggg 39

<210> 113

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 113

atggtctcag gcccggatcg aagagggcat caaagagct 39

<210> 114

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 114

atggtctcag gccatcgaag agggcatcaa agagctggg 39

<210> 115

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 115

atggtctcac gccgagctgg gcagccagat cctgaaaga 39

<210> 116

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 116

atggtctcag gccgaacacc ccgtggaaaa cacccagct 39

<210> 117

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 117

atggtctcac gccctgatta cccagagaaa gttcgacaa 39

<210> 118

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 118

atggtctcag gccaacagcg ataagctgat cgccagaaa 39

<210> 119

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 119

atggtctcat gccctgatcg ccagaaagaa ggactggga 39

<210> 120

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 120

atggtctcat gcctactccc tgttcgagct ggaaaacgg 39

<210> 121

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 121

atggtctcac gccctgaaga gaaccgccag aagaagata 39

<210> 122

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 122

atggtctcac gccttccggg gccacttcct gatcgaggg 39

<210> 123

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 123

atggtctcac gccggccact tcctgatcga gggcgacct 39

<210> 124

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 124

atggtctcag gccaccttcg acaacggcag catccccca 39

<210> 125

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 125

atggtctcac gccctgggag agctgcacgc cattctgcg 39

<210> 126

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 126

atggtctcac gccatcccct actacgtggg ccctctggc 39

<210> 127

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 127

atggtctcaa gcctacccta agctggaaag cgagttcgt 39

<210> 128

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 128

atggtctcaa attcttactt tttctttttt gcctggcc 38

<210> 129

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 129

atggtctcac gcctgtccct tctgggtggt ctgg 34

<210> 130

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 130

atggtctcac gcctcgcggc tgttcttctg tccct 35

<210> 131

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 131

atggtctcac gccagctggg tgttttccac gggg 34

<210> 132

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 132

atggtctcac gcctcgttct gcagctgggt gttttcca 38

<210> 133

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 133

atggtctcag ggcgttgatg tccagttcct ggtccac 37

<210> 134

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 134

atggtctcac ggccagaaag ctctgaggca cgatatggtc cac 43

<210> 135

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 135

atggtctcac tgcgttgtcg atggagtcgt ccttcagaaa gctctg 46

<210> 136

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 136

atggtctcat gcggtcagca ccttgttgtc gatggagtc 39

<210> 137

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 137

atggtctcac gcgtcgcttc tggtcagcac cttgttg 37

<210> 138

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 138

atggtctcac gcgccccggt tcttgtcgct tctg 34

<210> 139

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 139

atggtctcag cgcggacttc agggtgatca ctttcacttc 40

<210> 140

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 140

atggtctcac cgcccggaaa tcggacacca gcttg 35

<210> 141

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 141

atggtctcat gcgtaaaact ggaaatcctt ccggaaatcg gacac 45

<210> 142

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 142

atggtctcag ccactttgta aaactggaaa tccttccgga aatcgg 46

<210> 143

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 143

atggtctcag gcgtagttgt tgatctcgcg cactttgtaa aactg 45

<210> 144

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 144

atggtctcag gcgtggtagt tgttgatctc gcgcactttg 40

<210> 145

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 145

atggtctcac cgcgtagtcg ccgtacacga actcg 35

<210> 146

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 146

atggtctcac gcgaaaaagt tcatgatgtt gctgtagaag aagtacttgg 50

<210> 147

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 147

atggtctcag cgcccggatc tcgccgttgg c 31

<210> 148

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 148

atggtctcac gccttccgga tctcgccgtt ggc 33

<210> 149

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 149

atggtctcag cgcagggtac tttttgatca gggcggttc 39

<210> 150

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 150

atggtctcag gcgctggcca ggtacaggaa gttcac 36

<210> 151

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 151

atggtctcac gcctcatagt ggctggccag gtacag 36

<210> 152

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 152

atggtctcat gcgtccagat tagcgtcggc caggatc 37

<210> 153

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 153

atggtctcac gcgttgtagg cggacagcac tttgtcc 37

<210> 154

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 154

atggtctcag ccttgttgta ggcggacagc actttgtcc 39

<210> 155

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 155

atggtctcac cgcgtgcttg ttgtaggcgg acagc 35

<210> 156

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 156

atggtctcag cgcatcccgg tgcttgttgt aggcg 35

<210> 157

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 157

atggtctcat gcgatgggct tatcccggtg cttgttgtag 40

<210> 158

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 158

atggtctcag gcgatgatat tctcggcctg ctctctgatg 40

<210> 159

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 159

atggtctcac gcgaaggcgg caggggctcc 30

<210> 160

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 160

atggtctcag gcgctgaagc cgcctgtctg cacctcggt 39

<210> 161

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 161

atggtctcag gctttgctga agccgcctgt ctgcacctc 39

<210> 162

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 162

atggtctcag gcctctttgc tgaagccgcc tgtctgcac 39

<210> 163

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 163

atggtctcac tcgctgaagc cgcctgtctg cacctcggt 39

<210> 164

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 164

atggtctcaa gatttgctga agccgcctgt ctgcacctc 39

<210> 165

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 165

atggtctcag atctctttgc tgaagccgcc tgtctgcac 39

<210> 166

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 166

atggtctcag cctttgctga agccgcctgt ctgcacctc 39

<210> 167

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 167

atggtctcag ccgccgctga agccgcctgt ctgcacctc 39

<210> 168

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 168

atggtctcag gcgctgttct tctgtccctt ctgggtggt 39

<210> 169

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 169

atggtctcag gccattctct cgcggctgtt cttctgtcc 39

<210> 170

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 170

atggtctcag gccttcattc tctcgcggct gttcttctg 39

<210> 171

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 171

atggtctcag gcgatgccct cttcgatccg cttcattct 39

<210> 172

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 172

atggtctcag gccaggatct ggctgcccag ctctttgat 39

<210> 173

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 173

atggtctcag gcggcgttca gcagctgccg ccagtagtt 39

<210> 174

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 174

atggtctcag gccttgggca ggatagactc tttgctgaa 39

<210> 175

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 175

atggtctcag gcatcgctgt tcctcttggg caggataga 39

<210> 176

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 176

atggtctcag gcaggcagct tgatgatcag gtccttttt 39

<210> 177

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 177

atggtctcag gcggtggcct cggctgtttc gccgctgtc 39

<210> 178

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 178

atggtctcag gcgatcatgt gggccagggc cagatagat 39

<210> 179

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 179

atggtctcag gcgaacttga tcatgtgggc cagggccag 39

<210> 180

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 180

atggtctcag gcctgcttcc gcagcaggtc ctctctgtt 39

<210> 181

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 181

atggtctcag gcgatctggt gggggatgct gccgttgtc 39

<210> 182

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 182

atggtctcag gcgaaggtca ggatcttctc gatcttttc 39

<210> 183

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 183

atggtctcag gctttgatca gggcggttcc cacgacggc 39

<210> 184

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 184

atgaagacta ccggtgccac catggccc 28

<210> 185

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 185

atgaagacta gcgtacctga tcgagaagat caagctgca 39

<210> 186

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 186

atgaagacta gcgatcaagc tgcacgacat gcagga 36

<210> 187

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 187

atgaagacta gcgctgcacg acatgcagga aggc 34

<210> 188

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 188

atgaagacta gccatcatcc ccagaagcgt gtccttc 37

<210> 189

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 189

atgaagacta gcaagcgtgt ccttcgacaa cagcttc 37

<210> 190

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 190

atgaagacta gcggtgctcg tgaagcagga agaaaaca 38

<210> 191

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 191

atgaagacta gcgaagtgga agtttaagaa agagcggaac aa 42

<210> 192

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 192

atgaagacta gcagagcgga acaaggggta caagcac 37

<210> 193

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 193

atgaagacta gcgaacaagg ggtacaagca ccacgc 36

<210> 194

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 194

atgaagacta gcccacgccg aggacgccct ga 32

<210> 195

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 195

atgaagacta gcagagatct tcatcacccc ccaccag 37

<210> 196

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 196

atgaagacta gccaaccggc agaccaacga gcg 33

<210> 197

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 197

atgaagacta gcaaagacca acgagcggat cgagg 35

<210> 198

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 198

atgaagacta gcgttctccg tgcagaaaga cttcatcaac 40

<210> 199

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 199

atgaagacta gcccgcctga tgaacctgct gcgg 34

<210> 200

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 200

atgaagacta aattcttaag cgtaatctgg aacatcgtat gg 42

<210> 201

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 201

atgaagacta acgcggcgtt ctctttgccg gtgg 34

<210> 202

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 202

atgaagacta tcgcctcgat caggtacttg gcgttctctt 40

<210> 203

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 203

atgaagacta gcgcgatctt ctcgatcagg tacttggcgt 40

<210> 204

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 204

atgaagacta tggcgtccac ctcatagttg aaggggttgt 40

<210> 205

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 205

atgaagacta ttgcggggat gatgtggtcc acctcata 38

<210> 206

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 206

atgaagacta ccgcgttgtt gaagctgttg tcgaaggaca 40

<210> 207

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 207

atgaagacta tcgcccgcag aaagctggtg aagcc 35

<210> 208

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 208

atgaagacta ctgccttaaa cttccacttc cgccgca 37

<210> 209

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 209

atgaagacta tcgcctcttt cttaaacttc cacttccgcc 40

<210> 210

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 210

atgaagacta gggccttgta ccccttgttc cgctctttc 39

<210> 211

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 211

atgaagacta ctgcgtactc ctgctcggtt tcgatctcg 39

<210> 212

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 212

atgaagacta tggccttctg catctcgttg atcattttct g 41

<210> 213

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 213

atgaagacta ttgcgttccg cttctgcatc tcgttga 37

<210> 214

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 214

atgaagacta acgcgttgat gtcccgttct tccagca 37

<210> 215

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 215

atgaagacta gggcggtggc gtatctggta tccacca 37

<210> 216

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 216

ggtgagtgag tgtgtgcgtg ngg 23

<210> 217

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 217

ggtgagtgag tgtgtgtgtg ngg 23

<210> 218

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 218

gctgagtgag tgtatgcgtg ngg 23

<210> 219

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 219

ggtgagtgag tgcgtgcggg ngg 23

<210> 220

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 220

tgtgggtgag tgtgtgcgtg ngg 23

<210> 221

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 221

agtgaatgag tgtgtgtgtg ngg 23

<210> 222

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 222

tgtgagtaag tgtgtgtgtg ngg 23

<210> 223

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 223

actgtgtgag tgtgtgcgtg ngg 23

<210> 224

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 224

agcgagtggg tgtgtgcgtg ngg 23

<210> 225

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 225

agtgtgtgag tgtgtgcgtg ngg 23

<210> 226

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 226

tgtgggtgag tgtgtgcgtg nga 23

<210> 227

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 227

agcgagtgag tgtgtgtgtg ngg 23

<210> 228

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 228

gtagagtgag tgtgtgtgtg ngg 23

<210> 229

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 229

tgagtgtgag tgtgtgcgtg ngg 23

<210> 230

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 230

agagagtgag tgtgtgcatg ngg 23

<210> 231

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 231

gttgagtgaa tgtgtgcgtg ngg 23

<210> 232

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 232

cgtgagtgag tgtgtacctg ngg 23

<210> 233

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 233

gggtgggggg agtttgctcc ngg 23

<210> 234

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 234

gggagggtgg agtttgctcc ngg 23

<210> 235

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 235

cgggggaggg agtttgctcc ngg 23

<210> 236

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 236

tagtggaggg agcttgctcc ngg 23

<210> 237

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 237

gcgtgggggg tgtttgctcc ngg 23

<210> 238

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 238

ttgggggggc agtttgctcc ngg 23

<210> 239

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 239

gagtccgagc agaagaagaa ngg 23

<210> 240

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 240

gagttagagc agaagaagaa ngg 23

<210> 241

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 241

gagtctaagc agaagaagaa nag 23

<210> 242

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 242

gaggccgagc agaaaaagga ngg 23

<210> 243

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 243

aagtctgagc acaagaagaa ngg 23

<210> 244

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 244

gagtcctagc aggagaagaa nag 23

<210> 245

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 245

acgtctgagc agaagaagaa ngg 23

<210> 246

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 246

gtcacctcca atgactaggg ngg 23

<210> 247

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 247

gggcaaccac aaacccacga ngg 23

<210> 248

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 248

gcttgtccct ctgtcaatgg ngg 23

<210> 249

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 249

gcgccaccgg ttgatgtgat ngg 23

<210> 250

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 250

gacatcgatg tcctccccat ngg 23

<210> 251

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 251

gcctccccaa agcctggcca ngg 23

<210> 252

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 252

gccccgggct tcaagccctg ngg 23

<210> 253

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 253

ggcagagtgc tgcttgctgc ngg 23

<210> 254

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 254

gctaaagagg gaatgggctt ngg 23

<210> 255

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 255

gtttgggagg tcagaaatag ngg 23

<210> 256

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 256

gttggagcgg ggagaaggcc ngg 23

<210> 257

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 257

gaggctgggg tggaggtgtt ngg 23

<210> 258

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 258

gtgggtgagt gagtgcgtgc ngg 23

<210> 259

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 259

gattcctggt gccagaaaca ngg 23

<210> 260

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 260

gggcagtttg ctcctggcac ngg 23

<210> 261

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 261

ggagagaggc tcccatcacg ngg 23

<210> 262

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 262

gagaagagaa gtggggtggg ngg 23

<210> 263

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 263

gtgtgtgtgt gagggtgtaa ngg 23

<210> 264

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 264

ggtgagtgag tgtgtgtgtg ngg 23

<210> 265

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, unknown or other

<400> 265

gaagaatgga cagaactctg ngg 23

<210> 266

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 266

ccatctcatc cctgcgtgtc tccgcgtcct tcgagagtga ggac 44

<210> 267

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 267

ccatctcatc cctgcgtgtc tccagggacc cctctgacag act 43

<210> 268

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 268

ccatctcatc cctgcgtgtc tccgcccatt tctcctttga ggt 43

<210> 269

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 269

ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag 43

<210> 270

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 270

ccatctcatc cctgcgtgtc tcctgtcacc acacagttac cacct 45

<210> 271

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 271

ccatctcatc cctgcgtgtc tccataaggg gcaagttctg ggctat 46

<210> 272

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 272

ccatctcatc cctgcgtgtc tcctgatgaa gctgcctttc ctaagc 46

<210> 273

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 273

ccatctcatc cctgcgtgtc tcctctgcca gatccttagg cg 42

<210> 274

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 274

ccatctcatc cctgcgtgtc tccgacgtct gggtcccgag c 41

<210> 275

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 275

ccatctcatc cctgcgtgtc tcctcctgtg gaacaaccag acacc 45

<210> 276

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 276

ccatctcatc cctgcgtgtc tccaagctgc tggctttcct aag 43

<210> 277

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 277

ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t 41

<210> 278

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 278

ccatctcatc cctgcgtgtc tccatgatta gaaacctgca ctcccag 47

<210> 279

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 279

ccatctcatc cctgcgtgtc tccgtgggca ccaggagcgt ag 42

<210> 280

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 280

ccatctcatc cctgcgtgtc tccggcctcg ggaaacttac aat 43

<210> 281

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 281

ccatctcatc cctgcgtgtc tccagtgcct tgcacaaata ggc 43

<210> 282

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 282

ccatctcatc cctgcgtgtc tccctgccat tgtgaacagt gct 43

<210> 283

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 283

ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat 43

<210> 284

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 284

ccatctcatc cctgcgtgtc tcccctgcag gtgtctcctt ttc 43

<210> 285

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 285

ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga 43

<210> 286

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 286

ccatctcatc cctgcgtgtc tcctgcaaag ctaagcagag atgc 44

<210> 287

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 287

ccatctcatc cctgcgtgtc tccgcagaga tgcctatgcc tacat 45

<210> 288

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 288

ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa 43

<210> 289

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 289

ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc 44

<210> 290

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 290

ccatctcatc cctgcgtgtc tccttctgag ggctgctacc tgt 43

<210> 291

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 291

ccatctcatc cctgcgtgtc tcccacggcc tttgcaaata gag 43

<210> 292

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 292

ccatctcatc cctgcgtgtc tcctgggaga gagacccctt ctt 43

<210> 293

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 293

ccatctcatc cctgcgtgtc tccgttctga cattcctcct gaggga 46

<210> 294

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 294

ccatctcatc cctgcgtgtc tccccagact cagtaaagcc tgga 44

<210> 295

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 295

ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac 46

<210> 296

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 296

ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat 43

<210> 297

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 297

ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat 43

<210> 298

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 298

ccatctcatc cctgcgtgtc tccaacccac gagggcagag t 41

<210> 299

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 299

ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc 44

<210> 300

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 300

ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc 44

<210> 301

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 301

ccatctcatc cctgcgtgtc tccaacccac gagggcagag t 41

<210> 302

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 302

ccatctcatc cctgcgtgtc tccaacccac gagggcagag t 41

<210> 303

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 303

ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat 43

<210> 304

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 304

ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat 43

<210> 305

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 305

ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat 43

<210> 306

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 306

ccatctcatc cctgcgtgtc tccgcgtctt cgagagtgag gac 43

<210> 307

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 307

ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag 43

<210> 308

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 308

ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag 43

<210> 309

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 309

ccatctcatc cctgcgtgtc tcctgttaaa aacacaacat cagtgcat 48

<210> 310

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 310

ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa 43

<210> 311

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 311

ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga 43

<210> 312

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 312

ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t 41

<210> 313

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 313

ccatctcatc cctgcgtgtc tccagggacc cctctgacag act 43

<210> 314

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 314

ccatctcatc cctgcgtgtc tccagggacc cctctgacag act 43

<210> 315

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 315

ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac 46

<210> 316

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 316

cctctctatg ggcagtcggt gatgggggag agggacacac agat 44

<210> 317

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 317

cctctctatg ggcagtcggt gatgcacacc cacaccctca taca 44

<210> 318

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 318

cctctctatg ggcagtcggt gatgagccac agaggtggag actg 44

<210> 319

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 319

cctctctatg ggcagtcggt gatggcaccc caacacctac atct 44

<210> 320

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 320

cctctctatg ggcagtcggt gatggggaat ctaatgtatg gcatgg 46

<210> 321

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 321

cctctctatg ggcagtcggt gatgtgtgac ccaaaagatt cccacc 46

<210> 322

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 322

cctctctatg ggcagtcggt gatgcacagg cactaacttc ttcagccta 49

<210> 323

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 323

cctctctatg ggcagtcggt gatgccccag caaaacgcac tg 42

<210> 324

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 324

cctctctatg ggcagtcggt gatgccacac acagcgtctt ccg 43

<210> 325

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 325

cctctctatg ggcagtcggt gatgtcaaag ctgtatcccc attgccta 48

<210> 326

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 326

cctctctatg ggcagtcggt gatgagcaac gagacgttaa ccc 43

<210> 327

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 327

cctctctatg ggcagtcggt gatgttctgc cactggctta gctt 44

<210> 328

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 328

cctctctatg ggcagtcggt gatggtaagt gaatctctgt ctgtctcat 49

<210> 329

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 329

cctctctatg ggcagtcggt gatgcaggag gttaaatccc tcctcca 47

<210> 330

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 330

cctctctatg ggcagtcggt gatggtttcc cccatgcttt tctt 44

<210> 331

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 331

cctctctatg ggcagtcggt gatggaaggg ttggtttgga ag 42

<210> 332

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 332

cctctctatg ggcagtcggt gatgaggcat gagccactga gact 44

<210> 333

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 333

cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg 43

<210> 334

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 334

cctctctatg ggcagtcggt gatggccaca gtcgtgtcat cttg 44

<210> 335

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 335

cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct 44

<210> 336

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 336

cctctctatg ggcagtcggt gatggaaaga aagccccacc ctcg 44

<210> 337

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 337

cctctctatg ggcagtcggt gatgcaccct cgctctttta gtctc 45

<210> 338

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 338

cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct 44

<210> 339

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 339

cctctctatg ggcagtcggt gatggttgcc caccctagtc attg 44

<210> 340

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 340

cctctctatg ggcagtcggt gatggcccaa tcattgatgc tttt 44

<210> 341

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 341

cctctctatg ggcagtcggt gatgggcttt cacaaggatg cagt 44

<210> 342

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 342

cctctctatg ggcagtcggt gatgtcctgc tctcacttag actttctc 48

<210> 343

<211> 58

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 343

cctctctatg ggcagtcggt gatgatggct tacatattta ttagataaaa tgtattcc 58

<210> 344

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 344

cctctctatg ggcagtcggt gatgtggccc cagtctctct tcta 44

<210> 345

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 345

cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc 45

<210> 346

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 346

cctctctatg ggcagtcggt gatgtccagc ttgggcccac 40

<210> 347

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 347

cctctctatg ggcagtcggt gatgtccagc ttgggcccac 40

<210> 348

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 348

cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc 44

<210> 349

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 349

cctctctatg ggcagtcggt gatggttgcc caccctagtc attg 44

<210> 350

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 350

cctctctatg ggcagtcggt gatggttgcc caccctagtc attg 44

<210> 351

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 351

cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc 44

<210> 352

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 352

cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc 44

<210> 353

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 353

cctctctatg ggcagtcggt gatgtccagc ttgggcccac 40

<210> 354

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 354

cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg 43

<210> 355

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 355

cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg 43

<210> 356

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 356

cctctctatg ggcagtcggt gatgggggag agggacacac agat 44

<210> 357

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 357

cctctctatg ggcagtcggt gatggcaccc caacacctac atct 44

<210> 358

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 358

cctctctatg ggcagtcggt gatggcaccc caacacctac atct 44

<210> 359

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 359

cctctctatg ggcagtcggt gatgcgtgtt ccccagagtg actt 44

<210> 360

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 360

cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct 44

<210> 361

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 361

cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct 44

<210> 362

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 362

cctctctatg ggcagtcggt gatgttctgc cactggctta gctt 44

<210> 363

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 363

cctctctatg ggcagtcggt gatgcacacc cacaccctca taca 44

<210> 364

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 364

cctctctatg ggcagtcggt gatgcacacc cacaccctca taca 44

<210> 365

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

primer"

<400> 365

cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc 45

<210> 366

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 366

ggtgagtgag tgtgtgcgtg tgg 23

<210> 367

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 367

gctgagtgag tgtatgcgtg tgg 23

<210> 368

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 368

tgtgggtgag tgtgtgcgtg agg 23

<210> 369

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 369

agagagtgag tgtgtgcatg agg 23

<210> 370

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 370

agtgagtgag tgtgtgtgtg ggg 23

<210> 371

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 371

ggtgagtgag tgtgtgtgtg agg 23

<210> 372

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 372

ggtgagtgag tgcgtgcggg tgg 23

<210> 373

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 373

agtgtgtgag tgtgtgcgtg tgg 23

<210> 374

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 374

tgtgagtaag tgtgtgtgtg tgg 23

<210> 375

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 375

ggtgagtgtg tgtgtgcatg tgg 23

<210> 376

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 376

gttgagtgaa tgtgtgcgtg agg 23

<210> 377

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 377

gtgagtgagt gtgtgtgtgt gag 23

<210> 378

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 378

agcgagtggg tgtgtgcgtg ggg 23

<210> 379

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 379

ggtgagtgag tgtgtgcgtg tgg 23

<210> 380

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 380

gctgagtgag tgtatgcgtg tgg 23

<210> 381

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 381

tgtgggtgag tgtgtgcgtg agg 23

<210> 382

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 382

agagagtgag tgtgtgcatg agg 23

<210> 383

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 383

agtgagtgag tgtgtgtgtg ggg 23

<210> 384

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 384

ggtgagtgag tgtgtgtgtg agg 23

<210> 385

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 385

ggtgagtgag tgcgtgcggg tgg 23

<210> 386

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 386

agtgtgtgag tgtgtgcgtg tgg 23

<210> 387

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 387

tgtgagtaag tgtgtgtgtg tgg 23

<210> 388

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 388

ggtgagtgtg tgtgtgcatg tgg 23

<210> 389

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 389

gttgagtgaa tgtgtgcgtg agg 23

<210> 390

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 390

gtgagtgagt gtgtgtgtgt gag 23

<210> 391

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 391

agcgagtggg tgtgtgcgtg ggg 23

<210> 392

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 392

ggtgagtgag tgtgtgcgtg tgg 23

<210> 393

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 393

gctgagtgag tgtatgcgtg tgg 23

<210> 394

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 394

tgtgggtgag tgtgtgcgtg agg 23

<210> 395

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 395

agagagtgag tgtgtgcatg agg 23

<210> 396

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 396

agtgagtgag tgtgtgtgtg ggg 23

<210> 397

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 397

ggtgagtgag tgtgtgtgtg agg 23

<210> 398

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 398

ggtgagtgag tgcgtgcggg tgg 23

<210> 399

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 399

agtgtgtgag tgtgtgcgtg tgg 23

<210> 400

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 400

tgtgagtaag tgtgtgtgtg tgg 23

<210> 401

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 401

ggtgagtgtg tgtgtgcatg tgg 23

<210> 402

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 402

gttgagtgaa tgtgtgcgtg agg 23

<210> 403

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 403

gtgagtgagt gtgtgtgtgt gag 23

<210> 404

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 404

agcgagtggg tgtgtgcgtg ggg 23

<210> 405

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 405

gagtccgagc agaagaagaa ggg 23

<210> 406

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 406

gagttagagc agaagaagaa agg 23

<210> 407

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 407

gagtctaagc agaagaagaa gag 23

<210> 408

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 408

aagtctgagc acaagaagaa tgg 23

<210> 409

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 409

gagtcctagc aggagaagaa gag 23

<210> 410

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 410

gagtccgagc agaagaagaa ggg 23

<210> 411

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 411

gagttagagc agaagaagaa agg 23

<210> 412

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 412

gagtctaagc agaagaagaa gag 23

<210> 413

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 413

aagtctgagc acaagaagaa tgg 23

<210> 414

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 414

gagtcctagc aggagaagaa gag 23

<210> 415

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 415

gagtccgagc agaagaagaa ggg 23

<210> 416

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 416

gagttagagc agaagaagaa agg 23

<210> 417

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 417

gagtctaagc agaagaagaa gag 23

<210> 418

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 418

aagtctgagc acaagaagaa tgg 23

<210> 419

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 419

gagtcctagc aggagaagaa gag 23

<210> 420

<211> 4203

<212> DNA

<213> Staphylococcus aureus

<400> 420

atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60

tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120

tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180

aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240

aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300

atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360

ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420

gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480

agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540

cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600

ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660

ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720

ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780

agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840

cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900

cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960

atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020

tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080

gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140

ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200

ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260

ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320

cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380

accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440

atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500

ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560

gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620

accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680

aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740

aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800

gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860

gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920

ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980

gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040

aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100

tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160

aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220

gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280

gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340

agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400

gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460

cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520

gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580

agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640

ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700

cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760

agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820

cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880

gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940

gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000

cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060

gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120

agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180

tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240

acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300

aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360

ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420

gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480

gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540

gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600

aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660

gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720

gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780

ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840

tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900

gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960

caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020

aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080

gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140

ctgggaggcg acaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 4200

taa 4203

<210> 421

<211> 4272

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 421

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctgaa ggacgactcc atcgacaacg cggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaagt aa 4272

<210> 422

<211> 4269

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 422

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgaggccctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaag 4269

<210> 423

<211> 4272

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

polynucleotide"

<400> 423

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctggc ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaagt aa 4272

<210> 424

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 424

gagtccgagc agaagaagaa ggg 23

<210> 425

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 425

gtcacctcca atgactaggg tgg 23

<210> 426

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 426

gacatcgatg tcctccccat tgg 23

<210> 427

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 427

gcctccccaa agcctggcca ggg 23

<210> 428

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 428

gccccgggct tcaagccctg tgg 23

<210> 429

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 429

ggcagagtgc tgcttgctgc tgg 23

<210> 430

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 430

gattcctggt gccagaaaca ggg 23

<210> 431

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 431

ggtgagtgag tgtgtgcgtg tgg 23

<210> 432

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 432

gctaaagagg gaatgggctt tgg 23

<210> 433

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 433

gtttgggagg tcagaaatag ggg 23

<210> 434

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 434

gagtccgagc agaagaagaa ggg 23

<210> 435

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 435

gtcacctcca atgactaggg tgg 23

<210> 436

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 436

gggcaaccac aaacccacga ggg 23

<210> 437

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 437

gcttgtccct ctgtcaatgg cgg 23

<210> 438

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 438

gcgccaccgg ttgatgtgat ggg 23

<210> 439

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 439

gacatcgatg tcctccccat tgg 23

<210> 440

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 440

gcctccccaa agcctggcca ggg 23

<210> 441

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 441

gccccgggct tcaagccctg tgg 23

<210> 442

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 442

ggcagagtgc tgcttgctgc tgg 23

<210> 443

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 443

ggtgagtgag tgtgtgcgtg tgg 23

<210> 444

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 444

gctaaagagg gaatgggctt tgg 23

<210> 445

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 445

gtttgggagg tcagaaatag ggg 23

<210> 446

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 446

gttggagcgg ggagaaggcc agg 23

<210> 447

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 447

gggtgggggg agtttgctcc tgg 23

<210> 448

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 448

gtagagtgag tgtgtgtgtg tgg 23

<210> 449

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 449

gaagaatgga cagaactctg agg 23

<210> 450

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 450

gattcctggt gccagaaaca ggg 23

<210> 451

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 451

gtgggtgagt gagtgcgtgc ggg 23

<210> 452

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 452

gaggctgggg tggaggtgtt ggg 23

<210> 453

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 453

ggtgagtgag tgtgtgtgtg agg 23

<210> 454

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 454

gtgtgtgtgt gagggtgtaa ggg 23

<210> 455

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 455

gggcagtttg ctcctggcac agg 23

<210> 456

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 456

ggagagaggc tcccatcacg ggg 23

<210> 457

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 457

gagaagagaa gtggggtggg ggg 23

<210> 458

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 458

gtgtgtctgt gtgggtgagt gagtgtgtgc gtgtggggtt gag 43

<210> 459

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 459

ctcaacccca cacgcacaca ctcactcacc cacacagaca cac 43

<210> 460

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 460

ggugagugag ugugugcgug 20

<210> 461

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, u, g, unknown or other

<400> 461

ggugagugag ugugugcgun 20

<210> 462

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (19)..(19)

<223> a, c, u, g, unknown or other

<400> 462

ggugagugag ugugugcgng 20

<210> 463

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (18)..(18)

<223> a, c, u, g, unknown or other

<400> 463

ggugagugag ugugugcnug 20

<210> 464

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (17)..(17)

<223> a, c, u, g, unknown or other

<400> 464

ggugagugag ugugugngug 20

<210> 465

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (16)..(16)

<223> a, c, u, g, unknown or other

<400> 465

ggugagugag uguguncgug 20

<210> 466

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (15)..(15)

<223> a, c, u, g, unknown or other

<400> 466

ggugagugag ugugngcgug 20

<210> 467

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (14)..(14)

<223> a, c, u, g, unknown or other

<400> 467

ggugagugag ugunugcgug 20

<210> 468

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (13)..(13)

<223> a, c, u, g, unknown or other

<400> 468

ggugagugag ugngugcgug 20

<210> 469

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (12)..(12)

<223> a, c, u, g, unknown or other

<400> 469

ggugagugag unugugcgug 20

<210> 470

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (11)..(11)

<223> a, c, u, g, unknown or other

<400> 470

ggugagugag ngugugcgug 20

<210> 471

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (10)..(10)

<223> a, c, u, g, unknown or other

<400> 471

ggugagugan ugugugcgug 20

<210> 472

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (9)..(9)

<223> a, c, u, g, unknown or other

<400> 472

ggugagugng ugugugcgug 20

<210> 473

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (8)..(8)

<223> a, c, u, g, unknown or other

<400> 473

ggugagunag ugugugcgug 20

<210> 474

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (7)..(7)

<223> a, c, u, g, unknown or other

<400> 474

ggugagngag ugugugcgug 20

<210> 475

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (6)..(6)

<223> a, c, u, g, unknown or other

<400> 475

gguganugag ugugugcgug 20

<210> 476

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (5)..(5)

<223> a, c, u, g, unknown or other

<400> 476

ggugngugag ugugugcgug 20

<210> 477

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (4)..(4)

<223> a, c, u, g, unknown or other

<400> 477

ggunagugag ugugugcgug 20

<210> 478

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (3)..(3)

<223> a, c, u, g, unknown or other

<400> 478

ggngagugag ugugugcgug 20

<210> 479

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (2)..(2)

<223> a, c, u, g, unknown or other

<400> 479

gnugagugag ugugugcgug 20

<210> 480

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<220>

<221> modified_base

<222> (1)..(1)

<223> a, c, u, g, unknown or other

<400> 480

ngugagugag ugugugcgug 20

<210> 481

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 481

ggugagugag ugugugcgug 20

<210> 482

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 482

ggugagugag ugugugcgug 20

<210> 483

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 483

ggugagugag ugugugcgug 20

<210> 484

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 484

ggugagugag ugugugcgug 20

<210> 485

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 485

ggtgagtgag tgtgtgcgtg 20

<210> 486

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 486

gacgagtgag tgtgtgcgtg 20

<210> 487

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 487

ggcaagtgag tgtgtgcgtg 20

<210> 488

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 488

ggtaggtgag tgtgtgcgtg 20

<210> 489

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 489

ggtggatgag tgtgtgcgtg 20

<210> 490

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 490

ggtgaacgag tgtgtgcgtg 20

<210> 491

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 491

ggtgagcaag tgtgtgcgtg 20

<210> 492

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 492

ggtgagtagg tgtgtgcgtg 20

<210> 493

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 493

ggtgagtgga tgtgtgcgtg 20

<210> 494

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 494

ggtgagtgaa cgtgtgcgtg 20

<210> 495

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 495

ggtgagtgag catgtgcgtg 20

<210> 496

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 496

ggtgagtgag tacgtgcgtg 20

<210> 497

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 497

ggtgagtgag tgcatgcgtg 20

<210> 498

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 498

ggtgagtgag tgtacgcgtg 20

<210> 499

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 499

ggtgagtgag tgtgcacgtg 20

<210> 500

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 500

ggtgagtgag tgtgtatgtg 20

<210> 501

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 501

ggtgagtgag tgtgtgtatg 20

<210> 502

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 502

ggtgagtgag tgtgtgcacg 20

<210> 503

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 503

ggtgagtgag tgtgtgcgca 20

<210> 504

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 504

gagtccgagc agaagaagaa ggg 23

<210> 505

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 505

gagttagagc agaagaagaa agg 23

<210> 506

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 506

gagtctaagc agaagaagaa gag 23

<210> 507

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 507

aagtctgagc acaagaagaa tgg 23

<210> 508

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 508

gagtcctagc aggagaagaa gag 23

<210> 509

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 509

ggtgagtgag tgtgtgcgtg tgg 23

<210> 510

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 510

gctgagtgag tgtatgcgtg tgg 23

<210> 511

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 511

tgtgggtgag tgtgtgcgtg agg 23

<210> 512

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 512

agagagtgag tgtgtgcatg agg 23

<210> 513

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 513

ggtgagtgag tgtgtgtgtg agg 23

<210> 514

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 514

ggtgagtgag tgcgtgcggg tgg 23

<210> 515

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 515

agtgtgtgag tgtgtgcgtg tgg 23

<210> 516

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 516

tgtgagtaag tgtgtgtgtg tgg 23

<210> 517

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 517

tgtgagtgag tgtgtgtgtg tga 23

<210> 518

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 518

agcgagtggg tgtgtgcgtg ggg 23

<210> 519

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 519

cgtgagtgag tgtgtacctg ggg 23

<210> 520

<211> 1443

<212> PRT

<213> Staphylococcus aureus

<400> 520

Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Thr

965 970 975

Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

980 985 990

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln

995 1000 1005

Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys

1010 1015 1020

Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val

1025 1030 1035

Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile

1040 1045 1050

Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val

1055 1060 1065

Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

1070 1075 1080

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1085 1090 1095

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1100 1105 1110

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1115 1120 1125

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1130 1135 1140

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1145 1150 1155

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1160 1165 1170

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1175 1180 1185

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1190 1195 1200

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1205 1210 1215

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1220 1225 1230

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1235 1240 1245

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1250 1255 1260

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1265 1270 1275

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1280 1285 1290

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1295 1300 1305

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1310 1315 1320

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1325 1330 1335

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1340 1345 1350

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1355 1360 1365

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1370 1375 1380

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1385 1390 1395

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1400 1405 1410

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1415 1420 1425

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1430 1435 1440

<210> 521

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 521

gagtccgagc agaagaagaa ggg 23

<210> 522

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 522

gagttagagc agaagaagaa agg 23

<210> 523

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 523

gagtctaagc agaagaagaa gag 23

<210> 524

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 524

gagtcctagc aggagaagaa tag 23

<210> 525

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 525

gaggccgagc agaagaagaa ggg 23

<210> 526

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 526

aagtctgagc acaagaagaa cgg 23

<210> 527

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 527

acgtctgagc agaagaagaa tgg 23

<210> 528

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 528

gggtgggggg agtttgctcc tgg 23

<210> 529

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 529

gggagggtgg agtttgctcc tgg 23

<210> 530

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 530

gcgtgggggg tgtttgctcc cgg 23

<210> 531

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 531

cgggggaggg agtttgctcc tgg 23

<210> 532

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 532

tagtggaggg agcttgctcc tgg 23

<210> 533

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 533

ttgggggggc agtttgctcc tgg 23

<210> 534

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 534

ggtgagtgag tgtgtgcgtg tgg 23

<210> 535

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 535

ggtgagtgag tgtgtgtgtg agg 23

<210> 536

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 536

tgtgggtgag tgtgtgcgtg agg 23

<210> 537

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 537

gctgagtgag tgtatgcgtg tgg 23

<210> 538

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 538

ggtgagtgag tgcgtgcggg tgg 23

<210> 539

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 539

agtgtgtgag tgtgtgcgtg tgg 23

<210> 540

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 540

tgtgggtgag tgtgtgcgtg aga 23

<210> 541

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 541

agtgaatgag tgtgtgtgtg tgg 23

<210> 542

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 542

agcgagtgag tgtgtgtgtg ggg 23

<210> 543

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 543

tgtgagtaag tgtgtgtgtg tgg 23

<210> 544

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 544

agcgagtggg tgtgtgcgtg ggg 23

<210> 545

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 545

gtagagtgag tgtgtgtgtg tgg 23

<210> 546

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 546

actgtgtgag tgtgtgcgtg agg 23

<210> 547

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /note="Description of Artificial Sequence: Synthetic

oligonucleotide"

<400> 547

tgagtgtgag tgtgtgcgtg ggg 23

<---

1. Сконструированный белок Cas9, содержащий домен HNH, домен RuvC и одну или несколько модификаций в бороздке между доменами HNH и RuvC, каждый из которых содержит аминокислотную замену положительно заряженного остатка Cas9 дикого типа нейтральным или отрицательно заряженным аминокислотным остатком, где сконструированный белок Cas9 обладает повышенной специфичностью к целевым полинуклеотидным локусам по сравнению с нецелевыми полинуклеотидными локусами.

2. Сконструированный белок Cas9 по п. 1, где сконструированный белок Cas9 содержит две или более модификаций в бороздке между доменами HNH и RuvC, и где модификации изменяют кинетику связывания на границе соприкосновения ДНК:РНК:белок.

3. Сконструированный белок Cas9 по п. 1 или 2, где нейтральным или отрицательно заряженным остатком является аланин.

4. Сконструированный белок Cas9 по п. 1 или 2, где модификации предусматривают аминокислотную замену в положении 780, 810, 848, 855, 976, 982, 1003 или 1060 в соответствии с нумерацией аминокислотных положений в Cas9 из S. pyogenes (SpCas9).

5. Сконструированный белок Cas9 по п. 1 или 2, где модификации предусматривают аминокислотные замены в соответствии с нумерацией SpCas9 R780A и K810A, или R780A и K855A, или R780A и R976A, или K848A и R976A, или K855A и R976A, или R780A и K848A, или K810A и K848A, или K848A и K855A, или K810A и K855A, или H982A и R1060A, или H982A и R1003A, или K1003A и R1060A, или R780A и H982A, или K810A и H982A, или K848A и H982A, или K855A и H982A, или R780A и K1003A, или K810A и R1003A, или K848A и K1003A, или R780A и R1060A, или K810A и R1060A, или K848A и R1060A, или K848A и E1108A, или K810A и K1003A, или R780A и R1060A, или K810A и R1060A, или K848A и R1060A.

6. Сконструированный белок Cas9 по п. 1 или 2, где модификации предусматривают аминокислотные замены в соответствии с нумерацией SpCas9: H982A, K1003A и K1129E, или R780A, K1003A и R1060A, или K810A, K1003A и R1060A, или K848A, K1003A и R1060A, или K855A, K1003A и R1060A, или H982A, K1003A и R1060A.

7. Сконструированный белок Cas9 по п. 1 или 2, где модификации предусматривают аминокислотные замены в соответствии с нумерацией SpCas9: K848A, K1003A и R1060A.

8. Сконструированный белок Cas9 по любому из пп. 1-7, где сконструированный белок Cas9 представляет собой мутантный белок Cas9 из организма рода, представляющего собой Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.

9. Сконструированный белок Cas9 по любому из пп. 1-8, где сконструированный белок Cas9 содержит один или несколько доменов, представляющих собой сигнал ядерной локализации (NLS).

10. Сконструированный белок Cas9 по любому из пп. 1-8, где сконструированный белок Cas9 содержит по меньшей мере два или более сигнала ядерной локализации (NLS).

11. Сконструированный белок Cas9 по любому из пп. 1-8, где сконструированный белок Cas9 содержит три или более модификации.

12. Сконструированный белок Cas9 по любому из пп. 1-11, где сконструированный белок Cas9 содержит один или несколько гетерологичных функциональных доменов.

13. Сконструированный белок Cas9 по п. 12, где один или несколько гетерологичных функциональных доменов предусматривают один или несколько доменов активации транскрипции.

14. Сконструированный белок Cas9 по п. 13, где домен активации транскрипции предусматривает VP64.

15. Сконструированный белок Cas9 по п. 12, где один или несколько гетерологичных функциональных доменов предусматривают один или несколько доменов репрессии транскрипции.

16. Сконструированный белок Cas9 по п. 15, где домен репрессии транскрипции предусматривает домен KRAB или домен SID.

17. Сконструированный белок Cas9 по п. 12, где один или несколько гетерологичных функциональных доменов предусматривают один или несколько нуклеазных доменов.

18. Сконструированный белок Cas9 по п. 17, где нуклеазный домен предусматривает Fok1.

19. Сконструированный белок Cas9 по п. 12, где один или несколько гетерологичных функциональных доменов характеризуются одной или несколькими из следующих видов активности: метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, нуклеазной активностью, активностью расщепления однонитевой РНК, активностью расщепления двухнитевой РНК, активностью расщепления однонитевой ДНК, активностью расщепления двухнитевой ДНК и активностью связывания нуклеиновой кислоты.

20. Сконструированный белок Cas9 по любому из пп. 1-19, где сконструированный белок Cas9 кодируется нуклеотидной последовательностью, которая является кодон-оптимизированной для экспрессии в эукариотическом организме.

21. Выделенная клетка для модификации целевых полинуклеотидных локусов внутри указанной клетки, содержащая сконструированный белок Cas9 по любому из пп. 1-20.

22. Выделенная клетка по п. 21, в которой выделенная клетка представляет собой выделенную прокариотическую клетку.

23. Выделенная клетка по п. 21, где выделенная клетка представляет собой выделенную эукариотическую клетку.

24. Выделенная клетка по п. 23, в которой выделенная клетка представляет собой клетку животного.

25. Выделенная клетка по п. 24, где клетка представляет собой клетку человека.

26. Выделенная клетка по п. 23, в которой выделенная клетка представляет собой стволовую клетку или линию стволовых клеток.

27. Выделенная клетка по п. 23, в которой выделенная клетка представляет собой растительную клетку.

28. Комплекс CRISPR-Cas9, содержащий сконструированный белок Cas9 по любому из пп. 1-20 и направляющий полинуклеотид.

29. Комплекс CRISPR-Cas9 по п. 28, в котором направляющий полинуклеотид содержит направляющую последовательность, последовательность парную tracr и последовательность tracr.

30. Комплекс CRISPR-Cas9 по п. 29, где направляющий полинуклеотид представляет собой химерный направляющий полинуклеотид, в котором последовательность парная tracr связана с последовательностью tracr.

31. Выделенная клетка для модификации целевых полинуклеотидных локусов внутри указанной клетки, содержащая комплекс CRISPR-Cas9 по любому из пп. 28-30.

32. Выделенная клетка по п. 31, где выделенная клетка представляет собой выделенную прокариотическую клетку.

33. Выделенная клетка по п. 31, где выделенная клетка представляет собой выделенную эукариотическую клетку.

34. Выделенная клетка по п. 33, где выделенная клетка представляет собой клетку животного.

35. Выделенная клетка по п. 34, где клетка представляет собой клетку человека.

36. Выделенная клетка по п. 33, где выделенная клетка представляет собой стволовую клетку или линию стволовых клеток.

37. Выделенная клетка по п. 33, где выделенная клетка представляет собой растительную клетку.

38. Композиция для модулирования экспрессии гена, содержащая сконструированный белок Cas9 по любому из пп. 1-20 и направляющую РНК, содержащую направляющую последовательность, последовательность tracr и последовательность парную tracr.

39. Векторная система для экспрессии сконструированного белка Cas9 по любому из пп. 1-20 и направляющей РНК, содержащая один или несколько векторов, где один или несколько векторов содержат:

a) первый регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей сконструированный белок Cas9 по любому из пп. 1-20, где указанный первый регуляторный элемент функционально сконфигурирован для экспрессии сконструированного белка Cas9; и

b) второй регуляторный элемент, функционально связанный с одной или несколькими нуклеотидными последовательностями, кодирующими одну или несколько молекул нуклеиновой кислоты, включающих направляющую РНК, причем эта направляющая РНК содержит направляющую последовательность, последовательность tracr и последовательность парную tracr, и где указанный второй регуляторный элемент функционально сконструирован для экспрессии одной или более молекул нуклеиновой кислоты, включающих эту направляющую РНК;

где компоненты (a) и (b) находятся в одном и том же или в разных векторах.

40. Выделенная эукариотическая клетка для продуцирования сконструированного белка Cas9 по любому из пп. 1-20 и направляющей РНК, содержащая векторную систему по п. 39, причем эта направляющая РНК содержит направляющую последовательность, последовательность tracr и последовательность парную tracr.

41. Выделенная эукариотическая клетка по п. 40, где выделенная эукариотическая клетка представляет собой клетку животного.

42. Выделенная эукариотическая клетка по п. 41, где выделенная эукариотическая клетка представляет собой клетку человека.

43. Выделенная эукариотическая клетка по п. 40, где выделенная эукариотическая клетка представляет собой стволовую клетку или линию стволовых клеток.

44. Выделенная эукариотическая клетка по п. 40, где выделенная эукариотическая клетка представляет собой растительную клетку.

45. Способ модулирования экспрессии гена, включающий введение комплекса CRISPR-Cas9 по любому из пп. 28-30, композиции по п. 38 или векторной системы по п. 39 в клетку или в клеточную линию.

46. Способ по п. 45, дополнительно включающий культивирование модифицированной клетки или клеточной линии для получения потомства.

47. Способ по п. 45 или 46, где клетка является эукариотической или прокариотической клеткой.

48. Способ по любому из пп. 45-47, где комплекс CRISPR-Cas9, композицию или векторную систему вводят в клетку или клеточную линию ex vivo.

49. Способ по любому из пп. 45-47, в котором комплекс CRISPR-Cas9, композицию или векторную систему вводят в клетку или клеточную линию in vitro.

50. Способ лечения болезненного состояния у индивидуума, нуждающегося в этом, включающий введение эффективного количества комплекса CRISPR-Cas9 по любому из пп. 28-30, композиции по п. 38 или векторной системы по п. 39, причем целевой локус, который делает вклад в болезненное состояние, у субъекта модифицируется.

51. Способ по п. 50, в котором болезненное состояние связано с заболеванием, расстройством или инфекцией, выбранными из группы, состоящей из: заболевания или расстройства крови или коагуляции, нарушения регуляции клеток или онкологическое заболевание или расстройство, воспаление или связанное с иммунитетом заболевание или расстройство, метаболическое заболевание или расстройство печени, почек или белковое метаболическое заболевание или расстройство, мышечное заболевание или расстройство или заболевание или расстройство, относящееся к скелету, неврологическое или нейрональное заболевание или расстройство, глазное заболевание или расстройство и вирусное заболевание.

52. Способ изменения экспрессии представляющего интерес локуса генома в клетке млекопитающего, включающий

доставку комплекса CRISPR-Cas9 в клетку млекопитающего, и

определение того, была ли изменена экспрессия локуса генома,

где указанный комплекс CRISPR-Cas9 представляет собой комплекс CRISPR-Cas9 по любому из пп. 28-30.

53. Способ по п. 52, который предусматривает расщепление геномной ДНК, что приводит в результате к сниженной транскрипции гена.

54. Способ по п. 52, где изменение экспрессии предусматривает редактирование генома.

55. Способ по п. 52, где изменение экспрессии предусматривает повышение экспрессии продукта гена.

56. Способ по п. 52, где изменение экспрессии предусматривает модификацию продукта гена.

57. Способ модифицирования представляющего интерес целевого локуса, причем способ включает доставку в указанный локус сконструированного белка Cas9 и одного или нескольких компонентов на основе нуклеиновой кислоты, где указанный сконструированный белок Cas9 образует комплекс с одним или несколькими компонентами на основе нуклеиновой кислоты, и после связывания комплекса с представляющим интерес целевым локусом указанный сконструированный белок Cas9 индуцирует модификацию представляющего интерес целевого локуса, и где указанный сконструированный белок Cas9 представляет собой сконструированный белок Cas9 по любому из пп. 1-20.

58. Способ по п. 57, где представляющий интерес целевой локус находится в клетке.

59. Способ по п. 58, где клетка является эукариотической клеткой.

60. Способ по п. 58, где клетка является клеткой животного или человека.

61. Способ по п. 58, где клетка является растительной клеткой.

62. Способ по п. 57, где представляющий интерес целевой локус содержится в молекуле ДНК in vitro.

63. Способ по любому из пп. 57-62, где указанную композицию, содержащую сконструированный белок Cas9 и один или несколько компонентов на основе нуклеиновой кислоты, доставляют в клетку в виде одной или нескольких полинуклеотидных молекул.

64. Способ по п. 63, где одна или несколько полинуклеотидных молекул содержатся в одном или нескольких векторах.

65. Способ по любому из пп. 63 или 64, где одна или несколько полинуклеотидных молекул содержат один или несколько регуляторных элементов, функционально сконфигурированных для обеспечения экспрессии сконструированного белка Cas9 и/или компонента (компонентов) на основе нуклеиновой кислоты, причем необязательно эти один или несколько регуляторных элементов включают индуцируемые промоторы.

66. Способ по любому из пп. 63-65, где одна или несколько полинуклеотидных молекул или один или несколько векторов содержатся в системе доставки.

67. Способ по любому из пп. 63-66, где систему доставки или одну или несколько полинуклеотидных молекул доставляют посредством частиц, везикул или одного или нескольких вирусных векторов.

68. Способ по п. 67, где частицы включают липид, сахар, металл или белок.

69. Способ по п. 67, где везикулы включают экзосомы или липосомы.

70. Способ по п. 67, где один или несколько вирусных векторов включают одно или несколько из аденовируса, одного или нескольких лентивирусов или одного или нескольких аденоассоциированных вирусов.

71. Способ по любому из пп. 57-70, который представляет собой способ модифицирования клетки, линии клеток или организма путем манипуляции с одной или несколькими целевыми последовательностями в представляющих интерес локусах генома.

72. Способ получения растения с модифицированным представляющим интерес признаком, кодируемым представляющим интерес геном, причем указанный способ включает введение комплекса CRISPR-Cas9 по любому из пп. 28-30, композиции по п. 38 или векторной системы по п. 39 в растительную клетку или осуществление в отношении растительной клетки способа по п. 57, за счет чего обеспечивается либо модифицирование, либо введение указанного представляющего интерес гена, и регенерацию растения из указанной растительной клетки.

73. Способ идентификации представляющего интерес признака у растения, причем указанный представляющий интерес признак кодируется представляющим интерес геном, причем указанный способ включает введение комплекса CRISPR-Cas9 по любому из пп. 28-30, композиции по п. 38 или векторной системы по п. 39 в растительную клетку или осуществление в отношении растительной клетки способа по п. 57, за счет чего обеспечивается идентификация указанного представляющего интерес гена.

74. Способ по п. 73, дополнительно включающий введение идентифицированного представляющего интерес гена в растительную клетку, или линию растительных клеток, или растительную идиоплазму и получение из них растения, в результате чего растение содержит представляющий интерес ген.

75. Способ по п. 74, где у растения проявляется представляющий интерес признак.

76. Система доставки на основе частиц для доставки сконструированного белка Cas9 по любому из пп. 1-20, комплекса CRISPR-Cas9 по любому из пп. 28-30, композиции по п. 38 или векторной системы по п. 39, содержащая сконструированный белок Cas9 по любому из пп. 1-20, комплекс CRISPR-Cas9 по любому из пп. 28-30, композицию по п. 38 или векторную систему по п. 39.

77. Система доставки на основе частиц для доставки сконструированного белка Cas9 по любому из пп. 1-20, содержашая сконструированный белок Cas9 по любому из пп.1-20, причем белок находится в комплексе с направляющей РНК.

78. Система доставки на основе частиц по п. 77, где частица для доставки содержит eSpCas9(1.1) в комплексе с направляющей РНК.

79. Сконструированный белок Cas9 по любому из пп. 1-20, где этот сконструированный белок Cas9 конъюгирован по меньшей мере с одним сахарным фрагментом, необязательно N-ацетилгалактозамином (GalNAc), в частности с трехразветвленным GalNAc.

80. Комплекс CRISPR-Cas9 по любому из пп. 28-30, где комплекс CRISPR-Cas9, направляющий полинуклеотид или сконструированный белок Cas9 конъюгированы по меньшей мере с одним сахарным фрагментом, необязательно N-ацетилгалактозамином (GalNAc), в частности с трехразветвленным GalNAc.

81. Способ улучшения специфичности системы CRISPR путем обеспечения сконструированного белка Cas9 по любому из пп. 1-20 или комплекса CRISPR-Cas9 по любому из пп. 28-30.



 

Похожие патенты:

Изобретение относится к экспериментальной медицине, в частности к военной токсикологии, и может быть использовано в исследовательских целях для моделирования функциональных нарушений дыхания при ингаляционном поражении сернистым ипритом. Для осуществления способа моделирования находящимся под наркозом крысам с массой тела 200±20 г при помощи микроспреера вводят аэрозоль раствора сернистого иприта с дисперсностью 32,1±2,6 мкм в объеме 100 мкл на 100 г массы тела крысы, причем поглощенная доза сернистого иприта составляет 1,1 мг/кг.

Изобретение относится к онкологии, а именно к экспериментальной онкологии, и может быть использовано для изучения первично-множественного процесса в эксперименте. Способ создания полинеоплазии со стимуляцией опухолевого роста в условиях первичного иммунодефицита в эксперименте заключается в том, что самцам мышей линии BALB/c Nude перевивают под кожу спины два опухолевых штамма: 0,5 мл взвеси опухолевых клеток мышиной меланомы В16/F10 в физиологическом растворе в разведении 1:20 ниже угла левой лопатки и 0,5 мл опухолевой взвеси саркомы 45, содержащей 0,5 млн опухолевых клеток, ниже угла правой лопатки.
Изобретение относится к области медицины, а именно к ультразвуковой диагностике. Выполняют обучение навыкам эхокардиографии с использованием симуляционных технологий, включая отработку эхокардиографических исследований на симуляторе Vimedix.
Изобретение относится к области медицины, а именно к акушерству и гинекологии, и может быть использовано для ускоренного обучения врачей акушеров-гинекологов базовым навыкам эндоскопической внутриматочной хирургии с помощью тренажера Hyst Sym. Способ обучения основан на последовательном повторении тестового задания.

Изобретение относится к медицине, а именно к офтальмологии, и может быть использовано для прогнозирования развития экстраретинальной вазопролиферации при экспериментальной ретинопатии недоношенных (РН). У крысят с моделью РН на 14-е сутки жизни в плазме крови определяют содержание L-дезоксифенилаланина (L-ДОФА).

Изобретение относится к медицине, в частности к экспериментальной фармакологии и офтальмологии, и может быть использовано для коррекции микроциркуляторных нарушений сетчатки. Способ коррекции микроциркуляторных нарушений сетчатки низкосиалированным эритропоэтином в эксперименте включает моделирование патологии сетчатки и коррекцию микроциркуляторных нарушений сетчатки введением лабораторному животному низкосиалированного эритропоэтина.

Изобретение относится к области медицины, а именно к экспериментальной медицине, эндокринологии и андрологии. Способ лечения подросткового гипогонадотропного гипогонадизма в эксперименте включает внутримышечное введение 0,1%-ного раствора препарата кисспептина Kiss 10 в дозе 500 мкг в течение 7 дней лабораторным животным 2-месячного пубертатного возраста с гипогонадотропным гипогонадизмом, смоделированным путем оперативного удаления одной гонады у новорожденных самцов крыс на 1-3 день постнатальной жизни.

Изобретение относится к биологии и экспериментальной медицине, а именно экспериментальной кардиологии, и может быть использовано для изучения пато- и морфогенеза ранних стадий инфаркта миокарда. Способ моделирования острого инфаркта миокарда у животных включает создание очага ишемического повреждения в сердце взрослых крыс возраста 6-18 месяцев.

Изобретение относится к онкологии, а именно к экспериментальной онкологии, и может быть использовано для изучения патогенеза первично-множественного неопластического процесса в эксперименте. Способ моделирования первично-множественного роста злокачественных опухолей с подавлением одной опухоли другой в условиях первичного иммунодефицита заключается в том, что самкам мышей линии BALB/c Nude подкожно под лопатку слева вводят суспензию опухолевых клеток мышиной меланомы В16/F10 в 0,5 мл физиологического раствора в разведении 1:20, одновременно под лопатку справа вводят 0,5 млн опухолевых клеток крысиной карциномы Герена в 0,5 мл физиологического раствора.
Изобретение относится к области медицины и может быть использовано при проведении в биофизических, биологических лабораториях. Способ включает: забор биоптата, размещение его в буферном растворе, не содержащем Са2+, измельчение биоптата, с последующим переносом в чистый буферный раствор того же состава, перемешивание, затем перенос фрагментов биоптата в ферментативный буфер, содержащий смесь ферментов, один из которых коллагеназа, инкубирование при 37°С при перемешивании с последующим удалением надосадочной жидкости и повторным проведением инкубирования в свежем растворе ферментативного буфера в том же режиме.

Группа изобретений относится к области биотехнологии. Предложен рекомбинантный штамм Escherichia coli (Е.
Наверх