Пестицидные белковые токсины, активные в отношении чешуекрылых

Авторы патента:


C12N15/00 - Получение мутаций или генная инженерия; ДНК или РНК, связанные с генной инженерией, векторы, например плазмиды или их выделение, получение или очистка; использование их хозяев (мутанты или микроорганизмы, полученные генной инженерией C12N 1/00,C12N 5/00,C12N 7/00; новые виды растений A01H; разведение растений из тканевых культур A01H 4/00; новые виды животных A01K 67/00; использование лекарственных препаратов, содержащих генетический материал, который включен в клетки живого организма, для лечения генетических заболеваний, для генной терапии A61K 48/00 пептиды вообще C07K)

Владельцы патента RU 2780626:

МОНСАНТО ТЕКНОЛОДЖИ ЛЛС (US)

Изобретение относится к области биохимии, в частности к полинуклеотидной конструкции для придания устойчивости к насекомому отряда Lepidoptera. Также раскрыты белок, токсичный для совки–ипсилон (black cutworm) отряда Lepidoptera; вектор, экспрессирующий указанную полинуклеотидную конструкцию; клетка–хозяин, содержащая указанную полинуклеотидную конструкцию; трансгенное растение, содержащее указанную полинуклеотидную конструкцию; семя, содержащее указанную полинуклеотидную конструкцию; биологический образец, содержащий указанную полинуклеотидную конструкцию; композиция, содержащая указанный белок. Раскрыт способ получения семян с помощью указанного вектора. Изобретение позволяет эффективно бороться с насекомым-вредителем отряда Lepidoptera. 10 н. и 6 з.п. ф-лы, 2 ил., 5 пр.

 

ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ

[001] Данная заявка заявляет приоритет по предварительной заявке США № 62/445313, поданной 12 января 2017 года, которая включена в данный документ посредством ссылки в полном объеме.

ВКЛЮЧЕНИЕ ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

[002] Файл, названный «MONS434WO-sequence listing.txt», содержащий Перечень последовательностей в машиночитаемом формате, был создан 11 января 2018 года. Этот файл имеет размер 166134 байта, как измерено в MS-Windows®, и полностью включен в данный документ посредством ссылки. Этот Перечень последовательностей состоит из SEQ ID NO:1-SEQ ID NO:12.

ОБЛАСТЬ ТЕХНИКИ

[003] Изобретение относится, в целом, к области белков, проявляющих ингибирующую активность в отношение насекомых, в частности к белкам, проявляющим ингибирующую активность в отношении насекомых-вредителей сельского хозяйства из отряда Lepidoptera (чешуекрылые), таких как совка-ипсилон («BCW», Agrotis ipsilon).

УРОВЕНЬ ТЕХНИКИ

[004] Ингибирующие насекомых белки, продуцируемые видом бактерии Bacillus thuringiensis (Bt), известны в данной области техники. Определенные белки Bt могут быть использованы для борьбы с вредителями сельскохозяйственных культур путем распрыскивания приемлемых в сельском хозяйстве готовых форм, содержащих один или большее количество таких белков, на растения, путем покрытия семян композицией, приготовленной так, что она содержит инсектицидно-эффективное количество таких белков, или путем результативно эффективной экспрессии указанных одного или большего количества белков в растениях/семенах.

[005] Были разработаны только несколько белков Bt для использования в качестве трансгенных признаков для коммерческого использования фермерами для борьбы с насекомыми-вредителями. Фермеры полагаются на эти белки, чтобы получить предписанный спектр сдерживания вредителей, и могут продолжать полагаться на химические вещества широкого спектра действия при применении к листьям и почве для борьбы с вредителями. Доказано, что особенно трудно бороться с некоторыми чешуекрылыми насекомыми, такими как виды Agrotis и виды Striacosta, с использованием трансгенных инсектицидных признаков, применяемых в данное время, включая Cry1Ab, Cry1Ac, Cry1Fa, Cry2Ab, Cry2Ae, VIP3Aa и различные другие токсины Bt, которые используются менее часто. Следовательно, существует потребность в ингибирующих насекомых белках, которые проявляют активность против более широкого спектра видов насекомых-вредителей, и в использовании токсинов с целью преодоления развития устойчивости вредителей к существующим пестицидам, включая токсины, применяемые в данное время в системах контроля вредителей.

[006] Данная заявка описывает новое семейство белков, варианты и химерные токсичные белковые конструкции, каждая из которых проявляет удивительно эффективную инсектицидную активность в отношение чешуекрылых, особенно против вредителей видов Agrotis, таких как совка-ипсилон.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[007] Показано, что новая группа полипептидов, ингибирующих насекомых (токсичные белки BCW 001, BCW 002 и BCW 003 и их пестицидные фрагменты), обладает ингибирующей активностью в отношении нескольких чешуекрылых-вредителей сельскохозяйственных растений, в частности в отношении вида совки-ипсилон (вид Agrotis). Каждый белок может быть использован отдельно или в комбинации с друг другом и с другими белками Bt и ингибирующими насекомых агентами в готовых формах и in planta, тем самым предлагая альтернативы Bt белкам и химическим инсектицидам, которые в данное время применяются в сельскохозяйственных системах.

[008] Согласно данному изобретению предложены полинуклеотидные конструкции, которые содержат в функциональной связи сегмент гетерологичного промотора, связанный с нуклеотидной последовательностью, кодирующей инсектицидный белок, обладающий характеристиками Cry1A, который меньше чем полноразмерный токсичный белок класса Cry1A, и который имеет аминокислотную последовательность от около позиции 1 до позиции 607, как указано в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO 6, SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12, или его инсектицидно-активный фрагмент. Меньше чем полноразмерный полипептид, который проявляет такую инсектицидную активность, должен проявлять идентичность, по меньшей мере, около 100%, 99%, 98%, 97%, 96%, 95%, 94%, 94%, 92%, 91% или 90% с аминокислотной последовательностью BCW 001, как указано в SEQ ID NO: 2, от около позиции 1 до около позиции 606, или от около позиции 5 до около позиции 600. Если необходимо использовать полноразмерный или значительно большего размера фрагменты токсина, процент идентичности должен быть менее ограничивающим, и представлять собой процент идентичности от около 100, до около 95, до около 90, до около 85 или даже до 80% идентичности по отношению к последовательностям полноразмерных белковых токсинов, как указано в SEQ ID NO: 2, 4 и 6, так как данные токсичные белки демонстрируют коммерчески полезные уровни биологической активности при тестировании против личинок совки-ипсилон в пищевых биоанализах и при тестировании in planta на трансгенной кукурузе, хлопке и сое, экспрессирующих такие белки.

[009] Согласно данному изобретению также предложены белки, токсичные для вида чешуекрылых совка-ипсилон, включая белки, имеющие аминокислотную последовательность, как указано в SEQ ID NO: 2 от позиции 256 до 606 (белок BCW 001), и белки, имеющие аминокислотную последовательность, как указано в любой из SEQ ID NO: 4 и SEQ ID NO: 6 от аминокислотной позиции 257 до 607 (в данном документе соответственно обозначаемые как токсичный белок BCW 002 и токсичный белок BCW 003).

[0010] Такие инсектицидные белки также проявляют активность против видов чешуекрылых, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.

[0011] Белки согласно данному изобретению также могут проявлять биологическую активность в отношении видов чешуекрылых, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.

[0012] Белки согласно данному изобретению и рассматриваемые в данном документе конструкции могут быть включены в любой вектор, включая плазмиды, космиды, фагмиды и т. п.

[0013] Такие векторы могут быть использованы для введения конструкций согласно данному изобретению в любое количество клеток-хозяев, включая бактериальные клетки, дрожжевые клетки и клетки растений.

[0014] Клетками-хозяевами, которые являются дрожжевыми клетками, могут быть Saccharomyces cereviseae или Saccharomyces pombe, и т. п. Бактериальные клетки-хозяева могут представлять собой любое количество известных таких клеток-хозяев, включая, но не ограничиваясь Е. coli, B. thuringiensis, и другие родственные бациллы. Растительные клетки-хозяева могут быть получены из любого количества видов растений, включая, но не ограничиваясь растительными клетками из: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы.

[0015] Трансгенные растения, в частности трансгенные растения кукурузы, хлопка и сои, могут быть получены путем введения конструкций согласно данному изобретению, содержащих подходящим образом модифицированные полинуклеотидные последовательности, такие как указанные в SEQ ID NO: 7, SEQ ID NO: 9 и SEQ ID NO: 11, например, в геном таких растительных клеток и путем восстановления фертильного трансгенного растения кукурузы, сои или хлопка, содержащего в своем геноме генетическую конструкцию для экспрессии по меньшей мере белкового токсина согласно данному изобретению, то есть BCW 001, BCW 002 или белкового токсина BCW 003. Такие трансгенные растения будут иметь внедренную в их растительный геном полинуклеотидную конструкцию, содержащую по меньшей мере гетерологичный промоторный сегмент, функционально связанный с нуклеотидной последовательностью, кодирующей инсектицидный белок BCW 001, BCW 002 или BCW 003, имеющий аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12, или их инсектицидный белковый фрагмент.

[0016] Семена также рассматриваются в качестве признака изобретения, в котором семена получают из таких трансгенных растений, и такие семена содержат определяемое количество полинуклеотидной конструкции, введенной в геном растения. Пыльца, семена, растительные клетки потомства, растительная ткань и товарные продукты, полученные из каждого такого трансгенного растения, будут содержать детектируемое количество полинуклеотидной конструкции.

[0017] Любой биологический образец, который содержит, по меньшей мере, детектируемое количество полинуклеотидной конструкции, кодирующей такой белок BCW 001, BCW 002 или BCW 003, будет находиться в пределах объема изобретения.

[0018] Предложены композиции, которые обеспечивают инсектицидно эффективное количество белка BCW 001, 002 или 003 согласно данному изобретению и предназначены для борьбы с видами чешуекрылых-вредителей. Такие композиции могут также содержать дополнительный агент, который отличается от токсичного белка BCW. Такой агент также будет токсичным для тех же видов чешуекрылых, что и токсичный белок BCW. Дополнительный агент должен быть выбран из группы агентов, состоящей из белков или полипептидов, аминокислотная последовательность которых отличается от белка BCW, и также может быть агентом, представляющим собой молекулу РНК, оказывающую токсическое действие на целевое насекомое-вредителя (такую как дцРНК, микроРНК или малая интерферирующая РНК (миРНК)), а также может быть инсектицидным химическим соединением, таким как пиретрин, фосфорорганический пестицид и т. п. В альтернативном варианте, дополнительный агент может быть любым совместимым Cry или родственным токсичным белком, таким как другой Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae (но они не являются предпочтительными, поскольку они могут не обеспечивать соответствующие свойства для контроля устойчивости), или Cry1B, Cry1C, Cry1D, Cry1E, Cry1F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853, TIC1415, VIP3A, VIP3Ab, инсектицидными белками Axmi, инсектицидными белками DIG, eHIPs и белками VIP и любым токсичным белком, известным в данной области техники, для обеспечение токсических свойств в отношение личинок вида совки-ипсилон или применимых к другим видам-мишеням чешуекрылых вредителей.

[0019] Такие композиции могут также содержать дополнительные пестицидные агенты, которые необязательно являются токсичными для одного и того же вредителя-мишени, такие как дополнительные агенты, выбранные из группы, состоящей из Cry1C, Cry3A, Cry3B, Cry34, Cry35, Cry51Aa1, ET29, ET33, ET34, ET70, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, 5307, DIG-10, Axmi184, Axmi205 и AxmiR1.

[0020] Также предусматриваются способы получения семян, в которых используется полезные пестицидные свойства белков согласно данному изобретению. Такие способы включают в себя полинуклеотидную конструкцию, спроектированную для экспрессии белка BCW 001, BCW 002 или BCW 003, или белка, показывающего по меньшей мере около 90% идентичность с указанным белком, причем указанный способ включает в себя посадку одного или большего количества семян, которые содержат полинуклеотид, экспрессирующий один или большее количество белковых токсинов BCW согласно данному изобретению, выращивание растений из таких семян и затем сбор урожая таких семян из растений. Собранное семя будет содержать полинуклеотидную конструкцию и даст растения, которые также будут устойчивы к заражению совкой-ипсилон.

[0021] Такими растениями могут быть кукуруза, хлопок, соя или любые другие растения, восприимчивые к видам чешуекрылых-вредителей, которые, как продемонстрировано, контролируются белками согласно данному изобретению. Предполагается, что такие растения являются предварительно полученными трансгенными растениями, которые получат пользу от эффектов токсических свойств белков согласно данному изобретению. Растения кукурузы, попадающие в эту категорию, включают в себя, но не ограничиваются лишь трансформантами, выбранными из группы, состоящей из: DKB89614-9, MON801, MON802, MON809, MON810, MON863, MON88017, MON89034, трансформанта 4114-3, трансформанта 5307, DAS59122-7, Bt10, Bt11, Bt176, CBH-351, DKB-83614-9, MIR162, MIR604, TC1507, TC6275, трансформанта 676, трансформанта 678, трансформанта 680, трансформанта 98140, DAS40278-9, DKB89790-5, MON21-9, HCEM485, MON832, MON87427, NK603, T14, T25 и VCO01981-5. Растения сои, которые попадают в эту категорию трансгенных растений, выбирают из группы, состоящей из: MON87751, DAS81419-2, MON87701, A2704-12, A2704-21, A5547-127, A5547-35, CV127, DAS44406-6, DAS68416-4, DP356043, FG72, MON4032, ACS-GM003-1, MON87705, MON87708, MON89788, W62, W98 и GFM Cry1A. Трансгенные растения хлопка, попадающие в эту категорию, выбирают из группы, состоящей из: DAS24236-5, DAS21023-5, трансформанта 31707, трансформанта 31803, трансформанта 31807, трансформанта 31808, трансформанта 42317, BNLA-601, COT102, COT67B, трансформанта 1, GHB119, GK12, MON15985, MLS9124, MON1076, MON531, MON757, T303-3, T304-40, SGK321, трансформанта 19-51a, GHB614, LLCotton25, MON88701, MON88702, MON1445, MON1698 и MON88913. Трансгенные растения сахарного тростника, попадающие в эту категорию, включают в себя трансформант NXI-1T сахарного тростника. Известные в данной области техники растения риса, которым было бы полезно иметь конструкцию, кодирующую такие белковые токсины BCW, включают в себя трансформанты риса, выбранные из группы, состоящей из: LLRICE06, LLRICE601, LLRICE62, GM-A17054 и GM-A17054.

[0022] Дополнительно, предложены обработанные растительные продукты, которые содержат детектируемое количество раскрытых рекомбинантных полинуклеотидов. Такие обработанные продукты включают в себя, но не ограничиваются лишь этими: растительную биомассу, масло, шрот, корм для животных, муку, хлопья, отруби, пух, шелуху и обработанные семена.

[0023] Также предлагаются способы получения трансгенных растений. Такие способы включают в себя введение рекомбинантного полинуклеотида в клетку растения и отбор трансгенного растения, которое экспрессирует ингибирующее насекомых количество рекомбинантного полипептида, кодируемого рекомбинантным полинуклеотидом.

[0024] Другие варианты осуществления, признаки и преимущества изобретения будут очевидны из следующего подробного описания, примеров и формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[0025] На Фиг. 1 изображен список видов чешуекрылых насекомых-вредителей, которые были протестированы в биоанализах с токсичными белками BCW 001, BCW 002 и BCW 003. «+» указывает на смертность относительно контроля в виде буфера; «-» указывает на отсутствие статистически значимой наблюдаемой смертности выше уровня контроля в виде буфера; «НД» означает, что не тестировалось с использованием соответствующего токсичного белка. BCW 001 продемонстрировал вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea, Ostrinia nubilalis (огневка кукурузная), Diatraea grandiosella, Trichoplusia ni, Pseudoplusia includens, и не продемонстрировал вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка). Diatraea saccharalis не тестировали с BCW 001. BCW 002 проявил вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea (совка хлопковая), и Ostrinia nubilalis (огневка кукурузная), и не проявил вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка). Diatraea saccharalis, Diatraea grandiosella (огневка кукурузная юго-западная), Trichoplusia ni (совка капустная), и Pseudoplusia includens (соевая совка) не тестировали с BCW 002. BCW 003 проявил вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea (совка хлопковая), Ostrinia nubilalis (огневка кукурузная), Diatraea saccharalis, Diatraea grandiosella, Trichoplusia ni (совка капустная), и Pseudoplusia includens (соевая совка), и не проявил вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка).

[0026] На Фиг. 2 изображено выравнивание аминокислотной последовательности BCW 001 (SEQ ID NO: 2, верхняя) против BCW 002 (SEQ ID NO: 4, средняя), и против BCW 003 (SEQ ID NO: 6, нижняя); звездочки под тремя последовательностями представляют различия по аминокислоте в выбранной позиции по меньшей мере в одной из трех различных последовательностей.

КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

[0027] SEQ ID NO: 1 представляет собой нуклеотидную последовательность природного штамма EG4384 B. thuringiensis, кодирующую токсичный для чешуекрылых белок BCW 001.

[0028] SEQ ID NO: 2 является установленной аминокислотной последовательностью BCW 001 из открытой рамки считывания, как указано в SEQ ID NO: 1.

[0029] SEQ ID NO: 3 представляет собой искусственную последовательность, кодирующую химерный токсичный для чешуекрылых белок BCW 002.

[0030] SEQ ID NO: 4 представляет собой установленную аминокислотную последовательность BCW 002 из открытой рамки считывания, как указано в SEQ ID NO: 3, в которой такой белок BCW 002 состоит из домена I Cry1Ac, функционально связанного с доменами II и III BCW 001 (с аминокислотной позиции 258 до аминокислотной позиции 606, как указано в SEQ ID NO: 2) и функционально связанного с доменом протоксина Cry1Ac с аминокислотной позиции 608 до 1177, как указано в SEQ ID NO: 4 и SEQ ID NO: 6. SEQ ID NO: 4 (BCW 002) отличается от SEQ ID NO: 6 (BCW 003) только в позиции 259, BCW 002 содержит изолейцин в данной позиции, BCW 003 содержит треонин, как в BCW 001.

[0031] SEQ ID NO: 5 представляет собой искусственную последовательность, кодирующую химерный токсичный для чешуекрылых белок BCW 003.

[0032] SEQ ID NO: 6 представляет собой установленную аминокислотную последовательность BCW 003 из открытой рамки считывания, как указано в SEQ ID NO: 3, в которой такой белок BCW 003 состоит из домена I Cry1Ac, функционально связанного с доменами II и III BCW 001 (с аминокислотной позиции 258 до аминокислотной позиции 606, как указано в SEQ ID NO: 2) и функционально связанного с доменом протоксина Cry1Ac с аминокислотной позиции 608 до 1177, как указано в SEQ ID NO: 4 и SEQ ID NO: 6. SEQ ID NO: 6 (BCW 003) отличается от SEQ ID NO: 4 (BCW 002) только в позиции 259, BCW 002 содержит изолейцин в данной позиции, BCW 003 содержит треонин, как в BCW 001.

[0033] SEQ ID NO: 7 представляет собой искусственную последовательность, кодирующую белок BCW 001 для экспрессии в растениях.

[0034] SEQ ID NO: 8 представляет собой установленную аминокислотную последовательность BCW 001, полученную из SEQ ID NO: 7.

[0035] SEQ ID NO: 9 представляет собой искусственную последовательность, кодирующую белок BCW 002 для экспрессии в растениях.

[0036] SEQ ID NO: 10 представляет собой установленную аминокислотную последовательность BCW 002, полученную из SEQ ID NO: 9.

[0037] SEQ ID NO: 11 представляет собой искусственную последовательность, кодирующую белок BCW 003 для экспрессии в растениях.

[0038] SEQ ID NO: 12 представляет собой установленную аминокислотную последовательность BCW 003, полученную из SEQ ID NO: 11.

ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

[0039] Альтернативой борьбе с сельскохозяйственными вредителями культурных растений путем опрыскивания готовыми формами, содержащими инсектицидные белки, растений/семян является вставка полинуклеотидов, кодирующих данные белки, в геном растения для экспрессии в растении или частях растения. Растения, трансформированные такими полинуклеотидами, обладают устойчивостью к насекомым, которую данные экспрессированные белки обеспечивают в качестве трансгенных признаков.

[0040] Чтобы избежать развития или обойти устойчивость насекомых к используемым в данное время белкам, для борьбы с чешуекрылыми необходимы новые белки с другим способом действия (СД), а также широким спектром и эффективностью. Одним из способов решить данную проблему является секвенирование геномов Bt в надежде открыть новые инсектицидные белки. Другой подход заключается в обмене сегментов из различных белков Bt для создания новых химерных белков Bt, обладающих ингибирующими свойствами в отношении насекомых. Вероятность произвольного создания химерного белка с улучшенными свойствами путем рекомбинирования доменных структур многочисленных природных инсектицидных кристаллических белков, известных в данной области техники, крайне мала (смотрите, например, A Strategy for Shuffling Numerous Bacillus thuringiensis Crystal Protein Domains; J. Economic Entomology, 97 (6): 1805-1813. 2004).

[0041] В данном документе раскрыты нуклеотидные последовательности, которые кодируют инсектицидные белки, обозначенные в данном документе как белки BCW, которые удовлетворяют потребность в альтернативном СД, обеспечивают активность против более широкого спектра насекомых-вредителей и действуют, задерживая или предотвращая развитие устойчивости, особенно при использование в борьбе с вредителями совки-ипсилон (BCW).

[0042] BCW 001 был открыт как открытая рамка считывания, предсказывающая аминокислотную последовательность, имеющую характеристики белка типа Cry1A, после секвенирования генома штамма EG4384 Bacillus thuringiensis. Открытая рамка считывания BCW 001 (ORF) кодировала белок из 1180 аминокислот, и было предсказано, что белок обладает многими характеристиками белковых токсинов Cry1, включая идентифицируемую структуру доменов I, II и III и характерный домен протоксина типа Cry1A на карбоксиконцевой половине предсказанного белка. Предсказанная аминокислотная последовательность домена I (остатки с 1 по около 258 SEQ ID NO: 2) демонстрирует около 67% идентичность с доменом I белкового токсина Cry1Ac. Предсказанная аминокислотная последовательность домена II (остатки от около 259 до около остатка 459, как указано в SEQ ID NO: 2) демонстрирует полную (100%) идентичность с доменом II Cry1Ai2. Предсказанная аминокислотная последовательность домена III (остатки от около 260 до около 606, как указано в SEQ ID NO: 2) демонстрирует около 63% идентичность с соответствующими остатками домена III в Cry1Ah2. Структура домена протоксина предсказанного белка BCW 001 (от около остатка 607 до 1180, как указано в SEQ ID NO: 2) демонстрирует около 96% идентичность с соответствующими остатками в Cry1Aa9. В целом, этот предсказанный полноразмерный белок демонстрирует около 83% идентичности аминокислотной последовательности с Cry1Ai, а предсказанная область токсина от аминокислотной позиции 1 до около остатка 607, как указано в SEQ ID NO: 2, демонстрирует 76% идентичность с Cry1Ai1. Трудно отнести этот новый токсичный белок к определенному классу Cry1A, и поэтому комитету по номенклатуре Bacillus thuringiensis будет предоставлена данная последовательность и он определит, заслуживает ли этот белок свой собственный отдельный и новый класс.

[0043] Белок BCW 001 был получен из плазмидного вектора в некристаллоносном штамме Bacillus thuringiensis, а препараты кристаллов спор были протестированы против разнообразных чешуекрылых. Смотрите Фиг. 1, столбец 2 касательно данных. Факты указывают на то, что данный белок не схож с любым из белков, с которыми он разделяет источник происхождения, то есть токсичными белками Cry1Aa, Cry1Ah или Cry1Ai, известными в данной области техники. Ни один из белков предшествующего уровня техники не проявляет сколько-нибудь заметной активности при тестировании против совки-ипсилон, однако данной новый белок BCW 001 был токсичным в биоанализах при тестировании против совки-ипсилон и неожиданно проявлял токсические свойства при тестировании против группы других чешуекрылых, как изложено в Фиг. 1.

[0044] В частности, в биоанализах по сравнению с необработанным контрольным рационом насекомых белок BCW 001 проявлял активность против Striacosta albicosta («WBC»), Helicoverpa zea («CEW»), огневки кукурузной («ECB», Ostrinia nubilalis), Diatraea grandiosella («SWC»), Pseudoplusia includes («SL»), Trichoplusia ni («CLW»), и совки ипсилон 1-3 личиночной стадии («BCW», Agrotis ipsilon).

[0045] Как описано дополнительно ниже, химерные токсичные белки получали с использованием домена I Cry1Ac, и доменов II и III BCW 001 (то есть BCW 002 и BCW 003, как указано в SEQ ID NO: 4 и SEQ ID NO: 6, соответственно), и данные химерные токсичные белки были введены в растения кукурузы и сахарного тростника. Оба химерных белка проявляли активность в кукурузе против BCW, WBC, CEW и SWC. BCW 003 проявлял активность в отношении SCB в сахарном тростнике.

[0046] Термин «белок BCW», как используется в данном документе, относится к любому новому ингибирующему насекомых белку, который содержит, который состоит из, который является по существу гомологичным, или который получен из любой ингибирующей насекомых полипептидной последовательности: BCW 001 (SEQ ID NO: 2), BCW 002 (SEQ ID NO: 4) и BCW 003 (SEQ ID NO: 6) и их сегментов, ингибирующих насекомых, или их комбинаций, которые обеспечивают активность против чешуекрылых, в частности, но не ограничиваясь, BCW, WBC и/или SCB. Полинуклеотид, кодирующий BCW 001, был получен из штамма EG4384. Основная токсичная аминокислотная последовательность для BCW 001 соответствует аминокислотам от около позиции 28 до около позиции 606 и до позиции 618, как указано в SEQ ID NO: 2, а основная токсичная аминокислотная последовательность для BCW 002 и 003 соответствует аминокислотам от около позиции 29 до около позиции 607 и до около позиции 619, как указано в SEQ ID NO: 4 и SEQ ID NO: 6, соответственно.

[0047] В одном варианте осуществления, белки, раскрытые в данном документе, являются родственными по первичной структуре дельта-эндотоксину по длине (около 1176-1180 аминокислот), по длине белка без протоксина (от около 600 до около 619 аминокислот), по длине основной части токсина (около 591 аминокислот) или по наличию по меньшей мере одного специфического для BCW сегмента.

[0048] Иллюстративные белки были выровнены друг с другом с использованием алгоритма Clustal W, давая в результате число аминокислотных совпадений для пар выравнивания и процент аминокислотной идентичности для пар выравнивания с использованием данных параметров по умолчанию: Матрица вессов: Blosum; Штраф за открытие пропуска: 10,0; Штраф за продление пропуска: 0,05; Гидрофильные пропуски: Вкл.; Гидрофильные остатки: GPSNDQERK; Штрафы за пропуск по конкретным остаткам: Вкл. The Clustal W algorithm is described in Thompson, J.D., Higgins, D.G. and Gibson, T.J. (1994) "CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice." Nucleic Acids Research, 22:4673-4680.

[0049] Другие алгоритмы выравнивания также доступны в данной области техники и обеспечивают результаты, аналогичные тем, которые получены с использованием выравнивания Clustal W.

[0050] Термин «около» используется в данном документе для описания того, что данные границы сегментов могут отличаться на 1, 2, 3, 4, 5, 10, 20, 25, 30 или 35 остатков, в зависимости от последовательности исходных белков и их выравнивания друг с другом. Чтобы дополнительно описать изменчивость и конфигурацию различных сегментов, в Таблицах 2 и 3 приведены границы сегментов BCW 002 и 003, и других активных против совки-ипсилон химерных белков.

[0051] Термин «фрагмент» используется в данном документе для описания непрерывных аминокислотных или нуклеотидных последовательностей, которые короче, чем полная аминокислотная или нуклеотидная последовательность, описывающая токсичный белок BCW.

[0052] Фраза «ингибитор насекомых» и «инсектицид» используются в данном документе взаимозаменяемо и относятся к белку, фрагменту белка, сегменту белка или полинуклеотиду, который приводит к любому измеримому подавлению жизнеспособности, роста, развития насекомых, размножения насекомых, поведения насекомых при кормлении, брачного поведения насекомых и/или любому измеримому уменьшению неблагоприятных эффектов, вызванных поглощением насекомым данного белка, фрагмента белка, сегмента белка или полинуклеотида.

[0053] Термины «биологическая активность», «активный», «активность», «эффективный», «эффективность» или их вариации используются в данному документе взаимозаменяемо для описания эффектов белков согласно данному изобретению на целевых насекомых-вредителей.

[0054] Культура - это само-распространяемое или культивируемое растение, продукт которого собирают в какой-то момент его стадии роста. Неограничивающими примерами таких продуктов являются семя, коробочка, лист, цветок, стебель, корень или любая их часть.

Биологический образец, полученный из любой ткани растения, бактерии, вируса или вектора, содержащих полинуклеотид или экспрессирующих белок, как проиллюстрировано в данном документе, такой как, но не ограничиваясь лишь этими: семя, коробочка, лист, цветок, стебель, корень или любая его часть, и содержащих определяемое количество полинуклеотида, белка или обоих.

[0055] Фраза «определяемое количество» используется в данном документе для описания минимального количества белка или полинуклеотида, раскрытого в данном документе, которое может быть обнаружено стандартными аналитическими способами, такими как, но без ограничения, полимеразная цепная реакция (ПЦР) и иммуноферментный анализ (ИФА), и т. п.

[0056] В одном варианте осуществления, токсины, описанные в данном документе, связаны общей функцией и проявляют инсектицидную активность в отношении видов чешуекрылых насекомых.

[0057] Сегменты BCW 001 обеспечивают активность против совки-ипсилон химерам Cry1, которые содержат такие сегменты. Примеры сегментов BCW 001, которые придают активность против совки-ипсилон, приведены в SEQ ID NO: 2 от около аминокислотной позиции 250 до около 606, и более конкретно от около аминокислотной позиции 255 до около 606. Химеры Cry1, содержащие данный аминокислотный сегмент, соответствующий доменам II и III токсичного белка BCW 001, часто также будут иметь помимо свойств химерного белка токсические свойства, связанные с контролем совки-ипсилон, и это было проверено в каркасах Cry1A, Cry1B, Cry1C, Cry1D, Cry1E и Cry1F, в которых соответствующая токсичная конструкция имела компоненты домена II и III, замещенные данным участком аминокислот из BCW 001, и во многих случаях активность против совки-ипсилон неожиданно сохранялась в химерной конструкции (данные не показаны).

[0058] В одном аспекте изобретения, вредитель, контролируемый применимым токсичным белком BCW, является, в частности, насекомым-вредителем отряда Lepidoptera, включая взрослых особей, куколок, личинок и только появившихся личинок.

[0059] Насекомые отряда чешуекрылых (Lepidoptera) включают в себя, но не ограничиваются лишь этими: насекомых из семейства совок (Noctuidae) (гусеницы, бабочка-совка, пяденицы, heliothines), (например кукурузную лиственную совку (Spodoptera frugiperda), совку помидорную (Spodoptera exigua), Mamestra configurata, совку-ипсилон (Agrotis ipsilon), Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Agrotis orthogonia, Pseudaletia unipuncta; точильщиков, чехлоносиков и других насекомых из семейства огневок (Pyralidae), например огневку кукурузную (Ostrinia nubilalis), Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus; насекомых из семейства листоверток (Tortricidae), например яблонную плодожорку (Cydia pomonella), Endopiza viteana, восточную плодожорку (Grapholita molesta), Suleima helianthana; и многих других экономически важных чешуекрылых (например, капустную моль (Plutella xylostella), Pectinophora gossypiella, и непарного шелкопряда (Lymantria dispar)). Другие насекомые-вредители отряда чешуекрылых (Lepidoptera) включают в себя, например, Alabama argillacea, Archips argyrospila, Archips rosana и другие виды Archips, Chilo suppressalis (огневку желтую рисовую), Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Earias vittella, Helicoverpa armigera (совку хлопковую), Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana (гроздьевую листовертку), Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae (капустницу), Pieris rapae (репницу), Plutella xylostella (капустную моль), Spodoptera exigua, Spodoptera litura, S. frugiperda, и Tuta absoluta (томатную минирующую моль).

[0060] Раскрытые в данном документе белки также могут быть использованы для получения антител, которые специфически связываются с BCW-специфичными токсичными белками, и могут использоваться для скрининга и поиска других представителей семейства токсинов BCW.

[0061] В одном варианте осуществления, иллюстративные полинуклеотиды, которые кодируют ингибирующие насекомых белки, родственные BCW 001, указаны в SEQ ID NO: 1, 3, 5, 7, 9 и 11. Нуклеотидные последовательности, кодирующие данные белки, можно использовать в качестве зондов и праймеров для скрининга для идентификации других представителей семейства с использованием способов термической или изотермической амплификации и/или гибридизации и других способов идентификации, известных специалистам в данной области техники.

[0062] Согласно аспекту изобретения, предложены способы обнаружения родственных белков, и такие способы включают в себя секвенирование геномов Bt, сборку данных секвенирования, идентификацию и клонирование генов Bt, кодирующих такие пестицидные белки, а также экспрессию и тестирование новых белков Bt для анализа пестицидной активности. В другом аспекте изобретения используются молекулярные способы для конструирования и клонирования коммерчески полезных белков, включающих в себя химеры белков из семейства пестицидных белков, например, химеры могут быть собраны из сегментов токсичных белков BCW для получения дополнительных вариантов осуществления. Раскрытые белки могут быть подвергнуты выравниванию друг с другом и с другими пестицидными белками Bt, и могут быть идентифицированы сегменты каждого такого белка, которые полезны для замещения между выровненными белками, что приводит к конструированию химерных белков. Такие химерные белки могут быть подвергнуты анализу - биоанализу с вредителем, и охарактеризованы на наличие повышенной биологической активности или расширения спектра вредителей-мишеней, по сравнению с исходными белками, из которых был получен каждый такой сегмент химеры. Пестицидную активность полипептидов можно дополнительно сконструировать в виде активности против конкретного вредителя или более широкого спектра вредителей путем замены доменов или сегментов таковыми из других белков.

[0063] В одном варианте осуществления, белки, раскрытые в данном документе, включат в себя функционально эквивалентные фрагменты (N- или C-концевые делеции) белков, раскрытых в данном документе.

[0064] BCW токсичные белки предложены в данном документе. В некоторых вариантах осуществления, могут быть выделены, могут быть представлены в композиции, в трансгенном микроорганизме или в трансгенном растении токсины, родственные BCW 001. В данном варианте осуществления, белки BCW 002 и, в частности, белки BCW 003 обеспечивают ингибирующую активность в отношении чешуекрылых, особенно ингибирующую активность в отношении совки-ипсилон и/или Diatraea saccharalis. Отсылка в данной заявке к «выделенному белку», или эквивалентному термину или фразе, предназначена для обозначения того, что белок представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, токсичные белки согласно данному изобретению и т. п., которые естественным образом обнаруживаются в организме, не считаются «выделенными», если они находятся в организме, в котором они находятся в естественном состояние. Однако, каждый из них будет «выделен» в рамках данного раскрытия изобретения, если белок не находится в организме, в котором он находится в естественном состояние.

[0065] Термин «функционально связанный», как используется в данном документе, относится к соединению последовательностей нуклеиновых кислот или аминокислотных последовательностей, так что одна последовательность может обеспечивать требуемую функцию или совместимое или полезное свойство для связанной последовательности.

[0066] Пептиды, полипептиды и белки, биологически функционально эквивалентные BCW 001, BCW 002 и BCW 003, включают в себя, но не ограничиваются лишь этими: аминокислотные последовательности, содержащие консервативные аминокислотные замены в данных белковых последовательностях токсичного белка BCW. В таких аминокислотных последовательностях одна или большее количество аминокислот в последовательности замещены другой аминокислотой (аминокислотами), что приводит к молчащей или консервативной замене в аминокислотной последовательности.

[0067] Хотя раскрытые ингибирующие насекомых полипептиды предпочтительно содержат белковую последовательность BCW 001, BCW 002 или BCW 003, фрагменты и варианты данной последовательности, обладающие такой же или сходной ингибирующей активностью в отношении насекомых, что и активность данного ингибирующего насекомых белка, также раскрыты в данном документе. Например, смежные последовательности из по меньшей мере 30, 35, 38, 40, 45, 50, 55, 60, 65, 70, 75, 100, 150, 200, 500, 550 или большего количества аминокислот в родственном BCW токсичном белке с ингибирующей активностью в отношении насекомых. В другом варианте осуществления, фрагменты родственного BCW токсичного белка с ингибирующей активностью в отношении насекомых могут содержать аминокислотные замены, делеции, вставки или добавления в последовательности токсичного белка BCW.

[0068] В одном варианте осуществления, ингибирующий насекомых полипептид содержит ингибирующий насекомых сегмент от около остатка 28 до около остатка 618 белковой последовательности BCW 001, как указано в SEQ ID NO: 2. Неограничивающие примеры включают в себя любую из SEQ ID NO: 2, 4 или 6, или более короткие фрагменты, или варианты, обладающие такой же или сходной ингибирующей активностью в отношении насекомых, что и активность данного конкретного белка BCW 001, сами по себе или в функциональной связи в химерным белком. В другом варианте осуществления, сегменты, имеющие смежные аминокислотные последовательности, по меньшей мере, около 38 или большего количества аминокислот в любой из SEQ ID NO: 2, 4 или 6, обладающие ингибирующей активностью в отношении насекомых, также дают функциональный инсектицидный белок. Ингибирующие насекомых токсичные фрагменты BCW 001 также могут содержать сегменты, по меньшей мере, с 30, 35, 38, 40, 45, 50, 100, 150, 200, 500, 550, 555, 560, 565, 570, 572, 574, 580 или 585 аминокислотными остатками из области 591 аминокислотного остатка, соответствующей остаткам от около 28 до около 618 последовательностей, любой из SEQ ID NO: 2, 4 или 6.

[0069] В некоторых вариантах осуществления, фрагменты зрелого белка BCW 001 (зрелый обозначает протоксиновую форму белка, состоящую из 1180 аминокислот, расщепляемую путем протеолиза в кишечнике насекомого-вредителя, чтобы высвободить только N-концевое ядро токсина до остатка 607 включительно около остатка 618, высвобождая активный сегмент токсина, содержащего, больше или меньше, остатки с 1 по 606 или любое количество остатков от около 5 до около 618, как указано в SEQ ID NO: 2, при условии, что высвободившийся сегмент проявляет токсические свойства при воздействии на личинки совки-ипсилон) могут быть усеченными формами, в которых одна или большее количество аминокислот удалены с N-конца, С-конца, середины белка или их комбинаций, с активностью в виде подавления насекомых. Эти фрагменты могут быть природными или синтетическими вариантами BCW 001 и сохранять ингибирующую активность в отношение насекомых токсичного белка BCW. В некоторых вариантах осуществления, фрагменты зрелых белков BCW 001, BCW 002 или BCW 003 проявляют пестицидную активность, которой обладают исходные молекулы белка, из которых они получены. Описанный в данном документе фрагмент или вариант может дополнительно содержать обозначенный в данном документе домен, который отвечает за пестицидную активность белка. Усеченное производное, обладающее ингибирующей активностью в отношении насекомых, представляет собой токсичный белок BCW, соответствующий остаткам от около 28 до около 606, или до около 618 последовательности токсичного белка BCW 001, как указано в SEQ ID NO: 2, или остаткам от около 29 до около 607 и до остатка 619 токсичного белка BCW, как указано в SEQ ID NO: 4 или SEQ ID NO: 6.

[0070] Еще в одном варианте осуществления, укороченные N-концевые делеционные мутации включают в себя, но не ограничиваются токсичными белками BCW 001, в которых отсутствуют аминокислотные остатки либо с N-конца, и/или с С-конца токсичной части без протоксина, либо токсическое ядро токсичных белков BCW. Например, от 1 до 6 N-концевых аминокислотных остатков токсичного ядра белка BCW 001, соответствующего остаткам с 28 по 618 SEQ ID NO: 2 или остаткам с 29 по 619 SEQ ID NO: 4 или 6, могут быть удалены. Усеченные С-концевые делеционные мутанты токсичного белка BCW, соответствующего остаткам с 28 по 618 последовательности SEQ ID NO: 2 или остаткам с 29 по 619 последовательности SEQ ID NO: 4 или 6, включают в себя, но не ограничиваются токсичными белками BCW, в которых отсутствуют от 1 до 6 С-концевых аминокислотных остатков. В других вариантах осуществления, токсичный белок BCW с соответствующими остатками 28-618 SEQ ID NO: 2 или соответствующими остатками 29-619 SEQ ID NO: 4 или 6, может иметь как N-концевое усечение от 1 до 6 аминоконцевых остатков, так и С-концевое усечение от 1 до 6 карбоксиконцевых остатков.

[0071] В некоторых вариантах осуществления, отдельные сегменты с 1 по 6 белка CPR24719 или комбинация из сегментов с 1 по 6, которые предоставляют активность против совки-ипсилон белку, отличающемуся от CPR24719-1, также могут проявлять ту же или подобную функцию.

[0072] Фрагменты и варианты токсичного белка BCW, раскрытые в данном документе, могут обладать около 62% или больше идентичности последовательности, около 65%, 70%, 75%, 80%, 85%, 90%, 92%, 95%, 96%, 97%, 98% или больше идентичности последовательности и около 99%, 99,5%, 100% идентичности аминокислотной последовательности с соответствующими сегментами зрелого токсичного белка BCW, имеющего соответствующие аминокислотные последовательности, показанные как остатки 28-618 SEQ ID NO: 2 или остатки 29-619 SEQ ID NO: 4 или 6.

[0073] Вариант осуществления изобретения включает в себя рекомбинантные полинуклеотидные композиции, которые кодируют токсичные белки BCW. Например, токсичные белки BCW могут экспрессироваться с помощью рекомбинантных конструкций ДНК, в которых выделенная полинуклеотидная молекула с открытой рамкой считывания, кодирующей белок, функционально связана с такими элементами, как промотор и любой другой регуляторный элемент, функционирующий для экспрессии в системе, для которой предназначена конструкция. Отсылка в данной заявке к «выделенной молекуле ДНК», или эквивалентному термину или фразе, предназначена для обозначения того, что молекула ДНК представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, элементы нуклеиновой кислоты, такие как кодирующая последовательность, последовательность интрона, нетранслируемая лидерная последовательность, последовательность промотора, последовательность терминации транскрипции и т.п., которые природно обнаруживают в ДНК генома организма, не считаются «выделенными» до тех пор, пока элемент находится в геноме организма и в том месте в геноме, в котором его природно обнаруживают. Однако, каждый из данных элементов, и частей таких элементов, будут «выделены» в рамках данного раскрытия изобретения, если элемент находится не в геноме организма, и не месте в геноме, в котором его природно обнаруживают. Подобным образом, нуклеотидная последовательность, кодирующая инсектицидный белок или любой встречающийся в природе инсектицидный вариант такого белка, будет представлять собой выделенную нуклеотидную последовательность, до тех пора пока нуклеотидная последовательность не находится в ДНК бактерии, в которой природно обнаруживают последовательность, кодирующую белок. Синтетическая нуклеотидная последовательность, кодирующая аминокислотную последовательность встречающегося в природе инсектицидного белка, будет считаться выделенной для целей данного раскрытия изобретения. Для целей данного раскрытия изобретения, любая трансгенная нуклеотидная последовательность, то есть нуклеотидная последовательность ДНК, вставленная в геном клеток растения или бактерии, или присутствующая во внехромосомном векторе, будет рассматриваться как выделенная нуклеотидная последовательность, независимо от того, присутствует она в плазмиде или аналогичной структуре, используемой для трансформации клеток, в геноме растения или бактерии, или присутствует в обнаруживаемых количествах в тканях, потомстве, биологических образцах или товарных продуктах, полученных из растения или бактерии. Неограничивающие примеры включают в себя функциональные в растениях промоторы, функционально связанные с последовательностями, кодирующими токсичный белок BCW, для экспрессии белка в растениях, или Bt-функциональные промоторы, функционально связанные с последовательностями, кодирующими токсичный белок BCW, для экспрессии белка в Bt. Другие элементы, которые могут быть функционально связаны с последовательностями, кодирующими токсичный белок BCW, включают в себя, но не ограничиваются лишь этими: энхансеры, интроны, лидерные последовательности, кодируемые тэги иммобилизации белка (HIS-тэг), кодируемые пептиды субклеточной транслокации (например, пластидные транзитные пептиды, сигнальные пептиды), кодируемые полипептидные сайты ферментов посттрансляционных модификаций, рибосомные сайты связывания и сайты-мишени РНКи.

[0074] Как применяется в данном документе, термин «рекомбинантная молекула ДНК» представляет собой молекулу ДНК, содержащую комбинацию молекул ДНК, которые не встречались бы в природе вместе без вмешательства человека. Например, рекомбинантная молекула ДНК может представлять собой молекулу ДНК, которая состоит по меньшей мере из двух молекул ДНК, гетерологичных по отношению друг к другу, молекулу ДНК, которая содержит последовательность ДНК, которая отличается от последовательностей ДНК, существующих в природе, или молекулу ДНК, которая была включена в ДНК клетки-хозяина путем генетической трансформации или редактирования генов. Аналогичным образом, «рекомбинантная молекула белка» представляет собой молекулу белка, содержащую комбинацию аминокислот, которые не встречались бы в природе вместе без вмешательства человека. Например, рекомбинантная молекула белка может быть молекулой белка, которая состоит по меньшей мере из двух аминокислотных молекул, гетерологичных по отношению друг к другу, молекулой белка, которая содержит аминокислотную последовательность, которая отличается от аминокислотных последовательностей, существующих в природе, или молекулой белка, которая экспрессируется в клетке-хозяине в результате генетической трансформации клетки-хозяина или из-за редактирования генов генома клетки-хозяина.

[0075] Иллюстративные рекомбинантные полинуклеотидные молекулы, предложенные в данном документе, включают в себя, но не ограничиваются лишь этими: SEQ ID NO: 7, SEQ ID NO: 9 и SEQ ID NO: 11, а также каждый из нуклеотидных сегментов, указанных в SEQ ID NO: 3 и SEQ ID NO: 5 и которые кодируют соответствующие полипептиды или белки, имеющие аминокислотную последовательность, как указано в SEQ ID NO: 2 (BCW oo1), SEQ ID NO: 4 (BCW 002), SEQ ID NO: 6 (BCW 003) и SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12. Раскрытые в данном документе кодоны рекомбинантной полинуклеотидной молекулы, кодирующей белки, могут быть заменены синонимичными кодонами (также называемыми молчащей заменой). Также предложены рекомбинантные полинуклеотиды, кодирующие любой из белков-вариантов токсина BCW, описанных в данном документе.

[0076] Конструкция рекомбинантной ДНК, содержащая последовательности, кодирующие токсичный белок BCW, может также дополнительно содержать область ДНК, которая кодирует один или большее количество агентов, ингибирующих насекомых, которые могут быть сконфигурированы для одновременной экспрессии или ко-экспрессии с последовательностью ДНК, кодирующей токсичный белок BCW, белка, отличающегося от токсичного белка BCW, ингибирующей насекомых молекулы дцРНК или инсектицидного химического соединения. Неограничивающими примерами инсектицидных химических соединений являются органохлориды, органофосфаты и карбаматы, пиретроиды, неоникотиноиды и рианоиды.

[0077] Конструкция рекомбинантной ДНК может быть собрана таким образом, что все белки или молекулы дцРНК экспрессируются одним промотором, или каждая молекула белка или дсРНК находится под контролем отдельного промотора или какой-либо их комбинацией. Раскрытые в данном документе белки могут быть экспрессированы из мультигенной системы экспрессии, в которой один или большее количество белков, описанных в данном документе, экспрессируются из общего нуклеотидного сегмента, который также содержит другие открытые рамки считывания и/или промоторы в зависимости от типа выбранной системы экспрессии. Например, бактериальная мультигенная система экспрессии может использовать один промотор для управления экспрессией множественно связанных/тандемных открытых рамок считывания из одного оперона. В другом примере, в растительной мультигенной системе экспрессии могут использоваться мультисвязанные экспрессионные кассеты, каждая из которых экспрессирует разный белок или разный агент, такой как одна или большее количество молекул дцРНК. В еще одном примере, в растительной мультигенной системе экспрессии могут использоваться мультинесвязанные экспрессионные кассеты, каждая из которых экспрессирует разный белок или разный агент, такой как одна или большее количество молекул дцРНК. Промотор для применения в описанной в данном документе рекомбинантной нуклеиновой кислоте может содержать полную последовательность промотора или любой его вариант или фрагмент, обладающий активностью промотора или активностью генной регуляции.

[0078] Конструкция рекомбинантного полинуклеотида или рекомбинантной ДНК, содержащая последовательность, кодирующую токсичный белок BCW, может быть доставлена в клетки-хозяева векторами, например, плазмидой, бакуловирусом, искусственной хромосомой, вирионом, космидой, фагмидой, фагом или вирусным вектором. Такие векторы могут быть использованы для достижения стабильной или временной экспрессии последовательности, кодирующей токсичный белок BCW в клетке-хозяине, или последующей экспрессии в полипептид. Экзогенная конструкция рекомбинантного полинуклеотида или рекомбинантной ДНК, которая содержит последовательность, кодирующую токсичный белок BCW и которая вводится в клетку-хозяина, называется в данном документе «трансгеном».

[0079] Также в данном документе предложены трансгенные бактерии, трансгенные клетки растений, трансгенные растения, грибы и дрожжи и части трансгенных растений, которые содержат любой рекомбинантный полинуклеотид, который экспрессирует любую одну или большее количество последовательностей, кодирующих токсичный белок BCW, предложенный в данном документе. Термин «бактериальная клетка» или «бактерия» может включать в себя, но не ограничивается клеткой Agrobacterium, Bacillus, Escherichia, Salmonella, Pseudomonas или Rhizobium. Термин «клетка растения» или «растение» могут включать в себя, но не ограничиваются лишь клеткой растения или растением: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы. В некоторых вариантах осуществления, предложены трансгенные растения и части трансгенных растений, регенерированные из клетки трансгенного растения. В некоторых вариантах осуществления, трансгенные растения могут быть получены из трансгенного семени, путем размножения, разрезания, отламывания, измельчения или иным образом отсоединения части от растения. В некоторых вариантах осуществления, часть растения может быть семенем, коробочкой, листом, цветком, стеблем, корнем или любой их частью, или нерегенерируемым фрагментом части трансгенного растения. Как используется в данном контексте, «нерегенерируемая» часть трансгенной части растения представляет собой часть, которая не может быть стимулирована для образования целого растения, или которая не может быть стимулирована для образования целого растения, способного к половому и/или бесполому размножению. В некоторых вариантах осуществления, нерегенерируемая часть части растения представляет собой часть трансгенного семени, семенной коробочки, листка, цветка, стебля или корня.

[0080] В данном документе также предложены способы получения трансгенных растений, которые содержат ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. Такие растения могут быть получены путем введения рекомбинантного полинуклеотида, который кодирует любой из токсичных белков BCW, представленных в данном документе, в клетку растения, и отбор растения, полученного из указанной клетки растения, которое экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. Растения могут быть получены из растительных клеток методами регенерации, способами трансформации семян, пыльцы или меристемы.

[0081] Способы трансформации y растений известны в данной области техники. Например, Agrobacterium-опосредованная трансформация, описана в публикациях патентных заявок США № 2009/0138985A1 (соя), № 2008/0280361A1 (соя), № 2009/0142837A1 (кукуруза), № 2008/0282432 (хлопок), № 2008/0256667 (хлопок), № 2003/0110531 (пшеница), № 2001/0042257 A1 (сахарная свекла), патентах США № 5750871 (канола), № 7026528 (пшеница), и № 6365807 (рис), и в Arencibia et al. (1998) Transgenic Res. 7:213-222 (сахарный тросник).

[0082] В данном документе также предложено применение трансгенного растения, которое экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW, для борьбы с заражением насекомыми или чешуекрылыми. Любое из вышеупомянутых трансгенных растений может быть использовано в способах защиты растения от заражения насекомыми или чешуекрылыми, приведенными в данном документе. Способы получения трансгенных растений, которые экспрессируют активные против чешуекрылых белки, такие как белки Cry1A (патент США № 5880275), Cry1B (заявка на патент США № 10/525318), Cry1C (патент США № 6033874), Cry1F, химеры Cry1A/F (патенты США № 7070982; 6962705 и 6713063) и белок Cry2Ab (патент США № 7064249) являются хорошо охарактеризованными.

[0083] В данном документе также предложено применение любой из вышеупомянутых трансгенных клеток-хозяев для продуцирования токсичного белка BCW.

[0084] Дополнительные аспекты изобретения включают в себя антитела и способы обнаружения полинуклеотидов, которые кодируют токсичные белки BCW, или способы различения их фрагментов и сегментов, способы идентификации дополнительных членов семейства белков, ингибирующих насекомых, готовые формы и способы контроля роста и/или заражения насекомыми, и также способы для предоставления такого контроля растениям и другим хозяевам-реципиентам.

[0085] В некоторых вариантах осуществления, растительный продукт может включать в себя товарные или другие коммерческие продукты, полученные из трансгенного растения или части трансгенного растения, причем товарные или другие продукты могут отслеживаться по коммерческой деятельности путем обнаружения нуклеотидных сегментов, или экспрессированной РНК или белков, которые кодируют или содержат отличительные части токсичного белка BCW. Такие товарные или другие коммерческие продукты включают в себя, но не ограничиваются лишь этими: части растения, биомассу, масло, шрот, сахар, корм для животных, муку, хлопья, отруби, пух, обработанные семена и семена.

[0086] Также при этом предложены обработанные растительные продукты, причем указанный обработанный продукт содержит детектируемое количество рекомбинантного полинуклеотида, кодирующего токсичный белок BCW, его сегмент, его фрагмент, ингибирующий насекомых, или любую его отличительную часть. В некоторых вариантах осуществления, обработанный продукт выбирают из группы, состоящей из: растительной биомассы, масла, шрота, корма для животных, муки, хлопьев, отрубей, пуха, шелухи и обработанных семян. В некоторых вариантах осуществления, обработанный продукт является не регенерируемым.

[0087] Также в данном документе предложены способы борьбы с насекомыми. В некоторых вариантах осуществления, заражение чешуекрылыми культурных растений является контролируемым. Такие способы могут включать в себя выращивание растения, содержащего ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. В определенных вариантах осуществления, такие способы могут дополнительно включать в себя любое одно или большее количество из: (i) нанесения любой композиции, содержащей или кодирующей токсичный белок BCW, на растение или семя, которое дает растение; и/или (ii) трансформацию растения или растительной клетки, которая дает растение, полинуклеотидом, кодирующим токсичный белок BCW. В некоторых вариантах осуществления, растение представляет собой временно или стабильно трансформированное трансгенное растение, содержащее трансген, который экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. В некоторых вариантах осуществления, растение представляет собой нетрансгенное растение, на которое была нанесена композиция, содержащая токсичный белок BCW. В некоторых вариантах осуществления таких способов, растение представляет собой растение кукурузы или сахарного тростника. В некоторых вариантах осуществления, вид Lepidoptera представляет собой Agrotis ipsilon. В некоторых вариантах осуществления, вид Lepidoptera представляет собой Diatraea saccharalis. В некоторых вариантах осуществления, вид Lepidoptera находится на поле с культурным растением.

[0088] Увеличение количества белков, раскрытых в данном документе, либо в растениях, либо с помощью технологического процесса, может включать в себя культивирование рекомбинантных Bt-клеток в условиях для экспрессии/продуцирования рекомбинантного полипептида/белков. Такой процесс может включать в себя получение путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, седиментации или концентрирования культуры рекомбинантных Bt-клеток, экспрессирующих/продуцирующих указанный рекомбинантный полипептид. Такой процесс может привести к получению Bt-клеточного экстракта, клеточной суспензии, гомогената клеток, лизата клеток, супернатанта клеток, фильтрата клеток или осадка клеток. Получая рекомбинантные полипептиды/белки, произведенные таким образом, композиция, которая содержит рекомбинантные полипептиды/белки, может содержать бактериальные клетки, бактериальные споры и параспоральные внутриклеточные тельца, и может быть приготовлена для различных применений, включая распыляемые сельскохозяйственные продукты, ингибирующие насекомых, или в виде готовых форм, подавляющих насекомых в пищевых биоанализах.

[0089] В одном варианте осуществления, композиция/готовая форма, ингибирующая насекомых, содержащая раскрытый рекомбинантный полипептид/белок, может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую активность в отношении тех же видов чешуекрылых насекомых, но отличается от рекомбинантного полипептида, чтобы обеспечить уменьшение количества случаев появления устойчивости у чешуекрылых насекомых к токсичному белку BCW или другой композиции, ингибирующей чешуекрылых. Такой полипептид выбран из группы, состоящей из белка, ингибирующего насекомых, молекулы дцРНК, ингибирующей насекомых, и химического соединения. Один пример использования таких рибонуклеотидных последовательностей для борьбы с насекомыми-вредителями описан в публикации заявки на патент США № 2006/0021087. Примеры других таких композиций включают в себя, но не ограничиваются лишь этими: Cry1A (патент США № 5880275), Cry1Ab, Cry1Ac, Cry1Ae, Cry1B (заявка на патент США № 10/525318), Cry1C (патент США № 6033874), Cry1E, Cry1F и химеры Cry1A/F (патенты США № 7070982; № 6962705 и № 6713063), Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab (патент США № 7064249), Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853 и TIC1415. Другими неограничивающими примерами являются активные против чешуекрылых белки VIP, Axmi и DIG, такие как, но не ограниченные Vip3A, VIP3Ab, AXMI-184, AXMI-196, DIG-3, DIG-4, DIG-5 и DIG-11, которые могут быть скомбинированы с белками, описанными в данном документе.

[0090] В других вариантах осуществления, такая композиция может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую по отношению к насекомому активность, которое не подавляется другим токсичным белком BCW, ингибирующим насекомых, для расширения спектра полученного ингибирования насекомых. Например, для борьбы с жесткокрылыми насекомыми-вредителями можно использовать комбинации токсичных белков BCW, ингибирующих насекомых, с белками, активными против жесткокрылых, такими как, но не ограничиваясь лишь этими: варианты Cry1C, варианты Cry3A, Cry3Bb (патент США № 6501009), Cry34/35, 5307, Axmi184, Axmi205, AxmiR1, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, DIG-10 и eHIP (публикация заявки на патент США № 2010/0017914).

[0091] В данной области техники была задокументирована возможность насекомых развивать устойчивость к определенным инсектицидам. Одна из стратегий контроля устойчивости насекомых заключается в использовании трансгенных культур, которые экспрессируют два различных агента, ингибирующих насекомых, которые имеют различные способы действия. Следовательно, любое насекомое, обладающее устойчивостью к одному из агентов, ингибирующих насекомых, может контролироваться другим агентом, ингибирующим насекомых. Другая стратегия контроля устойчивости насекомых предусматривает использование растений, которые не защищены от видов чешуекрылых вредителей, чтобы создать для них экологическое убежище. Один конкретный пример описан в патенте США № 6551962.

[0092] Другие варианты осуществления, раскрытые в данном документе, включают в себя пестицидные химические соединения местного применения, которые предназначены для борьбы с вредителями, которых также контролируют с помощью белков, раскрытых в данном документе, для использования с белками при обработке семян, распылении, поливе, или орошение готовыми формами, которые можно непосредственно вносить в почву (почвенное орошение), применяемые к выращиваемым растениям, экспрессирующим белки, раскрытые в данном документе, или приготовленные для применения к семенам, содержащим один или большее количество трансгенов, кодирующих один или большее количество раскрытых белков. Такие готовые формы для применения при обработке семян можно наносить с различными клеящими веществами и веществами для повышения клейкости, известными в данной области техники. Такие готовые формы могут содержать пестициды, которые являются синергетическими по СД с раскрытыми белками, так что готовая форма пестицидов имеет отличающийся СД для борьбы с теми же или аналогичными вредителями, которые могут контролироваться раскрытыми белками, или так, что действие таких пестицидов контролирует более широкий диапазон хозяев-вредителей, таких как виды чешуекрылых или полужесткокрылых (Hemiptera), или другие виды вредителей растений, такие как виды жесткокрылых (Coleoptera), которые не контролируются эффективно.

[0093] Вышеупомянутая композиция/готовая форма может дополнительно содержать приемлемый с точки зрения сельского хозяйства носитель, такой как приманка, порошок, пыль, пеллеты, гранулы, спрей, эмульсия, коллоидная суспензия, водный раствор, препарат спор/кристаллов Bacillus, удобрение семян, рекомбинантная растительная клетка/растительная ткань/семя/растение, трансформированные для экспрессии одного или большего количества белков, или бактерия, трансформированная для экспрессии одного или большего количества белков. В зависимости от уровня ингибирования насекомых или инсектицидного ингибирования, присущего рекомбинантному полипептиду, и активности готовой формы, которая будет применяться в растительных или пищевых биоанализах, композиция/готовая форма может содержать различные массовые количества рекомбинантного полипептида, например, от 0,0001% до 0,001%, до 0,01%, до 1%, до 99% по массе рекомбинантного полипептида.

[0094] Раскрытые в данном документе белки можно комбинировать в готовых формах для местного применения к покровам растений, к почве, в готовых формах для обработки семян и в готовых формах с другими агентами, токсичными для в целевых видов чешуекрылых-вредителей. Такие агенты включают в себя, но не ограничиваются лишь этими: белки Cry1A, химеры Cry1B, Cry1C, Cry1F, Cry1A/F и белок Cry2Ab.

ПРИМЕРЫ

[0095] Следующие раскрытые варианты осуществления просто представляют изобретение, которое может быть воплощено в различных формах. Таким образом, конкретные структурные и функциональные детали, раскрытые в данном документе, не должны интерпретироваться как ограничивающие. Следует понимать, что полное раскрытие каждого источника, цитируемого в данном документе, включено в данный документ посредством ссылки.

Пример 1

[0096] Данный пример описывает открытие и анализ токсичного белка BCW 001 и конструирование химерных токсинов BCW 002 и BCW 003.

[0097] Было установлено, что штамм EG4384 Bt обладает активностью против чешуекрылых в пищевых биоанализах с использованием препаратов спор с кристаллами. Была получена последовательность генома данного штамма, были обработаны сырые считанные последовательности, собраны контиги из обработанных считанных последовательностей, идентифицированы открытые рамки считывания, которые показали гомологию с белками Cry1, и проанализированы полученные аминокислотные последовательности. Была идентифицирована конкретная открытая рамка считывания, как указано в SEQ ID NO: 1, которая кодирует полученную аминокислотную последовательность белка (BCW 001, SEQ ID NO: 2), которая демонстрирует новую аминокислотную последовательность по сравнению с большинством белков Cry1, известных в данной области техники. Полученный белок из открытой рамки считывания обладает всеми характеристиками нового белка типа Cry1, поскольку он имеет длину 1180 аминокислот, а выравнивание с известными белкам Cry1 указывает на то, что данный белок имеет характерную трехдоменную структуру в пределах примерно 600-630 аминоконцевых аминокислот и характерную структуру аминокислотной последовательности протоксина типа Cry1A. Полинуклеотидная последовательность, кодирующая эту предсказанную аминокислотную последовательность, содержит открытую рамку считывания, которая также является характерной для Cry1, а именно есть сайт рестрикции NheI внутри сегмента ДНК, кодирующего C-концевую область предсказанного домена I токсина, и сайт рестрикции KpnI в пределах сегмента ДНК, кодирующего N-концевую часть предсказанного прототоксинового домена.

[0098] Сравнение аминокислотной последовательности токсина BCW 001 с Cry1Ac показывает, что аминокислотный сегмент, соответствующий домену I (аминокислоты от около позиции 1 до около позиции 258), демонстрирует только около 67% идентичности такому же сегменту в Cry1Ac, аминокислотный сегмент, соответствующий домену II (аминокислоты от около позиции 58 до около позиции 460), демонстрирует очень низкий процент идентичности с таким же сегментом в Cry1Ac, а аминокислотный сегмент, соответствующий домену III (аминокислоты от около позиции 460 до около позиции 607) демонстрирует около 63% идентичности с сегментом домена III из Cry1Ah2.

[0099] Сегмент ДНК, кодирующий по существу предсказанные домены II и III, был вырезан по сайтам рестрикции от NheI до KpnI, и заменен на соответствующий сегмент кодирующей последовательности Cry1Ac в векторе экспрессии, содержащем сегмент ДНК, кодирующий Cry1Ac, что дало открытую рамку считывания состоящую из, и соединение по рамке считывания в последовательном порядке от 5`конца до 3`конца, первого сегмента, кодирующего домен I Cry1Ac, второго сегмента, кодирующего домен II и III BCW 001, и третьего сегмента, кодирующего прототоксиновый домен токсичного белка Cry1Ac. Данная химерная конструкция (SEQ ID NO: 3) кодирует химерный токсичный белок, обозначенный в данном документе как BCW 002 (SEQ ID NO: 4). Незначительное смещение точки разрыва между доменом I и доменом II дает открытую рамку считывания (SEQ ID NO: 5), кодирующую химерный токсичный белок, называемый в данном документе BCW 003 (SEQ ID NO: 6), имеющий аминокислотную последовательность, отличающуюся от BCW002 только по аминокислотной позиции 259. BCW 003, как и BCW 001, содержит треонин (T) в позиции 259, а BCW 002 содержит изолейцин (I) в данной позиции. BCW 001 отличается от BCW 002 и BCW 003, главным образом, в домене I токсина, то есть по аминокислотам 1-202, а BCW 002 и BCW 002 практически идентичны, за исключением разницы I/T в позиции 259.

Пример 2

[00100] Этот пример показывает эффективность биологической активности белков BCW 001, 002 и 003 для контроля чешуекрылых вредителей.

[00101] Трансформация конструкций, экспрессирующих токсичные белки BCW 001, 002 и 003, в E. coli или в применимые Bacillus thuringiensis или другие Bacilli, позволила провести тестирование экспрессированных белков в биоанализе и сравнить с белками, известными в данной области техники, как токсичные для совки-ипсилон, такими как Cry1Fa и Cry1Ac. Наблюдалось, что полученные рекомбинантные штаммы экспрессируют рекомбинантный белок с активностью против чешуекрылых вредителей. Активность в биоанализе была особенно сильной при тестировании против личинок совки-ипсилон (Agrotis ipsilon) и Helicoverpa zea. Как указано выше в ПОДРОБНОМ ОПИСАНИИ СУЩНОСТИ ИЗОБРЕТЕНИЯ, УРОВНЕ ТЕХНИКИ и КРАТКОМ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ, было обнаружено очень мало токсичных белков, которые проявляют какой-либо заметный уровень биологической активности против совки-ипсилон, и поэтому в данной области техники существует потребность в идентификации таких белков для использования в растениях, для защиты таких растений от заражения совкой-ипсилон, и для того, чтобы убедится, что существует достаточный запас дополнительных активных против совки-ипсилон белков, доступных для преодоления любого развития устойчивости к любым таким активным против совки-ипсилон белкам, которые используются в данное время, таким как токсичные белки Cry1Fa.

Пример 3

[00102] В данном примере показано, что домены II и III BCW 001 являются достаточными для передачи биологической активности против совки-ипсилон другим токсичным белкам Cry1, когда такие домены заменяют соответствующие домены в таких других токсинах Cry1.

[00103] Были идентифицированы многие химерные токсины BCW, обладающие активностью против чешуекрылых, в частности, две химеры проявляли сильную активность против BCW, WBC и SCB.

[00104] Конструкции с нуклеотидными последовательностями, кодирующими Cry1Ab, Cry1Ac и Cry1Ca, использовали для конструирования химер, содержащих сегменты домена II и домена III BCW 001, заменяющие соответствующие домены Cry1Ab, Cry1Ac и Cry1Ca, и полученные нативные и химерные белки тестировали в биоанализах с кристаллами спор. Активности против BCW, FAW и CEW в таких пищевых биоанализах были сведены в таблицу. В экспериментальных условиях тестирования, Cry1Ac проявлял активность против FAW, BCW и CEW, Cry1Ab проявлял активность против FAW и CEW, но не против BCW, а Cry1Ca не проявлял активности против FAW, BCW, а также CEW. BCW 001 проявлял активность против BCW и CEW, но не FAW. По сравнению с BCW 003, активность Cry1Ac против BCW была примерно в десять раз меньше у Cry1Ac. Cry1Ab и Cry1Ac, химеры, содержащие домены II и III BCW 001, проявляли токсические свойства при тестировании в биоанализах против FAW, BCW и CEW. Cry1Ac не был токсичным против CEW, а Cry1Ab не был токсичным против BCW. Были сконструированы химеры Cry1Ca/BCW 001, в которых домен III Cry1Ca был заменен соответствующим доменом BCW 001, и полученный химерный токсин проявлял токсические свойства против FAW, BCW и CEW, тогда как токсин Cry1Ca был неэффективен при тестировании против любого из этих вредителей.

Пример 4

[00105] Этот пример иллюстрирует токсические свойства BCW 001, 002 и 003 при тестировании в биоанализе против разнообразных чешуекрылых-вредителей.

[00106] Протоколы для биоанализа и подсчета смертности и задержки роста насекомых известны в данной области техники, примеры которых описаны в публикации заявки на патент РСТ № WO 2012/139004 и в патенте США № 7927598.

[00107] На Фиг. 1 соотносятся различные токсичные белки BCW 001, 002 и 003 по пестицидной активности к видам насекомых в пищевых биоанализах. Каждый из данных токсичных белков продемонстрировал активность против чешуекрылых насекомых.

Пример 5

[00108] В этом примере описывается конструирование искусственных последовательностей, кодирующих белки согласно данному изобретению для использования в растениях, приготовление растительных векторов и конструкций для использования в растениях, и получение растений, экспрессирующих белки согласно данному изобретению.

[00109] Нуклеотидные последовательности, кодирующие белок BCW 001 (SEQ ID NO: 1), белок BCW 002 (SEQ ID NO: 3) и белок BCW 003 (SEQ ID NO: 5), были сконструированы и синтезированы в соответствии со способами, описанными в патенте США 5500365. Эти сконструированные кодирующие области, предназначенные для экспрессии в растениях, представлены в данном документе как SEQ ID NO: 7, кодирующая BCW 001, SEQ ID NO: 9, кодирующая BCW 002, и SEQ ID NO: 11, кодирующая BCW 003.

[00110] Разнообразные кассеты для экспрессии в растениях конструировали с последовательностями, указанными в SEQ ID NO: 7, 9 и 11. Такие кассеты экспрессии полезны для временной экспрессии в протопластах растений или для трансформации растительных клеток. Типичные экспрессионные кассеты были сконструированы с учетом возможного размещения белка в клетке. Один набор кассет экспрессии был сконструирован таким образом, чтобы позволить белку транслироваться и оставаться в цитозоле. Другой набор кассет экспрессии был сконструирован так, чтобы иметь транзитный пептид, смежный с токсичным белком, чтобы обеспечить нацеливание на органеллу клетки, такую как хлоропласт или пластид. Все кассеты экспрессии были сконструированы так, чтобы начинаться с 5'-конца промотором, который может состоять из нескольких промоторных элементов и энхансерных элементов, смежно связанных для усиления экспрессии трансгена. За промоторной последовательностью обычно следовали смежно одна или несколько лидерных последовательностей в 3' к промотору. Последовательность интрона была размещена в 3' к лидерной последовательности для улучшения экспрессии трансгена. Кодирующая последовательность токсина или транзитного пептида, и кодирующая последовательность токсина были расположены в 3' по отношению к промотору, лидерной последовательности и интрону. Определенная последовательность была размещена в 3' к кодирующей последовательности для облегчения терминации транскрипции и обеспечивает последовательности, важные для полиаденилирования полученного транскрипта. Все элементы, описанные выше, были расположены смежно, часто с дополнительной последовательностью, предусмотренной для конструирования экспрессионной кассеты, такой как сайты рестрикции эндонуклеаз или сайты безлигазного клонирования.

[00111] Для растений кукурузы был разработан набор кассет экспрессии для цитозольной экспрессии BCW 001, содержащий промотор убиквитина 1 Mexicana, BCW 002, содержащий промотор актина 15 Orysza sativa или промотор 35S, и BCW 003, содержащий промотор 35S.

[00112] Другой набор кассет экспрессии был разработан для целевой экспрессии в растениях кукурузы токсичных для насекомых белков BCW 002 и BCW 003, в которых последовательность, кодирующая пептид хлоропласта (например, CTP2), была слита по рамке считывания на 5'-конце ДНК сегмента, кодирующего токсичные белки BCW, содержащие промотор актина 15 Orysza sativa или промотор 35S, и последовательность, содержащую промотор 35S.

[00113] Кассеты для экспрессии в растениях сахарного тростника, содержащие промотор CaMV 35S или промотор PClSV.FLt, функционально связанный с промотором 35S, конструировали в виде векторов трансформации растений. В некоторых случаях, была включена кассета, экспрессирующая нацеленный на хлоропласты Cry2Ab.

[00114] Растения, экспрессирующие белки согласно данному изобретению, тестировали против личинок BCW, WBC, CEW, SWC и SCB третьей линьки. Кассета экспрессии в цитозоле для BCW 001, и нацеленная на цитозоль и пластиды кассета экспрессии для BCW 002 и BCW 003 были клонированы и использовались для получения трансгенных кукурузных растений, экспрессирующих данные белки. Трансформированные клетки индуцировали для формирования растений способами, известными в данной области техники. Биоанализ с использованием дисков листьев растений проводили аналогично тому, как описано в патенте США № 8344207. Степени повреждения листа (LDR) присваивалась оценка, основанная на проценте диска листа, съеденного насекомым, по шкале от 0 (съедено 0%) до 11 (съедено более 50%). Шаг оценки степени увеличивается на 5%. Изогенную линию кукурузы использовали для получения ткани в качестве отрицательного контроля, и результаты оценивали. Как экспрессия в пластидах-мишенях, так и цитозольная экспрессия токсичных для насекомых белков BCW 002 и BCW 003 снижали повреждение при питании по сравнению с нетрансформированным контролем. Результаты анализов дисков из листьев в отношение этих насекомых согласуются с данными биоанализа из примеров, представленных выше. Одна конструкция, содержащая кассету BCW 003 для цитозольной экспрессии, дала 34 трансформанта, 25 из них продемонстрировали полный контроль над личинками BCW. Растения кукурузы, экспрессирующие BCW 001 и BCW 003 в цитозоле, также тестировали на CEW, SWC и FAW. Растения, экспрессирующие BCW 003, демонстрировали 100% контроль CEW и SWC, и значения LDR в диапазоне от 1 до 2. Три трансформанта, экспрессирующие BCW 001, дали растения, проявляющие эффективность в отношении CEW и SWC, и значения LDR в диапазоне от 1 до 3. Это согласуется с данными пищевого биоанализа, представленными в предыдущих примерах.

[00115] Трансгенные растения сахарного тростника, экспрессирующие BCW 003, были получены и испытаны против SCB в биоанализах. Каждый биоанализ включал в себя диски листьев из сахарного тростника дикого типа в качестве отрицательного контроля, и из положительного контроля, экспрессирующего высокие уровни Cry2Ab. Смертность насекомых и повреждение листьев измеряли через четыре (4) дня после заражения. Было обнаружено, что диски листьев нескольких трансформантов сахарного тростника, экспрессирующих BCW 003, демонстрируют контроль Diatraea saccharalis (sugarcane borer) in planta и имеют степень повреждения ниже 2, аналогично положительному контролю и средней смертности насекомых 90-100%.

[00116] Трансформанты, экспрессирующие BCW 003 и Cry2Ab, демонстрировали лучший контроль SCB по сравнению с трансформантами, которые экспрессировали только BCW 003.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Monsanto Technology LLC

<120> ПЕСТИЦИДНЫЕ БЕЛКОВЫЕ ТОКСИНЫ, АКТИВНЫЕ В ОТНОШЕНИИ

ЧЕШУЕКРЫЛЫХ НАСЕКОМЫХ

<130> MONS:434WO

<150> US 62/445,313

<151> 2017-01-12

<160> 12

<170> Версия PatentIn 3.5

<210> 1

<211> 3543

<212> ДНК

<213> Bacillus thuringiensis

<220>

<221> CDS

<222> (1)..(3540)

<400> 1

atg gag gaa aat aat cag aat caa tgc gtc cct tat aat tgt ttg aat 48

Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn

1 5 10 15

aat cct gca atc gaa ata tta gaa gga gac aga ata tca gtt ggt aac 96

Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn

20 25 30

act cca atc gat att tct cta tca ctt gtg gaa ctt ctt att agt gaa 144

Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu

35 40 45

ttt gtc cca ggc ggt gga ata ata aca gga ttg ttg aac ata gta tgg 192

Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp

50 55 60

gga ttt gta ggg cct tcc caa tgg gac gca ttt ctt gct caa gtg gaa 240

Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu

65 70 75 80

cag tta att aac caa agg ata tca gaa gct gta aga aat aca gca att 288

Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile

85 90 95

cag gaa tta gag gga atg gcg cgg gtt tat aga acc tat gct act gct 336

Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala

100 105 110

ttt gct gag tgg gaa aga gat cct aat aac aca gat cta aga gaa gca 384

Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala

115 120 125

gta cgg aca cag ttt aca gca act gag act tat atc agt gga aga ata 432

Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile

130 135 140

tct gtt tta aaa att caa aat ttt gaa gtg cag ctg tta tcg gtg ttt 480

Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe

145 150 155 160

gcc caa gct gcc aat tta cat tta tct tta tta aga gac gtt gtg ttt 528

Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe

165 170 175

ttt ggg caa aga tgg ggg ttt tca acg aca acc gta aat aat tac tac 576

Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr

180 185 190

aat gat tta aca gaa gag att agt acc tat aca gat tat gca gta cgc 624

Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg

195 200 205

tgg tac aat acg gga tta gag cgt gta tgg gga ccg gat tct aga gat 672

Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp

210 215 220

tgg gta agg tat aat caa ttt aga aga gag cta aca ctt act gta tta 720

Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu

225 230 235 240

gat atc gtt gct cta ttc cca aat tat gat agt cga agg tat cca att 768

Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile

245 250 255

cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta tta 816

Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu

260 265 270

gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa cag 864

Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln

275 280 285

aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc att 912

Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile

290 295 300

tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa ata 960

Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile

305 310 315 320

aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct tta 1008

Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu

325 330 335

ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta act 1056

Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr

340 345 350

ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga att 1104

Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile

355 360 365

ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat gga 1152

Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly

370 375 380

acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act ata 1200

Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile

385 390 395 400

tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca cag 1248

Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln

405 410 415

gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt cat 1296

Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His

420 425 430

gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga gct 1344

Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala

435 440 445

cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata att 1392

Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile

450 455 460

gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct att 1440

Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile

465 470 475 480

att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc gat 1488

Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp

485 490 495

ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca tac 1536

Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr

500 505 510

ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt gtt 1584

Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val

515 520 525

cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt ttc 1632

Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe

530 535 540

gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca tta 1680

Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu

545 550 555 560

gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga act 1728

Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr

565 570 575

ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta tct 1776

Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser

580 585 590

act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act gca 1824

Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala

595 600 605

acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg aat 1872

Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn

610 615 620

gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg acg 1920

Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr

625 630 635 640

gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg gat 1968

Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp

645 650 655

gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa cat 2016

Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His

660 665 670

gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac ttc 2064

Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe

675 680 685

agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg gat 2112

Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp

690 695 700

att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc aca 2160

Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr

705 710 715 720

cta cca ggt acc ttt gat gag tgc tat cca acg tat tta tat caa aaa 2208

Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys

725 730 735

ata gat gag tcg aaa tta aaa gcc tat acc cgt tat caa tta aga ggg 2256

Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly

740 745 750

tat atc gag gat agt caa gac tta gaa atc tat tta att cgc tac aat 2304

Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn

755 760 765

gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg ccg 2352

Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro

770 775 780

ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga tgc 2400

Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys

785 790 795 800

gcg cca cac ctt gaa tgg aat cct gat tta cac tgt tcc tgc aga gac 2448

Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp

805 810 815

ggg gaa aaa tgt gct cat cat tct cat cat ttc tcc ttg gac att gat 2496

Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp

820 825 830

gtt gga tgt aca gac tta aat gag gat tta ggt gta tgg gtg ata ttc 2544

Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe

835 840 845

aag att aag acg caa gat ggc cat gca aga cta gga aat cta gag ttt 2592

Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe

850 855 860

ctc gaa gag aaa cca tta gta ggg gaa gca cta gct cgt gtg aaa aga 2640

Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg

865 870 875 880

gcg gag aaa aaa tgg aga gac aaa cgc gaa aaa tta caa ttg gaa aca 2688

Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr

885 890 895

aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt gta 2736

Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val

900 905 910

aac tct caa tat gat caa tta caa gcg gat acg aac atc gcg atg att 2784

Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile

915 920 925

cat gcg gca gat aaa cgt gtt cat aga atc cga gaa gcg tac ctt cca 2832

His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro

930 935 940

gag tta tct gtg att ccg ggt gta aat gca gac att tcc gaa gaa tta 2880

Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu

945 950 955 960

gaa ggg cgt att ttc act gca ttc tct cta tat gat gcg aga aat gtc 2928

Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val

965 970 975

att aaa aat ggc gat ttc aat aat ggc tta tta tgc tgg aac gtg aaa 2976

Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys

980 985 990

ggg cat gta gat gta gaa gaa caa aat aac cac cgt tcg gtc ctt gtt 3024

Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val

995 1000 1005

gtt ccg gaa tgg gaa gca gaa gtg tca caa gag gtt cgt gtc tgt 3069

Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys

1010 1015 1020

ccg ggg cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag gga 3114

Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly

1025 1030 1035

tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat aca 3159

Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr

1040 1045 1050

gac gaa ctg aag ttt agc aac tgt gta gaa gag gaa gtc tat cca 3204

Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro

1055 1060 1065

aac aac acg gta acg tgt aat gat tat act gca aat caa gaa gaa 3249

Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu

1070 1075 1080

tat gag ggt acg tac act tct cgt aat cga gga tat gac gaa gcc 3294

Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala

1085 1090 1095

tat gaa agc aat tct tct gta cca gct gag tat gcg tca gtc tat 3339

Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr

1100 1105 1110

gaa gaa aaa gtg tat aca gat gga cga aga ggg aat cct tgt gaa 3384

Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu

1115 1120 1125

tct aac aga gga tat ggg gat tac aca cca cta cca gct ggc tat 3429

Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr

1130 1135 1140

gtg aca aaa gaa tta gag tac ttc cca gaa acc gat aag gta tgg 3474

Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp

1145 1150 1155

att gag att gga gaa aca gaa gga aca ttc att gtg gat agt gtg 3519

Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val

1160 1165 1170

gaa tta ctc ctt atg gag gaa taa 3543

Glu Leu Leu Leu Met Glu Glu

1175 1180

<210> 2

<211> 1180

<212> БЕЛОК

<213> Bacillus thuringiensis

<400> 2

Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn

1 5 10 15

Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn

20 25 30

Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu

35 40 45

Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp

50 55 60

Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu

65 70 75 80

Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile

85 90 95

Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala

100 105 110

Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala

115 120 125

Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile

130 135 140

Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe

145 150 155 160

Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe

165 170 175

Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr

180 185 190

Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg

195 200 205

Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp

210 215 220

Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu

225 230 235 240

Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile

245 250 255

Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu

260 265 270

Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln

275 280 285

Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile

290 295 300

Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile

305 310 315 320

Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu

325 330 335

Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr

340 345 350

Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile

355 360 365

Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly

370 375 380

Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile

385 390 395 400

Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln

405 410 415

Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His

420 425 430

Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala

435 440 445

Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile

450 455 460

Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile

465 470 475 480

Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp

485 490 495

Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr

500 505 510

Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val

515 520 525

Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe

530 535 540

Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu

545 550 555 560

Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr

565 570 575

Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser

580 585 590

Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala

595 600 605

Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn

610 615 620

Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr

625 630 635 640

Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp

645 650 655

Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His

660 665 670

Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe

675 680 685

Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp

690 695 700

Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr

705 710 715 720

Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys

725 730 735

Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly

740 745 750

Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn

755 760 765

Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro

770 775 780

Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys

785 790 795 800

Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp

805 810 815

Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp

820 825 830

Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe

835 840 845

Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe

850 855 860

Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg

865 870 875 880

Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr

885 890 895

Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val

900 905 910

Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile

915 920 925

His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro

930 935 940

Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu

945 950 955 960

Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val

965 970 975

Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys

980 985 990

Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val

995 1000 1005

Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys

1010 1015 1020

Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly

1025 1030 1035

Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr

1040 1045 1050

Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro

1055 1060 1065

Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu

1070 1075 1080

Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala

1085 1090 1095

Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr

1100 1105 1110

Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu

1115 1120 1125

Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr

1130 1135 1140

Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp

1145 1150 1155

Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val

1160 1165 1170

Glu Leu Leu Leu Met Glu Glu

1175 1180

<210> 3

<211> 3534

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Полностью синтетическая ДНК, кодирующая BCW 002

<220>

<221> CDS

<222> (1)..(3531)

<400> 3

atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta tca gta 480

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

att cga ata gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816

Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa 960

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

gct cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata 1392

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

aaa ggg cat gta gat gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

ctt atg gag gaa tag 3534

Leu Met Glu Glu

1175

<210> 4

<211> 1177

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Синтетическая конструкция

<400> 4

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

Leu Met Glu Glu

1175

<210> 5

<211> 3534

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Полностью синтетическая последовательность, кодирующая BCW 003

<220>

<221> CDS

<222> (1)..(3531)

<400> 5

atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta tca gta 480

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

att cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816

Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa 960

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

gct cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata 1392

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

aaa ggg cat gta gat gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

ctt atg gag gaa tag 3534

Leu Met Glu Glu

1175

<210> 6

<211> 1177

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Синтетическая конструкция

<400> 6

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

Leu Met Glu Glu

1175

<210> 7

<211> 3543

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Полностью синтетическая последовательность для применения

в растениях, кодирующая BCW 001

<220>

<221> CDS

<222> (1)..(3540)

<223> BCW 001

<400> 7

atg gag gag aac aac cag aac cag tgt gtc cca tac aac tgc ctc aac 48

Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn

1 5 10 15

aac cca gcc atc gaa atc ctt gag ggc gac cga att tca gtc ggc aac 96

Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn

20 25 30

acg ccc atc gac atc tcc ctg agt ctt gtg gaa ctc ctc atc tcg gag 144

Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu

35 40 45

ttc gtc cct ggc ggc ggc ata atc acc ggt ctg ctc aac atc gtg tgg 192

Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp

50 55 60

gga ttc gtg ggc cca tcc cag tgg gat gcg ttc ctg gcc caa gtg gag 240

Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu

65 70 75 80

cag ctc atc aac cag agg atc tcc gag gcc gtc cgc aat acc gcg atc 288

Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile

85 90 95

caa gag ctg gag ggc atg gcc cgc gtg tac cgc acc tac gcc acc gcc 336

Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala

100 105 110

ttt gct gaa tgg gag cgc gac ccg aac aac act gac ctg cgc gag gcc 384

Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala

115 120 125

gtc cga aca cag ttc acg gcg acc gag acc tac atc agc ggc cgg atc 432

Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile

130 135 140

tca gtg ctc aag atc cag aac ttc gag gtg cag ctc cta tcg gtc ttc 480

Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe

145 150 155 160

gcc cag gcc gcc aac ttg cac ctg agc ctc ctg cgg gac gtt gtg ttc 528

Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe

165 170 175

ttc ggc cag cgg tgg ggc ttc tct act acg acc gtg aac aac tac tac 576

Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr

180 185 190

aac gac ctg acg gag gaa atc agc acc tac aca gat tac gca gtt cgt 624

Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg

195 200 205

tgg tac aac acc ggc ctt gag cgc gtg tgg ggc ccg gac tcc cgc gat 672

Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp

210 215 220

tgg gtc cgc tac aac cag ttc cgc cgc gag ctg acg ctt aca gtg ctg 720

Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu

225 230 235 240

gac atc gtc gca ctc ttt cct aac tac gac tcc agg cgc tat ccc atc 768

Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile

245 250 255

agg aca gtg tca cag ctc acc cgc gag atc tac aca aac ccg gtg ctt 816

Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu

260 265 270

gag aac ttc gac ggc agc ttc cgt ggc atg gcg cag cgc att gaa cag 864

Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln

275 280 285

aac atc cgc cag ccg cac ctt atg gac atc ttg aac agt atc act atc 912

Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile

290 295 300

tac acc gac gtc cac aga ggc ttc aac tac tgg agc gga cac cag atc 960

Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile

305 310 315 320

aca gcc agc ccg gta ggc ttc tcg ggt cca gag ttc gcc ttc ccg ctg 1008

Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu

325 330 335

ttt ggg aac gct ggc aat gcc gcg ccg ccc gtg ctg gtc agc ctc act 1056

Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr

340 345 350

ggt ctc ggc atc ttc cgc aca ctt tcc tcg ccg ctg tac agg agg atc 1104

Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile

355 360 365

atc ctc ggg tcc ggt ccg aac aac cag gag ctg ttc gtg ctc gac ggg 1152

Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly

370 375 380

acc gag ttc agt ttc gcc agc ctc acg acg aac ctc ccg tcc acc atc 1200

Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile

385 390 395 400

tat cgc cag cgc gga acg gtc gat tcc ctg gat gtt atc cca ccg caa 1248

Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln

405 410 415

gac aat tct gtg ccg ccg agg gcc ggg ttc tcc cac cgg ctg tct cac 1296

Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His

420 425 430

gtg act atg ctt tca cag gcc gcc gga gcc gtg tac acg ctc cgt gcg 1344

Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala

435 440 445

cct act ttc tcc tgg cag cac cgc agc gcg acc acg acc aac atc atc 1392

Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile

450 455 460

gca gca gac tcc atc acc cag atc ccg gcc gtt aag ggc cgc agc atc 1440

Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile

465 470 475 480

atc aac aac gga act gtc atc agc ggt ccg ggc ttc acg ggc ggc gac 1488

Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp

485 490 495

ctg gtc cgg ctc tac aac gca gac ttc aac atc aat aac cgc gct tat 1536

Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr

500 505 510

ctt gaa gta cct atc ttc ttc cag agc ccg agc act aac tac cgg gtt 1584

Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val

515 520 525

cgc gtc cgc tac gcc agc acc tcc agc ctc cct gtg gat gtc gtg ttc 1632

Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe

530 535 540

gga aac ata agc cat ccg acc acg ttc cca gcc acg gct agg agc ctg 1680

Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu

545 550 555 560

gac aac cta cag agc aac gac ttc ggc tac atc gac atc gcg ggc acc 1728

Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr

565 570 575

ttt ctg cca agc ctg ggt ccg tct atc ggc atc cgc ccg atg ctg agc 1776

Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser

580 585 590

act atc aac cta att gtg gac cgg ttc gag ttt atc ccg gtg acg gca 1824

Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala

595 600 605

acg ttc gag gcg gag tct gac ctc gaa agg gca cag aag gcc gtg aac 1872

Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn

610 615 620

gcc ctg ttc acg agc acc aac cag ctt ggc att aag act gat gtc acc 1920

Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr

625 630 635 640

gac tac cac att gac caa gtc agc aac ctg gtg gag tgc ctc tcg gac 1968

Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp

645 650 655

gag ttc tat ctt gat gag aaa cgg gaa cta agc gag aag gtg aag cac 2016

Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His

660 665 670

gca aag cgc ttg agc gac gag cgg aac tta ctc cag gac cct aac ttc 2064

Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe

675 680 685

cgt ggg att aac cgc cag ccg gat cgc ggg tgg cgc ggc tca acg gac 2112

Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp

690 695 700

atc acc atc cag ggc ggc gat gac gtc ttc aag gag aac tac gtg acc 2160

Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr

705 710 715 720

ctc cct ggc acg ttc gac gag tgc tac ccg acg tac ctt tat cag aag 2208

Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys

725 730 735

att gac gaa agc aag ctg aaa gcc tac acc cgc tac cag ttg cgc ggc 2256

Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly

740 745 750

tac atc gag gac tct caa gac ctg gag atc tac ttg att cga tac aac 2304

Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn

755 760 765

gcg aaa cac gag acc gtc aac gtg ccg ggc act ggg agc ctg tgg ccg 2352

Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro

770 775 780

ttg tct gca caa agt ccg atc ggc aag tgc ggc gag cca aac cgg tgc 2400

Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys

785 790 795 800

gct ccg cac ctg gag tgg aac cca gac ctt cat tgc tcc tgt agg gat 2448

Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp

805 810 815

ggc gag aag tgc gct cac cac agc cat cac ttc agc ctc gac att gac 2496

Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp

820 825 830

gtc ggc tgt acc gac ctt aat gag gat ctg ggt gtg tgg gtg atc ttc 2544

Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe

835 840 845

aag atc aag acc cag gac ggt cac gcc cgg ttg ggc aat ctg gag ttc 2592

Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe

850 855 860

ctg gag gag aag ccg ctg gtt ggc gag gct ctc gcg cgg gtc aag cgg 2640

Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg

865 870 875 880

gcg gag aag aag tgg cgg gac aaa cgc gag aag ctc cag tta gag acg 2688

Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr

885 890 895

aac atc gtg tac aag gag gcg aag gaa tcc gtg gac gca cta ttc gtg 2736

Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val

900 905 910

aac agc cag tac gac caa ctc cag gcc gac acc aac atc gcc atg att 2784

Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile

915 920 925

cac gca gcc gac aag agg gtg cac cgc atc cgc gaa gcc tac ctt ccc 2832

His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro

930 935 940

gaa ctt tcg gtc atc cca ggc gtc aac gct gac atc tcg gag gaa ttg 2880

Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu

945 950 955 960

gag ggc aga atc ttc acg gcc ttc tct ttg tac gat gcc agg aac gtc 2928

Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val

965 970 975

atc aag aac ggc gac ttc aac aac ggc ctg ctg tgc tgg aac gtg aag 2976

Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys

980 985 990

ggc cac gtg gac gtc gag gag cag aac aac cac aga tca gtc ctg gtg 3024

Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val

995 1000 1005

gtg ccc gag tgg gaa gcc gaa gtc tca caa gaa gtc cgg gtg tgc 3069

Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys

1010 1015 1020

cct gga cgc ggg tac att ctc cgc gtg acc gcc tac aag gag ggc 3114

Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly

1025 1030 1035

tac ggt gag ggc tgc gtg acc atc cac gag atc gag aac aac acc 3159

Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr

1040 1045 1050

gac gag ctg aaa ttc agt aac tgt gtt gag gag gag gtg tac ccg 3204

Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro

1055 1060 1065

aac aac acc gtc acc tgc aac gac tac act gcg aac cag gag gaa 3249

Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu

1070 1075 1080

tac gag ggc acg tac acg agc cgc aat cgc ggg tac gac gag gcg 3294

Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala

1085 1090 1095

tac gag agc aac tcc agc gtc ccg gcc gag tac gcc tcc gtg tac 3339

Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr

1100 1105 1110

gag gag aag gtt tac acc gac ggg agg cgt ggc aac ccg tgc gag 3384

Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu

1115 1120 1125

agc aac aga ggc tac ggc gat tac act ccg ctt ccc gct ggc tac 3429

Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr

1130 1135 1140

gtg acg aaa gag ctg gag tac ttc cca gag acc gac aag gtg tgg 3474

Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp

1145 1150 1155

atc gag atc gga gaa acg gag ggc acg ttc ata gtg gac tcc gtt 3519

Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val

1160 1165 1170

gag ctg ctg ctc atg gag gag tag 3543

Glu Leu Leu Leu Met Glu Glu

1175 1180

<210> 8

<211> 1180

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Синтетическая конструкция

<400> 8

Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn

1 5 10 15

Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn

20 25 30

Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu

35 40 45

Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp

50 55 60

Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu

65 70 75 80

Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile

85 90 95

Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala

100 105 110

Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala

115 120 125

Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile

130 135 140

Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe

145 150 155 160

Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe

165 170 175

Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr

180 185 190

Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg

195 200 205

Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp

210 215 220

Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu

225 230 235 240

Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile

245 250 255

Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu

260 265 270

Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln

275 280 285

Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile

290 295 300

Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile

305 310 315 320

Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu

325 330 335

Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr

340 345 350

Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile

355 360 365

Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly

370 375 380

Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile

385 390 395 400

Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln

405 410 415

Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His

420 425 430

Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala

435 440 445

Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile

450 455 460

Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile

465 470 475 480

Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp

485 490 495

Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr

500 505 510

Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val

515 520 525

Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe

530 535 540

Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu

545 550 555 560

Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr

565 570 575

Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser

580 585 590

Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala

595 600 605

Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn

610 615 620

Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr

625 630 635 640

Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp

645 650 655

Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His

660 665 670

Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe

675 680 685

Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp

690 695 700

Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr

705 710 715 720

Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys

725 730 735

Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly

740 745 750

Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn

755 760 765

Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro

770 775 780

Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys

785 790 795 800

Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp

805 810 815

Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp

820 825 830

Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe

835 840 845

Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe

850 855 860

Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg

865 870 875 880

Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr

885 890 895

Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val

900 905 910

Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile

915 920 925

His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro

930 935 940

Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu

945 950 955 960

Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val

965 970 975

Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys

980 985 990

Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val

995 1000 1005

Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys

1010 1015 1020

Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly

1025 1030 1035

Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr

1040 1045 1050

Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro

1055 1060 1065

Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu

1070 1075 1080

Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala

1085 1090 1095

Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr

1100 1105 1110

Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu

1115 1120 1125

Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr

1130 1135 1140

Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp

1145 1150 1155

Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val

1160 1165 1170

Glu Leu Leu Leu Met Glu Glu

1175 1180

<210> 9

<211> 3534

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Полностью синтетическая последовательность, кодирующая

CW 002 для применения в растениях

<220>

<221> CDS

<222> (1)..(3531)

<223> BCW 002

<400> 9

atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc ctc acc gtg 720

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

att cgc atc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816

Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc cac caa 960

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

ctg atg gaa gag tga 3534

Leu Met Glu Glu

1175

<210> 10

<211> 1177

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Синтетическая конструкция

<400> 10

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

Leu Met Glu Glu

1175

<210> 11

<211> 3534

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Полностью синтетическая нуклеотидная последовательность,

кодирующая BCW 003 для применения в растениях

<220>

<221> CDS

<222> (1)..(3531)

<223> BCW 003

<400> 11

atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc ctc acc gtg 720

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

att cgc acc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816

Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc cac caa 960

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

ctg atg gaa gag tga 3534

Leu Met Glu Glu

1175

<210> 12

<211> 1177

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Синтетическая конструкция

<400> 12

Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu

1 5 10 15

Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

20 25 30

Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

35 40 45

Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

50 55 60

Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile

65 70 75 80

Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

85 90 95

Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

100 105 110

Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

115 120 125

Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130 135 140

Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val

145 150 155 160

Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

165 170 175

Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

180 185 190

Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val

195 200 205

Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210 215 220

Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val

225 230 235 240

Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro

245 250 255

Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

260 265 270

Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu

275 280 285

Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290 295 300

Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln

305 310 315 320

Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro

325 330 335

Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu

340 345 350

Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg

355 360 365

Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp

370 375 380

Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr

385 390 395 400

Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro

405 410 415

Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser

420 425 430

His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg

435 440 445

Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile

450 455 460

Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser

465 470 475 480

Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly

485 490 495

Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala

500 505 510

Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg

515 520 525

Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val

530 535 540

Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser

545 550 555 560

Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly

565 570 575

Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu

580 585 590

Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr

595 600 605

Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val

610 615 620

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val

625 630 635 640

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser

645 650 655

Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

660 665 670

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

675 680 685

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

690 695 700

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

705 710 715 720

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

725 730 735

Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg

740 745 750

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

755 760 765

Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp

770 775 780

Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg

785 790 795 800

Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg

805 810 815

Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile

820 825 830

Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile

835 840 845

Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu

850 855 860

Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys

865 870 875 880

Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu

885 890 895

Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe

900 905 910

Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met

915 920 925

Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu

930 935 940

Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu

945 950 955 960

Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn

965 970 975

Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val

980 985 990

Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu

995 1000 1005

Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val

1010 1015 1020

Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu

1025 1030 1035

Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn

1040 1045 1050

Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr

1055 1060 1065

Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu

1070 1075 1080

Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu

1085 1090 1095

Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys

1100 1105 1110

Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg

1115 1120 1125

Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys

1130 1135 1140

Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile

1145 1150 1155

Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu

1160 1165 1170

Leu Met Glu Glu

1175

<---

1. Полинуклеотидная конструкция для придания устойчивости к насекомому отряда Lepidoptera, содержащая нуклеотидную последовательность, кодирующую:

a) инсектицидный белок, имеющий аминокислотную последовательность, содержащую аминокислоты с 1 по 607 последовательности, выбранной из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12; или

b) инсектицидный белок, имеющий аминокислотную последовательность от позиции 7 до 607, как указано в любой из SEQ ID NO: 2, 4, 6, 8, 10 или 12,

при этом указанная нуклеотидная последовательность функционально связана с гетерологичной последовательностью промотора.

2. Белок, токсичный для совки–ипсилон (black cutworm) отряда Lepidoptera, содержащий:

a) аминокислотную последовательность, как указано в SEQ ID NO: 2 от позиции 256 до 606;

b) аминокислотную последовательность, как указано в SEQ ID NO: 4 от позиции 257 до 607; и

c) аминокислотную последовательность, как указано в SEQ ID NO: 6 от позиции 257 до 607.

3. Полинуклеотидная конструкция по п. 1, отличающаяся тем, что указанный инсектицидный белок проявляет активность против насекомого отряда Lepidoptera, выбранного из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.

4. Белок по п. 2, дополнительно содержащий биоактивность в отношении видов Lepidoptera, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.

5. Вектор, экспрессирующий полинуклеотидную конструкцию по п. 1.

6. Клетка–хозяин, имеющая устойчивость к насекомому отряда Lepidoptera, содержащая полинуклеотидную конструкцию по п. 1, отличающаяся тем, что указанная клетка–хозяин выбрана из группы, состоящей из бактериальной клетки, дрожжевой клетки и растительной клетки.

7. Клетка–хозяин по п. 6, отличающаяся тем, что указанную растительную клетку выбирают из группы, состоящей из растительной клетки: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, льна, чеснока, винограда, хмеля, лука–порея, салата–латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополя, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы.

8. Трансгенное растение, имеющее устойчивость к насекомому отряда Lepidoptera, где указанное растение содержит полинуклеотидную конструкцию по п. 1.

9. Семя, имеющее устойчивость к насекомому отряда Lepidoptera и где указанное семя содержит детектируемое количество указанной полинуклеотидной конструкции.

10. Трансгенное растение по п. 8, отличающееся тем, что семена, пыльца, потомство, растительные клетки, растительная ткань и товарные продукты, полученные из указанного растения, содержат определяемое количество указанной полинуклеотидной конструкции.

11. Биологический образец, имеющий устойчивость к насекомому отряда Lepidoptera, где биологический образец содержит детектируемое количество полинуклеотидной конструкции по п. 1.

12. Композиция для борьбы с насекомым отряда Lepidoptera, содержащая инсектицидно–эффективное количество белка по п. 2, и:

a) агент, отличный от указанного белка и также токсичный для насекомого отряда Lepidoptera, причем указанный агент выбирают из группы, состоящей из полипептида, имеющего аминокислотную последовательность, отличную от указанного белка, молекулы РНК и химического соединения; или

b) агент выбранный из группы, состоящей из: Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B, Cry1C, Cry1D, Cry1E, Cry1F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853, TIC1415, VIP3A, VIP3Ab, инсектицидных белков AXMI, инсектицидных белков DIG, eHIPs и белков VIP.

13. Композиция по п. 12, дополнительно содержащая дополнительный пестицидный агент, причем указанный дополнительный агент выбирают из группы, состоящей из: Cry1C, Cry3A, Cry3B, Cry34, Cry35, Cry51Aa1, ET29, ET33, ET34, ET70, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, 5307, DIG–10, Axmi184, Axmi205 и AxmiR1.

14. Способ получения семян, содержащих полинуклеотидную последовательность по п. 1, причем указанный способ включает в себя:

a) трансформацию одного или более семян вектором по п.5,

b) посадку одного или большего количества семян, содержащих указанный полинуклеотид;

c) выращивание растений из указанного семени; и

d) сбор урожая семян с указанных растений, причем указанное семя содержит указанную полинуклеотидную конструкцию.

15. Растение по п. 8, дополнительно содержащее:

a) трансгенное растение кукурузы, выбранное из группы, состоящей из: DKB89614–9, MON801, MON802, MON809, MON810, MON863, MON88017, MON89034, трансформанта 4114–3, трансформанта 5307, DAS59122–7, Bt10, Bt11, Bt176, CBH–351, DKB–83614–9, MIR162, MIR604, TC1507, TC6275, трансформанта 676, трансформанта 678, трансформанта 680, трансформанта 98140, DAS40278–9, DKB89790–5, MON21–9, HCEM485, MON832, MON87427, NK603, T14, T25 и VCO01981–5;

b) трансгенное растение сои, выбранное из группы, состоящей из: MON87751, DAS81419–2, MON87701, A2704–12, A2704–21, A5547–127, A5547–35, CV127, DAS44406–6, DAS68416–4, DP356043, FG72, MON4032, ACS–GM003–1, MON87705, MON87708, MON89788, W62, W98 и GFM Cry1A;

c) трансгенное растение хлопка, выбранное из группы, состоящей из: DAS24236–5, DAS21023–5, трансформанта 31707, трансформанта 31803, трансформанта 31807, трансформанта 31808, трансформанта 42317, BNLA–601, COT102, COT67B, трансформанта 1, GHB119, GK12, MON15985, MLS9124, MON1076, MON531, MON757, T303–3, T304–40, SGK321, трансформанта 19–51a, GHB614, LLCotton25, MON88701, MON88702, MON1445, MON1698 и MON88913;

d) трансгенное растение сахарного тростника трансформанта NXI–1T; и

e) трансгенное растения риса, выбранное из группы, состоящей из: LLRICE06, LLRICE601, LLRIC2E62, GM–A17054 и GM–A17054.

16. Токсичный для Lepidoptera белок, содержащий в функциональной связи:

a) первый пептидный сегмент, содержащий аминокислотную последовательность домена I Cry1A;

b) второй пептидный сегмент, содержащий остатки 255-606 последовательности SEQ ID NO: 2;

причем указанный токсичный для Lepidoptera белок проявляет токсическую биоактивность при тестировании против Lepidoptera вредителей, выбранных из группы, состоящей из: совки–ипсилон (A. ipsilon), совки хлопковой (H. zea), Striacosta albicosta (S. albicosta), огневки кукурузной (O. nubilalis), огневки кукурузной юго–западной (D. grandiosella), совки капустной (T. ni), соевой совки (P. includens), совки травяной (S. frugiperda) и Diatraea saccharalis (D. saccharalis).



 

Похожие патенты:

Изобретение относится к области биохимии, в частности к способу индукции образования гаплоидных зародышей. Изобретение позволяет эффективно получать растения, индуцирующие гаплоидию.

Изобретение относится к биотехнологии. Предложен способ выделения биологически активных веществ антимикробного действия из клеточных культур элеутерококка колючего Eleutherococcus senticosus Rupr.

Изобретение относится к области биотехнологии и может быть использовано в пищевой и фармацевтической промышленности для культивирования каллусной культуры лимонника китайского (Schisandra chinensis (Turcz.) Baill.). Способ культивирования каллусной культуры лимонника китайского {Schisandra chinensis (Turcz.) Baill.) включает стерилизацию посадочного материала, приготовление питательной среды на минеральной основе Мурасиге-Скуга (MS) или Гамборга (В-5) с добавлением или без гормонов - 6-бензиламинопурина (6-БАП) и нафтилуксусной кислоты (НУК), культивирование в стерильных условиях при фотопериоде (свет/темнота) 16/8 часов, температуре 25±2°C и влажности 60-70%.

Изобретение относится к области биохимии, в частности рекомбинантной молекуле ДНК, кодирующей белок, обладающий активностью нечувствительной к гербицидам протопорфириногеноксидазы. Так же раскрыты конструкция ДНК, вектор, растение, клетка, часть растения и семя, содержащие указанную молекулу, полипептид, кодируемый указанной молекулой.

Изобретение относится к биотехнологии и представляет собой вариант ксиланазы, предусматривающий замену в одном или более положениях, соответствующих положениям 24, 26, 36, 37, 60, 71, 74, 75, 76, 124, 133, 155, 167, 208, 317 и 321 SEQ ID NO: 1, где указанная замена выбрана из группы, состоящей из H24W, A26E, R36L, R36T, E37T, R60N, K71T, K71I, V74L, V74I, K75N, K75L, H76L, I155M, N167E, V208L, S317D и G321A; где вариант ксиланазы обладает ксиланазной активностью, и где вариант ксиланазы характеризуется последовательностью, на по меньшей мере 90%, на по меньшей мере 95%, на по меньшей мере 96%, на по меньшей мере 97%, на по меньшей мере 98% или на по меньшей мере 99%, но на менее чем 100% идентичной SEQ ID NO: 1, 2, 3, 4, 5 или 6; и где указанный вариант имеет улучшенную термостабильность по сравнению с SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 и SEQ ID NO: 6.

Изобретение относится к области биохимии, в частности к молекуле рекомбинантной ДНК для придания растению толерантности к гербициду дикамбе или ингибитору PPO. Также раскрыты ДНК-конструкция и клетка трансгенного растения, содержащие указанную молекулу ДНК; вектор, содержащий указанную ДНК-конструкцию; трансгенное растение, часть трансгенного растения, трансгенное семя, содержащие указанную молекулу ДНК.

Изобретение относится к области биотехнологии, в частности к выделенной молекуле нуклеиновой кислоты, кодирующей полипептид, обладающий инсектицидной активностью в отношении вредителя из отряда Lepidoptera, а также к содержащей ее ДНК-конструкции, клетке, растению и семени. Также раскрыт выделенный инсектицидный полипептид, обладающий инсектицидной активностью в отношении вредителя из отряда Lepidoptera, способ его получения, а также содержащая вышеуказанный полипептид композиция.

Группа изобретений относится к фармацевтической и косметической промышленности, а именно к экстракту клеток Mimosa pudica с содержанием мимозина менее 5 нг/г сухой массы и его применению. Способ получения in vitro экстракта клеток Mimosa pudica с содержанием мимозина менее 5 нг/г сухой массы, включающий следующие стадии: а.

Группа изобретений относится к фармацевтической и дерматологической промышленности, а именно к получению экстракта, обогащенного целастролом, для лечения воспалительного дерматоза, индуцированного иммунным ответом типа TH17. Разработан способ получения неочищенного экстракта, обогащенного пентациклическим тритерпеном, представляющим собой целастрол, включающий следующие стадии: (i) фаза пролиферации клеток растения семейства Celastraceae, представляющего собой Tripterygium wilfordii, в пролиферационной среде, (ii) фаза элиситации посредством добавления элиситирующей смеси в культуру клеток, полученную на стадии (i), причем указанная элиситирующая смесь содержит по меньшей мере один элиситор типа монокарбоксильного соединения, представляющий собой метилжасмонат, и по меньшей мере один биотический элиситор, причем указанный биотический элиситор представляет собой хитин, и (iii) получение неочищенного экстракта, обогащенного пентациклическими тритерпенами, из культуры клеток, полученной на стадии (ii).

Изобретение относится к области биотехнологии. Изобретение представляет собой способ получения биологически активных веществ - адаптогенов в клеточной культуре радиолы розовой, характеризующийся тем, что предусматривает культивирование клеток растения Rhodiola rosea L.

Настоящее изобретение относится к биотехнологии и предусматривает способы индуцирования толерантности и/или супрессии иммунного ответа на антиген посредством пропускания клеточной суспензии, содержащей безъядерную клетку, через сужение, где сужение деформирует клетку, тем самым вызывая возмущение в клетке так, что антиген и/или толерогенный фактор проникает в клетку.
Наверх