Пестицидные белковые токсины, активные в отношении чешуекрылых
Изобретение относится к области биохимии, в частности к полинуклеотидной конструкции для придания устойчивости к насекомому отряда Lepidoptera. Также раскрыты белок, токсичный для совки–ипсилон (black cutworm) отряда Lepidoptera; вектор, экспрессирующий указанную полинуклеотидную конструкцию; клетка–хозяин, содержащая указанную полинуклеотидную конструкцию; трансгенное растение, содержащее указанную полинуклеотидную конструкцию; семя, содержащее указанную полинуклеотидную конструкцию; биологический образец, содержащий указанную полинуклеотидную конструкцию; композиция, содержащая указанный белок. Раскрыт способ получения семян с помощью указанного вектора. Изобретение позволяет эффективно бороться с насекомым-вредителем отряда Lepidoptera. 10 н. и 6 з.п. ф-лы, 2 ил., 5 пр.
ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ
[001] Данная заявка заявляет приоритет по предварительной заявке США № 62/445313, поданной 12 января 2017 года, которая включена в данный документ посредством ссылки в полном объеме.
ВКЛЮЧЕНИЕ ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[002] Файл, названный «MONS434WO-sequence listing.txt», содержащий Перечень последовательностей в машиночитаемом формате, был создан 11 января 2018 года. Этот файл имеет размер 166134 байта, как измерено в MS-Windows®, и полностью включен в данный документ посредством ссылки. Этот Перечень последовательностей состоит из SEQ ID NO:1-SEQ ID NO:12.
ОБЛАСТЬ ТЕХНИКИ
[003] Изобретение относится, в целом, к области белков, проявляющих ингибирующую активность в отношение насекомых, в частности к белкам, проявляющим ингибирующую активность в отношении насекомых-вредителей сельского хозяйства из отряда Lepidoptera (чешуекрылые), таких как совка-ипсилон («BCW», Agrotis ipsilon).
УРОВЕНЬ ТЕХНИКИ
[004] Ингибирующие насекомых белки, продуцируемые видом бактерии Bacillus thuringiensis (Bt), известны в данной области техники. Определенные белки Bt могут быть использованы для борьбы с вредителями сельскохозяйственных культур путем распрыскивания приемлемых в сельском хозяйстве готовых форм, содержащих один или большее количество таких белков, на растения, путем покрытия семян композицией, приготовленной так, что она содержит инсектицидно-эффективное количество таких белков, или путем результативно эффективной экспрессии указанных одного или большего количества белков в растениях/семенах.
[005] Были разработаны только несколько белков Bt для использования в качестве трансгенных признаков для коммерческого использования фермерами для борьбы с насекомыми-вредителями. Фермеры полагаются на эти белки, чтобы получить предписанный спектр сдерживания вредителей, и могут продолжать полагаться на химические вещества широкого спектра действия при применении к листьям и почве для борьбы с вредителями. Доказано, что особенно трудно бороться с некоторыми чешуекрылыми насекомыми, такими как виды Agrotis и виды Striacosta, с использованием трансгенных инсектицидных признаков, применяемых в данное время, включая Cry1Ab, Cry1Ac, Cry1Fa, Cry2Ab, Cry2Ae, VIP3Aa и различные другие токсины Bt, которые используются менее часто. Следовательно, существует потребность в ингибирующих насекомых белках, которые проявляют активность против более широкого спектра видов насекомых-вредителей, и в использовании токсинов с целью преодоления развития устойчивости вредителей к существующим пестицидам, включая токсины, применяемые в данное время в системах контроля вредителей.
[006] Данная заявка описывает новое семейство белков, варианты и химерные токсичные белковые конструкции, каждая из которых проявляет удивительно эффективную инсектицидную активность в отношение чешуекрылых, особенно против вредителей видов Agrotis, таких как совка-ипсилон.
КРАТКОЕ ОПИСАНИЕ СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[007] Показано, что новая группа полипептидов, ингибирующих насекомых (токсичные белки BCW 001, BCW 002 и BCW 003 и их пестицидные фрагменты), обладает ингибирующей активностью в отношении нескольких чешуекрылых-вредителей сельскохозяйственных растений, в частности в отношении вида совки-ипсилон (вид Agrotis). Каждый белок может быть использован отдельно или в комбинации с друг другом и с другими белками Bt и ингибирующими насекомых агентами в готовых формах и in planta, тем самым предлагая альтернативы Bt белкам и химическим инсектицидам, которые в данное время применяются в сельскохозяйственных системах.
[008] Согласно данному изобретению предложены полинуклеотидные конструкции, которые содержат в функциональной связи сегмент гетерологичного промотора, связанный с нуклеотидной последовательностью, кодирующей инсектицидный белок, обладающий характеристиками Cry1A, который меньше чем полноразмерный токсичный белок класса Cry1A, и который имеет аминокислотную последовательность от около позиции 1 до позиции 607, как указано в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO 6, SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12, или его инсектицидно-активный фрагмент. Меньше чем полноразмерный полипептид, который проявляет такую инсектицидную активность, должен проявлять идентичность, по меньшей мере, около 100%, 99%, 98%, 97%, 96%, 95%, 94%, 94%, 92%, 91% или 90% с аминокислотной последовательностью BCW 001, как указано в SEQ ID NO: 2, от около позиции 1 до около позиции 606, или от около позиции 5 до около позиции 600. Если необходимо использовать полноразмерный или значительно большего размера фрагменты токсина, процент идентичности должен быть менее ограничивающим, и представлять собой процент идентичности от около 100, до около 95, до около 90, до около 85 или даже до 80% идентичности по отношению к последовательностям полноразмерных белковых токсинов, как указано в SEQ ID NO: 2, 4 и 6, так как данные токсичные белки демонстрируют коммерчески полезные уровни биологической активности при тестировании против личинок совки-ипсилон в пищевых биоанализах и при тестировании in planta на трансгенной кукурузе, хлопке и сое, экспрессирующих такие белки.
[009] Согласно данному изобретению также предложены белки, токсичные для вида чешуекрылых совка-ипсилон, включая белки, имеющие аминокислотную последовательность, как указано в SEQ ID NO: 2 от позиции 256 до 606 (белок BCW 001), и белки, имеющие аминокислотную последовательность, как указано в любой из SEQ ID NO: 4 и SEQ ID NO: 6 от аминокислотной позиции 257 до 607 (в данном документе соответственно обозначаемые как токсичный белок BCW 002 и токсичный белок BCW 003).
[0010] Такие инсектицидные белки также проявляют активность против видов чешуекрылых, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.
[0011] Белки согласно данному изобретению также могут проявлять биологическую активность в отношении видов чешуекрылых, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.
[0012] Белки согласно данному изобретению и рассматриваемые в данном документе конструкции могут быть включены в любой вектор, включая плазмиды, космиды, фагмиды и т. п.
[0013] Такие векторы могут быть использованы для введения конструкций согласно данному изобретению в любое количество клеток-хозяев, включая бактериальные клетки, дрожжевые клетки и клетки растений.
[0014] Клетками-хозяевами, которые являются дрожжевыми клетками, могут быть Saccharomyces cereviseae или Saccharomyces pombe, и т. п. Бактериальные клетки-хозяева могут представлять собой любое количество известных таких клеток-хозяев, включая, но не ограничиваясь Е. coli, B. thuringiensis, и другие родственные бациллы. Растительные клетки-хозяева могут быть получены из любого количества видов растений, включая, но не ограничиваясь растительными клетками из: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы.
[0015] Трансгенные растения, в частности трансгенные растения кукурузы, хлопка и сои, могут быть получены путем введения конструкций согласно данному изобретению, содержащих подходящим образом модифицированные полинуклеотидные последовательности, такие как указанные в SEQ ID NO: 7, SEQ ID NO: 9 и SEQ ID NO: 11, например, в геном таких растительных клеток и путем восстановления фертильного трансгенного растения кукурузы, сои или хлопка, содержащего в своем геноме генетическую конструкцию для экспрессии по меньшей мере белкового токсина согласно данному изобретению, то есть BCW 001, BCW 002 или белкового токсина BCW 003. Такие трансгенные растения будут иметь внедренную в их растительный геном полинуклеотидную конструкцию, содержащую по меньшей мере гетерологичный промоторный сегмент, функционально связанный с нуклеотидной последовательностью, кодирующей инсектицидный белок BCW 001, BCW 002 или BCW 003, имеющий аминокислотную последовательность, выбранную из группы, состоящей из SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12, или их инсектицидный белковый фрагмент.
[0016] Семена также рассматриваются в качестве признака изобретения, в котором семена получают из таких трансгенных растений, и такие семена содержат определяемое количество полинуклеотидной конструкции, введенной в геном растения. Пыльца, семена, растительные клетки потомства, растительная ткань и товарные продукты, полученные из каждого такого трансгенного растения, будут содержать детектируемое количество полинуклеотидной конструкции.
[0017] Любой биологический образец, который содержит, по меньшей мере, детектируемое количество полинуклеотидной конструкции, кодирующей такой белок BCW 001, BCW 002 или BCW 003, будет находиться в пределах объема изобретения.
[0018] Предложены композиции, которые обеспечивают инсектицидно эффективное количество белка BCW 001, 002 или 003 согласно данному изобретению и предназначены для борьбы с видами чешуекрылых-вредителей. Такие композиции могут также содержать дополнительный агент, который отличается от токсичного белка BCW. Такой агент также будет токсичным для тех же видов чешуекрылых, что и токсичный белок BCW. Дополнительный агент должен быть выбран из группы агентов, состоящей из белков или полипептидов, аминокислотная последовательность которых отличается от белка BCW, и также может быть агентом, представляющим собой молекулу РНК, оказывающую токсическое действие на целевое насекомое-вредителя (такую как дцРНК, микроРНК или малая интерферирующая РНК (миРНК)), а также может быть инсектицидным химическим соединением, таким как пиретрин, фосфорорганический пестицид и т. п. В альтернативном варианте, дополнительный агент может быть любым совместимым Cry или родственным токсичным белком, таким как другой Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae (но они не являются предпочтительными, поскольку они могут не обеспечивать соответствующие свойства для контроля устойчивости), или Cry1B, Cry1C, Cry1D, Cry1E, Cry1F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853, TIC1415, VIP3A, VIP3Ab, инсектицидными белками Axmi, инсектицидными белками DIG, eHIPs и белками VIP и любым токсичным белком, известным в данной области техники, для обеспечение токсических свойств в отношение личинок вида совки-ипсилон или применимых к другим видам-мишеням чешуекрылых вредителей.
[0019] Такие композиции могут также содержать дополнительные пестицидные агенты, которые необязательно являются токсичными для одного и того же вредителя-мишени, такие как дополнительные агенты, выбранные из группы, состоящей из Cry1C, Cry3A, Cry3B, Cry34, Cry35, Cry51Aa1, ET29, ET33, ET34, ET70, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, 5307, DIG-10, Axmi184, Axmi205 и AxmiR1.
[0020] Также предусматриваются способы получения семян, в которых используется полезные пестицидные свойства белков согласно данному изобретению. Такие способы включают в себя полинуклеотидную конструкцию, спроектированную для экспрессии белка BCW 001, BCW 002 или BCW 003, или белка, показывающего по меньшей мере около 90% идентичность с указанным белком, причем указанный способ включает в себя посадку одного или большего количества семян, которые содержат полинуклеотид, экспрессирующий один или большее количество белковых токсинов BCW согласно данному изобретению, выращивание растений из таких семян и затем сбор урожая таких семян из растений. Собранное семя будет содержать полинуклеотидную конструкцию и даст растения, которые также будут устойчивы к заражению совкой-ипсилон.
[0021] Такими растениями могут быть кукуруза, хлопок, соя или любые другие растения, восприимчивые к видам чешуекрылых-вредителей, которые, как продемонстрировано, контролируются белками согласно данному изобретению. Предполагается, что такие растения являются предварительно полученными трансгенными растениями, которые получат пользу от эффектов токсических свойств белков согласно данному изобретению. Растения кукурузы, попадающие в эту категорию, включают в себя, но не ограничиваются лишь трансформантами, выбранными из группы, состоящей из: DKB89614-9, MON801, MON802, MON809, MON810, MON863, MON88017, MON89034, трансформанта 4114-3, трансформанта 5307, DAS59122-7, Bt10, Bt11, Bt176, CBH-351, DKB-83614-9, MIR162, MIR604, TC1507, TC6275, трансформанта 676, трансформанта 678, трансформанта 680, трансформанта 98140, DAS40278-9, DKB89790-5, MON21-9, HCEM485, MON832, MON87427, NK603, T14, T25 и VCO01981-5. Растения сои, которые попадают в эту категорию трансгенных растений, выбирают из группы, состоящей из: MON87751, DAS81419-2, MON87701, A2704-12, A2704-21, A5547-127, A5547-35, CV127, DAS44406-6, DAS68416-4, DP356043, FG72, MON4032, ACS-GM003-1, MON87705, MON87708, MON89788, W62, W98 и GFM Cry1A. Трансгенные растения хлопка, попадающие в эту категорию, выбирают из группы, состоящей из: DAS24236-5, DAS21023-5, трансформанта 31707, трансформанта 31803, трансформанта 31807, трансформанта 31808, трансформанта 42317, BNLA-601, COT102, COT67B, трансформанта 1, GHB119, GK12, MON15985, MLS9124, MON1076, MON531, MON757, T303-3, T304-40, SGK321, трансформанта 19-51a, GHB614, LLCotton25, MON88701, MON88702, MON1445, MON1698 и MON88913. Трансгенные растения сахарного тростника, попадающие в эту категорию, включают в себя трансформант NXI-1T сахарного тростника. Известные в данной области техники растения риса, которым было бы полезно иметь конструкцию, кодирующую такие белковые токсины BCW, включают в себя трансформанты риса, выбранные из группы, состоящей из: LLRICE06, LLRICE601, LLRICE62, GM-A17054 и GM-A17054.
[0022] Дополнительно, предложены обработанные растительные продукты, которые содержат детектируемое количество раскрытых рекомбинантных полинуклеотидов. Такие обработанные продукты включают в себя, но не ограничиваются лишь этими: растительную биомассу, масло, шрот, корм для животных, муку, хлопья, отруби, пух, шелуху и обработанные семена.
[0023] Также предлагаются способы получения трансгенных растений. Такие способы включают в себя введение рекомбинантного полинуклеотида в клетку растения и отбор трансгенного растения, которое экспрессирует ингибирующее насекомых количество рекомбинантного полипептида, кодируемого рекомбинантным полинуклеотидом.
[0024] Другие варианты осуществления, признаки и преимущества изобретения будут очевидны из следующего подробного описания, примеров и формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0025] На Фиг. 1 изображен список видов чешуекрылых насекомых-вредителей, которые были протестированы в биоанализах с токсичными белками BCW 001, BCW 002 и BCW 003. «+» указывает на смертность относительно контроля в виде буфера; «-» указывает на отсутствие статистически значимой наблюдаемой смертности выше уровня контроля в виде буфера; «НД» означает, что не тестировалось с использованием соответствующего токсичного белка. BCW 001 продемонстрировал вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea, Ostrinia nubilalis (огневка кукурузная), Diatraea grandiosella, Trichoplusia ni, Pseudoplusia includens, и не продемонстрировал вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка). Diatraea saccharalis не тестировали с BCW 001. BCW 002 проявил вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea (совка хлопковая), и Ostrinia nubilalis (огневка кукурузная), и не проявил вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка). Diatraea saccharalis, Diatraea grandiosella (огневка кукурузная юго-западная), Trichoplusia ni (совка капустная), и Pseudoplusia includens (соевая совка) не тестировали с BCW 002. BCW 003 проявил вызывающее смерть воздействие против Agrotis ipsilon (совка-ипсилон), Striacosta albicostsa, Helicoverpa zea (совка хлопковая), Ostrinia nubilalis (огневка кукурузная), Diatraea saccharalis, Diatraea grandiosella, Trichoplusia ni (совка капустная), и Pseudoplusia includens (соевая совка), и не проявил вызывающее смерть воздействие или задержку роста при тестировании против Spodoptera frugiperda (курузная лиственная совка).
[0026] На Фиг. 2 изображено выравнивание аминокислотной последовательности BCW 001 (SEQ ID NO: 2, верхняя) против BCW 002 (SEQ ID NO: 4, средняя), и против BCW 003 (SEQ ID NO: 6, нижняя); звездочки под тремя последовательностями представляют различия по аминокислоте в выбранной позиции по меньшей мере в одной из трех различных последовательностей.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[0027] SEQ ID NO: 1 представляет собой нуклеотидную последовательность природного штамма EG4384 B. thuringiensis, кодирующую токсичный для чешуекрылых белок BCW 001.
[0028] SEQ ID NO: 2 является установленной аминокислотной последовательностью BCW 001 из открытой рамки считывания, как указано в SEQ ID NO: 1.
[0029] SEQ ID NO: 3 представляет собой искусственную последовательность, кодирующую химерный токсичный для чешуекрылых белок BCW 002.
[0030] SEQ ID NO: 4 представляет собой установленную аминокислотную последовательность BCW 002 из открытой рамки считывания, как указано в SEQ ID NO: 3, в которой такой белок BCW 002 состоит из домена I Cry1Ac, функционально связанного с доменами II и III BCW 001 (с аминокислотной позиции 258 до аминокислотной позиции 606, как указано в SEQ ID NO: 2) и функционально связанного с доменом протоксина Cry1Ac с аминокислотной позиции 608 до 1177, как указано в SEQ ID NO: 4 и SEQ ID NO: 6. SEQ ID NO: 4 (BCW 002) отличается от SEQ ID NO: 6 (BCW 003) только в позиции 259, BCW 002 содержит изолейцин в данной позиции, BCW 003 содержит треонин, как в BCW 001.
[0031] SEQ ID NO: 5 представляет собой искусственную последовательность, кодирующую химерный токсичный для чешуекрылых белок BCW 003.
[0032] SEQ ID NO: 6 представляет собой установленную аминокислотную последовательность BCW 003 из открытой рамки считывания, как указано в SEQ ID NO: 3, в которой такой белок BCW 003 состоит из домена I Cry1Ac, функционально связанного с доменами II и III BCW 001 (с аминокислотной позиции 258 до аминокислотной позиции 606, как указано в SEQ ID NO: 2) и функционально связанного с доменом протоксина Cry1Ac с аминокислотной позиции 608 до 1177, как указано в SEQ ID NO: 4 и SEQ ID NO: 6. SEQ ID NO: 6 (BCW 003) отличается от SEQ ID NO: 4 (BCW 002) только в позиции 259, BCW 002 содержит изолейцин в данной позиции, BCW 003 содержит треонин, как в BCW 001.
[0033] SEQ ID NO: 7 представляет собой искусственную последовательность, кодирующую белок BCW 001 для экспрессии в растениях.
[0034] SEQ ID NO: 8 представляет собой установленную аминокислотную последовательность BCW 001, полученную из SEQ ID NO: 7.
[0035] SEQ ID NO: 9 представляет собой искусственную последовательность, кодирующую белок BCW 002 для экспрессии в растениях.
[0036] SEQ ID NO: 10 представляет собой установленную аминокислотную последовательность BCW 002, полученную из SEQ ID NO: 9.
[0037] SEQ ID NO: 11 представляет собой искусственную последовательность, кодирующую белок BCW 003 для экспрессии в растениях.
[0038] SEQ ID NO: 12 представляет собой установленную аминокислотную последовательность BCW 003, полученную из SEQ ID NO: 11.
ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ
[0039] Альтернативой борьбе с сельскохозяйственными вредителями культурных растений путем опрыскивания готовыми формами, содержащими инсектицидные белки, растений/семян является вставка полинуклеотидов, кодирующих данные белки, в геном растения для экспрессии в растении или частях растения. Растения, трансформированные такими полинуклеотидами, обладают устойчивостью к насекомым, которую данные экспрессированные белки обеспечивают в качестве трансгенных признаков.
[0040] Чтобы избежать развития или обойти устойчивость насекомых к используемым в данное время белкам, для борьбы с чешуекрылыми необходимы новые белки с другим способом действия (СД), а также широким спектром и эффективностью. Одним из способов решить данную проблему является секвенирование геномов Bt в надежде открыть новые инсектицидные белки. Другой подход заключается в обмене сегментов из различных белков Bt для создания новых химерных белков Bt, обладающих ингибирующими свойствами в отношении насекомых. Вероятность произвольного создания химерного белка с улучшенными свойствами путем рекомбинирования доменных структур многочисленных природных инсектицидных кристаллических белков, известных в данной области техники, крайне мала (смотрите, например, A Strategy for Shuffling Numerous Bacillus thuringiensis Crystal Protein Domains; J. Economic Entomology, 97 (6): 1805-1813. 2004).
[0041] В данном документе раскрыты нуклеотидные последовательности, которые кодируют инсектицидные белки, обозначенные в данном документе как белки BCW, которые удовлетворяют потребность в альтернативном СД, обеспечивают активность против более широкого спектра насекомых-вредителей и действуют, задерживая или предотвращая развитие устойчивости, особенно при использование в борьбе с вредителями совки-ипсилон (BCW).
[0042] BCW 001 был открыт как открытая рамка считывания, предсказывающая аминокислотную последовательность, имеющую характеристики белка типа Cry1A, после секвенирования генома штамма EG4384 Bacillus thuringiensis. Открытая рамка считывания BCW 001 (ORF) кодировала белок из 1180 аминокислот, и было предсказано, что белок обладает многими характеристиками белковых токсинов Cry1, включая идентифицируемую структуру доменов I, II и III и характерный домен протоксина типа Cry1A на карбоксиконцевой половине предсказанного белка. Предсказанная аминокислотная последовательность домена I (остатки с 1 по около 258 SEQ ID NO: 2) демонстрирует около 67% идентичность с доменом I белкового токсина Cry1Ac. Предсказанная аминокислотная последовательность домена II (остатки от около 259 до около остатка 459, как указано в SEQ ID NO: 2) демонстрирует полную (100%) идентичность с доменом II Cry1Ai2. Предсказанная аминокислотная последовательность домена III (остатки от около 260 до около 606, как указано в SEQ ID NO: 2) демонстрирует около 63% идентичность с соответствующими остатками домена III в Cry1Ah2. Структура домена протоксина предсказанного белка BCW 001 (от около остатка 607 до 1180, как указано в SEQ ID NO: 2) демонстрирует около 96% идентичность с соответствующими остатками в Cry1Aa9. В целом, этот предсказанный полноразмерный белок демонстрирует около 83% идентичности аминокислотной последовательности с Cry1Ai, а предсказанная область токсина от аминокислотной позиции 1 до около остатка 607, как указано в SEQ ID NO: 2, демонстрирует 76% идентичность с Cry1Ai1. Трудно отнести этот новый токсичный белок к определенному классу Cry1A, и поэтому комитету по номенклатуре Bacillus thuringiensis будет предоставлена данная последовательность и он определит, заслуживает ли этот белок свой собственный отдельный и новый класс.
[0043] Белок BCW 001 был получен из плазмидного вектора в некристаллоносном штамме Bacillus thuringiensis, а препараты кристаллов спор были протестированы против разнообразных чешуекрылых. Смотрите Фиг. 1, столбец 2 касательно данных. Факты указывают на то, что данный белок не схож с любым из белков, с которыми он разделяет источник происхождения, то есть токсичными белками Cry1Aa, Cry1Ah или Cry1Ai, известными в данной области техники. Ни один из белков предшествующего уровня техники не проявляет сколько-нибудь заметной активности при тестировании против совки-ипсилон, однако данной новый белок BCW 001 был токсичным в биоанализах при тестировании против совки-ипсилон и неожиданно проявлял токсические свойства при тестировании против группы других чешуекрылых, как изложено в Фиг. 1.
[0044] В частности, в биоанализах по сравнению с необработанным контрольным рационом насекомых белок BCW 001 проявлял активность против Striacosta albicosta («WBC»), Helicoverpa zea («CEW»), огневки кукурузной («ECB», Ostrinia nubilalis), Diatraea grandiosella («SWC»), Pseudoplusia includes («SL»), Trichoplusia ni («CLW»), и совки ипсилон 1-3 личиночной стадии («BCW», Agrotis ipsilon).
[0045] Как описано дополнительно ниже, химерные токсичные белки получали с использованием домена I Cry1Ac, и доменов II и III BCW 001 (то есть BCW 002 и BCW 003, как указано в SEQ ID NO: 4 и SEQ ID NO: 6, соответственно), и данные химерные токсичные белки были введены в растения кукурузы и сахарного тростника. Оба химерных белка проявляли активность в кукурузе против BCW, WBC, CEW и SWC. BCW 003 проявлял активность в отношении SCB в сахарном тростнике.
[0046] Термин «белок BCW», как используется в данном документе, относится к любому новому ингибирующему насекомых белку, который содержит, который состоит из, который является по существу гомологичным, или который получен из любой ингибирующей насекомых полипептидной последовательности: BCW 001 (SEQ ID NO: 2), BCW 002 (SEQ ID NO: 4) и BCW 003 (SEQ ID NO: 6) и их сегментов, ингибирующих насекомых, или их комбинаций, которые обеспечивают активность против чешуекрылых, в частности, но не ограничиваясь, BCW, WBC и/или SCB. Полинуклеотид, кодирующий BCW 001, был получен из штамма EG4384. Основная токсичная аминокислотная последовательность для BCW 001 соответствует аминокислотам от около позиции 28 до около позиции 606 и до позиции 618, как указано в SEQ ID NO: 2, а основная токсичная аминокислотная последовательность для BCW 002 и 003 соответствует аминокислотам от около позиции 29 до около позиции 607 и до около позиции 619, как указано в SEQ ID NO: 4 и SEQ ID NO: 6, соответственно.
[0047] В одном варианте осуществления, белки, раскрытые в данном документе, являются родственными по первичной структуре дельта-эндотоксину по длине (около 1176-1180 аминокислот), по длине белка без протоксина (от около 600 до около 619 аминокислот), по длине основной части токсина (около 591 аминокислот) или по наличию по меньшей мере одного специфического для BCW сегмента.
[0048] Иллюстративные белки были выровнены друг с другом с использованием алгоритма Clustal W, давая в результате число аминокислотных совпадений для пар выравнивания и процент аминокислотной идентичности для пар выравнивания с использованием данных параметров по умолчанию: Матрица вессов: Blosum; Штраф за открытие пропуска: 10,0; Штраф за продление пропуска: 0,05; Гидрофильные пропуски: Вкл.; Гидрофильные остатки: GPSNDQERK; Штрафы за пропуск по конкретным остаткам: Вкл. The Clustal W algorithm is described in Thompson, J.D., Higgins, D.G. and Gibson, T.J. (1994) "CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice." Nucleic Acids Research, 22:4673-4680.
[0049] Другие алгоритмы выравнивания также доступны в данной области техники и обеспечивают результаты, аналогичные тем, которые получены с использованием выравнивания Clustal W.
[0050] Термин «около» используется в данном документе для описания того, что данные границы сегментов могут отличаться на 1, 2, 3, 4, 5, 10, 20, 25, 30 или 35 остатков, в зависимости от последовательности исходных белков и их выравнивания друг с другом. Чтобы дополнительно описать изменчивость и конфигурацию различных сегментов, в Таблицах 2 и 3 приведены границы сегментов BCW 002 и 003, и других активных против совки-ипсилон химерных белков.
[0051] Термин «фрагмент» используется в данном документе для описания непрерывных аминокислотных или нуклеотидных последовательностей, которые короче, чем полная аминокислотная или нуклеотидная последовательность, описывающая токсичный белок BCW.
[0052] Фраза «ингибитор насекомых» и «инсектицид» используются в данном документе взаимозаменяемо и относятся к белку, фрагменту белка, сегменту белка или полинуклеотиду, который приводит к любому измеримому подавлению жизнеспособности, роста, развития насекомых, размножения насекомых, поведения насекомых при кормлении, брачного поведения насекомых и/или любому измеримому уменьшению неблагоприятных эффектов, вызванных поглощением насекомым данного белка, фрагмента белка, сегмента белка или полинуклеотида.
[0053] Термины «биологическая активность», «активный», «активность», «эффективный», «эффективность» или их вариации используются в данному документе взаимозаменяемо для описания эффектов белков согласно данному изобретению на целевых насекомых-вредителей.
[0054] Культура - это само-распространяемое или культивируемое растение, продукт которого собирают в какой-то момент его стадии роста. Неограничивающими примерами таких продуктов являются семя, коробочка, лист, цветок, стебель, корень или любая их часть.
Биологический образец, полученный из любой ткани растения, бактерии, вируса или вектора, содержащих полинуклеотид или экспрессирующих белок, как проиллюстрировано в данном документе, такой как, но не ограничиваясь лишь этими: семя, коробочка, лист, цветок, стебель, корень или любая его часть, и содержащих определяемое количество полинуклеотида, белка или обоих.
[0055] Фраза «определяемое количество» используется в данном документе для описания минимального количества белка или полинуклеотида, раскрытого в данном документе, которое может быть обнаружено стандартными аналитическими способами, такими как, но без ограничения, полимеразная цепная реакция (ПЦР) и иммуноферментный анализ (ИФА), и т. п.
[0056] В одном варианте осуществления, токсины, описанные в данном документе, связаны общей функцией и проявляют инсектицидную активность в отношении видов чешуекрылых насекомых.
[0057] Сегменты BCW 001 обеспечивают активность против совки-ипсилон химерам Cry1, которые содержат такие сегменты. Примеры сегментов BCW 001, которые придают активность против совки-ипсилон, приведены в SEQ ID NO: 2 от около аминокислотной позиции 250 до около 606, и более конкретно от около аминокислотной позиции 255 до около 606. Химеры Cry1, содержащие данный аминокислотный сегмент, соответствующий доменам II и III токсичного белка BCW 001, часто также будут иметь помимо свойств химерного белка токсические свойства, связанные с контролем совки-ипсилон, и это было проверено в каркасах Cry1A, Cry1B, Cry1C, Cry1D, Cry1E и Cry1F, в которых соответствующая токсичная конструкция имела компоненты домена II и III, замещенные данным участком аминокислот из BCW 001, и во многих случаях активность против совки-ипсилон неожиданно сохранялась в химерной конструкции (данные не показаны).
[0058] В одном аспекте изобретения, вредитель, контролируемый применимым токсичным белком BCW, является, в частности, насекомым-вредителем отряда Lepidoptera, включая взрослых особей, куколок, личинок и только появившихся личинок.
[0059] Насекомые отряда чешуекрылых (Lepidoptera) включают в себя, но не ограничиваются лишь этими: насекомых из семейства совок (Noctuidae) (гусеницы, бабочка-совка, пяденицы, heliothines), (например кукурузную лиственную совку (Spodoptera frugiperda), совку помидорную (Spodoptera exigua), Mamestra configurata, совку-ипсилон (Agrotis ipsilon), Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Agrotis orthogonia, Pseudaletia unipuncta; точильщиков, чехлоносиков и других насекомых из семейства огневок (Pyralidae), например огневку кукурузную (Ostrinia nubilalis), Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus; насекомых из семейства листоверток (Tortricidae), например яблонную плодожорку (Cydia pomonella), Endopiza viteana, восточную плодожорку (Grapholita molesta), Suleima helianthana; и многих других экономически важных чешуекрылых (например, капустную моль (Plutella xylostella), Pectinophora gossypiella, и непарного шелкопряда (Lymantria dispar)). Другие насекомые-вредители отряда чешуекрылых (Lepidoptera) включают в себя, например, Alabama argillacea, Archips argyrospila, Archips rosana и другие виды Archips, Chilo suppressalis (огневку желтую рисовую), Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Earias vittella, Helicoverpa armigera (совку хлопковую), Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana (гроздьевую листовертку), Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae (капустницу), Pieris rapae (репницу), Plutella xylostella (капустную моль), Spodoptera exigua, Spodoptera litura, S. frugiperda, и Tuta absoluta (томатную минирующую моль).
[0060] Раскрытые в данном документе белки также могут быть использованы для получения антител, которые специфически связываются с BCW-специфичными токсичными белками, и могут использоваться для скрининга и поиска других представителей семейства токсинов BCW.
[0061] В одном варианте осуществления, иллюстративные полинуклеотиды, которые кодируют ингибирующие насекомых белки, родственные BCW 001, указаны в SEQ ID NO: 1, 3, 5, 7, 9 и 11. Нуклеотидные последовательности, кодирующие данные белки, можно использовать в качестве зондов и праймеров для скрининга для идентификации других представителей семейства с использованием способов термической или изотермической амплификации и/или гибридизации и других способов идентификации, известных специалистам в данной области техники.
[0062] Согласно аспекту изобретения, предложены способы обнаружения родственных белков, и такие способы включают в себя секвенирование геномов Bt, сборку данных секвенирования, идентификацию и клонирование генов Bt, кодирующих такие пестицидные белки, а также экспрессию и тестирование новых белков Bt для анализа пестицидной активности. В другом аспекте изобретения используются молекулярные способы для конструирования и клонирования коммерчески полезных белков, включающих в себя химеры белков из семейства пестицидных белков, например, химеры могут быть собраны из сегментов токсичных белков BCW для получения дополнительных вариантов осуществления. Раскрытые белки могут быть подвергнуты выравниванию друг с другом и с другими пестицидными белками Bt, и могут быть идентифицированы сегменты каждого такого белка, которые полезны для замещения между выровненными белками, что приводит к конструированию химерных белков. Такие химерные белки могут быть подвергнуты анализу - биоанализу с вредителем, и охарактеризованы на наличие повышенной биологической активности или расширения спектра вредителей-мишеней, по сравнению с исходными белками, из которых был получен каждый такой сегмент химеры. Пестицидную активность полипептидов можно дополнительно сконструировать в виде активности против конкретного вредителя или более широкого спектра вредителей путем замены доменов или сегментов таковыми из других белков.
[0063] В одном варианте осуществления, белки, раскрытые в данном документе, включат в себя функционально эквивалентные фрагменты (N- или C-концевые делеции) белков, раскрытых в данном документе.
[0064] BCW токсичные белки предложены в данном документе. В некоторых вариантах осуществления, могут быть выделены, могут быть представлены в композиции, в трансгенном микроорганизме или в трансгенном растении токсины, родственные BCW 001. В данном варианте осуществления, белки BCW 002 и, в частности, белки BCW 003 обеспечивают ингибирующую активность в отношении чешуекрылых, особенно ингибирующую активность в отношении совки-ипсилон и/или Diatraea saccharalis. Отсылка в данной заявке к «выделенному белку», или эквивалентному термину или фразе, предназначена для обозначения того, что белок представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, токсичные белки согласно данному изобретению и т. п., которые естественным образом обнаруживаются в организме, не считаются «выделенными», если они находятся в организме, в котором они находятся в естественном состояние. Однако, каждый из них будет «выделен» в рамках данного раскрытия изобретения, если белок не находится в организме, в котором он находится в естественном состояние.
[0065] Термин «функционально связанный», как используется в данном документе, относится к соединению последовательностей нуклеиновых кислот или аминокислотных последовательностей, так что одна последовательность может обеспечивать требуемую функцию или совместимое или полезное свойство для связанной последовательности.
[0066] Пептиды, полипептиды и белки, биологически функционально эквивалентные BCW 001, BCW 002 и BCW 003, включают в себя, но не ограничиваются лишь этими: аминокислотные последовательности, содержащие консервативные аминокислотные замены в данных белковых последовательностях токсичного белка BCW. В таких аминокислотных последовательностях одна или большее количество аминокислот в последовательности замещены другой аминокислотой (аминокислотами), что приводит к молчащей или консервативной замене в аминокислотной последовательности.
[0067] Хотя раскрытые ингибирующие насекомых полипептиды предпочтительно содержат белковую последовательность BCW 001, BCW 002 или BCW 003, фрагменты и варианты данной последовательности, обладающие такой же или сходной ингибирующей активностью в отношении насекомых, что и активность данного ингибирующего насекомых белка, также раскрыты в данном документе. Например, смежные последовательности из по меньшей мере 30, 35, 38, 40, 45, 50, 55, 60, 65, 70, 75, 100, 150, 200, 500, 550 или большего количества аминокислот в родственном BCW токсичном белке с ингибирующей активностью в отношении насекомых. В другом варианте осуществления, фрагменты родственного BCW токсичного белка с ингибирующей активностью в отношении насекомых могут содержать аминокислотные замены, делеции, вставки или добавления в последовательности токсичного белка BCW.
[0068] В одном варианте осуществления, ингибирующий насекомых полипептид содержит ингибирующий насекомых сегмент от около остатка 28 до около остатка 618 белковой последовательности BCW 001, как указано в SEQ ID NO: 2. Неограничивающие примеры включают в себя любую из SEQ ID NO: 2, 4 или 6, или более короткие фрагменты, или варианты, обладающие такой же или сходной ингибирующей активностью в отношении насекомых, что и активность данного конкретного белка BCW 001, сами по себе или в функциональной связи в химерным белком. В другом варианте осуществления, сегменты, имеющие смежные аминокислотные последовательности, по меньшей мере, около 38 или большего количества аминокислот в любой из SEQ ID NO: 2, 4 или 6, обладающие ингибирующей активностью в отношении насекомых, также дают функциональный инсектицидный белок. Ингибирующие насекомых токсичные фрагменты BCW 001 также могут содержать сегменты, по меньшей мере, с 30, 35, 38, 40, 45, 50, 100, 150, 200, 500, 550, 555, 560, 565, 570, 572, 574, 580 или 585 аминокислотными остатками из области 591 аминокислотного остатка, соответствующей остаткам от около 28 до около 618 последовательностей, любой из SEQ ID NO: 2, 4 или 6.
[0069] В некоторых вариантах осуществления, фрагменты зрелого белка BCW 001 (зрелый обозначает протоксиновую форму белка, состоящую из 1180 аминокислот, расщепляемую путем протеолиза в кишечнике насекомого-вредителя, чтобы высвободить только N-концевое ядро токсина до остатка 607 включительно около остатка 618, высвобождая активный сегмент токсина, содержащего, больше или меньше, остатки с 1 по 606 или любое количество остатков от около 5 до около 618, как указано в SEQ ID NO: 2, при условии, что высвободившийся сегмент проявляет токсические свойства при воздействии на личинки совки-ипсилон) могут быть усеченными формами, в которых одна или большее количество аминокислот удалены с N-конца, С-конца, середины белка или их комбинаций, с активностью в виде подавления насекомых. Эти фрагменты могут быть природными или синтетическими вариантами BCW 001 и сохранять ингибирующую активность в отношение насекомых токсичного белка BCW. В некоторых вариантах осуществления, фрагменты зрелых белков BCW 001, BCW 002 или BCW 003 проявляют пестицидную активность, которой обладают исходные молекулы белка, из которых они получены. Описанный в данном документе фрагмент или вариант может дополнительно содержать обозначенный в данном документе домен, который отвечает за пестицидную активность белка. Усеченное производное, обладающее ингибирующей активностью в отношении насекомых, представляет собой токсичный белок BCW, соответствующий остаткам от около 28 до около 606, или до около 618 последовательности токсичного белка BCW 001, как указано в SEQ ID NO: 2, или остаткам от около 29 до около 607 и до остатка 619 токсичного белка BCW, как указано в SEQ ID NO: 4 или SEQ ID NO: 6.
[0070] Еще в одном варианте осуществления, укороченные N-концевые делеционные мутации включают в себя, но не ограничиваются токсичными белками BCW 001, в которых отсутствуют аминокислотные остатки либо с N-конца, и/или с С-конца токсичной части без протоксина, либо токсическое ядро токсичных белков BCW. Например, от 1 до 6 N-концевых аминокислотных остатков токсичного ядра белка BCW 001, соответствующего остаткам с 28 по 618 SEQ ID NO: 2 или остаткам с 29 по 619 SEQ ID NO: 4 или 6, могут быть удалены. Усеченные С-концевые делеционные мутанты токсичного белка BCW, соответствующего остаткам с 28 по 618 последовательности SEQ ID NO: 2 или остаткам с 29 по 619 последовательности SEQ ID NO: 4 или 6, включают в себя, но не ограничиваются токсичными белками BCW, в которых отсутствуют от 1 до 6 С-концевых аминокислотных остатков. В других вариантах осуществления, токсичный белок BCW с соответствующими остатками 28-618 SEQ ID NO: 2 или соответствующими остатками 29-619 SEQ ID NO: 4 или 6, может иметь как N-концевое усечение от 1 до 6 аминоконцевых остатков, так и С-концевое усечение от 1 до 6 карбоксиконцевых остатков.
[0071] В некоторых вариантах осуществления, отдельные сегменты с 1 по 6 белка CPR24719 или комбинация из сегментов с 1 по 6, которые предоставляют активность против совки-ипсилон белку, отличающемуся от CPR24719-1, также могут проявлять ту же или подобную функцию.
[0072] Фрагменты и варианты токсичного белка BCW, раскрытые в данном документе, могут обладать около 62% или больше идентичности последовательности, около 65%, 70%, 75%, 80%, 85%, 90%, 92%, 95%, 96%, 97%, 98% или больше идентичности последовательности и около 99%, 99,5%, 100% идентичности аминокислотной последовательности с соответствующими сегментами зрелого токсичного белка BCW, имеющего соответствующие аминокислотные последовательности, показанные как остатки 28-618 SEQ ID NO: 2 или остатки 29-619 SEQ ID NO: 4 или 6.
[0073] Вариант осуществления изобретения включает в себя рекомбинантные полинуклеотидные композиции, которые кодируют токсичные белки BCW. Например, токсичные белки BCW могут экспрессироваться с помощью рекомбинантных конструкций ДНК, в которых выделенная полинуклеотидная молекула с открытой рамкой считывания, кодирующей белок, функционально связана с такими элементами, как промотор и любой другой регуляторный элемент, функционирующий для экспрессии в системе, для которой предназначена конструкция. Отсылка в данной заявке к «выделенной молекуле ДНК», или эквивалентному термину или фразе, предназначена для обозначения того, что молекула ДНК представляет собой молекулу, которая присутствует отдельно или в комбинации с другими соединениями, но не в ее естественной среде. Например, элементы нуклеиновой кислоты, такие как кодирующая последовательность, последовательность интрона, нетранслируемая лидерная последовательность, последовательность промотора, последовательность терминации транскрипции и т.п., которые природно обнаруживают в ДНК генома организма, не считаются «выделенными» до тех пор, пока элемент находится в геноме организма и в том месте в геноме, в котором его природно обнаруживают. Однако, каждый из данных элементов, и частей таких элементов, будут «выделены» в рамках данного раскрытия изобретения, если элемент находится не в геноме организма, и не месте в геноме, в котором его природно обнаруживают. Подобным образом, нуклеотидная последовательность, кодирующая инсектицидный белок или любой встречающийся в природе инсектицидный вариант такого белка, будет представлять собой выделенную нуклеотидную последовательность, до тех пора пока нуклеотидная последовательность не находится в ДНК бактерии, в которой природно обнаруживают последовательность, кодирующую белок. Синтетическая нуклеотидная последовательность, кодирующая аминокислотную последовательность встречающегося в природе инсектицидного белка, будет считаться выделенной для целей данного раскрытия изобретения. Для целей данного раскрытия изобретения, любая трансгенная нуклеотидная последовательность, то есть нуклеотидная последовательность ДНК, вставленная в геном клеток растения или бактерии, или присутствующая во внехромосомном векторе, будет рассматриваться как выделенная нуклеотидная последовательность, независимо от того, присутствует она в плазмиде или аналогичной структуре, используемой для трансформации клеток, в геноме растения или бактерии, или присутствует в обнаруживаемых количествах в тканях, потомстве, биологических образцах или товарных продуктах, полученных из растения или бактерии. Неограничивающие примеры включают в себя функциональные в растениях промоторы, функционально связанные с последовательностями, кодирующими токсичный белок BCW, для экспрессии белка в растениях, или Bt-функциональные промоторы, функционально связанные с последовательностями, кодирующими токсичный белок BCW, для экспрессии белка в Bt. Другие элементы, которые могут быть функционально связаны с последовательностями, кодирующими токсичный белок BCW, включают в себя, но не ограничиваются лишь этими: энхансеры, интроны, лидерные последовательности, кодируемые тэги иммобилизации белка (HIS-тэг), кодируемые пептиды субклеточной транслокации (например, пластидные транзитные пептиды, сигнальные пептиды), кодируемые полипептидные сайты ферментов посттрансляционных модификаций, рибосомные сайты связывания и сайты-мишени РНКи.
[0074] Как применяется в данном документе, термин «рекомбинантная молекула ДНК» представляет собой молекулу ДНК, содержащую комбинацию молекул ДНК, которые не встречались бы в природе вместе без вмешательства человека. Например, рекомбинантная молекула ДНК может представлять собой молекулу ДНК, которая состоит по меньшей мере из двух молекул ДНК, гетерологичных по отношению друг к другу, молекулу ДНК, которая содержит последовательность ДНК, которая отличается от последовательностей ДНК, существующих в природе, или молекулу ДНК, которая была включена в ДНК клетки-хозяина путем генетической трансформации или редактирования генов. Аналогичным образом, «рекомбинантная молекула белка» представляет собой молекулу белка, содержащую комбинацию аминокислот, которые не встречались бы в природе вместе без вмешательства человека. Например, рекомбинантная молекула белка может быть молекулой белка, которая состоит по меньшей мере из двух аминокислотных молекул, гетерологичных по отношению друг к другу, молекулой белка, которая содержит аминокислотную последовательность, которая отличается от аминокислотных последовательностей, существующих в природе, или молекулой белка, которая экспрессируется в клетке-хозяине в результате генетической трансформации клетки-хозяина или из-за редактирования генов генома клетки-хозяина.
[0075] Иллюстративные рекомбинантные полинуклеотидные молекулы, предложенные в данном документе, включают в себя, но не ограничиваются лишь этими: SEQ ID NO: 7, SEQ ID NO: 9 и SEQ ID NO: 11, а также каждый из нуклеотидных сегментов, указанных в SEQ ID NO: 3 и SEQ ID NO: 5 и которые кодируют соответствующие полипептиды или белки, имеющие аминокислотную последовательность, как указано в SEQ ID NO: 2 (BCW oo1), SEQ ID NO: 4 (BCW 002), SEQ ID NO: 6 (BCW 003) и SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12. Раскрытые в данном документе кодоны рекомбинантной полинуклеотидной молекулы, кодирующей белки, могут быть заменены синонимичными кодонами (также называемыми молчащей заменой). Также предложены рекомбинантные полинуклеотиды, кодирующие любой из белков-вариантов токсина BCW, описанных в данном документе.
[0076] Конструкция рекомбинантной ДНК, содержащая последовательности, кодирующие токсичный белок BCW, может также дополнительно содержать область ДНК, которая кодирует один или большее количество агентов, ингибирующих насекомых, которые могут быть сконфигурированы для одновременной экспрессии или ко-экспрессии с последовательностью ДНК, кодирующей токсичный белок BCW, белка, отличающегося от токсичного белка BCW, ингибирующей насекомых молекулы дцРНК или инсектицидного химического соединения. Неограничивающими примерами инсектицидных химических соединений являются органохлориды, органофосфаты и карбаматы, пиретроиды, неоникотиноиды и рианоиды.
[0077] Конструкция рекомбинантной ДНК может быть собрана таким образом, что все белки или молекулы дцРНК экспрессируются одним промотором, или каждая молекула белка или дсРНК находится под контролем отдельного промотора или какой-либо их комбинацией. Раскрытые в данном документе белки могут быть экспрессированы из мультигенной системы экспрессии, в которой один или большее количество белков, описанных в данном документе, экспрессируются из общего нуклеотидного сегмента, который также содержит другие открытые рамки считывания и/или промоторы в зависимости от типа выбранной системы экспрессии. Например, бактериальная мультигенная система экспрессии может использовать один промотор для управления экспрессией множественно связанных/тандемных открытых рамок считывания из одного оперона. В другом примере, в растительной мультигенной системе экспрессии могут использоваться мультисвязанные экспрессионные кассеты, каждая из которых экспрессирует разный белок или разный агент, такой как одна или большее количество молекул дцРНК. В еще одном примере, в растительной мультигенной системе экспрессии могут использоваться мультинесвязанные экспрессионные кассеты, каждая из которых экспрессирует разный белок или разный агент, такой как одна или большее количество молекул дцРНК. Промотор для применения в описанной в данном документе рекомбинантной нуклеиновой кислоте может содержать полную последовательность промотора или любой его вариант или фрагмент, обладающий активностью промотора или активностью генной регуляции.
[0078] Конструкция рекомбинантного полинуклеотида или рекомбинантной ДНК, содержащая последовательность, кодирующую токсичный белок BCW, может быть доставлена в клетки-хозяева векторами, например, плазмидой, бакуловирусом, искусственной хромосомой, вирионом, космидой, фагмидой, фагом или вирусным вектором. Такие векторы могут быть использованы для достижения стабильной или временной экспрессии последовательности, кодирующей токсичный белок BCW в клетке-хозяине, или последующей экспрессии в полипептид. Экзогенная конструкция рекомбинантного полинуклеотида или рекомбинантной ДНК, которая содержит последовательность, кодирующую токсичный белок BCW и которая вводится в клетку-хозяина, называется в данном документе «трансгеном».
[0079] Также в данном документе предложены трансгенные бактерии, трансгенные клетки растений, трансгенные растения, грибы и дрожжи и части трансгенных растений, которые содержат любой рекомбинантный полинуклеотид, который экспрессирует любую одну или большее количество последовательностей, кодирующих токсичный белок BCW, предложенный в данном документе. Термин «бактериальная клетка» или «бактерия» может включать в себя, но не ограничивается клеткой Agrobacterium, Bacillus, Escherichia, Salmonella, Pseudomonas или Rhizobium. Термин «клетка растения» или «растение» могут включать в себя, но не ограничиваются лишь клеткой растения или растением: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, лена, чеснока, винограда, хмеля, лука-порея, салата-латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополи, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, тыквенных, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы. В некоторых вариантах осуществления, предложены трансгенные растения и части трансгенных растений, регенерированные из клетки трансгенного растения. В некоторых вариантах осуществления, трансгенные растения могут быть получены из трансгенного семени, путем размножения, разрезания, отламывания, измельчения или иным образом отсоединения части от растения. В некоторых вариантах осуществления, часть растения может быть семенем, коробочкой, листом, цветком, стеблем, корнем или любой их частью, или нерегенерируемым фрагментом части трансгенного растения. Как используется в данном контексте, «нерегенерируемая» часть трансгенной части растения представляет собой часть, которая не может быть стимулирована для образования целого растения, или которая не может быть стимулирована для образования целого растения, способного к половому и/или бесполому размножению. В некоторых вариантах осуществления, нерегенерируемая часть части растения представляет собой часть трансгенного семени, семенной коробочки, листка, цветка, стебля или корня.
[0080] В данном документе также предложены способы получения трансгенных растений, которые содержат ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. Такие растения могут быть получены путем введения рекомбинантного полинуклеотида, который кодирует любой из токсичных белков BCW, представленных в данном документе, в клетку растения, и отбор растения, полученного из указанной клетки растения, которое экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. Растения могут быть получены из растительных клеток методами регенерации, способами трансформации семян, пыльцы или меристемы.
[0081] Способы трансформации y растений известны в данной области техники. Например, Agrobacterium-опосредованная трансформация, описана в публикациях патентных заявок США № 2009/0138985A1 (соя), № 2008/0280361A1 (соя), № 2009/0142837A1 (кукуруза), № 2008/0282432 (хлопок), № 2008/0256667 (хлопок), № 2003/0110531 (пшеница), № 2001/0042257 A1 (сахарная свекла), патентах США № 5750871 (канола), № 7026528 (пшеница), и № 6365807 (рис), и в Arencibia et al. (1998) Transgenic Res. 7:213-222 (сахарный тросник).
[0082] В данном документе также предложено применение трансгенного растения, которое экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW, для борьбы с заражением насекомыми или чешуекрылыми. Любое из вышеупомянутых трансгенных растений может быть использовано в способах защиты растения от заражения насекомыми или чешуекрылыми, приведенными в данном документе. Способы получения трансгенных растений, которые экспрессируют активные против чешуекрылых белки, такие как белки Cry1A (патент США № 5880275), Cry1B (заявка на патент США № 10/525318), Cry1C (патент США № 6033874), Cry1F, химеры Cry1A/F (патенты США № 7070982; 6962705 и 6713063) и белок Cry2Ab (патент США № 7064249) являются хорошо охарактеризованными.
[0083] В данном документе также предложено применение любой из вышеупомянутых трансгенных клеток-хозяев для продуцирования токсичного белка BCW.
[0084] Дополнительные аспекты изобретения включают в себя антитела и способы обнаружения полинуклеотидов, которые кодируют токсичные белки BCW, или способы различения их фрагментов и сегментов, способы идентификации дополнительных членов семейства белков, ингибирующих насекомых, готовые формы и способы контроля роста и/или заражения насекомыми, и также способы для предоставления такого контроля растениям и другим хозяевам-реципиентам.
[0085] В некоторых вариантах осуществления, растительный продукт может включать в себя товарные или другие коммерческие продукты, полученные из трансгенного растения или части трансгенного растения, причем товарные или другие продукты могут отслеживаться по коммерческой деятельности путем обнаружения нуклеотидных сегментов, или экспрессированной РНК или белков, которые кодируют или содержат отличительные части токсичного белка BCW. Такие товарные или другие коммерческие продукты включают в себя, но не ограничиваются лишь этими: части растения, биомассу, масло, шрот, сахар, корм для животных, муку, хлопья, отруби, пух, обработанные семена и семена.
[0086] Также при этом предложены обработанные растительные продукты, причем указанный обработанный продукт содержит детектируемое количество рекомбинантного полинуклеотида, кодирующего токсичный белок BCW, его сегмент, его фрагмент, ингибирующий насекомых, или любую его отличительную часть. В некоторых вариантах осуществления, обработанный продукт выбирают из группы, состоящей из: растительной биомассы, масла, шрота, корма для животных, муки, хлопьев, отрубей, пуха, шелухи и обработанных семян. В некоторых вариантах осуществления, обработанный продукт является не регенерируемым.
[0087] Также в данном документе предложены способы борьбы с насекомыми. В некоторых вариантах осуществления, заражение чешуекрылыми культурных растений является контролируемым. Такие способы могут включать в себя выращивание растения, содержащего ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. В определенных вариантах осуществления, такие способы могут дополнительно включать в себя любое одно или большее количество из: (i) нанесения любой композиции, содержащей или кодирующей токсичный белок BCW, на растение или семя, которое дает растение; и/или (ii) трансформацию растения или растительной клетки, которая дает растение, полинуклеотидом, кодирующим токсичный белок BCW. В некоторых вариантах осуществления, растение представляет собой временно или стабильно трансформированное трансгенное растение, содержащее трансген, который экспрессирует ингибирующее насекомых или чешуекрылых количество токсичного белка BCW. В некоторых вариантах осуществления, растение представляет собой нетрансгенное растение, на которое была нанесена композиция, содержащая токсичный белок BCW. В некоторых вариантах осуществления таких способов, растение представляет собой растение кукурузы или сахарного тростника. В некоторых вариантах осуществления, вид Lepidoptera представляет собой Agrotis ipsilon. В некоторых вариантах осуществления, вид Lepidoptera представляет собой Diatraea saccharalis. В некоторых вариантах осуществления, вид Lepidoptera находится на поле с культурным растением.
[0088] Увеличение количества белков, раскрытых в данном документе, либо в растениях, либо с помощью технологического процесса, может включать в себя культивирование рекомбинантных Bt-клеток в условиях для экспрессии/продуцирования рекомбинантного полипептида/белков. Такой процесс может включать в себя получение путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, седиментации или концентрирования культуры рекомбинантных Bt-клеток, экспрессирующих/продуцирующих указанный рекомбинантный полипептид. Такой процесс может привести к получению Bt-клеточного экстракта, клеточной суспензии, гомогената клеток, лизата клеток, супернатанта клеток, фильтрата клеток или осадка клеток. Получая рекомбинантные полипептиды/белки, произведенные таким образом, композиция, которая содержит рекомбинантные полипептиды/белки, может содержать бактериальные клетки, бактериальные споры и параспоральные внутриклеточные тельца, и может быть приготовлена для различных применений, включая распыляемые сельскохозяйственные продукты, ингибирующие насекомых, или в виде готовых форм, подавляющих насекомых в пищевых биоанализах.
[0089] В одном варианте осуществления, композиция/готовая форма, ингибирующая насекомых, содержащая раскрытый рекомбинантный полипептид/белок, может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую активность в отношении тех же видов чешуекрылых насекомых, но отличается от рекомбинантного полипептида, чтобы обеспечить уменьшение количества случаев появления устойчивости у чешуекрылых насекомых к токсичному белку BCW или другой композиции, ингибирующей чешуекрылых. Такой полипептид выбран из группы, состоящей из белка, ингибирующего насекомых, молекулы дцРНК, ингибирующей насекомых, и химического соединения. Один пример использования таких рибонуклеотидных последовательностей для борьбы с насекомыми-вредителями описан в публикации заявки на патент США № 2006/0021087. Примеры других таких композиций включают в себя, но не ограничиваются лишь этими: Cry1A (патент США № 5880275), Cry1Ab, Cry1Ac, Cry1Ae, Cry1B (заявка на патент США № 10/525318), Cry1C (патент США № 6033874), Cry1E, Cry1F и химеры Cry1A/F (патенты США № 7070982; № 6962705 и № 6713063), Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab (патент США № 7064249), Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853 и TIC1415. Другими неограничивающими примерами являются активные против чешуекрылых белки VIP, Axmi и DIG, такие как, но не ограниченные Vip3A, VIP3Ab, AXMI-184, AXMI-196, DIG-3, DIG-4, DIG-5 и DIG-11, которые могут быть скомбинированы с белками, описанными в данном документе.
[0090] В других вариантах осуществления, такая композиция может дополнительно содержать, по меньшей мере, один дополнительный полипептид, который проявляет ингибирующую по отношению к насекомому активность, которое не подавляется другим токсичным белком BCW, ингибирующим насекомых, для расширения спектра полученного ингибирования насекомых. Например, для борьбы с жесткокрылыми насекомыми-вредителями можно использовать комбинации токсичных белков BCW, ингибирующих насекомых, с белками, активными против жесткокрылых, такими как, но не ограничиваясь лишь этими: варианты Cry1C, варианты Cry3A, Cry3Bb (патент США № 6501009), Cry34/35, 5307, Axmi184, Axmi205, AxmiR1, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, DIG-10 и eHIP (публикация заявки на патент США № 2010/0017914).
[0091] В данной области техники была задокументирована возможность насекомых развивать устойчивость к определенным инсектицидам. Одна из стратегий контроля устойчивости насекомых заключается в использовании трансгенных культур, которые экспрессируют два различных агента, ингибирующих насекомых, которые имеют различные способы действия. Следовательно, любое насекомое, обладающее устойчивостью к одному из агентов, ингибирующих насекомых, может контролироваться другим агентом, ингибирующим насекомых. Другая стратегия контроля устойчивости насекомых предусматривает использование растений, которые не защищены от видов чешуекрылых вредителей, чтобы создать для них экологическое убежище. Один конкретный пример описан в патенте США № 6551962.
[0092] Другие варианты осуществления, раскрытые в данном документе, включают в себя пестицидные химические соединения местного применения, которые предназначены для борьбы с вредителями, которых также контролируют с помощью белков, раскрытых в данном документе, для использования с белками при обработке семян, распылении, поливе, или орошение готовыми формами, которые можно непосредственно вносить в почву (почвенное орошение), применяемые к выращиваемым растениям, экспрессирующим белки, раскрытые в данном документе, или приготовленные для применения к семенам, содержащим один или большее количество трансгенов, кодирующих один или большее количество раскрытых белков. Такие готовые формы для применения при обработке семян можно наносить с различными клеящими веществами и веществами для повышения клейкости, известными в данной области техники. Такие готовые формы могут содержать пестициды, которые являются синергетическими по СД с раскрытыми белками, так что готовая форма пестицидов имеет отличающийся СД для борьбы с теми же или аналогичными вредителями, которые могут контролироваться раскрытыми белками, или так, что действие таких пестицидов контролирует более широкий диапазон хозяев-вредителей, таких как виды чешуекрылых или полужесткокрылых (Hemiptera), или другие виды вредителей растений, такие как виды жесткокрылых (Coleoptera), которые не контролируются эффективно.
[0093] Вышеупомянутая композиция/готовая форма может дополнительно содержать приемлемый с точки зрения сельского хозяйства носитель, такой как приманка, порошок, пыль, пеллеты, гранулы, спрей, эмульсия, коллоидная суспензия, водный раствор, препарат спор/кристаллов Bacillus, удобрение семян, рекомбинантная растительная клетка/растительная ткань/семя/растение, трансформированные для экспрессии одного или большего количества белков, или бактерия, трансформированная для экспрессии одного или большего количества белков. В зависимости от уровня ингибирования насекомых или инсектицидного ингибирования, присущего рекомбинантному полипептиду, и активности готовой формы, которая будет применяться в растительных или пищевых биоанализах, композиция/готовая форма может содержать различные массовые количества рекомбинантного полипептида, например, от 0,0001% до 0,001%, до 0,01%, до 1%, до 99% по массе рекомбинантного полипептида.
[0094] Раскрытые в данном документе белки можно комбинировать в готовых формах для местного применения к покровам растений, к почве, в готовых формах для обработки семян и в готовых формах с другими агентами, токсичными для в целевых видов чешуекрылых-вредителей. Такие агенты включают в себя, но не ограничиваются лишь этими: белки Cry1A, химеры Cry1B, Cry1C, Cry1F, Cry1A/F и белок Cry2Ab.
ПРИМЕРЫ
[0095] Следующие раскрытые варианты осуществления просто представляют изобретение, которое может быть воплощено в различных формах. Таким образом, конкретные структурные и функциональные детали, раскрытые в данном документе, не должны интерпретироваться как ограничивающие. Следует понимать, что полное раскрытие каждого источника, цитируемого в данном документе, включено в данный документ посредством ссылки.
Пример 1
[0096] Данный пример описывает открытие и анализ токсичного белка BCW 001 и конструирование химерных токсинов BCW 002 и BCW 003.
[0097] Было установлено, что штамм EG4384 Bt обладает активностью против чешуекрылых в пищевых биоанализах с использованием препаратов спор с кристаллами. Была получена последовательность генома данного штамма, были обработаны сырые считанные последовательности, собраны контиги из обработанных считанных последовательностей, идентифицированы открытые рамки считывания, которые показали гомологию с белками Cry1, и проанализированы полученные аминокислотные последовательности. Была идентифицирована конкретная открытая рамка считывания, как указано в SEQ ID NO: 1, которая кодирует полученную аминокислотную последовательность белка (BCW 001, SEQ ID NO: 2), которая демонстрирует новую аминокислотную последовательность по сравнению с большинством белков Cry1, известных в данной области техники. Полученный белок из открытой рамки считывания обладает всеми характеристиками нового белка типа Cry1, поскольку он имеет длину 1180 аминокислот, а выравнивание с известными белкам Cry1 указывает на то, что данный белок имеет характерную трехдоменную структуру в пределах примерно 600-630 аминоконцевых аминокислот и характерную структуру аминокислотной последовательности протоксина типа Cry1A. Полинуклеотидная последовательность, кодирующая эту предсказанную аминокислотную последовательность, содержит открытую рамку считывания, которая также является характерной для Cry1, а именно есть сайт рестрикции NheI внутри сегмента ДНК, кодирующего C-концевую область предсказанного домена I токсина, и сайт рестрикции KpnI в пределах сегмента ДНК, кодирующего N-концевую часть предсказанного прототоксинового домена.
[0098] Сравнение аминокислотной последовательности токсина BCW 001 с Cry1Ac показывает, что аминокислотный сегмент, соответствующий домену I (аминокислоты от около позиции 1 до около позиции 258), демонстрирует только около 67% идентичности такому же сегменту в Cry1Ac, аминокислотный сегмент, соответствующий домену II (аминокислоты от около позиции 58 до около позиции 460), демонстрирует очень низкий процент идентичности с таким же сегментом в Cry1Ac, а аминокислотный сегмент, соответствующий домену III (аминокислоты от около позиции 460 до около позиции 607) демонстрирует около 63% идентичности с сегментом домена III из Cry1Ah2.
[0099] Сегмент ДНК, кодирующий по существу предсказанные домены II и III, был вырезан по сайтам рестрикции от NheI до KpnI, и заменен на соответствующий сегмент кодирующей последовательности Cry1Ac в векторе экспрессии, содержащем сегмент ДНК, кодирующий Cry1Ac, что дало открытую рамку считывания состоящую из, и соединение по рамке считывания в последовательном порядке от 5`конца до 3`конца, первого сегмента, кодирующего домен I Cry1Ac, второго сегмента, кодирующего домен II и III BCW 001, и третьего сегмента, кодирующего прототоксиновый домен токсичного белка Cry1Ac. Данная химерная конструкция (SEQ ID NO: 3) кодирует химерный токсичный белок, обозначенный в данном документе как BCW 002 (SEQ ID NO: 4). Незначительное смещение точки разрыва между доменом I и доменом II дает открытую рамку считывания (SEQ ID NO: 5), кодирующую химерный токсичный белок, называемый в данном документе BCW 003 (SEQ ID NO: 6), имеющий аминокислотную последовательность, отличающуюся от BCW002 только по аминокислотной позиции 259. BCW 003, как и BCW 001, содержит треонин (T) в позиции 259, а BCW 002 содержит изолейцин (I) в данной позиции. BCW 001 отличается от BCW 002 и BCW 003, главным образом, в домене I токсина, то есть по аминокислотам 1-202, а BCW 002 и BCW 002 практически идентичны, за исключением разницы I/T в позиции 259.
Пример 2
[00100] Этот пример показывает эффективность биологической активности белков BCW 001, 002 и 003 для контроля чешуекрылых вредителей.
[00101] Трансформация конструкций, экспрессирующих токсичные белки BCW 001, 002 и 003, в E. coli или в применимые Bacillus thuringiensis или другие Bacilli, позволила провести тестирование экспрессированных белков в биоанализе и сравнить с белками, известными в данной области техники, как токсичные для совки-ипсилон, такими как Cry1Fa и Cry1Ac. Наблюдалось, что полученные рекомбинантные штаммы экспрессируют рекомбинантный белок с активностью против чешуекрылых вредителей. Активность в биоанализе была особенно сильной при тестировании против личинок совки-ипсилон (Agrotis ipsilon) и Helicoverpa zea. Как указано выше в ПОДРОБНОМ ОПИСАНИИ СУЩНОСТИ ИЗОБРЕТЕНИЯ, УРОВНЕ ТЕХНИКИ и КРАТКОМ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ, было обнаружено очень мало токсичных белков, которые проявляют какой-либо заметный уровень биологической активности против совки-ипсилон, и поэтому в данной области техники существует потребность в идентификации таких белков для использования в растениях, для защиты таких растений от заражения совкой-ипсилон, и для того, чтобы убедится, что существует достаточный запас дополнительных активных против совки-ипсилон белков, доступных для преодоления любого развития устойчивости к любым таким активным против совки-ипсилон белкам, которые используются в данное время, таким как токсичные белки Cry1Fa.
Пример 3
[00102] В данном примере показано, что домены II и III BCW 001 являются достаточными для передачи биологической активности против совки-ипсилон другим токсичным белкам Cry1, когда такие домены заменяют соответствующие домены в таких других токсинах Cry1.
[00103] Были идентифицированы многие химерные токсины BCW, обладающие активностью против чешуекрылых, в частности, две химеры проявляли сильную активность против BCW, WBC и SCB.
[00104] Конструкции с нуклеотидными последовательностями, кодирующими Cry1Ab, Cry1Ac и Cry1Ca, использовали для конструирования химер, содержащих сегменты домена II и домена III BCW 001, заменяющие соответствующие домены Cry1Ab, Cry1Ac и Cry1Ca, и полученные нативные и химерные белки тестировали в биоанализах с кристаллами спор. Активности против BCW, FAW и CEW в таких пищевых биоанализах были сведены в таблицу. В экспериментальных условиях тестирования, Cry1Ac проявлял активность против FAW, BCW и CEW, Cry1Ab проявлял активность против FAW и CEW, но не против BCW, а Cry1Ca не проявлял активности против FAW, BCW, а также CEW. BCW 001 проявлял активность против BCW и CEW, но не FAW. По сравнению с BCW 003, активность Cry1Ac против BCW была примерно в десять раз меньше у Cry1Ac. Cry1Ab и Cry1Ac, химеры, содержащие домены II и III BCW 001, проявляли токсические свойства при тестировании в биоанализах против FAW, BCW и CEW. Cry1Ac не был токсичным против CEW, а Cry1Ab не был токсичным против BCW. Были сконструированы химеры Cry1Ca/BCW 001, в которых домен III Cry1Ca был заменен соответствующим доменом BCW 001, и полученный химерный токсин проявлял токсические свойства против FAW, BCW и CEW, тогда как токсин Cry1Ca был неэффективен при тестировании против любого из этих вредителей.
Пример 4
[00105] Этот пример иллюстрирует токсические свойства BCW 001, 002 и 003 при тестировании в биоанализе против разнообразных чешуекрылых-вредителей.
[00106] Протоколы для биоанализа и подсчета смертности и задержки роста насекомых известны в данной области техники, примеры которых описаны в публикации заявки на патент РСТ № WO 2012/139004 и в патенте США № 7927598.
[00107] На Фиг. 1 соотносятся различные токсичные белки BCW 001, 002 и 003 по пестицидной активности к видам насекомых в пищевых биоанализах. Каждый из данных токсичных белков продемонстрировал активность против чешуекрылых насекомых.
Пример 5
[00108] В этом примере описывается конструирование искусственных последовательностей, кодирующих белки согласно данному изобретению для использования в растениях, приготовление растительных векторов и конструкций для использования в растениях, и получение растений, экспрессирующих белки согласно данному изобретению.
[00109] Нуклеотидные последовательности, кодирующие белок BCW 001 (SEQ ID NO: 1), белок BCW 002 (SEQ ID NO: 3) и белок BCW 003 (SEQ ID NO: 5), были сконструированы и синтезированы в соответствии со способами, описанными в патенте США 5500365. Эти сконструированные кодирующие области, предназначенные для экспрессии в растениях, представлены в данном документе как SEQ ID NO: 7, кодирующая BCW 001, SEQ ID NO: 9, кодирующая BCW 002, и SEQ ID NO: 11, кодирующая BCW 003.
[00110] Разнообразные кассеты для экспрессии в растениях конструировали с последовательностями, указанными в SEQ ID NO: 7, 9 и 11. Такие кассеты экспрессии полезны для временной экспрессии в протопластах растений или для трансформации растительных клеток. Типичные экспрессионные кассеты были сконструированы с учетом возможного размещения белка в клетке. Один набор кассет экспрессии был сконструирован таким образом, чтобы позволить белку транслироваться и оставаться в цитозоле. Другой набор кассет экспрессии был сконструирован так, чтобы иметь транзитный пептид, смежный с токсичным белком, чтобы обеспечить нацеливание на органеллу клетки, такую как хлоропласт или пластид. Все кассеты экспрессии были сконструированы так, чтобы начинаться с 5'-конца промотором, который может состоять из нескольких промоторных элементов и энхансерных элементов, смежно связанных для усиления экспрессии трансгена. За промоторной последовательностью обычно следовали смежно одна или несколько лидерных последовательностей в 3' к промотору. Последовательность интрона была размещена в 3' к лидерной последовательности для улучшения экспрессии трансгена. Кодирующая последовательность токсина или транзитного пептида, и кодирующая последовательность токсина были расположены в 3' по отношению к промотору, лидерной последовательности и интрону. Определенная последовательность была размещена в 3' к кодирующей последовательности для облегчения терминации транскрипции и обеспечивает последовательности, важные для полиаденилирования полученного транскрипта. Все элементы, описанные выше, были расположены смежно, часто с дополнительной последовательностью, предусмотренной для конструирования экспрессионной кассеты, такой как сайты рестрикции эндонуклеаз или сайты безлигазного клонирования.
[00111] Для растений кукурузы был разработан набор кассет экспрессии для цитозольной экспрессии BCW 001, содержащий промотор убиквитина 1 Mexicana, BCW 002, содержащий промотор актина 15 Orysza sativa или промотор 35S, и BCW 003, содержащий промотор 35S.
[00112] Другой набор кассет экспрессии был разработан для целевой экспрессии в растениях кукурузы токсичных для насекомых белков BCW 002 и BCW 003, в которых последовательность, кодирующая пептид хлоропласта (например, CTP2), была слита по рамке считывания на 5'-конце ДНК сегмента, кодирующего токсичные белки BCW, содержащие промотор актина 15 Orysza sativa или промотор 35S, и последовательность, содержащую промотор 35S.
[00113] Кассеты для экспрессии в растениях сахарного тростника, содержащие промотор CaMV 35S или промотор PClSV.FLt, функционально связанный с промотором 35S, конструировали в виде векторов трансформации растений. В некоторых случаях, была включена кассета, экспрессирующая нацеленный на хлоропласты Cry2Ab.
[00114] Растения, экспрессирующие белки согласно данному изобретению, тестировали против личинок BCW, WBC, CEW, SWC и SCB третьей линьки. Кассета экспрессии в цитозоле для BCW 001, и нацеленная на цитозоль и пластиды кассета экспрессии для BCW 002 и BCW 003 были клонированы и использовались для получения трансгенных кукурузных растений, экспрессирующих данные белки. Трансформированные клетки индуцировали для формирования растений способами, известными в данной области техники. Биоанализ с использованием дисков листьев растений проводили аналогично тому, как описано в патенте США № 8344207. Степени повреждения листа (LDR) присваивалась оценка, основанная на проценте диска листа, съеденного насекомым, по шкале от 0 (съедено 0%) до 11 (съедено более 50%). Шаг оценки степени увеличивается на 5%. Изогенную линию кукурузы использовали для получения ткани в качестве отрицательного контроля, и результаты оценивали. Как экспрессия в пластидах-мишенях, так и цитозольная экспрессия токсичных для насекомых белков BCW 002 и BCW 003 снижали повреждение при питании по сравнению с нетрансформированным контролем. Результаты анализов дисков из листьев в отношение этих насекомых согласуются с данными биоанализа из примеров, представленных выше. Одна конструкция, содержащая кассету BCW 003 для цитозольной экспрессии, дала 34 трансформанта, 25 из них продемонстрировали полный контроль над личинками BCW. Растения кукурузы, экспрессирующие BCW 001 и BCW 003 в цитозоле, также тестировали на CEW, SWC и FAW. Растения, экспрессирующие BCW 003, демонстрировали 100% контроль CEW и SWC, и значения LDR в диапазоне от 1 до 2. Три трансформанта, экспрессирующие BCW 001, дали растения, проявляющие эффективность в отношении CEW и SWC, и значения LDR в диапазоне от 1 до 3. Это согласуется с данными пищевого биоанализа, представленными в предыдущих примерах.
[00115] Трансгенные растения сахарного тростника, экспрессирующие BCW 003, были получены и испытаны против SCB в биоанализах. Каждый биоанализ включал в себя диски листьев из сахарного тростника дикого типа в качестве отрицательного контроля, и из положительного контроля, экспрессирующего высокие уровни Cry2Ab. Смертность насекомых и повреждение листьев измеряли через четыре (4) дня после заражения. Было обнаружено, что диски листьев нескольких трансформантов сахарного тростника, экспрессирующих BCW 003, демонстрируют контроль Diatraea saccharalis (sugarcane borer) in planta и имеют степень повреждения ниже 2, аналогично положительному контролю и средней смертности насекомых 90-100%.
[00116] Трансформанты, экспрессирующие BCW 003 и Cry2Ab, демонстрировали лучший контроль SCB по сравнению с трансформантами, которые экспрессировали только BCW 003.
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Monsanto Technology LLC
<120> ПЕСТИЦИДНЫЕ БЕЛКОВЫЕ ТОКСИНЫ, АКТИВНЫЕ В ОТНОШЕНИИ
ЧЕШУЕКРЫЛЫХ НАСЕКОМЫХ
<130> MONS:434WO
<150> US 62/445,313
<151> 2017-01-12
<160> 12
<170> Версия PatentIn 3.5
<210> 1
<211> 3543
<212> ДНК
<213> Bacillus thuringiensis
<220>
<221> CDS
<222> (1)..(3540)
<400> 1
atg gag gaa aat aat cag aat caa tgc gtc cct tat aat tgt ttg aat 48
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15
aat cct gca atc gaa ata tta gaa gga gac aga ata tca gtt ggt aac 96
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30
act cca atc gat att tct cta tca ctt gtg gaa ctt ctt att agt gaa 144
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45
ttt gtc cca ggc ggt gga ata ata aca gga ttg ttg aac ata gta tgg 192
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60
gga ttt gta ggg cct tcc caa tgg gac gca ttt ctt gct caa gtg gaa 240
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80
cag tta att aac caa agg ata tca gaa gct gta aga aat aca gca att 288
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95
cag gaa tta gag gga atg gcg cgg gtt tat aga acc tat gct act gct 336
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110
ttt gct gag tgg gaa aga gat cct aat aac aca gat cta aga gaa gca 384
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125
gta cgg aca cag ttt aca gca act gag act tat atc agt gga aga ata 432
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140
tct gtt tta aaa att caa aat ttt gaa gtg cag ctg tta tcg gtg ttt 480
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160
gcc caa gct gcc aat tta cat tta tct tta tta aga gac gtt gtg ttt 528
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175
ttt ggg caa aga tgg ggg ttt tca acg aca acc gta aat aat tac tac 576
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190
aat gat tta aca gaa gag att agt acc tat aca gat tat gca gta cgc 624
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205
tgg tac aat acg gga tta gag cgt gta tgg gga ccg gat tct aga gat 672
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220
tgg gta agg tat aat caa ttt aga aga gag cta aca ctt act gta tta 720
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
gat atc gtt gct cta ttc cca aat tat gat agt cga agg tat cca att 768
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255
cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta tta 816
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270
gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa cag 864
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285
aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc att 912
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300
tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa ata 960
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320
aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct tta 1008
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335
ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta act 1056
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350
ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga att 1104
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365
ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat gga 1152
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380
acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act ata 1200
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400
tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca cag 1248
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415
gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt cat 1296
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430
gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga gct 1344
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445
cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata att 1392
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460
gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct att 1440
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480
att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc gat 1488
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495
ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca tac 1536
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510
ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt gtt 1584
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525
cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt ttc 1632
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540
gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca tta 1680
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560
gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga act 1728
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575
ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta tct 1776
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590
act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act gca 1824
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605
acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg aat 1872
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620
gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg acg 1920
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640
gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg gat 1968
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655
gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa cat 2016
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670
gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac ttc 2064
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685
agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg gat 2112
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700
att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc aca 2160
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720
cta cca ggt acc ttt gat gag tgc tat cca acg tat tta tat caa aaa 2208
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735
ata gat gag tcg aaa tta aaa gcc tat acc cgt tat caa tta aga ggg 2256
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750
tat atc gag gat agt caa gac tta gaa atc tat tta att cgc tac aat 2304
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765
gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg ccg 2352
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780
ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga tgc 2400
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800
gcg cca cac ctt gaa tgg aat cct gat tta cac tgt tcc tgc aga gac 2448
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815
ggg gaa aaa tgt gct cat cat tct cat cat ttc tcc ttg gac att gat 2496
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830
gtt gga tgt aca gac tta aat gag gat tta ggt gta tgg gtg ata ttc 2544
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845
aag att aag acg caa gat ggc cat gca aga cta gga aat cta gag ttt 2592
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860
ctc gaa gag aaa cca tta gta ggg gaa gca cta gct cgt gtg aaa aga 2640
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880
gcg gag aaa aaa tgg aga gac aaa cgc gaa aaa tta caa ttg gaa aca 2688
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895
aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt gta 2736
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910
aac tct caa tat gat caa tta caa gcg gat acg aac atc gcg atg att 2784
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925
cat gcg gca gat aaa cgt gtt cat aga atc cga gaa gcg tac ctt cca 2832
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940
gag tta tct gtg att ccg ggt gta aat gca gac att tcc gaa gaa tta 2880
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960
gaa ggg cgt att ttc act gca ttc tct cta tat gat gcg aga aat gtc 2928
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975
att aaa aat ggc gat ttc aat aat ggc tta tta tgc tgg aac gtg aaa 2976
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990
ggg cat gta gat gta gaa gaa caa aat aac cac cgt tcg gtc ctt gtt 3024
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005
gtt ccg gaa tgg gaa gca gaa gtg tca caa gag gtt cgt gtc tgt 3069
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020
ccg ggg cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag gga 3114
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035
tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat aca 3159
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050
gac gaa ctg aag ttt agc aac tgt gta gaa gag gaa gtc tat cca 3204
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065
aac aac acg gta acg tgt aat gat tat act gca aat caa gaa gaa 3249
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080
tat gag ggt acg tac act tct cgt aat cga gga tat gac gaa gcc 3294
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095
tat gaa agc aat tct tct gta cca gct gag tat gcg tca gtc tat 3339
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110
gaa gaa aaa gtg tat aca gat gga cga aga ggg aat cct tgt gaa 3384
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125
tct aac aga gga tat ggg gat tac aca cca cta cca gct ggc tat 3429
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140
gtg aca aaa gaa tta gag tac ttc cca gaa acc gat aag gta tgg 3474
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155
att gag att gga gaa aca gaa gga aca ttc att gtg gat agt gtg 3519
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170
gaa tta ctc ctt atg gag gaa taa 3543
Glu Leu Leu Leu Met Glu Glu
1175 1180
<210> 2
<211> 1180
<212> БЕЛОК
<213> Bacillus thuringiensis
<400> 2
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170
Glu Leu Leu Leu Met Glu Glu
1175 1180
<210> 3
<211> 3534
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Полностью синтетическая ДНК, кодирующая BCW 002
<220>
<221> CDS
<222> (1)..(3531)
<400> 3
atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta tca gta 480
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
att cga ata gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa 960
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
gct cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
aaa ggg cat gta gat gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
ctt atg gag gaa tag 3534
Leu Met Glu Glu
1175
<210> 4
<211> 1177
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 4
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
Leu Met Glu Glu
1175
<210> 5
<211> 3534
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Полностью синтетическая последовательность, кодирующая BCW 003
<220>
<221> CDS
<222> (1)..(3531)
<400> 5
atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
att cct ctt ttg gca gtt caa aat tat caa gtt cct ctt tta tca gta 480
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
tat aat gat tta act agg ctt att ggc aac tat aca gat tat gct gta 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
cgc tgg tac aat acg gga tta gaa cgt gta tgg gga ccg gat tct aga 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
gat tgg gta agg tat aat caa ttt aga aga gaa tta aca cta act gta 720
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
tta gat atc gtt gct ctg ttc ccg aat tat gat agt aga aga tat cca 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
att cga aca gtt tcc caa tta aca aga gaa att tat acg aac cca gta 816
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
tta gaa aat ttt gat ggt agt ttt cgt gga atg gct cag aga ata gaa 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
cag aat att agg caa cca cat ctt atg gat atc ctt aat agt ata acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
att tat act gat gtg cat aga ggc ttt aat tat tgg tca ggg cat caa 960
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
ata aca gct tct cct gta ggg ttt tca gga cca gaa ttc gca ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
tta ttt ggg aat gcg gga aat gca gct cca ccc gta ctt gtc tca tta 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
act ggt ttg ggg att ttt aga aca tta tct tca cct tta tat aga aga 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
att ata ctt ggt tca ggc cca aat aat cag gaa ctg ttt gtc ctt gat 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
gga acg gag ttt tct ttt gcc tcc cta acg acc aac ttg cct tcc act 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
ata tat aga caa agg ggt aca gtc gat tca cta gat gta ata ccg cca 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
cag gat aat agt gta cca cct cgt gcg gga ttt agc cat cga ttg agt 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
cat gtt aca atg ctg agc caa gca gct gga gca gtt tac acc ttg aga 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
gct cca acg ttt tct tgg cag cat cgc agt gct acg aca act aat ata 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
att gca gcg gat agt att act caa att cct gct gtt aaa gga cgt tct 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
att att aat aat ggc acg gta att tca gga cca ggg ttt acc gga ggc 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
gat ttg gtt aga tta tac aat gct gat ttt aat att aat aat aga gca 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
tac ctt gaa gtt ccg ata ttc ttc caa tca ccc tct aca aat tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
gtt cgt gtt cgt tat gct tct aca tct tca ctc cct gta gat gta gtt 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
ttc gga aat att agt cat cct act aca ttc cca gcc act gcc aga tca 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
tta gat aat cta caa tcc aat gat ttt gga tat att gat att gct gga 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
act ttc tta cct tca cta ggg cct agt ata ggt atc aga cct atg tta 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
tct act att aat ttg ata gta gat aga ttt gaa ttt att cca gta act 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
gca acc ttt gaa gca gaa tcg gat tta gaa aga gca caa aag gcg gtg 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
aat gcg ctg ttt act tct aca aac caa cta ggg ata aaa aca gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
acg gat tat cat att gat caa gtg tcc aat tta gtg gag tgt tta tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
gat gaa ttt tat ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
cat gcg aag cga ctc agt gat gag cga aat tta ctt caa gat cca aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
ttc agg ggc atc aat aga caa cca gat cgt ggc tgg aga gga agt acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
gat att acc atc caa gga gga gat gac gta ttc aaa gag aat tac gtc 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
aca cta cca ggt acc ttt gat gag tgc tat cca aca tat ttg tat caa 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
aaa atc gat gaa tca aaa tta aaa gcc ttt acc cgt tat caa tta aga 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
ggg tat atc gaa gat agt caa gac tta gaa atc tat tta att cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
aat gca aaa cat gaa aca gta aat gtg cca ggt acg ggt tcc tta tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
ccg ctt tca gcc caa agt cca atc gga aag tgt gga gag ccg aat cga 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
tgc gcg cca cac ctt gaa tgg aat cct gac tta gat tgt tcg tgt agg 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
gat gga gaa aag tgt gcc cat cat tcg cat cat ttc tcc tta gac att 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
gat gta gga tgt aca gac tta aat gag gac cta ggt gta tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
ttt aag att aag acg caa gat ggg cac gca aga cta ggg aat cta gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
ttt ctc gaa gag aaa cca tta gta gga gaa gca cta gct cgt gtg aaa 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
aga gcg gag aaa aaa tgg aga gac aaa cgt gaa aaa ttg gaa tgg gaa 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
aca aat atc gtt tat aaa gag gca aaa gaa tct gta gat gct tta ttt 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
gta aac tct caa tat gat caa tta caa gcg gat acg aat att gcc atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
att cat gcg gca gat aaa cgt gtt cat agc att cga gaa gct tat ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
cct gag ctg tct gtg att ccg ggt gtc aat gcg gct att ttt gaa gaa 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
tta gaa ggg cgt att ttc act gca ttc tcc cta tat gat gcg aga aat 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
gtc att aaa aat ggt gat ttt aat aat ggc tta tcc tgc tgg aac gtg 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
aaa ggg cat gta gat gta gaa gaa caa aac aac caa cgt tcg gtc ctt 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
gtt gtt ccg gaa tgg gaa gca gaa gtg tca caa gaa gtt cgt gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
tgt ccg ggt cgt ggc tat atc ctt cgt gtc aca gcg tac aag gag 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
gga tat gga gaa ggt tgc gta acc att cat gag atc gag aac aat 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
aca gac gaa ctg aag ttt agc aac tgc gta gaa gag gaa atc tat 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
cca aat aac acg gta acg tgt aat gat tat act gta aat caa gaa 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
gaa tac gga ggt gcg tac act tct cgt aat cga gga tat aac gaa 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
gct cct tcc gta cca gct gat tat gcg tca gtc tat gaa gaa aaa 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
tcg tat aca gat gga cga aga gag aat cct tgt gaa ttt aac aga 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
ggg tat agg gat tac acg cca cta cca gtt ggt tat gtg aca aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
gaa tta gaa tac ttc cca gaa acc gat aag gta tgg att gag att 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
gga gaa acg gaa gga aca ttt atc gtg gac agc gtg gaa tta ctc 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
ctt atg gag gaa tag 3534
Leu Met Glu Glu
1175
<210> 6
<211> 1177
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 6
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
Leu Met Glu Glu
1175
<210> 7
<211> 3543
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Полностью синтетическая последовательность для применения
в растениях, кодирующая BCW 001
<220>
<221> CDS
<222> (1)..(3540)
<223> BCW 001
<400> 7
atg gag gag aac aac cag aac cag tgt gtc cca tac aac tgc ctc aac 48
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15
aac cca gcc atc gaa atc ctt gag ggc gac cga att tca gtc ggc aac 96
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30
acg ccc atc gac atc tcc ctg agt ctt gtg gaa ctc ctc atc tcg gag 144
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45
ttc gtc cct ggc ggc ggc ata atc acc ggt ctg ctc aac atc gtg tgg 192
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60
gga ttc gtg ggc cca tcc cag tgg gat gcg ttc ctg gcc caa gtg gag 240
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80
cag ctc atc aac cag agg atc tcc gag gcc gtc cgc aat acc gcg atc 288
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95
caa gag ctg gag ggc atg gcc cgc gtg tac cgc acc tac gcc acc gcc 336
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110
ttt gct gaa tgg gag cgc gac ccg aac aac act gac ctg cgc gag gcc 384
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125
gtc cga aca cag ttc acg gcg acc gag acc tac atc agc ggc cgg atc 432
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140
tca gtg ctc aag atc cag aac ttc gag gtg cag ctc cta tcg gtc ttc 480
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160
gcc cag gcc gcc aac ttg cac ctg agc ctc ctg cgg gac gtt gtg ttc 528
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175
ttc ggc cag cgg tgg ggc ttc tct act acg acc gtg aac aac tac tac 576
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190
aac gac ctg acg gag gaa atc agc acc tac aca gat tac gca gtt cgt 624
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205
tgg tac aac acc ggc ctt gag cgc gtg tgg ggc ccg gac tcc cgc gat 672
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220
tgg gtc cgc tac aac cag ttc cgc cgc gag ctg acg ctt aca gtg ctg 720
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
gac atc gtc gca ctc ttt cct aac tac gac tcc agg cgc tat ccc atc 768
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255
agg aca gtg tca cag ctc acc cgc gag atc tac aca aac ccg gtg ctt 816
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270
gag aac ttc gac ggc agc ttc cgt ggc atg gcg cag cgc att gaa cag 864
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285
aac atc cgc cag ccg cac ctt atg gac atc ttg aac agt atc act atc 912
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300
tac acc gac gtc cac aga ggc ttc aac tac tgg agc gga cac cag atc 960
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320
aca gcc agc ccg gta ggc ttc tcg ggt cca gag ttc gcc ttc ccg ctg 1008
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335
ttt ggg aac gct ggc aat gcc gcg ccg ccc gtg ctg gtc agc ctc act 1056
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350
ggt ctc ggc atc ttc cgc aca ctt tcc tcg ccg ctg tac agg agg atc 1104
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365
atc ctc ggg tcc ggt ccg aac aac cag gag ctg ttc gtg ctc gac ggg 1152
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380
acc gag ttc agt ttc gcc agc ctc acg acg aac ctc ccg tcc acc atc 1200
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400
tat cgc cag cgc gga acg gtc gat tcc ctg gat gtt atc cca ccg caa 1248
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415
gac aat tct gtg ccg ccg agg gcc ggg ttc tcc cac cgg ctg tct cac 1296
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430
gtg act atg ctt tca cag gcc gcc gga gcc gtg tac acg ctc cgt gcg 1344
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445
cct act ttc tcc tgg cag cac cgc agc gcg acc acg acc aac atc atc 1392
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460
gca gca gac tcc atc acc cag atc ccg gcc gtt aag ggc cgc agc atc 1440
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480
atc aac aac gga act gtc atc agc ggt ccg ggc ttc acg ggc ggc gac 1488
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495
ctg gtc cgg ctc tac aac gca gac ttc aac atc aat aac cgc gct tat 1536
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510
ctt gaa gta cct atc ttc ttc cag agc ccg agc act aac tac cgg gtt 1584
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525
cgc gtc cgc tac gcc agc acc tcc agc ctc cct gtg gat gtc gtg ttc 1632
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540
gga aac ata agc cat ccg acc acg ttc cca gcc acg gct agg agc ctg 1680
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560
gac aac cta cag agc aac gac ttc ggc tac atc gac atc gcg ggc acc 1728
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575
ttt ctg cca agc ctg ggt ccg tct atc ggc atc cgc ccg atg ctg agc 1776
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590
act atc aac cta att gtg gac cgg ttc gag ttt atc ccg gtg acg gca 1824
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605
acg ttc gag gcg gag tct gac ctc gaa agg gca cag aag gcc gtg aac 1872
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620
gcc ctg ttc acg agc acc aac cag ctt ggc att aag act gat gtc acc 1920
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640
gac tac cac att gac caa gtc agc aac ctg gtg gag tgc ctc tcg gac 1968
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655
gag ttc tat ctt gat gag aaa cgg gaa cta agc gag aag gtg aag cac 2016
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670
gca aag cgc ttg agc gac gag cgg aac tta ctc cag gac cct aac ttc 2064
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685
cgt ggg att aac cgc cag ccg gat cgc ggg tgg cgc ggc tca acg gac 2112
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700
atc acc atc cag ggc ggc gat gac gtc ttc aag gag aac tac gtg acc 2160
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720
ctc cct ggc acg ttc gac gag tgc tac ccg acg tac ctt tat cag aag 2208
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735
att gac gaa agc aag ctg aaa gcc tac acc cgc tac cag ttg cgc ggc 2256
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750
tac atc gag gac tct caa gac ctg gag atc tac ttg att cga tac aac 2304
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765
gcg aaa cac gag acc gtc aac gtg ccg ggc act ggg agc ctg tgg ccg 2352
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780
ttg tct gca caa agt ccg atc ggc aag tgc ggc gag cca aac cgg tgc 2400
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800
gct ccg cac ctg gag tgg aac cca gac ctt cat tgc tcc tgt agg gat 2448
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815
ggc gag aag tgc gct cac cac agc cat cac ttc agc ctc gac att gac 2496
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830
gtc ggc tgt acc gac ctt aat gag gat ctg ggt gtg tgg gtg atc ttc 2544
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845
aag atc aag acc cag gac ggt cac gcc cgg ttg ggc aat ctg gag ttc 2592
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860
ctg gag gag aag ccg ctg gtt ggc gag gct ctc gcg cgg gtc aag cgg 2640
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880
gcg gag aag aag tgg cgg gac aaa cgc gag aag ctc cag tta gag acg 2688
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895
aac atc gtg tac aag gag gcg aag gaa tcc gtg gac gca cta ttc gtg 2736
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910
aac agc cag tac gac caa ctc cag gcc gac acc aac atc gcc atg att 2784
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925
cac gca gcc gac aag agg gtg cac cgc atc cgc gaa gcc tac ctt ccc 2832
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940
gaa ctt tcg gtc atc cca ggc gtc aac gct gac atc tcg gag gaa ttg 2880
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960
gag ggc aga atc ttc acg gcc ttc tct ttg tac gat gcc agg aac gtc 2928
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975
atc aag aac ggc gac ttc aac aac ggc ctg ctg tgc tgg aac gtg aag 2976
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990
ggc cac gtg gac gtc gag gag cag aac aac cac aga tca gtc ctg gtg 3024
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005
gtg ccc gag tgg gaa gcc gaa gtc tca caa gaa gtc cgg gtg tgc 3069
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020
cct gga cgc ggg tac att ctc cgc gtg acc gcc tac aag gag ggc 3114
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035
tac ggt gag ggc tgc gtg acc atc cac gag atc gag aac aac acc 3159
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050
gac gag ctg aaa ttc agt aac tgt gtt gag gag gag gtg tac ccg 3204
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065
aac aac acc gtc acc tgc aac gac tac act gcg aac cag gag gaa 3249
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080
tac gag ggc acg tac acg agc cgc aat cgc ggg tac gac gag gcg 3294
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095
tac gag agc aac tcc agc gtc ccg gcc gag tac gcc tcc gtg tac 3339
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110
gag gag aag gtt tac acc gac ggg agg cgt ggc aac ccg tgc gag 3384
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125
agc aac aga ggc tac ggc gat tac act ccg ctt ccc gct ggc tac 3429
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140
gtg acg aaa gag ctg gag tac ttc cca gag acc gac aag gtg tgg 3474
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155
atc gag atc gga gaa acg gag ggc acg ttc ata gtg gac tcc gtt 3519
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170
gag ctg ctg ctc atg gag gag tag 3543
Glu Leu Leu Leu Met Glu Glu
1175 1180
<210> 8
<211> 1180
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 8
Met Glu Glu Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15
Asn Pro Ala Ile Glu Ile Leu Glu Gly Asp Arg Ile Ser Val Gly Asn
20 25 30
Thr Pro Ile Asp Ile Ser Leu Ser Leu Val Glu Leu Leu Ile Ser Glu
35 40 45
Phe Val Pro Gly Gly Gly Ile Ile Thr Gly Leu Leu Asn Ile Val Trp
50 55 60
Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val Glu
65 70 75 80
Gln Leu Ile Asn Gln Arg Ile Ser Glu Ala Val Arg Asn Thr Ala Ile
85 90 95
Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr Ala
100 105 110
Phe Ala Glu Trp Glu Arg Asp Pro Asn Asn Thr Asp Leu Arg Glu Ala
115 120 125
Val Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg Ile
130 135 140
Ser Val Leu Lys Ile Gln Asn Phe Glu Val Gln Leu Leu Ser Val Phe
145 150 155 160
Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val Phe
165 170 175
Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr Tyr
180 185 190
Asn Asp Leu Thr Glu Glu Ile Ser Thr Tyr Thr Asp Tyr Ala Val Arg
195 200 205
Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg Asp
210 215 220
Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro Ile
245 250 255
Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val Leu
260 265 270
Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu Gln
275 280 285
Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr Ile
290 295 300
Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln Ile
305 310 315 320
Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro Leu
325 330 335
Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu Thr
340 345 350
Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg Ile
355 360 365
Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp Gly
370 375 380
Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr Ile
385 390 395 400
Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro Gln
405 410 415
Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser His
420 425 430
Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg Ala
435 440 445
Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile Ile
450 455 460
Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser Ile
465 470 475 480
Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly Asp
485 490 495
Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala Tyr
500 505 510
Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg Val
515 520 525
Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val Phe
530 535 540
Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser Leu
545 550 555 560
Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly Thr
565 570 575
Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu Ser
580 585 590
Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr Ala
595 600 605
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
610 615 620
Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val Thr
625 630 635 640
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
645 650 655
Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
660 665 670
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
675 680 685
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
690 695 700
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
705 710 715 720
Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
725 730 735
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly
740 745 750
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
755 760 765
Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
770 775 780
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
785 790 795 800
Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp
805 810 815
Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
820 825 830
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
835 840 845
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
850 855 860
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
865 870 875 880
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
885 890 895
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
900 905 910
Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
915 920 925
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
930 935 940
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Asp Ile Ser Glu Glu Leu
945 950 955 960
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
965 970 975
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys
980 985 990
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
995 1000 1005
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1010 1015 1020
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1025 1030 1035
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1040 1045 1050
Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro
1055 1060 1065
Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Asn Gln Glu Glu
1070 1075 1080
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1085 1090 1095
Tyr Glu Ser Asn Ser Ser Val Pro Ala Glu Tyr Ala Ser Val Tyr
1100 1105 1110
Glu Glu Lys Val Tyr Thr Asp Gly Arg Arg Gly Asn Pro Cys Glu
1115 1120 1125
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1130 1135 1140
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1145 1150 1155
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1160 1165 1170
Glu Leu Leu Leu Met Glu Glu
1175 1180
<210> 9
<211> 3534
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Полностью синтетическая последовательность, кодирующая
CW 002 для применения в растениях
<220>
<221> CDS
<222> (1)..(3531)
<223> BCW 002
<400> 9
atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc ctc acc gtg 720
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
att cgc atc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc cac caa 960
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
ctg atg gaa gag tga 3534
Leu Met Glu Glu
1175
<210> 10
<211> 1177
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 10
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
Ile Arg Ile Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
Leu Met Glu Glu
1175
<210> 11
<211> 3534
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Полностью синтетическая нуклеотидная последовательность,
кодирующая BCW 003 для применения в растениях
<220>
<221> CDS
<222> (1)..(3531)
<223> BCW 003
<400> 11
atg gac aac aac ccg aac atc aac gag tgc atc ccc tac aac tgc ctc 48
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
tcc aac ccg gag gtc gag gtg ctg ggc ggc gaa agg atc gag acc ggc 96
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
tac act ccc atc gac atc agc ctc agc ctg acc cag ttc ctg ctc tct 144
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
gag ttc gtg ccc ggc gcg ggg ttc gtt ctc ggc ctg gtc gac atc atc 192
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
tgg ggc atc ttc ggt ccg agc cag tgg gac gcc ttt ctc gtt cag att 240
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
gag cag ctg atc aac cag cgc atc gag gag ttc gcc cgc aac cag gcg 288
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
atc tcc cgg ctg gag ggc ctc tcc aac ctg tac caa atc tac gcc gag 336
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
agc ttc cgg gag tgg gaa gcc gat ccg acc aac ccc gct ctc agg gag 384
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
gag atg cgg att cag ttc aac gac atg aac tcc gct ctc acg act gcc 432
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
atc cca ctc ctc gct gtg cag aac tac caa gtg ccg ctc ctg tcc gtg 480
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
tac gtg cag gcc gcc aat ctg cac ctc tcc gtc ctc cgg gac gtt agc 528
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
gtg ttc ggg cag cgc tgg ggc ttc gac gcc gct acc atc aac tcc cgt 576
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
tac aac gat ctc act cgc ctc atc ggc aac tac acc gac tat gcc gtg 624
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
cgc tgg tac aac act ggt ctt gag aga gtc tgg ggc ccg gac agc cgc 672
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
gac tgg gtg cgc tac aac cag ttc cgg cgc gag ctg acc ctc acc gtg 720
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
ctc gac atc gta gcc ctc ttt ccc aac tac gac tcc cgg cgc tac ccg 768
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
att cgc acc gtc agc cag ctc acc agg gag atc tac acc aac cct gtg 816
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
ctg gag aac ttc gac ggc tcc ttt cgc ggg atg gcc caa cgc ata gag 864
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
cag aac atc cgc caa cct cat ctg atg gac atc ctt aat tct atc acc 912
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
atc tac act gac gtt cat cgc ggg ttt aac tac tgg tcg ggc cac caa 960
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
atc act gcg tcg ccc gtt ggt ttc tcc ggc ccg gag ttc gcg ttc cct 1008
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
ctg ttc gga aac gcg ggc aat gcc gct cca ccc gta ttg gtg agc ctg 1056
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
acc ggc ctc ggc atc ttc cgt aca ctg tct agc cct ctg tac aga agg 1104
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
atc att ctt ggc agc ggt ccc aat aac cag gaa ctc ttc gtg ttg gac 1152
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
ggc acc gag ttc agc ttc gcc agt ctt acg acc aat ttg ccc tcc aca 1200
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
atc tat cgc cag cgc ggt act gtg gac tcc ctt gat gtg ata cca cct 1248
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
cag gac aac tct gtc cca cct cgc gcc ggt ttc tcc cac cgc ctc agc 1296
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
cac gtc act atg ctg agt cag gct gcg gga gcc gtg tac acc ctt cgg 1344
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
gct ccg acg ttt agc tgg cag cac agg agc gcg act acc acg aac atc 1392
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
att gcg gct gac tcc atc act caa atc cct gcc gtt aag ggt cgc tcc 1440
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
atc atc aac aat ggg aca gtg atc tcg gga ccg ggc ttc acc ggc ggt 1488
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
gac ctg gtg agg ctg tac aac gcg gac ttc aac atc aac aac agg gcg 1536
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
tac ctc gaa gtc ccg atc ttc ttc cag tcg ccc agc acg aac tat cgt 1584
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
gtc agg gtc cgg tac gcc tca acc tca tcc ctc ccg gtc gat gtg gtc 1632
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
ttc ggc aac atc agc cac ccg acc acg ttt ccg gct acc gcc cga tcc 1680
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
ctg gac aat ctg caa agc aac gat ttc ggc tac att gac att gcc ggg 1728
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
acg ttc ctc ccg agc ctc ggc cca tcc atc ggc atc cgg ccc atg ctc 1776
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
tcc acc atc aac ctg atc gtg gat cgg ttt gag ttc atc cca gtg aca 1824
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
gcc act ttc gag gct gag tcc gac cta gag cgt gct cag aag gca gtc 1872
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
aat gct ctg ttt acc tcc acc aat cag ctc ggc att aag acc gat gtg 1920
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
acc gat tac cac att gac caa gtc tca aac ctc gtt gag tgc ctc tcg 1968
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
gat gag ttc tac ctt gat gag aag agg gag ctt tca gag aaa gtt aag 2016
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
cac gct aag aga ctc tcg gac gaa cgc aat ctg ttg caa gat ccc aac 2064
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
ttc aga ggg atc aac cgt cag cca gac cgg gga tgg cgc ggg tcc acg 2112
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
gac atc act atc cag ggc ggt gat gac gtc ttc aag gag aac tac gtg 2160
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
acc ctg ccg ggc acc ttt gac gaa tgc tac ccc act tac ctc tac cag 2208
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
aag att gac gag tcc aag ctc aag gcg ttc aca cgc tac cag ctc agg 2256
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
ggt tac atc gag gac tcc caa gac ctg gaa atc tac ctg atc cgc tac 2304
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
aac gct aag cac gag act gtc aac gtg ccc ggc acc ggc agc ctg tgg 2352
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
ccc ttg tcc gct cag agc cca atc ggc aag tgc ggc gag ccc aac cgc 2400
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
tgc gcg ccc cac ctg gaa tgg aac ccc gac ctc gac tgt agc tgc cgc 2448
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
gac gga gag aag tgc gcg cat cac tcc cac cac ttc agc ctc gac atc 2496
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
gac gtc ggt tgc acc gac ctt aac gag gat ctg ggc gtt tgg gtg atc 2544
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
ttc aag atc aag act cag gac ggc cac gcc cgc ctg gga aac ctg gag 2592
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
ttc ctg gag gag aag ccc ctc gtt ggc gag gcc ctg gcc cgc gtc aag 2640
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
agg gcc gag aag aaa tgg cgc gac aag cgc gag aag ctg gag tgg gag 2688
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
acc aac atc gtg tac aag gaa gcg aag gag tca gtt gac gcc ctg ttc 2736
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
gtc aac agc cag tac gac cag ctc cag gca gac aca aac atc gct atg 2784
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
atc cat gcg gcc gac aag cgc gtc cac tcc atc cgc gag gcg tac ctg 2832
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
ccc gag ctg tcc gtc atc ccc ggc gtc aac gcc gcg atc ttt gag gag 2880
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
ctg gag ggc cgc atc ttc acc gcc ttc tcc ctc tac gac gca cgc aac 2928
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
gtt atc aag aat ggc gac ttc aac aac ggg ctg tcc tgc tgg aat gtc 2976
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
aag ggc cac gtg gac gtc gag gag cag aac aac cag cgc tca gtc ctg 3024
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
gtc gtc ccg gag tgg gag gcc gaa gtc agc cag gaa gtc cgc gtc 3069
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
tgc cct gga cgc ggg tac atc ctg cgc gtc act gcc tac aag gaa 3114
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
ggc tac gga gag ggc tgc gtc acc atc cat gag atc gaa aac aac 3159
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
acg gat gag ctt aag ttc agc aac tgt gtt gaa gag gaa atc tac 3204
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
ccg aac aac acg gtc acc tgc aat gat tac acc gtc aac cag gag 3249
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
gaa tac ggt gga gct tac acc tcc cgc aac agg ggc tac aac gag 3294
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
gca ccc tct gtc ccg gcc gac tac gct tca gtc tac gaa gag aag 3339
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
tcg tac acc gac gga cgc aga gag aac ccg tgt gag ttc aac cgc 3384
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
ggc tac cgc gat tac acc ccg ctg cct gtc ggg tac gtc acc aaa 3429
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
gag ctg gaa tac ttc cca gag acc gac aaa gtc tgg att gag atc 3474
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
ggc gag acc gag ggc acg ttc atc gtg gac tcc gtc gaa ctc ctt 3519
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
ctg atg gaa gag tga 3534
Leu Met Glu Glu
1175
<210> 12
<211> 1177
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Синтетическая конструкция
<400> 12
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30
Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95
Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110
Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125
Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140
Ile Pro Leu Leu Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175
Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190
Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp Tyr Ala Val
195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Met Ala Gln Arg Ile Glu
275 280 285
Gln Asn Ile Arg Gln Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
Ile Tyr Thr Asp Val His Arg Gly Phe Asn Tyr Trp Ser Gly His Gln
305 310 315 320
Ile Thr Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Ala Phe Pro
325 330 335
Leu Phe Gly Asn Ala Gly Asn Ala Ala Pro Pro Val Leu Val Ser Leu
340 345 350
Thr Gly Leu Gly Ile Phe Arg Thr Leu Ser Ser Pro Leu Tyr Arg Arg
355 360 365
Ile Ile Leu Gly Ser Gly Pro Asn Asn Gln Glu Leu Phe Val Leu Asp
370 375 380
Gly Thr Glu Phe Ser Phe Ala Ser Leu Thr Thr Asn Leu Pro Ser Thr
385 390 395 400
Ile Tyr Arg Gln Arg Gly Thr Val Asp Ser Leu Asp Val Ile Pro Pro
405 410 415
Gln Asp Asn Ser Val Pro Pro Arg Ala Gly Phe Ser His Arg Leu Ser
420 425 430
His Val Thr Met Leu Ser Gln Ala Ala Gly Ala Val Tyr Thr Leu Arg
435 440 445
Ala Pro Thr Phe Ser Trp Gln His Arg Ser Ala Thr Thr Thr Asn Ile
450 455 460
Ile Ala Ala Asp Ser Ile Thr Gln Ile Pro Ala Val Lys Gly Arg Ser
465 470 475 480
Ile Ile Asn Asn Gly Thr Val Ile Ser Gly Pro Gly Phe Thr Gly Gly
485 490 495
Asp Leu Val Arg Leu Tyr Asn Ala Asp Phe Asn Ile Asn Asn Arg Ala
500 505 510
Tyr Leu Glu Val Pro Ile Phe Phe Gln Ser Pro Ser Thr Asn Tyr Arg
515 520 525
Val Arg Val Arg Tyr Ala Ser Thr Ser Ser Leu Pro Val Asp Val Val
530 535 540
Phe Gly Asn Ile Ser His Pro Thr Thr Phe Pro Ala Thr Ala Arg Ser
545 550 555 560
Leu Asp Asn Leu Gln Ser Asn Asp Phe Gly Tyr Ile Asp Ile Ala Gly
565 570 575
Thr Phe Leu Pro Ser Leu Gly Pro Ser Ile Gly Ile Arg Pro Met Leu
580 585 590
Ser Thr Ile Asn Leu Ile Val Asp Arg Phe Glu Phe Ile Pro Val Thr
595 600 605
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
610 615 620
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Ile Lys Thr Asp Val
625 630 635 640
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
645 650 655
Asp Glu Phe Tyr Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
660 665 670
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
675 680 685
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
690 695 700
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
705 710 715 720
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
725 730 735
Lys Ile Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg
740 745 750
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
755 760 765
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
770 775 780
Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg
785 790 795 800
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg
805 810 815
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
820 825 830
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
835 840 845
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
850 855 860
Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys
865 870 875 880
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu
885 890 895
Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
900 905 910
Val Asn Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met
915 920 925
Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu
930 935 940
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
945 950 955 960
Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
965 970 975
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
980 985 990
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu
995 1000 1005
Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val
1010 1015 1020
Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu
1025 1030 1035
Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn
1040 1045 1050
Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr
1055 1060 1065
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu
1070 1075 1080
Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu
1085 1090 1095
Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys
1100 1105 1110
Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg
1115 1120 1125
Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys
1130 1135 1140
Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile
1145 1150 1155
Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu
1160 1165 1170
Leu Met Glu Glu
1175
<---
1. Полинуклеотидная конструкция для придания устойчивости к насекомому отряда Lepidoptera, содержащая нуклеотидную последовательность, кодирующую:
a) инсектицидный белок, имеющий аминокислотную последовательность, содержащую аминокислоты с 1 по 607 последовательности, выбранной из группы, состоящей из SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 и SEQ ID NO: 12; или
b) инсектицидный белок, имеющий аминокислотную последовательность от позиции 7 до 607, как указано в любой из SEQ ID NO: 2, 4, 6, 8, 10 или 12,
при этом указанная нуклеотидная последовательность функционально связана с гетерологичной последовательностью промотора.
2. Белок, токсичный для совки–ипсилон (black cutworm) отряда Lepidoptera, содержащий:
a) аминокислотную последовательность, как указано в SEQ ID NO: 2 от позиции 256 до 606;
b) аминокислотную последовательность, как указано в SEQ ID NO: 4 от позиции 257 до 607; и
c) аминокислотную последовательность, как указано в SEQ ID NO: 6 от позиции 257 до 607.
3. Полинуклеотидная конструкция по п. 1, отличающаяся тем, что указанный инсектицидный белок проявляет активность против насекомого отряда Lepidoptera, выбранного из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.
4. Белок по п. 2, дополнительно содержащий биоактивность в отношении видов Lepidoptera, выбранных из группы, состоящей из: Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Mamestra configurata, Striacosta albicosta, Trichoplusia ni, Pseudoplusia includens, Anticarsia gemmatalis, Hypena scabra, Heliothis virescens, Agrotis subterranea, Pseudaletia unipuncta, Agrotis ipsilon, Agrotis orthogonia, Ostrinia nubilalis, Amyelois transitella, Crambus caliginosellus, Herpetogramma licarsisalis, Homoeosoma electellum, Elasmopalpus lignosellus, Cydia pomonella, Endopiza viteana, Grapholita molesta, Suleima helianthana, Plutella xylostella, Pectinophora gossypiella, Lymantria dispar, Alabama argillacea, Archips argyrospila, Archips rosana, Chilo suppressalis, Cnaphalocrocis medinalis, Crambus caliginosellus, Crambus teterrellus, Diatraea grandiosella, Diatraea saccharalis, Earias insulana, Egrias vittella, Helicoverpa armigera, Helicoverpa zea, Heliothis virescens, Herpetogramma licarsisalis, Lobesia botrana, Pectinophora gossypiella, Phyllocnistis citrella, Pieris brassicae, Pieris rapae, Plutella xylostella, и Tuta absoluta.
5. Вектор, экспрессирующий полинуклеотидную конструкцию по п. 1.
6. Клетка–хозяин, имеющая устойчивость к насекомому отряда Lepidoptera, содержащая полинуклеотидную конструкцию по п. 1, отличающаяся тем, что указанная клетка–хозяин выбрана из группы, состоящей из бактериальной клетки, дрожжевой клетки и растительной клетки.
7. Клетка–хозяин по п. 6, отличающаяся тем, что указанную растительную клетку выбирают из группы, состоящей из растительной клетки: люцерны, банана, ячменя, фасоли, брокколи, капусты, капусты декоративной, моркови, маниоки, клещевины, цветной капусты, сельдерея, нута, китайской капусты, цитрусовых, кокосовой пальмы, кофе, кукурузы, клевера, хлопка, тыквенных, огурца, псевдотсуги Мензиса, баклажана, эвкалипта, льна, чеснока, винограда, хмеля, лука–порея, салата–латука, сосны ладанной, проса, дыни, ореха, овса, оливкового дерева, репчатого лука, декоративных растений, пальмовых, пастбищных трав, гороха, арахиса, перца, голубиного гороха, сосновых, картофеля, тополя, тыквы, сосны лучистой, редьки, рапса, риса, корневищ, ржи, дикого шафрана, кустарниковых, сорго, сосны южной, сои, шпината, клубники, сахарной свеклы, сахарного тростника, подсолнечника, кукурузы сахарной, амбрового дерева, батата, проса прутьевидного, чая, табака, помидора, тритикале, дерновой травы, арбуза и пшеницы.
8. Трансгенное растение, имеющее устойчивость к насекомому отряда Lepidoptera, где указанное растение содержит полинуклеотидную конструкцию по п. 1.
9. Семя, имеющее устойчивость к насекомому отряда Lepidoptera и где указанное семя содержит детектируемое количество указанной полинуклеотидной конструкции.
10. Трансгенное растение по п. 8, отличающееся тем, что семена, пыльца, потомство, растительные клетки, растительная ткань и товарные продукты, полученные из указанного растения, содержат определяемое количество указанной полинуклеотидной конструкции.
11. Биологический образец, имеющий устойчивость к насекомому отряда Lepidoptera, где биологический образец содержит детектируемое количество полинуклеотидной конструкции по п. 1.
12. Композиция для борьбы с насекомым отряда Lepidoptera, содержащая инсектицидно–эффективное количество белка по п. 2, и:
a) агент, отличный от указанного белка и также токсичный для насекомого отряда Lepidoptera, причем указанный агент выбирают из группы, состоящей из полипептида, имеющего аминокислотную последовательность, отличную от указанного белка, молекулы РНК и химического соединения; или
b) агент выбранный из группы, состоящей из: Cry1A, Cry1Ab, Cry1Ac, Cry1A.105, Cry1Ae, Cry1B, Cry1C, Cry1D, Cry1E, Cry1F, Cry1G, Cry1H, Cry1I, Cry1J, Cry1K, Cry1L, Cry2A, Cry2Ab, Cry2Ae, Cry4B, Cry6, Cry7, Cry8, Cry9, Cry15, Cry43A, Cry43B, ET35, ET66, TIC400, TIC800, TIC807, TIC834, TIC853, TIC1415, VIP3A, VIP3Ab, инсектицидных белков AXMI, инсектицидных белков DIG, eHIPs и белков VIP.
13. Композиция по п. 12, дополнительно содержащая дополнительный пестицидный агент, причем указанный дополнительный агент выбирают из группы, состоящей из: Cry1C, Cry3A, Cry3B, Cry34, Cry35, Cry51Aa1, ET29, ET33, ET34, ET70, TIC407, TIC417, TIC431, TIC901, TIC1201, TIC3131, 5307, DIG–10, Axmi184, Axmi205 и AxmiR1.
14. Способ получения семян, содержащих полинуклеотидную последовательность по п. 1, причем указанный способ включает в себя:
a) трансформацию одного или более семян вектором по п.5,
b) посадку одного или большего количества семян, содержащих указанный полинуклеотид;
c) выращивание растений из указанного семени; и
d) сбор урожая семян с указанных растений, причем указанное семя содержит указанную полинуклеотидную конструкцию.
15. Растение по п. 8, дополнительно содержащее:
a) трансгенное растение кукурузы, выбранное из группы, состоящей из: DKB89614–9, MON801, MON802, MON809, MON810, MON863, MON88017, MON89034, трансформанта 4114–3, трансформанта 5307, DAS59122–7, Bt10, Bt11, Bt176, CBH–351, DKB–83614–9, MIR162, MIR604, TC1507, TC6275, трансформанта 676, трансформанта 678, трансформанта 680, трансформанта 98140, DAS40278–9, DKB89790–5, MON21–9, HCEM485, MON832, MON87427, NK603, T14, T25 и VCO01981–5;
b) трансгенное растение сои, выбранное из группы, состоящей из: MON87751, DAS81419–2, MON87701, A2704–12, A2704–21, A5547–127, A5547–35, CV127, DAS44406–6, DAS68416–4, DP356043, FG72, MON4032, ACS–GM003–1, MON87705, MON87708, MON89788, W62, W98 и GFM Cry1A;
c) трансгенное растение хлопка, выбранное из группы, состоящей из: DAS24236–5, DAS21023–5, трансформанта 31707, трансформанта 31803, трансформанта 31807, трансформанта 31808, трансформанта 42317, BNLA–601, COT102, COT67B, трансформанта 1, GHB119, GK12, MON15985, MLS9124, MON1076, MON531, MON757, T303–3, T304–40, SGK321, трансформанта 19–51a, GHB614, LLCotton25, MON88701, MON88702, MON1445, MON1698 и MON88913;
d) трансгенное растение сахарного тростника трансформанта NXI–1T; и
e) трансгенное растения риса, выбранное из группы, состоящей из: LLRICE06, LLRICE601, LLRIC2E62, GM–A17054 и GM–A17054.
16. Токсичный для Lepidoptera белок, содержащий в функциональной связи:
a) первый пептидный сегмент, содержащий аминокислотную последовательность домена I Cry1A;
b) второй пептидный сегмент, содержащий остатки 255-606 последовательности SEQ ID NO: 2;
причем указанный токсичный для Lepidoptera белок проявляет токсическую биоактивность при тестировании против Lepidoptera вредителей, выбранных из группы, состоящей из: совки–ипсилон (A. ipsilon), совки хлопковой (H. zea), Striacosta albicosta (S. albicosta), огневки кукурузной (O. nubilalis), огневки кукурузной юго–западной (D. grandiosella), совки капустной (T. ni), соевой совки (P. includens), совки травяной (S. frugiperda) и Diatraea saccharalis (D. saccharalis).