Рекомбинантная плазмида pet-gst-3cl-gpg, обеспечивающая синтез протеазы 3cl sars-cov-2 в клетках e.coli в растворимой форме

Изобретение относится к биотехнологии. Описана рекомбинантная плазмида pET-GST-3CL-GPG, обеспечивающая синтез протеазы 3CL SARS-CoV-2 в клетках Е.coli в растворимой форме, имеющая нуклеотидную последовательность SEQ ID NO: 2. Плазмида имеет карту, представленную на фиг. 1, и содержит следующие элементы: AmpR promoter; генетический маркер, определяющий устойчивость к ампициллину клеток бактерии Е.coli, трансформированных рекомбинантной плазмидой AmpR; участок начала репликации ori; лактозный репрессор lacI; ДНК-связывающий белок, который ингибирует экспрессию генов E.coli и обеспечивает экспрессию целевого рекомбинантного белка 3CL-GPG-6His после добавления индуктора изопропил-β-D-1-тиогалактопиранозида (IPTG); lacI promoter; промотор фага Т7, обеспечивающий экспрессию последовательности гена GST-3CL-GPG в клетках E.coli; lac operator; RBS; ген GST-глутатион-S-трансфераза из Scihistosoma japonicum; Pep - участок, кодирующий пептид GSTSAVLQ; химерный ген 3CL SARS-CoV-2 включающий также последовательность GPG и 6His, имеющий нуклеотидную последовательность SEQ ID NO: 1, и кодирующий синтез протеазы 3CL-GPG-6His с аминокислотной последовательностью SEQ ID NO: 3; Т7 terminator. Изобретение может быть использовано в биотехнологии для получения фермента 3CL, являющегося основной протеазой SARS-CoV-2. При этом обеспечивается синтез и транспорт химерного варианта белка 3CL в периплазматическое пространство E.coli в растворимой форме. 3 ил., 1 табл., 5 пр.

 

Область техники

Изобретение относится к рекомбинантной плазмиде pET-GST-3CL-GPG, обеспечивающей синтез протеазы 3CL SARS-CoV-2 в клетках E.coli в растворимой форме и может быть использовано в биотехнологии для получения фермента 3CL (с англ.: 3C-like protease), являющегося основной протеазой сарбековируса SARS-CoV-2. Получаемый белок 3CL может быть использован для in vitro поиска ингибиторов основной протеазы SARS-CoV-2 потенциальных терапевтических препаратов (Froggatt, Н.М., Heaton, В.Е., Heaton, N.S. (2020). Development of a fluorescence-based, high-throughput SARS-CoV-2 3CLpro reporter assay. Journal of virology, 94(22), e01265-20.; Zhu, W., Xu, M., Chen, C.Z., Guo, H., Shen, M., Hu, X., … & Zheng, W. (2020). Identincation of SARS-CoV-2 3CL protease inhibitors by a quantitative high-throughput screening. ACS pharmacology & translational science, 3(5), 1008-1016.). Изобретение включает дизайн генетических конструкций, метод трансформации клеток E.coli, очистки и оценки экспрессии целевого белка, метод анализа ферментативной активности.

Уровень техники

Геном SARS-CoV-2 кодирует более двадцати белков, среди которых присутствуют две протеазы - папаин-подобная PLpro и 3-С подобная 3CLpro (3CL), (или Mpro, основная протеаза). Обе протеазы играют важную роль в репликативном цикле вируса, их функцией является ферментативный гидролиз двух синтезируемых вирусных полипротеинов (1А и 1АВ) на отдельные функциональные белки.

В силу своих небольших размеров, а также высокой гомологии с аналогичными белками коронавирусов, вызывающих атипичные пневмонии SARS и MERS, основная протеаза SARS-CoV-2 является наиболее охарактеризованной мишенью для потенциальных антивирусных препаратов. Основная протеаза расщепляет полипротеин 1АВ в 11 специфических сайтах. Последовательность распознавания сайта в большинстве случаев состоит из участка цепи (L-Q)-(S-A-G), где расщепляется связь между глутамином и серином. Ингибирование активности основной протеазы приводит к остановке репликации вируса. Среди ферментов человека не известно протеаз с такой же специфичностью расщепления, что может говорить о вероятном специфическом действии и возможной низкой токсичности ингибиторов основной протеазы SARS-CoV-2 (Zhang L, Lin D, Sun X, et al. Crystal structure of SARS-CoV-2 main protease provides a basis for design of improved α-ketoamide inhibitors. Science (New York, NY). 2020; 368(6489):409-412. doi:10.1126/science.abb3405 Dai W, Zhang B, Su H, et al. Structure-based design of antiviral drug candidates targeting the SARS-CoV-2 main protease. Денисе. April 2020:eabb4489. doi:10.1126/science.abb4489 Jin Z, Du X, Xu Y, et al. Structure of Mpro from COVID-19 virus and discovery of its inhibitors. Nature. April 2020:1-9. doi:10.1038/s41586-020-2223-y).

Наиболее близким аналогом (прототипом) к заявляемому изобретению является создание конструкции экспрессионной плазмиды основной протеазы SARS; трансформирование плазмиды экспрессии основной протеазы SARS с получением рекомбинантного штамма Escherichia coli; получение с помощью системы экспрессии целевого белка путем культивирования рекомбинантного штамма Escherichia coli в жидкой питательной среде (в культуре LB) с последующим получением очищенной стабильной основной протеазы SARS-CoV-1 с помощью специального метода очистки (заявка на патент Китая CN111979214A, МПК C12N 15/70; C12N 9/50, опубл. 31.08.2020 г.).

Однако данное изобретение имеет ряд недостатков. Так используемый экспрессионный вектор рЕТ28а не имеет в своем составе последовательности GST, обеспечивающей более эффективный транспорт целевого белка в периплазматическое пространство клеток Escherichia coli. Кроме того, синтезируемый белок является основной протеазой коронавируса SARS-CoV-1, который существенно отличается нуклеотидной и аминокислотной последовательностями от основной протеазы коронавируса SARS-CoV-2.

Раскрытие изобретения

Задачей настоящего изобретения являлась разработка экспрессионной системы и структуры химерного гена GST-3CL-GPG SARS-CoV-2, обеспечивающих получение химерного варианта растворимого белка 3CL SARS-CoV-2.

Техническим результатом изобретения является получение экспрессионной генетической конструкции, содержащей нуклеотидную последовательность белка (протеазы) 3CL с оптимизированными кодонами и обеспечивающей синтез и транспорт химерного варианта белка 3CL в периплазматическое пространство E. coli.

Указанный технический результат достигается тем, что создана рекомбинантная плазмида pET-GST-3CL-GPG, обеспечивающая синтез и транспорт химерного белка (протеазы) 3CL SARS-CoV-2 в периплазматическое пространство клеток E. coli в растворимой форме, имеющая нуклеотидную последовательность SEQ ID NO: 2 размером 7008 п.н., и содержащая в соответствии с физической и генетической картой, представленной на фиг. 1, следующие элементы:

- AmpR promoter (координаты с 494 п.н. по 598 п.н.);

- генетический маркер, определяющий устойчивость к ампициллину клеток бактерии E.coli, трансформированных рекомбинантной плазмидой AmpR (координаты с 599 по 1459 п.н.);

- участок начала репликации ori (координаты с 1630 по 2218 п.н.);

- lacI - ДНК-связывающий белок, ингибирующий экспрессию генов E.coli и обеспечивающий экспрессию целевого рекомбинантного белка 3CL-GPG-6His после добавления индуктора изопропил-β-D-1-тиогалактопиранозида (IPTG) (координаты с 3648 по 4730 п.н.);

- lacI promoter (координаты с 4731 по 4808 п.н.);

- промотор фага Т7 (координаты с 5117 по 5135 п.н.), обеспечивающий экспрессию последовательности гена GST-3CL-GPG-6His в клетках E.coli;

- lac operator (координаты с 5136 по 5160 п.н.);

- RBS - сайт связывания рибосомы (координаты с 5191 по 5196 п.н.)

- ген GST (глутатион-S-трансфераза из Shistosoma japonium) (координаты с 5205 по 5857 п.н.

- Pep - участок, кодирующий пептид GSTSAVLQ, (координаты с 5859 по 5882 п.н.)

химерный ген 3CL SARS-CoV-2 включающий так же последовательность GPG и 6His, имеющий координаты с 5883 по 6833 п.н., нуклеотидную последовательность SEQ ID NO: 1 и кодирующий синтез белка (протеазы) 3CL-GPG-6His с аминокислотной последовательностью SEQ ID NO: 3;

- Т7 terminator (координаты с 6936 по 6983 п.н.).

Таким образом, получена кодон-оптимизированная нуклеотидная последовательность, имеющая последовательность SEQ ID NO: 1, кодирующая белок 3CL SARS-CoV-2, включающий так же последовательность GPG и последовательность 6×His, а также получена генетическая плазмидная конструкция pET-GST-3CL-GPG (фиг. 1), содержащая нуклеотидную последовательность 3CL-GPG SEQ ID NO: 2 и обеспечивающая синтез и транспорт в периплазматическое пространство белка 3CL-GPG-6His в клетках Е.coli.

Кроме того, получен химерный белок GST-3CL-GPG. Последовательность GST на N-конце белка обеспечивает транспорт слитого белка в периплазматическое пространство клеток Е.coli. В периплазматическом пространстве происходит автоотщепление GST благодаря каталитической активности протеазы 3CL. Последовательность GSTSAVLQ является консенсусной последовательностью сайта протеолиза 3CL и расположена между белком GST и 3CL. На С-конце белок содержит последовательность 6×His, обеспечивающую возможность очистки целевого белка при помощи аффинной металл-хелатной хроматографии. Последовательность 3CL и 6×His разделены аминокислотной последовательностью GPGSG, предотвращающей автоотщепление последовательности 6×His от 3CL.

Белок 3CL-GPG-6His с аминокислотной последовательностью SEQ ID NO: 3, получают культивированием клеток E.coli, синтезом целевого белка и выделением растворимого белка с помощью аффинной металл-хелатной хроматографии.

Изобретение имеет ряд преимуществ по сравнению с наиболее близким по сущности аналогом (прототипом). Использование белка GST позволяет получить белок 3CL-GPG-6His в растворимой форме, сохраняющей ферментативную активность, что позволяет использовать его для анализа веществ-ингибиторов коронавируса SARS-CoV-2. Проведенная оптимизация кодонов фрагмента ДНК, кодирующего белок 3CL, обеспечивает высокий уровень экспрессии белка. Последовательность GSTSAVLQ обеспечивает эффективное автоотщепление белка 3CL-GPG-6His. Использование в составе целевого белка последовательности 6×His делает возможным оптимизацию способа выделения и очистки белка 3CL-GPG-6His.

Осуществление изобретения

Изобретение иллюстрируется следующими графическими материалами.

На фиг. 1. Представлена физическая и генетическая карта плазмидного вектора pET-GST-3CL-GPG, имеющего размер 7008 п.н.

На фиг. 2 приведена электрофореграмма разделения препаратов белков в 15% ДСН-ПААГ:

1 - биомасса Е.coli до добавления индуктора IPTG;

2 - биомасса E.coli после добавления индуктора IPTG;

3 - фракция белков периплазмы (растворимая);

4 - нерастворимая фракция белков;

М - маркер молекулярного веса, 10-200 кДа

На фиг. 3 представлена электрофореграмма разделения хроматографических фракций в 15% ДСН-ПААГ:

1 - лизат клеток E.coli содержащих плазмиду pET-GST-3CL-GPG до хроматографической очистки;

2 - баластные (примесные) белки, не связавшиеся с сорбентом (проскок нанесения);

3 - фракция примесных белков после промывки колонки тремя объемами промывочного буфера;

4 - фракция целевого белка после хроматографической очистки;

М - маркер молекулярного веса, 10-200 кДа.

Ниже приведены примеры 1-3 конкретного осуществления изобретения.

Пример 1. Конструирование генетической последовательности для синтеза белка 3CL-GPG-6His

Последовательность гена, кодирующего белок 3CL (3264S - 3569Q) коронавируса SARS-CoV-2 (GenBank MZ149976) заимствовали из базы данных GenBank и проводили оптимизацию частот встречаемости кодонов для млекопитающих при помощи сервиса JCat (http://www.jcat.de/), при этом индекс адаптации кодонов CAI достиг 0,87.

На основе вектора pET-GST получали конструкцию pET-GST-3CL-GPG (фиг. 1), содержащую нуклеотидную последовательность 3CL-GPG-6His (SEQ ID NO: 1).

Нуклеотидную последовательность кодирующую пептид Pep (GSTSAVLQ), 6His, последовательность GPG и сайтов рестрикции BamHI и CciNI вводили в последовательность 3CL одновременно с помощью ПНР. Использовались пары праймеров 3CL-GPG-F и 3CL-GPG-R (таблица 1).

Пример 2. Создание плазмидной конструкции pET-GST-3CL-GPG

2.1. Амплификация методом ПЦР нуклеотидной последовательности, кодирующей 3CL SARS-CoV-2

Амплификацию фрагментов проводили по стандартному протоколу. Реакционная смесь, объемом 50 мкл содержала 10×буфер, 25 мМ dNTP, олигонуклеотидные праймеры (таблица 1) в количестве 15 пмоль каждого, 5 ед. Q5-полимеразы, 1 мкл раствора плазмидной ДНК. Реакцию проводили в амплификаторе Veriti™ 96-Well Thermal Cycler. Температурно-временной профиль ПЦР: плавление - 95°С - 5 мин. (1 цикл). 95°С - 30 секунд. Отжиг - 58°С - 30 секунд, элонгация - 72°С - 30 секунд (35 циклов).

2.2. Выделение ДНК из агарозного геля

После визуализации под УФ-излучением фрагменты ДНК необходимой длины, разделенные в агарозном геле, вырезали из геля и элюировали при помощи набора «Евроген» Cleanup Standard (Россия) в соответствии с рекомендациями производителя.

2.3. Ферментативный гидролиз вектора pET-GST и ПЦР-продукта (последовательность Pep-3CL-GPG)

Для клонирования гена 3CL-GPG в составе вектора pET-GST были использованы эндонуклеазы рестрикции BamHI и CciNI (фирма «Сибэнзим», Россия) с прилагаемыми к ним буферами. Реакционную смесь готовили в соответствии с активностью фермента (2-5 е.а. на 1 мкг ДНК) и концентрации плазмидной ДНК. Условия реакции: температура, состав буфера и длительность проведения ферментативного гидролиза ДНК подбирали в соответствии с инструкциями производителя "Сибэнзим".

2.4. Лигирование ПЦР-продукта (последовательность Pep-3CL-GPG) и вектора pET-GST

Реакцию лигирования проводили в течение 30 мин. при комнатной температуре, используя смесь из 2 мкг ампликонов с ДНК-матрицы, 1 мкг векторной плазмиды и 20 е.а. ДНК-лигазы фага Т4 в прилагаемом к коммерческому набору реакционном буфере. Полученную лигазную смесь использовали для трансформирования культуры компетентных клеток Е.coli штамм Neb Stable.

2.5. Heat-shock трансформация

К «компетентным» клеткам Е. coli штамм Neb Stable добавляли 10 мкл лигазной смеси (отношение 1:10), инкубировали на льду в течение 30 мин. После этого клетки подвергали «температурному шоку» при 42°С в течение 45 сек. Охлаждали клетки на льду в течение 2 мин, затем добавляли 200 мкл среды SOB и инкубировали при 37°С в течение 60 мин. По окончании инкубации трансформированные клетки высевали на чашку Петри с твердой питательной средой LB, содержащей антибиотик.

2.6. Отбор клонов для рестрикционного анализа. Клетки Е. coli штамма Neb Stable, трансформированные плазмидой селективно культивировали в 10 мл жидкой питательной среды LB с добавлением антибиотика в рабочей концентрации 25 мкг/мл.

2.7. Определение нуклеотидной последовательности ДНК

Секвенирование проводили по методу Сэнгера. Использовался набор CEQ2000Dye Terminator Cycle Sequencing Kit и 16-капилярный автоматический секвенатор ABI 3130xl.

Пример 3. Наработка рекомбинантного белка 3CL-GPG-6His

Полученной плазмидой pET-GST-3CL-GPG (фиг. 1) трансформировали клетки Е. coli BL21(DE3). Индивидуальные колонии Е. coli, содержащие рекомбинантные плазмиды, культивировали в течение ночи на орбитальном шейкере в среде LB, содержащей 100 мкг/мл ампициллина, при 37°С и 180 об./мин. Инокулят в соотношении 1/100 переносили в колбу Эрленмейера, содержащую среду LB, и растили до поглощения 0,8 (при λ=600 нм). Добавляли индуктор изопропил-β-D-1-тиогалактопиранозид (ИПТГ) до конечной концентрации 1 мМ. Культуру дополнительно культивировали на шейкере в течение 5 ч при 37°С и 180 об/мин. Биомассу осаждали центрифугированием в течении 20 мин при 5000 g и 4°С. Полученный осадок растворяли в лизирующем буфере: 12 мМ Tris; 120 мМ NaCl; 0.1 mM EDTA; 1 mM DTT. Для разрушения клеточной стенки проводили ультразвуковую обработку полученного раствора. После суспензию центрифугировали при 16000g 20 минут при 4°С для отделения нерастворимой фракции. Полученные фракции анализировали при помощи электрофореза в денатурирующих условиях в 15% ПААГ. Белок находился в растворимой фракции (фиг. 2).

Пример 4. Очистка рекомбинантого белка

Супернатант, содержащий целевой белок подвергали металл-хелатной хроматографии. Для этого хроматографическую колонку с сорбентом Ni Sepharose 6 Fast Flow уравновешивали промывочным буфером, содержащим 15 мМ имидазол в PBS. Супернатант наносили на колонку из соотношения 30 мг белка на 1 мл сорбента и промывали 10 объемами промывочного буфера. Белок элюировали 3 объемами элюирующего буфера (350 мМ имидазол в PBS). Полученный элюат диализовали против 100 объемов 50 мМ Tris рН 7.5. Полученные фракции анализировали при помощи электрофореза в денатурирующих условиях в 15% ПААГ (фиг. 3).

Пример 5. Анализ ферментативной активности рекомбинантого белка. Анализ ферментативной активности полученного белка проводили методом флуориметрии с использованием планшетного флуориметра CLARIOstar Plus, длины волн возбуждения - 495 нм, эмиссии - 520 нм. В качестве субстрата использовали синтетический пептид Dabcyl-VNSTLQSGLR-Lys(5FAM)-MA. Гидролиз субстрата химозином приводит к разгоранию флуоресценции из-за удаления флуорофора и тушителя. Скорость увеличения флуоресценции отражает скорость ферментативной реакции.

Реакционные смеси готовили в 384 луночном планшете, после чего инкубировали при комнатной температуре в течение 5 мин. Все измерения проводили при 25°С. Каждая лунка содержала одну реакционную смесь. Калибровку прибора проводили по раствору пептида, подвергшегося полному гидролизу. Значение флуоресценции данной смеси принимали за 80%. Реакционные смеси содержали 5 мкл Tris-HCl буфера (рН 8,0; 50 мМ Tris; 50 мМ NaCl), 2 мкл субстрата (С=33 мкг/мл). Реакцию запускали добавлением 3 мкл 3CL-GPG-6His (С=0,025 мг/мл). О ферментативной активности свидетельствовало увеличение сигнала флуоресценции. При инкубировании специфического пептидного субстрата (Dabcyl-VNSTLQSGLR-Lys(5FAM)-МА) с ферментом (протеазой 3CL-GPG-6His), происходило увеличение уровня флуоресценции до 200000 RFU (относительных единиц флуоресценции), что и позволяет судить о специфической ферментативной активности белка 3CL-GPG-6His.

--->

ПРИЛОЖЕНИЕ

Перечень последовательностей

<110> Федеральное бюджетное учреждение науки «Государственный научный центр

вирусологии и биотехнологии «Вектор» Федеральной службы по надзору в сфере

защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ «Вектор»

Роспотребнадзора)

<120> Рекомбинантная плазмида pET-GST-3CL-GPG, обеспечивающая синтез протеазы

3CL SARS-CoV-2 в клетках E.coli в растворимой форме.

<160> SEQ ID NO:3

<210> SEQ ID NO:1

<211> 951

<212> DNA

<213> Artificial Sequence

<220>

<223> Нуклеотидная последовательность химерного гена 3CL-GPG-6His

<400> 1

1 AGCGGTTTTC GTAAAATGGC ATTTCCGAGC GGTAAAGTTG AAGGTTGTAT GGTTCAGGTT

61 ACCTGTGGCA CCACGACACT GAATGGTCTG TGGCTGGATG ATGTTGTTTA TTGTCCGCGT

121 CATGTTATTT GTACCAGCGA AGATATGCTG AACCCGAATT ATGAAGATCT GCTGATTCGC

181 AAAAGCAACC ATAATTTTCT GGTTCAGGCA GGTAATGTTC AGCTGCGTGT TATTGGTCAT

241 AGCATGCAGA ATTGTGTGCT GAAACTGAAA GTTGATACCG CCAATCCGAA AACGCCGAAA

301 TATAAGTTTG TTCGTATTCA GCCTGGTCAG ACCTTTAGCG TTCTGGCATG TTATAATGGT

361 AGCCCGAGCG GTGTTTATCA GTGTGCAATG CGTCCGAATT TTACCATTAA AGGCAGCTTT

421 CTGAATGGTA GCTGTGGTAG CGTTGGTTTC AACATTGATT ATGATTGCGT GAGCTTCTGC

481 TATATGCATC ATATGGAACT GCCGACCGGT GTTCATGCAG GCACCGATCT GGAAGGTAAC

541 TTTTATGGTC CGTTTGTTGA TCGTCAGACC GCACAGGCAG CAGGTACAGA TACCACCATT

601 ACCGTTAATG TTCTGGCCTG GCTGTATGCA GCAGTTATTA ATGGTGATCG CTGGTTTCTG

661 AATCGTTTTA CAACAACCCT GAACGATTTT AATCTGGTGG CCATGAAATA TAACTATGAA

721 CCGCTGACAC AGGATCATGT TGATATTCTG GGTCCGCTGA GCGCACAGAC CGGTATTGCA

781 GTTCTGGATA TGTGTGCAAG CCTGAAAGAA CTGTTACAGA ATGGTATGAA TGGTCGTACA

841 ATTCTGGGTA GCGCACTGCT GGAAGATGAA TTCACCCCGT TTGATGTTGT GCGTCAGTGT

901 AGCGGTGTTA CCTTTCAGGG ACCAGGTAGC GGTCATCATC ACCATCACCA C

<210> SEQ ID NO:2

<211> 7008 п.н.

<212> DNA

<213> Artificial Sequence

<220>

<223> Нуклеотидная последовательность рекомбинантной плазмиды pET-GST-3CL-GPG.

<400> 2

1 TGGCGAATGG GACGCGCCCT GTAGCGGCGC ATTAAGCGCG GCGGGTGTGG TGGTTACGCG

61 CAGCGTGACC GCTACACTTG CCAGCGCCCT AGCGCCCGCT CCTTTCGCTT TCTTCCCTTC

121 CTTTCTCGCC ACGTTCGCCG GCTTTCCCCG TCAAGCTCTA AATCGGGGGC TCCCTTTAGG

181 GTTCCGATTT AGTGCTTTAC GGCACCTCGA CCCCAAAAAA CTTGATTAGG GTGATGGTTC

241 ACGTAGTGGG CCATCGCCCT GATAGACGGT TTTTCGCCCT TTGACGTTGG AGTCCACGTT

301 CTTTAATAGT GGACTCTTGT TCCAAACTGG AACAACACTC AACCCTATCT CGGTCTATTC

361 TTTTGATTTA TAAGGGATTT TGCCGATTTC GGCCTATTGG TTAAAAAATG AGCTGATTTA

421 ACAAAAATTT AACGCGAATT TTAACAAAAT ATTAACGTTT ACAATTTCAG GTGGCACTTT

481 TCGGGGAAAT GTGCGCGGAA CCCCTATTTG TTTATTTTTC TAAATACATT CAAATATGTA

541 TCCGCTCATG AGACAATAAC CCTGATAAAT GCTTCAATAA TATTGAAAAA GGAAGAGTAT

601 GAGTATTCAA CATTTCCGTG TCGCCCTTAT TCCCTTTTTT GCGGCATTTT GCCTTCCTGT

661 TTTTGCTCAC CCAGAAACGC TGGTGAAAGT AAAAGATGCT GAAGATCAGT TGGGTGCACG

721 AGTGGGTTAC ATCGAACTGG ATCTCAACAG CGGTAAGATC CTTGAGAGTT TTCGCCCCGA

781 AGAACGTTTT CCAATGATGA GCACTTTTAA AGTTCTGCTA TGTGGCGCGG TATTATCCCG

841 TATTGACGCC GGGCAAGAGC AACTCGGTCG CCGCATACAC TATTCTCAGA ATGACTTGGT

901 TGAGTACTCA CCAGTCACAG AAAAGCATCT TACGGATGGC ATGACAGTAA GAGAATTATG

961 CAGTGCTGCC ATAACCATGA GTGATAACAC TGCGGCCAAC TTACTTCTGA CAACGATCGG

1021 AGGACCGAAG GAGCTAACCG CTTTTTTGCA CAACATGGGG GATCATGTAA CTCGCCTTGA

1081 TCGTTGGGAA CCGGAGCTGA ATGAAGCCAT ACCAAACGAC GAGCGTGACA CCACGATGCC

1141 TGCAGCAATG GCAACAACGT TGCGCAAACT ATTAACTGGC GAACTACTTA CTCTAGCTTC

1201 CCGGCAACAA TTAATAGACT GGATGGAGGC GGATAAAGTT GCAGGACCAC TTCTGCGCTC

1261 GGCCCTTCCG GCTGGCTGGT TTATTGCTGA TAAATCTGGA GCCGGTGAGC GTGGGTCTCG

1321 CGGTATCATT GCAGCACTGG GGCCAGATGG TAAGCCCTCC CGTATCGTAG TTATCTACAC

1381 GACGGGGAGT CAGGCAACTA TGGATGAACG AAATAGACAG ATCGCTGAGA TAGGTGCCTC

1441 ACTGATTAAG CATTGGTAAC TGTCAGACCA AGTTTACTCA TATATACTTT AGATTGATTT

1501 AAAACTTCAT TTTTAATTTA AAAGGATCTA GGTGAAGATC CTTTTTGATA ATCTCATGAC

1561 CAAAATCCCT TAACGTGAGT TTTCGTTCCA CTGAGCGTCA GACCCCGTAG AAAAGATCAA

1621 AGGATCTTCT TGAGATCCTT TTTTTCTGCG CGTAATCTGC TGCTTGCAAA CAAAAAAACC

1681 ACCGCTACCA GCGGTGGTTT GTTTGCCGGA TCAAGAGCTA CCAACTCTTT TTCCGAAGGT

1741 AACTGGCTTC AGCAGAGCGC AGATACCAAA TACTGTCCTT CTAGTGTAGC CGTAGTTAGG

1801 CCACCACTTC AAGAACTCTG TAGCACCGCC TACATACCTC GCTCTGCTAA TCCTGTTACC

1861 AGTGGCTGCT GCCAGTGGCG ATAAGTCGTG TCTTACCGGG TTGGACTCAA GACGATAGTT

1921 ACCGGATAAG GCGCAGCGGT CGGGCTGAAC GGGGGGTTCG TGCACACAGC CCAGCTTGGA

1981 GCGAACGACC TACACCGAAC TGAGATACCT ACAGCGTGAG CTATGAGAAA GCGCCACGCT

2041 TCCCGAAGGG AGAAAGGCGG ACAGGTATCC GGTAAGCGGC AGGGTCGGAA CAGGAGAGCG

2101 CACGAGGGAG CTTCCAGGGG GAAACGCCTG GTATCTTTAT AGTCCTGTCG GGTTTCGCCA

2161 CCTCTGACTT GAGCGTCGAT TTTTGTGATG CTCGTCAGGG GGGCGGAGCC TATGGAAAAA

2221 CGCCAGCAAC GCGGCCTTTT TACGGTTCCT GGCCTTTTGC TGGCCTTTTG CTCACATGTT

2281 CTTTCCTGCG TTATCCCCTG ATTCTGTGGA TAACCGTATT ACCGCCTTTG AGTGAGCTGA

2341 TACCGCTCGC CGCAGCCGAA CGACCGAGCG CAGCGAGTCA GTGAGCGAGG AAGCGGAAGA

2401 GCGCCTGATG CGGTATTTTC TCCTTACGCA TCTGTGCGGT ATTTCACACC GCATATATGG

2461 TGCACTCTCA GTACAATCTG CTCTGATGCC GCATAGTTAA GCCAGTATAC ACTCCGCTAT

2521 CGCTACGTGA CTGGGTCATG GCTGCGCCCC GACACCCGCC AACACCCGCT GACGCGCCCT

2581 GACGGGCTTG TCTGCTCCCG GCATCCGCTT ACAGACAAGC TGTGACCGTC TCCGGGAGCT

2641 GCATGTGTCA GAGGTTTTCA CCGTCATCAC CGAAACGCGC GAGGCAGCTG CGGTAAAGCT

2701 CATCAGCGTG GTCGTGAAGC GATTCACAGA TGTCTGCCTG TTCATCCGCG TCCAGCTCGT

2761 TGAGTTTCTC CAGAAGCGTT AATGTCTGGC TTCTGATAAA GCGGGCCATG TTAAGGGCGG

2821 TTTTTTCCTG TTTGGTCACT GATGCCTCCG TGTAAGGGGG ATTTCTGTTC ATGGGGGTAA

2881 TGATACCGAT GAAACGAGAG AGGATGCTCA CGATACGGGT TACTGATGAT GAACATGCCC

2941 GGTTACTGGA ACGTTGTGAG GGTAAACAAC TGGCGGTATG GATGCGGCGG GACCAGAGAA

3001 AAATCACTCA GGGTCAATGC CAGCGCTTCG TTAATACAGA TGTAGGTGTT CCACAGGGTA

3061 GCCAGCAGCA TCCTGCGATG CAGATCCGGA ACATAATGGT GCAGGGCGCT GACTTCCGCG

3121 TTTCCAGACT TTACGAAACA CGGAAACCGA AGACCATTCA TGTTGTTGCT CAGGTCGCAG

3181 ACGTTTTGCA GCAGCAGTCG CTTCACGTTC GCTCGCGTAT CGGTGATTCA TTCTGCTAAC

3241 CAGTAAGGCA ACCCCGCCAG CCTAGCCGGG TCCTCAACGA CAGGAGCACG ATCATGCGCA

3301 CCCGTGGGGC CGCCATGCCG GCGATAATGG CCTGCTTCTC GCCGAAACGT TTGGTGGCGG

3361 GACCAGTGAC GAAGGCTTGA GCGAGGGCGT GCAAGATTCC GAATACCGCA AGCGACAGGC

3421 CGATCATCGT CGCGCTCCAG CGAAAGCGGT CCTCGCCGAA AATGACCCAG AGCGCTGCCG

3481 GCACCTGTCC TACGAGTTGC ATGATAAAGA AGACAGTCAT AAGTGCGGCG ACGATAGTCA

3541 TGCCCCGCGC CCACCGGAAG GAGCTGACTG GGTTGAAGGC TCTCAAGGGC ATCGGTCGAG

3601 ATCCCGGTGC CTAATGAGTG AGCTAACTTA CATTAATTGC GTTGCGCTCA CTGCCCGCTT

3661 TCCAGTCGGG AAACCTGTCG TGCCAGCTGC ATTAATGAAT CGGCCAACGC GCGGGGAGAG

3721 GCGGTTTGCG TATTGGGCGC CAGGGTGGTT TTTCTTTTCA CCAGTGAGAC GGGCAACAGC

3781 TGATTGCCCT TCACCGCCTG GCCCTGAGAG AGTTGCAGCA AGCGGTCCAC GCTGGTTTGC

3841 CCCAGCAGGC GAAAATCCTG TTTGATGGTG GTTAACGGCG GGATATAACA TGAGCTGTCT

3901 TCGGTATCGT CGTATCCCAC TACCGAGATA TCCGCACCAA CGCGCAGCCC GGACTCGGTA

3961 ATGGCGCGCA TTGCGCCCAG CGCCATCTGA TCGTTGGCAA CCAGCATCGC AGTGGGAACG

4021 ATGCCCTCAT TCAGCATTTG CATGGTTTGT TGAAAACCGG ACATGGCACT CCAGTCGCCT

4081 TCCCGTTCCG CTATCGGCTG AATTTGATTG CGAGTGAGAT ATTTATGCCA GCCAGCCAGA

4141 CGCAGACGCG CCGAGACAGA ACTTAATGGG CCCGCTAACA GCGCGATTTG CTGGTGACCC

4201 AATGCGACCA GATGCTCCAC GCCCAGTCGC GTACCGTCTT CATGGGAGAA AATAATACTG

4261 TTGATGGGTG TCTGGTCAGA GACATCAAGA AATAACGCCG GAACATTAGT GCAGGCAGCT

4321 TCCACAGCAA TGGCATCCTG GTCATCCAGC GGATAGTTAA TGATCAGCCC ACTGACGCGT

4381 TGCGCGAGAA GATTGTGCAC CGCCGCTTTA CAGGCTTCGA CGCCGCTTCG TTCTACCATC

4441 GACACCACCA CGCTGGCACC CAGTTGATCG GCGCGAGATT TAATCGCCGC GACAATTTGC

4501 GACGGCGCGT GCAGGGCCAG ACTGGAGGTG GCAACGCCAA TCAGCAACGA CTGTTTGCCC

4561 GCCAGTTGTT GTGCCACGCG GTTGGGAATG TAATTCAGCT CCGCCATCGC CGCTTCCACT

4621 TTTTCCCGCG TTTTCGCAGA AACGTGGCTG GCCTGGTTCA CCACGCGGGA AACGGTCTGA

4681 TAAGAGACAC CGGCATACTC TGCGACATCG TATAACGTTA CTGGTTTCAC ATTCACCACC

4741 CTGAATTGAC TCTCTTCCGG GCGCTATCAT GCCATACCGC GAAAGGTTTT GCGCCATTCG

4801 ATGGTGTCCG GGATCTCGAC GCTCTCCCTT ATGCGACTCC TGCATTAGGA AGCAGCCCAG

4861 TAGTAGGTTG AGGCCGTTGA GCACCGCCGC CGCAAGGAAT GGTGCATGCA AGGAGATGGC

4921 GCCCAACAGT CCCCCGGCCA CGGGGCCTGC CACCATACCC ACGCCGAAAC AAGCGCTCAT

4981 GAGCCCGAAG TGGCGAGCCC GATCTTCCCC ATCGGTGATG TCGGCGATAT AGGCGCCAGC

5041 AACCGCACCT GTGGCGCCGG TGATGCCGGC CACGATGCGT CCGGCGTAGA GGATCGAGAT

5101 CTCGATCCCG CGAAATTAAT ACGACTCACT ATAGGGGAAT TGTGAGCGGA TAACAATTCC

5161 CCTCTAGAAA TAATTTTGTT TAACTTTAAG AAGGAGATAT ACATATGTCC CCTATACTAG

5221 GTTATTGGAA AATTAAGGGC CTTGTGCAAC CCACTCGACT TCTTTTGGAA TATCTTGAAG

5281 AAAAATATGA AGAGCATTTG TATGAGCGCG ATGAAGGTGA TAAATGGCGA AACAAAAAGT

5341 TTGAATTGGG TTTGGAGTTT CCCAATCTTC CTTATTATAT TGATGGTGAT GTTAAATTAA

5401 CACAGTCTAT GGCCATCATA CGTTATATAG CTGACAAGCA CAACATGTTG GGTGGTTGTC

5461 CAAAAGAGCG TGCAGAGATT TCAATGCTTG AAGGAGCGGT TTTGGATATT AGATACGGTG

5521 TTTCGAGAAT TGCATATAGT AAAGACTTTG AAACTCTCAA AGTTGATTTT CTTAGCAAGC

5581 TACCTGAAAT GCTGAAAATG TTCGAAGATC GTTTATGTCA TAAAACATAT TTAAATGGTG

5641 ATCATGTAAC CCATCCTGAC TTCATGTTGT ATGACGCTCT TGATGTTGTT TTATACATGG

5701 ACCCAATGTG CCTGGATGCG TTCCCAAAAT TAGTTTGTTT TAAAAAACGT ATTGAAGCTA

5761 TCCCACAAAT TGATAAGTAC TTGAAATCCA GCAAGTATAT AGCATGGCCT TTGCAGGGCT

5821 GGCAAGCCAC GTTTGGTGGT GGCGACCATC CTCCAAAAGG ATCCACCTCA GCTGTTTTGC

5881 AGAGCGGTTT TCGTAAAATG GCATTTCCGA GCGGTAAAGT TGAAGGTTGT ATGGTTCAGG

5941 TTACCTGTGG CACCACGACA CTGAATGGTC TGTGGCTGGA TGATGTTGTT TATTGTCCGC

6001 GTCATGTTAT TTGTACCAGC GAAGATATGC TGAACCCGAA TTATGAAGAT CTGCTGATTC

6061 GCAAAAGCAA CCATAATTTT CTGGTTCAGG CAGGTAATGT TCAGCTGCGT GTTATTGGTC

6121 ATAGCATGCA GAATTGTGTG CTGAAACTGA AAGTTGATAC CGCCAATCCG AAAACGCCGA

6181 AATATAAGTT TGTTCGTATT CAGCCTGGTC AGACCTTTAG CGTTCTGGCA TGTTATAATG

6241 GTAGCCCGAG CGGTGTTTAT CAGTGTGCAA TGCGTCCGAA TTTTACCATT AAAGGCAGCT

6301 TTCTGAATGG TAGCTGTGGT AGCGTTGGTT TCAACATTGA TTATGATTGC GTGAGCTTCT

6361 GCTATATGCA TCATATGGAA CTGCCGACCG GTGTTCATGC AGGCACCGAT CTGGAAGGTA

6421 ACTTTTATGG TCCGTTTGTT GATCGTCAGA CCGCACAGGC AGCAGGTACA GATACCACCA

6481 TTACCGTTAA TGTTCTGGCC TGGCTGTATG CAGCAGTTAT TAATGGTGAT CGCTGGTTTC

6541 TGAATCGTTT TACAACAACC CTGAACGATT TTAATCTGGT GGCCATGAAA TATAACTATG

6601 AACCGCTGAC ACAGGATCAT GTTGATATTC TGGGTCCGCT GAGCGCACAG ACCGGTATTG

6661 CAGTTCTGGA TATGTGTGCA AGCCTGAAAG AACTGTTACA GAATGGTATG AATGGTCGTA

6721 CAATTCTGGG TAGCGCACTG CTGGAAGATG AATTCACCCC GTTTGATGTT GTGCGTCAGT

6781 GTAGCGGTGT TACCTTTCAG GGACCAGGTA GCGGTCATCA TCACCATCAC CACTAAGCGG

6841 CCGCACTCGA GCACCACCAC CACCACCACT GAGATCCGGC TGCTAACAAA GCCCGAAAGG

6901 AAGCTGAGTT GGCTGCTGCC ACCGCTGAGC AATAACTAGC ATAACCCCTT GGGGCCTCTA

6961 AACGGGTCTT GAGGGGTTTT TTGCTGAAAG GAGGAACTAT ATCCGGAT

<210> SEQ ID NO:3

<211> 317 а.о.

<212> DNA

<213> Artificial Sequence

<220>

<223> Аминокислотная последовательность рекомбинантного белка 3CL-GPG-6His

<400> 3

1 SGFRKMAFPS GKVEGCMVQV TCGTTTLNGL WLDDVVYCPR HVICTSEDML NPNYEDLLIR

61 KSNHNFLVQA GNVQLRVIGH SMQNCVLKLK VDTANPKTPK YKFVRIQPGQ TFSVLACYNG

121 SPSGVYQCAM RPNFTIKGSF LNGSCGSVGF NIDYDCVSFC YMHHMELPTG VHAGTDLEGN

181 FYGPFVDRQT AQAAGTDTTI TVNVLAWLYA AVINGDRWFL NRFTTTLNDF NLVAMKYNYE

241 PLTQDHVDIL GPLSAQTGIA VLDMCASLKE LLQNGMNGRT ILGSALLEDE FTPFDVVRQC

301 SGVTFQGPGS GHHHHHH

<---

Рекомбинантная плазмида pET-GST-3CL-GPG, обеспечивающая синтез и транспорт протеазы 3CL SARS-CoV-2 в периплазматическое пространство клеток Е.coli в растворимой форме, имеющая нуклеотидную последовательность SEQ ID NO: 2 размером 7008 п.н. и содержащая в соответствии с физической и генетической картой, представленной на фиг. 1, следующие элементы:

- AmpR promoter, имеющий координаты с 494 по 598 п.н.;

- генетический маркер, определяющий устойчивость к ампициллину клеток бактерии Е.coli, трансформированных рекомбинантной плазмидой AmpR, имеющий координаты с 599 по 1459 п.н.;

- участок начала репликации ori, имеющий координаты с 1630 по 2218 п.н.;

- lacI - ДНК-связывающий белок, ингибирующий экспрессию генов E.coli, обеспечивающий экспрессию целевого рекомбинантного белка 3CL-GPG-6His после добавления индуктора изопропил-β-D-1-тиогалактопиранозида (IPTG), имеющий координаты с 3648 по 4730 п.н.;

- lacI promoter, имеющий координаты с 4731 по 4808 п.н.;

- промотор фага Т7, имеющий координаты с 5117 по 5135 п.н. и обеспечивающий экспрессию последовательности гена GST-3CL-GPG в клетках E.coli;

- lac operator, имеющий координаты с 5136 по 5160 п.н.;

- RBS - сайт связывания рибосомы, имеющий координаты с 5191 по 5196 п.н.;

- ген GST - глутатион-S-трансфераза из Shistosoma japonicum, имеющий координаты с 5205 по 5857 п.н.;

- Pep - участок, кодирующий пептид GSTSAVLQ, имеющий координаты с 5859 по 5882 п.н.;

- химерный ген 3CL SARS-CoV-2, включающий также последовательность GPG и 6His, имеющий нуклеотидную последовательность SEQ ID NO: 1, координаты с 5883 по 6833 п.н. и кодирующий синтез протеазы 3CL-GPG-6His с аминокислотной последовательностью SEQ ID NO: 3;

- Т7 terminator, имеющий координаты с 6936 по 6983 п.н.



 

Похожие патенты:
Изобретение относится к области биотехнологии, конкретно к рекомбинантному получению ферментов в Е. coli, и может быть использовано для получения рекомбинантного белка нуклеазы Serratia marcescens.

Изобретение относится к области биотехнологии. Предложен трансформант дрожжей Ogataea haglerorum, продуцирующий фитазу и несущий в составе хромосомной ДНК оптимизированный синтетический ген PhyEc-mod, кодирующий фитазу Escherichia coli, нуклеотидная последовательность которого приведена в перечне последовательностей под номером SEQ ID NO: 1.

Настоящее изобретение относится к биотехнологии, в частности к варианту аденилосукцинат-синтетазы, к микроорганизму, содержащему его, и к способу получения пуриновых нуклеотидов с использованием такого микроорганизма. Изобретение позволяет с высокой степенью эффективности получать пуриновые нуклеотиды.

Изобретение относится к биотехнологии. Описан способ вакцинации субъекта с раком головного мозга, включающий: (i) получение жизнеспособной опухолевой ткани от субъекта, где опухолевую ткань хирургически удаляют из субъекта; (ii) сбор опухолевой ткани в стерильном уловителе; (iii) сбор адгезивных клеток из опухолевой ткани; (iv) инкапсуляцию собранных клеток в биодиффузионную камеру вместе с антисмысловым олигодезоксинуклеотидом рецептора инсулиноподобного фактора роста 1 (IGF-1R AS ODN), имеющим последовательность SEQ ID NO:1; (v) облучение камеры, и (vi) имплантацию камеры субъекту, при этом получают иммунный ответ против рака головного мозга, при этом субъект вакцинируют от 1 до 50 камерами на от 24 до 96 часов.

Изобретение относится к области биотехнологии. Предложен способ удлинения теломер.

Настоящая группа изобретений относится к биотехнологии. Представлены: полинуклеотид, содержащий нуклеотидную последовательность, кодирующую полипептид PPT1 или его фрагмент, экспрессионная кассета, экспрессионный вектор, трансформированная клетка, фармацевтическая композиция, способы их применения для доставки ORF CLN1 в клетку или субъекту и способу лечения расстройства, связанного с аберрантной экспрессией гена CLN1 или аберрантной активностью продукта гена CLN1 у субъекта.

Изобретение относится к биотехнологии. Предложен трансформант дрожжей Ogataea haglerorum, продуцирующий β-маннаназу ЕС 3.2.1.78 из Bacillus subtilis, содержащий в составе хромосомы оптимизированный синтетический ген, кодирующий указанную β-маннаназу, нуклеотидная последовательность которого приведена в перечне последовательностей под номером SEQ ID NO: 1.
Изобретение относится к способу получения метионина. Способ предусматривает культивирование микроорганизма в среде, получение O-сукцинилгомосерина из микроорганизма или среды, превращение O-сукцинилгомосерина в метионин путем использования цистатионин-гамма-синтазы или O-сукцинилгомосеринсульфгидрилазы.

Изобретение относится к областям молекулярной и клеточной биотехнологии и, в частности, к люциферазам. Мутантная копеподная люцифераза для применения в качестве биолюминесцентного репортера in vitro и in vivo имеет аминокислотную последовательность, выбранную из группы, включающей SEQ ID NO:1, 2, 3, и получена путем направленной молекулярной эволюции из MLuc7 изоформы люциферазы Metridia longa, отличается от природной аминокислотной последовательности наличием аминокислотных замен Y72W, I73L, G81E, G90A и D146V с нумерацией по SEQ ID NO:1.

Изобретение относится к области биотехнологии, в частности к полинуклеотиду, кодирующему идуцируемый полипептид каспазы, к полинуклеотиду, содержащему нуклеотидную последовательность, кодирующую область связывания лиганда, нуклеотидную последовательность, кодирующую линкер, и нуклеотидную последовательность, кодирующую усеченный полипептид каспазы 9, а также к содержащей его композиции, вектору и клетке.

Изобретение относится к области биотехнологии, иммунологии, вирусологии, генетики и молекулярной биологии. Описана выделенная кодон-оптимизированная нуклеиновая кислота, которая кодирует выделенный рекомбинантный рецептор-связывающий домен гликопротеина S (RBD-S) вируса SARS-CoV-2, экспрессионная кассета и вектор на ее основе.
Наверх