Искусственные молекулы нуклеиновой кислоты

Изобретение относится к биотехнологии. Описана искусственная молекула нуклеиновой кислоты для генетической терапии или генетической вакцинации, содержащая по меньшей мере одну открытую рамку считывания (ОРС), кодирующую терапевтический пептид; и по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR), который содержит нуклеотидную последовательность, происходящую из 3'-UTR гена рибосомального белка или из функционального варианта 3'-UTR гена рибосомального белка, в котором указанный функциональный вариант по меньшей мере на 80% идентичен указанному 3'-UTR гену рибосомального белка; и 5'-нетранслируемая область (5'-UTR), как дополнительного 5'-конце элемента, где 5'-UTR - это 5'TOP-UTR, который не содержит 5'-ТОР мотив. В заявке описана искусственная молекула нуклеиновой кислоты, содержащая по меньшей мере одну открытую рамку считывания и по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR), который содержит нуклеотидную последовательность, происходящую из 3'-UTR гена рибосомального белка. Изобретение может быть использовано в генной терапии и/или генетической вакцинации. 9 н. и 15 з.п. ф-лы, 9 ил., 5 табл., 1 пр.

 

Настоящее изобретение относится к искусственным молекулам нуклеиновой кислоты, которые содержат открытую рамку считывания, элемент 3'-нетранслируемой области (3'-UTR-элемент) и необязательно поли(А)-последовательность и/или сигнал полиаденилирования. Изобретение относится также к вектору, содержащему 3'-UTR-элемент, к клетке, содержащей искусственную молекулу нуклеиновой кислоты или вектор, к фармацевтической композиции, содержащей искусственную молекулу нуклеиновой кислоты или вектор, и к набору, содержащему искусственную молекулу нуклеиновой кислоты, вектор и/или фармацевтическую композицию, предпочтительно предназначенным для применения в области генной терапии и/или генетической вакцинации.

Генная терапия и генетическая вакцинация относятся к наиболее перспективным и быстро развивающимся методам современной медицины. Они позволяют разрабатывать высокоспецифические и индивидуальные подходы для терапии широкого разнообразия заболеваний. Мишенью для таких подходов к лечению могут являться, прежде всего, врожденные генетические заболевания, злокачественные или связанные с опухолью заболевания, а также воспалительные заболевания. Подразумевается, что с помощью указанных подходов можно предупреждать раннее начало таких заболеваний.

Основная концептуальная идея генной терапии заключается в осуществлении соответствующей модуляции нарушенной генной экспрессии, ассоциированной с патологическими состояниями при конкретных заболеваниях. Патологически измененная генная экспрессия может приводить к недостатку или сверхпродуцированию имеющих важное значение генных продуктов, например, сигнальных факторов, таких как гормоны, факторы, обусловленные генами «домашнего хозяйства», метаболические ферменты, структурные белки или т.п. Измененная генная экспрессия может быть обусловлена не только нарушением регуляции транскрипции и/или трансляции, но также и мутациями в ОРС, кодирующей конкретный белок. Патологические мутации могут вызываться, например, хромосомной аберрацией или более специфическими мутациями, такими как точечные мутации или мутации, приводящие к сдвигу рамки считывания, которые все приводят к ограничению функциональности и возможно к полной потере функции генного продукта. Однако нарушение регуляции транскрипции или трансляции может иметь место также в том случае, если мутации воздействуют на гены, кодирующие белки, которые участвуют в механизме транскрипции или трансляции в клетке. Такие мутации могут приводить к патологической повышающей или понижающей регуляции генов, которые сами по себе являются функциональными. Гены, кодирующие генные продукты, которые обладают такими регуляторными функциями, могут представлять собой, например, факторы транскрипции, сигнальные рецепторы, белки-мессенджеры или т.п. Однако потеря функции таких генов, кодирующих регуляторные белки, при определенных обстоятельствах может быть восстановлена путем искусственной интродукции других факторов, функционирующих в прямом направлении относительно нарушенного генного продукта. Такие дефекты генов можно компенсировать также с помощью генной терапии посредством замены самого поврежденного гена.

Генетическая вакцинация позволяет вызывать требуемый иммунный ответ на выбранные антигены, такие как обладающие определенными характеристиками компоненты бактериальных поверхностей, вирусные частицы, опухолевые антигены или т.п. В целом, вакцинация представляет собой одно из наиболее важных достижений современной медицины. Однако, в настоящее время эффективные вакцины доступны только для ограниченного количества заболеваний. Поэтому инфекции, которые нельзя предупреждать путем вакцинации, все еще поражают каждый год миллионы людей.

Обычно вакцины можно подразделять на вакцины «первого», «второго» и «третьего» поколения. Вакцины «первого поколения», как правило, представляют собой вакцины, содержащие цельные организмы. Они основаны либо на живых и ослабленных, либо на убитых патогенах, например, вирусах, бактериях или т.п. Основным недостатком живых и ослабленных вакцин является риск реверсии с образованием угрожающих жизни вариантов. Таким образом, указанные патогены, хотя они и являются ослабленными, все еще могут нести присущие им непредсказуемые риски. Убитые патогены могут не являться достаточно эффективными для создания специфического иммунного ответа. Для того чтобы минимизировать указанные риски, были разработаны вакцины «второго поколения». Как правило, они представляют собой субъединичные вакцины, состоящие из компонентов определенных антигенов или рекомбинантных белков, происходящих из патогенов.

Генетические вакцины, т.е. вакцины для генетической вакцинации, как правило, называют вакцинами «третьего поколения». Они, как правило, состоят из созданных методами генной инженерии молекул нуклеиновой кислоты, которые обеспечивают экспрессию in vivo фрагментов пептида или белка (антигена), характерных для патогена или опухолевого антигена. При введении пациенту экспрессия генетических вакцин происходит после поглощения клетками-мишенями. Экспрессия введенных нуклеиновых кислот приводит к производству кодируемых белков. В том случае, когда эти белки распознаются иммунной системой пациента как чужие, запускается иммунный ответ.

Как следует из вышеизложенного, оба метода, и генная терапия, и генетическая вакцинация, по существу основаны на введении молекул нуклеиновой кислоты пациенту и последующей транскрипции и/или трансляции кодируемой генетической информации. Альтернативно этому, генетическая вакцинация или генная терапия может включать также методы, которые предусматривают выделение специфических клеток из организма пациента, подлежащего лечению, последующую трансфекцию ex vivo указанных клеток и повторное введение обработанных клеток пациенту.

В контексте генной терапии или генетической вакцинации в качестве молекул нуклеиновой кислоты можно вводить как ДНК, так и РНК. Известно, что ДНК является относительно стабильной и с ней проще манипулировать. Однако применение ДНК сопряжено с риском нежелательного встраивания введенных ДНК-фрагментов в геном пациента, что может приводить к мутагенным действиям, таким как потеря функции нарушенных генов. Другим риском является то, что происходит нежелательное возникновение антител к ДНК. Еще одним недостатком является ограниченный уровень экспрессии кодируемого пептида или белка, достижимый при введении ДНК, поскольку ДНК должна проникнуть в ядро для того, чтобы произошла ее транскрипция перед тем, как могла осуществляться трансляция полученной в результате этого мРНК. Уровень экспрессии введенной ДНК может зависеть, среди прочего, от присутствия специфических факторов транскрипции, которые регулируют транскрипцию ДНК. В случае отсутствия таких факторов транскрипция ДНК не приводит к получению ДНК в достаточных количествах. В результате достигаемый уровень транслированного пептида или белка является ограниченным.

При использовании РНК вместо ДНК для генной терапии или генетической вакцинации риск нежелательной интеграции в геном и образования антител к ДНК сводится к минимуму или устраняется. Однако считается, что РНК являться относительно нестабильной молекулой, которая может легко расщепляться под действием повсеместно присутствующих РНКаз.

Расщепление РНК in vivo вносит вклад в регулирование времени полужизни РНК. Этот эффект был изучен и было установлено, что он строго регулирует экспрессию эукариотических генов (Friedel и др., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37 (17), 2009, cc. 1-12). Таким образом, каждая встречающаяся в естественных условиях мРНК имеет свое индивидуальное время полужизни, зависящее от гена, из которого происходит мРНК, и от типа клетки, в которой происходит экспрессия. Оно вносит вклад в регуляцию уровня экспрессии рассматриваемого гена. Нестабильные РНК важны для реализации кратковременной генной экспрессии в определенные моменты времени. Однако РНК с продолжительным временем жизни могут ассоциироваться с накоплением различных белков или с непрерывной экспрессией генов. Время полужизни мРНК in vivo может зависеть также от факторов окружающей среды, таких как обработка гормонами, что продемонстрировано, например, для мРНК инсулин-подобного фактора роста I, актина, и альбумина (Johnson и др., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, 1991, cc. 5287-5291).

Для генной терапии и генетической вакцинации, как правило, требуется стабильная РНК. Это обусловлено, с одной стороны, тем фактом, что, как правило, требуется, чтобы in vivo происходило накопление продукта, кодируемого последовательностью РНК. С другой стороны, РНК должна сохранять свою структурную и функциональную целостность при приготовлении пригодной лекарственной формы, в процессе ее хранения и при введении. Таким образом, предпринимались усилия для создания стабильных молекул РНК для генной терапии или генетической вакцинации с целью предупреждения их от раннего разложения или расщепления.

Опубликованы данные о том, что содержание G/C в молекулах нуклеиновой кислоты может оказывать влияние на ее стабильность. Так, нуклеиновые кислоты, содержащие в большем количестве остатки гуанина (G) и/или цитозина (С), могут быть функционально более стабильными, чем нуклеиновые кислоты, содержащие большое количество адениновых (А) и тиминовых (Т) или урациловых (U) нуклеотидов. В этом контексте в WO 02/098443 предложена фармацевтическая композиция, содержащая мРНК, которая стабилизирована посредством модификаций последовательности в кодирующей области. Такая модификация является возможной благодаря вырожденности генетического кода. В соответствии с этим кодоны, содержащие менее предпочтительную комбинацию нуклеотидов (менее предпочтительную с точки зрения стабильности РНК), быть заменены на альтернативные кодоны без изменения кодируемой аминокислотной последовательности. Такой метод стабилизации РНК ограничен тем, что для каждой отдельной молекулы РНК нужно получать конкретную нуклеотидную последовательность, которая не приводит к получению аминокислотной последовательности, отклоняющейся от требуемой. Указанный подход ограничен также тем, что его применяют к кодирующим областям РНК.

При поиске альтернативного подхода к стабилизации мРНК было установлено, что встречающиеся в естественных условиях молекулы эукариотической мРНК содержат характерные стабилизирующие элементы. Например, они могут содержать так называемые нетранслируемые области (UTR) на своем 5'-конце (5'-UTR) и/или на своем 3'-конце (3'-UTR), а также другие структурные особенности, такие как 5'-кэп-структура или 3'-поли(А)-хвост. Как 5'-UTR, так и 3'-UTR, как правило, транскрибируются с геномной ДНК и, следовательно, представляют собой элемент незрелой мРНК. Характерные структурные особенности зрелой мРНК, такие как 5'-кэп и 3'-поли(А)-хвост (которые обозначают также, как поли(А)-хвост или поли(А)-последовательность), как правило, добавляют к транскрибированной (незрелой) мРНК в ходе процессинга мРНК.

3'-поли(А)-хвост, как правило, представляет собой монотонный участок последовательности, который состоит из аденозиновых нуклеотидов, добавленный к 3'-концу транскрибированной мРНК. Он может содержать вплоть до примерно 400 аденозиновых нуклеотидов. Установлено, что длина такого 3'-поли(А)-хвоста может являться элементом, имеющим решающее значение для стабильности индивидуальной мРНК.

Было продемонстрировано также, что 3'-UTR мРНК α-глобина может являться важным фактором, обеспечивающим хорошо известную стабильность мРНК α-глобина (Rodgers и др., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, 2002, cc. 1526-1537). 3'-UTR мРНК α-глобина, по-видимому, участвует в формировании специфического рибонуклеопротеинового комплекса, α-комплекса, присутствие которого коррелирует со стабильностью мРНК in vitro (Wang и др., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular biology, том 19, №7, июль 1999 г., cc. 4552-4560).

Кроме того, для UTR в мРНК рибосомального белка была выявлена важная регуляторная функция: хотя 5'-UTR мРНК рибосомального белка контролирует ассоциированную с ростом трансляцию мРНК, строгость указанной регулировки обеспечивается соответствующей 3'-UTR в мРНК рибосомального белка (Ledda и др., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, том 344, 2005, cc. 213-220). Этот механизм оказывает влияние на специфическую схему экспрессии рибосомальных белков, которые, как правило, транскрибируются постоянным образом, вследствие чего мРНК некоторых рибосомальных белков, таких как рибосомальный белок S9 или рибосомальный белок L32, называют генами «домашнего хозяйства» (Janovick-Guretzky и др., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., том 90, 2007, cc. 2246-2252). Таким образом, ассоциированная с ростом схема экспрессии рибосомальных белков в основном обусловлена регуляцией на уровне трансляции.

Вне зависимости от факторов, влияющих на стабильность мРНК, эффективность трансляции введенных молекул нуклеиновой кислоты клетками-мишенями или тканью имеет решающее значение для любого подхода с использованием молекул нуклеиновой кислоты для генной терапии или генетической вакцинации. Как следует из процитированных выше примеров, структурные особенности, такие как UTR, 5'-кэп и 3'-поли(А)-хвост, наряду с регуляцией стабильности, регулируют также трансляцию большинства мРНК. В этом контексте, опубликованы данные о том, что длина поли(А)-хвоста может играть важную роль также и для эффективности трансляции. Однако стабилизирующие 3'-элементы могут оказывать также ослабляющее действие на трансляцию.

В основу настоящего изобретения была положена задача создать молекулы нуклеиновой кислоты, которые можно применять для генной терапии и/или генетической вакцинации. Задача изобретения заключалась, прежде всего, в том, чтобы создать виды мРНК, которые стабилизированы для защиты от преждевременного разложения или расщепления, но которые не характеризуются значительной функциональной потерей с точки зрения эффективности трансляции. Задачей изобретения являлось также создание искусственной молекулы нуклеиновой кислоты, предпочтительно мРНК, отличающейся повышенной экспрессией соответствующего белка, кодируемого указанной молекулой нуклеиновой кислоты. Одна из конкретных задач изобретения заключалась в создании мРНК, позволяющей повышать эффективность трансляции соответствующего кодируемого белка. Другая задача настоящего изобретения заключалась в том, чтобы создать молекулы нуклеиновой кислоты, кодирующие такие обладающие преимуществами виды мРНК, которые могут быть пригодными для применения в генной терапии и/или генетической вакцинации. Следующая задача настоящего изобретения заключалась в том, чтобы создать фармацевтическую композицию для применения в генной терапии и/или генетической вакцинации. В целом, задача настоящего изобретения заключалась в создании усовершенствованных видов нуклеиновой кислоты, которые позволяют преодолевать указанные выше недостатки существующего уровня техники с использованием экономичного и простого подхода.

Задачи, положенные в основу настоящего изобретения, решаются с помощью объектов изобретения, представленных в формуле изобретения.

Настоящее изобретение было создано при поддержке правительства в рамках соглашения № HR0011-11-3-0001, подписанного DARPA (Агентство передовых оборонных исследовательских проектов). Правительство обладает определенными правами на изобретение.

Для целей ясности и удобочитаемости ниже даны следующие определения. Все технические характеристики, указанные в этих определениях, применимы к каждому и всем вариантам осуществления изобретения. В контексте этих вариантов осуществления изобретения могут быть даны дополнительные определения и пояснения.

Адаптивный иммунный ответ: Как правило, под адаптивным иммунным ответом понимают антигенспецифический ответ иммунной системы. Специфичность в отношении антигена позволяет вырабатывать ответы, приспособленные к специфическим патогенам или инфицированным патогеном клеткам. Способность создавать такие приспособленные ответы, как правило, поддерживается в организме «клетками памяти». Если патоген инфицирует организм более одного раза, то указанные специфические клетки памяти используются для его быстрой элиминации. В этом контексте первая стадия адаптивного иммунного ответа представляет собой активацию наивных антигенспецифических Т-клеток или других иммунных клеток, способных индуцировать антигенспецифический иммунный ответ, антигенпрезентирующими клетками. Это происходит в лимфоидных тканях и органах, через которые постоянно проходят наивные Т-клетки. Три типа клеток, которые могут служить в качестве антигенпрезентирующих клеток, представляют собой дендритные клетки, макрофаги и В-клетки. Каждая из указанных клеток выполняет отдельную функцию при вызывании иммунных ответов. Дендритные клетки могут поглощать антигены посредством фагоцитоза и макропиноцитоза, и они могут стимулироваться при контакте, например, с чужим антигеном, к миграции в местную лимфоидную ткань, где может происходить их дифференцировка в зрелые дендритные клетки. Макрофаги поглощают находящиеся в форме частиц антигены, такие как бактерии, и могут индуцироваться инфекционными агентами или другими соответствующими стимулами и экспрессировать в результате этого молекулы ГКГС. Уникальная способность В-клеток к связыванию и интернализации растворимых белковых антигенов посредством своих рецепторов также может иметь важное значение для индукции Т-клеток. ГКГС-молекулы, как правило, ответственны за презентацию антигена Т-клеткам. При этом презентация антигена на молекулах ГКГС приводит к активации Т-клеток, что индуцирует их пролиферацию и дифференцировку в «вооруженные» эффекторные Т-клетки. Наиболее важной функцией эффекторных Т-клеток является уничтожение (цитолиз) инфицированных клеток цитотоксическими СВ8+-Т-клетками и активация макрофагов Тh1-клетками, что в совокупности создает опосредованный клетками (клеточный) иммунитет, а активация В-клеток как Th2-, так и Th1-клетками, приводящая к образованию различных классов антител, запускает гуморальный иммунный ответ. Т-клетки распознают антиген посредством своих Т-клеточных рецепторов, которые не распознают антиген и не связываются с ним непосредственно, но вместо этого распознают короткие пептидные фрагменты, например, выведенных из патогена белковых антигенов, например, так называемые эпитопы, которые связываются с молекулами ГКГС на поверхностях других клеток.

Адаптивная иммунная система: Адаптивная иммунная система в основном предназначена для устранения или предупреждения роста патогенов. Как правило, она регулирует адаптивный иммунный ответ, придавая иммунной системе позвоночных способность распознавать и запоминать специфические патогены (для создания иммунитета) и организовывать более сильную атаку в каждом случае при обнаружении патогена. Система обладает высокой способностью к адаптации вследствие соматической гипермутации (процесс ускоренных соматических мутаций) и V(D)J-рекомбинации (необратимая генетическая рекомбинация сегментов гена рецептора антигена). Этот механизм позволяет небольшому количеству генов создавать огромное количество различных рецепторов антигенов, которые затем уникальным образом экспрессируются на каждом индивидуальном лимфоците. Поскольку реаранжировка гена приводит к необратимому изменению ДНК каждой клетки, то все потомство такой клетки должно затем наследовать гены, кодирующие ту же самую рецепторную специфичность, включая В-клетки памяти и Т-клетки памяти, которые имеют решающее значение для долговременного специфического иммунитета.

Адъювант/адъювантный компонент: Адъювант или адъювантный компонент в наиболее широком смысле, как правило, представляет собой фармакологический и/или иммунологический агент, который может модифицировать, например, усиливать, действие других агентов, таких как лекарственное средство или вакцина. Это понятие следует рассматривать в широком смысле, и оно относится к широкому спектру субстанций. Как правило, указанные субстанции обладают способностью повышать иммуногенность антигенов. Например, адъюванты могут распознаваться врожденными иммунными системами и, например, могут вызывать врожденный иммунный ответ. «Адъюванты», как правило, не вызывают адаптивный иммунный ответ. Таким образом, «адъюванты» нельзя классифицировать как антигены. Механизм их действия отличен от механизма действий, запускаемых антигенами, которые приводят к адаптивному иммунному ответу.

Антиген: В контексте настоящего изобретения понятие «антиген» относится, как правило, к субстанции, которая может распознаваться иммунной системой, предпочтительно адаптивной иммунной системой, и которая обладает способностью запускать антигенспецифический иммунный ответ, например, посредством образования антител и/или антигенспецифических Т-клеток, в качестве компонента адаптивного иммунного ответа. Как правило, антиген может представлять собой или содержать пептид или белок, который может презентоваться ГКГС Т-клеткам. В контексте настоящего изобретения антиген может представлять собой продукт трансляции предложенной молекулы нуклеиновой кислоты, предпочтительно мРНК, представленной в настоящем описании. В этом контексте под антигенами подразумевают также фрагменты, варианты и производные пептидов и белков, содержащие по меньшей мере один эпитоп. В контексте настоящего изобретения наиболее предпочтительными являются опухолевые антигены и патогенные антигены.

Искусственная молекула нуклеиновой кислоты: Под искусственной молекулой нуклеиновой кислоты, как правило, понимают молекулу нуклеиновой кислоты, например, ДНК или РНК, которая не встречается в естественных условиях. Иными словами, искусственную молекулу нуклеиновой кислоты можно рассматривать как молекулу нуклеиновой кислоты, не встречающуюся в естественных условиях. Такая молекула нуклеиновой кислоты может не встречаться в естественных условиях из-за своей индивидуальной последовательности (которая не встречается в естественных условиях) и/или из-за других модификаций, например, структурных модификаций нуклеотидов, которые не встречаются в естественных условиях. Искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, молекулу РНК или гибридную молекулу, содержащую участки ДНК и РНК. Как правило, искусственные молекулы нуклеиновой кислоты можно конструировать и/или создавать методами генетической инженерии так, чтобы они соответствовали требуемой искусственной последовательности нуклеотидов (гетерологичной последовательности). В этом контексте искусственная последовательность, как правило, представляет собой последовательность, которая не может встречаться в естественных условиях, т.е. отличается от последовательности дикого типа по меньшей мере одним нуклеотидом. Можно считать, что понятие «дикий тип» относится к последовательности, встречающейся в природе. Кроме того, не следует понимать, что понятие «искусственная молекула нуклеиновой кислоты» обозначает «одну единственную молекулу», как правило, оно включает группу идентичных молекул. Следовательно, оно может относиться к множеству идентичных молекул, содержащихся в аликвоте.

Бицистронная РНК, полицистронная РНК: Бицистронная или полицистронная РНК, как правило, представляет собой РНК, предпочтительно мРНК, которая, как правило, может иметь две (бицистронная) или большее количество (полицистронная) открытых рамок считывания (ОРС). В этом контексте открытая рамка считывания представляет собой последовательность, состоящую из нескольких кодонов, которые могут транслироваться в пептид или белок.

Носитель/полимерный носитель: В контексте изобретения носитель, как правило, может представлять собой соединение, которое облегчает транспорт и/или включение в комплекс другого соединения (карго, полезный груз). Полимерный носитель, как правило, представляет собой носитель, образующий полимер. Носитель может быть связан со своим полезным грузом посредством ковалентного или нековалентного взаимодействия. Носитель может транспортировать нуклеиновые кислоты, например, РНК или ДНК, к клеткам-мишеням. Носитель может (в некоторых вариантах осуществления изобретения) представлять собой катионный компонент.

Катионный компонент: Понятие «катионный компонент», как правило, относится к заряженной молекуле, которая является положительно заряженной (катион) при значении рН, составляющем, как правило, от 1 до 9, предпочтительно при значении рН, равном или ниже 9 (например, от 5 до 9), равном или ниже 8 (например, от 5 до 8), равном или ниже 7 (например, от 5 до 7), наиболее предпочтительно при физиологическом значении рН, например, от 7,3 до 7.4. Таким образом, катионный компонент может представлять собой любое положительно заряженное соединение или полимер, предпочтительно катионный пептид или белок, который является положительно заряженным в физиологических условиях, прежде всего в физиологических условиях in vivo. «Катионный пептид или белок» может содержать по меньшей мере одну положительно заряженную аминокислоту, или более чем одну положительно заряженную аминокислоту, например, выбранную из Arg, His, Lys или Orn. Следовательно, «поликатионные» соединения также подпадают под указанное определение, если они несут более одного положительного заряда в указанных условиях.

5'-Кэп: 5'-Кэп представляет собой структуру, как правило, модифицированную нуклеотидную структуру, которая обычно «завершает» 5'-конец зрелой мРНК. 5'-кэп может, как правило, быть образован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связан с 5'-концом через 5'-5'-трифосфатную связь. 5'-кэп может быть метилирован, например, может представлять собой m7GpppN, где N обозначает концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. Другими примерами структур 5'-кэпа являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент.

Клеточный иммунитет/клеточный иммунный ответ: Клеточный иммунитет относится, как правило, к активации макрофагов, естественных клеток-киллеров (NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождению различных цитокинов в ответ на антиген. В более общем смысле клеточный иммунитет основан не на антителах, а на активации клеток иммунной системы. Как правило, клеточный иммунный ответ может характеризоваться, например, активацией антигенспецифических цитотоксических Т-лимфоцитов, которые способны индуцировать апоптоз клеток, например, специфических иммунных клеток типа дендритных клеток или других клеток, экспонирующих эпитопы чужих генов на своей поверхности. Такие клетки могут представлять собой инфицированные вирусом или инфицированные внутриклеточными бактериями, или раковые клетки, экспонирующие опухолевые антигены. Другими характеристиками могут являться активация макрофагов и естественных клеток-киллеров, позволяющая им разрушать патогены, и стимуляция клеток к секреции различных цитокинов, которые влияют на функцию других клеток, участвующих в адаптивных иммунных ответах и врожденных иммунных ответах.

ДНК: ДНК является общепринятым сокращением дезоксирибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды, как правило, представляют собой мономеры дезоксиаденозинмонофосфата, дезокситимидинмонофосфата, дезоксигуанозинмонофосфата и дезоксицитидинмонофосфата, которые сами состоят из сахарного фрагмента (дезоксирибоза), фрагмента, представляющего собой основание, и фосфатного фрагмента, и образуют полимеры с характерной каркасной структурой. Каркасная структура, как правило, образована с помощью фосфодиэфирных связей между сахарным фрагментом нуклеотида, т.е. дезоксирибозы, первого мономера и фосфатным фрагментом второго смежного мономера. Специфический порядок мономеров, т.е. порядок оснований, сцепленных с сахарным/фосфатным каркасом, называют ДНК-последовательностью. ДНК может быть одноцепочечной или двухцепочечной. В двухцепочечной форме нуклеотиды первой цепи, как правило, гибридизуются с нуклеотидами второй цепи, например, путем спаривания оснований А/Т и спаривания оснований G/C.

Эпитоп: Эпитопы (которые называют также «антигенными детерминантами») можно подразделить на Т-клеточные эпитопы и В-клеточные эпитопы. В контексте настоящего изобретения Т-клеточные эпитопы или части белков могут содержать фрагменты, предпочтительно имеющие длину от примерно 6 до примерно 20 аминокислот или даже более, например, фрагменты, процессируемые и презентируемые молекулами ГКГС класса I, предпочтительно имеют длину от примерно 8 до примерно 10 аминокислот, например, 8, 9 или 10, (или даже 11 или 12 аминокислот), или фрагменты, процессируемые и презентируемые молекулами ГКГС класса II, предпочтительно имеют длину примерно 13 аминокислот или более, например, 13, 14, 15, 16, 17, 18, 19, 20 или даже большее количество аминокислот, при этом указанные фрагменты можно выбирать из любой части аминокислотной последовательности. Указанные фрагменты, как правило, распознаются Т-клетками в форме комплекса, состоящего из пептидного фрагмента и молекулы ГКГС, т.е. фрагменты, как правило, не распознаются в их нативной форме. В-клеточные эпитопы, как правило, представляют собой фрагменты, локализованные на внешней поверхности (нативных) белковых или пептидных антигенов, указанных в настоящем описании, предпочтительно состоящих из 5-15 аминокислот, более предпочтительно состоящих из 5-12 аминокислот, еще более предпочтительно состоящих из 6-9 аминокислот, которые могут распознаваться антителами, т.е. в их нативной форме.

Такие эпитопы белков или пептидов можно, кроме того, выбирать из любых указанных вариантов таких белков или пептидов. В этом контексте антигенные детерминанты могут представлять собой конформационные или прерывистые эпитопы, состоящие из сегментов указанных в настоящем описании белков или пептидов, которые расположены с перерывами в аминокислотной последовательности белков или пептидов, указанных в настоящем описании, но которые находятся вблизи друг от друга в трехмерной структуре, или непрерывные или линейные эпитопы, состоящие из одной полипептидной цепи.

Фрагмент последовательности: фрагмент последовательности, как правило, представляет собой укороченный участок полноразмерной последовательности, например, молекулы нуклеиновой кислоты или аминокислотной последовательности. Следовательно, фрагмент, как правило, состоит из последовательности, которая идентична соответствующему сегменту полноразмерной последовательности. В контексте настоящего изобретения предпочтительный фрагмент последовательности состоит из непрерывного сегмента, содержащего такие элементы, как нуклеотиды или аминокислоты, который соответствует непрерывному состоящему из указанных элементов сегменту молекулы, из которой происходит фрагмент, длина которого составляет по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, и наиболее предпочтительно по меньшей мере 80% от всей (т.е. полноразмерной) молекулы, из которой происходит фрагмент.

G/C-модифицированная: G/C-модифицированная нуклеиновая кислота, как правило, может представлять собой нуклеиновую кислоту, предпочтительно молекулу РНК, указанную в настоящем описании, созданную на основе модифицированной последовательности дикого типа, которая содержит предпочтительно повышенное количество гуанозиновых и/или цитозиновых нуклеотидов по сравнению с последовательностью дикого типа. Для получения указанного повышенного количества можно осуществлять замену кодонов, содержащих аденозиновые или тимидиновые нуклеотиды, на кодоны, содержащие гуанозиновые или цитозиновые нуклеотиды. При повышенном содержании G/C в кодирующей области ДНК или РНК, при заменах можно использовать вырожденность генетического кода. Таким образом, замены кодонов предпочтительно не изменяют кодируемые аминокислотные остатки, но исключительно увеличивают содержание G/C в молекуле нуклеиновой кислоты.

Генная терапия: Генная терапия, как правило, может представлять собой лечение организма пациента или выделенных элементов организма пациента, например, выделенных тканей/клеток, с помощью нуклеиновых кислот, кодирующих пептид или белок. Как правило, она может включать по меньшей мере одну из следующих стадий а) введение нуклеиновой кислоты, предпочтительно молекулы РНК, указанной в настоящем описании, непосредственно пациенту - любым путем введения - либо in vitro в выделенные клетки/ткани пациента, что приводит к трансфекции клеток пациента, либо in vivo/ex vivo, либо in vitro; б) транскрипция и/или трансляция интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.

Генетическая вакцинация: Генетическая вакцинация, как правило, может представлять собой вакцинацию, осуществляемую путем введения молекулы нуклеиновой кислоты, кодирующей антиген или иммуноген или его фрагмент. Молекулу нуклеиновой кислоты можно вводить в организм индивидуума или в выделенные клетки индивидуума. После трансфекции определенных клеток организма или после трансфекции выделенных клеток антиген или иммуноген может экспрессироваться указанными клетками и затем презентоваться иммунной системе, вызывая адаптивный, т.е. антигенспецифический иммунный ответ. Таким образом, генетическая вакцинация, как правило, включает по меньшей мере одну из следующих стадий: а) введение нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании, индивидууму, предпочтительно пациенту, или в выделенные клетки индивидуума, предпочтительно пациента, что обычно приводит к трансфекции клеток индивидуума in vivo или in vitro; б) транскрипцию и/или трансляцию интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток индивидууму, предпочтительно пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.

Гетерологичная последовательность: Как правило, считается, что две последовательности являются «гетерологичными», если они не происходят из одного и того же гена. Это означает, что, хотя гетерологичные последовательности могут происходить из одного и того же организма, они в естественных условиях (в природе) не встречаются в одной и той же молекуле, например, в одной и той же мРНК.

Гуморальный иммунитет/гуморальный иммунный ответ: Гуморальный иммунитет, как правило, относится к производству антител и необязательно к второстепенным процессам, которые могут сопровождать его. Гуморальный иммунный ответ, как правило, может характеризоваться, например, активацией Th2 и производством цитокинов, образованием зародышевого центра и переключением изотипа, созреванием аффинности и образованием клеток памяти. Гуморальный иммунитет, как правило, может относиться также к эффекторным функциям антител, включая нейтрализацию патогенов и токсинов, классическую активацию комплемента и стимулирование опсонинами фагоцитоза и элиминации патогенов.

Иммуноген: В контексте настоящего изобретения под иммуногеном, как правило, понимают соединение, которое обладает способностью стимулировать иммунный ответ. Предпочтительно иммуноген представляет собой пептид, полипептид или белок. В наиболее предпочтительном варианте осуществления изобретения иммуноген в контексте настоящего изобретения представляет собой продукт трансляции применяемой молекулы нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании. Как правило, иммуноген вызывает по меньшей мере адаптивный иммунный ответ.

Иммуностимулирующая композиция: В контексте изобретения иммуностимулирующая композиция, как правило, может представлять собой композицию, содержащую по меньшей мере один компонент, который обладает способностью индуцировать иммунный ответ или из которого может происходить компонент, обладающий способностью индуцировать иммунный ответ. Такой иммунный ответ предпочтительно может представлять собой врожденный иммунный ответ или комбинацию адаптивного и врожденного иммунного ответа. В контексте настоящего описания иммуностимулирующая композиция предпочтительно содержит по меньшей мере одну искусственную молекулу нуклеиновой кислоты, более предпочтительно РНК, например, молекулу мРНК. Иммуностимулирующий компонент, такой как мРНК, может находиться в составе комплекса с пригодным носителем. Таким образом, иммуностимулирующая композиция может содержать комплекс мРНК/носитель. Кроме того, иммуностимулирующая композиция может содержать адъювант и/или пригодный наполнитель для иммуностимулирующего компонента, такого как мРНК.

Иммунный ответ: Иммунный ответ может, как правило, представлять собой либо специфическую реакцию адаптивной иммунной системы на конкретный антиген (так называемый специфический или адаптивный иммунный ответ), либо неспецифическую реакцию врожденной иммунной системы (так называемый неспецифический или врожденный иммунный ответ).

Иммунная система: Иммунная система может защищать организмы от инфекции. Если патогену удалось преодолеть физический барьер организма и попасть в указанный организм, то врожденная иммунная система обеспечивает немедленный, но неспецифический ответ. Если патоген ускользает от этого врожденного ответа, у позвоночных имеется второй уровень защиты, представляющий собой адаптивную иммунную систему. В этом случае иммунная система адаптирует свой ответ в процессе инфекции для улучшения распознавания патогена. Затем этот улучшенный ответ сохраняется после элиминации патогена в форме иммунологической памяти и позволяет адаптивной иммунной системе организовывать более быстрые и сильные атаки каждый раз при проникновении указанного патогена. Таким образом, иммунная система включает врожденную и адаптивную иммунную систему. Каждая из этих двух частей, как правило, включает так называемые гуморальный и клеточный компоненты.

Иммуностимулирующая РНК: Иммуностимулирующая РНК (isPHK) в контексте изобретения, как правило, может представлять собой РНК, которая обладает способностью индуцировать врожденный иммунный ответ. Обычно она не имеет открытой рамки считывания и, таким образом, не кодирует пептид-антиген или иммуноген, но вызывает иммунный ответ, например, посредством связывания со специфическим типом Толл-подобного рецептора (TLR) или другими приемлемыми рецепторами. Однако, естественно, также и мРНК, имеющие открытую рамку считывания и кодирующие пептид/белок, могут индуцировать врожденный иммунный ответ и, следовательно, могут являться иммуностимулирующими РНК.

Врожденная иммунная система: Врожденная иммунная система, которую называют также неспецифической иммунной системой, как правило, включает клетки и механизмы, которые неспецифически защищают хозяина от заражения другими организмами. Это означает, что клетки врожденной системы могут распознавать патогены и реагировать на них обычным путем, но, в отличие от адаптивной иммунной системы, она не обеспечивает долговременный или защитный иммунитет хозяину. Врожденная иммунная система может, например, активироваться лигандами патоген-ассоциированных распознающих молекулярные паттерны (РАМР) рецепторов, например, Толл-подобных рецепторов (TLR), или другими вспомогательными субстанциями, такими как липополисахариды, TNF-альфа, лиганд CD40 или цитокины, монокины, лимфокины, интерлейкины или хемокины, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-альфа, IFN-бета, IFN-гамма, GM-CSF, G-CSF, M-CSF, LT-бета, TNF-альфа, факторы роста и hGH, лиганд человеческого Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, лиганд мышиного Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 или TLR13, лиганд NOD-подобного рецептора, лиганд RIG-I-подобного рецептора, иммуностимулирующая нуклеиновая кислота, иммуностимулирующая РНК (isPHK), CpG-ДНК, антибактериальный агент или противовирусный агент. Как правило, ответ врожденной иммунной системы включает рекрутинг иммунных клеток к областям заражения посредством производства химических факторов, включая специализированные химические медиаторы, которые называют цитокинами; активацию каскада комплемента; идентификацию и удаление чужих субстанций, присутствующих в органах, тканях, крови и лимфе, специализированными лейкоцитами; активацию адаптивной иммунной системы посредством процесса, известного как презентация антигена; и/или функционирование в качестве физического и химического барьера для инфекционных агентов.

Сайт клонирования: Под сайтом клонирования, как правило, понимают сегмент молекулы нуклеиновой кислоты, пригодный для встраивания нуклеотидной последовательности, например, нуклеотидной последовательности, содержащей открытую рамку считывания. Встраивание можно осуществлять с помощью любого метода молекулярной биологии, известного специалисту в данной области, например, посредством рестрикции и лигирования. Сайт клонирования, как правило, содержит один или несколько сайтов, распознаваемых рестриктазами (сайты рестрикции). Указанные один или несколько сайтов рестрикции могут распознаваться рестриктазами, расщепляющими ДНК в этих сайтах. Сайт клонирования, который содержит более одного сайта рестрикции, можно обозначать также как множественный сайт клонирования (MCS) или полилинкер.

Молекула нуклеиновой кислоты: Молекула нуклеиновой кислоты представляет собой молекулу, которая содержит, предпочтительно состоит из компонентов нуклеиновой кислоты. Понятие «молекула нуклеиновой кислоты» предпочтительно относится к молекулам ДНК или РНК. Его предпочтительно применяют в качестве синонима понятия «полинуклеотид». Предпочтительно молекула нуклеиновой кислоты представляет собой полимер, содержащий или состоящий из нуклеотидных мономеров, которые ковалентно связаны друг с другом фосфодиэфирными связями сахарного/фосфатного каркаса. Понятие «нуклеиновая кислота» включает также модифицированные молекулы нуклеиновой кислоты, такие как молекулы ДНК или РНК с модифицированным основанием, модифицированным сахарным фрагментом или модифицированным каркасом.

Открытая рамка считывания: Открытая рамка считывания (ОРС) в контексте изобретения, как правило, может представлять собой состоящую из нескольких нуклеотидных триплетов последовательность, которая может транслироваться в пептид или белок. Открытая рамка считывания предпочтительно содержит на своем 5'-конце стартовый кодон, т.е. комбинацию трех последовательно расположенных нуклеотидов, кодирующих, как правило, аминокислоту метионин (ATG или AUG), и следующую за ним область, длина которой, как правило, кратна 3 нуклеотидам. ОРС предпочтительно оканчивается стоп-кодоном (например, ТАА, TAG, TGA). Как правило, в открытой рамке считывания присутствует только один стоп-кодон. Таким образом, открытая рамка считывания в контексте настоящего изобретения предпочтительно представляет собой нуклеотидную последовательность, состоящую из кратного трем количества нуклеотидов, которая начинается стартовым кодоном (например, ATG или AUG), и которая предпочтительно заканчивается стоп-кодоном (например, ТАА, TGA или TAG, или UAA, UAG, UGA соответственно). Открытая рамка считывания может быть выделена или она может быть встроена в более длинную нуклеотидную последовательность, например, в вектор или мРНК. Открытую рамку считывания можно называть также «кодирующей белок областью».

Пептид: Пептид или полипептид, как правило, представляет собой полимер, состоящий из аминокислотных мономеров, связанных пептидными связями. Он, как правило, содержит менее 50 мономерных звеньев. Однако понятие «пептид» не исключает молекулы, имеющие более 50 мономерных звеньев. Длинные пептиды называют также полипептидами, как правило, они имеют от 50 до 600 мономерных звеньев.

Фармацевтически эффективное количество: В контексте изобретения под фармацевтически эффективным количеством, как правило, понимают количество, достаточное для того, чтобы индуцировать фармацевтическое действие, такое как иммунный ответ, измененный патологический уровень экспрессируемого пептида или белка, или замену недостающего генного продукта, например, в случае наличия патологической ситуации.

Белок: Белок, как правило, содержит один или несколько пептидов или полипептидов. Белок, как правило, уложен с образованием 3-мерной структуры, которая может требоваться для проявления биологической функции белка.

Поли(А)-последовательность: Поли(А)-последовательность, которую называют также поли(А)-хвостом или 3'-поли(А)-хвостом, как правило, представляет собой последовательность адениновых нуклеотидов, содержащую, например, вплоть до примерно 400 аденозиновых нуклеотидов, например, от примерно 25 до примерно 400, предпочтительно от примерно 50 до примерно 400, более предпочтительно от примерно 50 до примерно 300, еще более предпочтительно от примерно 50 до примерно 250, наиболее предпочтительно от примерно 60 до примерно 250 аденозиновых нуклеотидов. Поли(А)-последовательность, как правило, локализована на 3'-конце мРНК. В контексте настоящего изобретения поли(А)-последовательность может быть локализована внутри мРНК или любой другой молекулы нуклеиновой кислоты, например, внутри вектора, например, вектора, служащего в качестве матрицы для создания РНК, предпочтительно мРНК, например, при транскрипции вектора.

Полиаденилирование: Под полиаденилированием, как правило, понимают добавление поли(А)-последовательности к молекуле нуклеиновой кислоты, такой как молекула РНК, например, незрелая мРНК. Полиаденилирование может индуцироваться так называемым сигналом полиаденилирования. Указанный сигнал предпочтительно локализован в сегменте нуклеотидов на 3'-конце молекулы нуклеиновой кислоты, такой как молекула РНК, подлежащая полиаденилированию. Сигнал полиаденилирования, как правило, содержит гексамер, состоящий из адениновых и/или урациловых/тиминовых нуклеотидов, предпочтительно последовательность гексамера AAUAAA. Также возможны другие последовательности, предпочтительно гексамерные последовательности. Полиаденилирование, как правило, имеет место во время процессинга пре-мРНК (которую называют также незрелой мРНК). Как правило, созревание РНК (превращение пре-мРНК в зрелую мРНК) включает стадию полиаденилирования.

Сайт рестрикции: Сайт рестрикции, который называют также как сайт, распознаваемый рестриктазой, представляет собой нуклеотидную последовательность, распознаваемую рестрктазой. Сайт рестрикции, как правило, представляет собой короткую, предпочтительно палиндромную нуклеотидную последовательность, например, последовательность, содержащую от 4 до 8 нуклеотидов. Сайт рестрикции предпочтительно специфически распознается рестриктазой. Рестриктаза, как правило, расщепляет нуклеотидную последовательность, содержащую сайт рестрикции, в этом сайте. В двухцепочечной нуклеотидной последовательности, такой как двухцепочечная последовательность ДНК, рестриктаза, как правило, расщепляет обе цепи нуклеотидной последовательности.

РНК, мРНК: РНК является общепринятым сокращением для рибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды представляют собой, как правило, мономеры аденозинмонофосфата, уридинмонофосфата, гуанозинмонофосфата и цитидинмонофосфата, соединенные друг с другом вдоль так называемого каркаса. Каркас формируется с помощью фосфодиэфирных связей между сахаром, т.е. рибозой, первого мономера и фосфатным фрагментом второго смежного мономера. Конкретную последовательность мономеров называют РНК-последовательностью. Как правило, РНК можно получать путем транскрипции ДНК-последовательности, например, внутри клетки. В эукариотических клетках транскрипция, как правило, происходит в ядре или в митохондрии. In vivo транскрипция ДНК, как правило, приводит к образованию так называемой незрелой РНК, которая в результате процессинга должна превратиться в так называемую матричную (информационную) РНК, которую сокращенно обозначают как мРНК. Процессинг незрелой РНК, например, в эукариотических организмах, включает ряд различных пост-транскрипционных модификаций, таких как сплайсинг, 5'-кэпирование, полиаденилирование, экспорт из ядра или митохондрии и т.п. Совокупность указанных процессов называют также созреванием РНК. Зрелая матричная РНК, как правило, представляет собой нуклеотидную последовательность, которая может транслироваться в аминокислотную последовательность конкретного пептида или белка. Как правило, зрелая мРНК содержит 5'-кэп, 5'UTR, открытую рамку считывания, необязательно 3'UTR и поли(А)-последовательность. Помимо матричной РНК существует несколько некодирующих типов РНК, которые могут участвовать в регуляции транскрипции и/или трансляции.

Последовательность молекулы нуклеиновой кислоты: Под последовательностью молекулы нуклеиновой кислоты, как правило, понимают конкретный и индивидуальный порядок расположения, т.е. последовательный ряд входящих в нее нуклеотидов. Под последовательностью белка или пептида, как правило, понимают порядок расположения, т.е. последовательный ряд входящих в него аминокислот.

Идентичность последовательности: Две или большее количество последовательностей являются идентичными, если они имеют одинаковую длину и порядок расположения нуклеотидов или аминокислот. Процент идентичности, как правило, характеризует степень идентичности двух последовательностей, т.е. он, как правило, характеризует процент нуклеотидов, которые соответствуют по своему положению идентичным нуклеотидам референс-последовательности. При определении степени идентичности считается, что подлежащие сравнению последовательности имеют одну и ту же длину, т.е. длину наиболее длинной последовательности из подлежащих сравнению последовательностей. Это означает, что первая последовательность, состоящая из 8 нуклеотидов, идентична на 80% второй последовательности, состоящей из 10 нуклеотидов, которая содержит первую последовательность. Другими словами, в контексте настоящего изобретения идентичность последовательностей предпочтительно относится к проценту нуклеотидов в последовательности, которые находятся в одних и тех же положениях в двух или большем количестве последовательностей, имеющих одинаковую длину. При сравнительном анализе первичной структуры последовательностей бреши обычно рассматривают как неидентичные положения безотносительно к их действительному положению.

Стабилизированная молекула нуклеиновой кислоты: Стабилизированная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, предпочтительно молекулу ДНК или РНК, модифицированную таким образом, чтобы она обладала большей стабильностью к расщеплению или разрушению, например, факторами окружающей среды, или ферментативному расщеплению, такому как расщепление экзо- или эндонуклеазами, чем молекула нуклеиновой кислоты без модификации. Предпочтительно стабилизированная молекула нуклеиновой кислоты в контексте настоящего изобретения является стабилизированной в клетке, такой как прокариотическая или эукариотическая клетка, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Стабилизирующее действие можно оказывать также вне клеток, например, в буферном растворе и т.д., например, в процессе производства фармацевтической композиции, которая содержит стабилизированную молекулу нуклеиновой кислоты.

Трансфекция: Понятие «трансфекция» относится к интродукции молекул нуклеиновой кислоты, таких как молекулы ДНК или РНК (например, мРНК), в клетки, предпочтительно в эукариотические клетки. В контексте настоящего изобретения под понятие «трансфекция» подпадает любой известный специалисту в данной области метод интродукции молекул нуклеиновой кислоты в клетки, предпочтительно в эукариотические клетки, такие как клетки млекопитающих. Такие методы включают, например, электропорацию, липофекцию, например, на основе катионных липидов и/или липосом, осаждение фосфатом кальция, трансфекцию на основе наночастиц, трансфекцию на основе вирусов или трансфекцию на основе катионных полимеров, таких как ДЭАЭ-декстран или полиэтиленимин, и т.д. Предпочтительно интродукцию осуществляют без использования вирусов.

Вакцина: Под вакциной, как правило, понимают предназначенный для профилактики или терапии продукт, содержащий по меньшей мере один антиген, предпочтительно иммуноген. Антиген или иммуноген может иметь происхождение из любого материала, пригодного для вакцинации. Например, антиген или иммуноген может происходить из патогена, такого как бактерии или вирусные частицы и т.д., или из опухолевой или раковой ткани. Антиген или иммуноген стимулирует адаптивную иммунную систему организма вырабатывать адаптивный иммунный ответ.

Вектор: Понятие «вектор» относится к молекуле нуклеиновой кислоты, предпочтительно к искусственной молекуле нуклеиновой кислоты. В контексте настоящего изобретения вектор можно применять для встраивания или хранения требуемой нуклеотидной последовательности, такой как нуклеотидная последовательность, содержащая открытую рамку считывания. Таким векторы могут представлять собой векторы для хранения, экспрессионные векторы, клонирующие векторы, векторы для переноса и т.д. Вектор для хранения представляет собой вектор, который позволяет удобно хранить молекулу нуклеиновой кислоты, например, молекулу мРНК. Так, вектор может содержать последовательность, соответствующую, например, требуемой последовательности мРНК или ее части, такой как последовательность, соответствующая открытой рамке считывания и 3'-UTR мРНК. Экспрессионный вектор можно применять для производства продуктов экспрессии, таких как РНК, например, мРНК, или пептиды, полипептиды или белки. Например, экспрессионный вектор может содержать последовательности, необходимые для транскрипции сегмента последовательности вектора, такой как промоторная последовательность, например, промоторная последовательность РНК-полимеразы. Клонирующий вектор, как правило, представляет собой вектор, который содержит сайт клонирования, который можно применять для встраивания нуклеотидных последовательностей в вектор. Клонирующий вектор может представлять собой, например, плазмидный вектор или вектор на основе бактериофага. Вектор для переноса может представлять собой вектор, который пригоден для переноса молекул нуклеиновой кислоты в клетки или организмы, например, вирусные векторы. В контексте настоящего изобретения вектор может представлять собой, например, РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой молекулу ДНК. В контексте настоящего описания предпочтительно вектор содержит сайт клонирования, маркер для селекции, такой как фактор, обусловливающий устойчивость к антибиотикам, и последовательность, пригодную для размножения вектора, такую как сайт инициации репликации. В контексте настоящего описания предпочтительно вектор представляет собой плазмидный вектор.

Наполнитель: Под наполнителем, как правило, понимают материал, пригодный для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение. Он может представлять собой, например, физиологически приемлемую жидкость, пригодную для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение.

3'-нетранслируемая область (3'UTR): 3'UTR, как правило, является частью искусственной молекулы нуклеиновой кислоты, которая локализована с 3'-стороны (т.е. в прямом направлении) относительно открытой рамки считывания и которая не транслируется в белок. Как правило, 3'UTR представляет собой часть мРНК, которая локализована между кодирующей белок областью (открытой рамкой считывания (ОРС) или кодирующей последовательностью (CDS)) и поли(А)-последовательностью мРНК. В контексте изобретения понятие «3'UTR» может включать также элементы, которые не кодируются в матрице, с которой транскрибируется РНК, но которые добавляются после транскрипции в процессе созревания, например, поли(А)-последовательность. 3'UTR мРНК не транслируется в аминокислотную последовательность. Последовательность 3'UTR, как правило, кодируется геном, который транскрибируется в соответствующую мРНК в процессе экспрессии гена. Геномная последовательность сначала транскрибируется в незрелую мРНК, которая содержит необязательные интроны. Незрелая мРНК затем дополнительно процессируется с образованием зрелой мРНК в процессе созревания. Указанный процесс созревания включает стадии 5'-кэпирования, сплайсинга незрелой мРНК с вырезанием необязательных интронов и модификаций 3'-конца, таких как полиаденилирование 3'-конца незрелой мРНК, и необязательные расщепления эндо-/или экзонуклеазами и т.д. В контексте настоящего изобретения 3'UTR соответствует последовательности зрелой мРНК, которая локализована между стоп-кодоном кодирующей области белка, предпочтительно непосредственно примыкает с 3'-стороны к стоп-кодону кодирующей белок области, и поли(А)-последовательностью мРНК. Понятие «соответствует» означает, что последовательность 3'UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной в определении последовательности 3'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «3'UTR гена», например, «3'UTR гена рибосомального белка», означает последовательность, которая соответствует 3'UTR зрелой мРНК, полученной из указанного гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «3'UTR гена» включает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую цепи и как зрелые, так и незрелые последовательности) 3'UTR.

5'-нетранслируемая область (5'UTR): Под 5'UTR, как правило, понимают конкретный сегмент матричной РНК (мРНК). Она локализована с 5'-стороны относительно открытой рамки считывания мРНК. Как правило, 5'UTR начинается с сайта инициации транскрипции и заканчивается за один нуклеотид до стартового кодона открытой рамки считывания. 5'UTR может содержать элементы, предназначенные для контроля генной экспрессии, так называемые регуляторные элементы. Указанные регуляторные элементы могут представлять собой, например, сайты связывания рибосом. 5'UTR может подвергаться посттранскрипционным модификациям, например, путем добавления 5'-кэпа. В контексте настоящего изобретения 5'UTR соответствует последовательности зрелой мРНК, локализованной между 5'-кэпом и стартовым кодоном. Предпочтительно 5'UTR соответствует последовательности, которая простирается от нуклеотида, расположенного с 3'-стороны 5'-кэпа, предпочтительно от расположенного с 3'-стороны нуклеотида, непосредственно примыкающего к 5'-кэпу, до нуклеотида, расположенного с 5'-стороны стартового кодона кодирующей белок области, предпочтительно до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону кодирующей белок области. Нуклеотид, непосредственно примыкающий с 3'-стороны к 5'-кэпу зрелой мРНК, как правило, соответствует сайту инициации транскрипции. Понятие «соответствует» означает, что последовательность 5'UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной при определении последовательности 5'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «5'UTR гена», например, «5'UTR ТОР-гена», обозначает последовательность, которая соответствует 5'UTR зрелой мРНК, полученной из этого гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «5'UTR гена» включает последовательность ДНК и последовательность РНК 5'UTR. В вариантах осуществления изобретения указанная 5'-UTR может находиться на 5'-конце ОРС. Ее длина, как правило, составляет менее 500, 400, 300, 250 или менее 200 нуклеотидов. В других вариантах осуществления изобретения ее длина может находиться в пределах по меньшей мере от 10, 20, 30 или 40, предпочтительно вплоть до 100 или 150 нуклеотидов.

5'-концевой олигопиримидиновый тракт (ТОР): 5'-концевой олигопиримидиновый тракт (ТОР), как правило, обозначает сегмент пиримидиновых нуклеотидов, локализованный в 5'-концевой области молекулы нуклеиновой кислоты, например, в 5'-концевой области некоторых молекул мРНК или в 5'-концевой области функционального элемента, например, транскрибируемой области некоторых генов. Последовательность начинается с цитидина, который, как правило, соответствует сайту инициации транскрипции, и за которым следует сегмент, как правило, состоящий примерно из 3-30 пиримидиновых нуклеотидов. Например, ТОР может содержать 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или даже большее количество нуклеотидов. Пиримидиновый сегмент и, следовательно, 5'-ТОР, заканчивается одним нуклеотидом, расположенным в 5'-направлении относительно первого пуринового нуклеотида, локализованного в прямом направлении относительно ТОР. Матричную РНК, которая содержит 5'-концевой олигопиримидиновый тракт, часто обозначают как ТОР-мРНК. Таким образом, гены, из которых получают указанные матричные РНК, обозначают как ТОР-гены. Последовательности ТОР, например, обнаружены в генах и мРНК, кодирующих пептидные факторы элонгации и рибосомальные белки.

ТОР-мотив: В контексте настоящего изобретения ТОР-мотив обозначает нуклеотидную последовательность, которая соответствует 5'-ТОР, описанному выше. Таким образом, ТОР-мотив в контексте настоящего изобретения предпочтительно обозначает состоящий из пиримидиновых нуклеотидов сегмент длиной 3-30 нуклеотидов. Предпочтительно ТОР-мотив состоит по меньшей мере из 3 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 4 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 5 пиримидиновых нуклеотидов, более предпочтительно по меньшей мере 6 нуклеотидов, более предпочтительно по меньшей мере 7 нуклеотидов, наиболее предпочтительно по меньшей мере 8 пиримидиновых нуклеотидов, при этом сегмент пиримидиновых нуклеотидов предпочтительно начинается на его 5'-конце с цитозинового нуклеотида. В ТОР-генах и ТОР-мРНК ТОР-мотив предпочтительно начинается на его 5'-конце с сайта инициации транскрипции и заканчивается на расстоянии одного нуклеотида в 5'-направлении относительно первого пуринового остатка в указанном гене или мРНК. В контексте настоящего изобретения ТОР-мотив предпочтительно локализован на 5'-конце последовательности, которая представляет собой 5'UTR, или на 5'-конце последовательности, которая кодирует 5'UTR. Таким образом, в контексте настоящего изобретения сегмент из 3 или большего количества пиримидиновых нуклеотидов предпочтительно называют «ТОР-мотивом», если сегмент локализован на 5'-конце соответствующей последовательности, такой как мРНК, предлагаемая в изобретении, 5'UTR-элeмeнт мРНК, предлагаемой в изобретении, или нуклеотидная последовательность, которая происходит из 5'UTR ТОР-гена, указанного в настоящем описании. Другими словами, сегмент, состоящий из 3 или большего количества пиримидиновых нуклеотидов, который не локализован на 5'-конце 5'UTR или 5'UTR-элемента, но локализован где-либо внутри 5'UTR или 5'UTR-элемента, предпочтительно не обозначают как «ТОР-мотив».

ТОР-ген: ТОР-гены, как правило, характеризуются присутствием 5'-концевого олигопримидинового тракта. Кроме того, большинство ТОР-генов характеризуются связанной с ростом регуляцией трансляции. Однако известны также ТОР-гены с тканеспецифической регуляцией трансляции. Как указано выше, 5'UTR ТОР-гена соответствует последовательности 5'UTR зрелой мРНК, происходящей из ТОР-гена, которая предпочтительно простирается от нуклеотида, примыкающего с 3'-стороны к 5'-кэпу, до нуклеотида, примыкающего с 5'-стороны к стартовому кодону. 5'UTR ТОР-гена, как правило, не содержит никаких стартовых кодонов, предпочтительно не содержит расположенных в обратном направлении AUG (uAUG) или расположенных в обратном направлении открытых рамок считывания (иОРС). В данном контексте под расположенными в обратном направлении AUG и расположенными в обратном направлении открытыми рамками считывания, как правило, понимают AUG и открытые рамки считывания, которые находятся в 5'-направлении относительно стартового кодона (AUG) открытой рамки считывания, которая должна транслироваться. 5'UTR ТОР-генов, как правило, являются относительно короткими. Длины 5'UTR ТОР-генов могут варьироваться от 20 нуклеотидов вплоть до 500 нуклеотидов и, как правило, они содержат менее чем примерно 200 нуклеотидов, предпочтительно менее чем примерно 150 нуклеотидов, более предпочтительно менее чем примерно 100 нуклеотидов. Примерами 5'UTR ТОР-генов в контексте настоящего изобретения являются нуклеотидные последовательности, простирающиеся от нуклеотида в положении 5 до нуклеотида, непосредственно примыкающего к 5'-концу стартового кодона (например, ATG), указанные последовательности представлены в SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 14221-1363 заявки на патент PCT/EP 2012/002448 WO 2013/143700 или представляют собой их гомологи или варианты, описание указанных документов включено в настоящее описание в качестве ссылки. В этом контексте наиболее предпочтительным фрагментом 5'UTR ТОР-гена является 5'UTR ТОР-гена без 5'ТОР-мотива. Понятие «5'UTR ТОР-гена» предпочтительно относится к 5'UTR встречающегося в естественных условиях ТОР-гена.

Первый объект настоящего изобретения относится к искусственной молекуле нуклеиновой кислоты, содержащей

а. по меньшей мере одну открытую рамку считывания (ОРС); и

б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), содержащий или состоящий из нуклеотидной последовательности, которая происходит из 3'-UTR гена рибосомального белка.

Понятие «3'-UTR-элeмeнт» относится к нуклеотидной последовательности, которая содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR или из варианта 3'-UTR. Понятие «3'-UTR-элeмeнт» предпочтительно относится к нуклеотидной последовательности, которая представляет собой 3'-UTR искусственной нуклеотидной последовательности, такой как искусственная мРНК, или которая кодирует 3'-UTR искусственной молекулы нуклеиновой кислоты. Следовательно, в контексте настоящего изобретения 3'-UTR-элeмeнт предпочтительно может представлять собой 3'-UTR мРНК, предпочтительно искусственной мРНК, или может представлять собой матрицу для транскрипции 3'-UTR мРНК. Так, 3'-UTR-элeмeнт предпочтительно представляет собой нуклеотидную последовательность, которая соответствует 3'-UTR мРНК, предпочтительно 3'-UTR искусственной мРНК, такой как мРНК, полученная в результате транскрипции созданной генетическими методами векторной конструкции. Предпочтительно 3'-UTR-элемент в контексте настоящего изобретения функционирует в качестве 3'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 3'-UTR.

Понятие «ген рибосомального белка», как правило, относится к гену, кодирующему рибосомальный белок. В контексте настоящего описания это понятие относится к любому гену рибосомального белка независимо от вида, из которого он происходит. Конкретно, понятие относится к гену эукариотического рибосомального белка. Кроме того, в контексте изобретения понятие «ген рибосомального белка» может относиться также к гену, сходному с геном рибосомального белка либо с точки зрения структуры, либо с точки зрения функции. В частности, понятие включает «подобные гену рибосомального белка», псевдогены и гены, обладающие характеристиками последовательности или структуры, прежде всего в их 3'-UTR-oблacти, присущими гену рибосомального белка. Предпочтительно понятие относится к гену рибосомального белка позвоночных, более предпочтительно к гену рибосомального белка млекопитающих, еще более предпочтительно к гену рибосомального белка приматов, прежде всего к гену рибосомального белка человека. Кроме того, понятие «ген рибосомального белка» включает также ген рибосомального белка грызунов, прежде всего ген мышиного рибосомального белка. Примерами генов рибосомального белка в контексте изобретения являются (но, не ограничиваясь только ими) гены рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка большой субъединицы, Р0 (RPLP0), рибосомального белка большой субъединицы, Р1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка L10a (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA), продукта 1 слияния: остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемому гену (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли (FBR-MuSV), гену рибосомального белка L22-подобного 1 (RPL22L1), рибосомального белка S17 (RPS17), рибосомального белка L39-подобного (RPL39L), рибосомального белка L10-подобного (RPL10L), рибосомального белка L36а-подобного (RPL36AL), рибосомального белка L3-подобного (RPL3L), рибосомального белка S27-подобного (RPS27L), рибосомального белка L26-подобного 1 (RPL26L1), рибосомального белка L7-подобного 1 (RPL7L1), псевдогена рибосомального белка L13a (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена рибосомального белка 11 S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка большой субъединицы Р0 (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14). Предпочтительно понятие «ген рибосомального белка» относится к одному из вышеуказанных генов, которые происходят из млекопитающих, предпочтительно из Homo sapiens или Mus muscuius.

Предпочтительно по меньшей мере одна открытая рамка считывания и по меньше мере один 3'-UTR-элемент являются гетерологичными. В контексте настоящего описания понятие «гетерологичный» означает, что два элемента последовательности, содержащиеся в искусственной молекуле нуклеиновой кислоты, такие как открытая рамка считывания и 3'-UTR-элeмeнт, не встречаются в естественных условиях (в природе) в рассматриваемой комбинации. Предпочтительно 3'-UTR-элeмeнт происходит из гена, отличного от гена, из которого происходит открытая рамка считывания. Например, ОРС может происходить из гена, отличного от гена, из которого происходит 3'-UTR-элемент, например, кодирующего другой белок или такой же белок, но из другого вида, и т.д. Предпочтительно открытая рамка считывания не кодирует рибосомальный белок. В предпочтительном варианте осуществления изобретения ОРС не кодирует человеческий рибосомальный белок или растительный рибосомальный белок (прежде всего, из Arabidopsis), прежде всего человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 Arabidopsis (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16).

В конкретных вариантах осуществления изобретения предпочтительно открытая рамка считывания не кодирует репортерный белок, например, выбранный из группы, состоящей из глобиновых белков (прежде всего, бета-глобина), белка люциферазы, белков GFP или их вариантов, например, вариантов, последовательности которых идентичны по меньшей мере на 70% последовательности белка глобина, белка люциферазы или белка GFP. В наиболее предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует репортерный ген или не происходит из репортерного гена, где репортерный ген предпочтительно не выбирают из группы, состоящей из (генов) глобиновых белков (прежде всего бета-глобина), белка люциферазы, бета-глюкуронидазы (GUS) и белков GFP или их вариантов, предпочтительно не выбирают из EGFP или из вариантов любого из вышеуказанных генов, последовательности которых, как правило, идентичны по меньшей мере на 70% последовательности любого из вышеуказанных репортерных генов, предпочтительно генов белка глобина, белка люциферазы или белка GFP.

Еще более предпочтительно 3'-UTR-элемент является гетерологичным любому другому элементу, содержащемуся в искусственной нуклеиновой кислоте, представленной в настоящем описании. Например, если искусственная нуклеиновая кислота, предлагаемая в изобретении, содержит 3'-UTR-элемент из рассматриваемого гена, то она предпочтительно не содержит никакой другой нуклеотидной последовательности, прежде всего никакой функциональной нуклеотидной последовательности (например, элемента кодирующей или регуляторной последовательности) из этого же гена, включая его регуляторные последовательности на 5'- и 3'-конце ОРС гена. В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит ОРС, 3'UTR и 5'-UTR, которые все являются гетерологичными друг другу, например, они являются рекомбинантными, поскольку каждый из указанных элементов происходит из различных генов (и их 5'- и 3'-UTR). В другом предпочтительном варианте осуществления изобретения 3'-UTR не происходит из 3'-UTR вирусного гена или происходит не из вируса.

Предпочтительно по меньшей мере один 3'-UTR-элeмeнт функционально связан с ОРС. Это означает, что предпочтительно 3'-UTR-элeмeнт ассоциирован с ОРС таким образом, что он может осуществлять функцию, такую как функция повышения или стабилизации экспрессии кодируемого пептида или белка, или функцию стабилизации искусственной молекулы нуклеиновой кислоты. Предпочтительно ОРС и 3'-UTR-элемент ассоциированы в направлении 5'→3'. Таким образом, предпочтительно искусственная молекула нуклеиновой кислоты содержит структуру 5'-ОРС-(необязательно)-линкер-3'-UTR-элемент-3', в которой линкер может присутствовать или отсутствовать. Например, линкер может состоять из одного или нескольких нуклеотидов, например, представлять собой сегмент, состоящий из 1-50 или 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов, распознаваемых рестриктазами (сайтов рестрикции).

Предпочтительно по меньшей мере один 3'-UTR-элемент содержит нуклеотидную последовательность, происходящую из 3'-UTR гена эукариотического рибосомального белка, предпочтительно из 3'-UTR гена рибосомального белка позвоночных, более предпочтительно из 3'-UTR гена рибосомального белка млекопитающих, еще более предпочтительно из 3'-UTR гена рибосомального белка приматов, прежде всего гена рибосомального белка человека, или из 3'-UTR гена рибосомального белка грызунов, прежде всего гена мышиного рибосомального белка.

В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элeмeнт содержит или соответствует нуклеотидной последовательности, которая происходит из последовательности 3'-UTR транскрипта, выбранного из группы, состоящей из NM_000661.4, NM_001024921.2, NM_000967.3, NM_001033853.1, NM_000968.3, NM_000969.3, NM_001024662.1, NM_000970.3, NM_000971.3, NM_000972.2, NM_000975.3, NM_001199802.1, NM_000976.3, NM_000977.3, NM_033251.2, NM_001243130.1, NM_001243131, NM_000978.3, NM_000979.3, NM_001270490.1, NM_000980.3, NM_000981.3, NM_000982.3, NM_000983.3, NM_000984.5, NM_000985.4, NM_001035006.2, NM_001199340.1, NM_001199341.1, NM_001199342.1, NM_001199343.1, NM_001199344.1, NM_001199345.1, NM_000986.3, NM_000987.3, NM_000988.3, NM_000989.3, NM_000990.4, NM_001136134.1, NM_000991.4, NM_001136135.1, NM_001136136.1, NM_001136137.1, NM_000992.2, NM_000993.4, NM_001098577.2, NM_001099693.1, NM_000994.3, NM_001007073.1, NM_001007074.1, NM_000996.2, NM_000997.4, NM_000998.4, NM_000999.3, NM_001035258.1, NM_001000.3, NM_001002.3, NM_053275.3, NM_001003.2, NM_213725.1, NM_001004.3, NM_001005.4, NM_001256802.1, NM_001260506.1, NM_001260507.1, NM_001006.4, NM_001267699.1, NM_001007.4, NM_001008.3, NM_001009.3, NM_001010.2, NM_001011.3, NM_001012.1, NM_001013.3, NM_001203245.2, NM_001014.4, NM_001204091.1, NM_001015.4, NM_001016.3, NM_001017.2, NM_001018.3, NM_001030009.1, NM_001019.4, NM_001020.4, NM_001022.3, NM_001146227.1, NM_001023.3, NM_001024.3, NM_001025.4, NM_001028.2, NM_001029.3, NM_001030.4, NM_002954, NM_001135592.2, NM_001177413.1, NM_001031.4, NM_001032.4, NM_001030001.2, NM_002948.3, NM_001253379.1, NM_001253380.1, NM_001253382.1, NM_001253383.1, NM_001253384.1, NM_002952.3, NM_001034996.2, NM_001025071.1, NM_001025070.1, NM_005617.3, NM_006013.3, NM_001256577.1, NM_001256580.1, NM_007104.4, NM_007209.3, NM_012423.3, NM_001270491.1, NM_033643.2, NM_015414.3, NM 021029.5, NM_001199972.1, NM_021104.1, NM_022551.2, NM_033022.3, NM_001142284.1, NM_001026.4, NM_001142285.1, NM_001142283.1, NM_001142282.1, NM_000973.3, NM_033301.1, NM_000995.3, NM_033625.2, NM_001021.3, NM_002295.4, NM_001012321.1, NM_001033930.1, NM_003333.3, NM_001997.4, NM_001099645.1, NM_001021.3, NM_052969.1, NM_080746.2, NM_001001.4, NM_005061.2, NM_015920.3, NM_016093.2, NM_198486.2, NG_011172.1, NG_011253.1, NG_000952.4, NR_002309.1, NG_010827.2, NG_009952.2, NG_009517.1, NM_052835.3, NM_011287.2, NM_001162933.1, NM_009076.3, NM_009438.5, NM_025974.2, NM_025586.3, NM_001002239.3, NM_009077.2, NM_029751.4, NM_009078.2, NM_019647.6, NM_009079.3, NM_022891.3, NM_024218.4, NM_011975.3, NM_009081.2, NM_009082.2, NM_009083.4, NM_053257.3, ENSMUST00000081840 (NM_172086.2), NM_026724.2, NM_025592.3, NM_025589.4, NM_026069.3, NM_009084, NM_026055.1. NM_026594.2, NM_001163945.1, NM_024212.4, NM_016980.2, NM_011290.5, NM_011291.5, ENSMUST00000102898 (NM_013721.3), NM_025433.3, NM_012053,2. NM_011292.2, NM_007475.5, NM_018853.3, NM_026020.6, NM_025963.3, NM_013725.4, NM_011295.6, NM_020600.4, NM_009091.2, NM_170669.2, NM_013647.2, NM_009092.3, NM_008503.5, NM_026147.5 / ENSMUST00000138502, NM_207635.1, NM_024266.3, NM_013765.2, NM_024277.2, NM_026467.3, NM_012052.2, NM_016959.4, ENSMUST00000071745, NM_009095.2, NM_009096.3, NM_011300.3, NM_011029.4, NM_018860.4, NM_001277113.1, NM_001277114.1, NM_001271590.1, NM_007990, NM_025919, NM_016738, NM_026517, NM_207523, NM_009080, NM_011289, NM_013762, NM 021338, NM_018730, NM_019865, NM_023372.2, NM_026533.3, NM_009092, NM_011296, NM_023133, ENSMUST00000059080 (NM_025587.2), NM_024175, NM_027015, NM_016844, NM_009093.2, NM_009094, NM_009098, NM_029767 и NM_019883.

Фраза «нуклеотидная последовательность, которая происходит из 3'-UTR гена рибосомального белка» предпочтительно относится к нуклеотидной последовательности, основой которой является последовательность 3'-UTR гена рибосомального белка или ее фрагмент или участок. Указанная фраза включает последовательности, соответствующие полной последовательности 3'-UTR, т.е. полноразмерной последовательности 3'-UTR гена рибосомального белка, и последовательности, соответствующие фрагменту последовательности 3'-UTR гена рибосомального белка. Предпочтительно фрагмент 3'-UTR гена рибосомального белка состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерной последовательности 3'-UTR гена рибосомального белка, который включает по меньшей мере 5%, 10%, 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90% полноразмерной последовательности 3'-UTR гена рибосомального белка. В контексте настоящего изобретения такой фрагмент предпочтительно представляет собой функциональный фрагмент, представленный в настоящем описании. Предпочтительно фрагмент сохраняет функцию регулирования трансляции ОРС, сцепленной с 3'-UTR или его фрагментом. Понятие «3'-UTR гена рибосомального белка» предпочтительно относится к 3'-UTR встречающегося в естественных условиях гена рибосомального белка.

Понятия «вариант 3'-UTR гена рибосомального белка» и «его вариант» в контексте 3'-UTR гена рибосомального белка относятся к варианту 3'-UTR встречающегося в естественных условиях гена рибосомального белка, предпочтительно к варианту 3'-UTR гена рибосомального белка позвоночных, более предпочтительно к варианту 3'-UTR гена рибосомального белка млекопитающих, еще более предпочтительно к варианту 3'-UTR варианту 3'-UTR гена рибосомального белка приматов, прежде всего гена рибосомального белка человека, представленного выше. Такой вариант может представлять собой модифицированный 3'-UTR гена рибосомального белка. Например, вариант 3'-UTR может иметь одну или несколько делеций, инсерций, добавлений и/или замен нуклеотидов по сравнению с встречающейся в естественных условиях 3'-UTR, из которой происходит вариант. Предпочтительно вариант 3'-UTR гена рибосомального белка по меньшей мере на 40%, предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, более предпочтительно по меньшей мере на 70%, еще более предпочтительно по меньшей мере на 80%, еще более предпочтительно по меньшей мере на 90%, наиболее предпочтительно по меньшей мере на 95% идентичен встречающейся в естественных условиях 3'-UTR, из которой происходит вариант. Предпочтительно вариант представляет собой функциональный вариант, представленный в настоящем описании.

Фраза «нуклеотидная последовательность, которая происходит из варианта 3'-UTR гена рибосомального белка» предпочтительно относится к нуклеотидной последовательности, основой которой является вариант последовательности 3'-UTR гена рибосомального белка или его фрагмент или участок, представленный выше. Фраза включает последовательности, соответствующие полной последовательности варианта 3'-UTR гена рибосомального белка, т.е. полноразмерной последовательности варианта 3'-UTR гена рибосомального белка, и последовательности, соответствующие фрагменту варианта последовательности 3'-UTR гена рибосомального белка. Предпочтительно фрагмент варианта 3'-UTR гена рибосомального белка состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерного варианта последовательности 3'-UTR гена рибосомального белка, который включает по меньшей мере 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, и наиболее предпочтительно по меньшей мере 90% полноразмерного варианта 3'-UTR гена рибосомального белка. В контексте настоящего изобретения такой фрагмент варианта предпочтительно представляет собой функциональный фрагмент варианта, представленного в настоящем описании.

В контексте настоящего описания понятия «функциональный вариант» «функциональный фрагмент» и «функциональный фрагмент варианта» (который обозначают также как «функциональный вариантный фрагмент») означают, что фрагмент 3'-UTR, вариант 3'-UTR или фрагмент варианта 3'-UTR гена рибосомального белка выполняет по меньшей мере одну, предпочтительно более чем одну функцию встречающейся в естественных условиях 3'-UTR гена рибосомального белка, из которой происходит вариант, фрагмента или фрагмент варианта. Такая функция может заключаться, например, в стабилизации мРНК и/или увеличении, стабилизации и/или пролонгировании производства белка с мРНК, и/или увеличении экспрессии белка или общего производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Предпочтительно функция 3'-UTR касается трансляции белка, кодируемого ОРС. Более предпочтительно функция включает повышение эффективности трансляции ОРС, связанной с 3'-UTR или ее фрагментом или вариантом. В контексте настоящего изобретения наиболее предпочтительно, чтобы вариант, фрагмент и вариант фрагмента выполнял функцию стабилизации мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, и/или функцию увеличения, стабилизации и/или пролонгирования производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, и/или функцию увеличения производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Референс-3'-UTR может представлять собой, например, 3'-UTR, встречающуюся в естественных условиях в комбинации с ОРС. Кроме того, функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента 3'-UTR гена рибосомального белка предпочтительно не оказывает существенного понижающего действия на эффективность трансляции мРНК, которая содержит такой вариант, фрагмент или вариант фрагмента 3'-UTR, по сравнению с 3'-UTR дикого типа, из которой происходит вариант, фрагмент или вариант фрагмента. В контексте настоящего изобретения наиболее предпочтительная функция «функционального варианта», «функционального фрагмента» или «функционального варианта фрагмента» 3'-UTR гена рибосомального белка заключается в увеличении, стабилизации и/или пролонгировании производства белка посредством экспрессии мРНК, несущей функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента, представленный выше.

Предпочтительно эффективность одной или нескольких функций, осуществляемых функциональным вариантом, функциональным фрагментом или функциональным вариантом фрагмента, такую как эффективность стабилизации производства мРНК и/или белка, и/или эффективность увеличения производства белка, повышают по меньшей мере на 5%, более предпочтительно по меньшей мере на 10%, более предпочтительно по меньшей мере на 20%, более предпочтительно по меньшей мере на 30%, более предпочтительно по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере на 90% по сравнению с эффективностью стабилизации производства мРНК и/или белка, и/или эффективностью увеличения производства белка, обеспечиваемой встречающейся в естественных условиях 3'-UTR гена рибосомального белка, из которого происходит вариант, фрагмент или вариант фрагмента.

В контексте настоящего изобретения фрагмент 3'-UTR гена рибосомального белка или вариант 3'-UTR гена рибосомального белка предпочтительно имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Предпочтительно такой фрагмент 3'-UTR гена рибосомального белка или вариант 3'-UTR гена рибосомального белка представляет собой функциональный фрагмент, описанный выше. В предпочтительном варианте осуществления изобретения 3'-UTR гена рибосомального белка или его фрагмент или вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.

Предпочтительно по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из «функционального фрагмента», «функционального варианта» или «функционального фрагмента варианта» 3'-UTR гена рибосомального белка.

В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает стабильность искусственной молекулы нуклеиновой кислоты, например, повышает стабильность мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой нуклеиновой референс-кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно, по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает стабильность производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, пролонгирует производство белка из искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает экспрессию белка и/или общее производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, не оказывает отрицательного влияния на эффективность трансляции нуклеиновой кислоты по сравнению с эффективностью трансляции соответствующей нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Еще более предпочтительно с помощью 3'-UTR повышают эффективность трансляции по сравнению с эффективностью трансляции белка, кодируемого соответствующей ОРС в естественных условиях.

Понятие «соответствующая молекула нуклеиновой кислоты» или «референс-молекула нуклеиновой кислоты» в указанном контексте означает, что референс-молекула нуклеиновой кислоты, за исключением различий в 3'-UTR, сопоставима, предпочтительно идентична предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, содержащей 3'-UTR-элемент.

Понятие «стабилизирует и/или пролонгирует производство белка» с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, предпочтительно означает, что производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, стабилизируется и/или пролонгируется по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, например, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, предпочтительно в экспрессионной системе млекопитающих, такой как HeLa- или HDF-клетки. Так, белок, продуцируемый с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, поддается обнаружению в течение более длительного периода времени, чем время, в течение которого его можно обнаружить в случае белка, продуцируемого с референс-молекулы нуклеиновой кислоты. Иными словами, количество белка, продуцированного с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, измеряемое в зависимости от времени, снижается до уровня, находящегося ниже порогового значения, в более поздний момент времени, чем количество белка, продуцированного с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, измеряемое в зависимости от времени. Такое пороговое значение может представлять собой, например, количество белка, измеренное на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты.

Например, производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, в количествах, равных по меньшей мере количеству, обнаруженному на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, пролонгируется по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнении с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, в экспрессионной системе, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках. Так, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно позволяет пролонгировать производство белка в количестве, которое по меньшей мере равно количеству, обнаруженному на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнении с производством белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.

В предпочтительных вариантах осуществления изобретения период производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, удлиняют по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза по сравнению с периодом производства белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.

Указанный эффект пролонгирования производства белка можно оценивать на основе (I) измерения количеств белка, например, полученных в результате экспрессии кодируемого репортерного белка, такого как люцифераза, предпочтительно в экспрессионной системе млекопитающих, такой как HeLa-или HDF-клетки, в зависимости от времени, (II) определения момента времени, в который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, и (III) сравнения момента времени, который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, с указанным моментом времени, определенным для молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.

Предпочтительно указанное стабилизирующее и/или пролонгирующее действие на производство белка достигают, когда общее количество белка, продуцированное с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, в течение периода времени, составляющего 48 или 72 ч, по меньшей мере равно количеству белка, продуцированного с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, которая обеспечивает пролонгированное и/или стабилизированное производство белка в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках, как указано выше, при этом общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 или 72 ч, по меньшей мере равно общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ORF искусственной молекулы нуклеиновой кислоты.

Так, «стабилизированная экспрессия белка» предпочтительно означает, что имеет место более равномерное производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, в течение заранее определенного периода времени, например, в течение 24 ч, более предпочтительно в течение 48 ч, еще более предпочтительно в течение 72 ч, по сравнению с референс-молекулой нуклеиновой кислоты, например, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Следовательно, уровень производства белка, например, в системе млекопитающих, с искусственной молекулы нуклеиновой кислоты, содержащей 3'-UTR-элeмeнт, предлагаемый в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, предпочтительно не снижается до уровня, обнаруженного для референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, указанная выше. Например, количество белка (кодируемого ОРС), обнаруженное через 6 ч после инициации экспрессии, например, через 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, клетки, такой как клетка млекопитающего, может быть сопоставимым с количеством белка, обнаруженного через 48 ч после инициации экспрессии, например, через 48 ч после трансфекции. Так, отношение количества белка, кодируемого ОРС, такого как репортерный белок, например, люцифераза, обнаруженное через 48 ч после инициации экспрессии, например, через 48 после трансфекции, к количеству белка, обнаруженному через 6 ч после инициации экспрессии, например, через 6 ч после трансфекции, предпочтительно составляет по меньшей мере примерно 0,4, более предпочтительно по меньшей мере примерно 0,5, более предпочтительно по меньшей мере примерно 0,6, еще более предпочтительно по меньшей мере примерно 0,7. Для молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении отношение предпочтительно составляет от примерно 0,4 до примерно 4, предпочтительно от примерно 0,65 до примерно 3, более предпочтительно от примерно 0,7 до 2. Для соответствующей референс-молекулы нуклеиновой кислоты, например, мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, указанное отношение может составлять, например, от примерно 0,05 до примерно 0,3.

Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элeмeнт, описанный выше, при этом отношение количества (репортерного) белка, например, количество люциферазы, обнаруженное через 48 ч после инициации экспрессии, к количеству (репортерного) белка, обнаруженному через 6 ч после инициации экспрессии, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa-клетках, предпочтительно превышает примерно 0,4, более предпочтительно превышает примерно 0,5, более предпочтительно превышает примерно 0,6, еще более предпочтительно превышает примерно 0,7, например, составляет от примерно 0,4 до примерно 4, предпочтительно от примерно 0,65 до примерно 3, более предпочтительно от примерно 0,7 до 2, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 ч, по меньшей мере равно общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. В предпочтительном варианте осуществления настоящего изобретения предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элeмeнт, описанный выше, при этом отношение количества (репортерного) белка, например, количество люциферазы, обнаруженное через 72 ч после инициации экспрессии, к количеству (репортерного) белка, обнаруженному через 6 ч после инициации экспрессии, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa-клетках, предпочтительно превышает примерно 0,4, более предпочтительно превышает примерно 0,5, более предпочтительно превышает примерно 0,6, еще более предпочтительно превышает примерно 0,7, например, составляет от примерно 0,4 до 1,5, предпочтительно от примерно 0,65 до примерно 1,15, более предпочтительно от примерно 0,7 до 1.0, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 72 ч, по меньшей мере равно общему количеству белка, продуцированному, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит 3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты.

«Увеличенная экспрессия белка» или «повышенная экспрессия белка» в контексте настоящего изобретения предпочтительно обозначает увеличенную/повышенную экспрессию белка в один из моментов времени после инициации экспрессии или увеличенное/повышенное общее количество экспрессированного белка, по сравнению с экспрессией, индуцированной референс-молекулой нуклеиновой кислоты. Так, уровень белка, обнаруженный в определенный момент времени после инициации экспрессии, например, после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, после трансфекции мРНК, предлагаемой в настоящем изобретении, например, через 6, 12, 24, 48 или 72 ч после трансфекции, предпочтительно превышает уровень белка, обнаруженный в этот же самый момент времени после инициации экспрессии, например, после трансфекции референс-молекулой нуклеиновой кислоты, такой как референс-мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. В предпочтительном варианте осуществления изобретения максимальное количество белка (определенное, например, по активности или массе белка), экспрессированного с искусственной молекулы нуклеиновой кислоты, увеличивают по сравнению с количеством белка, экспрессированного с нуклеиновой референс-кислоты, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Пиковые уровни экспрессии предпочтительно достигаются в пределах 48 ч, более предпочтительно в пределах 24 ч и еще более предпочтительно в пределах 12 ч после, например, трансфекции.

В одном из вариантов осуществления изобретения «увеличенное общее производство белка» или «повышенное общее производство белка» с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, относится к увеличенному/повышенному производству белка за период времени, в течение которого белок продуцируется с искусственной молекулы нуклеиновой кислоты, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках, по сравнению с референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR. Согласно предпочтительному варианту осуществления изобретения кумулятивное количество белка, экспрессированного в течение периода времени, увеличивается, если применяют искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении.

В изобретении предложена искусственная молекула нуклеиновой кислоты, которая отличается увеличенной экспрессией кодируемого белка по сравнению с соответствующей молекулой нуклеиновой кислоты, в которой отсутствует по меньшей мере один 3'-UTR-элeмeнт или которая содержит 3'-UTR («нуклеиновая референс-кислота»), содержащую нуклеотидную последовательность, происходящую из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка. Для оценки in vivo производства белка с предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, определяют экспрессию кодируемого белка после инъекции/трансфекции предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты клеток-/ткани-мишени и сравнивают с экспрессией белка, индуцированной нуклеиновой референс-кислотой. В данной области известны количественные методы определения экспрессии белка (например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия). В рассматриваемом контексте наиболее пригодным является определение экспрессии репортерных белков типа люциферазы, зеленого флуоресцентного белка (GFP) или секретированной щелочной фосфатазы (SEAP). Для этого искусственную нуклеиновую кислоту, предлагаемую в изобретении, или нуклеиновую референс-кислоту интродуцируют в ткань-мишень или клетку-мишень, например, посредством трансфекции или инъекции. Через несколько часов или несколько дней (например, через 6, 12, 24, 48 или 72 ч) после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты берут образец клеток-мишеней и проводят измерения с помощью FACS и/или лизируют. После этого лизаты можно использовать для обнаружения экспрессированного белка (и определения тем самым эффективности экспрессии белка) с помощью нескольких методов, например, вестерн-блоттинга, FACS, ELISA, масс-спектрометрии или путем измерения флуоресценции или люминесценции.

Следовательно, если экспрессию белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, сравнивают с экспрессией белка с референс-молекулы нуклеиновой кислоты в определенные моменты времени (например, через 6, 12, 24, 48 или 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты), то обе молекулы нуклеиновой кислоты интродуцируют по отдельности в ткани-/клетки-мишени, берут образец ткани/клеток в определенный момент времени, приготавливают белковые лизаты согласно конкретному протоколу, скорректированному для конкретного метода обнаружения (например, для вестерн-блоттинга, ELISA и т.д., как это известно в данной области) и проводят обнаружение белка с помощью выбранного метода обнаружения. В качестве альтернативы измерениям количеств экспрессируемого белка в клеточных лизатах, или в дополнение к измерениям количеств экспрессируемого белка в клеточных лизатах, с помощью FACS-анализа можно определять количества белка также до лизиса собранных клеток или параллельно с использованием аликвот.

Если нужно измерять общее количество белка в течение определенного периода времени, то можно собирать ткань или клетки в несколько моментов времени после интродукции искусственной молекулы нуклеиновой кислоты (например, через 6, 12, 24, 48 и 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты; как правило, взятой из организма других подопытных животных), и определять количество белка в каждый момент времени как описано выше. Для расчета кумулятивного количества белка можно применять математический метод определения общего количества белка, например, можно определять площадь под кривой (AUC) согласно следующей формуле:

Для расчета площади под кривой для общего количества белка вычисляют интеграл уравнения кривой экспрессии между каждыми конечными точками (a и b).

Таким образом, понятие «общее производство белка» предпочтительно относится к площади под кривой (AUC), описывающей производство белка в зависимости от времени.

Указанное увеличение стабильности искусственной молекулы нуклеиновой кислоты, указанное увеличение стабильности производства белка, указанное пролонгирование производства белка и/или указанное увеличение/повышение экспрессии белка и/или общего производства белка предпочтительно определяют путем сравнения с соответствующей референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR, например, мРНК, в которой отсутствует 3'-UTR, или референс-молекулой нуклеиновой кислоты, которая содержит референс-3'-UTR, такую как 3'-UTR, встречающуюся в естественных условиях с ОРС, как описано выше.

Стабилизирующее действие на мРНК и/или производство белка и эффективность, и/или повышающее производство белка действие и эффективность вариантов, фрагментов и/или фрагментов вариантов 3'-UTR гена рибосомального белка, а также стабилизирующее действие на мРНК и/или производство белка и эффективность, и/или повышающее производство белка действие и эффективность по меньшей мере одного 3'-UTR-элeмeнтa искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно определять с помощью любого пригодного для этой цели метода, известного специалисту в данной области. Например, можно создавать искусственные молекулы мРНК, содержащие кодирующую последовательность/открытую рамку считывания (ОРС) для репортерного белка, такого как люцифераза, и не содержащие 3'-UTR, содержащие 3'-UTR, происходящую из встречающегося в естественных условиях гена рибосомального белка, 3'-UTR, происходящую из референс-гена (т.е. референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС), в качестве 3'-UTR вариант 3'-UTR гена рибосомального белка, в качестве 3'-UTR фрагмент гена встречающегося в естественных условиях рибосомального белка, или в качестве 3'-UTR фрагмент варианта 3'-UTR гена рибосомального белка. Такие мРНК можно создавать, например, путем транскрипции in vitro соответствующих векторов, таких как плазмидные векторы, например, содержащие промотор Т7 и последовательность, кодирующую соответствующие последовательности мРНК. Созданными молекулами мРНК можно трансфектировать клетки с помощью метода трансфекции, пригодного для трансфекции мРНК, например, их можно интродуцировать путем электропорации в клетки млекопитающих, такие как HELA-клетки, и можно анализировать образцы в определенные моменты времени после трансфекции, например, через 6, 24, 48 и 72 ч после трансфекции. Указанные образцы можно анализировать для оценки количеств мРНК и/или количеств белка с помощью методов, хорошо известных специалистам в данной области. Например, количества репортерной мРНК, присутствующей в клетках в моменты времени взятия образцов, можно определять с помощью методов количественной ПЦР. Количества репортерного белка, кодируемого соответствующими мРНК, можно определять, например, с помощью вестерн-блоттинга, ELISA, FACS-анализа или репортерных анализов, таких как анализы люциферазы, в зависимости от используемого репортерного белка. Эффект стабилизации экспрессии белка и/или пролонгирования экспрессии белка можно анализировать, например, путем определения отношения уровня белка, обнаруженного через 48 ч после трансфекции и уровня белка, обнаруженного через 6 ч после трансфекции. Предпочтительно величина такого отношения превышает 1, т.е. экспрессия белка в более поздний момент времени больше, чем экспрессия белка в более ранний момент времени. Если величина такого отношения меньше 1, то белок тем более стабилен, чем ближе указанная величина к 1. Такие измерения можно, конечно, проводить также и через 72 ч или более, и для определения стабильности экспрессии белка можно определять отношение уровня белка, обнаруженного через 72 ч после трансфекции к уровню белка, обнаруженному через 6 ч после трансфекции.

В предпочтительном варианте осуществления изобретения 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, происходит из 3'-UTR-области гена, кодирующего рибосомальный белок, предпочтительно из 3'-UTR-области гена рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка, большой субъединицы, Р0 (RPLP0), рибосомального белка, большой субъединицы, Р1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15а (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка L10a (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA) или рибосомального белка S17 (RPS17). В альтернативном варианте осуществления изобретения 3'-UTR-элемент может происходить из гена, кодирующего рибосомальный белок, или из гена, выбранного из генов продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли, белка 1, подобного рибосомальному белку L22 (RPL22L1), белка, подобного рибосомальному белку L39 (RPL39L), белка, подобного рибосомальному белку L10 (RPL10L), белка, подобного рибосомальному белку L36a (RPL36AL), белка, подобного рибосомальному белку L3 (RPL3L), белка, подобного рибосомальному белку S27 (RPS27L), белка 1, подобного рибосомальному белку L26 1 (RPL26L1), белка 1, подобного рибосомальному белку L7 (RPL7L1), псевдогена рибосомального белка L13а (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена 11 рибосомального белка S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка, большой субъединицы, Р0 (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14). Кроме того, 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно происходит из 3'-UTR-oблacти гена, выбранного из группы, состоящей из генов белка, подобного рибосомальному белку S4 (RPS41), предполагаемой субъединицы 60S рибосомального белка L13а, предполагаемой субъединицы 60S белка, подобного рибосомальному белку L37a, предполагаемой субъединицы 40S белка, подобного рибосомальному белку S10, предполагаемой субъединицы 40S белка 1, подобного рибосомальному белку S26, предполагаемой субъединицы 60S белка 5, подобного рибосомальному белку L39, или субъединицы 60S белка, подобного кислому рибосомальному белку Р0.

В наиболее предпочтительном варианте осуществления изобретения 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, происходит из 3'-UTR-oблacти гена, кодирующего рибосомальный белок, предпочтительно из 3'-UTR-oблacти гена рибосомального белка L3 (RPL3), рибосомального белка L11 (RPL11), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L23a (RPL23A), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L35a (RPL35A), рибосомального белка L38 (RPL38), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S13 (RPS13), рибосомального белка S19 (RPS19), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S27 (RPS27), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка S18 (RPS18) или рибосомального белка S17 (RPS17). В другом предпочтительном варианте осуществления изобретения 3'-UTR-элeмeнт может происходить из гена, кодирующего рибосомальный белок, или из гена, выбранного из генов продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли или белка 1, подобного рибосомальному белку L22 (RPL22L1).

Предпочтительно по меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 10-115 или соответствующей последовательности РНК:

Рибосомальный белок L9 (RPL9) Homo sapiens

(SEQ ID NO: 10)

Рибосомальный белок L3 (RPL3) Homo sapiens

(SEQ ID NO: 11)

Рибосомальный белок L4 (RPL4) Homo sapiens

(SEQ ID NO: 12)

Рибосомальный белок L5 (RPL5) Homo sapiens

(SEQ ID NO: 13)

Рибосомальный белок L6 (RPL6) Homo sapiens

(SEQ ID NO: 14)

Рибосомальный белок L7 (RPL7) Homo sapiens

(SEQ ID NO: 15)

Рибосомальный белок L7a (RPL7A) Homo sapiens

(SEQ ID NO: 16)

Рибосомальный белок L11 (RPL11) Homo sapiens

(SEQ ID NO: 17)

Рибосомальный белок L12 (RPL12) Homo sapiens

(SEQ ID NO: 18)

Рибосомальный белок L13 (RPL13) Homo sapiens

(SEQ ID NO: 19)

Рибосомальный белок L23 (RPL23) Homo sapiens

(SEQ ID NO: 20)

Рибосомальный белок L18 (RPL18) Homo sapiens

(SEQ ID NO: 21)

Рибосомальный белок L18a (RPL18A) Homo sapiens

(SEQ ID NO: 22)

Рибосомальный белок L19 (RPL19) Homo sapiens

(SEQ ID NO: 23)

Рибосомальный белок L21 (RPL21) Homo sapiens

(SEQ ID NO: 24)

Рибосомальный белок L22 (RPL22) Homo sapiens

(SEQ ID NO: 25)

Рибосомальный белок L23a (RPL23A) Homo sapiens

(SEQ ID NO: 26)

Рибосомальный белок L17 (RPL17) Homo sapiens

(SEQ ID NO: 27)

Рибосомальный белок L24 (RPL24) Homo sapiens

(SEQ ID NO: 28)

Рибосомальный белок L26 (RPL26) Homo sapiens

(SEQ ID NO: 29)

Рибосомальный белок L27 (RPL27) Homo sapiens

(SEQ ID NO: 30)

Рибосомальный белок L30 (RPL30) Homo sapiens

(SEQ ID NO: 31)

Рибосомальный белок L27a (RPL27A) Homo sapiens

(SEQ ID NO: 32)

Рибосомальный белок L28 (RPL28) Homo sapiens

(SEQ ID NO: 33)

Рибосомальный белок L28 (RPL28) Homo sapiens

(SEQ ID NO: 34)

Рибосомальный белок L28 (RPL28) Homo sapiens

(SEQ ID NO: 35)

Рибосомальный белок L29 (RPL29) Homo sapiens

(SEQ ID NO: 36)

Рибосомальный белок L31 (RPL31) Homo sapiens

(SEQ ID NO: 37)

Рибосомальный белок L31 (RPL31) Homo sapiens

(SEQ ID NO: 38)

Рибосомальный белок L32 (RPL32) Homo sapiens

(SEQ ID NO: 39)

Рибосомальный белок L35a (RPL35A) Homo sapiens

(SEQ ID NO: 40)

Рибосомальный белок L37 (RPL37) Homo sapiens

(SEQ ID NO: 41)

Рибосомальный белок L37a (RPL37A) Homo sapiens

(SEQ ID NO: 42)

Рибосомальный белок L38 (RPL38) Homo sapiens

(SEQ ID NO: 43)

Рибосомальный белок L39 (RPL39) Homo sapiens

(SEQ ID NO: 44)

Рибосомальный белок большой субъединицы, Р0 (RPLP0) Homo sapiens

(SEQ ID NO: 45)

Рибосомальный белок большой субъединицы, P1 (RPLP1) Homo sapiens

(SEQ ID NO: 46)

Рибосомальный белок большой субъединицы, Р2 (RPLP2)

(SEQ ID NO: 47)

Рибосомальный белок S3 (RPS3) Homo sapiens

(SEQ ID NO: 48)

Рибосомальный белок S3 (RPS3) Homo sapiens

(SEQ ID NO: 49)

Рибосомальный белок S3A (RPS3A) Homo sapiens

(SEQ ID NO: 50)

Рибосомальный белок S3A (RPS3A) Homo sapiens

(SEQ ID NO: 51)

Рибосомальный белок S4, Х-сцепленный (RPS4X) Homo sapiens

(SEQ ID NO: 52)

Рибосомальный белок S4, Y-сцепленный 1 (RPS4Y1) Homo sapiens

(SEQ ID NO: 53)

Рибосомальный белок S5 (RPS5) Homo sapiens

(SEQ ID NO: 54)

Рибосомальный белок S6 (RPS6) Homo sapiens

(SEQ ID NO: 55)

Рибосомальный белок S7 (RPS7) Homo sapiens

(SEQ ID NO: 56)

Рибосомальный белок S8 (RPS8) Homo sapiens

(SEQ ID NO: 57)

Рибосомальный белок S9 (RPS9) Homo sapiens

(SEQ ID NO: 58)

Рибосомальный белок S10 (RPS10) Homo sapiens

(SEQ ID NO: 59)

Рибосомальный белок S11 (RPS11) Homo sapiens

(SEQ ID NO: 60)

Рибосомальный белок S12 (RPS12) Homo sapiens

(SEQ ID NO: 61)

Рибосомальный белок S13 (RPS13) Homo sapiens

(SEQ ID NO: 62)

Рибосомальный белок S15 (RPS15) Homo sapiens

(SEQ ID NO: 63)

Рибосомальный белок S15a (RPS15A) Homo sapiens

(SEQ ID NO: 64)

Рибосомальный белок S16 (RPS16) Homo sapiens

(SEQ ID NO: 65)

Рибосомальный белок S19 (RPS19) Homo sapiens

(SEQ ID NO: 66)

Рибосомальный белок S20 (RPS20) Homo sapiens

(SEQ ID NO: 67)

Рибосомальный белок S20 (RPS20) Homo sapiens

(SEQ ID NO: 68)

Рибосомальный белок S21 (RPS21) Homo sapiens

(SEQ ID NO: 69)

Рибосомальный белок S23 (RPS23) Homo sapiens

(SEQ ID NO: 70)

Рибосомальный белок S25 (RPS25) Homo sapiens

(SEQ ID NO: 71)

Рибосомальный белок S26 (RPS26) Homo sapiens

(SEQ ID NO: 72)

Рибосомальный белок S27 (RPS27) Homo sapiens

(SEQ ID NO: 73)

Рибосомальный белок S27a (RPS27a) Homo sapiens

(SEQ ID NO: 74)

Рибосомальный белок S28 (RPS28) Homo sapiens

(SEQ ID NO: 75)

Рибосомальный белок S29 (RPS29) Homo sapiens

(SEQ ID NO: 76)

Рибосомальный белок L15 (RPL15) Homo sapiens

(SEQ ID NO: 77)

Рибосомальный белок L15 (RPL15) Homo sapiens

(SEQ ID NO: 78)

Рибосомальный белок S2 (RPS2) Homo sapiens

(SEQ ID NO: 79)

Рибосомальный белок L14 (RPL14) Homo sapiens

(SEQ ID NO: 80)

Рибосомальный белок S14 (RPS14) Homo sapiens

(SEQ ID NO: 81)

Рибосомальный белок L10 (RPL10) Homo sapiens

(SEQ ID NO: 82)

Рибосомальный белок L10a (RPL10A) Homo sapiens

(SEQ ID NO: 83)

Рибосомальный белок L35 (RPL35) Homo sapiens

(SEQ ID NO: 84)

Рибосомальный белок L13a (RPL13A) Homo sapiens

(SEQ ID NO: 85)

Рибосомальный белок L36 (RPL36) Homo sapiens

(SEQ ID NO: 86)

Homo sapiens ribosomal protein L36a (RPL36A) Homo sapiens

(SEQ ID NO: 87)

Рибосомальный белок L36a (RPL36A) Homo sapiens

(SEQ ID NO: 88)

Рибосомальный белок L41 (RPL41) Homo sapiens

(SEQ ID NO: 89)

Рибосомальный белок S18 (RPS18) Homo sapiens

(SEQ ID NO: 90)

Рибосомальный белок S24 (RPS24) Homo sapiens

(SEQ ID NO: 91)

Рибосомальный белок S24 (RPS24) Homo sapiens

(SEQ ID NO: 92)

Рибосомальный белок L8 (RPL8) Homo sapiens

(SEQ ID NO: 93)

Рибосомальный белок L34 (RPL34) Homo sapiens

(SEQ ID NO: 94)

Рибосомальный белок L34 (RPL34) Homo sapiens

(SEQ ID NO: 95)

Рибосомальный белок S17 (RPS17) Homo sapiens

(SEQ ID NO: 96)

Рибосомальный белок SA (RPSA) Homo sapiens

(SEQ ID NO: 97)

Продукт 1 слияния: остаток А-52-рибосомальный белок 1 (UBA52)

(SEQ ID NO: 98)

Белок повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли (FBR-MuSV)

(SEQ ID NO: 99)

Белок 1, подобный рибосомальному белку L22 (RPL22L1) Homo sapiens

(SEQ ID NO: 100)

Рибосомальный белок S17 (RPS17) Homo sapiens

(SEQ ID NO: 101)

Белок, подобный рибосомальному белку L39 (RPL39L) Homo sapiens

(SEQ ID NO: 102)

Белок, подобный рибосомальному белку L10 (RPL10L) Homo sapiens

(SEQ ID NO: 103)

Белок, подобный рибосомальному белку L36a (RPL36AL) Homo sapiens

(SEQ ID NO: 104)

Белок, подобный рибосомальному белку L3 (RPL3L) Homo sapiens

(SEQ ID NO: 105)

Белок, подобный рибосомальному белку S27 (RPS27L) Homo sapiens

(SEQ ID NO: 106)

Белок 1, подобный рибосомальному белку L26 (RPL26L1) Homo sapiens

(SEQ ID NO: 107)

Белок 1, подобный рибосомальному белку L7 (RPL7L1) Homo sapiens

(SEQ ID NO: 108)

Псевдоген рибосомального белка L13a (RPL13AP) Homo sapiens

(SEQ ID NO: 109)

Псевдоген 8 рибосомального белка L37a 8 (RPL37AP8) Homo sapiens

(SEQ ID NO: 110)

Псевдоген 5 рибосомального белка S10 (RPS10P5) Homo sapiens

(SEQ ID NO: 111)

Псевдоген 11 рибосомального белка S26 (RPS26P11) Homo sapiens

(SEQ ID NO: 112)

Псевдоген 5 рибосомального белка L39 (RPL39P5) Homo sapiens

(SEQ ID NO: 113)

Псевдоген 6 рибосомального белка Р0 большой субъединицы (RPLP0P6) Homo sapiens

(SEQ ID NO: 114)

Псевдоген 14 рибосомального белка P0 большой субъединицы L36 (RPL36P14) Homo sapiens

(SEQ ID NO: 115)

Кроме того, предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100%) нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 116-205 или соответствующей последовательности РНК:

Рибосомальный белок L9 (RPL9) Mus musculus

(SEQ ID NO: 116)

Рибосомальный белок L3 (RPL3) Mus musculus

(SEQ ID NO: 117)

Рибосомальный белок L4 (RPL4) Mus musculus

(SEQ ID NO: 118)

Рибосомальный белок L5 (RPL5) Mus musculus

(SEQ ID NO: 119)

Рибосомальный белок L6 (RPL6) Mus musculus

(SEQ ID NO: 120)

Рибосомальный белок L7 (RPL7) Mus musculus

(SEQ ID NO: 121)

Рибосомальный белок L7a (RPL7A) Mus musculus

(SEQ ID NO: 122)

Рибосомальный белок L11 (RPL11) Mus musculus

(SEQ ID NO: 123)

Рибосомальный белок L12 (RPL12) Mus musculus

(SEQ ID NO: 124)

Рибосомальный белок L13 (RPL13) Mus musculus

(SEQ ID NO: 125)

Рибосомальный белок L23 (RPL23) Mus musculus

(SEQ ID NO: 126)

Рибосомальный белок L18 (RPL18) Mus musculus

(SEQ ID NO:127)

Рибосомальный белок L18a (RPL18A) Mus musculus

(SEQ ID NO: 128)

Рибосомальный белок L19 (RPL19) Mus musculus

(SEQ ID NO: 129)

Рибосомальный белок L21 (RPL21) Mus musculus

(SEQ ID NO: 130)

Рибосомальный белок L22 (RPL22) Mus musculus

(SEQ ID NO: 131)

Рибосомальный белок L22 (RPL22) Mus musculus

(SEQ ID NO: 132)

Рибосомальный белок L23a (RPL23A) Mus musculus

(SEQ ID NO: 133)

Рибосомальный белок L17 (RPL17) Mus musculus

(SEQ ID NO: 134)

Рибосомальный белок L24 (RPL24) Mus musculus

(SEQ ID NO: 135)

Рибосомальный белок L26 (RPL26) Mus musculus

(SEQ ID NO: 136)

Рибосомальный белок L27 (RPL27) Mus musculus

(SEQ ID NO: 137)

Рибосомальный белок L30 (RPL30) Mus musculus

(SEQ ID NO: 138)

Рибосомальный белок L27a (RPL27A) Mus musculus

(SEQ ID NO: 139)

Рибосомальный белок L28 (RPL28) Mus musculus

(SEQ ID NO: 140)

Рибосомальный белок L29 (RPL29) Mus musculus

(SEQ ID NO: 141)

Рибосомальный белок L31 (RPL31) Mus musculus

(SEQ ID NO: 142)

Рибосомальный белок L32 (RPL32) Mus musculus

(SEQ ID NO: 143)

Рибосомальный белок L35a (RPL35A) Mus musculus

(SEQ ID NO: 144)

Рибосомальный белок L37 (RPL37) Mus musculus

(SEQ ID NO: 145)

Рибосомальный белок (RPL37) Mus musculus

(SEQ ID NO: 146)

Рибосомальный белок L37a (RPL37A) Mus musculus

(SEQ ID NO: 147)

Рибосомальный белок L38 (RPL38) Mus musculus

(SEQ ID NO: 148)

Рибосомальный белок L39 (RPL39) Mus musculus

(SEQ ID NO: 149)

Рибосомальный белок большой субъединицы Р0 (RPLP0) Mus musculus

(SEQ ID NO: 150)

Рибосомальный белок большой субъединицы P1 (RPLP1) Mus musculus

(SEQ ID NO: 151)

Рибосомальный белок большой субъединицы Р2 (RPLP2) Mus musculus

(SEQ ID NO: 152)

Рибосомальный белок S3 (RPS3) Mus musculus

(SEQ ID NO: 153)

Рибосомальный белок S3A (RPS3A) Mus musculus

(SEQ ID NO: 154)

Рибосомальный белок S4, Х-сцепленный (RPS4X) Mus musculus

(SEQ ID NO: 155)

Рибосомальный белок 34-подобный (RPS41) Mus musculus

(SEQ ID NO: 156)

Рибосомальный белок S5 (RPS5) Mus musculus

(SEQ ID NO: 157)

Рибосомальный белок S6 (RPS6) Mus musculus

(SEQ ID NO: 158)

Рибосомальный белок S7 (RPS7) Mus musculus

(SEQ ID NO: 159)

Рибосомальный белок S8 (RPS8) Mus musculus

(SEQ ID NO: 160)

Рибосомальный белок S9 (RPS9) Mus musculus

(SEQ ID NO: 161)

Рибосомальный белок S10 (RPS10) Mus musculus

(SEQ ID NO: 162)

Рибосомальный белок S11 (RPS11) Mus musculus

(SEQ ID NO: 163)

Рибосомальный белок S12 (RPS12) Mus musculus

(SEQ ID NO: 164)

Рибосомальный белок S13 (RPS13) Mus musculus

(SEQ ID NO: 165)

Рибосомальный белок S15 (RPS15) Mus musculus

(SEQ ID NO: 166)

Рибосомальный белок S15a (RPS15A) Mus musculus

(SEQ ID NO: 167)

Mus musculus ribosomal protein S16 (RPS16) Mus musculus

(SEQ ID NO: 168)

Рибосомальный белок S19 (RPS19) Mus musculus

(SEQ ID NO: 169)

Рибосомальный белок S20 (RPS20) Mus musculus

(SEQ ID NO: 170)

Рибосомальный белок S21 (RPS21)

(SEQ ID NO: 171)

Рибосомальный белок S23 (RPS23) Mus musculus

(SEQ ID NO: 172)

Рибосомальный белок S25 (RPS25) Mus musculus

(SEQ ID NO: 173)

Рибосомальный белок S26 (RPS26) Mus musculus

(SEQ ID NO: 174)

Рибосомальный белок S27 (RPS27) Mus musculus

(SEQ ID NO: 175)

Рибосомальный белок S27a (RPS27a) Mus musculus

(SEQ ID NO: 176)

Рибосомальный белок S28 (RPS28) Mus musculus

(SEQ ID NO: 177)

Рибосомальный белок S29 (RPS29) Mus musculus

(SEQ ID NO: 178)

Рибосомальный белок L15 (RPL15) Mus musculus

(SEQ ID NO: 179)

Рибосомальный белок S2 (RPS2) Mus musculus

(SEQ ID NO: 180)

Рибосомальный белок L14 (RPL14) Mus musculus

(SEQ ID NO: 181)

Рибосомальный белок S14 (RPS14) Mus musculus

(SEQ ID NO: 182)

Рибосомальный белок L10 (RPL10) Mus musculus

(SEQ ID NO: 183)

Рибосомальный белок L10a (RPL10A) Mus musculus

(SEQ ID NO: 184)

Рибосомальный белок L35 (RPL35) Mus musculus

(SEQ ID NO: 185)

Рибосомальный белок L13a (RPL13A) Mus musculus

(SEQ ID NO: 186)

Рибосомальный белок L36 (RPL36) Mus musculus

(SEQ ID NO: 187)

Рибосомальный белок L36a (RPL36A) Mus musculus

(SEQ ID NO: 188)

Рибосомальный белок L41 (RPL41) Mus musculus

(SEQ ID NO: 189)

Рибосомальный белок S18 (RPS18) Mus musculus

(SEQ ID NO: 190)

Рибосомальный белок S24 (RPS24) Mus musculus

(SEQ ID NO: 191)

Рибосомальный белок L8 (RPL8) Mus musculus

(SEQ ID NO: 192)

Рибосомальный белок L34 (RPL34) Mus musculus

(SEQ ID NO: 193)

Рибосомальный белок S17 (RPS17) Mus musculus

(SEQ ID NO: 194)

Рибосомальный белок SA (RPSA) Mus musculus

(SEQ ID NO: 195)

Продукт 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52) Mus musculus

(SEQ ID NO: 196)

Повсеместно экспрессируемый белок (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли (FBR-MuSV)

(SEQ ID NO: 197)

Рибосомальный белок L22-подобный 1 (RPL22L1) Mus musculus

(SEQ ID NO: 198)

Рибосомальный белок S17 (RPS17) Mus musculus

(SEQ ID NO: 199)

Рибосомальный белок L39-подобный (RPL39L) Mus musculus

(SEQ ID NO: 200)

Рибосомальный белок L10-подобный (RPL10L) Mus musculus

(SEQ ID NO: 201)

Рибосомальный белок L36а-подобный (RPL36AL) Mus musculus

(SEQ ID NO: 202)

Рибосомальный белок L3-подобный (RPL3L) Mus musculus

(SEQ ID NO: 203)

Рибосомальный белок S27-подобный (RPS27L) Mus musculus

(SEQ ID NO: 204)

Рибосомальный белок L7-подобный 1 (RPL7L1) Mus musculus

(SEQ ID NO: 205)

В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности 3'-UTR гена рибосомального белка малой субъединицы 9 (RPS9). Наиболее предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% SEQ ID NO: 1 или SEQ ID NO: 2:

SEQ ID NO: 1

SEQ ID NO: 2

По меньшей мере один 3'-UTR-элeмeнт искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, может также содержать или состоять из фрагмента нуклеотидной последовательности, который идентичен по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как 3'-UTR, имеющая последовательность, представленную в SEQ ID NO: 10-205, где фрагмент предпочтительно представляет собой функциональный фрагмент или функциональный фрагмент варианта, описанный выше. Такой фрагмент предпочтительно имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотида, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления изобретения фрагмент или его вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.

Предпочтительно указанные варианты, фрагменты или фрагменты вариантов представляют собой функциональные варианты, функциональные фрагменты или функциональные фрагменты вариантов, описанные выше, которые обладают по меньшей мере одной функцией, присущей нуклеотидной последовательности, представленной в SEQ ID NO: 10-205, такой как стабилизация искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, стабилизация и/или пролонгирование экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или увеличение производства белка, предпочтительно с эффективностью, составляющей по меньшей мере 40%, более предпочтительно по меньшей мере 50%, более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере 90% от эффективности стабилизации и/или эффективности увеличения производства белка с искусственной молекулы нуклеиновой кислоты, содержащей нуклеотидную последовательность, представленную в SEQ ID NO: 1 или SEQ ID NO: 2.

Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотида, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Верхний предел длины 3'-UTR-элемента может составлять 500 нуклеотидов или менее, например, 400, 300, 200, 150 или 100 нуклеотидов. В других вариантах осуществления изобретения верхний предел может быть выбран из диапазона от 50 до 100 нуклеотидов. Например, фрагмент или вариант может иметь длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.

Кроме того, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать более одного 3'-UTR-элемента, описанного выше. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать один, два, три четыре или большее количество 3'-UTR-элементов, при этом индивидуальные 3'-UTR-элементы могут быть одинаковыми или могут быть различными. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать два практически идентичных 3'-UTR-элемента, описанных выше, например, два 3'-UTR-элемента, содержащих или состоящих из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка, например, из последовательности, представленной в SEQ ID NO: 10-205, или из фрагмента или варианта 3'-UTR гена рибосомального белка, имеющего нуклеотидную последовательность, представленную в SEQ ID NO: 1 или 2, его функциональных вариантов, его функциональных фрагментов или функциональных фрагментов вариантов, описанных выше.

При создании изобретения неожиданно было установлено, что искусственная молекула нуклеиновой кислоты, содержащая 3'-UTR-элeмeнт, описанный выше, может представлять собой или позволяет создавать молекулу мРНК, которая обеспечивает повышенное, пролонгированное и/или стабилизированное производство белка. Так, 3'-UTR-элемент, представленный в настоящем описании, может повышать стабильность экспрессии белка с молекулы мРНК и/или повышать эффективность трансляции.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может представлять собой РНК, такую как мРНК, ДНК, такую как векторная ДНК, или может представлять собой модифицированную молекулу РНК или ДНК. Она может находиться в виде двухцепочечной молекулы, имеющей смысловую цепь и антисмысловую цепь, например, в виде молекулы ДНК, имеющей смысловую цепь и антисмысловую цепь.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, кроме того, может необязательно содержать 5'-UTR и/или 5'-кэп. Необязательные 5'-кэп и/или 5'-UTR предпочтительно расположены с 5'-стороны относительно ОРС в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении.

Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность и/или сигнал полиаденилирования. Предпочтительно необязательная поли(А)-последовательность расположена с 3'-стороны относительно по меньшей мере одного 3'-UTR-элeмeнтa, предпочтительно необязательная поли(А)-последовательность присоединена к 3'-концу 3'-UTR-элемента. Соединение может осуществляться непосредственно или косвенным образом посредством сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, такой как линкер, состоящий из 1-50, предпочтительно из 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов рестрикции.

В одном из вариантов осуществления изобретения необязательный сигнал полиаденилирования расположен в прямом направлении с 3'-стороны 3'-UTR-элемента. Предпочтительно сигнал полиаденилирования содержит консенсусную последовательность NN(U/T)ANA, в которой N обозначает А или U, предпочтительно AA(U/T)AAA или A(U/T)(U/T)AAA. Такая консенсусная последовательность может распознаваться большинством систем на основе клеток животных и бактериальных клеток, например, факторами полиаденилирования, такими как фактор специфичности расщепления/полиаденилирования (CPSF), в сочетании с CstF, PAP, РАВ2, CFI и/или CFII. Предпочтительно сигнал полиаденилирования, предпочтительно представляющий собой консенсусную последовательность NNUANA, расположен на расстоянии менее чем примерно 50 нуклеотидов, более предпочтительно менее чем примерно 30 оснований, наиболее предпочтительно менее чем примерно 25 оснований, например, на расстоянии 21 основания, в прямом направлении относительно 3'-конца 3'-UTR-элемента.

Транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, содержащей сигнал полиаденилирования, расположенный в прямом направлении относительно 3'-UTR-элемента, должна приводить к получению незрелой РНК, содержащей сигнал полиаденилирования, в прямом направлении относительно ее 3'-UTR-элемента. Например, транскрипция молекулы ДНК, содержащей 3'-UTR-элемент, имеющий SEQ ID NO: 1, должна приводить к получению РНК, несущей 3'-UTR-элемент, имеющий последовательность SEQ ID NO: 2.

Затем при использовании соответствующей системы транскрипции должно происходить присоединение поли(А)-последовательности к незрелой РНК. Например, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, содержащую 3'-UTR-элемент, описанный выше, и сигнал полиаденилирования, который может приводить к полиаденилированию РНК после транскрипции указанной молекулы ДНК. Следовательно, образовавшаяся РНК может содержать комбинацию предлагаемого в изобретении 3'-UTR-элемента, за которым располагается поли(А)-последовательность.

Возможными системами транскрипции являются системы транскрипции in vitro или клеточные системы транскрипции и т.д. Таким образом, транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, например, транскрипции искусственной молекулы нуклеиновой кислоты, содержащей открытую рамку считывания, 3'-UTR-элемент и сигнал полиаденилирования, может приводить к получению молекулы мРНК, содержащей открытую рамку считывания, 3'-UTR-элемент и поли(А)-последовательность.

Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая представляет собой молекулу мРНК, содержащую открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность.

Один из вариантов осуществления изобретения относится к искусственной молекуле нуклеиновой кислоты, которая представляет собой искусственную молекулу ДНК, содержащую открытую рамку считывания и последовательность, представленную в SEQ ID NO: 1 или последовательность, идентичную по меньшей мере примерно на 40% или более SEQ ID NO: 1, или ее фрагмент, описанный выше. Кроме того, в изобретении предложена искусственная молекула нуклеиновой кислоты, которая представляет собой искусственную молекулу РНК, содержащую открытую рамку считывания и последовательность, представленную в SEQ ID NO: 2 или последовательность, идентичную по меньшей мере примерно на 40% или более SEQ ID NO: 2, или ее фрагмент, описанный выше.

Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая может служить в качестве матрицы для молекулы РНК, предпочтительно для молекулы мРНК, которая стабилизирована и оптимизирована в отношении эффективности трансляции. Иными словами, искусственная молекула нуклеиновой кислоты может представлять собой ДНК, которую можно применять в качестве матрицы для получения мРНК. мРНК, которую можно получать таким путем, может, в свою очередь, транслироваться с получением требуемого пептида или белка, кодируемого открытой рамкой считывания. Если искусственная молекула нуклеиновой кислоты представляет собой ДНК, то ее можно, например, использовать в качестве двухцепочечной формы хранения для продолжения и повторения производства мРНК in vitro или in vivo.

В другом варианте осуществления изобретения 3'-UTR искусственной молекулы нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Кроме того, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Более предпочтительно 3'-UTR искусственной молекулы нуклеиновой кислоты или сама предлагаемая в изобретении искусственная молекула нуклеиновой кислоты не содержит сигнал полиаденилирования, прежде всего не содержит сигнал полиаденилирования AAU/TAAA.

В одном из вариантов осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность. Например, молекула ДНК, содержащая ОРС, за которой следует рибосомальная 3'-UTR, может содержать состоящий из тимидиновых нуклеотидов сегмент, который может транскрибироваться в поли(А)-последовательность в образующейся мРНК. Длина поли(А)-последовательности может варьироваться. Например, поли(А)-последовательность может иметь длину от примерно 20 адениновых нуклеотидов вплоть до 300 адениновых нуклеотидов, предпочтительно от примерно 40 до примерно 200 адениновых нуклеотидов, более предпочтительно от примерно 50 до примерно 100 адениновых нуклеотидов, например, примерно 60, 70, 80, 90 или 100 адениновых нуклеотидов. Наиболее предпочтительно предлагаемая в изобретении нуклеиновая кислота содержит поли(А)-последовательность, содержащую от примерно 60 до примерно 70 нуклеотидов, наиболее предпочтительно 64 адениновых нуклеотида.

Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать нуклеотидную последовательность, соответствующую последовательности ДНК:

(SEQ ID NO: 3).

Транскрипция указанных последовательностей может приводить к получению искусственных молекул нуклеиновой кислоты, содержащих последовательность:

(SEQ ID NO: 4).

Такие искусственные молекулы РНК, т.е. искусственные молекулы нуклеиновой кислоты, содержащие последовательность, представленную в SEQ ID NO: 4, можно также получать in vitro с помощью обычных методов химического синтеза, при этом не требуется осуществлять транскрипцию с ДНК-предшественника.

В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляет собой молекулу РНК, предпочтительно молекулу РНК, содержащую в 5→3'-направлении открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность.

Предпочтительно открытая рамка считывания не кодирует рибосомальный белок. В предпочтительном варианте осуществления изобретения открытая рамка считывания не кодирует рибосомальный белок, из которого происходит 3'-UTR-элемент предлагаемой в изобретении нуклеиновой кислоты, прежде всего не кодирует рибосомальный белок млекопитающих, при условии, что 3'-UTR-элемент идентичен 3'-UTR гена рибосомального белка млекопитающих. В некоторых других вариантах осуществления изобретения открытая рамка считывания не кодирует RPS9 или его варианты, при условии, что 3'-UTR-элемент имеет последовательность, идентичную SEQ ID NO: 1 или SEQ ID NO: 2.

В предпочтительном варианте осуществления изобретения ОРС не кодирует рибосомальные белки человека или растения, прежде всего Arabidopsis, прежде всего не кодирует человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL), или рибосомальный белок Arabidopsis S16 (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16) вне зависимости от его происхождения.

Один из вариантов осуществления изобретения относится к искусственной молекул ДНК, содержащей открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элeмeнт, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 1; сигнал полиаденилирования и/или поли(А)-последовательность. Кроме того, в изобретении предложена искусственная молекула ДНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует любой пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элeмeнт, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 3.

Кроме того, в изобретении предложена искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная вирусная молекула РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элeмeнт, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 2; и сигнал полиаденилирования и/или поли(А)-последовательность. Кроме того, искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная вирусная молекула РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элeмeнт, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 4.

В изобретении предложена искусственная молекула нуклеиновой кислоты, предпочтительно искусственная мРНК, которая может отличаться тем, что обеспечивает повышенную стабильность и пролонгирование экспрессии кодируемого пептида или белка. Не выдаваясь в какую-либо конкретную теорию, можно считать, что повышенная стабильность экспрессии белка и также пролонгированная экспрессия белка могут быть обусловлены уменьшением разложения искусственной молекулы нуклеиновой кислоты, такой как искусственная молекула мРНК, предлагаемая в настоящем изобретении. Таким образом, предлагаемый в изобретении 3'-UTR-элeмeнт может предупреждать разложение и расщепление искусственной нуклеиновой кислоты.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты может содержать гистоновую структуру типа «стебель-петля» в дополнение к нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка. Такая искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать, например, расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную последовательность гистоновой структуры типа «стебель-петля», необязательную поли(А)-последовательность или сигнал полиаденилирования и необязательную поли(С)-последовательность. Она может содержать также расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную поли(А)-последовательность, необязательную поли(С)-последовательность и необязательную последовательность гистоновой структуры типа «стебель-петля».

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в изобретении, содержит по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля».

Последовательность гистоновой структуры типа «стебель-петля», которую можно применять в настоящем изобретении, предпочтительно выбирают по меньшей мере из одной из следующих формул (I) или (II):

формула (I) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):

формула (II) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):

в которых:

пограничные элементы stem1 или stem2 N1-6 обозначают непрерывную последовательность, состоящую из 1-6, предпочтительно 2-6, более предпочтительно 2-5, еще более предпочтительно 3-5, наиболее предпочтительно 4-5 или 5 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или их нуклеотидного аналога;

stem1 [N0-2GN3-5] обозначает последовательность, обратно комплементарную или частично обратно комплементарную элементу stem2, и представляет собой непрерывную последовательность, состоящую из 5-7 нуклеотидов;
в которой N0-2 обозначает непрерывную последовательность, состоящую из 0-2, предпочтительно 0-1, более предпочтительно 1 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; в которой N3-5 обозначает непрерывную последовательность, состоящую из 3-5, предпочтительно 4-5, более предпочтительно 4 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога, и в которой G обозначает гуанозин или его аналог и необязательно может быть заменен на цитидин или его аналог при условии, что комплементарный ему нуклеотид цитидин в stem2 заменен на гуанозин;
последовательность «петли» [N0-4(U/T)N0-4] локализована между элементами stem1 и stem2 и обозначает непрерывную последовательность, состоящую из 3-5 нуклеотидов, более предпочтительно 4 нуклеотидов;
в которой N0-4 каждый независимо друг от друга обозначает непрерывную последовательность, состоящую из 0-4, предпочтительно 1-3, более предпочтительно

1-2 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; и в которой U/T обозначает уридин или необязательно тимидин;
stem2 [N3-5CN0-2] обозначает последовательность, обратно комплементарную или частично обратно комплементарную элементу stem1, и представляет собой непрерывную последовательность, состоящую из 5-7 нуклеотидов;
в которой N3-5 обозначает непрерывную последовательность, состоящую из 3-5, предпочтительно 4-5, более предпочтительно 4 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; в которой N0-2 обозначает непрерывную последовательность, состоящую из 0-2, предпочтительно 0-1, более предпочтительно 1 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G или С или его нуклеотидного аналога; и в которой С обозначает цитидин или его аналог и необязательно может быть заменен на гуанозин или его аналог при условии, что комплементарный ему нуклеотид гуанозин в stem1 заменен на цитидин;

где

у элементов stem1 и stem2 может происходить спаривание оснований друг с другом с образованием обратно комплементарной последовательности, где спаривание оснований может иметь место между steml и stem2, например, посредством спаривания оснований по Уотсону-Крику нуклеотидов А и U/T или G и С, или посредством спаривания оснований не по Уотсону-Крику, например, посредством спаривания «качающихся» оснований («качающегося» спаривания оснований), обратного спариванию оснований по Уотсону-Крику, посредством хугстиновского спаривания оснований, посредством обратного хугстиновскому спаривания оснований, или у них может происходить спаривание оснований друг с другом с образованием частично обратно комплементарной последовательности, при этом неполное спаривание оснований может иметь место между stem1 и stem2, вследствие того, что для одного или нескольких оснований в одном стебле не имеется комплементарного основания в обратно комплементарной последовательности другого стебля.

Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Iа) или (IIа):

формула (Iа) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):

формула (IIа) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):

в которой:

N, С, G, Т и U имеют указанные выше значения.

Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Ib) или (IIb):

формула (Ib) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):

формула (IIb) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):

в которой:

N, С, G, Т и U имеют указанные выше значения.

Наиболее предпочтительной последовательностью гистоновой структуры типа «стебель-петля» является последовательность, представленная в SEQ ID NO: 5 CAAAGGCTCTTTTCAGAGCCACCA, или более предпочтительно последовательность РНК, соответствующая нуклеотидной последовательности, представленной в SEQ ID NO: 5.

Например, отдельные элементы могут присутствовать в искусственной молекуле нуклеиновой кислоты в следующем порядке:

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элeмeнт - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элeмeнт - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элeмeнт - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»; и т.д.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит дополнительные элементы, такие как 5'-кэп, поли(С)-последовательность и/или IRES-мотив. 5'-кэп может быть добавлен в процессе транскрипции или после транскрипции к 5'-концу РНК. Кроме того, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, можно модифицировать с помощью последовательности, состоящей по меньшей мере из 10 цитозинов, предпочтительно по меньшей мере из 20 цитозинов, более предпочтительно по меньшей мере из 30 цитозинов (так называемая «поли(С)-последовательность»). В частности, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может содержать, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, поли(С)-последовательность которая, как правило, содержит примерно от 10 до 200 цитозиновых нуклеотидов, предпочтительно примерно от 10 до 100 цитидиновых нуклеотидов, более предпочтительно примерно от 10 до 70 цитидиновых нуклеотидов или еще более предпочтительно примерно от 20 до 50 или даже от 20 до 30 цитидиновых нуклеотидов. Наиболее предпочтительно, предлагаемая в изобретении нуклеиновая кислота содержит поли(С)-последовательность, состоящую из 30 цитидиновых оснований. Так, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит, предпочтительно в 5'→3' направлении ОРС, по меньшей мере один 3'-UTR-элeмeнт, описанный выше, поли(А)-последовательность или сигнал полиаденилирования и поли(С)-последовательность.

Последовательность внутреннего сайта связывания рибосом (IRES) или IRES-мотив может разделять несколько открытых рамок считывания, например в том случае, когда искусственная молекула нуклеиновой кислоты кодирует два или большее количество пептидов или белков. IRES-последовательность может быть наиболее полезной в том случае, когда искусственная молекула нуклеиновой кислоты представляет собой би- или полицистронную молекулу нуклеиновой кислоты.

Кроме того, искусственная молекула нуклеиновой кислоты может содержать дополнительные 5'-элементы, предпочтительно 5'-UTR, промотор или последовательность, содержащую 5'-UTR и промотор. Промотор может управлять транскрипцией или регулировать транскрипцию искусственной молекулы нуклеиновой кислоты предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, предлагаемой в настоящем изобретении. Кроме того, 5'-UTR может состоять или содержать 5'-UTR гена, представленную в настоящем описании. Кроме того, 5'-UTR может взаимодействовать с предлагаемым в изобретении 3'-UTR-элeмeнтoм и тем самым может поддерживать стабилизирующее действие предлагаемого в изобретении 3'-UTR-элeмeнтa. Такие элементы могут дополнительно поддерживать стабильность и эффективность трансляции. Следовательно, в некоторых вариантах осуществления изобретения предложены искусственные молекулы нуклеиновой кислоты, предпочтительно молекулы мРНК, содержащие в 5'→3'-направлении по меньшей мере одну из следующих структур

5'-кэп - 5'-UTR - ORF - 3'-UTR-элeмeнт - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элeмeнт - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элeмeнт - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элeмeнт - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля».

В наиболее предпочтительном варианте осуществления настоящего изобретения искусственная молекула нуклеиновой кислоты содержит по меньшей мере один элемент 5'-нетранслируемой области (5'UTR-элeмeнт) длиной менее чем 500, 400, 300, 250, 200, 150 или 100 нуклеотидов и/или более чем 20, 30, 40, 50 или 60 нуклеотидов, который предпочтительно содержит или состоит из нуклеотидной последовательности, которая происходит из 5'UTR ТОР-гена, или которая происходит из фрагмента, гомолога или варианта 5'UTR ТОР-гена.

Наиболее предпочтительно 5'UTR-элeмeнт не содержит ТОР-мотив или 5'-ТОР, указанный выше.

Нуклеотидная последовательность, которая происходит из 5'UTR ТОР-гена, происходит из эукараотического ТОР-гена, предпочтительно ТОР-гена растения или животного, более предпочтительно ТОР-гена хордовых, еще более предпочтительно ТОР-гена позвоночных, наиболее предпочтительно ТОР-гена млекопитающих, такого как ТОР-ген человека.

Например, 5'UTR-элемент предпочтительно выбирают из 5'-UTR-элементов, содержащих или состоящих из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, описание которой включено в настоящее описание в качестве ссылки, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта или предпочтительно из соответствующей последовательности РНК. Понятие «гомологи SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленные в заявке на патент WO 2013/143700» относится к последовательностям из видов кроме человека, которые гомологичны последовательностям SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленным в заявке на патент WO 2013/143700.

В предпочтительном варианте осуществления изобретения 5'UTR-элемент содержит или состоит из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения 5 (т.е. нуклеотида, находящегося в последовательности в положении 5) до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности, выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК. Наиболее предпочтительно 5'UTR-элемент происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения, непосредственно примыкающего с 3'-стороны к 5'-ТОР, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК.

В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена, кодирующего рибосомальный белок, или из варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок. Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 или 1360, представленных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива. Как описано выше, последовательность, простирающаяся от положения 5 до нуклеотида, непосредственно примыкающего с 5'-стороны к ATG (который находится на 3'-конце последовательностей), соответствует 5'-UTR указанных последовательностей.

Предпочтительно 5'UTR-элемент содержит или состоит из нуклеотидной последовательности, которая происходит из 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL), или из гомолога или варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL). Например, 5'-UTR-элeмeнт содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 и 1422, описанных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива.

В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, или из варианта 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, где предпочтительно 5'-UTR-элемент не содержит 5'-ТОР указанного гена.

Следовательно, в наиболее предпочтительном варианте осуществления изобретения, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 6 (5'-UTR рибосомального белка большой субъединицы 32 человека без 5'-концевого олигопиримидинового тракта: GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; соответствующая SEQ ID NO: 1368, представленной в заявке на патент WO 2013/143700) или предпочтительно соответствующей последовательности РНК, или где по меньшей мере один 5'UTR-элемент содержит или состоит из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 6, или более предпочтительно соответствующей последовательности РНК, где предпочтительно фрагмент представляет собой описанный выше фрагмент, непрерывный сегмент нуклеотидов, представляющий собой по меньшей мере 20% и т.д. полноразмерной 5'-UTR. Предпочтительно фрагмент имеет длину по меньшей мере примерно 20 нуклеотидов или более, предпочтительно по меньшей мере примерно 30 нуклеотидов или более, более предпочтительно по меньшей мере примерно 40 нуклеотидов или более. Предпочтительно фрагмент представляет собой функциональный фрагмент, представленный в настоящем описании.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит 5'-UTR-элемент, который содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена позвоночных, например, млекопитающих, например, ТОР-гена человека, выбранного из RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLPO, RPLP1, RPLP2, RPLP3, RPLPO, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, РАВРС1, HNRNPA1, ТРТ1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB или из его гомолога или варианта, где предпочтительно 5'-UTR-элeмeнт не содержит ТОР-мотив или 5'-ТОР указанных генов, и где необязательно 5'-UTR-элeмeнт начинается на его 5'-конце с нуклеотида, находящегося в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в прямом направлении относительно 5'-концевого олигопиримидинового тракта (ТОР) и где необязательно также 5'-UTR-элeмeнт, происходящий из 5'-UTR ТОР-гена, заканчивается на его 3'-конце нуклеотидом, находящимся в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в обратном направлении относительно стартового кодона (A(U/T)G) гена, из которого он происходит.

Предпочтительно в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно в открытой рамке считывания, модифицируют по меньшей мере содержание G/C. Так, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты можно стабилизировать с точки зрения ее термодинамических характеристик путем модификации содержания G (гуанозин)/С (цитидин) в молекуле. Содержание G/C в открытой рамке считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно повышать по сравнению с содержанием G/C в открытой рамке считывания соответствующей последовательности дикого типа, предпочтительно на основе вырожденности генетического кода. Так, аминокислотную последовательность, кодируемую искусственной молекулой нуклеиновой кислоты, предпочтительно не модифицируют посредством модификации содержания G/C по сравнению с конкретной кодируемой аминокислотной последовательностью дикого типа. Таким образом, можно варьировать кодоны кодирующей последовательности или всей искусственной молекулы нуклеиновой кислоты, например, мРНК, по сравнению с кодирующей последовательностью дикого типа таким образом, чтобы они содержали большее количество G/C-нуклеотидов, сохраняя при этом транслируемую аминокислотную последовательность. Благодаря тому факту, что несколько кодонов кодируют одну и ту же аминокислоту (так называемая вырожденность генетического кода), можно изменять кодоны, не изменяя кодируемую последовательность пептида/белка (использование так называемых альтернативных кодонов). Следовательно, можно специально интродуцировать определенные кодоны (осуществляя обмен соответствующих кодонов дикого типа, кодирующих ту же самую аминокислоту), которые являются более предпочтительными с точки зрения стабильности РНК и/или наиболее часто встречающихся кодонов в организме индивидуума (так называемая оптимизация кодонов).

В зависимости от аминокислоты, которая должна кодироваться кодирующей областью предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, существуют различные возможности для модификации нуклеотидной последовательности, например, открытой рамки считывания, по сравнению с ее кодирующей областью дикого типа. В случае аминокислот, которые кодируются кодонами, содержащими только нуклеотиды G или С, модификации кодонов не требуется. Таким образом, кодоны для Pro (ССС или CCG), Arg (CGC или CGG), Ala (GCC или GCG) и Gly (GGC или GGG) не требуют модификации, поскольку в них отсутствуют А или U/T.

В противоположность этому, кодоны, которые содержат нуклеотиды А и/или U, можно модифицировать путем замены на другие кодоны, которые кодируют эти же аминокислоты, но не содержат А и/или U.

Например,

кодирующие Pro кодоны СС(U/T) или ССА можно модифицировать на ССС или CCG;

кодирующие Arg кодоны CG(U/T) или CGA, или AGA, или AGG можно модифицировать на CGC или CGG;

кодирующие Ala кодоны GC(U/T) или GCA можно модифицировать на GCC или GCG;

кодирующие Gly кодоны GG(U/T) илиr GGA можно модифицировать на GGC или GGG.

В других случаях, когда нуклеотиды А или U нельзя элиминировать из кодонов, можно снижать содержание А и U с использованием кодонов, которые содержат нуклеотиды А и/или U в более низком количестве. Примерами указанных колонов являются:

кодирующие Phe кодоны (U/T)(U/T)(U/T) можно модифицировать на (U/T) (U/T)C;

кодирующие Leu кодоны (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) или C(U/T)A можно модифицировать на C(U/T)C или C(U/T)G;

кодирующие Ser кодоны (U/T)C(U/T) или (U/T)CA, или AG(U/T) можно модифицировать на (U/T)CC, (U/T)CG или AGC;

кодирующий Tyr кодон (U/T)A(U/T) можно модифицировать на (U/T)AC;

кодирующий Cys кодон (U/T)G(U/T) можно модифицировать на (U/T)GC;

кодирующий His кодон CA(U/T) можно модифицировать на САС;

кодирующий Gln кодон САА можно модифицировать на CAG;

кодирующие Ile кодоны A(U/T)(U/T) или A(U/T)A можно модифицировать на A(U/T)C

кодирующие Thr кодоны AC(U/T) или АСА можно модифицировать на АСС или ACG

кодирующий Asn кодон AA(U/T) можно модифицировать на ААС;

кодирующий Lys кодоны AAA можно модифицировать на AAG;

кодирующие Val кодоны G(U/T)(U/T) или G(U/T)A можно модифицировать на G(U/T)C или G(U/T)G;

кодирующий Asp кодон GA(U/T) можно модифицировать на GAC;

кодирующий Glu кодон GAA можно модифицировать на GAG;

стоп-кодон (U/T)AA можно модифицировать на (U/T)AG или (U/T)GA.

С другой стороны, в случае кодонов Met (AUG) и Trp (UGG), отсутствует возможность модификации последовательности без изменения кодируемой аминокислотной последовательности.

Перечисленные выше замены можно использовать либо индивидуально, либо в любых возможных комбинациях для повышения содержания G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, по сравнению с конкретной открытой рамкой считывания дикого типа (т.е. исходной последовательности). Так, например, все кодоны Thr, встречающиеся в последовательности дикого типа, можно модифицировать на АСС (или ACG).

Предпочтительно содержание G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, повышают по меньшей мере на 7%, более предпочтительно по меньшей мере на 15%, наиболее предпочтительно по меньшей мере на 20%, по сравнению с содержанием G/C в кодирующей области мРНК дикого типа без изменения кодируемой аминокислотной последовательности, т.е. используя вырожденность генетического кода. В конкретном варианте осуществления изобретения заменяют по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90%, 95% или даже 100% пригодных для замены кодонов в открытой рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты или ее фрагменте, варианте или производном, повышая тем самым содержание G/C в указанной открытой рамке считывания.

В этом контексте наиболее предпочтительно повышать содержание G/C в открытая рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, до максимума (т.е. до 100% пригодных для замещения кодонов) по сравнению с открытой рамкой считывания дикого типа без изменения кодируемой аминокислотной последовательности.

Кроме того, в открытой рамке считывания предпочтительно осуществляют по меньшей мере частично оптимизацию кодонов. Оптимизация кодонов основана на открытии того факта, что эффективность трансляции может определяться также различной частотой встречаемости транспортных РНК (тРНК) в клетках. Таким образом, если в кодирующей области, предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, присутствуют в повышенном количестве так называемые «редкие кодоны», то уровень трансляции соответствующей модифицированной нуклеотидной последовательности является более низким, чем в том случае, когда присутствуют кодоны, кодирующие относительно «часто встречающуюся» тРНК.

Так, открытую рамку считывания предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты предпочтительно модифицируют по сравнению с соответствующей кодирующей областью дикого типа таким образом, чтобы по меньшей мере один кодон в последовательности дикого типа, который кодирует тРНК, которая является относительно редкой в клетке, был заменен на кодон, который кодирует тРНК, которая встречается в клетке относительно часто и «несет» такую же аминокислоту, что и относительно редко встречающаяся тРНК. Посредством такой модификации открытую рамку считывания предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, модифицируют таким образом, чтобы кодонами, для которых доступны часто встречающиеся тРНК, заменять кодоны, которые соответствуют редким тРНК. Другими словами, согласно изобретению с помощью такой модификации все кодоны в открытой рамке считывания дикого типа, которые кодируют тРНК, являющуюся относительно редкой в клетке, можно заменять на кодоны, которые кодируют тРНК, относительно часто встречающуюся в клетке, и которая в каждом случае «несет» такую же аминокислоту, что и относительно редкая тРНК. тРНК, встречающиеся относительно часто в клетке, и наоборот, встречающиеся относительно редко, известны специалистам в данной области, см., например, Akashi, Curr. Opin. Genet. Dev., 11 (6), 2001, cc. 660-666. Таким образом, предпочтительно открытая рамка считывания имеет оптимизированные кодоны, предпочтительно применительно к системе, в которой должна экспрессироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно применительно к системе, в которой должна транслироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении. Предпочтительно, оптимизацию кодонов для наиболее часто встречающихся кодонов в открытой рамке считывания осуществляют в соответствии с наиболее часто встречающимися кодонами млекопитающих, более предпочтительно в соответствии с наиболее часто встречающимися кодонами человека. Предпочтительно, в открытой рамке считывания осуществляют и оптимизацию кодонов, и модификацию содержания G/C.

Для дополнительного повышения устойчивости к расщеплению, например, устойчивости к расщеплению in vivo экзо- или эндонуклеазой, и/или для дополнительного повышения стабильности экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно осуществлять дополнительные модификации искусственной молекулы нуклеиновой кислоты, такие как модификации каркаса, модификации сахаров и/или модификации оснований, например, липидные модификации или т.п. Предпочтительно, такие модификации не приводят к значимому ухудшению транскрипции и/или трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.

Как правило, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать любой нативный (встречающийся в естественных условиях) нуклеотид, например, гуанозин, урацил, аденозин и/или цитозин, или их аналоги. В этом контексте нуклеотидные аналоги классифицируют как встречающиеся в естественных условиях и не встречающиеся в естественных условиях варианта встречающихся в естественных условиях нуклеотидов аденозина, цитозина, тимидина, гуанозина и уридина. Таким образом, аналоги представляют собой, например, химически модифицированные нуклеотиды, несущие не встречающиеся в естественных условиях функциональные группы, которые предпочтительно добавляют или изымают путем делеции из встречающегося в естественных условиях нуклеотида, или которыми заменяют встречающиеся в естественных условиях функциональные группы нуклеотида. Следовательно, можно модифицировать каждый компонент встречающегося в естественных условиях нуклеотида, а именно, Компонент, представляющий собой основание, компонент, представляющий собой сахар (рибоза) компонент и/или компонент, представляющий собой фосфат, формирующий каркас (см. выше) последовательности РНК. Аналоги гуанозина, урацила, аденозина и цитозина включают (но, не ограничиваясь только ими) любой встречающийся в естественных условиях или не встречающийся в естественных условиях гуанозин, урацил, аденозин, тимидин или цитозин, который был изменен химически, например, ацетилированием, метилированием, гидроксилированием и т.д., включая, например, 1-метиладенозин, 1-метилгуанозин, 1-метилинозин, 2,2-диметилгуанозин, 2,6-диаминопурин, 2'-амино-2'-дезоксиаденозин, 2'-амино-2'-дезоксицитидин, 2'-амино-2'-дезоксигуанозин, 2'-амино-2'-дезоксиуридин, 2-амино-6-хлорпуринорибозид, 2-аминопуринрибозид, 2'-арааденозин, 2'-арацитидин, 2'-арауридин, 2'-Азидо-2'-дезоксиаденозин, 2'-азидо-2'-дезоксицитидин, 2'-азидо-2'-дезоксигуанозин, 2'-азидо-2'-дезоксиуридин, 2-хлораденозин, 2'-фтор-2'-дезоксиаденозин, 2'-фтор-2'-дезоксицитидин, 2'-фтор-2'-дезоксигуанозин, 2'-фтор-2'-дезоксиуридин, 2'-фтортимидин, 2-метиладенозин, 2-метилгуанозин, 2-метилтио-N6-изопенениладенозин, 2'-O-метил-2-аминоаденозин, 2'-O-метил-2'-дезоксиаденозин, 2'-Ометил-2'-дезоксицитидин, 2'-O-метил-2'-дезоксигуанозин, 2'-O-метил-2'-дезоксиуридин, 2'-O-метил-5-метилуридин, 2'-O-метилинозин, 2'-O-метилпсевдоуридин, 2-тиоцитидин, 2-тиоцитозин, 3-метилцитозин, 4-ацетилцитозин, 4-тиоуридин, 5-(карбоксигидроксиметил)урацил, 5,6-дигидроуридин, 5-аминоаллилцитидин, 5-аминоаллилдезоксиуридин, 5-бромуридин, 5-карбоксиметиламинометил-2-тиоурацил, 5-карбоксиметиламинометилурацил, 5-хлор арацитозин, 5-фторуридин, 5-йодуридин, 5-метоксикарбонилметилуридин, 5-метоксиуридин, 5-метил-2-тиоуридин, 6-азацитидин, 6-азауридин, 6-хлор-7-деазагуанозин, 6-хлорпуринорибозид, 6-меркаптогуанозин, 6-метилмеркаптопуринрибозид, 7-деаза-2'-дезоксигуанозин, 7-деазааденозин, 7-метилгуанозин, 8-азааденозин, 8-бромаденозин, 8-бромгуанозин, 8-меркапторгуанозин, 8-оксогуанозин, бензимидазолрибозид, бета-D-маннозилквеозин, дигидроурацил, инозин, N1-метиладенозин, N6-([6-аминогексил]карбамоилметил)аденозин, N6-изопентениладенозин, N6-метиладенозин, N7-метилксантозин, метиловый эфир N-урацил-3-оксиуксусной кислоты, пуромицин, квеозин, урацил-5-оксиуксусная кислота, метиловый эфир урацил-5-оксиуксусной кислоты, вибутоксозин, ксантозин и ксилоаденозин. Получение таких аналогов известно специалисту в данной области, например, описано в US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 и 5700642. Касательно аналогов, описанных выше, наиболее предпочтительными согласно некоторым вариантам осуществления изобретения могут быть те аналоги, которые увеличивают белковую экспрессию кодируемого пептида или белка, или повышают иммуногенность искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или не взаимодействуют с другой интродуцированной модификацией мРНК.

Согласно конкретному варианту осуществления изобретения мРНК в композиции, предлагаемой в настоящем изобретении, может содержать липидную модификацию.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит, предпочтительно в 5'→3'-направлении, следующие элементы:

5'-UTR;

по меньшей мере одну открытую рамку считывания (ОРС), где ОРС предпочтительно содержит по меньшей мере одну модификацию по сравнению с последовательностью дикого типа;

3'-UTR, происходящую из 3'-UTR рибосомального белка, предпочтительно из нуклеотидной последовательности, представленной в любой из SEQ ID NO: 10-115, более предпочтительно 3'-UTR RPS9, более предпочтительно 3'-UTR RPS9 человека;

поли(А)-последовательность, предпочтительно содержащую 64 аденилата;

поли(С)-последовательность, предпочтительно содержащую 30 цитидилатов;

гистоновую структуру типа «стебель-петля».

В другом предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит или состоит из нуклеотидной последовательности, представленной в SEQ ID NO: 7 (см. фиг. 3) или комплементарной последовательности ДНК.

В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, может содержать также одну или несколько описанных ниже модификаций:

Химические модификации:

В контексте настоящего описания понятие «модификация» применительно к искусственной молекуле нуклеиновой кислоты может относиться к химическим модификациям, включающим модификации каркаса, а также модификации сахара или модификации основания.

В этом контексте искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, представленная в настоящем описании, может содержать нуклеотидные аналоги/модификации, например, модификации каркаса, модификации сахара или модификации основания. Модификация каркаса согласно настоящему изобретению представляет собой модификацию, при которой химически модифицируют фосфаты каркаса нуклеотидов, содержащихся в молекуле нуклеиновой кислоты, представленной в настоящем описании. Модификация сахара согласно настоящему изобретению представляет собой химическую модификацию сахара нуклеотида в молекуле нуклеиновой кислоты, представленной в настоящем описании. Кроме того, модификация основания согласно настоящему изобретению представляет собой химическую модификацию оснóвного фрагмента нуклеотидов в молекуле нуклеиновой кислоты. В этом контексте нуклеотидные аналоги или модификации предпочтительно выбирают из нуклеотидных аналогов, пригодных для транскрипции и/или трансляции.

Модификации сахара:

Модифицированные нуклеозиды и нуклеотиды, которые могут быть включены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании, могут быть модифицированы в сахарном фрагменте. Например, 2'-гидроксигруппу (ОН) в молекуле РНК можно модифицировать или заменять многочисленными «окси»- или «дезокси»-заместителями. Примерами модификаций, включающих «окси»-2'-гидроксигруппы, являются (но, не ограничиваясь только ими) алкоксигруппы или арилоксигруппы (-OR, например, R=Н, алкил, циклоалкил, арил, аралкил, гетероарил или сахар); полиэтиленгликоли (PEG), -O(CH2CH2O)nCH2CH2OR; «замкнутые» нуклеиновые кислоты (LNA), в которых 2'-гидроксил присоединен, например, с помощью метиленового мостика к 4'-углероду в том же самом сахарном фрагменте, представляющем собой рибозу; и аминогруппы (-О-аминогруппы, в которых аминогруппа, например, NRR, может представлять собой алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу или дигетероариламиногруппу, этилендиамин, полиаминогруппу) или алкоксигруппу.

«Дезокси»-модификация включает водород, аминогруппу (например, NH2; алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу, дигетероариламиногруппу или аминокислоту); или аминогруппу можно присоединять к сахару через линкер, где линкер содержит один или несколько атомов С, N и О.

Сахарная группа может содержать также один или несколько атомов углерода, которые могут находиться в стереохимической конфигурации, отличной от конфигурации соответствующего атома углерода в рибозе. Так, модифицированная молекула нуклеиновой кислоты может включать, например, в качестве сахара арабинозу.

Модификации каркаса:

Можно модифицировать также фосфатный каркас в модифицированных нуклеозидах и нуклеотидах, которые могут быть встроены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании. Фосфатные группы в каркасе можно модифицировать посредством замены одного или нескольких атомов кислорода на различные заместители. Кроме того, в модифицированных нуклеозидах и нуклеотидах немодифицированный фосфатный фрагмент может быть полностью заменен на модифицированный фосфат, представленный в настоящем описании. Примеры модифицированных фосфатных групп включают (но, не ограничиваясь только ими) фосфоротиоаты, фосфороселенаты, боранофосфаты, сложные боранофосфатные эфиры, первичные фосфонаты, фосфороамидаты, алкил- или арилфосфонаты и сложные фосфотриэфиры. В фосфородитиоатах оба несвязывающих атома кислорода заменены серой. Фосфатный линкер также можно модифицировать путем замены связывающего атома кислорода на азот (мостиковые фосфороамидаты), серу (мостиковые фосфоротиоаты) и углерод (мостиковые метиленфосфонаты).

Модификации основания:

Модифицированные нуклеозиды и нуклеотиды, которые можно встраивать в искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать также в фрагменте, представляющем собой нуклеооснование. Примерами нуклеооснований, входящих в РНК, являются (но, не ограничиваясь только ими) аденин, гуанин, цитозин и урацил. Например, нуклеозиды и нуклеотиды, представленные в настоящем описании, можно химически модифицировать на поверхности большой бороздки. В некоторых вариантах осуществления изобретения химические модификации главной бороздки включают аминогруппу, тиольную групп алкильную группу или галогруппу.

В наиболее предпочтительных вариантах осуществления настоящего изобретения нуклеотидные аналоги/модификации выбирают из модификаций основания, которые предпочтительно выбирают из 2-амино-6-хлорпуринрибозид-5'-трифосфат, 2-аминоаденозин-5'-трифосфат, 2-тиоцитидин-5'-трифосфат, 2-тиоуридин-5'-трифосфат, 4-тиоуридин-5'-трифосфат, 5-аминоаллилцитидин-5'-трифосфат, 5-аминоаллилуридин-5'-трифосфат, 5-бромцитидин-5'-трифосфат, 5-бромуридин-5'-трифосфат, 5-йодцитидин-5'-трифосфат, 5-йодуридин-5'-трифосфат, 5-метилцитидин-5'-трифосфат, 5-метилуридин-5'-трифосфат, 6-азацитидин-5'-трифосфат, 6-азауридин-5'-трифосфат, 6-хлорпуринрибозид-5'-трифосфат, 7-деазааденозин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 8-азааденозин-5'-трифосфат, 8-азидоаденозин-5'-трифосфат, бензимидазолрибозид-5'-трифосфат, N1-метиладенозин-5'-трифосфат, N1-метилгуанозин-5'-трифосфат, N6-метиладенозин-5'-трифосфат, 06-метилгуанозин-5'-трифосфат, псевдоуридин-5'-трифосфат или пуромицин-5'-трифосфат, ксантозин-5'-трифосфат. Наиболее предпочтительные нуклеотиды для модификаций оснований выбирают из группы нуклеотидов с модифицированными основаниями, включающей 5-метилцитидин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 5-бромцитидин-5'-трифосфат и псевдоуридин-5'-трифосфат.

В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают пиридин-4-оновый рибонуклеозид, 5-азауридин, 2-тио-5-азауридин, 2-тиоуридин, 4-тиопсевдоуридин, 2-тиопсевдоуридин, 5-гидроксиуридин, 3-метилуридин, 5-карбоксиметилуридин, 1-карбоксиметилпсевдоуридин, 5-пропинилуридин, 1-пропинилпсевдоуридин, 5-тауринометилуридин, 1-тауринометилпсевдоуридин, 5-тауринометил-2-тиоуридин, 1-тауринометил-4-тиоуридин, 5-метилуридин, 1-метилпсевдоуридин, 4-тио-1-метилпсевдоуридин, 2-тио-1-метилпсевдоуридин, 1-метил-1-деазапсевдоуридин, 2-тио-1-метил-1-деазапсевдоуридин, дигидроуридин, дигидропсевдоуридин, 2-тиодигидроуридин, 2-тиодигидропсевдоуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метоксипсевдоуридин и 4-метокси-2-тиопсевдоуридин.

В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метилпсевдоизоцитидин, пирролоцитидин, пирролопсевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тиопсевдоизоцитидин, 4-тио-1-метилпсевдоизоцитидин, 4-тио-1-метил-1-деазапсевдоизоцитидин, 1-метил-1-деазапсевдоизоцитидин, зебуларин, 5-азазебуларин, 5-метилзебуларин, 5-аза-2-тиозебуларин, 2-тиозебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метоксипсевдоизоцитидин и 4-метокси-1-метилпсевдоизоцитидин.

В других вариантах осуществления изобретения модифицированные нуклеозиды включают 2-аминопурин, 2, 6-диаминопурин, 7-деазааденин, 7-деаза-8-азааденин, 7-деаза-2-аминопурин, 7-деаза-8-аза-2-аминопурин, 7-деаза-2,6-диаминопурин, 7-деаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6-(цис-гидроксиизопентенил)аденозин, 2-метилтио-N6-(цис-гидроксиизопентенил) аденозин, N6-глицинилкарбомоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6,N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин и 2-метоксиаденин.

В других вариантах осуществления изобретения модифицированные нуклеозиды включают инозин, 1-метилинозин, виозин, вибутозин, 7-деазагуанозин, 7-деаза-8-азагуанозин, 6-тиогуанозин, 6-тио-7-деазагуанозин, 6-тио-7-деаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2,N2-диметилгуанозин, 8-оксогуанозин, 7-метил-8-оксогуанозин, 1-метил-6-тиогуанозин, N2-метил-6-тиогуанозин и N2,N2-диметил-6-тиогуанозин.

В некоторых вариантах осуществления изобретения нуклеотид можно модифицировать на поверхности главной бороздки и модификация может включать замену атома водорода на С-5 урацила метильной группой или галогруппой.

В конкретных вариантах осуществления изобретения модифицированный нуклеозид представляет собой 5'-O-(1-тиофосфат)-аденозин, 5'-O-(1-тиофосфат)-цитидин, 5'-O-(1-тиофосфат)-гуанозин, 5'-O-(1-тиофосфат)-уридин или 5'-O-(1-тиофосфат)-псевдоуридин.

В других конкретных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, может содержать нуклеозидные модификации, выбранные из 6-азацитидина, 2-тиоцитидина, альфа-тиоцитидина, псевдоизоцитидина, 5-аминоаллилуридина, 5-йодуридина, N1-метилпсевдоуридина, 5,6-дигидроуридина, альфа-тиоуридина, 4-тиоуридина, 6-азауридина, 5-гидроксиуридина, дезокситимидина, 5-метилуридина, пирролоцитидина, инозина, альфа-тиогуанозина, 6-метилгуанозина, 5-метилцитидина, 8-оксогуанозина, 7-деазагуанозина, N1-метиладенозина, 2-амино-6-хлорпурина, N6-метил-2-аминопурина, псевдоизоцитидина, 6-хлорпурина, N6-метиладенозин, альфа-тиоаденозина, 8-азидоаденозина, 7-деазааденозина.

Липидная модификация

Согласно следующему варианту осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно РНК, представленная в настоящем описании, может содержать липидную модификацию. Такая модифицированная липидами РНК, как правило, содержит РНК, представленную в настоящем описании. Такая модифицированная липидами молекула РНК, представленная в настоящем описании, как правило, дополнительно содержит по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером. Альтернативно этому, модифицированная липидами молекула РНК содержит (по меньшей мере одну) молекулу РНК, указанную в настоящем описании, и по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной молекулой РНК. Согласно третьей альтернативе модифицированная липидами молекула РНК содержит искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, указанную в настоящем описании, по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером, и также по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной мРНК. В этом контексте наиболее предпочтительно липидную модификацию осуществляют на концах линейной последовательности РНК.

Модификация 5'-конца модифицированной РНК

Согласно другому предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать путем добавления так называемой «5'-кэп»-структуры.

5'-кэп представляет собой структуру, как правило, структуру, состоящую из модифицированных нуклеотидов, которая, как правило, завершает («кэпирует») 5'-конец зрелой мРНК. 5'-кэп, как правило, может быть сформирован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связывают с 5'-концом с помощью 5'-5'-трифосфатной связи. 5'-кэп может быть метилирован, например, m7GpppN), где N представляет собой концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. m7GpppN представляет собой 5'-кэп-структуру, которая встречается в естественных условиях в мРНК транскрибируемой полимеразой II, и, следовательно, не рассматривается как модификация, содержащаяся в модифицированной РНК, предлагаемой в изобретении. Это означает, что искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, предлагаемая в настоящем изобретении, может содержать m7GpppN в качестве 5'-кэпа, но при этом дополнительно искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, содержит по меньшей мере одну дополнительную модификацию, представленную в настоящем описании.

Другими примерами 5'-кэп-структур являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент. Эти модифицированные 5'-кэп-структуры рассматриваются в качестве по меньшей мере одной модификации, содержащейся в искусственной молекуле нуклеиновой кислоты, предпочтительно в молекуле РНК, предлагаемой в настоящем изобретении.

Наиболее предпочтительными модифицированными 5'-кэп-структурами являются САР1 (метилирование рибозы соседнего с m7GpppN нуклеотида), САР2 (метилирование рибозы 2-ого нуклеотида, расположенного в прямом направлении относительно m7GpppN), САР3 (метилирование рибозы 3-его нуклеотида, расположенного в прямом направлении относительное m7GpppN), САР4 (метилирование рибозы 4-ого нуклеотида, расположенного в прямом направлении относительно m7GpppN), ARCA (аналог кэп-структуры с правильной ориентацией, модифицированный ARCA (например, модифицированный фосфотиоатом ARCA), инозин, N1-метилгуанозин, 2'-фторгуанозин, 7-деазагуанозин, 8-оксогуанозин, 2-аминогуанозин, ЗНК-гуанозин и 2-азидогуанозин.

В предпочтительном варианте осуществления изобретения по меньшей мере одна открытая рамка считывания кодирует терапевтический белок или пептид. В другом варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания кодируется антиген, такой как патогенный антиген, опухолевый антиген, аллергенный антиген или аутоиммунный антиген. Таким образом, введение искусственной молекулы нуклеиновой кислоты, кодирующей антиген, применяют в подходе, заключающемся в генетической вакцинации против заболевания, в котором участвует указанный антиген.

В альтернативном варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, кодируется антитело.

Антигены

Патогенные антигены

Искусственная молекула нуклеиновой кислоты, предлагаемой в настоящем изобретении, может кодировать белок или пептид, который содержит патогенный антиген или его фрагмент, вариант или производное. Такие патогенные антигены происходят из патогенных организмов, прежде всего, бактерий, вирусов или простейших (многоклеточных) патогенных организмов, которые вызывают иммунологическую реакцию у индивидуума, прежде всего у млекопитающего, более предпочтительно у человека. Более конкретно, патогенные антигены предпочтительно представляют собой поверхностные антигены, например, белки (или фрагменты белков, например, находящуюся снаружи часть поверхностного антигена), локализованные на поверхности вируса или бактерии или простейшего.

Патогенные антигены представляют собой пептидные или белковые антигены, предпочтительно происходящие из патогенов, ассоциированных с инфекционным заболеванием, которые предпочтительно выбирают из антигенов, происходящих из патогенов Acinetobacter baumannii, рода Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, рода Aspergillus, Astroviridae, рода Babesia, Bacillus anthracis, Bacillus cereus, Bartonella henselae, вируса BK, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, рода Borrelia, Borrelia spp, рода Brucella, Brugia malayi, семейства Bunyaviridae, Burkholderia cepacia и других видов Burkholderia, Burkholderia mallei, Burkholderia pseudomallei, семейства Caliciviridae, рода Campylobacter, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, приона CJD, Clonorchis sinensis, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, коронавирусов, Corynebacterium diphtheriae, Coxiella burnetii, вируса геморрагической лихорадки Крым-Конго, Cryptococcus neoformans, рода Cryptosporidium, Cytomegalovirus (CMV), вирусов Денге (DEN-1, DEN-2, DEN-3 и DEN-4), Dientamoeba fragilis, вируса Эбола (EBOV), рода Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, рода Ehrlichia, Entamoeba histolytica, рода Enterococcus, рода Enterovirus, энтеровирусов, прежде всего вируса Коксаки А и энтеровируса 71 (EV71), Epidermophyton spp, вируса Эпштейна-Барра (EBV), Escherichia coli O157:Н7, O111 и О104:Н4, Fasciola hepatica и Fasciola gigantica, приона FFI, суперсемейства Filarioidea, флавивирусов, Francisella tularensis, рода Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, приона GSS, вируса Гуанарито, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, генипавируса (вирус Гендра и вирус Нипа), вируса гепатита А, вируса гепатита В (HBV), вируса гепатита С (HCV), вируса гепатита D, вируса гепатита, вируса герпеса простого 1 и 2 (HSV-1 и HSV-2), Histoplasma capsulatum, HIV (вирус иммунодефицита человека), Hortaea werneckii, человеческого бокавируса (HBoV), человеческого вируса герпеса 6 (HHV-6) и человеческого вируса герпеса 7 (HHV-7), человеческого вируса метапенвмонии (hMPV), вируса папилломы человека (HPV), человеческих вирусов парагриппа (HPIV), вируса японского энцефалита, вируса JC, вируса Джунин, Kingella kingae, Klebsiella granulomatis, приона Куру, вируса Ласса, Legionella pneumophila, рода Leishmania, рода Leptospira, Listeria monocytogenes, вируса лимфоцитарного хориоменингита (LCMV), вируса Мачупо, Malassezia spp, вируса Марбурга, вируса кори, Metagonimus yokagawai, Microsporidia phylum, вируса контагиозного моллюска (MCV), вируса паротита, Mycobacterium leprae и Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp, Onchocerca volvulus, Orientia tsutsugamushi, семейства Orthomyxoviridae (грипп), Paracoccidioides brasiliensis, Paragonimus spp, Paragonimus westermani, парвовируса В19, рода Pasteurella, рода Plasmodium, Pneumocystis jirovecii. полиовируса, вируса бешенства, респираторно-синтициального вируса (RSV), риновируса, риновирусов, Rickettsia akari, рода Rickettsia, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, вируса долины Рифта, ротавируса, вируса краснухи, вируса Сабиа, рода Salmonella, Sarcoptes scabiei, коронавируса SARS, рода Schistosoma, рода Shigella, вируса Син Номбре, хантавируса, Sporothrix schenckii, рода Staphylococcus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, рода Taenia, Taenia solium, вируса клещевого энцефалита (TBEV), Toxocara canis или Toxocara cati, Toxoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, вируса ветряной оспы (VZV), Variola major или Variola minor, приона vCJD, вируса венесуэльского энцефалита лошадей, Vibrio cholerae, вируса Западного Нила, вируса западного энцефалита лошадей, Wuchereria bancrofti, вируса желтой лихорадки, Yersinia enterocolitica, Yersinia pestis и Yersinia pseudotuberculosis.

В этом контексте наиболее предпочтительными являются антигены из патогенов, выбранных из вируса гриппа, респираторно-синтициального вируса (RSV), вируса герпеса простого (HSV), вируса папилломы человека (HPV), вируса иммунодефицита человека (HIV), Plasmodium, Staphylococcus aureus, вируса Денге, Chlamydia trachomatis, цитомегаловируса (CMV), вируса гепатита В (HBV), Mycobacterium tuberculosis, вируса бешенства и вируса желтой лихорадки.

Опухолевые антигены

В другом варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в настоящем изобретении, может кодировать белок или пептид, который содержит пептид или белок, содержащий опухолевый антиген, фрагмент, вариант или производное указанного опухолевого антигена, где предпочтительно, опухолевый антиген представляет собой меланоцит-специфический антиген, раково-тестикулярный антиген или опухоль-специфический антиген, предпочтительно СТ-Х-антиген, не-Х-СТ-антиген, партнер, связывающий СТ-Х-антиген или партнер, связывающий не-Х-СТ-антиген, или опухоль-специфический антиген, более предпочтительно СТ-Х-антиген, партнер, связывающий не-Х-СТ-антиген или опухоль-специфический антиген, или фрагмент, вариант или производное указанного опухолевого антигена; и где каждая из нуклеотидных последовательностей кодирует отличный от других пептид или белок; и где по меньшей мере одна из нуклеотидных последовательностей кодирует 5Т4, 707-АР, 9D7, AFP, AlbZIP HPG1, альфа-5-бета-1-интегрин, альфа-5-бета-6-интегрин, альфа-актинин-4/m, альфа-метилацил-кофермент А-рацемазу, ART-4, ARTC1/m, В7Н4, BAGE-1, BCL-2, bcr/abl, бета-катенин/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA 19-9, CA72-4, CA125, калретикулин, CAMEL, CASP-8/m, катепсин В, катепсин L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, коактозин-подобный белок, коллаген XXIII, COX-2, CT-9/BRD6, Cten, циклин B1, циклин D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, EphВ3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, гепсин, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, гомеобокс NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, незрелый ламининовый рецептор, каллекреин-2, каллекреин-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, маммоглобин A, MART-1/мелан-А, MART-2, MART-2/m, матриксный белок 22, MC1R, M-CSF, ME1/m, мезотелин, MG50/PXDN, MMP11, MN/CA IХ-антиген, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, миозин класса I/m, NA88-A, N-ацетилглюкозаминилтрансферазу-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, остеокальцин, остеопонтин, pi5, pi90 минорный bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-киназу, Pin-1, Pml/PARaльфa, POTE, PRAME, PRDX5/m, простеин, протеиназу-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, сурвивин, сурвивин-2 В, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGFбета, TGFбетаRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, тирозиназу, UPA, VEGF, VEGFR-2/FLK-1, WT1 и иммуноглобулиновый идиотип лимфоидной кровяной клетки или идиотип Т-клеточного рецептора, или фрагмент, вариант или производное указанного опухолевого антигена; предпочтительно сурвивин или его гомолог, антиген семейства MAGE или его связывающий партнер или фрагмент, вариант или производное указанного опухолевого антигена. Наиболее предпочтительными в этом контексте являются опухолевые антигены NY-ESO-1, 5Т4, MAGE-C1, MAGE-C2, сурвивин, Muc-1, PSA, PSMA, PSCA, STEAP и РАР.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты кодирует белок или пептид, который содержит терапевтический белок или его фрагмент, вариант или производное.

В контексте настоящего описания терапевтические белки представляют собой пептиды или белки, которые оказывают полезное действие при лечении любого врожденного или приобретенного заболевания или которые улучшают состояние индивидуума. В частности, терапевтические белки имеют важное значение для создания терапевтических средств, которые могут помимо осуществления других функций модифицировать и осуществлять репарацию генетических ошибок, разрушать раковые клетки или инфицированные патогеном клетки, лечить нарушения иммунной системы, лечить метаболические или эндокринные нарушения. Например, эритропоэтин (ЕРО), белковый гормон, можно применять для лечения пациентов с дефицитом эритроцитов, который является обычной причиной почечных осложнений. Кроме того, под понятие «терапевтические белки» подпадают адъювантные белки, терапевтические антитела, а также гормонзаместительная терапия, которую применяют, например, при лечении женщин в период менопаузы. В более современных подходах используют соматические клетки пациента для перепрограммирования их в плюрипотентные стволовые клетки, что является заменой спорной терапии на основе стволовых клеток. Такие белки, применяемые для перепрограммирования соматических клеток или применяемые для дифференцировки стволовых клеток, также рассматриваются как терапевтические белки в контексте настоящего описания. Кроме того, терапевтические белки можно применять и для других целей, например, для заживления ран, регенерации тканей, ангиогенеза и т.д. Кроме того, в контексте настоящего описания антигенпрезентирующие В-клеточные рецепторы и их фрагменты и варианты рассматриваются как терапевтические белки.

Таким образом, терапевтические белки можно применять для различных целей, включая лечение различных заболеваний, таких, например, как инфекционные заболевания, неоплазмы (например, раковые или опухолевые заболевания), заболевания крови или кроветворных органов, эндокринных, связанных с питанием или метаболических заболеваний, заболеваний нервной системы, заболеваний системы кровообращения, заболеваний дыхательной системы, заболеваний пищеварительной системы, заболеваний кожи и подкожной ткани, заболеваний скелето-мышечной системы и соединительной ткани, и заболеваний мочеполовой системы, независимо от того, являются ли они врожденными или приобретенными.

В этом контексте наиболее предпочтительными терапевтическими белками, которые можно применять, среди прочего, для лечения метаболических или эндокринных нарушений, являются (в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок): кислая сфингомиелиназа (болезнь Нимана-Пика), адипотид (ожирение), агалзидаза-бета (человеческая галактозидаза А) (болезнь Фабри; препятствует накоплению липидов, которое может приводить к почечным и сердечно-сосудистым осложнениям), алглукозидаза (болезнь Помпе (гликогеноз (накопление гликогена) типа II)), альфа-галактозидаза А (альфа-GAL А, агалзидаза-альфа) (болезнь Фабри), альфа-глюкозидаза (гликогеноз (GSD), болезнь Помпе), альфа-L-идуронидаза (мукополисахаридоз (MPS), синдром Гурлер, синдром Шейе), альфа-N-ацетилглюкозаминидаза (синдром Санфилиппо), амфирегулин (рак, метаболическое нарушение), ангиопоэтин ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (ангиогенез, стабилизирует сосуды), бетацеллюлин (метаболическое нарушение), бета-глюкуронидаза (синдром Слая), костный морфогенетический белок BMP (ВМР1, ВМР2, ВМР3, ВМР4, ВМР5, ВМР6, ВМР7, ВМР8а, BMP8b, ВМР10, ВМР15) (регенеративное действие, состояния, связанные с костной тканью, хроническое заболевание почек (CKD)), белок CLN6 (болезнь, вызванная мутациями в локусе CLN6 - атипичный поздний инфантилизм, вариант с поздним началом, ранний ювенильный, нейрональный цероид-липофусциноз (NCL)), эпидермальный фактор роста (EGF) (заживление ран, регуляция роста, пролиферации и дифференцировки клеток), эпиген (метаболическое нарушение), эпирегулин (метаболическое нарушение), фактор роста фибробластов (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (заживление ран, ангиогенез, эндокринные нарушения, регенерация ткани), галсульфаза (мукополисахаридоз типа VI), грелин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), глюкоцереброзидаза (болезнь Гоше), GM-CSF (регенеративное действие, производство лейкоцитов, рак), гепаринсвязывающий EGF-подобный фактор роста (HB-EGF) (заживление ран, гипертрофия сердца и развитие и функция сердца), фактор роста гепатоцитов HGF (регенеративное действие, заживление ран), гепсидин (нарушения метаболизма железа, бета-талассемия), человеческий альбумин (пониженное производство альбумина (гипопротеинемия), повышенная потеря альбумина (нефротический синдром), гиповолемия, гипербилирубинемия), идурсульфаза (идуронат-2-сульфатаза) (мукополисахаридоз типа II (синдром Хантера)), интегрины αVβ3, αVβ5 и α5β1 (связывают матриксные макромолекулы и протеиназы, ангиогенез), идуронатсульфатаза (синдром Хантера), ларонидаза (мукополисахаридоз типа I, формы Гурлер и Гурлер-Шайе), N-ацетилгалактозамин-4-сульфатаза (rhASB; галсульфаза, арилсульфатаза A (ARSA), арилсульфатаза В (ARSB)) (дефицит арилсульфатазы В, синдром Марото-Лами, мукополисахаридоз типа VI), N-ацетилглюкозамин-6-сульфатаза (синдром Санфилиппо), фактор роста нервов (NGF, мозговой нейротрофический фактор (BDNF), нейротрофин-3 (NT-3) и нейротрофин 4/5 (NT-4/5) (регенеративное действие, сердечно-сосудистые заболевания, коронарный атеросклероз, ожирение, диабет типа 2, метаболический синдром, острые коронарные синдромы, деменция, депрессия, шизофрения, аутизм, синдром Ретта, нервная анорексия, нервная булимия, заживление ран, кожные язвы, изъязвления роговицы, болезнь Альцгеймера), нейрегулин (NRG1, NRG2, NRG3, NRG4) (метаболическое нарушение, шизофрения), нейропилин (NRP-1, NRP-2) (ангиогенез, управление аксонами, выживание, миграция клеток), обестатин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), фактор роста тромбоцитов (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (регенеративное действие, заживление ран, нарушение ангиогенеза, артериосклероз, фиброз, рак), рецепторы TGF-бета (эндоглин, рецептор TGF-бета 1, рецептор TGF-бета 2, рецептор TGF-бета 3) (почечный фиброз, заболевание почек, диабет, терминальная стадия почечной болезни (ESRD), ангиогенез), тромбопоэтин (ТНРО) (фактор роста и развития мегакариоцитов (MGDF)) (тромбоцитарные нарушения, тромбоциты для донорской сдачи, восстановление уровня тромбоцитов после миелосупрессорной химиотерапии), трансформирующий фактор роста (TGF (TGF-альфа, TGF-бета (TGFбета1, TGFбета2 и TGFбета3))) (регенеративное действие, заживление ран, иммунитет, рак, заболевание сердца, диабет, синдром Марфана, синдром Лоеса-Дитца), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F и PIGF) (регенеративное действие, ангиогенез, заживление ран, рак, проницаемость), несритид (острая декомпенсированная застойная сердечная недостаточность), трипсин (декубитальная язва, варикозная язва, санация струпа, спонтанно раскрывающаяся рана, солнечный ожог, мекониевая непроходимость кишечника), адренокортикотропный гормон (АСТН) (болезнь Аддисона, мелкоклеточная саркома, адренолейкодистрофия, врожденная гиперплазия надпочечников, синдром Кушинга, синдром Нельсона, детские спазмы), предсердный натрийуретический пептид (ANP) (эндокринные нарушения), холецистокинин (различной длины), гастрин (гипогастринемия), лептин (диабет, гиперглицинемия, ожирение), окситоцин (стимулирует грудное кормление, ненаступление родов), соматостатин (симптоматическое лечение карционоидного синдрома, острое варикозное кровотечение и акромегалия, поликистозные заболевания печени и почек, акромегалия и симптомы, вызываемые нейроэндокринными опухолями), вазопрессин (антидиуретический гормон) (несахарный диабет), кальцитонин (постменопаузальный остеопороз, гиперкальциемия, болезнь Пэджета, метастазы в костную ткань, фантомная боль к конечностях, спинальный стеноз), экзенатид (диабет типа 2, устойчивый к обработке метформином и сульфонилмочевиной), гормон роста (GH), соматотропин (нарушение роста вследствие дефицита GH или хронической печеночной недостаточности, синдром Прадера-Вилли, синдром Турнера, обусловленное СПИДом истощение или кахексия при осуществлении противовирусной терапии), инсулин (сахарный диабет, диабетический кетоацидоз, гиперкалиемия), инсулиноподобный фактор роста 1 IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мекасермин ринфабат, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мегасермин, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), пэгвисомант (акромегалия), прамлинтид (сахарный диабет, в комбинации с инсулином), терипаратид (человеческий паратиреоидный гормон, остатки 1-34) (серьезный остеопороз), бекаплермин (вспомогательное средство при санации диабетических язв), диботермин-альфа (костный морфогенный белок 2) (хирургическая операция по закреплению позвоночника (Spinal Fusion), восстановление кости при повреждении), гистрелина ацетат (гонадотропин-рилизинг гормон; GnRH) (преждевременное половое созревание), октреотид (акромегалия, симптоматическое ослабление VIP-секретирующей аденомы и метастатических карциноидных опухолей) ипалифермин (фактор роста кератиноцитов; KGF) (серьезный оральный мукозит у пациентов, подвергающихся химиотерапии, заживление ран).

Указанные и другие белки рассматриваются как терапевтические, поскольку они предназначены для лечения индивидуума путем возмещения нарушенного эндогенного производства в его организме функционального белка в достаточных количествах. Следовательно, такие терапевтические белки, как правило, представляют собой белки млекопитающих, прежде всего человеческие белки.

Для лечения нарушений крови, заболеваний системы кровообращения, заболеваний дыхательной системы, раковых или опухолевых заболеваний, инфекционных заболеваний или иммунодефицитов можно применять следующие терапевтические белки: альтерплаза (активатор тканевого плазминогена; tPA) (легочная эмболия, инфаркт миокарда, острый ишемический инсульт («удар»), окклюзия устройств центрального венозного доступа), анистреплаза (тромболизис), антитромбин III (АТ-III) (наследственный дефицит АТ-III, тромбоэмболия), бивалирудин (снижает риск свертывания крови при коронарной ангиопластике и индуцированной гепарином тромбоцитопении), дарбепоэтин-альфа (лечение анемии у пациентов с хронической почечной недостаточностью и хроническим почечным нарушением (+/- диализ)), дротрекогин-альфа (активированный белок С) (серьезный сепсис с высоким риском смерти), эритропоэтин, эпоэтин-альфа, эритропоэтин, эритропоетин (анемия при хроническом заболевании, миелодисплазия, анемия при почечной недостаточности или при осуществлении химиотерапии, предоперационная подготовка), фактор IX (гемофилия В), фактор VIIa (кровоизлияние у пациентов с гемофилией А или В и при применении ингибиторов фактора VIII или фактора IX), фактор VIII (гемофилия А), лепирудин (индуцируемая гепарином тромбоцитопения), концентрат белка С (венозный тромбоз, молниеносная пурпура), ретеплаза (делеция мутеина в tPA) (лечение острого инфаркта миокарда, улучшение функции желудочков), стрептокиназа (остро развивающийся трансмуральный инфаркт миокарда, легочная эмболия, тромбоз глубоких вен, артериальный тромбоз или эмболия, окклюзия артериовенозной канюли), тенестеплаза (острый инфаркт миокарда), урокиназа (легочная эмболия), ангиостатин (рак), анти-СD22 иммунотоксин (рецидивирующий острый миелоидный СD33+-лейкоз), денилейкин дифтитокс (кожная Т-клеточная лимфома (CTCL)), иммуноцианин (рак мочевого пузыря и предстательной железы), MPS (металлопанстимулин) (рак), афлиберцепт (немелкоклеточный рак легкого (NSCLC), метастатический колоректальный рак (mCRC), гормон-устойчивый метастатический рак предстательной железы, влажная форма дегенерации желтого пятна), эндостатин (рак, воспалительные заболевания типа ревматоидного артрита, а также болезнь Крона, диабетическая ретинопатияпсориаз и эндометриоз), коллагеназа (санация хронических кожных язв и областей серьезных ожогов, контрактура Дюпюитрена, болезнь Пейрони), человеческая дезоксирибонуклеаза I, дорназа (муковисцидоз; уменьшение инфекций респираторного тракта у выбранных пациентов с FVC, превышающим более чем на 40% предсказанную величину), гиалуронидаза (применяется в качестве адъюванта для повышения абсорбции и диспергирования инъецированных лекарственных средств, прежде всего анестезирующих средств при глазной хирургии и определенных визуализирующих агентов), папаин (санация некротической ткани или разжижение отторгающихся некротических масс при острых и хронических повреждениях, таких как пролежни, варикозные и диабетические язвы, ожоги, послеоперационные раны, пилонидальные кистозные раны, карбункулы и другие раны), L-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), пэг-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), расбуриказа (пациенты детского возраста с лейкозом, лимфомой и солидными опухолями, подвергающиеся противораковой терапии, которая может вызывать синдром лизиса опухоли), человеческий хорионный гонадотропин (HCG) (улучшает репродуктивную функцию), человеческий фолликулостимулирующий гормон (FSH) (улучшает репродуктивную функцию), лутропин-альфа (бесплодие, сопровождающееся дефицитом лютениизирующего гормона), пролактин (гипопролактинемия, дефицит сывороточного пролактина, дисфункция яичника у женщин, состояние страха, артериогенная эректильная дисфункция, преждевременное семяизвержение, олигозооспермия, астеноспермия, пониженная функция семенных пузырьков, гипоандрогенизм у мужчин), ингибитор альфа-1-протеиназы (врожденный дефицит антитрипсина), лактаза (газообразование, вздутие, спазмы и диарея вследствие неспособности расщеплять лактозу), панкреатические ферменты (липаза, амилаза, протеиназа) (муковисцидоз, хронический панкреатит, панкреатическая недостаточность, состояние после операции желудочного шунтирования по Билльрот типа II (Billroth II), обструкция протоков поджелудочной железы, стеаторрея, недостаточное пищеварение, газообразование, вздутие), аденозиндеаминаза (бычья пегадемаза, PEG-ADA) (заболевания с серьезным комбинированным иммунодефицитом вследствие дефицита аденозиндеаминазы), абатецепт (ревматоидный артрит (прежде всего, рефракторный в отношении ингибирования TNF-альфа)), алефацепт (бляшковидный псориаз), анакинра (ревматоидный артрит), этанецепт (ревматоидный артрит, многосуставной юношеский ревматоидный артрит, псориатический артрит, анкилоизирующий спондилит, бляшковидный псориаз, анкилоизирующий спондилит), анти\агонист рецептора интерлейкина-1 (IL-1), анакинра (воспаление и деградация хряща, ассоциированная с ревматоидным артритом), тимулин (нейродегенеративные заболевания, ревматизм, нервная анорексия), антагонист TNF-альфа (аутоиммунные заболевания, такие как ревматоидный артрит, анкилоизирующий спондилит, болезнь Крона, псориаз, гнойный гидраденит, рефрактерная астма), энфувиртид (HIV-1-инфекция) и тимозин α1 (гепатит В и С)

(в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок)

Следующим объектом настоящего изобретения является вектор, содержащий

а. открытую рамку считывания (ОРС) и/или сайт клонирования, например, предназначенный для встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания; и

б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), содержащий нуклеотидную последовательность, которая происходит из 3'-UTR гена рибосомального белка.

По меньшей мере один 3'-UTR-элeмeнт и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении. Сайт клонирования может представлять собой любую последовательность, пригодную для интродукции открытой рамки считывания или последовательности, содержащей открытую рамку считывания, такую как одни или несколько сайтов рестрикции. Так, вектор, содержащий сайт клонирования, предпочтительно является пригодным для встраивания открытой рамки считывания в вектор, предпочтительно для встраивания открытой рамки считывания с 5'-стороны относительно 3'-UTR-элемента. Предпочтительно, сайт клонирования или ОРС располагают с 5'-стороны относительно 3'-UTR-элeмeнта, предпочтительно в непосредственной близости от 5'-конца 3'-UTR-элeмeнтa. Например, сайт клонирования или ОРС можно непосредственно присоединять к 5'-концу 3'-UTR-элeмeнтa или их можно присоединять посредством сегмента нуклеотидов, например, сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, как описано выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.

Предпочтительно вектор, предлагаемой в настоящем изобретении, можно применять для производства искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно производства искусственной мРНК, предлагаемой в настоящем изобретении, например, необязательно путем встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания, в вектор и транскрибирования вектора. Так, предпочтительно вектор содержит элементы, необходимые для транскрипции, такие как промотор, например, промотор РНК-полимеразы. Предпочтительно вектор пригоден для транскрипции с использованием эукариотической, прокариотической, вирусной или фаговой систем транскрипции, таких как эукариотические клетки, прокариотические клетки или эукариотические, прокариотические, вирусные или фаговые системы транскрипции in vitro. Так, например, вектор может содержать промоторную последовательность, которая распознается полимеразой, такой как РНК-полимераза, например, эукариотической, прокариотической, вирусной или фаговой РНК-полимеразой. В предпочтительном варианте осуществления изобретения вектор содержит промотор РНК-полимеразы фага, такой как промотор SP6, Т3 или Т7, предпочтительно промотор Т7. Предпочтительно вектор пригоден для транскрипции in vitro с использованием системы транскрипции in vitro на основе фага, такой как система транскрипции in vitro на основе РНК-полимеразы Т7.

В другом предпочтительном варианте осуществления изобретения вектор можно применять непосредственно для экспрессии кодируемого пептида или белка в клетках или ткани. Для этой цели вектор содержит конкретные элементы, необходимые для экспрессии в указанных клетках/ткани, например, конкретные последовательности промотора, такого как промотор CMV.

Вектор может содержать также поли(А)-последовательность и/или сигнал полиаденилирования, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.

Вектор может представлять собой РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой ДНК-вектор. Вектор может представлять собой любой вектор, известный специалисту в данной области, такой как вирусный вектор или плазмидный вектор. Предпочтительно вектор представляет собой плазмидный вектор, предпочтительно плазмидный ДНК-вектор.

В предпочтительном варианте осуществления изобретения вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении.

В одном из вариантов осуществления изобретения ДНК-вектор, предлагаемый в изобретении, содержит нуклеотидную последовательность, идентичную по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 10-115.

Предпочтительно ДНК-вектор, предлагаемый в настоящем изобретении, содержит последовательность, представленную в SEQ ID NO: 1, SEQ ID NO: 3, последовательность, комплементарную SEQ ID NO: 7 или последовательности, идентичные по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, или ее фрагменту, описанному выше, предпочтительно ее функциональному фрагменту.

Предпочтительно РНК-вектор, предлагаемый в настоящем изобретении, содержит последовательность, представленную в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7 или последовательность, идентичную по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7 или ее фрагменту, предпочтительно ее функциональному фрагменту.

Предпочтительно вектор представляет собой кольцевую молекулу. Предпочтительно вектор представляет собой двухцепочечную молекулу, такую как двухцепочечная молекула ДНК. Такую кольцевую, предпочтительно двухцепочечную молекулу ДНК можно использовать в качестве удобной формы хранения предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты. Кроме того, ее можно применять для трансфекции клеток, например, культивируемых клеток. Ее можно использовать также для транскрипции in vitro для получения искусственной молекулы РНК, предлагаемой в изобретении.

Предпочтительно вектор, предпочтительно кольцевой вектор, можно линеаризовать, например, путем расщепления рестриктазой. В предпочтительном варианте осуществления изобретения вектор содержит сайт расщепления, такой как сайт рестрикции, предпочтительно уникальный сайт расщепления, непосредственно примыкающий с 3'-стороны к 3'-UTR-элементу, или с 3'-стороны к поли(А)-последовательности или сигналу полиаденилирования, если она/он присутствует, или с 3'-стороны к подподпоследовательности, если она присутствует, или с 3'-стороны к гистоновой структуре типа «стебель-петля», если она присутствует. Так, предпочтительно продукт, полученный в результате линеаризации вектора, заканчивается на 3'-конце 3'-концом 3'-UTR-элемента или 3'-концом поли(А)-последовательности или сигналом полиаденилирования, если она/он присутствует, или 3'-концом поли(С)-последовательности, если она присутствует. В варианте осуществления изобретения, в котором вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, сайт рестрикции, предпочтительно уникальный сайт рестрикции, предпочтительно примыкающий непосредственно с 3'-стороны к 3'-концу искусственной молекулы нуклеиновой кислоты.

Следующий объект настоящего изобретения относится к клетке, содержащей искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, или вектор, предлагаемый в настоящем изобретении. Клетка может представлять собой любую клетку, такую как бактериальная клетка, клетка насекомого, клетка растения, клетка позвоночного, например, клетка млекопитающего. Такую клетку можно применять, например, для репликации вектора, предлагаемого в настоящем изобретении, например, в клетке бактерии. Кроме того, клетку можно применять для осуществления транскрипции искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, и/или для трансляции открытой рамки считывания искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении. Например, клетку можно применять для производства рекомбинантного белка.

Согласно настоящему изобретению клетки можно получать, например, с помощью стандартных методов переноса нуклеиновой кислоты, таких как стандартные методы трансфекции, трансдукции или трансформации. Например, искусственную молекулу нуклеиновой кислоты или вектор, предлагаемую/предлагаемый в настоящем изобретении, можно переносить в клетку путем электропорации, липофекции, например, с использованием катионных липидов и/или липосом, осаждения фосфатом кальция, трансфекции на основе наночастиц, трансфекции, основанной на применении вирусов или на основе катионных полимеров, таких как DEAE-декстран или полиэтиленимин и т.д.

Предпочтительно клетка представляет собой клетку млекопитающего, такую как клетка человека, домашнего животного, лабораторного животного, такую как клетка мыши или крысы. Предпочтительно клетка представляет собой человеческую клетку. Клетка может представлять собой клетку культивируемой клеточной линии, такой как СНО, ВНК, 293Т, COS-7, HELA, НЕК и т.д. или клетка может представлять собой первичную клетку, такую как человеческая кожная фибробластная (HDF) клетка и т.д., предпочтительно клетку, выделенную из организма. В предпочтительном варианте осуществления изобретения клетка представляет собой выделенную клетку млекопитающего, предпочтительно человека. Например, клетка может представлять собой иммунную клетку, такую как дендритная клетка, раковую или опухолевую клетку, или любую соматическую клетку и т.д., предпочтительно млекопитающего, предпочтительно человека.

Следующим объектом настоящего изобретения является фармацевтическая композиция, содержащая искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, или клетку, предлагаемую в настоящем изобретении. Фармацевтическую композицию, предлагаемую в изобретении, можно применять, например, в качестве вакцины, например, для генетической вакцинации. Так, ОРС может, например, кодировать антиген, предназначенный для введения пациенту с цель вакцинации. Так, в предпочтительном варианте осуществления изобретения фармацевтическая композиция, предлагаемая в настоящем изобретении, представляет собой вакцину. Кроме того, фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять, например, для генной терапии.

Предпочтительно фармацевтическая композиция содержит также один или несколько фармацевтически приемлемых наполнителей, разбавителей и/или эксципиентов и/или один или несколько адъювантов. В контексте настоящего изобретения фармацевтически приемлемый наполнитель, как правило, включает жидкую или нежидкую основу предлагаемой в изобретении фармацевтической композиции. Если предлагаемая в изобретении фармацевтическая композиция находится в жидкой форме, но носитель, как правило, может представлять собой свободную от пирогенов воду; изотонический соляной раствор или забуференные (водные) растворы, например, растворы, забуференные фосфатом, цитратом и т.д. Предназначенный для инъекции буфер может быть гипертоническим, изотоническим или гипотоническим относительно конкретной референс-среды, т.е. содержание в буфере солей может быть выше, идентичным или ниже их содержания в конкретной референс-среде, при этом предпочтительно можно применять такие концентрации вышеуказанных солей, которые не приводят к повреждению клеток в результате осмоса или других связанных с концентрацией воздействий. Референс-среды могут представлять собой, например, жидкости, применяемые в методах «in vivo», такие как кровь, лимфа, цитозольные жидкости или другие жидкости организма, или, например, жидкости, которые можно использовать в качестве референс-сред в методах «in vitro», такие как обычные буферы или жидкости. Указанные обычные буферы или жидкости известны специалисту в данной области. Наиболее предпочтительной жидкой основой является лактированный раствор Рингера.

В предлагаемой в изобретении фармацевтической композиции можно использовать также один или несколько совместимых твердых или жидких наполнителей или разбавителей или капсулирующих соединений, которые можно применять для введения пациенту, подлежащему лечению. Понятие «совместимые» в контексте настоящего описания означает, что указанные компоненты предлагаемой в изобретении фармацевтической композиции можно смешивать с предлагаемой в изобретении нуклеиновой кислотой, указанной в настоящем описании, таким образом, чтобы не происходило взаимодействия, которое могло бы существенно снижать фармацевтическую эффективность предлагаемой в изобретении фармацевтической композиции в обычных условиях применения.

Фармацевтическая композиция, предлагаемая в настоящем изобретении, может необязательно содержать также один или несколько дополнительных фармацевтически активных компонентов. В данном контексте фармацевтически активный компонент представляет собой соединение, которое обладает терапевтическим действием в отношении лечения, облегчения или предупреждения конкретного показания или заболевания. Такие соединения включают (но, не ограничиваясь только ими) пептиды или белки, нуклеиновые кислоты, (терапевтически активные) низкомолекулярные органические или неорганические соединения (с молекулярной массой менее 5000, предпочтительно менее 1000), сахара, антигены или антитела, терапевтические агенты, уже известные из существующего уровня техники, антигенные клетки, антигенные клеточные фрагменты, клеточные фракции; компоненты клеточной оболочки (например, полисахариды), модифицированные, ослабленные или дезактивированные (например, химическим путем или путем облучения) патогены (вирусы, бактерии и т.д.), адъюванты, предпочтительно указанные в настоящем описании, и т.д.

Кроме того, предлагаемая в изобретении фармацевтическая композиция может содержать носитель для искусственной молекулы нуклеиновой кислоты или вектора. Такой носитель может быть пригоден для облегчения растворения в физиологически приемлемых жидкостях, транспортировки и поглощения клеткой фармацевтически активной искусственной молекулы нуклеиновой кислоты или вектора. Следовательно, такой носитель может представлять собой компонент, который может быть пригоден для хранения и доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в изобретении. Такие компоненты могут представлять собой, например, катионные или поликатионные носители или соединения, которые могут служить в качестве агентов для трансфекции или комплексообразования.

В этом контексте наиболее предпочтительными агентами для трансфекции или комплексообразования являются катионные или поликатионные соединения, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды, Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, MPG-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны.

Кроме того, такие катионные или поликатионные соединения могут представлять собой катионные или поликатионные пептиды или белки, которые предпочтительно содержат или дополнительно модифицированы так, чтобы они содержали по меньшей мере одну -SH-группу. Предпочтительно катионный или поликатионный носитель выбирают из катионных пептидов, имеющих следующую общую формулу (I):

в которой l+m+n+o+x=3-100 и l, m, n или о независимо друг от друга обозначают любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 и 91-100, при условии, общее содержание Arg (аргинин), Lys (лизин), His (гистидин) и Orn (орнитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде; а Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His или Orn; и x может обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, при условии, что общее содержание Хаа не превышает 90% от общего содержания аминокислот в олигопептиде. Любую из аминокислот Arg, Lys, His, Orn и Хаа можно помещать в любое положение пептида. В этом контексте наиболее предпочтительными являются катионные пептиды или белки, содержащие 7-30 аминокислот.

Кроме того, катионный или поликатионный пептид или белок, определяемый формулой {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (формула (I)), представленной выше, который содержит или дополнительно модифицирован так, что он содержал по меньшей мере одну -SH-группу, можно выбирать (но, не ограничиваясь только этим) из соединений подформулы (Iа):

в которой (Arg)l;(Lys)m;(His)n;(Orn)o; и х имеют указанные выше значения, Хаа' обозначает любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His, Orn или Cys, и y обозначает любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 и 81-90, условии, что общее содержание Arg (аргинин), Lys (лизин), His (гистидин) и Orn (оринитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде. Кроме того, катионный или поликатионный пептид можно выбирать из соединений подформулы (Iб):

в которой эмпирическая формула {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (формула (III)) представлена в настоящем описании и образует ядро аминокислотной последовательности, представленной (полуэмприрической) формулой (III), и в которой Cys1 и Cys2 обозначают остатки цистеина, расположенные проксимально или терминально относительно (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x.

Другие предпочтительные катионные или поликатионные соединения, которые можно применять в качестве агентов для трансфекции, могут представлять собой катионные полисахариды, например, хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.

Согласно другому варианту осуществления изобретения фармацевтическая композиция, предлагаемая в изобретении, может содержать адъювант для повышения иммуностимулирующих свойств фармацевтической композиции. В данном контексте под адъювантом можно понимать любое соединение, которое пригодно для облегчения введения и доставки компонентов, таких как искусственная молекула нуклеиновой кислоты или вектор, которая/который содержится в фармацевтической композиции, предлагаемой в изобретении. Кроме того, такой адъювант может (но, не ограничиваясь только этим) инициировать или усиливать иммунный ответ врожденной иммунной системы, т.е. неспецифический иммунный ответ. Иными словами, после введения фармацевтическая композиция, предлагаемая в изобретении, как правило, инициирует адаптивный иммунный ответ, направленный на антиген, кодируемый искусственной молекулой нуклеиновой кислоты. Кроме того, фармацевтическая композиция, предлагаемая в изобретении, может вызывать (поддерживающий) врожденный иммунный ответ благодаря добавлению адъюванта, указанного в настоящем описании, к фармацевтической композиции, предлагаемой в изобретении.

Такой адъювант можно выбирать из любого адъюванта, известного специалисту в данной области и пригодного для рассматриваемого случая, т.е. для поддержания индукции иммунного ответа у млекопитающего. Предпочтительно адъювант можно выбирать из группы, включающей (но, не ограничиваясь только ими) TDM, MDP, мурамилдипептид, плюроники, раствор квасцов, гидроксид алюминия, ADJUMER™ (полифосфазен); гель фосфата алюминия; глюканы, выделенные из водорослей; алгаммулин; гель гидроксида алюминия (квасцы); высокоадсорбирующий белки гель гидроксида алюминия; обладающий низкой вязкостью гель гидроксида алюминия; AF или SPT (эмульсия, содержащая сквалан (5%), Твин 80 (0.2%), плюроник L121 (1,25%), забуференный фосфатом физиологический раствор, рН 7,4); AVRIDINE™ (пропандиамин); BAY R1005™ ((N-(2-дезокси-2-L-леуциламиноб-D-глюкопиранозил)-N-октадециламида гидроацетат); CALCITRIOL™ (1-альфа,25-дигидрокси-витамин D3); гель фосфата кальция; САР™ (наночастицы фосфата кальция); холерный голотоксин, слитый белок холерный токсин-А1-белок-A-D-фрагмент, субъединица В холерного токсина; CRL 1005 (блок-сополимер Р1205); содержащие цитокин липосомы; DDA (диметилдиоктадециламмония бромид); DHEA (дегидроэпиандростерон); DMPC (димиристоилфосфатидилхолин); DMPG (димиристоилфосфатидилглицерин); комплекс DOC/квасцы (натриевая соль дезоксихолиновой кислоты); полный адъювант Фрейнда; неполный адъювант Фрейнда; инулин-гамма; адъювант Гербу (смесь, содержащая: I) N-ацетилглюкозаминил-(Р1-4)-N-ацетилмурамоил-L-аланил-D35 глутамин (GMDP), II) диметилдиоктадециламмония хлорид (DDA), III) комплекс цинк-соль L-пролина (ZnPro-8); GM-CSF); GMDP (N-ацетилглюкозаминил-(b1-4)-N-ацетилмурамил-L47 аланил-D-изоглутамин); имиквимод (1-(2-метилпропил)-1Н-имидазо[4,5-с]хинолин-4-амин); ImmTher™ (N-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-изоGlu-L-Ala-глицерина дипальмитат); DRV (иммунолипосомы, приготовленные из везикул, полученных методом гидратации-регидратации); интерферон-гамма; интерлейкин-1бета; интерлейкин-2; интерлейкин-7; интерлейкин-12; ISCOMSTM; ISCOPREP 7.0.3. ТМ; липосомы; LOXORIBINE™ (7-аллил-8-оксогуанозин); оральный адъювант LT 5 (лабильный энтеротоксин-протоксин из E. coli); микросферы и микрочастицы любого состава; MF59TM; (водная эмульсия сквалена); MONTANIDE ISA 51™ (очищенный неполный адъювант Фрейнда); MONTANIDE ISA 720™ (метаболизируемый масляный адъювант); MPL™ (3-Q-дезацил-4'-монофосфорил-липид А); липосомы МТР-РЕ и МТР-РЕ ((N-ацетил-L-аланил-D-изоглутаминил-L-аланин-2-(1,2-дипальмитоил-sn-глицеро-3-(гидроксифосфорилокси))этиламид, однонатриевая соль); MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-ОСН3); MURAPALMITINE™ и DMURAPALMITINE™ (Мас-Mur-L-Thr-D-изоGIn-sn-глицериндипальмитоил); NAGO (нейраминидаза-галактозооксидаза); наносферы или наночастицы любого состава; NISV (везикулы из неионогенного поверхностно-активного вещества); PLEURAN™ β-глюкан); PLGA, PGA и PLA (гомо- и сополимеры молочной кислоты и гликолевой кислоты; микросферы/наносферы); ПЛЮРОНИК L121™; РММА (полиметилметакрилат); PODDS™ (протеноидные микросферы); полиэтиленкарбаматные производные; поли-rA:поли-rU (комплекс полиадениловая кислота-полиуридиновая кислота); полисорбат 80 (Твин 80); белковые кохлеаты (фирма Avanti Polar Lipids, Inc., Алабастер, шт. Алабама); STIMULON™ (QS-21); Quil-A (сапонин Quil-A); S-28463 (4-аминоотекдиметил-2-этоксиметил-1Н-имидазо[4,5-с]хинолин-1-этанол); SAF-1™ («композиция адъювантов фирмы Syntex»); протеолипосомы вируса Сендаи и липидные матрицы, содержащие вирус Сендаи; Спан-85 (сорбитантриолеат); Specol (эмульсия Marcol 52, Спан 85 и Твин 85); сквален или Robane® (2,6,10,15,19,23-гексаметилтетракозан и 2,6,10,15,19,23-гексаметил-2,6,10,14,18,22-тетракозагексан); стеарилтирозин (октадецилтирозина гидрохлорид); Theramid® (N-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-isoGlu-L-Ala-дипальмитоксипропиламид); Theronyl-MDP (Termurtide™ или [thr 1]-MDP; N-ацетилмурамил-L-треонил-D-изоглутамин); Ту-частицы (Ту-ВПЧ или вирусоподобные частицы); липосомы Уолтера-Рида (липосомы, содержащие липид А, адсорбированный на гидроксиде алюминия) и липопептиды, включая Pam3Cys, прежде всего соли алюминия, такие как адъю-фос (Adju-phos), алгидрогель, регидрагель и т.д., эмульсии, такие как CFA, SAF, IFA, MF59, провакс, TiterMax, монтанид, ваксфектин и т.д., сополимеры, такие как оптивакс (Optivax, CRL1005), L121, полоксамер 4010) и т.д., липосомы, такие как «липосомы-невидимки (Stealth)» и т.д., кохлеаты, такие как BIORAL, и т.д., адъюванты растительного происхождения, такие как QS21, Quil A, Iscomatrix, ISCOM; адъюванты, пригодные для костимуляции, включая томатин, биополимеры, такие как PLG, РММ, инулин и т.д., адъюванты микробного происхождения, такие как ромуртид, DETOX, MPL, CWS, манноза, нуклеотидные последовательности CpG, CpG7909, лиганды человеческого TLR 1-13, ISS-1018, 35 IC31, имидазохинолины, амплиген, Ribi529, IMOxine, IRIV, ВПЧ, холерный токсин, термолабильный токсин, Pam3Cys, флагеллин, GPI (гликозилфосфатидилинозитол)-якорь, LNFPIII/Lewis X, противомикробные пептиды, UC-1V150, слитый белок RSV, cdiGMP; и адъюванты, пригодные в качестве антагонистов, включая нейропептид CGRP.

Пригодные адъюванты можно выбирать также из катионных или поликатионных соединений, при этом адъювант предпочтительно получают путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию, и катионное или поликатионное соединение. Ассоциация или образование комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор входящую/входящий в фармацевтическую композицию, и катионные или поликатионные соединения, указанные в настоящем описании, предпочтительно обеспечивает присущие адъюванту свойства и оказывает стабилизирующее действие на искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию. Наиболее предпочтительно такие катионные или поликатионные соединения выбирают из катионных или поликатионных пептидов или белков, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды, Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, МРG-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны. Другими предпочтительными катионными или поликатионными соединениями могут являться катионные полисахариды, например хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTАР: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.

Кроме того, предпочтительные катионные или поликатионные белки или пептиды, которые можно применять в качестве адъюванта путем образования комплекса с искусственной молекулой нуклеиновой кислоты или вектором, предпочтительно РНК, включенной/включенным в композицию, можно выбирать из представленных ниже белков или пептидов, имеющих следующую общую формулу (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x, в которой l+m+n+o+х=8-15 и l, m, n или о независимо друг от друга могут обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, при условии, что общее содержание Arg, Lys, His и Orn составляет по меньшей мере 50% от общего содержания аминокислот в олигопептиде; и Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или ненативных аминокислот за исключением Arg, Lys, His или Orn; и x может обозначать любое число, выбранное из 0, 1, 2, 3 или 4, при условии, что общее содержание Хаа не должно превышать 50% от всех аминокислот в олигопептиде. Наиболее предпочтительными олигоаргининами в данном контексте являются, например, Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R и т.д.

Соотношение между искусственной нуклеиновой кислотой или вектором и катионным или поликатионным соединением можно рассчитывать на основе отношения содержания азота к содержанию фосфата (N/P-отношение) во всем включающем нуклеиновую кислоту комплексе. Например, 1 мкг РНК, как правило, содержит примерно 3 нмоля остатков фосфата, при условии, что для РНК характерно статистическое распределение оснований. Кроме того, 1 мл пептида, как правило, содержит примерно х нмолей остатков азота в зависимости от молекулярной массы и количества аминокислот. Если в качестве примера сделать расчет для (Arg)9 (молекулярная масса 1424 г/моль, 9 атомов азота), то 1 мкг (Arg)9 содержит примерно 700 пмолей (Arg)9 и, следовательно, 700×9=6300 пмолей аминокислот, т.е. 6,3 нмолей атомов азота. Можно рассчитать, что для массового соотношения PHK/(Arg)9, составляющего примерно 1:1, отношение N/P должно составлять примерно 2. Если в качестве примера сделать расчет для протамина (молекулярная масса примерно 4250 г/моль, 21 атом азота, если применяют протамин из лосося) при массовом соотношении, составляющем примерно 2:1, то для 2 мкг РНК РНК дает 6 нмолей фосфата; 1 мкг протамина содержит примерно 235 пмолей молекул протамина и, следовательно, 235×21=4935 пмолей атомов азота, т.е. 4,9 нмолей атомов азота. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 2:1, отношение N/P должно составлять примерно 0,81. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 8:1, отношение N/P должно составлять примерно 0,2. В контексте настоящего изобретения касательно соотношения нуклеиновая кислота : пептид в комплексе N/P-отношение предпочтительно находится примерно в пределах 0,1-10, предпочтительно примерно в пределах 0,3-4, и наиболее предпочтительно примерно в пределах 0,5-2 или 0,7-2, и наиболее предпочтительно примерно в пределах 0,7-1,5.

В заявке на патент WO 2010/037539, содержание которой включено в настоящее описание в качестве ссылки, описана иммуностимулирующая композиция и методы получения иммуностимулирующей композиции. Так, в предпочтительном варианте осуществления изобретения композицию получают, осуществляя две отдельные стадии для достижения и эффективного иммуностимулирующего действия, и эффективной трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении. Для этого на первой стадии получают так называемый «адъювантный компонент» путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно РНК, входящую в адъювантный компонент, и катионное или поликатионное соединение в конкретном соотношении для формирования стабильного комплекса. В этом контексте важно, чтобы в адъювантном компоненте отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение после образования комплекса с нуклеиновой кислотой. Таким образом, соотношение между нуклеиновой кислотой и катионным или поликатионным соединением в адъювантном компоненте, как правило, выбирают в таком диапазоне, чтобы нуклеиновая кислота была полностью включена в комплекс и отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение. Предпочтительно соотношение в адъювантном компоненте, т.е. соотношение между мРНК и катионным или поликатионным соединением, выбирают из диапазона, составляющего от примерно 6:1 (мас./мас.) до примерно 0,25:1 (мас./мас), более предпочтительно от примерно 5:1 (мас./мас.) до примерно 0,5:1 (мас./мас), еще более предпочтительно от примерно 4:1 (мас./мас.) до примерно 1:1 (мас./мас.) или от примерно 3:1 (мас./мас.) до примерно 1:1 (мас./мас.) и наиболее предпочтительно от примерно 3:1 (мас./мас.) до примерно 2:1 (мас./мас.).

Согласно предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют на второй стадии к входящей в комплекс молекуле нуклеиновой кислоты, предпочтительно РНК, адъювантного компонента для получения (иммуностимулирующей) композиции, предлагаемой в изобретении. При этом искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют в виде свободной нуклеиновой кислоты, т.е. нуклеиновой кислоты, которая не входит в комплекс с другими соединениями. Перед добавлением свободную искусственную молекулу нуклеиновой кислоты или вектор не включают в комплекс и предпочтительно после добавления адъювантного компонента она/он не должна/должен подвергаться какой-либо поддающейся обнаружению или значимой реакции комплексообразования.

Приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (II): GlXmGn, в которой: G обозначает гуанозин, урацил или аналог гуанозина или урацила; X обозначает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеуказанных нуклеотидов; 1 обозначает целое число от 1 до 40, при этом, когда l=1, то G представляет собой гуанозин или его аналог, когда l>1, то по меньшей мере 50% нуклеотидов представляют собой гуанозин или его аналог; m обозначает целое число и обозначает по меньшей мере 3; при этом, когда m=3, то X представляет собой урацил или его аналог, когда m>3, то по присутствуют меньшей мере 3 последовательно расположенных урацилов или аналогов урацила; n обозначает целое число от 1 до 40, при этом, когда n=1, то G представляет собой гуанозин или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов представляет собой гуанозин или его аналог.

Другие приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (III): ClXmCn, в которой: С обозначает цитозин, урацил или аналог цитозина или урацила; X обозначает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеуказанных нуклеотидов; 1 обозначает целое число от 1 до 40, при этом, когда l=1, то С представляет собой цитозин или его аналог, когда l>1, то по меньшей мере 50% нуклеотидов представляют собой цитозин или его аналог; m обозначает целое число и обозначает по меньшей мере 3; когда m=3, X представляет собой урацил или его аналог, когда m>3, то присутствуют по меньшей мере 3 последовательно расположенных урацила или аналогов урацила; n обозначает целое число от 1 до 40, при этом, когда n=1, то С представляет собой цитозин или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов представляют собой цитозин или его аналог.

Предлагаемая в настоящем изобретении фармацевтическая композиция предпочтительно содержит в «безопасном и эффективном количестве» компоненты фармацевтической композиции, прежде всего предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, вектор и/или клетки, представленные в настоящем описании. В контексте настоящего описания понятие «безопасное и эффективное количество» обозначает количество, достаточное для значимой индукции положительной модификации заболевания или нарушения, указанного в настоящем описании. Однако в то же время «безопасное и эффективное количество» должно быть таким, чтобы избегать серьезных побочных действий и обеспечивать разумное соотношение между преимуществом и риском. Определение этих пределов, как правило, находится в компетенции осуществляющего лечение врача.

Следующим объектом настоящего изобретения является искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенная/предназначенный для применения в качестве лекарственного средства, например, в качестве вакцины (для генетической вакцинации), или в генной терапии.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, наиболее пригодны для любого медицинского применения, в котором используется терапевтическое действие или эффект пептидов, полипептидов или белков, или в котором требуется добавление конкретного пептида или белка. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенные для применения при лечении или предупреждении заболеваний или нарушений, поддающихся лечению посредством терапевтического действия или эффекта пептидов, полипептидов или белков, или поддающихся лечению путем добавления пептида, полипептида или белка. Например, искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять для лечения или предупреждения генетических заболеваний, аутоиммунных заболеваний, раковых или связанных с опухолью заболеваний, инфекционных заболеваний, хронических заболеваний или т.п., например, путем генетической вакцинации или генной терапии.

В частности, такие терапевтические обработки, польза от которых определяется стабильным и пролонгированным присутствием терапевтических пептидов, полипептидов или белков в организме индивидуума, подлежащего лечению, являются наиболее пригодными в качестве медицинского подхода в контексте настоящего изобретения, поскольку предлагаемый в изобретении 3'-UTR-элемент обеспечивает стабильную и пролонгированную экспрессию пептида или белка, кодируемого предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты или предлагаемым в изобретении вектором. Так, наиболее пригодным медицинским применением искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, вектора, предлагаемого в настоящем изобретении, клетки, предлагаемой в настоящем изобретении, или фармацевтической композиции, предлагаемой в настоящем изобретении, является вакцинация. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, для вакцинации индивидуума, предпочтительно млекопитающего, более предпочтительно человека. Предпочтительными видами вакцинации являются вакцинация против инфекционных заболеваний, таких как бактериальные, вызываемые простейшими или вирусные инфекции, и противоопухолевая вакцинация. Такие виды вакцинации можно осуществлять в профилактических или терапевтических целях.

Можно выбирать ОРС в зависимости от заболевания, подлежащего лечению. Например, открытая рамка считывания может кодировать белок, который требуется поставлять в организм пациента, страдающего от полной потери или по меньшей мере от частичной потери функции белка, например, в организм пациента, страдающего генетическим заболеванием. Кроме того, открытую рамку считывания можно выбирать из ОРС, кодирующих пептид или белок, который оказывает благоприятное действие на заболевание или состояние пациента. Кроме того, открытая рамка считывания может кодировать пептид или белок, который осуществляет понижающую регуляцию патологического сверхпроизводства встречающегося в естественных условиях пептида или белка или элиминацию клеток, патологически экспрессирующих белок или пептид. Такое отсутствие, потеря функции или сверхпроизводство могут иметь место, например, в случае опухоли или неоплазии, при аутоиммунных заболеваниях, аллергиях, инфекциях или хронических заболеваниях, или т.п. Кроме того, открытая рамка считывания может кодировать антиген или иммуноген, например, эпитоп патогена или опухолевого антигена. Так, в предпочтительных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты или вектор, предлагаемая/предлагаемый в настоящем изобретении, содержит ОРС, кодирующую аминокислотную последовательность, содержащую или состоящую из последовательности антигена или иммуногена, например, эпитопа патогена или опухоль-ассоциированного антигена, 3'-UTR-элемент, указанный выше, и необязательно другие компоненты, такие как поли(А)-последовательность и т.п.

В контексте медицинского применения, прежде всего в контексте вакцинации, предпочтительно, чтобы искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляла собой РНК, предпочтительно мРНК, поскольку ДНК несет риск вызывания иммунного анти-ДНК-ответа и имеет тенденцию к встраиванию в геномную ДНК. Однако в некоторых вариантах осуществления изобретения, например, когда применяют вирусный носитель для доставки, такой как аденовирусный носитель для доставки, для доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, например, в контексте различных видов генного терапии, может оказаться желательным, чтобы искусственная молекула нуклеиновой кислоты или вектор представляла/представлял собой молекулу ДНК.

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить орально, парентерально, путем ингаляции с использованием спрея, местно, ректально, интраназально, трансбуккально, вагинально, с использованием имплантированного резервуара или посредством струйной инъекции. В контексте настоящего описания понятие «парентерально» включает методы подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, трансдермальной (чрескожной), внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. В предпочтительном варианте осуществления изобретения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят посредством безыгольной инъекции (например, струйной инъекции).

Предпочтительно искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят парентерально, например, путем парентеральной инъекции, более предпочтительно с помощью методов подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, трансдермальной (чрескожной), внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. Наиболее предпочтительными являются внутрикожная и внутримышечная инъекции. Стерильные инъекционные формы предлагаемой в изобретении фармацевтической композиции могут представлять собой водную или масляную суспензию. Такие суспензии можно приготавливать с помощью методов, известных в данной области, с применением пригодных диспергирующих или смачивающих средств. Предпочтительно, растворы или суспензии вводят посредством безыгольной инъекции (например, струйной инъекции).

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также орально в любой пригодной для орального введения лекарственной форме, включая (но, не ограничиваясь только ими) капсулы, таблетки, водные суспензии или растворы.

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также местно, прежде всего в тех случаях, когда мишень для лечения включает области или органы, легко доступные для местного нанесения, включая, например, заболевания кожи или любой другой доступной эпителиальной ткани. Для каждой из таких областей или органов можно легко приготавливать пригодные для местной обработки композиции. Для местного нанесения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно приготавливать в виде пригодной мази, суспендированной или растворенной в одном или нескольких носителях.

В одном из вариантов осуществления изобретения применение в качестве лекарственного средства включает стадию трансфекции клеток млекопитающих, предпочтительно трансфекцию in vitro или ex vivo клеток млекопитающих, более предпочтительно трансфекцию in vitro клеток, выделенных из организма пациента, подлежащего лечению лекарственным средством. Если применение включает трансфекцию in vitro выделенных клеток, то применение может предусматривать также повторное введение трансфектированных клеток пациенту. Применение предлагаемых в изобретении искусственных молекул нуклеиновой кислоты или вектора в качестве лекарственного средства может включать также стадию отбора успешно трансфектированных выделенных клеток. Таким образом, может оказаться целесообразным, чтобы вектор содержал также маркер для селекции. Применение в качестве лекарственного средства может включать также трансфекцию in vitro выделенных клеток и очистку продукта экспрессии, т.е. кодируемого пептида или белка из указанных клеток. Этот очищенный пептид или белок можно затем вводить индивидууму, нуждающемуся в этом.

В настоящем изобретении предложен также способ лечения или предупреждения заболевания или нарушения, указанного выше, заключающийся в том, что вводят искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, индивидууму, нуждающемуся в этом.

Кроме того, предложен способ лечения или предупреждения заболевания или нарушения, заключающийся в том, что осуществляют трансфекцию клетки искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении. Указанную трансфекцию можно осуществлять in vitro, ex vivo или in vivo. В предпочтительном варианте осуществления изобретения трансфекцию клетки осуществляют in vitro и трансфектированную клетку вводят индивидууму, нуждающемуся в этом, предпочтительно больному человеку. Предпочтительно клетка, которую требуется трансфектировать in vitro, представляет собой клетку, выделенную из организма индивидуума, предпочтительно больного человека. Таким образом, в настоящем изобретении предложен способ лечения, заключающийся в том, что осуществляют стадии, на которых выделяют клетку из организма индивидуума, предпочтительно из организма больного человека, трансфектируют выделенную клетку искусственной нуклеиновой кислотой, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении, и вводят трансфектированную клетку индивидууму, предпочтительно больному человеку.

Способ лечения или предупреждения нарушения, предлагаемый в настоящем изобретении, предпочтительно представляет собой способ вакцинации или способ генной терапии, описанный выше.

Как описано выше, предлагаемый в изобретении 3'-UTR-элемент обладает способностью стабилизировать молекулу мРНК и/или усиливать, стабилизировать и/или пролонгировать производство белка с молекулы мРНК. Таким образом, следующий объект настоящего изобретения относится к способу стабилизации молекулы РНК, предпочтительно молекулы мРНК, заключающийся в том, что выполняют стадию, на которой осуществляют ассоциацию молекулы РНК, предпочтительно молекулы мРНК, или вектора, кодирующего молекулу РНК, с 3'-UTR-элементом, содержащим или состоящим из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка, предпочтительно с 3'-UTR-элeмeнтoм, описанным выше.

Кроме того, настоящее изобретение относится к способу повышения, стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или с вектора, предпочтительно с молекулы мРНК, и/или стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или с вектора, предпочтительно с молекулы мРНК, заключающемуся в том, что выполняют стадию, на которой осуществляют ассоциацию искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно молекулы мРНК, с 3'-UTR-элeмeнтoм, который содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка, предпочтительно с 3'-UTR-элементом, описанным выше.

Выражение «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элeмeнтoм» в контексте настоящего изобретения предпочтительно означает функциональную ассоциацию или функциональное объединение искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом. Это означает, что осуществляют ассоциацию или связывание искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом, предпочтительно 3'-UTR-элементом, описанным выше, таким образом, чтобы осуществлялась функция 3'-UTR-элeмeнтa, например, функция стабилизации производства РНК и/или белка. Как правило, это означает, что 3'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в молекулу мРНК, с 3'-стороны относительно открытой рамки считывания, предпочтительно так, чтобы он непосредственно примыкал с 3'-стороны к открытой рамке считывания, предпочтительно располагался между открытой рамкой считывания и поли(А)-последовательностью или сигналом полиаденилирования. Предпочтительно 3'-UTR-элeмeнт интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в мРНК, в качестве 3'-UTR, т.е. так, чтобы 3'-UTR-элeмeнт представлял собой 3'-UTR искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно мРНК, т.е. так, чтобы он простирался от 3'-стороны открытой рамки считывания до 5'-стороны поли(А)-последовательности или сигнала полиаденилирования, необязательно был присоединен посредством короткого линкера, такого как последовательность, содержащая или состоящая из одного или нескольких сайтов рестрикции. Таким образом, предпочтительно выражение «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом» означает функциональную ассоциацию 3'-UTR-элeмeнтa с открытой рамкой считывания, локализованной в искусственной молекуле нуклеиновой кислоты или векторе, предпочтительно в молекуле мРНК. 3'-UTR и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, предпочтительно ОРС и 3'-UTR являются гетерологичными, например, происходят из различных генов, как описано выше.

Следующим объектом настоящего изобретения является применение 3'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, для повышения стабильности молекулы РНК, предпочтительно молекулы мРНК, где 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка.

Кроме того, в настоящем изобретении предложено применение 3'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, для повышения производства белка с искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно с молекулы мРНК, и/или для стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или векторной молекулы, предпочтительно с молекулы мРНК, где 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка.

Варианты применения, предлагаемые в настоящем изобретении, предпочтительно включают осуществление ассоциации искусственной молекулы нуклеиновой кислоты, вектора или РНК с 3'-UTR-элeмeнтoм, описанным выше.

Соединения и ингредиенты предлагаемой в изобретении фармацевтической композиции можно также производить и продавать по отдельности друг от друга. Таким образом, изобретение относится также к набору или набору компонентов, содержащему искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении, вектор, предлагаемый в изобретении, клетку, предлагаемую в изобретении, и/или фармацевтическую композицию, предлагаемую в изобретении. Предпочтительно такой набор или набор компонентов может дополнительно содержать инструкции по применению, клетки для трансфекции, адъювант, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разведения искусственной молекулы нуклеиновой кислоты, вектора, клеток или фармацевтической композиции.

Представленные ниже чертежи, последовательности и примеры предназначены для дополнительной иллюстрации изобретения. Они не направлены на ограничение сущности рассматриваемого изобретения.

На чертежах показано:

На фиг. 1-3 - последовательности, кодирующие мРНК, которые можно получать путем транскрипции in vitro. Используются следующие сокращения:

rpl32: 5'-UTR человеческого рибосомального белка большой субъединицы 32, в которой отсутствует 5'-концевой олигопиримидиновый тракт;

PpLuc (GC): последовательность мРНК с высоким содержанием GC (GC-обогащенная), кодирующая люциферазу Photinus pyralis;

- А64: поли(А)-последовательность, содержащая 64 аденилата;

- ag: центральная, α-комплекс-связывающая часть 3'-UTR человеческого α-глобина;

- rps9: 3'-UTR-элeмeнт, происходящий из 3'-UTR человеческого рибосомального белка малой субъединицы 9;

- С30: поли(С)-последовательность, содержащая 30 цитидилатов;

- thctohSL: последовательность гистоновой структуры типа «стебель-петля», взятая из публикации Cakmakci, Lerner, Wagner, Zheng и William F Marzluff, Mol. Cell. Biol. 28 (3), 2008, cc. 1182-1194;

альбумин: 3'-UTR человеческого альбумина;

на фиг. 1 - представлена последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - А64 - С30 - гистонSL (SEQ ID NO: 8);

на фиг. 2 - представлена последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - ag - А64 - С30 - гистонSL (SEQ ID NO: 9). Центральная, α-комплекс-связывающая часть 3'-UTR человеческого α-глобина встроена между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом. 3'-UTR-элeмeнт, происходящий из α-глобина, подчеркнут;

на фиг. 3 - последовательность мРНК rpl32 - PpLuc(GC) - rps9 - А64 - С30 - hSL (SEQ ID NO: 7). 3'-UTR человеческого рибосомального белка малой субъединицы 9 встроена между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом, 3' UTR-элемент, происходящий из rps9, подчеркнут;

на фиг. 4 - данные, демонстрирующие, что 3'-UTR рибосомального белка малой субъединицы 9 существенно повышает экспрессию белка с мРНК;

Влияние предлагаемой в изобретении 3'-UTR человеческого рибосомального белка малой субъединицы 9 на экспрессию люциферазы с мРНК изучали в сравнении с экспрессией люциферазы с мРНК, в которой отсутствует 3'-UTR или которая содержит 3'-UTR человеческого α-глобина. Для этого различными мРНК трансфектировали путем липофекции человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 6, 24, 48 и 72 ч после трансфекции. Очевидно, что имела место экспрессия люциферазы с мРНК, в которой отсутствовала 3'-UTR. При этом экспрессия люциферазы не возрастала при включении хорошо известной 3'-UTR человеческого α-глобина. В отличие от этого, 3'-UTR рибосомального белка малой субъединицы 9 приводила к существенному повышению экспрессии люциферазы. Данные представлены на графике в виде средней величины для трех трансфекции, выраженной в относительных световых единицах (RLU) ± SEM (стандартное отклонение). Результаты измерений в RLU обобщены в примере 5.1;

на фиг. 5 - последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - альбумин - А64 - С30 - гистонSL (SEQ ID NO: 206). 3'-UTR человеческого альбумина встраивали между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом. 3'-UTR-элeмeнт, происходящий из альбумина, подчеркнут;

на фиг. 6 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a повышают экспрессию белка с мРНК в HDF-клетках (человеческие кожные фибробласты) по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);

на фиг. 7 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a, повышают экспрессию белка с мРНК в HeLa-клетках по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);

на фиг. 8 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rpsl3, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38 повышают экспрессию белка с мРНК в HDF-клетках (человеческие кожные фибробласты) по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);

на фиг. 9 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38, повышают экспрессию белка с мРНК в HeLa- по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698).

Примеры

1. Получение ДНК-матриц

Конструировали вектор для транскрипции in vitro, содержащий промотор Т7 и GC-обогащенную последовательность, кодирующую люциферазу Photinus pyralis (PpLuc(GC)). 5'-нетранслируемую область (5'-UTR) рибосомального белка большой субъединицы 32 встраивали с 5'-стороны относительно PpLuc(GC). Содержащую 64 аденина (А64) поли(А)-последовательность, за которой следовала последовательность, состоящая из 30 цитозинов (С30), и последовательность структуры типа «стебель-петля», встраивали с 3'-стороны относительно PpLuc(GC). За последовательностью структуры типа «стебель-петля» находился сайт рестрикции, который использовали для линеаризации вектора перед осуществлением транскрипции in vitro. мРНК, полученную с этого вектора после транскрипции in vitro обозначили как «rpl32 - PpLuc(GC) - А64 - С30 - гистонSL».

Указанный вектор модифицировали так, чтобы он включал нетранслируемые последовательности с 3'-стороны относительно открытой рамки считывания (3'-UTR). В целом, создавали векторы, которые содержали следующие кодирующие последовательности мРНК (некоторые из кодирующих последовательностей мРНК представлены в качестве примеров на фиг. 1-3):

rpl32 - PpLuc(GC) - А64 - С30 - гистонSL (SEQ ID NO: 8, фиг. 1);

rpl32 - PpLuc(GC) - ag - A64 - C30 - гистонSL (SEQ ID NO: 9, фиг. 2);

rpl32 - PpLuc(GC) - rps9 - A64 - C30 - гистонSL (SEQ ID NO: 7, фиг. 3);

rpl32 - PpLuc(GC) - rps21 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rps29 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rps9 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rps27 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rps28 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpsl9 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl35a - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl13 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl23a - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - uba52 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl2211 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rps4x - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rps23 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpsl3 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpsl7 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpsl8 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - Fau - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpsl3 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - гистонSL;

rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - гистонSL.

2. Транскрипция in vitro

ДНК-матрицу, полученную согласно методу, описанному в примере 1, линеаризовали и транскрибировали in vitro с использованием Т7-РНК-полимеразы. Затем ДНК-матрицу расщепляли путем обработки ДНКазой. мРНК-транскрипты, содержащие 5'-кэп-структуру, получали путем добавления избытка N7-метил-гуанозин-5'-триптофосфат-5'-гуанозина в реакционную смесь для транскрипции. Полученную в результате этого мРНК очищали и ресуспендировали в воде.

3. Экспрессия люциферазы после липофекции мРНК

Человеческие кожные фибробласты (HDF) или HeLa-клетки высевали в 24-луночные планшеты за три дня до трансфекции с плотностью 3×104 клеток на лунку в среду (среда RPMI 1640, содержащая L-глутамин и 25 мМ Hepes (фирма Lonza, Базель, Швейцария), в которую добавляли 10% FCS, 1% Pen/Strep, 1% глутамина). Непосредственно перед осуществлением липофекции клетки промывали в среде Opti-MEM. Клетки подвергали липофекции с использованием 25 нг мРНК, кодирующей PpLuc, на лунку, включенной в комплекс с липофектамином 2000. Для контроля эффективности трансфекции наряду с мРНК PpLuc (2,5 нг мРНК RrLuc на лунку) осуществляли трансфекцию мРНК, кодирующей люциферазу Renilla reniformis (RrLuc). Через 90 мин после начала трансфекции среду заменяли на Opti-MEM. Через 6, 24, 48 и 72 ч после трансфекции среду удаляли путем аспирации и клетки лизировали в 100 мкл буфера для лизиса (буфер для пассивного лизиса, фирма Promega). Лизаты хранили при -80° до осуществления измерений люциферазной активности.

4. Измерение люциферазы

Люциферазную активность измеряли в относительных световых единицах (RLU) с помощью ридера для планшетов Hidex Chameleon. Активность PpLuc измеряли в течение периода измерения, составлявшего 2 с, с использованием 20 мкл лизата и 50 мкл содержащего люциферин буфера (буфер Beetle-Juice, фирма PJK GmbH). Активность RrLuc измеряли в течение периода измерения, составлявшего 2 с, с использованием 20 мкл лизата и 50 мкл содержащего коэлентеразин буфера (буфер Renilla-Juice, фирма PJK GmbH).

5. Результаты

5.1 3'-UTR генов рибосомального белка повышает экспрессию белка.

Для изучения воздействия 3'-UTR генов рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК либо не содержали 3'-UTR, либо содержали центральную связывающую α-комплекс часть 3'-UTR человеческого α-глобина (ag), либо содержали 3'-UTR человеческого рибосомального белка малой субъединицы 9 (rps9). мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 6, 24, 48 и 72 ч после трансфекции. На основе этих данных рассчитывали общее количество экспрессированного белка в течение периода времени с 0 до 72 ч в виде площади под кривой (AUC) (см. представленную ниже таблицу 1 и фиг. 4).

Очевидно, что имела место экспрессия люциферазы с мРНК, в которой отсутствует 3'-UTR. При этом экспрессия люциферазы не повышалась при наличии хорошо известной 3'-UTR α-глобина. В отличие от этого, 3'-UTR рибосомального белка малой субъединицы 9 существенно повышала экспрессию люциферазы.

5.2 3'-UTR генов мышиного рибосомального белка повышают экспрессию белка.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a) и для сравнения 3'-UTR альбумина, которая, как известно, повышает экспрессию белка с мРНК (WO 2013/143698). мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 2 и фиг. 6).

Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.

5.3 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали HeLa-клетки. Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 3 и фиг. 7).

Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.

5.4 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rpsl3, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 4 и фиг. 8).

Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.

5.5 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали HeLa-клетки. Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 5 и фиг. 9).

Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> КуреВак ГмбХ

<120> Искусственные молекулы нуклеиновой кислоты

<130> CU01P155WO1

<160> 206

<170> PatentIn, версия 3.5

<210> 1

<211> 70

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens

<400> 1

gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60

agcgctttac 70

<210> 2

<211> 70

<212> РНК

<213> Искусственная последовательность

<220>

<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens

<400> 2

guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60

agcgcuuuac 70

<210> 3

<211> 140

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens + поли-А

<400> 3

gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60

agcgctttac agatctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120

aaaaaaaaaa aaaaaaaaaa 140

<210> 4

<211> 140

<212> РНК

<213> Искусственная последовательность

<220>

<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens + поли-А

<400> 4

guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60

agcgcuuuac agaucuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120

aaaaaaaaaa aaaaaaaaaa 140

<210> 5

<211> 24

<212> ДНК

<213> Искусственная последовательность

<220>

<223> наиболее предпочтительная последовательность гистоновой структуры типа «стебель-петля»

<400> 5

caaaggctct tttcagagcc acca 24

<210> 6

<211> 42

<212> ДНК

<213> Искусственная последовательность

<220>

<223> 5-UTR человеческого рибосомального белка большой субъединицы 32 без 5-концевого олигопиримидинового тракта

<400> 6

ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42

<210> 7

<211> 1918

<212> ДНК

<213> Искусственная последовательность

<220>

<223> rpl32 PpLuc(GC) rps9 A64 C30 гистонSL

<400> 7

ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60

gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120

ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180

accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240

ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300

gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360

gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420

ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480

ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540

tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600

ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660

ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720

cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780

ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840

gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900

cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960

aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080

accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140

ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200

ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260

aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320

atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440

aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500

gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560

gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620

ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680

aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740

gattgtctcg ttttcctgcc aaataaacag gatcagcgct ttacagatct aaaaaaaaaa 1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc 1860

cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918

<210> 8

<211> 1848

<212> ДНК

<213> Искусственная последовательность

<220>

<223> rpl32 PpLuc(GC) A64 C30 гистонSL

<400> 8

ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60

gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120

ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180

accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240

ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300

gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360

gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420

ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480

ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540

tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600

ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660

ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720

cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780

ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840

gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900

cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960

aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080

accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140

ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200

ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260

aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320

atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440

aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500

gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560

gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620

ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680

aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800

cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848

<210> 9

<211> 1914

<212> ДНК

<213> Искусственная последовательность

<220>

<223> rpl32 PpLuc(GC) ag A64 C30 гистонSL

<400> 9

ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60

gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120

ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180

accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240

ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300

gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360

gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420

ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480

ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540

tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600

ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660

ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720

cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780

ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840

gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900

cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960

aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080

accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140

ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200

ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260

aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320

atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440

aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500

gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560

gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620

ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680

aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740

tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tgcatccccc 1860

cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914

<210> 10

<211> 109

<212> ДНК

<213> Homo sapiens

<400> 10

gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60

gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109

<210> 11

<211> 57

<212> ДНК

<213> Homo sapiens

<400> 11

tgccaggaac agattttgca gttggtgggg tctcaataaa agttattttc cactgac 57

<210> 12

<211> 91

<212> ДНК

<213> Homo sapiens

<400> 12

actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60

agacctgatt atacaggcag tgagaaacat g 91

<210> 13

<211> 58

<212> ДНК

<213> Homo sapiens

<400> 13

acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58

<210> 14

<211> 33

<212> ДНК

<213> Homo sapiens

<400> 14

atgtcttaag aacctaatta aatagctgac tac 33

<210> 15

<211> 67

<212> ДНК

<213> Homo sapiens

<400> 15

ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60

ttgaaat 67

<210> 16

<211> 59

<212> ДНК

<213> Homo sapiens

<400> 16

atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59

<210> 17

<211> 50

<212> ДНК

<213> Homo sapiens

<400> 17

attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50

<210> 18

<211> 46

<212> ДНК

<213> Homo sapiens

<400> 18

gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46

<210> 19

<211> 3787

<212> ДНК

<213> Homo sapiens

<400> 19

agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60

cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120

tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180

gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240

gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300

gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360

acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420

tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480

agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540

aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600

cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660

aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720

aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780

tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840

agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900

cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960

atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020

ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080

aaccccagag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140

cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200

tacctctgct gctgcactca cagccacact tgatacacga tgacaccttg cttgtttgga 1260

aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320

tgtatatgtt aacttcgtga tcagtttgta tgtttgggac tcttgtccta tgtaaagtta 1380

aggtgggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440

ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500

cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560

agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620

ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680

gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740

tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800

cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860

ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920

tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980

ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040

catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100

gcttaatcta ttaagagccc taacaggaga ggatgggctt tctctgttgt ctggggccct 2160

gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220

gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280

cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340

aggcttctgc aggatagctg gggggctggg caggtgggtg aggcagcctc cctgctgaca 2400

ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460

aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520

ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580

gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640

gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccgggctgga accagccctc 2700

tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtgggtca 2760

ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820

tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880

gacctgtgtg ccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940

gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000

gcccccgggg agcacgggct ggctctgtgg tgcccgtggc cttttgtaga agcgttggtt 3060

ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120

ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180

caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240

tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300

tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360

cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420

tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480

gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540

gagcccagga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600

gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660

ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720

agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780

atcattt 3787

<210> 20

<211> 63

<212> ДНК

<213> Homo sapiens

<400> 20

ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60

tgc 63

<210> 21

<211> 45

<212> ДНК

<213> Homo sapiens

<400> 21

ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45

<210> 22

<211> 61

<212> ДНК

<213> Homo sapiens

<400> 22

gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60

c 61

<210> 23

<211> 79

<212> ДНК

<213> Homo sapiens

<400> 23

aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60

aaaacaagcc ttaatctgc 79

<210> 24

<211> 38

<212> ДНК

<213> Homo sapiens

<400> 24

taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38

<210> 25

<211> 1651

<212> ДНК

<213> Homo sapiens

<400> 25

atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60

tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120

gggcttccct tggttcgcca ctcatttatt tgtaacttga cttctttttt tttctgctta 180

aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240

cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300

ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360

atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420

aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480

caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540

ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600

ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660

ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720

tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780

cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggaggtggg 840

aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900

gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960

caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020

caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080

aaagagcttg cctacagatg gtttccacac ttgaaattgt gccctgcgag ttgcatagct 1140

ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200

agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260

ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320

agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380

catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440

cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500

tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560

tcactggttt tctatgtctt tttgaactct tgtaatcgag ttttgatcat attttctatt 1620

aaagtggcta acacctggct actcttactg t 1651

<210> 26

<211> 474

<212> ДНК

<213> Homo sapiens

<400> 26

actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60

gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120

cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180

tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240

agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300

ggctgtgtat gaaaccaatg cccagggttt gaagggtgtt agcatccatt tcaggggagt 360

gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420

cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474

<210> 27

<211> 36

<212> ДНК

<213> Homo sapiens

<400> 27

attcagcatt aaaataaatg taattaaaag gaaaag 36

<210> 28

<211> 45

<212> ДНК

<213> Homo sapiens

<400> 28

actggcagat tagattttta aataaagatt ggattataac tctag 45

<210> 29

<211> 48

<212> ДНК

<213> Homo sapiens

<400> 29

agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48

<210> 30

<211> 32

<212> ДНК

<213> Homo sapiens

<400> 30

atgctttgtt ttgatcatta aaaattataa ag 32

<210> 31

<211> 90

<212> ДНК

<213> Homo sapiens

<400> 31

accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60

aaatttgctt gttttaaaaa cattgtatct 90

<210> 32

<211> 4065

<212> ДНК

<213> Homo sapiens

<400> 32

agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60

gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120

gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180

cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240

ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300

ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360

cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420

cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480

agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540

cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600

tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660

gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720

gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780

tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840

aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900

atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960

aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020

atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080

cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140

gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200

atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260

gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320

caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380

taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440

aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500

gagaatctcc aggaggcgga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560

gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620

gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680

agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740

agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800

ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860

cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920

cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980

cccggctaat tttttgcatt tttagtagag acagggtttc accgtgttag ccaggatggt 2040

ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100

accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160

ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220

gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280

tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340

ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400

cgggacttgg agactgaatt gtagtgggcc gaccacaaaa tgataaggca tggaaggaag 2460

tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520

taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580

tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640

gaaaatagtt ttgagcccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700

aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760

ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820

tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880

atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940

gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000

gagcagacag cccacggacg gactgcaagt cggaagcgcg ggcggaagct gtgcagcgcc 3060

cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120

tcacaacaca gaccggacct tgggtcttac cccggcacct gagaaccact tccggtgagt 3180

agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240

gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300

gataactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360

gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420

tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480

tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540

agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600

ggaggttagg gaaatgagca cgaagtatgt tttggtgcag ttttttgttc aacccaatgc 3660

gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720

actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780

ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840

catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900

aaatttaatt cctggctcta ttttacatcc caatttttat tttcctctca ttcccacttt 3960

acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020

tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065

<210> 33

<211> 3865

<212> ДНК

<213> Homo sapiens

<400> 33

gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60

gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120

cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180

tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240

ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300

ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360

tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420

cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480

gctgggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540

tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600

gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660

cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720

gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780

cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840

accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900

ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960

gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020

ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080

tgcagtgagc ccatgagccc caccactaca ctccagcctg gaagacacca tgacacacag 1140

tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200

ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260

atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320

tgactgagag taaggggact gtcagggcct cgacttgcca ttggttgggg tcgtacgggg 1380

ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440

agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500

attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560

ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620

cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680

ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740

gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800

cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860

gtttatctgt ctcatgtttg tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc 1920

atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980

agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040

tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100

gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160

gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220

tcaaattacc cacctgcctc agcctcccaa agtgctggca ttacaggcgc tcgaggcttt 2280

ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340

aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400

tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460

ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520

ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagagggct ggagggaggg 2580

agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640

catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700

agctttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760

aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820

aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880

tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940

acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcagggc 3000

taatggttca cggaagccag gaatcaaact gcctgggttc cagtcccagc tctgccagtt 3060

atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120

tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180

actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240

ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300

agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360

agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420

tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480

attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540

tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600

atgactaatt tgtacacaaa ctaatgctcg tgtttcccaa gcacctggaa gacatgccag 3660

atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720

gctttcccag cctcctgccc gtgtttgtga atatcattct gtcctcagct gcatttccag 3780

cccaggctgt ttggcgctgc ccaggaatgg tatcaattcc cctgtttctc ttgtagccag 3840

ttactagaat aaaatcatct acttt 3865

<210> 34

<211> 288

<212> ДНК

<213> Homo sapiens

<400> 34

ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60

gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120

gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180

cggtggttgt tgagagttaa ggcacggggt tgatgttttc agatgaaatt ctcaaagcaa 240

gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288

<210> 35

<211> 430

<212> ДНК

<213> Homo sapiens

<400> 35

gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60

agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120

agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180

cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240

tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatgggcct ggggttcctg 300

ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360

aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattggg 420

ctatgagtgt 430

<210> 36

<211> 120

<212> ДНК

<213> Homo sapiens

<400> 36

atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60

taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120

<210> 37

<211> 655

<212> ДНК

<213> Homo sapiens

<400> 37

agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60

tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120

cagagggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180

cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240

attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300

taactagtat gtctgtccca cctttaaaaa gtttttcatt atgaaagtaa gtatttgtta 360

gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420

gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480

ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540

tatcttaatt tccactgaac ttgatttaaa ttcagagtta cacagtatga atatcacaat 600

cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655

<210> 38

<211> 331

<212> ДНК

<213> Homo sapiens

<400> 38

agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60

gctaggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120

gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180

cccgtctaca aaaggttttt agagttgaaa tatgaaatgt gatgtgggta tggaaattga 240

ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300

tcagatcaaa taaagttata aaattgcctt c 331

<210> 39

<211> 1152

<212> ДНК

<213> Homo sapiens

<400> 39

gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60

ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120

ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180

tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240

gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300

cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360

aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420

atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480

gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540

ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600

tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660

tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720

cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780

cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840

tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900

tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960

ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020

cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080

agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140

aactggtcct tc 1152

<210> 40

<211> 75

<212> ДНК

<213> Homo sapiens

<400> 40

actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60

aaaacttact acctt 75

<210> 41

<211> 1176

<212> ДНК

<213> Homo sapiens

<400> 41

gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60

tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120

actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180

ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240

gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300

ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360

caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420

tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480

gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540

ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600

ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660

caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720

ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780

cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840

aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900

atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960

taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020

cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080

tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140

aaccctgctg attaaatctc tcttgggctt cctccc 1176

<210> 42

<211> 59

<212> ДНК

<213> Homo sapiens

<400> 42

acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59

<210> 43

<211> 49

<212> ДНК

<213> Homo sapiens

<400> 43

accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49

<210> 44

<211> 178

<212> ДНК

<213> Homo sapiens

<400> 44

ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60

atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120

tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178

<210> 45

<211> 73

<212> ДНК

<213> Homo sapiens

<400> 45

tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60

ttctttaaaa agt 73

<210> 46

<211> 38

<212> ДНК

<213> Homo sapiens

<400> 46

acctctttta taacatgttc aataaaaagc tgaacttt 38

<210> 47

<211> 40

<212> ДНК

<213> Homo sapiens

<400> 47

attcctgctc ccctgcaaat aaagcctttt tacacatctc 40

<210> 48

<211> 1301

<212> ДНК

<213> Homo sapiens

<400> 48

cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60

aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120

tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180

gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240

aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300

tttagaagag ggatatgttt gagtttttcc tatgcataag gcgatccacg ttgcacatag 360

aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420

tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480

cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540

tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600

gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660

agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720

ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780

atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840

ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900

tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960

cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020

ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080

tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttgggt caaaaataat 1140

caaaaaggat ggttgtgtgt gtattgaaca tgtagactta tttttcttat tttcaaaata 1200

ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260

acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301

<210> 49

<211> 576

<212> ДНК

<213> Homo sapiens

<400> 49

cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60

ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120

gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180

agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240

ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300

cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360

tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420

gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480

aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540

cttcagaact gtgagaaata aatttctgtt gtctat 576

<210> 50

<211> 57

<212> ДНК

<213> Homo sapiens

<400> 50

agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57

<210> 51

<211> 1324

<212> ДНК

<213> Homo sapiens

<400> 51

agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60

tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120

ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180

agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240

ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300

tgtctgtgaa tccttctagc tatatctctt taagtgaaag agtgttaagt actcagtaaa 360

tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420

tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctgggtt caagcagttc 480

ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540

ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600

ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660

ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttcccctact 720

tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780

gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840

ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900

aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960

aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020

atacagttag ctaagagggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080

ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140

aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200

taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260

cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320

atag 1324

<210> 52

<211> 68

<212> ДНК

<213> Homo sapiens

<400> 52

aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60

taatagca 68

<210> 53

<211> 60

<212> ДНК

<213> Homo sapiens

<400> 53

attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60

<210> 54

<211> 53

<212> ДНК

<213> Homo sapiens

<400> 54

ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53

<210> 55

<211> 37

<212> ДНК

<213> Homo sapiens

<400> 55

gattttttga gtaacaaata aataagatca gactctg 37

<210> 56

<211> 36

<212> ДНК

<213> Homo sapiens

<400> 56

acaaaaatga ctaaataaaa agtatatatt cacagt 36

<210> 57

<211> 55

<212> ДНК

<213> Homo sapiens

<400> 57

atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55

<210> 58

<211> 70

<212> ДНК

<213> Homo sapiens

<400> 58

gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60

agcgctttac 70

<210> 59

<211> 50

<212> ДНК

<213> Homo sapiens

<400> 59

aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50

<210> 60

<211> 77

<212> ДНК

<213> Homo sapiens

<400> 60

ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60

acttgggatc ttccgcg 77

<210> 61

<211> 21

<212> ДНК

<213> Homo sapiens

<400> 61

agaaataaat ctttggctca c 21

<210> 62

<211> 41

<212> ДНК

<213> Homo sapiens

<400> 62

atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41

<210> 63

<211> 31

<212> ДНК

<213> Homo sapiens

<400> 63

tggctcagct aataaaggcg cacatgactc c 31

<210> 64

<211> 53

<212> ДНК

<213> Homo sapiens

<400> 64

ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53

<210> 65

<211> 64

<212> ДНК

<213> Homo sapiens

<400> 65

gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60

caag 64

<210> 66

<211> 37

<212> ДНК

<213> Homo sapiens

<400> 66

aacaaaccat gctgggttaa taaattgcct cattcgt 37

<210> 67

<211> 386

<212> ДНК

<213> Homo sapiens

<400> 67

ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60

agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120

gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgattt 180

ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240

gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300

tgactttctt atccagcact tgtattgatt atttttcatt ttgataatgt tgggttttta 360

aaaactcctt tatgatggaa aatttc 386

<210> 68

<211> 281

<212> ДНК

<213> Homo sapiens

<400> 68

gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60

actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120

tatgggtatc ttagagtggt ctatcctgtt ttcgttgtcg tttgagtcat ttgaaaactg 180

gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240

taactttggc atactctaga taaattctga ttggtatggg g 281

<210> 69

<211> 53

<212> ДНК

<213> Homo sapiens

<400> 69

ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53

<210> 70

<211> 2785

<212> ДНК

<213> Homo sapiens

<400> 70

atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60

tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120

ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180

ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240

ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300

aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360

ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420

ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480

ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540

gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600

gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660

tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720

gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780

gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840

gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900

gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960

ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020

gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080

tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140

ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200

tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260

tagtctctcc ctccgcaagg gcggaaaggc tgcctgttgg tttgtaccag tgtttcctaa 1320

cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380

atgagcctta actgacccaa tcctttgtga tgcgggagag attgctaggc ctcgctcacc 1440

tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500

cgcggggtgg gcagctctcc ccgggcggtg gggcccttgt gaccgcgagg cggggcgcac 1560

caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620

gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcacccagga 1680

cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740

aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800

tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860

tgtatccatg gaggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920

tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980

caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040

tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100

aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160

aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220

ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280

cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340

cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400

attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460

cagcccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520

aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580

attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640

agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700

agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760

ccagctgaat aaagcccttc cttct 2785

<210> 71

<211> 48

<212> ДНК

<213> Homo sapiens

<400> 71

ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48

<210> 72

<211> 67

<212> ДНК

<213> Homo sapiens

<400> 72

ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60

tgtactt 67

<210> 73

<211> 62

<212> ДНК

<213> Homo sapiens

<400> 73

aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60

tg 62

<210> 74

<211> 276

<212> ДНК

<213> Homo sapiens

<400> 74

ctgtatgagt taataaaaga catgaactaa catttattgt tgggttttat tgcagtaaaa 60

agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120

tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180

aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240

cagaagttat atttaatgta agttgtctaa atataa 276

<210> 75

<211> 139

<212> ДНК

<213> Homo sapiens

<400> 75

gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60

tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac tgagatgctc ctttaaataa 120

agcgtttgtg tttcaagtt 139

<210> 76

<211> 94

<212> ДНК

<213> Homo sapiens

<400> 76

atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60

ttgtatataa aataaacatt tgaaaaaacc cttc 94

<210> 77

<211> 1355

<212> ДНК

<213> Homo sapiens

<400> 77

tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60

acaggtgtta tttgtctgtt aaaactagtc tgcagatgtt tcttgaatgc tttgtcaaat 120

taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180

ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240

aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300

ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360

gctctgctgg tttattttca agtggctgcg ttttttttag tttggcaggt gtagactttt 420

taagttgggc tttagaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480

ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540

tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600

tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660

tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720

cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780

ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840

tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900

ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960

ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020

ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080

aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140

ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200

atttccagga agtactcata gcaagttcat aaaagttctt gagacctaaa tttcttcaca 1260

aaaaaagaaa agatcttaag tcatacattt taattgtgta gaggttgttc aactgaagga 1320

ataaatgtct attaaactaa aacaaatgga ccttc 1355

<210> 78

<211> 2017

<212> ДНК

<213> Homo sapiens

<400> 78

gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60

agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120

aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180

tgagccacca cccccagccc aatttttatt ttttgtacag acaggatctc actatgttgc 240

ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300

aattatagga atgagccacc acaccgggcc caaatttact ttagtaataa caacaattgg 360

ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420

ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480

aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540

tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600

aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660

cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720

gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780

gcacgatctc agctcactgc aacccgggtt caagcgattc tcctgcctca gcctcccgag 840

tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900

cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960

ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020

ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080

aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140

ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200

cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260

tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320

gtttcaccat gttgttcagg ctggtctcaa agtcctgggc tcaagcaatc ttcctgtctc 1380

tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440

ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500

tatgtatctc agagcttatt ctttatcagc tcatgaggaa cttcattttt tttttttttt 1560

ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620

cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680

attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740

accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800

cccaaagtag tgggattaca ggcatgagca accgtgcccg gctggaactt cattcttttg 1860

gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920

ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980

acatctttat tcatctgtag aataaattct tagaagt 2017

<210> 79

<211> 37

<212> ДНК

<213> Homo sapiens

<400> 79

ggtttttata caagaaaaat aaagtgaatt aagcgtg 37

<210> 80

<211> 140

<212> ДНК

<213> Homo sapiens

<400> 80

gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60

tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120

aaacattaaa taatcagttc 140

<210> 81

<211> 55

<212> ДНК

<213> Homo sapiens

<400> 81

acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55

<210> 82

<211> 1485

<212> ДНК

<213> Homo sapiens

<400> 82

gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60

ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa cctttgggtc 120

attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180

ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240

cctccccagg tcctaggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300

tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360

cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420

gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480

gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540

caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600

acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660

gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720

cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780

tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840

gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900

ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960

tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020

acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080

aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140

acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200

ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260

ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320

tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380

gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440

gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485

<210> 83

<211> 31

<212> ДНК

<213> Homo sapiens

<400> 83

ggcacatttg aataaattct attaccagtt c 31

<210> 84

<211> 39

<212> ДНК

<213> Homo sapiens

<400> 84

ggggcgcatt gtcaataaag cacagctggc tgagactgc 39

<210> 85

<211> 486

<212> ДНК

<213> Homo sapiens

<400> 85

gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60

aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120

aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180

gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240

tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300

ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360

gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420

ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480

gctttt 486

<210> 86

<211> 44

<212> ДНК

<213> Homo sapiens

<400> 86

gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44

<210> 87

<211> 406

<212> ДНК

<213> Homo sapiens

<400> 87

gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60

ctgttcatct tttgggaggg aataagctag agccatcaat acaattccgc ttgtggggaa 120

atttatgcct cttactggta ctacttgttt tgcattgaag ctgactggtt gagttcacat 180

catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240

tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300

agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360

tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406

<210> 88

<211> 1994

<212> ДНК

<213> Homo sapiens

<400> 88

ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60

agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120

ctcatgtctg actagtccac aatactgcac tatttcagtg tttacgattt tttatccttt 180

cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240

agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300

cgcttgttgg ttgcactaag aattgttctg ttgtttctca tcacagaaat ctgcagtcaa 360

ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420

gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480

gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540

cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600

gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660

tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720

tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780

attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840

gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900

agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960

taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020

ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080

accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140

agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200

agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260

aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320

aaaaagaatg agatccagtc atttacaaca acatgggtgg aactggagat cgttatgtta 1380

agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440

aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500

ggtggcggga ggtggggatg gttaatgggt acaaaaagaa aaaagaatga attagaccaa 1560

ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620

cttagagtgt aattggattg tttgtacctc aaagaaaaaa tgcaataaaa ctttacagtg 1680

gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740

tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800

ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860

accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920

ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980

aaaaaggaca ttag 1994

<210> 89

<211> 307

<212> ДНК

<213> Homo sapiens

<400> 89

accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60

gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120

tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180

aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240

ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300

ttaaatc 307

<210> 90

<211> 38

<212> ДНК

<213> Homo sapiens

<400> 90

gtctgtaggc cttgtctgtt aataaatagt ttatatac 38

<210> 91

<211> 133

<212> ДНК

<213> Homo sapiens

<400> 91

agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60

tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120

gtctggttgt ttg 133

<210> 92

<211> 1802

<212> ДНК

<213> Homo sapiens

<400> 92

tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60

tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120

tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct ccccacgccc 180

ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240

accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300

attttcttgt ttattggtat tttcccacta gaaatgaagc tgcgtgaagt tagagatttt 360

tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420

cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480

acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540

gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600

ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660

tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720

agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780

tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840

caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900

cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960

tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020

atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080

agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140

ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200

gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260

cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320

atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380

ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440

gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500

ctggccaaag tggttgattg aggctgggtg caagcagagt tgtgagaagg ctcccatttg 1560

gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620

tgctgcagac attttgctac cacaagtgaa gccaccctga cgacacagtt gacaatttgg 1680

agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740

aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800

gt 1802

<210> 93

<211> 34

<212> ДНК

<213> Homo sapiens

<400> 93

tgctgagggc ctcaataaag tttgtgttta tgcc 34

<210> 94

<211> 502

<212> ДНК

<213> Homo sapiens

<400> 94

aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 60

tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120

ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180

cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240

catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300

caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360

cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420

gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480

aattaaaaat cttgcaaagg gg 502

<210> 95

<211> 502

<212> ДНК

<213> Homo sapiens

<400> 95

aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 60

tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120

ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180

cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240

catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300

caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360

cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420

gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480

aattaaaaat cttgcaaagg gg 502

<210> 96

<211> 48

<212> ДНК

<213> Homo sapiens

<400> 96

attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48

<210> 97

<211> 171

<212> ДНК

<213> Homo sapiens

<400> 97

gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60

gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120

gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171

<210> 98

<211> 2309

<212> ДНК

<213> Homo sapiens

<400> 98

ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60

aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120

gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180

acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240

ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300

gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360

gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420

gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480

ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540

tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600

tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660

gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720

cgagtagctg ggactacagg tgcccgccac aactcctggc taattttttg tatttttagt 780

agagacgggg tttcactggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840

tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900

actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960

tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020

cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080

caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140

caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200

aggtgggcaa atcataaggt caagagtttt ttagatgggg tgagcacaga ccaattcctg 1260

ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320

ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380

agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440

gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500

ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560

gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620

cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680

ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740

ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800

agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860

tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920

aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980

gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040

acttcctggg ccagtttggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100

cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160

ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220

cgcccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280

tcgcttcatt caataaacag ctgctgctc 2309

<210> 99

<211> 58

<212> ДНК

<213> Homo sapiens

<400> 99

gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58

<210> 100

<211> 1502

<212> ДНК

<213> Homo sapiens

<400> 100

gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60

ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120

tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180

cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240

gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300

acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360

ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420

tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480

tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540

tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600

tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660

agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720

gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780

tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840

cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900

attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960

atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020

ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080

atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140

attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200

aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260

tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320

tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380

gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440

tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500

gc 1502

<210> 101

<211> 48

<212> ДНК

<213> Homo sapiens

<400> 101

attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48

<210> 102

<211> 193

<212> ДНК

<213> Homo sapiens

<400> 102

ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60

atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120

tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180

agcttttgtt tcc 193

<210> 103

<211> 73

<212> ДНК

<213> Homo sapiens

<400> 103

aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60

tctgtttact ggc 73

<210> 104

<211> 93

<212> ДНК

<213> Homo sapiens

<400> 104

actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60

cgagggaaaa taaatacagt gatattctta cgc 93

<210> 105

<211> 257

<212> ДНК

<213> Homo sapiens

<400> 105

gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60

ggccggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120

ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180

agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240

aatcgatctc tttgagc 257

<210> 106

<211> 692

<212> ДНК

<213> Homo sapiens

<400> 106

tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60

attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120

acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180

cccctctttt tcttttttta aaatatattt gagtatgcca tacatttata tatatggtgt 240

atatgaattt ggtttaaaca ttttaaaatt tattctgatt agtttgtgtc tttttttttt 300

tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360

ctcactgcaa cctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420

ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480

aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540

tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600

aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660

ataattaaaa agaatagttt caaaaaaata ca 692

<210> 107

<211> 228

<212> ДНК

<213> Homo sapiens

<400> 107

atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60

tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120

aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180

ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228

<210> 108

<211> 529

<212> ДНК

<213> Homo sapiens

<400> 108

acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60

ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120

aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180

gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240

tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300

gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360

ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420

tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480

gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529

<210> 109

<211> 174

<212> ДНК

<213> Homo sapiens

<400> 109

gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60

gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120

aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174

<210> 110

<211> 156

<212> ДНК

<213> Homo sapiens

<400> 110

atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60

aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120

atcttatatc tgattagaaa ttagtatctg gaacat 156

<210> 111

<211> 46

<212> ДНК

<213> Homo sapiens

<400> 111

aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46

<210> 112

<211> 67

<212> ДНК

<213> Homo sapiens

<400> 112

ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60

tgtactt 67

<210> 113

<211> 294

<212> ДНК

<213> Homo sapiens

<400> 113

ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60

atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120

ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180

gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240

tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294

<210> 114

<211> 171

<212> ДНК

<213> Homo sapiens

<400> 114

tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60

ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120

aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171

<210> 115

<211> 49

<212> ДНК

<213> Homo sapiens

<400> 115

gcccccttcc cctgccctct ccctgaaata aagaatagct tgacagaaa 49

<210> 116

<211> 88

<212> ДНК

<213> Mus musculus

<400> 116

ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60

tttgggagaa taaaagactt atatattg 88

<210> 117

<211> 69

<212> ДНК

<213> Mus musculus

<400> 117

ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60

ggttttccc 69

<210> 118

<211> 118

<212> ДНК

<213> Mus musculus

<400> 118

actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60

acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118

<210> 119

<211> 1008

<212> ДНК

<213> Mus musculus

<400> 119

agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60

tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120

aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180

ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240

aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300

gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360

ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420

caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480

agaagggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540

gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600

ttaggtgctt atgcctctta gtaaatagcc cttcatccca gaaggagcaa gaattgtctt 660

cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720

acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780

ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840

aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900

agctaaaagc cattccacag ttgactccat ctgaagttaa agtgtgtaag tacacagtaa 960

atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008

<210> 120

<211> 306

<212> ДНК

<213> Mus musculus

<400> 120

attgttaacc taattaaaca gcttcatagg ttcttttggt gtcctttttg tgtgttgtgt 60

gtgcacatgt ttgttgggtg ggtgttttgc tggtgtcttt tcctctgtgt cttcctctgg 120

ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180

tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240

ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300

tactgg 306

<210> 121

<211> 63

<212> ДНК

<213> Mus musculus

<400> 121

ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60

ttg 63

<210> 122

<211> 49

<212> ДНК

<213> Mus musculus

<400> 122

atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49

<210> 123

<211> 39

<212> ДНК

<213> Mus musculus

<400> 123

acttgatcca aaaagctaat aaaattttct cagaaatgc 39

<210> 124

<211> 47

<212> ДНК

<213> Mus musculus

<400> 124

gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47

<210> 125

<211> 42

<212> ДНК

<213> Mus musculus

<400> 125

ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42

<210> 126

<211> 556

<212> ДНК

<213> Mus musculus

<400> 126

ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60

tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120

ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttagggg 180

ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240

gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300

aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360

tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420

caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480

ttagagcaaa ccatgcacat atggtaaatt atctttgggt tttgggtccc taaaataaag 540

tggtgtgttc attgtg 556

<210> 127

<211> 47

<212> ДНК

<213> Mus musculus

<400> 127

ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47

<210> 128

<211> 693

<212> ДНК

<213> Mus musculus

<400> 128

acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60

tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120

agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180

ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240

tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300

aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360

atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420

ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480

atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540

agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600

cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660

aatggcactt agaagataac atgtgaaagc cat 693

<210> 129

<211> 98

<212> ДНК

<213> Mus musculus

<400> 129

agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60

aataaaacaa gcctttgtct gttgccctct tgtttagc 98

<210> 130

<211> 1077

<212> ДНК

<213> Mus musculus

<400> 130

tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60

tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120

cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180

tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240

cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300

ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360

tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420

agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480

atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540

tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600

aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660

tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720

atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780

cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840

ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900

taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960

tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020

ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077

<210> 131

<211> 1658

<212> ДНК

<213> Mus musculus

<400> 131

gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60

tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120

ttaactgggc tgctgctcct ttgtatatag acactttttt cctgctcaga aacttgagtt 180

ctccagtagc aatggccaaa cagaagaacc aggctagggg gctgcatctg acagagcaag 240

tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300

atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360

caggtgattt ctttgtgtga tttttctttt cccctgggac aatgacagtc agtaagacag 420

gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480

cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540

tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600

ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660

gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720

ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780

caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840

actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900

gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960

gtacctccag ggcactgggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020

aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080

cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140

aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200

tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260

tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320

gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380

cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440

cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500

ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560

aaacttgctg gtttttatgc ctttctaact cttgtatttg aatgaatgtt gatcactttt 1620

tgtattaaag tggctgacac atggctactg tcactgtg 1658

<210> 132

<211> 1795

<212> ДНК

<213> Mus musculus

<400> 132

aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60

ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagaggagg 120

aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180

tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240

tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300

gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360

gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420

agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480

tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540

gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600

cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660

tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720

ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780

gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840

gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900

ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960

aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020

cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080

atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140

gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200

caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260

taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320

atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380

ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440

tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500

ctagcgtttc cttccaactt caggtgcagc ccccctcgtg gttagcggtc ttaagttcgt 1560

gacttgggtt tgcagatctt ttttgttaca tcgccggacc atgtggtggt ctttagctgt 1620

aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680

gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740

gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795

<210> 133

<211> 48

<212> ДНК

<213> Mus musculus

<400> 133

actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48

<210> 134

<211> 140

<212> ДНК

<213> Mus musculus

<400> 134

attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60

tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120

tcaaaaccac gtgaccatgt 140

<210> 135

<211> 46

<212> ДНК

<213> Mus musculus

<400> 135

tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46

<210> 136

<211> 40

<212> ДНК

<213> Mus musculus

<400> 136

agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40

<210> 137

<211> 109

<212> ДНК

<213> Mus musculus

<400> 137

gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60

gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109

<210> 138

<211> 45

<212> ДНК

<213> Mus musculus

<400> 138

acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45

<210> 139

<211> 640

<212> ДНК

<213> Mus musculus

<400> 139

aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60

tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120

agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180

gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240

aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300

taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360

actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420

aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480

taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540

gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaagagtac 600

cttggagtaa ataaataaag cccaagatcc tgattgtcta 640

<210> 140

<211> 40

<212> ДНК

<213> Mus musculus

<400> 140

gccccacacg cccgaagcaa taaagagtcc actgacttcc 40

<210> 141

<211> 124

<212> ДНК

<213> Mus musculus

<400> 141

aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60

tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120

cttg 124

<210> 142

<211> 575

<212> ДНК

<213> Mus musculus

<400> 142

cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60

tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120

tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180

attaggattg tggatttggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240

atagaatagg gtggccttga actcagaaat ccacctgcct tttcctccct agtattggca 300

attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360

aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420

gtcccaggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480

agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540

aacgattttt attaaaaacc ttgaggacaa acatt 575

<210> 143

<211> 54

<212> ДНК

<213> Mus musculus

<400> 143

atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54

<210> 144

<211> 68

<212> ДНК

<213> Mus musculus

<400> 144

actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60

gtcctaaa 68

<210> 145

<211> 504

<212> ДНК

<213> Mus musculus

<400> 145

ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60

tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120

ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180

ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240

atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300

accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360

cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420

gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480

ttaaaactct taattcatct tact 504

<210> 146

<211> 306

<212> ДНК

<213> Mus musculus

<400> 146

ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60

tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120

tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180

acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240

ttgaatttac agagatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300

actatg 306

<210> 147

<211> 246

<212> ДНК

<213> Mus musculus

<400> 147

aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60

tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120

gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180

ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240

taagac 246

<210> 148

<211> 41

<212> ДНК

<213> Mus musculus

<400> 148

accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41

<210> 149

<211> 181

<212> ДНК

<213> Mus musculus

<400> 149

ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60

gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120

gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180

t 181

<210> 150

<211> 285

<212> ДНК

<213> Mus musculus

<400> 150

tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60

ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120

aaaaccgcta ctgtttactt tgtgttggca tctttgtttc taaaattaaa gctcctagtg 180

tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240

gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285

<210> 151

<211> 40

<212> ДНК

<213> Mus musculus

<400> 151

actgcttttg ttaagttggc taataaagag ctgaacctgt 40

<210> 152

<211> 42

<212> ДНК

<213> Mus musculus

<400> 152

attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42

<210> 153

<211> 1059

<212> ДНК

<213> Mus musculus

<400> 153

cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60

tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120

ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180

tcatgaagtt ggtgaccctg tgttgaacaa ttgagggtta gaagagcagt ttggttttgg 240

tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300

gctgtgtctc tggcctggag tagtctttct tgcttttttt tttttttttt tttttctcta 360

gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420

gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480

aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540

atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600

gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660

ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720

attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780

attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840

aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900

ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960

cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020

ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059

<210> 154

<211> 49

<212> ДНК

<213> Mus musculus

<400> 154

aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49

<210> 155

<211> 87

<212> ДНК

<213> Mus musculus

<400> 155

aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60

tgctagatta aacagcatgg tgaaact 87

<210> 156

<211> 100

<212> ДНК

<213> Mus musculus

<400> 156

agtggactct gagggacatt gcggggaagg ggcgtttacg tttgtttata cttaaaagtt 60

ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100

<210> 157

<211> 45

<212> ДНК

<213> Mus musculus

<400> 157

tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45

<210> 158

<211> 603

<212> ДНК

<213> Mus musculus

<400> 158

gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60

gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120

agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180

aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240

attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300

ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360

ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420

cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480

ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540

ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600

agg 603

<210> 159

<211> 269

<212> ДНК

<213> Mus musculus

<400> 159

agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60

cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120

cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180

tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240

ctttctttgt aaacaactgt ccacatttt 269

<210> 160

<211> 42

<212> ДНК

<213> Mus musculus

<400> 160

gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42

<210> 161

<211> 69

<212> ДНК

<213> Mus musculus

<400> 161

ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60

gatacttgg 69

<210> 162

<211> 36

<212> ДНК

<213> Mus musculus

<400> 162

agttggagtt tatgttgtat tgaataaact ttaaag 36

<210> 163

<211> 47

<212> ДНК

<213> Mus musculus

<400> 163

ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47

<210> 164

<211> 50

<212> ДНК

<213> Mus musculus

<400> 164

ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaa 50

<210> 165

<211> 43

<212> ДНК

<213> Mus musculus

<400> 165

atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43

<210> 166

<211> 34

<212> ДНК

<213> Mus musculus

<400> 166

ccgaggccaa taaagactgg ttttggtccc tgga 34

<210> 167

<211> 3272

<212> ДНК

<213> Mus musculus

<400> 167

acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60

ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120

gttttatgta gatattgaaa gcatgaccat tgtcttcact tcacctccag cttgggttgt 180

atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240

gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300

cctttcatca cccagacttg gtagacttac attctgtcac actgttggct cttaatctca 360

gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420

ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttgggttc gcaggttatt 480

ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540

atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600

ctggtttcac tgtccatggt tagtatctgg tgggtggaca cctggtggaa ccaagctgct 660

catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720

cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780

aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840

cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900

ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960

ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020

atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080

tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140

ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200

tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260

cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320

gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380

ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440

ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500

tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560

ggaagttaag cttgctcatt tgtagattag tggtcggtta cactgcaatt tagagtatca 1620

tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680

tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740

tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800

atgtgatgag tggtctttta aagattatct tttatttttt ttgagatggg gtttttctgt 1860

gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920

cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980

gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040

tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100

atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160

aatgaataga cttaccaaat tctgctgtct ccttggtaga tgtgaagttg ttggaagagt 2220

cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280

tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340

tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400

ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460

tatctggaga tccttgatta atttgaacaa gagctacctt gggttatgca gtttatgcct 2520

ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580

tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640

gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700

gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760

ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820

ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880

tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940

tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000

tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060

agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120

ccttgattga ggtcaagctg tcgagaaatg gttctcttta cagtggatcc agtcaggatt 3180

ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240

aatggcagta cattaaatgg gtttttcatt ta 3272

<210> 168

<211> 59

<212> ДНК

<213> Mus musculus

<400> 168

gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59

<210> 169

<211> 35

<212> ДНК

<213> Mus musculus

<400> 169

aacaaaggat gctgggttaa taaattgcct cattc 35

<210> 170

<211> 3167

<212> ДНК

<213> Mus musculus

<400> 170

gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60

ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120

accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180

actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240

tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300

gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360

ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420

ttgcctctgc tcccagagta ctggaattaa aggcagggac cactgtatta gccattctga 480

gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540

gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600

ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660

ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720

ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780

tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840

gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900

catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960

cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020

ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080

ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140

ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200

acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260

tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320

acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380

tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440

tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500

atttcttaca tgaattgcac tttgtacatg cttttggata tgggcctagg cttttgcttt 1560

tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620

gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680

ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740

acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800

acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860

tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920

gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980

aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040

atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100

tcttcagtga cttaggatac taatagtatc tgcctcaaaa gtgtatgtgg ttatttttgt 2160

cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220

tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280

agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340

tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400

tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460

ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520

ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580

gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640

agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700

tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760

tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820

tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880

tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940

aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000

gaaagtagct cacagtgggt aaaagccatt tgttgccaat cctaacagcc tgagttcaat 3060

cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120

cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167

<210> 171

<211> 58

<212> ДНК

<213> Mus musculus

<400> 171

gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58

<210> 172

<211> 49

<212> ДНК

<213> Mus musculus

<400> 172

aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49

<210> 173

<211> 264

<212> ДНК

<213> Mus musculus

<400> 173

acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60

gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120

tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180

tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240

cttagcaaga ctaatggtaa atct 264

<210> 174

<211> 71

<212> ДНК

<213> Mus musculus

<400> 174

agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60

ctttacatgg c 71

<210> 175

<211> 56

<212> ДНК

<213> Mus musculus

<400> 175

aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56

<210> 176

<211> 38

<212> ДНК

<213> Mus musculus

<400> 176

ttgtgtatgc gttaataaaa agaaggaact cgtactta 38

<210> 177

<211> 92

<212> ДНК

<213> Mus musculus

<400> 177

tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60

ataaagcatt tatattaatt cttgtctaga aa 92

<210> 178

<211> 91

<212> ДНК

<213> Mus musculus

<400> 178

gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60

acacaaagaa taaaaatgtg aagaacttta a 91

<210> 179

<211> 1187

<212> ДНК

<213> Mus musculus

<400> 179

tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60

aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120

aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180

gcattatctg cttatgagat taagtgtata tagtgtttgt gccaagtggt gttctgtgtg 240

taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300

tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360

gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420

caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480

atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540

gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600

ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660

gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720

gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780

agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840

ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900

aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960

gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020

ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080

ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140

agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187

<210> 180

<211> 43

<212> ДНК

<213> Mus musculus

<400> 180

gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43

<210> 181

<211> 259

<212> ДНК

<213> Mus musculus

<400> 181

ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60

gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120

cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180

ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240

gtggaattcc ttcattttg 259

<210> 182

<211> 48

<212> ДНК

<213> Mus musculus

<400> 182

acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48

<210> 183

<211> 67

<212> ДНК

<213> Mus musculus

<400> 183

aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60

ttcgctt 67

<210> 184

<211> 33

<212> ДНК

<213> Mus musculus

<400> 184

gatgctccaa taaacctcac tgctgccact cag 33

<210> 185

<211> 36

<212> ДНК

<213> Mus musculus

<400> 185

gatgacaacg acaataaagt gcgagactga ctggct 36

<210> 186

<211> 388

<212> ДНК

<213> Mus musculus

<400> 186

acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60

gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120

agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180

ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240

attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300

agcactgcct tgctccttcc cagcagacca caaagcagta tttttctgga ggattttatg 360

tgctaataaa ttatttgact taagtgtg 388

<210> 187

<211> 32

<212> ДНК

<213> Mus musculus

<400> 187

tgaaccctcc cccaataaaa gatggttcct ac 32

<210> 188

<211> 103

<212> ДНК

<213> Mus musculus

<400> 188

gcagattttg ttatgaagac aataaaatct tgacctttca acccctttga ttgcagttgt 60

tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103

<210> 189

<211> 277

<212> ДНК

<213> Mus musculus

<400> 189

gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60

caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120

tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180

tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240

ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277

<210> 190

<211> 44

<212> ДНК

<213> Mus musculus

<400> 190

gtctctgggc ctttgctgtt aataaatagt ttatatacct atga 44

<210> 191

<211> 404

<212> ДНК

<213> Mus musculus

<400> 191

aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60

tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120

ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180

caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240

agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300

ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360

attgattttt attgaacact gagtgttttg aggttttatt tttt 404

<210> 192

<211> 39

<212> ДНК

<213> Mus musculus

<400> 192

agttcaggag ctaataaagt acgtcctttg gctaatccg 39

<210> 193

<211> 48

<212> ДНК

<213> Mus musculus

<400> 193

atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48

<210> 194

<211> 36

<212> ДНК

<213> Mus musculus

<400> 194

tctgttatgc catattttca ataaacctga aaacaa 36

<210> 195

<211> 875

<212> ДНК

<213> Mus musculus

<400> 195

gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60

agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120

ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180

tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240

gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300

cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360

ccagattggg attttgtgtc ccaggaacaa agttaatgct aaaaagttaa tgccttggtg 420

agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480

cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540

gtgggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600

gaattcaagg acagtacctg gttaaatgtt tttctagctt ttctaaaaag tttgttaggc 660

ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720

ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780

aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840

agacattaaa ttgtgtcatt acttctccag gtact 875

<210> 196

<211> 67

<212> ДНК

<213> Mus musculus

<400> 196

agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60

gagcagc 67

<210> 197

<211> 50

<212> ДНК

<213> Mus musculus

<400> 197

gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50

<210> 198

<211> 84

<212> ДНК

<213> Mus musculus

<400> 198

ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60

agaaaataaa agtcatttca ctct 84

<210> 199

<211> 36

<212> ДНК

<213> Mus musculus

<400> 199

tctgttatgc catattttca ataaacctga aaacaa 36

<210> 200

<211> 446

<212> ДНК

<213> Mus musculus

<400> 200

ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60

acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120

agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180

aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240

gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300

actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360

gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420

aaattagatt atttcttttt tcaatc 446

<210> 201

<211> 332

<212> ДНК

<213> Mus musculus

<400> 201

ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60

tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120

cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180

ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240

actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300

ttatagagaa ttaaacatga aaattacatc tc 332

<210> 202

<211> 80

<212> ДНК

<213> Mus musculus

<400> 202

aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60

aagttactgt taatgatacc 80

<210> 203

<211> 93

<212> ДНК

<213> Mus musculus

<400> 203

gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60

gttcaataaa gtcctgaggc aactctctct gtc 93

<210> 204

<211> 152

<212> ДНК

<213> Mus musculus

<400> 204

tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60

ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120

ttggtgtcag tttttcaata aagttttaat ta 152

<210> 205

<211> 1841

<212> ДНК

<213> Mus musculus

<400> 205

agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60

tcaagtatct tcagagaaga ttattttctg ccttcagaaa ctgaaggaag gcttgggcct 120

agagaacgac agtaaggtgc gagcaccgga gacacttaac acagctcagt ccatggaagg 180

acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240

ccctgctcat cctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300

tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360

catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420

ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480

tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540

cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600

ctgaagttta atcacttgtc ttctattaaa aactagtgtt tgcctgggcc tggtgtgtat 660

acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720

caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780

taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840

gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900

ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960

gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020

gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080

gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140

actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200

tggaatttaa aacaagcttt tttctatata gtaaaagatt gtttttaaga tttttgcgtg 1260

tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320

atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380

ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg ccagccaggg 1440

ttacagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500

taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560

ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620

tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgagggggcc 1680

caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740

accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800

aagacagcta cagtgtactt acataaaata aataaatctt t 1841

<210> 206

<211> 2035

<212> ДНК

<213> Искусственная последовательность

<220>

<223> последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - альбумин - A64 - C30 - гистонSL

<400> 206

ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60

gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120

ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180

accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240

ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300

gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360

gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420

ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480

ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540

tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600

ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660

ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720

cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780

ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840

gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900

cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960

aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 1080

accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140

ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200

ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260

aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320

atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 1440

aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500

gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560

gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620

ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680

aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740

taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800

tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860

cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980

cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035

<---

1. Искусственная молекула нуклеиновой кислоты для генетической терапии или генетической вакцинации, содержащая

а. по меньшей мере одну открытую рамку считывания (ОРС), кодирующую терапевтический пептид; и

б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR), который содержит нуклеотидную последовательность, происходящую из 3'-UTR гена рибосомального белка или из функционального варианта 3'-UTR гена рибосомального белка, в котором указанный функциональный вариант по меньшей мере на 80% идентичен указанному 3'-UTR гену рибосомального белка; и

в. 5'-нетранслируемая область (5'-UTR), как дополнительного 5'-конце элемента, где 5'-UTR - это 5'TOP-UTR, который не содержит 5'-ТОР мотив.

2. Искусственная молекула нуклеиновой кислоты по п. 1, в которой по меньшей мере один 3'-UTR-элемент повышает, стабилизирует и/или пролонгирует получение белка с указанной искусственной молекулы нуклеиновой кислоты.

3. Искусственная молекула нуклеиновой кислоты по п. 1 или 2, в которой 3'-UTR гетерологична ОРС.

4. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-3, в которой по меньшей мере один 3'-UTR-элемент содержит нуклеотидную последовательность, происходящую из 3'-UTR гена эукариотического рибосомального белка, предпочтительно из 3'-UTR гена рибосомального белка позвоночного, более предпочтительно из 3'-UTR гена рибосомального белка млекопитающего, еще более предпочтительно из 3'-UTR гена рибосомального белка примата, в частности гена рибосомального белка человека, или гена рибосомального белка грызуна, в частности гена рибосомального белка мыши.

5. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-4, в которой ОРС не кодирует репортерный ген или не происходит из репортерного гена, где репортерный ген предпочтительно не выбирают из группы, состоящей из белков глобина, прежде всего бета-глобина, белка люциферазы, белков бета-глюкуронидазы (GUS) и GFP или их вариантов, предпочтительно не из EGFP, или вариантов, последовательности которых идентичны по меньшей мере на 70% последовательности белка глобина, белка люциферазы или белка GFP;

ОРС не кодирует рибосомальный белок, предпочтительно не эукариотический рибосомальный белок, где рибосомальный белок предпочтительно не выбран из рибосомального белка S6 (RPS6), рибосомального белка L36a-подобного (RPL36AL) или рибосомального белка S16 (RPS16); или

3'-UTR не происходит из вируса.

6. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-5, в которой 3'-UTR, предпочтительно искусственная молекула нуклеиновой кислоты, не содержит поли(А)-последовательность или сигнал полиаденилирования, или

3'-UTR, предпочтительно искусственная молекула нуклеиновой кислоты, содержит поли(А)-последовательность или сигнал полиаденилирования, где

поли(А)-последовательность или сигнал полиаденилирования предпочтительно локализован на 3'-конце 3'-UTR-элемента.

7. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-6, в которой по меньшей мере один 3'-UTR-элемент содержит нуклеотидную последовательность, происходящую из 3'-UTR последовательности, выбранной из группы, которая состоит из рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка, большой субъединицы, Р0 (RPLP0), рибосомального белка, большой субъединицы, P1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, X-сцепленного (RPS4X), Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка L10a (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA), продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли (FBR-MuSV), белка 1, подобного рибосомальному белку L22 (RPL22L1), подобного рибосомальному белку L39 (RPL39L), белка, подобного рибосомальному белку L10 (RPL10L), белка, подобного рибосомальному белку L36a (RPL36AL), белка, подобного рибосомальному белку L3 (RPL3L), белка, подобного рибосомальному белку S27 (RPS27L), белка 1, подобного рибосомальному белку L26 1 (RPL26L1), белка 1, подобного рибосомальному белку L7 (RPL7L1), псевдогена рибосомального белка L13a (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена 11 рибосомального белка S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка, большой субъединицы, Р0 (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14).

8. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-7, в которой по меньшей мере один 3,-UTR-элемент содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, выбранной из группы, состоящей из SEQ ID NO: 10-205.

9. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-8, содержащая 5'-кэп-структуру, поли(С)-последовательность, гистоновую структуру типа «стебель-петля» и/или IRES-мотив.

10. Искусственная молекула нуклеиновой кислоты по п. 9, в которой гистоновая структура типа «стебель-петля» содержит последовательность SEQ ID NO: 5.

11. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-10, где искусственная молекула нуклеиновой кислоты, предпочтительно ОРС, имеет по меньшей мере частично модифицированное содержание G/C, где предпочтительно содержание G/C в ОРС увеличено по сравнению с ОРС дикого типа, и/или ОРС содержит область с оптимизированными кодонами, в которой предпочтительно ОРС имеет оптимизированные кодоны.

12. Искусственная молекула нуклеиновой кислоты по любому из пп. 1-11, которая представляет собой РНК, предпочтительно молекулу мРНК.

13. Вектор экспрессии, содержащий искусственную молекулу нуклеиновой кислоты по любому из пп. 1-12.

14. Вектор по п. 13, представляющий собой плазмидный вектор или вирусный вектор, предпочтительно плазмидный вектор.

15. Клетка для получения искусственной молекулы нуклеиновой кислоты любой из пп. 1-12 или кодируемого таким образом пептида, содержащая вектор п. 13 или 14.

16. Фармацевтическая композиция для генетической терапии или генетической вакцинации, содержащая эффективное количество искусственной молекулы нуклеиновой кислоты по одному из пп. 1-12, вектора по п. 13 или 14, или клетки по п. 15 и один или несколько фармацевтически приемлемых наполнителей, разбавителей и/или эксципиентов, и/или один или несколько адъювантов.

17. Применение искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12, вектора по п. 13 или 14, клетки по п. 15 или фармацевтической композиции по п. 16 для получения лекарственного средства для генетической терапии или генетической вакцинации.

18. Применение искусственной молекулы нуклеиновой кислоты по любому из пп. 1-12, вектора по п. 13 или 14, клетки по п. 15 или фармацевтической композиции по п. 16 для генетической терапии или генетической вакцинации.

19. Способ увеличения продукции белка из искусственной молекулы нуклеиновой кислоты in vitro, включающий стадию ассоциации молекулы нуклеиновой кислоты с 3'-UTR-элементом, как определено в любом из пп. 1-8.

20. Способ по п. 19, в котором искусственная молекула нуклеиновой кислоты представляет собой молекулу мРНК.

21. Применение 3'-UTR-элемента, как определено в любом из пп. 1-8, для увеличения продукции белка из молекулы нуклеиновой кислоты или вектора in vitro.

22. Применение по п. 21, в котором искусственная молекула нуклеиновой кислоты представляет собой молекулу мРНК.

23. Набор для генетической терапии или генетической вакцинации, содержащий искусственную молекулу нуклеиновой кислоты по любому из пп. 1-12, вектор по п. 13 или 14, клетку по п. 15 и фармацевтическую композицию по п. 16.

24. Набор по п. 23, содержащий инструкции по применению, клетки для трансфекции, адъювант, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разведения искусственной молекулы нуклеиновой кислоты, вектора, клеток или фармацевтической композиции.



 

Похожие патенты:

Изобретение относится к области молекулярной биологии и диагностической медицины. Описан способ определения контаминации образцов примесью ДНК.

Изобретение относится к области молекулярной биологии и диагностической медицины. Описан способ определения контаминации образцов примесью ДНК.

Изобретение относится к области биотехнологии. Предложен компьютерно-реализуемый интегральный способ для оценки качества результатов таргетного секвенирования.

Группа изобретений относится к области биотехнологии. Предложен биосенсор и система для быстрого обнаружения определяемых компонентов, а также способ получения указанной системы и способ обнаружения определяемого компонента.

Группа изобретений относится к области биотехнологии. Предложен биосенсор и система для быстрого обнаружения определяемых компонентов, а также способ получения указанной системы и способ обнаружения определяемого компонента.

Изобретение относится к области биотехнологии. Предложен зонд, состоящий из выделенной нуклеиновой кислоты, для обнаружения M.

Группа изобретений относится к биотехнологии, в частности к области стабилизации дезоксирибонуклеиновой кислоты (ДНК) человека и микроорганизмов, присутствующей в сложных биологических образцах, таких как фекалии.

Изобретение относится к биотехнологии, в частности к способу обнаружения плоидности хромосомных сегментов или целых хромосом, для обнаружения однонуклеотидных вариантов и для обнаружения, как плоидности хромосомных сегментов, так и однонуклеотидных вариантов.

Изобретение относится к биотехнологии, в частности к способу обнаружения плоидности хромосомных сегментов или целых хромосом, для обнаружения однонуклеотидных вариантов и для обнаружения, как плоидности хромосомных сегментов, так и однонуклеотидных вариантов.

Изобретение относится к биотехнологии. Описан способ анализа по меньшей мере двух или более анализируемых веществ множества единичных клеток, включающий: (a) обеспечение наличия множества элементов, сохраняющих связность (CE), где каждый CE включает единичную клетку; (b) проведение лизиса единичных клеток, находящихся в CE, при котором анализируемые вещества, находящиеся в единичной клетке, высвобождаются в CE; (c) обеспечение наличия первой репортерной группы для первого анализируемого вещества, находящегося в единичной клетке в каждом CE; (d) обеспечение наличия второй репортерной группы для второго анализируемого вещества, находящегося в единичной клетке в каждом CE; (e) модификацию анализируемых веществ, в результате которой по меньшей мере часть первого и второго анализируемых веществ, содержащихся в CE, включает первую и вторую репортерные группы соответственно; (f) объединение CE, включающего анализируемые вещества, включающие репортерные группы; (g) компартментализацию CE, включающего первое и второе анализируемые вещества, включающие первую и вторую репортерные группы соответственно, с образованием множества компартментов; (h) обеспечение наличия третьей репортерной группы для первого анализируемого вещества, включающего первую репортерную группу, в каждом CE; (i) обеспечение наличия четвертой репортерной группы для второго анализируемого вещества, включающего вторую репортерную группу, в каждом CE; (j) дополнительную модификацию анализируемых веществ, в результате которой по меньшей мере часть первых анализируемых веществ включает первую и третью репортерные группы, а по меньшей мере часть вторых анализируемых веществ включает вторую и четвертую репортерные группы; (k) анализ анализируемых веществ, включающих репортерные группы, в каждом компартменте, причем в проводимом анализе производят обнаружение единичной клетки, которая является источником каждого анализируемого вещества.

Изобретение относится к области биотехнологии, конкретно к экспрессионному вектору для рекомбинантной экспрессии интересующего полипептида, содержащему экспрессионную кассету, включающую полинуклеотид, кодирующий мутантный фолатный рецептор в качестве селективного маркера, при этом мутантный фолатный рецептор имеет сниженную аффинность связывания фолата по сравнению с фолатным рецептором дикого типа.

Изобретение относится к области биотехнологии, конкретно к экспрессионным кластерам, содержащим коровый элемент сайта гиперчувствительности к ДНКазе I 2 (HS2) кластера человеческого гена β-глобина или сайт гиперчувствительности 40 (HS40) кластера человеческого гена α-глобина и часть промотора человеческого гена Aγ-глобина.

Изобретение относится к области биотехнологии и молекулярной биологии. Предложен векторный геном на основе аденоассоциированного вируса (AAV) для ингибирования или подавления экспрессии гена супероксиддисмутазы 1 (SOD1) в клетке млекопитающего, а также соответствующая частица, способ ингибирования экспрессии гена, фармацевтическая композиция, способ лечения бокового амиотрофического склероза и дуплекс siРНК.

Настоящая группа изобретений относится к адоптивной терапии. Предложены химерные рецепторы антигена (CAR), содержащие мезотелин-связывающий домен, а также кодирующие их нуклеиновые кислоты, вектор и клетка.

Изобретение относится к области биохимии, в частности к грызуну для экспрессии модифицированного гена С3, геном которого содержит замену последовательности гена С3 грызуна в эндогенном локусе С3 грызуна на последовательность гена С3 человека с образованием модифицированного гена С3, а также к способу его получения, его эмбриону и клетке.

Изобретение относится к области биохимии, в частности к грызуну для экспрессии модифицированного гена С3, геном которого содержит замену последовательности гена С3 грызуна в эндогенном локусе С3 грызуна на последовательность гена С3 человека с образованием модифицированного гена С3, а также к способу его получения, его эмбриону и клетке.

Изобретение относится к новым эукариотическим клеткам, подходящим для рекомбинантного продуцирования представляющего интерес продукта, где геном клетки-хозяина модифицируют для ингибирования функция белка FAM60A в указанной клетке, например, посредством снижения или блокирования функциональной экспрессии гена FAM60A, что приводит к повышению ее стабильности.

Изобретение относится к области биохимии, в частности к способу модификации целевого геномного локуса на Y-хромосоме в мышиной эмбриональной стволовой клетке (ЭС). При этом способ предусматривает: обеспечение мышиной ЭС клетки, содержащей целевой геномный локус на Y-хромосоме, причем целевой геномный локус содержит сайт распознавания для нуклеазного агента, и где мышиная ЭС клетка находится в культуре, содержащей основную среду DMEM, введение в мышиную ЭС клетку нуклеазного агента или полинуклеотида, кодирующего нуклеазный агент, причем нуклеазный агент индуцирует одно- или двухцепочечный разрыв на сайте распознавания, и большого нацеливающего вектора, содержащего полинуклеотидную вставку, и идентификацию по меньшей мере одной мышиной ЭС клетки, содержащей в своем геноме полинуклеотидную вставку, интегрированную в целевой геномный локус.

Изобретение относится к области биотехнологии, конкретно к рекомбинантной молекуле нуклеиновой кислоты для увеличения эффективности продукции трансгена, экспрессируемого в клетке млекопитающего.

Настоящее изобретение относится к биоинженерии. Предложена композиция, содержащая нуклеиновую кислоту, кодирующую ген-редактирующий белок, включающий домен нуклеазы и ДНК-связывающий домен, содержащий повторы с аминокислотной последовательностью LTPvQVVAIAwxyzGHGG, где “v” представляет собой Q, D или E, “w” – S или N, “xy” - HD, NG, NS, NI, NN или N, а “z” - GGKQALETVQRLLPVLCQD или GGKQALETVQRLLPVLCQA.

Изобретение относится к области биотехнологии, конкретно к способу отбора стабильной продуцирующей антитело под контролем промотора CMV человека с SEQ ID NO: 1 клетки яичника китайского хомячка СНО-К1.
Наверх