Молекулы новых искусственных нуклеиновых кислот

Изобретение относится к молекуле искусственной нуклеиновой кислоты, для экспрессии белка или пептида in vitro, включающей по меньшей мере одну открытую рамку считывания и по меньшей мере один элемент 3'-нетранслируемой области, причем по меньшей мере один элемент 3'-UTR продлевает и/или увеличивает выработку белка указанной молекулы искусственной нуклеиновой кислоты и происходит от стабильной мРНК, в которой по меньшей мере один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая происходит от 3'-UTR транскрипта – GNAS. Изобретение также относится к вектору и клетке для обеспечения транскрипции молекулы нуклеиновой кислоты, способу получения белка или пептида, синтезируемого искусственной молекулой нуклеиновой кислоты и применению элемента 3'-UTR и/или элемента 5'-UTR для получения белка или пептида in vitro за счет увеличения и/или продления его выработки молекулой искусственной нуклеиновой кислоты или вектором. 5 н. и 14 з.п. ф-лы, 9 пр., 30 ил., 10 табл.

 

Настоящее изобретение разработано при поддержке правительства по Договору №HR0011-11-3-0001, заключенному с Управлением перспективных исследовательских проектов Министерства обороны США (Defense Advanced Research Projects Agency - DARPA). В настоящей заявке испрашивают приоритет международной патентной заявки РСТ/ЕР 2014/003479, поданной 30 декабря 2014 года, которая включена в настоящее описание в виде ссылки.

Настоящее изобретение относится к молекулам искусственных нуклеиновых кислот, содержащим открытую рамку считывания, элемент 3'-нетранслируемой области (элемент 3'-UTR) и или элемент 5'-нетранслируемой области (элемент 5'-UTR) и необязательно последовательность поли(А) и/или сигнал полиаденилирования. Настоящее изобретение также относится к вектору, содержащему элемент 3'-UTR и/или элемент 5'-UTR, к клетке, содержащей молекулу искусственной нуклеиновой кислоты или вектор, к фармацевтической композиции, содержащей молекулу искусственной нуклеиновой кислоты или вектор, и к набору, содержащему молекулу искусственной нуклеиновой кислоты, вектор и/или фармацевтическую композицию, предпочтительно для использования в области генной терапии и/или генетической вакцинации. Генная терапия и генетическая вакцинация относятся к наиболее перспективным и быстро развивающимся методам современной медицины. Они могут предоставить высокоспецифичные и индивидуальные варианты терапии большого числа различных заболеваний. Такие методы могут применяться для лечения наследственных генетических заболеваний, аутоиммунных заболеваний, раковых или связанных с опухолями заболеваний, а также воспалительных заболеваний. Кроме того, предусматривают предотвращение раннего начала перечисленных заболеваний с помощью указанных подходов.

В основе генной терапии лежит изменение экспрессии нарушенных генов, связанных с патологическими состояниями определенных заболеваний. Патологически измененная экспрессия гена может приводить к отсутствию или избыточной экспрессии важных генных продуктов, например, сигнальных факторов, например, гормонов, факторов «домашнего хозяйства» (housekeeping factors), ферментов метаболизма, структурных белков и других. Измененная экспрессия гена может быть связана не только с неправильной регуляцией транскрипции и/или трансляции, но также с мутациями в открытой рамке считывания (ORF), кодирующей определенный белок. Патологические мутации могут быть вызваны, например, хромосомной аберрацией или более конкретными мутациями, например, точечными мутациями или мутациями типа сдвига рамки, в результате чего происходит ограничение функции и, возможно, полная потеря функции генного продукта. Однако может также произойти нарушение регуляции транскрипции или трансляции, если мутации влияют на гены, кодирующие белки, которые участвуют в аппарате транскрипции или трансляции в клетке. Такие мутации могут приводить к патологическому повышению или понижению регуляции генов, что также влияет на функциональность. Гены, кодирующие генные продукты, которые оказывают такие регуляторные функции, могут быть, например, факторами транскрипции, сигнальными рецепторами, белками-посредниками или генами других продуктов. Однако потеря функции таких генов, кодирующих регуляторные белки, при определенных обстоятельствах может быть отменена искусственным введением других факторов, действующих дальше по цепи от продукта измененного гена. Такие генные дефекты также могут быть компенсированы генной терапией путем замены самого измененного гена.

Генетическая вакцинация позволяет индуцировать требуемый иммунный ответ на выбранные антигены, например, специфические компоненты на поверхности бактериальных клеток, вирусные частицы, опухолевые антигены или другие. В целом, вакцинация является одним из основных достижений современной медицины. Однако эффективные вакцины в настоящее время доступны только для ограниченного числа заболеваний. Соответственно, инфекции, которые не поддаются профилактике при вакцинации, по-прежнему воздействуют на миллионы людей каждый год.

Обычно вакцины могут быть подразделены на вакцины первого, второго и третьего поколения. Вакцины первого поколения обычно являются вакцинами, представляющими целые организмы. Они основаны либо на живых, либо на аттенуированных или убитых патогенах, например, вирусах, бактериях или других организмах. Основным недостатком живых и аттенуированных вакцин является риск возврата к вариантам, опасным для жизни. Таким образом, хотя и аттенуированные, такие патогены могут по-прежнему представлять непредсказуемый риск. Убитые патогены могут быть не столь эффективными для обеспечения специфического иммунного ответа. Чтобы свести к минимуму такой риск, были разработаны вакцины второго поколения. Обычно это вакцины состоят из частей, а именно из определенных антигенов или рекомбинантных белковых компонентов, которые получены из патогенов.

Генетические вакцины, то есть вакцины, предназначенные для генетической вакцинации, обычно рассматривают в качестве вакцин третьего поколения. Обычно они состоят из молекул сконструированных нуклеиновых кислот, которые допускают экспрессию фрагментов пептида или белка (антигенов), характерных для патогена или опухолевого антигена in vivo. Генетические вакцины экспрессируются при введении пациенту после их поглощения клетками-мишенями. Экспрессия вводимых нуклеиновых кислот приводит к получению кодируемых ими белков. Если эти белки распознаются иммунной системе пациента в качестве чужеродных, активируется иммунный ответ.

Из вышесказанного следует, что оба метода, генная терапия и генетическая вакцинация, основаны главным образом на введении молекул нуклеиновой кислоты пациенту с последующей транскрипцией и/или трансляцией закодированной генетической информации. В другом варианте генетическая вакцинация или генная терапия могут также подразумевать способы, которые включают выделение из организма подвергаемого лечению пациента определенных клеток, последующую трансфекцию ex vivo этих клеток и повторное введение обработанных клеток пациенту.

ДНК, а также РНК, могут быть использованы в качестве молекул нуклеиновых кислот для введения в контексте генной терапии или генетической вакцинации. Известно, что ДНК относительно стабильна и проста в обращении. Однако использование ДНК несет риск нежелательной инсерции введенных ДНК-фрагментов в геном пациента, что может привести к мутациям, например, к потере функции ослабленных генов. Также дополнительный риск представляет опасная ситуация, связанная с выработкой анти-ДНК-антител. Другим недостатком является ограниченный уровень экспрессии закодированного пептида или белка, который достигается при введении ДНК, потому что ДНК должна войти в ядро для транскрипции раньше, чем может произойти трансляция мРНК. Среди других причин находится уровень экспрессии вводимой ДНК, который может зависеть от наличия специфических факторов транскрипции, которые регулируют транскрипцию ДНК. При отсутствии таких факторов транскрипция ДНК не даст достаточных количеств РНК. В результате уровень полученного в результате трансляции пептида или белка ограничен.

Используя РНК вместо ДНК для генной терапии или генетической вакцинации, риск нежелательной геномной интеграции и выработки анти-ДНК-антител минимизируется или исключается. Однако РНК рассматривают в качестве довольно нестабильных молекул, которые могут быть легко разрушены повсеместно присутствующими РНКазами.

Обычно разрушение РНК способствует регуляции времени полураспада РНК. Этот эффект был рассмотрен и одобрен для точной настройки регуляции экспрессии генов эукариот (Friedel с соавт., 2009). Соответственно, каждая встречающаяся в природе мРНК имеет свой индивидуальный период полураспада в зависимости от гена, от которого получена мРНК, и от типа клеток, в которых она экспрессируется. Это влияет на регулирование уровня экспрессии этого гена. Нестабильные РНК важны для реализации временной генной экспрессии в разные моменты времени. Однако долгоживущие РНК могут быть связаны с накоплением отдельных белков или с непрерывной экспрессией генов. In vivo период полураспада мРНК также может зависеть от факторов окружающей среды, таких как гормональная терапия, что было показано, например, для мРНК инсулиноподобного фактора роста I, актина и альбумина (Johnson с соавт., 1991).

Для генной терапии и генетической вакцинации обычно требуется стабильная РНК. Это, с одной стороны, связано с тем, что обычно желательно, чтобы продукт, кодируемый последовательностью РНК, накапливался in vivo. С другой стороны, РНК должна сохранять свою структурную и функциональную целостность при приготовлении соответствующей лекарственной формы, в процессе ее хранения и при введении. Таким образом, были предприняты усилия по созданию стабильных молекул РНК для генной терапии или генетической вакцинации, чтобы предотвратить их раннее разрушение.

Установлено, что содержание G/C в молекулах нуклеиновых кислот может влиять на их стабильность. Поэтому нуклеиновые кислоты, содержащие повышенное количество остатков гуанина (G) и/или цитозина (С), могут быть функционально более стабильными, чем нуклеиновые кислоты, содержащие большое количество адениновых (А) и тиминовых (Т) или урацильных (U) нуклеотидов. В этом контексте предусматривают фармацевтическую композицию, содержащую мРНК, которая стабилизируется с помощью модификаций последовательности в кодируемой области (WO 02/098443). Преимущество такой модификации последовательностей использует в качестве преимущества вырождение генетического кода. Соответственно, кодоны, которые содержат менее благоприятную комбинацию нуклеотидов (менее благоприятных с точки зрения стабильности РНК), могут быть заменены другими кодонами без изменения закодированной аминокислотной последовательности. Такой метод стабилизации РНК ограничен положениями специфической нуклеотидной последовательности в случае каждой отдельной молекулы РНК, которая не позволяет выйти за рамки требуемой аминокислотной последовательности. Кроме того, этот подход ограничивается кодирующими областями РНК.

В качестве альтернативного варианта стабилизации мРНК было установлено, что природные молекулы эукариотической мРНК содержат специфические стабилизирующие элементы. Например, они могут содержать так называемые нетранслируемые области (untranslated regions - UTR) с 5'-конца (5'-UTR) и/или с 3'-конца (3'-UTR), а также другие структурные характеристики, например, структуру 5'-кэп или 3'-поли(А) хвост. И 5'-UTR, и 3'-UTR, обычно транскрибируются с геномной ДНК и, таким образом, являются элементом незрелой мРНК. Характерные структурные особенности зрелой мРНК, например, 5'-кэп и 3'-поли(А) хвост (также называемый поли(А) хвостом или последовательностью поли(А)), обычно добавляют к транскрибированной (незрелой) мРНК при процессинге мРНК.

3'-поли(А) хвост обычно представляет монотонный отрезок последовательности из аденозиновых нуклеотидов, добавленных к 3'-концу транскрибируемой мРНК. Он может содержать до 400 аденозиновых нуклеотидов. Установлено, что длина такого 3'-поли(А) хвоста потенциально является принципиально важным элементом стабильности индивидуальной мРНК.

Также было показано, что 3'-UTR α-глобина может быть важным фактором для известной стабильности мРНК α-глобина (Rodgers с соавт., 2002).

Установлено, что 3'-UTR мРНК α-глобина участвует в формировании специфического рибонуклеопротеинового комплекса, α-комплекса, чье присутствие коррелирует со стабильностью мРНК in vitro (Wang с соавт., 1999).

Интересная регуляторная функция была также показана для UTR в мРНК рибосомных белков: хотя 5'-UTR мРНК рибосомных белков контролирует связанную с ростом трансляцию мРНК, строгость такой регуляции обусловливается соответствующим 3'-UTR в мРНК рибосомных белков (Ledda с соавт., 2005). Этот механизм способствует модели специфической экспрессии рибосомных белков, которые обычно транскрибируются постоянно, поэтому некоторые мРНК рибосомных белков, например, рибосомного белка S9 или рибосомного белка L32, называются генами «домашнего хозяйства» (Janovick-Guretzky с соавт., 2007). Таким образом, связанная с ростом картина экспрессии рибосомных белков обусловлена главным образом регулированием уровня трансляции.

Независимо от факторов, влияющих на стабильность мРНК, эффективная трансляция введенных молекул нуклеиновых кислот клетками-мишенями или тканью имеет решающее значение для какого-либо подхода с использованием молекул нуклеиновых кислот для генной терапии или генетической вакцинации. Как видно из приведенных выше примеров, наряду с регуляцией стабильности, также трансляция большинства мРНК регулируется такими структурными характеристиками, как UTR, 5'-кэп и 3'-поли(А) хвост. В этом контексте показано, что длина поли(А) хвоста может также играть важную роль в эффективности трансляции. Однако стабилизирующие 3'-элементы также могут оказывать ослабляющее воздействие на трансляцию.

Задача настоящего изобретения заключается в получении молекул нуклеиновых кислот, которые могут быть применимы в генной терапии и/или генетической вакцинации. В частности, задача настоящего изобретения заключается в получении типов мРНК, стабилизированных против преждевременного разрушения без проявления существенного ухудшения эффективности трансляции. Кроме того, задача настоящего изобретения заключается в получении искусственных молекул нуклеиновых кислот, предпочтительно мРНК, которые характеризуется повышенной экспрессией соответствующего белка, кодируемого указанной молекулой нуклеиновой кислоты. Одной из конкретных задач настоящего изобретения является получение мРНК, причем эффективность трансляции соответствующего кодированного белка повышается. Другой задачей настоящего изобретения является получение молекул нуклеиновой кислоты, кодирующих такие улучшенные виды мРНК, которые могут быть пригодны для применения в генной терапии и/или генетической вакцинации. Еще одной задачей, решаемой в настоящем изобретении, является предоставление фармацевтической композиции для использования в генной терапии и/или генетической вакцинации. Таким образом, целью настоящего изобретения является предоставление улучшенных видов нуклеиновых кислот, которые преодолевают вышеупомянутые недостатки предшествующего уровня техники с помощью экономичного и прямого подхода.

Сущность, лежащая в основе настоящего изобретения, представлена в формуле изобретения.

Для ясности и четкости понимания настоящего изобретения ниже приведено определение применяемых в настоящем изобретении понятий. Какая-либо техническая характеристика, приведенная в определениях, может быть прочитана в каждом варианте осуществления настоящего изобретения. Дополнительные определения и пояснения могут быть специально приведены в контексте вариантов осуществления настоящего изобретения.

Адаптивный иммунный ответ. Адаптивный иммунный ответ обычно понимают в виде антигенспецифического ответа иммунной системы. Специфичность антигена позволяет получать ответы, адаптированные к конкретным патогенам или инфицированным патогенами клеткам. Способность повышать такие ответные реакции обычно поддерживается в организме с помощью «клеток памяти». Если патоген инфецирует организм более одного раза, указанные клетки памяти обеспечивают быструю элиминацию патогена. В этом контексте первой стадией адаптивного иммунного ответа является активация наивных антигенспецифических Т-клеток или различных иммунных клеток, способных индуцировать антигенспецифический иммунный ответ с помощью антигенпрезентирующих клеток. Это происходит в лимфоидных тканях и органах, через которые постоянно проходят наивные Т-клетки. Тремя типами клеток, которые могут выступать в роли антигенпрезентирующих клеток, являются дендритные клетки, макрофаги и В-клетки. Каждая из этих клеток имеет определенную функцию в индукции иммунного ответа.

Дендритные клетки могут поглощать антигены фагоцитозом и макропиноцитозом и могут стимулироваться за счет контакта, например, с чужим антигеном, для миграции в локальную лимфоидную ткань, где происходит дифференциация этих клеток в зрелые дендритные клетки. Макрофаги поглощают антигены-частицы, например, бактерии, и индуцируются инфекционными агентами или другими соответствующими стимулами для экспрессии молекул МНС. Уникальная способность В-клеток связывать и интернализировать растворимые белковые антигены через их рецепторы также может иметь важное значение для индукции Т-клеток. Молекулы МНС обычно отвечают за презентацию антигена Т-клеткам. При этом путем презентации антигена на молекулах МНС происходит активация Т-клеток, которая индуцирует их пролиферацию и дифференцировку в усиленные эффекторные Т-клетки. Важнейшей функцией эффекторных Т-клеток является уничтожение инфицированных клеток CD8+ цитотоксическими Т-клетками и активация макрофагов клетками Th1, которые вместе составляют опосредованный клетками иммунитет, а также активация В-клеток как клетками Th2, так и клетками Th1, для получения различных классов антител, что в результате вызывает гуморальный иммунный ответ. Т-клетки распознают антиген своими рецепторами, которые не распознают и не связывают антиген непосредственно, а вместо этого распознают короткие пептидные фрагменты, например, производные от патогенов белковые антигены, т.е. так называемые эпитопы, которые связываются с молекулами МНС на поверхностях других клеток.

Адаптивная иммунная система. Адаптивная иммунная система по существу предназначена для устранения или предотвращения патогенного роста. Она обычно регулирует адаптивный иммунный ответ, обеспечивая иммунную систему позвоночных способностью распознавать и запоминать специфические патогены (для выработки иммунитета) и усиливать силу атаки каждый раз при столкновении с патогеном. Система способна выработать высокую степень адаптации из-за соматической гипермутации (процесса повышенного возникновения соматических мутаций) и рекомбинации V(D)J (необратимая генетическая рекомбинация сегментов гена антигенного рецептора). Этот механизм позволяет небольшому числу генов вырабатывать огромное количество различных антигенных рецепторов, которые затем однозначно экспрессируются на каждом отдельном лимфоците. Поскольку перегруппировка генов приводит к необратимому изменению ДНК в каждой клетке, все потомство такой клетки наследует гены, кодирующие ту же специфичность рецептора, включая В-клетки памяти и Т-клетки памяти, которые являются ключевыми для долговременного специфического иммунитета.

Адъювант/адъювантный компонент. Адъювант или адъювантный компонент в самом широком смысле обычно является фармакологическим и/или иммунологическим агентом, который может модифицировать, например, повышать действие других агентов, например, лекарств или вакцин. Понятие «адъювант» следует толковать в широком смысле и применять в отношении широкого спектра веществ. Обычно адъюванты могут повышать иммуногенность антигенов. Например, адъюванты могут быть распознаны врожденными иммунными системами и, например, могут вызывать врожденный иммунный ответ. «Адъюванты» обычно не вызывают адаптивного иммунного ответа. Поскольку «адъюванты» не квалифицируются в качестве антигенов, их механизм действия отличается от эффектов, вызванных антигенами и приводящих к адаптивному иммунному ответу.

Антиген. В контексте настоящего изобретения понятие «антиген» обычно относят к веществу, которое может быть распознано иммунной системой, предпочтительно адаптивной иммунной системой, и которое способно инициировать антигенспецифический иммунный ответ, например, путем образования антител и/или антигенспецифических Т-клеток в качестве части адаптивного иммунного ответа. Как правило, антиген может быть белком или пептидом или может содержать белок или пептид, который может быть презентирован МНС Т-клеткам. В настоящем изобретении антиген может быть продуктом трансляции предоставленной молекулы нуклеиновой кислоты, предпочтительно мРНК по настоящему изобретению. Также в этом контексте фрагменты, варианты и производные пептидов и белков, включающие по меньшей мере один эпитоп, рассматривают в качестве антигенов. В настоящем изобретении особенно предпочтительными являются опухолевые антигены и антигены патогенов согласно описанию настоящего изобретения.

Молекула искусственной нуклеиновой кислоты. Под молекулой искусственной нуклеиновой кислоты обычно подразумевают молекулу нуклеиновой кислоты, например, ДНК или РНК, которая не возникает естественным образом. Иначе говоря, под молекулой искусственной нуклеиновой кислоты можно понимать неприродную молекулу нуклеиновой кислоты. Такая молекула нуклеиновой кислоты может быть неприродной, исходя из присущей ей специфической последовательности (которая не возникает естественным образом), и/или из-за других модификаций, например, структурных модификаций нуклеотидов, которые не встречаются в природе. Молекула искусственной нуклеиновой кислоты может быть молекулой ДНК, молекулой РНК или гибридной молекулой, содержащей части и ДНК, и РНК. Обычно молекулы искусственных нуклеиновых кислот могут быть разработаны и/или получены методами генной инженерии, чтобы соответствовать требуемой искусственной последовательности нуклеотидов (гетерологичной последовательности). В этом контексте искусственная последовательность обычно является последовательностью, которая может естественным образом не возникать, то есть она отличается от исходной последовательности, по меньшей мере, одним нуклеотидом. Понятие «исходная последовательность» означает природную последовательность, также называемую последовательностью дикого типа. Кроме того, понятие «молекула искусственной нуклеиновой кислоты» не ограничивается понятием «одна молекула», но обычно оно означает совокупность идентичных молекул. Соответственно, это понятие может относиться к множеству идентичных молекул, содержащихся в аликвоте.

Бицистронная РНК, мультицистронная РНК. Бицистронная или мультицистронная РНК обычно означает РНК, предпочтительно мРНК, которая может иметь иметь две (бицистронные) или более (мультицистронные) открытые рамки считывания (open reading frames - ORF). Открытая рамка считывания в этом контексте представляет последовательность кодонов, которая может транслироваться в пептид или белок.

Носитель/полимерный носитель. Носителем в контексте изобретения обычно может быть соединение, которое способствует транспорту другого соединения (груза) и/или образованию с ним комплекса. Полимерный носитель это обычно носитель, образованный из полимера. Носитель может быть связан со своим грузом за счет ковалентной или нековалентной связи. Носитель может транспортировать нуклеиновые кислоты, например, РНК или ДНК, к клеткам-мишеням. В некоторых вариантах осуществления настоящего изобретения носитель может быть катионным компонентом.

Катионный компонент. Понятие «катионный компонент» обычно относят к заряженной молекуле, которая заряжена положительно (катион) при значении рН обычно от 1 до 9, предпочтительно при значении рН ниже 9 (например, от 5 до 9), или ниже 8 (например, от 5 до 8), или ниже 7 (например, от 5 до 7), наиболее предпочтительно при физиологическом рН, например от 7,3 до 7,4. Соответственно, катионным компонентом может быть какое-либо положительно заряженное соединение или полимер, предпочтительно катионный пептид или белок, который положительно заряжен в физиологических условиях, особенно в физиологических условиях in vivo. «Катионный пептид или белок» может содержать, по меньшей мере, одну положительно заряженную аминокислоту или более одной положительно заряженной аминокислоты, например, выбранных из Arg, His, Lys или Orn. Соответственно, «поликатионные» компоненты в данных условиях имеют более одного положительного заряда и также входят в рамки охвата настоящего изобретения.

5'-кэп. 5'-кэп представляет объект, обычно модифицированный нуклеотидный объект, который обычно «закрывает» 5'-конец зрелой мРНК. 5'-кэп обычно может быть образован модифицированным нуклеотидом, в частности, производным гуанинового нуклеотида. Предпочтительно 5'-кэп связан с 5'-концом через 5'-5'-трифосфатную связь. 5'-кэп может быть метилирован, например, m7GpppN, где N представляет концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, обычно 5'-конец РНК. Другие примеры 5'-кэп-структур включают глицерил, инвертированный остаток дезоксиазотистого основания (часть молекулы), 4'-,5'-метиленовый нуклеотид, 1-(бета-D-эритрофуранозил)нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидроксигекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, модифицированное основание нуклеотида, трео-пентофуранозильный нуклеотид, ациклический 3', 4'-секонуклеотид, ациклический 3,4-дигидроксибутилнуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированную нуклеотидную часть молекулы, 3'-3'-инвертированную часть молекулы без азотистого основания, 3'-2'-инвертированную нуклеотидную часть молекулы, 3'-2'-инвертированную часть молекулы без азотистого основания, 1,4-бутандиолфосфат, 3'-фосфорамидат, гексилфосфат, аминогексилфосфат, 3'-фосфат, 3'-фосфоротиоат, фосфородитиоат, и связующую или несвязующую часть молекулы.

Клеточный иммунитет/клеточный иммунный ответ. Клеточный иммунитет обычно связан с активацией макрофагов, природных клеток киллеров (natural killer - NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождением различных цитокинов в ответ на антиген. В общих выражениях, клеточный иммунитет основан не на антителах, а на активации клеток иммунной системы. Как правило, клеточный иммунный ответ может быть охарактеризован, например, путем активации антигенспецифических цитотоксических Т-лимфоцитов, которые способны индуцировать апоптоз в клетках, например, в специфических иммунных клетках, например, в дендритных клетках или других клетках с эпитопами чужеродных антигенов на поверхности. Такие клетки могут быть инфицированы вирусом или инфицированы внутриклеточными бактериями, или могут быть раковыми клетками, несущими на поверхности опухолевые антигены. Другими свойствами могут быть активация макрофагов и природных клеток киллеров, что позволяет им разрушать патогены и стимулировать клетки к секреции разнообразных цитокинов, которые влияют на функцию других клеток, участвующих в адаптивных иммунных реакциях и врожденных иммунных реакциях.

Понятие «производный от», используемое в настоящем описании, относится к нуклеиновой кислоты, то есть к нуклеиновой кислоты, «производный от» (другой) нуклеиновой кислоты, что означает, что нуклеиновая кислота, которая получена из (другой) нуклеиновой кислоты, последовательность которой по меньшей мере на 50%, предпочтительно по меньшей мере на 60%, предпочтительно по меньшей мере на 70%, более предпочтительно по меньшей мере на 75%, более предпочтительно по меньшей мере на 80%, более предпочтительно по меньшей мере на 85%, еще более предпочтительно по меньшей мере на 90%, еще больше предпочтительно по меньшей мере на 95%, и особенно предпочтительно по меньшей мере на 98%, идентична последовательности нуклеиновой кислоты, производной которой она является. Специалисту известно, что идентичность последовательности обычно вычисляют для одних и тех же типов нуклеиновых кислот, то есть для последовательностей ДНК или для последовательностей РНК. Таким образом, очевидно, что если ДНК «производная от» РНК или если РНК «производна от» ДНК, на первой стадии последовательность РНК конвертируют в соответствующую последовательность ДНК (в частности, путем замены урацилов (U) тимидинами (Т) во всей последовательности) или, наоборот, последовательность ДНК конвертируют в соответствующую последовательность РНК (в частности, заменяя тимидины (Т) урацилами (U) во всей последовательности). После этого определяют идентичность последовательностей ДНК или идентичность последовательностей РНК. Предпочтительно, понятие нуклеиновой кислоты, «производной от» другой нуклеиновой кислоты, также относится к нуклеиновой кислоте, которую модифицируют по сравнению с нуклеиновой кислотой, от которой она производна, например, чтобы еще больше повысить стабильность РНК, и/или продлить, и/или увеличить выработку белка. Безусловно, что предпочтительными являются те модификации, которые не ухудшают стабильности РНК, например, по сравнению с нуклеиновой кислотой, из которой она получена.

ДНК. ДНК - это аббревиатура дезоксирибонуклеиновой кислоты. ДНК -молекула нуклеиновой кислоты, то есть полимер, состоящий из нуклеотидов. Этими нуклеотидами обычно являются мономеры дезоксиаденозинмонофосфат, дезокситимидинмонофосфат, дезоксигуанозинмонофосфат и дезоксицитидинмонофосфат, которые состоят из фрагмента сахара (дезоксирибозы), фрагмента основания и фрагмента фосфата и полимеризуются в специфическую каркасную структуру. Структура каркаса обычно образована фосфодиэфирными связями между фрагментом сахара в нуклеотиде, то есть между дезоксирибозой, первого мономера и фосфатной частью второго соседнего мономера. Определенный порядок мономеров, т.е. порядок оснований, связанных с каркасом молекулы из сахаров/фосфатов, называется последовательностью ДНК. ДНК может быть одноцепочечной или двухцепочечной. В двухцепочечной форме нуклеотиды первой цепи обычно гибридизуются с нуклеотидами второй цепи, например, путем спаривания оснований А/Т и G/C.

Эпитоп. Эпитопы (также называемые «антигенными детерминантами») можно подразделить на эпитопы Т-клеток и эпитопы В-клеток. Эпитопы Т-клеток или части белков в контексте настоящего изобретения могут содержать фрагменты, предпочтительно длиной примерно от 6 до примерно 20 или даже более аминокислот, например, фрагменты, процессированные и презентированные молекулами МНС класса I, предпочтительно длиной примерно от 8 до примерно 10 аминокислот, например, 8, 9 или 10 (или даже 11 или 12 аминокислот), или фрагменты, процессированные и презентированные молекулами МНС класса II, предпочтительно длиной примерно 13 или более аминокислот, например. 13, 14, 15, 16, 17, 18, 19, 20 или даже боле аминокислот, причем эти фрагменты могут быть получены из какой-либо части аминокислотной последовательности. Эти фрагменты обычно распознаются Т-клетками в виде комплекса, состоящего из фрагмента пептида и молекулы МНС, то есть фрагменты обычно не распознаются в своей нативной форме. Эпитопы В-клеток обычно представляют фрагменты, расположенные на внешней поверхности (нативного) белка или пептидных антигенов, согласно описанию настоящего изобретения, состоящие предпочтительно из 5-15 аминокислот, более предпочтительно из 5-12 аминокислот, еще более предпочтительно из 6-9 аминокислот, которые могут быть распознаны антителами, то есть в их нативной форме.

Такие эпитопы белков или пептидов могут также быть выбраны из каких-либо указанных в настоящем изобретении вариантов таких белков или пептидов. В этом контексте антигенными детерминантами могут быть конформационные или прерывистые эпитопы, которые состоят из сегментов белков или пептидов, согласно описанию настоящего изобретения, которые являются прерывистыми по аминокислотной последовательности белками или пептидами, согласно описанию настоящего изобретения, но которые объединены в трехмерную структуру, или непрерывные или линейные эпитопы, которые состоят из одной полипептидной цепи.

Фрагмент последовательности. Фрагмент последовательности обычно бывает более короткой частью последовательности полной длины, например, молекулы нуклеиновой кислоты или аминокислотной последовательности. Соответственно, фрагмент бычно состоит из последовательности, которая идентична соответствующему отрезку в последовательности полной длины. Предпочтительный фрагмент последовательности в контексте настоящего изобретения состоит из непрерывного отрезка мономеров, а именно нуклеотидов или аминокислот, соответствующих непрерывному отрезку из мономеров в молекуле, из которой получен этот фрагмент, иднтичный по меньшей мере на 5%, 10%, 20%, предпочтительно по меньшей мере на 30%, более предпочтительно по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, еще более предпочтительно по меньшей мере на 60%, еще более предпочтительно по меньшей мере на 70% и наиболее предпочтительно по меньшей мере на 80% целой (то есть полной по размеру) молекуле, из которой получен фрагмент.

Модификация G/C. Модифицированная G/C нуклеиновая кислота обычно бывает нуклеиновой кислотой, предпочтительно молекулой искусственной нуклеиновой кислоты, согласно описанию настоящего изобретения, на основе модифицированной исходной последовательности, содержащей предпочтительно повышенное количество нуклеотидов гуанозина и/или цитозина по сравнению с исходной последовательностью. Такое повышенное количество может быть получено путем замещения кодонов, содержащих нуклеотиды аденозин или тимидин, кодонами, содержащими нуклеотиды гуанозин или цитозин. Если повышенное содержание G/C осуществляют в кодирующей области ДНК или РНК, то оно построено на вырожденности генетического кода. Соответственно, замещения кодонов предпочтительно не изменяют закодированные аминокислотные остатки, а исключительно увеличивают содержание G/C в молекуле нуклеиновой кислоты.

Генная терапия. Обычно под генной терапией понимают лечение организма пациента или отдельных элементов организма пациента, например, отдельных тканей/клеток, нуклеиновыми кислотами, кодирующими пептид или белок. Обычно генная терапия включает, по меньшей мере, одну из стадий а) введения нуклеиновой кислоты, предпочтительно молекулы искусственной нуклеиновой кислоты по настоящему изобретению, непосредственно пациенту каким-либо способом введения, или in vitro - к выделенным клеткам/тканям пациента, что приводит к трансфекции клеток пациента, или in vivo/ex vivo, или in vitro; б) транскрипции и/или трансляции интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторного введения выделенных трансфицированных клеток пациенту, если нуклеиновая кислота не вводилась непосредственно пациенту.

Генетическая вакцинация. Обычно под генетической вакцинацией понимают вакцинацию путем введения молекулы нуклеиновой кислоты, кодирующей антиген, или иммуноген, или их фрагменты. Молекулу нуклеиновой кислоты можно вводить в организм субъекта или в выделенные клетки субъекта. При трансфекции определенных клеток организма или при трансфекции выделенных клеток антиген или иммуноген могут быть экспрессированы этими клетками и впоследствии презентированы иммунной системе, вызывая адаптивный, то есть антигенспецифический иммунный ответ. Соответственно, генетическая вакцинация обычно включает, по меньшей мере, одну из стадий: а) введения нуклеиновой кислоты, предпочтительно молекулы искусственной нуклеиновой кислоты по настоящему изобретению, субъекту, предпочтительно пациенту, или в выделенные клетки субъекта, предпочтительно пациента, что обычно приводит к трансфекции клеток субъекта in vivo или in vitro; б) транскрипции и/или трансляции интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных, трансфицированных клеток субъекту, предпочтительно пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.

Гетерологичная последовательность. Обычно две последовательности рассматривают в качестве «гетерологичных», если они не происходят от одного и того же гена. Таким образом, хотя гетерологичные последовательности могут быть получены из одного и того же организма, они естественным образом (по своей природе) не содержатся в одной и той же молекуле нуклеиновой кислоты, например, в одной и той же мРНК.

Гуморальный иммунитет/гуморальный иммунный ответ. Обычно под гуморальным иммунитетом понимают выработку антител и, необязательно, вспомогательные процессы, сопровождающие выработку антител. Гуморальный иммунный ответ обычно можно описать, например, путем активации Th2 и выработкой цитокинов, образованием зародышевого центра и переключением изотипов, созреванием аффинности и генерацией клеток памяти. Гуморальный иммунитет также обычно может относить к эффекторным функциям антител, которые включают нейтрализацию патогенов и токсинов, активацию классического комплемента и стимуляцию опсонина, способствующую фагоцитозу и элиминации патогенов.

Иммуноген. В контексте настоящего изобретения под иммуногеном обычно понимают соединение, способное стимулировать иммунный ответ. Предпочтительно иммуноген представляет пептид, полипептид или белок. В одном из предпочтительных вариантов осуществления настоящего изобретения иммуногеном является продукт трансляции полученной молекулы нуклеиновой кислоты, предпочтительно молекулы искусственной нуклеиновой кислоты по настоящему изобретению. Обычно иммуноген вызывает, по меньшей мере, адаптивный иммунный ответ.

Иммуностимулирующая композиция. В контексте настоящего изобретения иммуностимулирующая композиция обычно означает композицию, содержащую, по меньшей мере, один компонент, который способен индуцировать иммунный ответ или из которой можно получить компонент, который способен индуцировать иммунный ответ. Такой иммунный ответ может быть предпочтительно врожденным иммунным ответом или комбинацией адаптивного и врожденного иммунного ответа. Предпочтительно иммуностимулирующая композиция в контексте настоящего изобретения содержит, по меньшей мере, одну молекулу искусственной нуклеиновой кислоты, более предпочтительно РНК, например молекулу мРНК. Иммуностимулирующий компонент, например, мРНК, может быть соединен с подходящим носителем. Таким образом, иммуностимулирующая композиция может содержать комплекс мРНК/носитель. Кроме того, иммуностимулирующая композиция может содержать адъювант и/или соответствующий носитель для иммуностимулирующего компонента, например, для мРНК.

Иммунный ответ. Обычно иммунный ответ может быть специфической реакцией адаптивной иммунной системы на определенный антиген (так называемый специфический или адаптивный иммунный ответ), или неспецифической реакцией врожденной иммунной системы (так называемый неспецифический или врожденный иммунный ответ), или их комбинацией.

Иммунная система. Иммунная система может защитить организмы от инфекции. Если патогену удается пройти физический барьер организма и внедриться, врожденная иммунная система обеспечивает немедленный, но неспецифический ответ. Если патогены уклоняются от такого врожденного ответа, позвоночные обладают вторым уровнем защиты - адаптивной иммунной системой. По настоящему изобретению иммунная система адаптирует свой ответ во время инфекции, чтобы улучшить распознавание патогена. Такой улучшенный ответ сохраняется после элиминации патогена в виде иммунологической памяти и позволяет адаптивной иммунной системе быстрее и эффективнее атаковать каждый раз при появлении патогена. Таким образом, иммунная система включает врожденную и адаптивную иммунную систему.

Каждая из этих двух частей обычно содержит так называемые гуморальные и клеточные компоненты.

Иммуностимулирующая РНК. Иммуностимулирующая РНК (исРНК) в контексте настоящего изобретения обычно представляет РНК, способную индуцировать врожденный иммунный ответ. Такая РНК обычно не содержит открытой рамки считывания и, таким образом, не предоставляет пептид-антиген или иммуноген, но вызывает иммунный ответ, например, путем связывания специфического типа Toll-подобного рецептора (Toll-like-receptor - TLR) или других соответствующих рецепторов. Однако мРНК, которые также безусловно содержат открытую рамку считывания и кодируют пептид/белок, могут индуцировать врожденный иммунный ответ и, таким образом, могут быть иммуностимулирующими РНК.

Врожденная иммунная система. Врожденная иммунная система, также называемая неспецифической иммунной системой, обычно включает клетки и механизмы, которые неспецифическим образом защищают хозяина от инфекции другими организмами. Это означает, что клетки врожденной системы могут распознавать и реагировать на патогены генерическим образом, но в отличие от адаптивной иммунной системы это не приводит к долговременному защитному иммунитету хозяину. Врожденная иммунная система может быть, например, активирована лигандами Toll-подобных рецепторов (TLR) или другими вспомогательными веществами, такими как липополисахариды, TNF-альфа, лиганд CD40 или цитокины, монокины, лимфокины, интерлейкины или хемокины, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL- 14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-альфа, IFN-бета, IFN-гамма, GM-CSF, G-CSF, CSF, LT-бета, TNF-альфа, факторы роста и hGH, лиганд Toll-подобного рецептора человека TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, лиганд мышиного Toll-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 или TLR13, лиганд NOD-подобного рецептора, лиганд RIG-I-подобного рецептора, иммуностимулирующая нуклеиновая кислота, иммуностимулирующая РНК (исРНК), CpG-ДНК, антибактериальный агент или противовирусный агент.

Сайт клонирования. Обычно сайтом клонирования является сегмент молекулы нуклеиновой кислоты, который подходит для инсерции последовательности нуклеиновой кислоты, например, последовательности нуклеиновой кислоты, содержащей открытую рамку считывания. Инсерция может выполняться каким-либо методом молекулярной биологии, известным специалисту в данной области техники, например, путем рестрикции и лигирования. Один или несколько сайтов рестрикции может быть распознано ферментами рестрикции, которые расщепляют ДНК по этим сайтам. Сайт клонирования, который содержит более одного сайта рестрикции, также может быть назван сайтом множественного клонирования (multiple cloning site - MCS) или полилинкером.

Молекула нуклеиновой кислоты. Молекула нуклеиновой кислоты является молекулой, предпочтительно состоящей из компонентов нуклеиновой кислоты. Понятие «молекула нуклеиновой кислоты» предпочтительно относится к молекулам ДНК или РНК. Его предпочтительно используют в качестве синонима понятия «полинуклеотид». Предпочтительно, молекула нуклеиновой кислоты является полимером, содержащим или состоящим из нуклеотидных мономеров, которые ковалентно связаны друг с другом фосфодиэфирными связями каркаса молекулы из сахара/фосфата. Понятие «молекула нуклеиновой кислоты» также относится к модифицированным молекулам нуклеиновой кислоты, например, к молекулам ДНК или РНК с модифицированными основаниями, модифицированными сахарами или модифицированным каркасом молекулы.

Открытая рамка считывания. Открытая рамка считывания (open reading frame -ORF) в контексте настоящего изобретения может представлять последовательность из некоторого количества нуклеотидных триплетов, которые могут быть транслированы в пептид или белок. Открытая рамка считывания предпочтительно содержит стартовый кодон, то есть комбинацию из трех последовательно расположенных нуклеотидов, кодирующих обычно аминокислоту метионин (ATG), на 5'-конце и последующую область, которая обычно имеет длину, кратную 3 нуклеотидам. ORF предпочтительно заканчивается стоп-кодоном (например, ТАА, TAG, TGA). Обычно это единственный стоп-кодон открытой рамки считывания. Таким образом, открытая рамка считывания в контексте настоящего изобретения предпочтительно представляет собой нуклеотидную последовательность, состоящую из ряда нуклеотидов, количество которых может быть разделено на три и которые начинаются с исходного кодона (например, ATG), причем указанная последовательность предпочтительно заканчивается стоп-кодоном (например, ТАА, TGA или TAG). Открытая рамка считывания может быть выделена или может быть инкорпорирована в более длинную последовательность нуклеиновой кислоты, например, в векторе или мРНК. Открытую рамку считывания также можно назвать «областью кодирования белка».

Пептид. Пептид или полипептид обычно представляет полимер из аминокислотных мономеров, связанных пептидными связями. Обычно он содержит менее 50 мономерных единиц. Тем не менее, понятие «пептид» также относится к молекулам, содержащим более 50 мономерных единиц. Длинные пептиды также называют полипептидами, обычно имеющими от 50 до 600 мономерных единиц.

Фармацевтически эффективное количество. Фармацевтически эффективное количество в контексте настоящего изобретения обычно означает количество, которое является достаточным для индукции фармацевтического эффекта, например, иммунного ответа, изменяющего патологический уровень экспрессированного пептида или белка, или заменяющим отсутствующий генный продукт, например, в случае патологической ситуации.

Белок А. Белок А обычно содержит один или несколько пептидов или полипептидов. Белок обычно складывается в трехмерную форму, которая может потребоваться для того, чтобы белок мог выполнять свою биологическую функцию.

Последовательность поли(А). Последовательность поли(А), также называемая поли(А) хвостом или 3'-поли(А) хвостом, обычно означает последовательность аденозиновых нуклеотидов, например, включающую примерно 400 аденозиновых нуклеотидов, например примерно от 20 до примерно 400, предпочтительно примерно от 50 до примерно 400, более предпочтительно примерно от 50 до примерно 300, еще более предпочтительно примерно от 50 до примерно 250, наиболее предпочтительно примерно от 60 до примерно 250 аденозиновых нуклеотидов. Поли (А) последовательность обычно расположена в 3'-конце мРНК. В контексте настоящего изобретения поли(А) последовательность может быть расположена внутри мРНК или какой-либо другой молекулы нуклеиновой кислоты, например, в векторе, например, в векторе, служащем в качестве матрицы для выработки РНК, предпочтительно мРНК, например, путем транскрипции вектора.

Полиаденилирование. Обычно понятие «полиаденилирование» означает добавление поли(А) последовательности к молекуле нуклеиновой кислоты, например, к молекуле РНК, например, к незрелой мРНК. Полиаденилирование может быть вызвано так называемым сигналом полиаденилирования. Этот сигнал предпочтительно расположен в пределах отрезка нуклеотидов с 3'-конца молекулы нуклеиновой кислоты, например, молекулы РНК, подвергаемой полиаденилированию. Сигнал полиаденилирования обычно включает гексамер, состоящий из адениновых и урациловых/тиминовых нуклеотидов, предпочтительно гексамерную последовательность AAUAAA. Возможны также другие последовательности, предпочтительно гексамерные. Полиаденилирование обычно происходит во время процессирования пре-мРНК (также называемой незрелой мРНК). Обычно созревание РНК (от пре-мРНК до зрелой мРНК) включает стадию полиаденилирования.

Сайт рестрикции. Сайт рестрикции, также называемый сайтом распознавания ферментов рестрикции, представляет собой нуклеотидную последовательность, распознаваемую ферментом рестрикции. Сайт рестрикции обычно представляет короткую предпочтительно палиндромную нуклеотидную последовательность, например, последовательность, содержащую от 4 до 8 нуклеотидов. Сайт рестрикции предпочтительно специфически распознается ферментом рестрикции. Фермент рестрикции обычно расщепляет нуклеотидную последовательность, содержащую сайт рестрикции в этом месте. В двухцепочечной нуклеотидной последовательности, например, двухцепочечной последовательности ДНК, фермент рестрикции обычно разрезает обе нити нуклеотидной последовательности.

РНК, мРНК. РНК является аббревиатурой рибонуклеиновой кислоты. Это молекула нуклеиновой кислоты, то есть полимер, состоящий из нуклеотидов. Эти нуклеотиды обычно представляют мономеры аденозинмонофосфат, уридинмонофосфат, гуанозинмонофосфат и цитидинмонофосфат, которые связаны друг с другом вдоль так называемого каркаса молекулы. Каркас молекулы образован фосфодиэфирными связями между сахаром, то есть рибозой, первого мономера и фосфатной частью второго соседнего мономера. Определенная последовательность мономеров называется последовательностью РНК. Обычно РНК может быть получена путем транскрипции последовательности ДНК, например, внутри клетки. В эукариотических клетках транскрипция обычно происходит внутри ядра или в митохондриях. Обычно транскрипция ДНК обычно приводит к так называемой незрелой РНК, которая должна быть процессирована в так называемую матричную РНК, обычно сокращенно обозначаемую «мРНК». Процессирование незрелой РНК, например, в эукариотических организмах, включает множество различных посттранскрипционных модификаций, например, сплайсинг, 5'-кэпирование, полиаденилирование, экспорт из ядра или митохондрий и другие. Сумма этих процессов также называется созреванием РНК. Зрелая мРНК обычно представляет нуклеотидную последовательность, которая может быть транслирована в аминокислотную последовательность определенного пептида или белка. Обычно зрелая мРНК содержит 5'-кэп, 5'-UTR, открытую рамку считывания, 3'-UTR и поли(А) последовательность. Помимо матричной РНК существует несколько некодирующих типов РНК, которые могут участвовать в регуляции транскрипции и/или трансляции.

Последовательность молекулы нуклеиновой кислоты. Последовательность молекулы нуклеиновой кислоты обычно представляет определенный индивидуальный порядок, т.е. последовательность нуклеотидов. Последовательность белка или пептида обычно подразумевает порядок, то есть последовательность аминокислот.

Идентичность последовательностей. Две или более последовательностей идентичны, если они имеют одинаковую длину и порядок нуклеотидов или аминокислот. Процент идентичности обычно описывает степень идентичности двух последовательностей, то есть он обычно описывает процент нуклеотидов, которые соответствуют по положению в последовательности идентичным нуклеотидам в сравниваемой последовательности. Для определения степени идентичности сравниваемые последовательности предположительно должны иметь равную длину, то есть длину самой длинной из последовательностей. Это означает, что первая последовательность, состоящая из 8 нуклеотидов, на 80% идентична второй последовательности, состоящей из 10 нуклеотидов и содержащей первую последовательность. Иначе говоря, в контексте настоящего изобретения идентичность последовательностей предпочтительно относится к проценту нуклеотидов последовательности, которые имеют одинаковое положение в двух или более последовательностях, имеющих одинаковую длину.

Гэпы обычно рассматривают в качестве неидентичных положений, независимо от их фактического положения при выравнивании.

Стабилизированная молекула нуклеиновой кислоты. Стабилизированная молекула нуклеиновой кислоты представляет молекулу нуклеиновой кислоты, предпочтительно молекулу ДНК или РНК, которая модифицирована таким образом, что она более устойчива к распаду, например, к факторам окружающей среды или к ферментативному расщеплению, например, экзо- или эндонуклеазами, чем молекула нуклеиновой кислоты без модификации. Предпочтительно, стабилизированная молекула нуклеиновой кислоты в контексте настоящего изобретения стабилизируется в клетке, например, прокариотической или эукариотической клетке, предпочтительно в клетке млекопитающего, например, клетке человека. Эффект стабилизации также может проявляться вне клеток, например, в буферном растворе и т.д., например, в процессе получения фармацевтической композиции, содержащей стабилизированную молекулу нуклеиновой кислоты.

Трансфекция. Понятие «трансфекция» относится к интродукции молекул нуклеиновой кислоты, например, молекул ДНК или РНК (например, мРНК), в клетки, предпочтительно в эукариотические клетки. В контексте настоящего изобретения понятие «трансфекция» охватывает какой-либо метод, известный специалисту в данной области для интродукции молекул нуклеиновой кислоты в клетки, предпочтительно в эукариотические клетки, например, в клетки млекопитающих. Такие методы включают, например, электропорацию, липофекцию, например, на основе катионных липидов и/или липосом, осаждение фосфатом кальция, трансфекцию на основе наночастиц, трансфекцию на основе вирусов или трансфекцию на основе катионных полимеров, например, DEAE-декстрана или полиэтилененимина и т.д. Предпочтительно интродукция не является основанной на вирусах.

Вакцина. Обычно вакциной называют профилактический или терапевтический материал, обеспечивающий по меньшей мере один антиген, предпочтительно иммуноген. Антиген или иммуноген могут быть получены из какого-либо материала, который пригоден для вакцинации. Например, антиген или иммуноген могут быть получены из патогена, например, из бактерий или вирусных частиц и т.д., или из опухоли или раковой ткани. Антиген или иммуноген стимулирует адаптивную иммунную систему организма для обеспечения адаптивного иммунного ответа.

Вектор. Понятие «вектор» относится к молекуле нуклеиновой кислоты, предпочтительно к молекуле искусственной нуклеиновой кислоты. Вектор в контексте настоящего изобретения пригоден для инкорпорации или сохранения нужной последовательности нуклеиновой кислоты, например, последовательности нуклеиновой кислоты, содержащей открытую рамку считывания. Такие векторы могут быть векторами хранения, векторами экспрессии, векторами клонирования, векторами переноса и т.д. Вектор хранения представляет вектор, который позволяет удобно хранить молекулы нуклеиновой кислоты, например, молекулы мРНК. Таким образом, вектор может содержать последовательность, соответствующую, например, желаемой последовательности мРНК или ее части, например, последовательности, соответствующей открытой рамке считывания и 3'-UTR и/или 5'-UTR мРНК. Вектор экспрессии может быть использован для получения продуктов экспрессии, например, РНК, например, мРНК или пептидов, полипептидов или белков. Например, вектор экспрессии может содержать последовательности, необходимые для транскрипции отрезка последовательности вектора, например, промоторной последовательности, например, последовательности промотора РНК-полимеразы. Вектор клонирования обычно представляет вектор, который содержит сайт клонирования, который может быть использован для инкорпорации последовательностей нуклеиновых кислот в вектор. Вектор клонирования может представлять, например, плазмидный вектор или вектор бактериофага. Вектор трансфекции может быть вектором, который подходит для переноса молекул нуклеиновой кислоты в клетки или организмы, например, вирусным вектором. Вектор в контексте настоящего изобретения может представлять, например, РНК-вектор или ДНК-вектор. Предпочтительно, вектор является молекулой ДНК. Предпочтительно вектор в контексте настоящего изобретения содержит сайт клонирования, селективный маркер, например, фактор устойчивости к антибиотику, и последовательность, пригодную для мультипликации вектора, например, начало репликации. Предпочтительно, вектор в контексте настоящей заявки представляет плазмидный вектор.

Носитель. Обычно носителем является материал, который пригоден для хранения, транспортировки и/или введения соединения, например, фармацевтически активного соединения. Например, это может быть физиологически приемлемая жидкость, пригодная для хранения, транспортировки и/или введения фармацевтически активного соединения.

3'-нетранслируемая область (3'-UTR). Обычно понятие «3'-UTR» относят к части молекулы искусственной нуклеиновой кислоты, которая расположена с 3'-конца (т.е. «вниз по цепи») открытой рамки считывания и которая не транслируется в белок. Обычно 3'-UTR является частью мРНК, которая расположена между областью кодирования белка (открытой рамкой считывания (ORF) или кодирующей последовательностью (coding sequence - CDS)) и поли(А) последовательностью мРНК. В контексте настоящего изобретения понятие «3'-UTR» также может содержать элементы, которые не кодируются в матрице, с которой транскрибируется РНК, но которые добавляются после транскрипции во время созревания, например, последовательность поли(А). 3'-UTR мРНК не транслируется в аминокислотную последовательность. Последовательность 3'-UTR обычно кодируется геном, который транскрибируется в соответствующую мРНК во время процесса экспрессии гена. Геномную последовательность сначала транскрибируется в незрелую мРНК, которая содержит необязательные интроны. Незрелую мРНК затем дополнительно процессируют в зрелую мРНК в процессе созревания. Такой процесс созревания включает стадии 5'-кэпирования, сплайсирования незрелой мРНК, чтобы вырезать необязательные интроны, и модификации 3'-конца, например, полиаденилированием 3'-конца незрелой мРНК и необязательное расщепление эндо- и/или экзонуклеазой и т.д. В контексте настоящего изобретения 3'-UTR соответствует последовательности зрелой мРНК, которая локализована между стоп-кодоном кодирующей белок области, предпочтительно сразу 3' по отношению к стоп-кодону области кодирования белка и поли(А) последовательности мРНК. Понятие «соответствует» означает, что последовательность 3'-UTR может быть последовательностью РНК, например, последовательностью мРНК, используемой для определения последовательности 3'-UTR, или последовательность ДНК, которая соответствует такой последовательности РНК. В контексте настоящего изобретения понятие «3'-UTR гена» означает последовательность, которая соответствует 3'-UTR зрелой мРНК, полученной из этого гена, то есть мРНК, полученной в результате транскрипции гена и созревания незрелой мРНК. Понятие «3'-UTR гена» охватывает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую нить, и как зрелую, так и незрелую) 3'-UTR. Предпочтительно, 3'UTR имеют в длину более 20, 30, 40 или 50 нуклеотидов.

5'-нетранслируемая область (5'-UTR). Обычно понятие «5'-UTR» относят к части молекулы искусственной нуклеиновой кислоты, которая расположена с 5'-конца (т.е. «вверх по цепи») открытой рамки считывания и которая не транслируется в белок. Обычно 5'-UTR является частью матричной РНК (мРНК), которая расположена с 5'-конца открытой рамки считывания мРНК. Обычно 5'-UTR начинается с сайта начала транскрипции и заканчивается одним нуклеотидом перед стартовым кодоном открытой рамки считывания. Предпочтительно области 5'UTR имеют длину более 20, 30, 40 или 50 нуклеотидов. 5'-UTR может содержать элементы контроля экспрессии генов, также называемые регулирующими элементами. Такими регулирующими элементами могут быть, например, сайты рибосомного связывания. Область 5'-UTR может быть посттрансляционно модифицированной, например, путем добавления 5'-САР. Область 5'-UTR мРНК не транслируется в аминокислотную последовательность. Последовательность 5'-UTR обычно кодируется геном, который транскрибируется в соответствующую мРНК во время процесса экспрессии гена. Геномную последовательность сначала транскрибируют в незрелую мРНК, которая содержит необязательные интроны. Незрелую мРНК затем дополнительно процессируют в зрелую мРНК в процессе созревания. Этот процесс созревания включает стадии 5'-кэппирования, сплайсирования незрелой мРНК для вырезания необязательных интронов и модификаций 3'-конца, полиаденилирования 3'-конца незрелой мРНК и необязательные расщепления эндо- и/или экзонуклеазой и т.д. В контексте настоящего изобретения 5'-UTR соответствует последовательности зрелой мРНК, которая расположена между стартовым кодоном и, например, 5'-САР. Предпочтительно 5'-UTR соответствует последовательности, которая простирается от нуклеотида, расположенного от 3' до 5'-САР, более предпочтительно от нуклеотида, расположенного сразу от 3' до 5'-САР, до нуклеотида, расположенного с 5', до стартового кодона области кодирования белка, предпочтительно к нуклеотиду, расположенному сразу от 5' до стартового кодона области кодирования белка. Нуклеотид, расположенный сразу от 3'до 5'-САР зрелой мРНК, обычно соответствует сайту начала транскрипции. Понятие «соответствует» означает, что последовательность 5'-UTR может представлять собой последовательность РНК, например, последовательность мРНК, используемую для определения последовательности 5'-UTR, или последовательность ДНК, которая соответствует такой последовательности РНК. В контексте настоящего изобретения понятие «5'-UTR гена» представляет последовательность, которая соответствует 5'-UTR зрелой мРНК, полученной из этого гена, то есть мРНК, полученной транскрипцией гена и созреванием зрелой мРНК. Понятие «5'-UTR гена» охватывает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую нить и как зрелые, так и незрелые) 5'-UTR.

5'-концевой олигопиримидиновый тракт (Terminal Oligopyrimidine Tract - TOP). 5'-концевой олигопиримидиновый тракт (ТОР) обычно представляет участок пиримидиновых нуклеотидов, расположенный в 5'-концевой области молекулы нуклеиновой кислоты, например, 5'-концевой области некоторых молекул мРНК или 5'-концевой области функционального объекта, например транскрибируемой области, определенных генов. Последовательность начинается с цитидина, который обычно соответствует сайту начала транскрипции, и за ним следует отрезок, обычно состоящий примерно из 3-30 пиримидиновых нуклеотидов. Например, ТОР может содержать 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или даже больше нуклеотидов. Пиримидиновый отрезок и, соответственно, 5'-ТОР, заканчивается одним нуклеотидом 5' по отношению к первому пуриновому нуклеотиду, расположенному ниже по цепи от ТОР. Матричную РНК, которая содержит 5'-концевой олигопиримидиновый тракт, часто обозначают «ТОР-мРНК». Соответственно, гены, которые предоставляют такие матричные РНК, называют генами ТОР. Последовательности ТОР, например, обнаружены в генах и мРНК, кодирующих факторы элонгации пептидов и рибосомные белки.

ТОР-мотив. В контексте настоящего изобретения ТОР-мотив представляет собой последовательность нуклеиновой кислоты, которая соответствует 5'ТОР, согласно описанному выше. Таким образом, ТОР-мотив в контексте настоящего изобретения предпочтительно представляет фрагмент пиримидиновых нуклеотидов длиной 3-30 нуклеотидов. Предпочтительно ТОР-мотив состоит, по меньшей мере, из 3 пиримидиновых нуклеотидов, предпочтительно по меньшей мере из 4 пиримидиновых нуклеотидов, предпочтительно по меньшей мере из 5 пиримидиновых нуклеотидов, более предпочтительно по меньшей мере из 6 нуклеотидов, более предпочтительно по меньшей мере из 7 нуклеотидов, наиболее предпочтительно по меньшей мере из 8 пиримидиновых нуклеотидов, причем участок пиримидиновых нуклеотидов предпочтительно начинается с 5'-конца с цитозинового нуклеотида. В ТОР-генах и ТОР-мРНК ТОР-мотив предпочтительно начинается с 5'-конца с сайта начала транскрипции и заканчивается одним нуклеотидом 5' к первому пуриновому остатку в указанном гене или мРНК. Мотив ТОР в контексте настоящего изобретения предпочтительно расположен в 5'-конце последовательности, которая представляет 5'-UTR, или в 5'-конце последовательности, которая кодирует 5'-UTR. Таким образом, предпочтительно, участок из 3 или более пиримидиновых нуклеотидов называют «ТОР-мотивом» в контексте настоящего изобретения, если этот участок локализован в 5'-конце соответствующей последовательности, например, молекулы искусственной нуклеиновой кислоты, 5'-UTR элемента молекулы искусственной нуклеиновой кислоты или последовательности нуклеиновой кислоты, которая производна от 5'-UTR гена ТОР, согласно описанию настоящего изобретения. Иначе говоря, участок из 3 или более пиримидиновых нуклеотидов, который не расположен на 5'-конце 5'-UTR или 5'-UTR-элемента, но где-либо в пределах 5'-UTR или 5'-UTR элемента, предпочтительно не называют «ТОР-мотивом».

ТОР-ген. ТОР-гены обычно характеризуются наличием 5'-концевого олигопиримидинового тракта. Кроме того, большинство генов ТОР характеризуются связанной с ростом регуляцией трансляции. Однако известны также гены ТОР с тканеспецифичной регуляцией трансляции. Согласно описанному выше, 5'-UTR гена ТОР соответствует последовательности 5'-UTR зрелой мРНК, производной от гена ТОР, которая предпочтительно расположена от нуклеотида, локализованного с 3' к 5'-CAP нуклеотида, локализованного с 5' к стартовому кодону. 5'-UTR гена ТОР обычно не содержит каких-либо стартовых кодонов, предпочтительно нет расположенных вверх по цепи AUG (upstream AUG - uAUG) или расположенных вверх по цепи открытых рамок считывания (upstream - uORF). В этом случае AUG и расположенные выше по цепи открытые рамки считывания обычно рассматривают в качестве AUG и открытых рамок считывания, которые находятся с 5' стартового кодона (AUG) открытой рамки считывания, с которой должно быть транслирование. 5'-UTR генов ТОР обычно довольно короткие. Длины 5'-UTR генов ТОР могут варьировать в диапазоне от 20 до 500 нуклеотидов и обычно составляют менее примерно 200 нуклеотидов, предпочтительно менее чем около 150 нуклеотидов, более предпочтительно менее примерно 100 нуклеотидов. Типичными 5'-UTR генов ТОР в контексте настоящего изобретения являются последовательности нуклеиновых кислот, простирающиеся от нуклеотида в положении 5 до нуклеотида, расположенного непосредственно 5' по отношению к стартовому кодону (например, ATG) в последовательностях, соответствующих SEQ ID NO: 1-1363 в патентной заявки WO 02013/143700, сущность которой включена в настоящее изобретение в виде ссылки. В этом контексте особенно предпочтительным фрагментом 5'-UTR гена ТОР является область 5'-UTR гена ТОР, утратившая 5'-ТОР-мотив. Понятия «5'-UTR гена ТОР» или «5'-TOP UTR» предпочтительно относятся к 5'-UTR встречающегося в природе гена ТОР.

Первый объект, предусмотренный в настоящем изобретении, относится к молекуле искусственной нуклеиновой кислоты, включающей:

а. по меньшей мере, одну открытую рамку считывания (ORF); и

б. по меньшей мере, один элемент 3'-нетранслируемой области (элемент 3'-UTR) и/или, по меньшей мере, один элемент 5'-нетранслируемой области (элемент 5'-UTR), причем, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты и, по меньшей мере, один элемент 3'-UTR и/или, по меньшей мере, один элемент 5'-UTR является производным от стабильной мРНК.

Предпочтительно, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не содержит 3'-UTR (элемент) и/или 5'-UTR (элемент) рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9. Более предпочтительно, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не содержит 3'-UTR (элемент) и/или 5'-UTR (элемент) рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9, и открытая рамка считывания молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не кодирует белок GFP. Еще более предпочтительно, если молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не содержит 3'-UTR (элемент) и/или 5'-UTR (элемент) рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9, и открытая рамка считывания молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не кодируют репортерный белок, например, выбранный из группы, состоящей из глобиновых белков (особенно бета-глобина), белка люциферазы, белков GFP, белков глюкуринодазы (в частности, бета-глюкуринодазы) или их вариантов, например, вариантов, демонстрирующих идентичность последовательности с глобиновым белком, белком люциферазы, белком GFP или белком глюкуринодазы, по меньшей мере, на 70%.

Понятие «элемент 3'-UTR» относится к последовательности нуклеиновой кислоты, которая содержит или состоит из последовательности нуклеиновой кислоты, производной от 3'-UTR или от варианта или фрагмента 3'-UTR. Элемент «3'-UTR» предпочтительно относится к последовательности нуклеиновой кислоты, которая состоит из 3'-UTR последовательности искусственной нуклеиновой кислоты, например, искусственной мРНК. Соответственно, в контексте настоящего изобретения предпочтительно элемент 3'-UTR может быть включен в 3'-UTR мРНК, предпочтительно искусственной мРНК, или элемент 3'-UTR может быть включен в 3'-UTR соответствующей матрицы транскрипции. Предпочтительно, элемент 3'-UTR представляет последовательность нуклеиновой кислоты, которая соответствует мРНК 3'-UTR, предпочтительно искусственной мРНК 3'-UTR, например, мРНК, полученной транскрипцией генноинженерной векторной конструкции. Предпочтительно элемент 3'-UTR в контексте настоящего изобретения функционирует в качестве 3'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 3'-UTR.

Соответствующим образом, понятие «элемент 5'-UTR» относится к последовательности нуклеиновой кислоты, которая содержит или состоит из последовательности нуклеиновой кислоты, которая является производной от 5'-UTR или от варианта или фрагмента 5'-UTR. «Элемент 5'-UTR» предпочтительно относится к последовательности нуклеиновой кислоты, которая состоит из 5'-UTR последовательности искусственной нуклеиновой кислоты, например, искусственной мРНК. Соответственно, в контексте настоящего изобретения предпочтительно элемент 5'-UTR может состоять из 5'-UTR мРНК, предпочтительно из искусственной мРНК, или элемент 5'-UTR может состоять из 5'-UTR соответствующей матрицы транскрипции. Предпочтительно, 5'-UTR-элемент представляет последовательность нуклеиновой кислоты, которая соответствует 5'-UTR мРНК, предпочтительно 5'-UTR искусственной мРНК, например, мРНК, полученной транскрипцией генноинженерной векторной конструкции. Предпочтительно, 5'-UTR-элемент в контексте настоящего изобретения функционирует в качестве 5'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 5'-UTR.

Элемент 3'-UTR и/или элемент 5'-UTR в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты. Таким образом, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может, в частности, содержать:

- элемент 3'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 5'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 5'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 5'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который увеличивает выработку белка из указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который продлевает производство белка из указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты,

- элемент 3'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и элемент 5'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, или

- элемент 3'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты и элемент 5'-UTR, который увеличивает и продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты.

Предпочтительно, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит элемент 3'-UTR, который продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и/или элемент 5'-UTR, который увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты.

Предпочтительно молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит, по меньшей мере, один элемент 3'-UTR и, по меньшей мере, один элемент 5'-UTR, то есть, по меньшей мере, один элемент 3'-UTR, который продлевает и/или увеличивает выработку белка с указанной искусственной молекулы нуклеиновой кислоты и который является производным стабильной мРНК, а также, по меньшей мере, один элемент 5'-UTR, который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты и который получен из стабильной мРНК.

Понятие «продление и/или увеличение выработки белка с указанной молекулы искусственной нуклеиновой кислоты» в общем случае относится к количеству белка, выработанного с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, с соответствующим элементом 3'-UTR и/или элементом 5'-UTR по сравнению с количеством белка, выработанного с соответствующей молекулы контрольной нуклеиновой кислоты, не содержащей 3'-UTR и/или 5'-UTR, или содержащей контрольную 3'-UTR и/или контрольную 5'-UTR, например, 3'-UTR и/или 5'-UTR, встречающиеся в природе в комбинации с ORF.

В частности, по меньшей мере, один элемент 3'-UTR и/или 5'-UTR-элемент молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением продлевают выработку белка с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, с мРНК в соответствии с настоящим изобретением, по сравнению с соответствующей нуклеиновой кислотой, не содержащей 3'-UTR и/или 5'-UTR, или содержащей контрольную 3'-UTR и/или 5'-UTR, например, 3'- и/или 5'-UTR, встречающиеся в природе в комбинации с ORF.

В частности, по меньшей мере, один элемент 3'-UTR и/или элемент 5'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением увеличивает выработку белка, в частности экспрессию белка и/или общую выработку белка, с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, с мРНК в соответствии с настоящим изобретением, по сравнению с соответствующей нуклеиновой кислотой, не содержащей 3'- и/или 5'-UTR, или содержащей контрольные 3'-и/или 5'-UTR, например, 3'- и/или 5'-UTR, встречающиеся в природе в комбинации с ORF.

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не оказывают отрицательного воздействия на эффективность трансляции нуклеиновой кислоты по сравнению с эффективностью трансляции соответствующей нуклеиновой кислоты, не содержащей 3'-UTR и/или 5'-UTR, или содержащей контрольный 3'-UTR и/или контрольный 5'-UTR, например, 3'-UTR и/или 5'- UTR, естественным образом встречающийся в комбинации с ORF. Еще более предпочтительно эффективность трансляции усиливается за счет 3'-UTR и/или 5'-UTR по сравнению с эффективностью трансляции белка, кодируемого соответствующей ORF в ее естественном виде.

В контексте настоящего изобретения понятие «соответствующая молекула нуклеиновой кислоты» или «контрольная молекула нуклеиновой кислоты» означает, что, кроме различных 3'-UTR и/или 5'-UTR, контрольная молекула нуклеиновой кислоты является сравнимой, предпочтительно идентичной, с разработанной в настоящем изобретении молекулой искусственной нуклеиновой кислоты, содержащей элемент 3'-UTR и/или элемент 5'-UTR.

Для оценки выработки белка in vivo или in vitro по настоящему изобретению (т.е. понятие «in vitro» относится к «живым» клеткам и/или тканям, включая ткань живого субъекта; клетки включают, в частности, клеточные линии, первичные клетки, клетки в тканях или субъектах, предпочтительными являются клетки млекопитающих, например клетки человека и мыши, и особенно предпочтительными являются линии клеток человека HeLa и U-937, и линии клеток мыши NIH3T3, JAWSII и L929, кроме того, наиболее предпочтительными являются первичные клетки, в частности предпочтительными вариантами осуществления настоящего изобретения являются дермальные фибробласты человека (human dermal fibroblasts - HDF)) с помощью молекулы искусственной нуклеиновой кислоты по настоящему изобретению, экспрессию закодированного белка определяют после инъекции/трансфекции молекулы искусственной нуклеиновой кислоты по настоящему изобретению в клетки-мишени/ткани и сравнивают с экспрессией белка, индуцированной контрольной нуклеиновой кислотой. Количественные методы определения экспрессии белка известны в данной области (например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия). Особенно полезным в этом контексте является определение экспрессии репортерных белков, таких как люцифераза, зеленый флуоресцентный белок (Green fluorescent protein - GFP) или секретируемая щелочная фосфатаза (SEAP). Таким образом, искусственная нуклеиновая кислота по настоящему изобретению или контрольная нуклеиновая кислота вводится в ткань или клетку-мишень, например, через трансфекцию или инъекцию, предпочтительно в систему экспрессии млекопитающих, например, в клетки млекопитающих, например, в клетки HeLa или HDF. Через несколько часов или несколько дней (например, 6, 12, 24, 48 или 72 ч) после инициации экспрессии или после введения молекулы нуклеиновой кислоты образец клетки-мишени отбирают и измеряют с помощью FACS и/или лизируют. Затем лизаты могут быть использованы для обнаружения экспрессированного белка (и, таким образом, определения эффективности экспрессии белка) с использованием нескольких способов, например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия или измерение флуоресценции или люминесценции.

Таким образом, если экспрессию белка с молекулы искусственной нуклеиновой кислоты согласно настоящему изобретению сравнивают с экспрессией белка с контрольной молекулы нуклеиновой кислоты в определенный момент времени (например, через 6, 12, 24, 48 или 72 ч после начала экспрессии или после интродукции молекулы нуклеиновой кислоты), обе молекулы нуклеиновой кислоты вводятся отдельно в целевую ткань/клетки, образец ткани/клеток берут по прошествии определенного времени, белковые лизаты получают в соответствии с определенным протоколом, заданным для определенного метода обнаружения (например, вестерн-блоттинга, ELISA, измерения флуоресценции или люминесценции и т.д., известных в данной области), и белок определяют выбранным методом. В качестве альтернативы измерению количества экспрессированного белка в клеточных лизатах - или в дополнение к измерению количества белка в клеточных лизатах до лизиса собранных клеток или с использованием аликвоты в параллельных исследованиях - количество белка также может быть определено методом FACS.

Понятие «продление выработки белка», получаемого с молекулы искусственной нуклеиновой кислоты, например, искусственной мРНК, предпочтительно означает, что выработка белка с молекулы искусственной нуклеиновой кислоты, например, искусственной мРНК, пролонгируется по сравнению с выработкой белка с контрольной молекулы нуклеиновой кислоты, например, с контрольной мРНК, например включающей контрольную область 3'-и/или 5'-UTR или отсутствие 3'- и/или 5'-UTR, предпочтительно в системе экспрессии млекопитающих, например, в клетках HeLa или HDF. Таким образом, выработку белка с молекулы искусственной нуклеиновой кислоты, например, с искусственной мРНК, наблюдают в течение более длительного периода времени, чем можно наблюдать для белка, вырабатываемого с контрольной молекулы нуклеиновой кислоты. Иначе говоря, количество белка, вырабатываемого с молекулы искусственной нуклеиновой кислоты, например, с искусственной мРНК, измеренное в более поздний момент времени, например, через 48 ч или 72 ч после трансфекции, больше, чем количество белка, выработанного с контрольной молекулы нуклеиновой кислоты, например, с контрольной мРНК в соответствующий более поздний момент времени. Такой «более поздний момент времени» может быть, например, в любое время после 24 ч после начала экспрессии, например, посттрансфекции молекулы нуклеиновой кислоты, например, через 36, 48, 60, 72, 96 ч после начала экспрессии, то есть после трансфекции. Кроме того, для той же нуклеиновой кислоты количество белка, продуцируемого в более поздний момент времени, может быть нормализовано по количеству, выработанному в более ранний (контрольный) момент времени, например, количество белка в более поздний момент времени может быть выражено в процентах от количества белка через 24 ч после трансфекции.

Предпочтительно такой эффект продления выработки белка определяют (i) измерением количества белка, например, полученного путем экспрессии закодированного репортерного белка, например, люциферазы, предпочтительно в системе экспрессии млекопитающих, например, в клетках HeLa или HDF, на протяжении времени, (ii) определением количества белка, наблюдаемого в «контрольной» точке за время t1, например t1=24 ч после трансфекции, и определением этого количества белка равным 100%, (iii) определением количества белка, наблюдаемого в один или несколько более поздних временных точек t2, t3 и т.д., например t2=48 ч и t3=72 ч после трансфекции, и вычисление относительного количества белка, наблюдаемого в более поздний момент времени в виде процента от количества белка в момент времени t1. Например, белок, который экспрессирован в момент времени t1 в количестве «80», в момент времени t2 экспрессирован в количестве «20», а при t3 экспрессирован в количестве «10», относительное количество белка в момент времени t2 может составлять 25%, и в момент времени t3 - 12,5%. Такие относительные количества в более поздний момент времени затем можно сравнить на стадии (iv) с относительными количествами белка в соответствующие моменты времени для молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'-и/или 5'-UTR, соответственно. Путем сравнения относительного количество белка, выработанного с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, с относительным количеством белка, выработанного с контрольной молекулы нуклеиновой кислоты, то есть молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей эталонный 3'- и/или 5'-UTR, соответственно, может быть определен фактор, посредством которого выработка белка с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением продлевается по сравнению с выработкой белка с контрольной молекулы нуклеинового кислотной молекулы.

Предпочтительно, по меньшей мере, один 3'- и/или 5'-UTR элемент в молекуле искусственной нуклеиновой кислоты по настоящему изобретению продлевает выработку белка с указанной молекулы искусственной нуклеиновой кислоты по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно на по меньшей мере, в 2 раза, еще более предпочтительно, по меньшей мере, в 2,5 раза по сравнению с выработкой белка с контрольной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'- UTR, соответственно. Иначе говоря, (относительное) количество белка, выработанного с молекулы искусственной нуклеиновой кислоты по настоящему изобретению, в некоторый более поздний момент времени, согласно описанию выше, увеличивается в по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере, в 2 раза, еще более предпочтительно по меньшей мере в 2,5 раза по сравнению с (относительным) количеством белка, выработанного с контрольной молекулы нуклеиновой кислоты, которая, например, не имеют 3'- и/или 5'-UTR соответственно или содержат контрольные 3'- и/или 5'-UTR, соответственно, для одного и того же более более позднего момента времени.

В другом варианте эффект продления выработки белка также может быть определен посредством (i) измерения количества белка, например, образованного в результате экспрессии закодированного репортерного белка, например, люциферазы, предпочтительно в системе экспрессии млекопитающих, например, в клетках HeLa или HDF, на протяжении времени, (ii) определения времени, когда количество белка отличается от количества белка, наблюдаемого, например, через 1, 2, 3, 4, 5 или 6 ч после начала экспрессии, например 1, 2, 3, 4, 5 или 6 ч после трансфекции молекулы искусственной нуклеиновой кислоты, и (iii) сравнения момента времени, при котором количество белка отличается от количества белка, наблюдаемого на 1, 2, 3, 4, 5 или 6 ч после начала экспрессии до указанного момента времени, определенного для молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'-UTR, соответственно.

Например, выработка белка с молекулы искусственной нуклеиновой кислоты, например, с искусственной мРНК, в количестве, которое представляет, по меньшей мере, количество, наблюдаемое в начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициация экспрессии, например, после трансфекции молекулы нуклеиновой кислоты, продлевается, по меньшей мере, примерно на 5 ч, предпочтительно, по меньшей мере, примерно на 10 ч, более предпочтительно, по меньшей мере, примерно на 24 ч по сравнению с выработкой белка с контрольной молекулы нуклеиновой кислоты, например, контрольной мРНК, в системе экспрессии млекопитающих, например, в клетках млекопитающих, например, в клетках HeLa или HDF. Таким образом, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением предпочтительно обеспечивает длительную выработку белка в количестве, которое составляет, по меньшей мере, количество, наблюдаемое в начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 часов после начала экспрессии, например, после трансфекции, по меньшей мере, примерно на 5 ч, предпочтительно, по меньшей мере, примерно на 10 ч, более предпочтительно, по меньшей мере, примерно на 24 ч по сравнению с контрольной молекулой нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'-UTR, соответственно.

В предпочтительных вариантах осуществления настоящего изобретения период выработки белка с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением продлевается по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере в 2 раза, еще более предпочтительно по меньшей мере в 2,5 раза по сравнению с выработкой белка с исходной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'-UTR, соответственно.

Предпочтительно достигается такой пролонгированный эффект выработки белка, хотя общее количество выработанного белка с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, в течение 48 или 72 ч, соответствует, по меньшей мере, количеству белка, выработанного с контрольной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'-UTR, соответственно, например, 3'-UTR и/или 5'-UTR, встречающиеся естественным образом в ORF молекулы искусственной нуклеиновой кислоты. Таким образом, настоящее изобретение предусматривает молекулу искусственной нуклеиновой кислоты, которая обеспечивает длительную выработку белка в экспрессирующей системе млекопитающих, например, в клетках млекопитающих, например, в клетках HeLa или HDF согласно указанному выше, причем общее количество белка, вырабатываемого с указанной молекулы искусственной нуклеиновой кислоты, например, в течение 48 или 72 ч, представляет, по меньшей мере, общее количество вырабатываемого белка, например, в пределах установленного промежутка времени, с контрольной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'-и/или 5'-UTR, соответственно, например, 3'- и/или 5'-UTR, встречающиеся естественным образом в ORF молекулы искусственной нуклеиновой кислоты.

Кроме того, понятие «продленная экспрессия белка» также включает понятие «стабилизированная экспрессия белка», причем понятие «стабилизированная экспрессия белка» предпочтительно означает, что существует более однородная выработка белка с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением в течение заранее определенного периода времени, например, более 24 ч, более предпочтительно более 48 ч, еще более предпочтительно в течение 72 ч, по сравнению с контрольной молекулой нуклеиновой кислоты, например, мРНК, содержащей контрольные 3'- и/или 5'-UTR, соответственно, или не сдержащие 3'- и/или 5'-UTR, соответственно.

Соответственно, уровень выработки белка, например, в системе млекопитающих, с молекулы искусственной нуклеиновой кислоты, содержащей элемент 3'- и/или 5'-UTR в соответствии с настоящим изобретением, например, с мРНК в соответствии с настоящим изобретением, предпочтительно не падает до степени, наблюдаемой для контрольной молекулы нуклеиновой кислоты, наример, контрольной мРНК согласно описанному выше. Для оценки того, в какой степени выработка белка с определенной молекулы нуклеиновой кислоты падает, например, количество белка (кодируемое соответствующей ORF), наблюдаемое через 24 ч после начала экспрессии, например, через 24 ч после трансфекции молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением в клетку, например, клетку млекопитающего, можно сравнить с количеством белка, наблюдаемом через 48 ч после начала экспрессии, например, через 48 ч после трансфекции. Таким образом, соотношение количества белка, кодируемого ORF молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, количества репортерного белка, например люциферазы, наблюдаемого в более поздний момент времени, например, через 48 ч после начала экспрессии, например, после трансфекции, до количества белка, наблюдаемого в более ранний момент времени, например, через 24 ч после начала экспрессии, например, после трансфекции, предпочтительно выше соответствующего соотношения (в одни и те же моменты времени) для контрольной молекулы нуклеиновой кислоты, содержащей контрольные 3'- и/или 5'-UTR, соответственно, или не имеющей 3'-и/или 5'-UTR, соответственно.

Предпочтительно, соотношение количества белка, кодируемого ORF молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, количество репортерного белка, например люциферазы, наблюдаемое в более поздний момент времени, например, через 48 ч после начала экспрессии, например, после трансфекции, до количества белка, наблюдаемого в более ранний момент времени, например, 24 ч после начала экспрессии, например, после трансфекции, предпочтительно составляет по меньшей мере 0,2, более предпочтительно, по меньшей мере, около 0,3, еще более предпочтительно, по меньшей мере, примерно 0,4, еще более предпочтительно, по меньшей мере, примерно 0,5 и особенно предпочтительно по меньшей мере примерно 0,7. Для соответствующей контрольной молекулы нуклеиновой кислоты, например, мРНК, содержащую контрольные 3'- и/или 5'-UTR, соответственно или не имеющие 3'- и/или 5'-UTR, соответственно, указанное соотношение может составлять, например, примерно от 0,05 до примерно 0,35.

Таким образом, настоящее изобретение относится к молекуле искусственной нуклеиновой кислоты, содержащей ORF и 3'- и/или 5'-UTR элемент согласно описанному выше, причем соотношение количества белка, например, количества люциферазы, наблюдаемое через 48 ч после начала экспрессии, к количеству белка, наблюдаемому через 24 ч после начала экспрессии, предпочтительно в экспрессирующей системе млекопитающих, например, в клетках млекопитающих, например, в клетках HDF или в клетках HeLa, предпочтительно составляет по меньшей мере 0,2, более предпочтительно, по меньшей мере, около 0,3, более предпочтительно, по меньшей мере, около 0,4, еще более предпочтительно по меньшей мере около 0,5, еще более предпочтительно, по меньшей мере, около 0,6 и особенно предпочтительно, по меньшей мере, около 0,7. Таким образом, предпочтительно общее количество белка, полученного с указанной молекулы искусственной нуклеиновой кислоты, например, в течение 48 ч, соответствует, по меньшей мере, полному количеству продуцируемого белка, например, в пределах указанного промежутка времени, с эталонной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'-UTR, соответственно, например, 3'-UTR и/или 5'-UTR, встречающиеся в природе с ORF молекулы искусственной нуклеиновой кислоты.

Предпочтительно, настоящее изобретение предусматривает молекулу искусственной нуклеиновой кислоты, содержащую ORF и элемент 3'-UTR и/или элемент 5'-UTR согласно описанному выше, причем соотношение количества белка, например, количества люциферазы, наблюдаемое через 72 ч после начала экспрессии, к количеству белка, наблюдаемому через 24 ч после начала экспрессии, предпочтительно в экспрессирующей системе млекопитающих, например, в клетках млекопитающих, например, в клетках HeLa или клетках HDF, предпочтительно выше примерно 0,05, более предпочтительно выше примерно 0,1, более предпочтительно выше примерно 0,2, еще более предпочтительно выше примерно 0,3, причем предпочтительно общее количество белка, полученного с указанной молекулы искусственной нуклеиновой кислоты, например, в течение периода времени в 72 ч, составляет, по меньшей мере, общее количество белка, вырабатываемого, например, в пределах указанного отрезка времени, с контрольной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно, или содержащей контрольные 3'- и/или 5'-UTR, соответственно, например, 3'- и/или 5'-UTR, встречающиеся естественным образом в ORF молекулы искусственной нуклеиновой кислоты.

Предпочтительно понятие «повышенная экспрессия белка» или «увеличенная экспрессия белка» в контексте настоящего изобретения предпочтительно означает увеличенную/повышенную экспрессию белка в определенный момент времени после инициации экспрессии или увеличенное/повышенное общее количество экспрессированного белка по сравнению с экспрессией, индуцированной контролой молекулой нуклеиновой кислоты. Таким образом, уровень белка, наблюдаемый в определенный момент времени после начала экспрессии, например, после трансфекции молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, после трансфекции мРНК в соответствии с настоящим изобретением, например, через 6, 12, 24, 48 или 72 ч после трансфекции, предпочтительно выше, чем уровень белка, наблюдаемый в тот же момент времени после начала экспрессии, например, после трансфекции контрольной молекулы нуклеиновой кислоты, наример, контрольной мРНК, содержащей контрольные 3'- и/или 5'-UTR, соответственно, или не содержащей 3'- и/или 5'-UTR, соответственно. В предпочтительном варианте осуществления настоящего изобретения максимальное количество белка (определенное, например, по белковой активности или массы), экспрессированное с молекулы искусственной нуклеиновой кислоты, увеличивается в отношении количества белка, экспрессированного с контрольной нуклеиновой кислоты, содержащей контрольную 3'- и/или 5'-UTR соответственно или не имеющей 3'- и/или 5'-UTR, соответственно. Пиковые уровни экспрессии предпочтительно достигают в течение 48 ч, более предпочтительно в течение 24 ч и еще более предпочтительно в течение 12 ч, например, после трансфекции.

Предпочтительно понятие «повышенная выработка общего белка» или «увеличенная выработка общего белка» с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением относится к увеличенной/повышенной выработке белка на потяжении определенного периода времени, когда белок получают с молекулы искусственной нуклеиновой кислоты, например 48 ч или 72 ч, предпочтительно в системе экспрессии млекопитающих, например, в клетках млекопитающих, например, в клетках HeLa или HDF, по сравнению с контрольной молекулой нуклеиновой кислоты, не содержащей 3'-и/или 5'-UTR, соответственно, или содержащей контрольный элемент 3'- и/или 5'-UTR, соответственно. В соответствии с предпочтительным вариантом осуществления настоящего изобретения суммарное количество белка, экспрессируемое в течение определенного времени, увеличивается при использовании молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением.

Общее количество белка в течение определенного периода времени может быть определено путем (i) сбора ткани или клеток в нескольких временных точках после введения молекулы искусственной нуклеиновой кислоты (например, через 6, 12, 24, 48 и 72 ч после начала экспрессии или после интродукции молекулы нуклеиновой кислоты), и количество белка в определенной временной точке может быть определено согласно описанию настоящего изобретения. Чтобы вычислить суммарное количество белка, можно использовать математический метод определения общего количества белка, например, площадь под кривой (area under the curve - AUC) может быть определена по следующей формуле:

Для расчета площади под кривой для общего количества белка рассчитывают интеграл уравнения кривой экспрессии по каждой конечной точке (а и b).

Таким образом, «общая выработка белка» предпочтительно относится к площади под кривой (area under the curve - AUC), представляющей выработку белка на протяжении времени.

Предпочтительно, по меньшей мере, один 3'- или 5'-UTR элемент в соответствии с настоящим изобретением увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно, по меньшей мере в 2,5 раза по сравнению с выработкой белка с контрольной молекулы нуклеиновой кислоты, не содержащей 3'- и/или 5'-UTR, соответственно. Иначе говоря, общее количество белка, полученного с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением в определенный момент времени, например, 48 ч или 72 ч после начала экспрессии, например, после трансфекции, увеличивается, по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза по сравнению с (относительным) количеством белка, полученным с контрольной молекулы нуклеиновой кислоты, которая, например, не имеет 3'- и/или 5'-UTR, соответственно, или содержат контрольный 3'- и/или 5'-UTR соответственно для определенной более поздней временной точки.

Эффект и эффективность продления выработки мРНК и/или белка и/или эффект и эффективность роста выработки белка вариантов, фрагментов и/или фрагментов вариантов 3'-UTR и/или 5'-UTR, а также эффект и эффективность продления выработки мРНК и/или белка, и/или эффект и эффективность повышения выработки белка по меньшей мере одного 3'-UTR-элемента и/или по меньшей мере одного 5'-UTR-элемента молекулы искусственной нуклеиновой кислоты в соответствии с настоящее изобретением может быть определено каким-либо методом, пригодным для этой цели и известным специалистам.

Например, могут быть получены молекулы искусственной мРНК, содержащие кодирующую последовательность/открытую рамку считывания (open reading frame - ORF) для репортерного белка, например, для люциферазы, и элемент 3'-UTR в соответствии с настоящим изобретением, то есть который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной мРНК. Кроме того, молекула мРНК по настоящему изобретению может дополнительно содержать элемент 5'-UTR в соответствии с настоящим изобретением, то есть элемент, который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной мРНК, но не содержит элемент 5'-UTR или элемент 5'-UTR, который не соответствует настоящему изобретению, например контрольный 5'-UTR. Соответственно, могут быть получены молекулы искусственной мРНК, содержащие кодирующую последовательность/открытую рамку считывания (ORF) для репортерного белка, например, для люциферазы, и элемент 5'-UTR в соответствии с настоящим изобретением, то есть который продлевает иили увеличивает выработку белка с указанной молекулы искусственной мРНК. Кроме того, подобная молекула мРНК по настоящему изобретению может дополнительно содержать элемент 3'-UTR в соответствии с настоящим изобретением, то есть элемент, который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной мРНК, не содержит элемент 3'-UTR или элемент 3'-UTR, который не соответствует настоящему изобретению, например, контрольный элемент 3'-UTR.

В соответствии с настоящим изобретением мРНК могут быть получены, например, путем транскрипции in vitro соответствующих векторов, например, векторов плазмид, например, включающих промотор Т7 и последовательность, кодирующую соответствующие последовательности мРНК. Полученные молекулы мРНК могут быть трансфицированы в клетки каким-либо методом трансфекции, пригодным для трансфекции мРНК, например, они могут быть трансфицированы методом липофекции в клетки млекопитающих, например, в клетки HeLa или HDF, и образцы могут анализироваться через определенные моменты времени после трансфекции, например, через 6 ч, 24 ч, 48 ч и 72 ч после трансфекции. В указанных образцах могут быть исследованы количество мРНК и/или белка известными специалистами методами. Например, количество репортерной мРНК, присутствующей в клетках в определенные моменты времени, может быть определено методами количественной ПЦР. Количество репортерного белка, кодируемого соответствующими мРНК, может быть определено, например, методами вестерн-блоттинга, ELISA, анализа репортеров FACS, например, анализом люциферазы, в зависимости от используемого репортерного белка. Эффект стабилизации экспрессии белка и/или удлинения экспрессии белка может быть проанализирован, например, путем определения соотношения уровня белка, наблюдаемого через 48 ч после трансфекции, и уровня белка, наблюдаемого через 24 ч после трансфекции. Чем ближе указанное значение к 1, тем более стабильной является экспрессия белка в течение соответствующего периода времени. Безусловно, такие измерения также могут выполняться в течение 72 ч или более, и соотношение уровня белка, наблюдаемого через 72 ч после трансфекции, и уровня белка, наблюдаемого через 24 ч после трансфекции, можно определить для определения стабильности экспрессии белка.

Кроме того, по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением является производным стабильной мРНК. Таким образом, понятие молекула, «производная» стабильной мРНК, означает, что по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR идентичен по меньшей мере на 50%, предпочтительно по меньшей мере на 60%, предпочтительно по меньшей мере на 70%, более предпочтительно по меньшей мере на 75%, более предпочтительно по меньшей мере на 80%, более предпочтительно по меньшей мере на 85%, еще более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95% и особенно предпочтительно по меньшей мере на 98% последовательности элемента 3'-UTR и/или элемента 5'-UTR стабильной мРНК. Предпочтительно стабильная мРНК представляет природную мРНК и, таким образом, элемент 3'-UTR и/или элемент 5'-UTR стабильной мРНК относится к 3'-UTR и/или 5'-UTR, или к их фрагментам или их вариантам, встречающимся в природной мРНК. Кроме того, элемент 3'-UTR и/или элемент 5'-UTR, полученный из стабильной мРНК, предпочтительно также относится к элементу 3'-UTR и/или к элементу 5'-UTR, который модифицирован по сравнению с природным элементом 3'-UTR и/или элементом 5'-UTR, например, чтобы еще больше повысить стабильность РНК и или продлить и/или увеличить выработку белка. Безусловно, что такие модификации являются предпочтительными, которые не ухудшают стабильности РНК, например, по сравнению с естественным (немодифицированным) элементом 3'-UTR и/или элементом 5'-UTR. В частности, понятие мРНК в контексте настоящего изобретения относится к молекуле мРНК, однако оно также может относиться к виду мРНК согласно описанию настоящего изобретения.

Предпочтительно стабильность мРНК, т.е. распад и/или период полувыведения мРНК, оценивают в стандартных условиях, например, в стандартных условиях (стандартные среда, условия инкубиования и т.д.) для определенной клеточной линии.

В контексте настоящего изобретения понятие «стабильная мРНК» в общем относится к мРНК, распад которой происходит медленно. Таким образом, «стабильная мРНК» обычно имеет длительный период полураспада. Период полураспада мРНК - это время, необходимое для разрушения 50% молекул мРНК в условиях in vivo или in vitro. Соответственно, стабильность мРНК обычно оценивают in vivo или in vitro. Таким образом, понятие «in vitro» относится, в частности, к («живым») клеткам и или тканям, включая ткань живого субъекта. К клеткам отнсятся, в частности, клеточные линии, первичные клетки, клетки в тканях или субъектах. В некоторых вариантах осуществления настоящего изобретения клеточные типы, допускающие культивирование клеток, могут быть применимы в настоящем изобретении. Особенно предпочтительными являются клетки млекопитающих, например, клетки человека и клетки мыши. В особенно предпочтительных вариантах осуществления настоящего изобретения используют линии клеток человека HeLa и U-937 и линии клеток мыши NIH3T3, JAWSII и L929. Кроме того, первичные клетки являются особенно предпочтительными, в частности в предпочтительных вариантах осуществления настоящего изобретения могут быть использованы дермальные фибробласты человечека (human dermal fibroblasts - HDF). В другом варианте также может быть применена ткань субъекта.

Предпочтительно период полураспада «стабильной мРНК» составляет по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере ч, по меньшей мере 10 ч, по меньшей мере 11 ч, по меньшей мере 12 ч, по меньшей мере 13 ч, по меньшей мере 14 ч и/или по меньшей мере 15 ч. Период полураспада представляющей интерес мРНК может быть определен различными методами, известными специалисту в данной области. Обычно период полураспада представляющей интерес мРНК определяют путем определения константы распада, в соответствии с чем обычно предполагают использовать идеальную ситуацию in vivo (или in vitro согласно описанному выше), при которой транскрипция представляющей интерес мРНК может быть полностью выключена (или, по крайней мере, находится на уровне ниже определяемого). В такой идеальной ситуации обычно предполагают, что распад мРНК следует кинетике первого порядка. Соответственно, распад мРНК обычно может быть описан следующим уравнением:

где А0 означает количество (или концентрацию) представляющей интерес мРНК в момент времени 0, то есть до начала распада, A(t) означает количество (или концентрацию) представляющей интерес мРНК за время t во время распада, и λ означает константу распада. Таким образом, если количество (или концентрация) представляющей интерес мРНК в момент времени 0 (А0) и количество (или концентрация) представляющей интерес мРНК в момент времени t во время процесса распада (A(t) и t) известны, можно рассчитать константу распада λ. На основании константы распада λ можно рассчитать период полураспада t1/2 по следующему уравнению:

поскольку согласно определению A(t)/A0=1/2 при t1/2. Таким образом, для оценки периода полураспада исследуемой мРНК обычно определяют количество или концентрацию мРНК во время процесса распада РНК in vivo (или in vitro согласно описанному выше).

Чтобы определить количество или концентрацию мРНК во время процесса распада РНК in vivo (или in vitro, согласно описанному выше), могут быть использованы различные методы, которые известны специалистам в данной области. К примерам, не ограничивающим области охвата настоящего изобретения, относят общее ингибирование транскрипции, например, таким ингибитором транскрипции, как актиномицин D, использование индуцируемых промоторов для специфической индукции временной транскрипции, например, c-fos индуцируемой сывороткой промоторной системы и регуляторной промоторной системы Tet-off, а также методы кинетической маркировки, например, импульсной маркировки, например, 4-тиоуридином (4sU), 5-этиниллуридином (ЕС) или 5'-бром-уридином (BrU). Дополнительные подробности и предпочтительные варианты осуществления настоящего изобретения касаются определения количества или концентрации мРНК во время распада РНК, описанных ниже, в контексте способа идентификации элемента 3'-UTR и/или по меньшей мере одного элемента 5'-UTR, который являеся прозводным стабильной мРНК по настоящему изобретению. Соответствующее описание и предпочтительные варианты его осуществления также касаются применяемых в настоящем изоберетении способов определения количества или концентрации мРНК во время распада РНК.

Предпочтительно, «стабильная мРНК» в контексте настоящего изобретения распадается медленнее, чем средняя мРНК, что предпочтительно оценивают in vivo (или in vitro, согласно описанному выше). Например, «распад средней мРНК» можно оценить, исследуя распад мРНК множества видов мРНК, предпочтительно 100, по меньшей мере 300, по меньшей мере 500, по меньшей мере 1000, по меньшей мере 2000, по меньшей мере 3000, по меньшей мере 4000, при по меньшей мере 5000, по меньшей мере 6000, по меньшей мере 7000, по меньшей мере 8000, по меньшей мере 9000, по меньшей мере 10000, по меньшей мере 11000, по меньшей мере 12000, по меньшей мере 13000, не менее 14000, не менее 15000, не менее 16000, по меньшей мере 17000, по меньшей мере 18000, по меньшей мере 19000, по меньшей мере 20000, по меньшей мере 21000, по меньшей мере 22000, по меньшей мере 23000, по меньшей мере 24000, по меньшей мере 25000, по меньшей мере 26000, по меньшей мере 27000, по меньшей мере 28000, по меньшей мере 29000, по меньшей мере 30000 мРНК. Особенно предпочтительно, когда оценивают весь транскриптом, или так много видов мРНК транскриптома, насколько это взможно. Это может быть достигнуто, например, с использованием микроматрицы, обеспечивающей охват всего транскрипта.

Понятие «виды мРНК» в контексте настоящего изобретения означает единицу транскрипции генома, т.е. обычно ген. Таким образом, в пределах одного «вида мРНК» могут встречаться различные транскрипты, например, из-за процессинга мРНК. Например, вид мРНК может быть представлен пятном на микрочипе. Соответственно, микрочип представляет собой полезный инструмент для определения количества видов мРНК в множестве, например, в определенный момент времени во время распада мРНК. Однако специалистам известны также другие методы, которые могут быть применены, например, сиквенс РНК, количественная ПЦР и др.

В настоящем изобретении особенно предпочтительно, чтобы стабильная мРНК отличалась расщеплением мРНК, причем отношение количества указанной мРНК во второй временной точке к количеству указанной мРНК в первой временной точке составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%) или по меньшей мере 0,95 (95%). Таким образом, вторая временная точка наступает позже в процессе распада, чем первая временная точка.

Предпочтительно, первую временную точку выбирают таким образом, что рассматривают только мРНК, подвергающуюся процессу распада, т.е. возникающую мРНК - т.е. в ходе транскрипции - исключают. Например, если применяют методы кинетической маркировки, например, импульсной маркировка, первую временную точку предпочтительно выбираются таким образом, что включение метки в мРНК завершается, то есть не происходит постоянного включения метки в мРНК. Таким образом, если используют кинетическую маркировку, первая временная точка может составлять по меньшей мере 10 мин, по меньшей мере 20 мин, по меньшей мере 30 мин, по меньшей мере 40 мин, по меньшей мере 50 мин, по меньшей мере 60 мин, по меньшей мере 70 мин по меньшей мере 80 мин или по меньшей мере 90 мин после окончания экспериментальной процедуры нанесения метки, например после окончания инкубации клеток с меткой.

Например, первая временная точка может составлять предпочтительно от 0 до 6 ч после остановки транскрипции (например, ингибитором транскрипции), остановки индукции промотора в случае индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания нанесения метки. Более предпочтительно, первая временная точка может составлять от 30 мин до 5 ч, еще более предпочтительно от 1 ч до 4 ч и особенно предпочтительно примерно через 3 ч после прекращения транскрипции (например, ингибитором транскрипции), прекращение индукции промотора в случае индуцируемых промоторов или после остановки подачи импульсов или меток, например после окончания нанесения метки.

Предпочтительно вторую временную точку выбирают как можно позже во время процесса распада мРНК. Однако если рассматривать множество видов мРНК, второй момент времени предпочтительно выбирают таким образом, что все еще существенное количество множества видов мРНК, предпочтительно по меньшей мере 10% видов мРНК, присутствует в обнаружимом количестве, то есть в количестве больше 0. Предпочтительно, второй момент времени составляет по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч, по меньшей мере 12 ч, по меньшей мере 13 ч, по меньшей мере 14 ч или по меньшей мере 15 ч после окончания транскрипции или в конце экспериментальной процедуры несения метки.

Таким образом, временной интервал между первой временной точкой и второй временной точкой предпочтительно имеет наибольший размер, насколько это возможно, в указанным выше пределах. Таким образом, временной интервал между первой временной точкой и второй временной точкой предпочтительно составляет по меньшей мере 4 ч, по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч или по меньшей мере 12 ч.

Кроме того, предпочтительно, что по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, который является производным от стабильной мРНК, идентифицируют методом идентификации элемента 3'-UTR и/или элемента 5'-UTR, который является производным от стабильной мРНК в соответствии с настоящим изобретением. Особенно предпочтительно, чтобы по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением идентифицируют методом идентификации элемента 3'-UTR и/или элемента 5'-UTR, который продлевает и/или увеличивает выработку белка с молекулы искусственной нуклеиновой кислоты и который является производным от стабильной мРНК согласно описанию настоящего изобретения.

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR в молекуле искусственной нуклеиновой кислоты согласно настоящему изобретению содержит или состоит из последовательности нуклеиновой кислоты, которая получена из 3'-UTR и/или 5'-UTR эукариотического гена, кодирующего белок, предпочтительно из 3'-UTR и/или 5'-UTR гена, кодирующего белок позвоночного, более предпочтительно из 3'-UTR и/или 5'-UTR гена, кодирующего белок млекопитающего, например из генов, кодирующих белок мыши и человека, еще более предпочтительно из 3'-UTR и/или 5'-UTR гена, кодирующего белок примата или грызуна, в частности 3'-UTR и/или 5'-UTR гена, кодирующего белок человека или мыши.

В целом, очевидно что по меньшей мере один элемент 3'-UTR в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из последовательности нуклеиновой кислоты, которая предпочтительно получена от природной 3'-UTR, тогда как по меньшей мере один элемент 5'-UTR в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из последовательности нуклеиновой кислоты, которая предпочтительно получена от природной 5'-UTR.

Предпочтительно, по меньшей мере, одна открытая рамка считывания является гетерологичной по меньшей мере одному элементу 3'-UTR и/или по меньшей мере одному элементу 5'-UTR. Понятие «гетерологичные» в контексте настоящего изобретения означает, что два элемента последовательности, состоящие из молекулы искусственной нуклеиновой кислоты, например, открытая рамка считывания и элемент 3'-UTR, и/или открытая рамка считывания и элемент 5'-UTR, действительно не встречаются естественным образом (в природе) в такой комбинации. Они обычно являются рекомбинантными. Предпочтительно, элемент 3'-UTR и/или элемент 5'-UTR производны от другого гена, чем открытая рамка считывания. Например, ORF может быть производным от другого гена, чем элемент 3'-UTR, и/или по меньшей мере один элемент 3'-UTR, например, кодирование другого белка или того же белка, но другого вида и т.д. То есть, открытая рамка считывания производна от гена, который отличен от гена, производным которого является элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR. В предпочтительном варианте осуществления настоящего изобретения ORF не кодирует рибосомальный белок человека или растения (например, Arabidopsis), предпочтительно не кодирует человеческий рибосомный белок S6 (RPS6), L36a-подобный рибосомальный белок человека (RPL36AL) или рибосомальный белок S16 (RPS16) Arabidopsis. В еще одном предпочтительном варианте осуществления настоящего изобретения открытая рамка считывания (ORF) не кодирует рибосомный белок S6 (RPS6), L36a-подобный рибосомальный белок человека (RPL36AL) или рибосомальный белок S16 (RPS16).

В некоторых вариантах осуществления настоящего изобретения предпочтительно, чтобы открытая рамка считывания не кодировала репортерный белок, например, выбранный из группы, состоящей из белков глобина (в частности, бета-глобина), белка люциферазы, белков GFP или их вариантов, например, вариантов, которые по меньшей мере на 70% идентичны глобиновым белкам, белку люциферазы или белку GFP. Таким образом, особенно предпочтительно, чтобы открытая рамка считывания не кодировала белок GFP. Также особенно предпочтительно, чтобы открытая рамка считывания (ORF) не кодировала репортерный ген или не была получена из репортерного гена, где репортерный ген предпочтительно не выбран из группы, состоящей из глобиновых белков (в частности, бета-глобина), белка люциферазы, бета-глюкуронидазы (GUS) и белков GFP или их вариантов, предпочтительно не выбранных из EGFP, или вариантов каких-либо из вышеуказанных генов, обычно по меньшей мере на 70% идентичных последовательности какого-либо репортерного гена, предпочтительно глобинового белка, белка люциферазы или белка GFP.

Еще более предпочтительно элемент 3'-UTR и/или 5'-UTR-элемент являются гетерологичными какому-либо другому элементу, содержащемуся в искусственной нуклеиновой кислоте согласно описанию настоящего изобретения. Например, если искусственная нуклеиновая кислота согласно настоящему изобретению содержит элемент 3'-UTR из данного гена, то он предпочтительно не содержит какой-либо другой последовательности нуклеиновой кислоты, в частности, какой-либо функциональной последовательности нуклеиновой кислоты (например, кодирующей или регуляторной последовательности) из того же самого гена, включая его регуляторные последовательности на 5'- и 3'-концах ORF гена. Соответственно, например, если искусственная нуклеиновая кислота согласно настоящему изобретению содержит элемент 5'-UTR данного гена, она предпочтительно не содержит какой-либо другой последовательности нуклеиновой кислоты, в частности, никакой функциональной последовательности нуклеиновой кислоты (например, элемента кодирующей или регуляторной последовательности) из того же самого гена, включая его регуляторные последовательности на 5'- и 3'-конце ORF гена.

Кроме того, предпочтительно, если искусственная нуклеиновая кислота в соответствии с настоящим изобретением содержит по меньшей мере одну открытую рамку считывания, по меньшей мере один 3'-UTR (элемент) и по меньшей мере один 5'-UTR (элемент), в соответствии с чем, либо по меньшей мере один 3'-UTR (элемент) представляет элемент 3'-UTR согласно настоящему изобретению и/или по меньшей мере один 5'-UTR (элемент) представляет элемент 5'-UTR в соответствии с настоящим изобретением. В такой предпочтительной искусственной нуклеиновой кислоте в соответствии с настоящим изобретением, которая содержит по меньшей мере одну открытую рамку считывания, по меньшей мере один 3'-UTR (элемент) и по меньшей мере один 5'-UTR (элемент), особенно предпочтительно, чтобы каждый компонент из перечисленных, а именно по меньшей мере одна открытая рамка считывания, по меньшей мере один 3'-UTR (элемент) и по меньшей мере один 5'-UTR (элемент), были гетерологичными, то есть чтобы по меньшей мере ни один 3'-UTR (элемент) и по меньшей мере один 5'-UTR (элемент), и ни одна открытая рамка считывания и 3'-UTR (элемент) или 5'-UTR (элемент), соответственно, не встречаются естественным образом в такой комбинации. Это означает, что молекула искусственной нуклеиновой кислоты содержит ORF, 3'-UTR (элемент) и 5'-UTR (элемент), которые все являются гетерологичными друг другу, например, они являются рекомбинантными, поскольку каждый из них получен из разных генов (и их 5'- и 3'-UTR). В другом предпочтительном варианте осуществления 3'-UTR (элемент) не является производным 3'-UTR (элемента) вирусного гена или не имеет вирусного происхождения.

Предпочтительно, молекула искусственной нуклеиновой кислоты согласно настоящему изобретению:

(i) содержит, по меньшей мере, один элемент 3'-UTR и по меньшей мере один элемент 5'-UTR, причем предпочтительно (каждый) из по меньшей мере одного элемента 5'-UTR и по меньшей мере одного элемента 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, производной от 3'-UTR или 5'-UTR, соответственно, гена, кодирующего белок человека или мыши;

(ii) по меньшей мере один элемент 3'-UTR, по меньшей мере один элемент 5'-UTR и по меньшей мере одна открытая рамка считывания молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением гетерологичны друг другу;

(iii) по меньшей мере один 3'-UTR-элемент является производным гена, выбранного из группы, состоящей из: генов «домашнего хозяйства», генов, кодирующих мембранные белки, генов, участвующих в клеточном метаболизме, генов, участвующих в процессах транскрипции, трансляции и репликации, генов, участвующих в модификации белка и генов, участвующих в делении клеток; а также

(iv) 3'UTR не является производным гена, кодирующего рибосомный белок, или гена на фиг. 4.

Гены «домашнего хозяйства» обычно являются конститутивными генами, которые необходимы для поддержания основной клеточной функции и которые обычно экспрессируются во всех клетках организма в нормальных и патофизиологических условиях. Хотя некоторые гены «домашнего хозяйства» экспрессируются на относительно постоянных уровнях при максимально непатологических ситуациях, другие гены «домашнего хозяйства» могут варьироваться в зависимости от условий эксперимента. Обычно гены «домашнего хозяйства» экспрессируются по меньшей мере в количестве не менее 25 копий на клетку, а иногда их количество выражается в тысячах копий. Предпочтительные примеры генов «домашнего хозяйства» в контексте настоящего изобретения показаны ниже в табл. 10.

Приведенная выше таблица взята из WO 2007/068265 А1, табл. 1; она основана на перечне номеров, которые были даны Е. Eisenberg и Е.Y. Levanon (Trends Genet. 19(7), 2003, 362-365). Эти номера используют в качестве входных данных для компьютерной программы PERL (Programmed Extraction Report Language), которая извлекает данные EST из базы данных Unigene. База данных Unigene была загружена в виде текстового файла с сайта NCBI. Длину 3'UTR извлекают путем компьютерного извлечения 3'UTR (Bakheet с соавт., Nucleic Acids Research. 29, 2001, 246-254). Обозначения: <а> - обычно используемая аббревиатура продукта гена; <б> - длина 3'UTR; <в> - количество EST.

К предочтительны генам домашнего хозяйства относятся LDHA, NONO, PGK1 и PPIH.

Геном, кодирующим мембранный белок, обычно называют такой ген, который кодирует белок, взаимодействующий с биологическими мембранами. В большинстве геномов около 20-30% всех генов кодируют мембранные белки. Обычные типы белков включают - помимо мембранных белков - растворимые глобулярные белки, фибриллярные белки и неупорядоченные белки. Таким образом, гены, кодирующие мембранные белки, обычно отличаются от генов, кодирующих растворимые глобулярные белки, фибриллярные белки или неупорядоченные белки. Мембранные белки включают мембранные рецепторы, транспортные белки, мембранные ферменты и молекулы клеточной адгезии.

Геном, участвующим в клеточном метаболизме, обычно называют ген, который кодирует белок, участвующий в клеточном метаболизме, то есть в наборе жизнеобеспечивающих химических превращений в клетках живых организмов. Обычно это реакции, катализируемые ферментами, позволяют организму расти и воспроизводить, поддерживать свои структуры и реагировать на окружающую среду. Соответственно, предпочтительными генами, участвующими в клеточном метаболизме, являются такие гены, которые кодируют ферменты, катализирующие реакцию, позволяющую организму расти и воспроизводить, поддерживать свои структуры и реагировать на окружающую среду. К другим примерам генов, участвующих в клеточном метаболизме, относят гены, кодирующие белки, несущие структурную или механическую функцию, например, формирование цитоскелета. Другие белки, участвующие в клеточном метаболизме, включают белки, участвующие в клеточной передаче сигналов, иммунных реакциях, клеточной адгезии, активном переносе через мембраны и клеточном цикле. Метаболизм обычно подразделяют на две категории: катаболизм - разрушение органического вещества посредством клеточного дыхания, и анаболизм - строительство компонентов клеток, например, белков и нуклеиновых кислот.

К генам, участвующим в процессах транскрипции, трансляции и репликации, обычно относят гены, которые кодируют белки, вовлеченные в процессы транскрипции, трансляции и репликации. В частности, понятие «репликация» в контексте настоящего изобретения предпочтительно относят к репликации нуклеиновых кислот, например, к репликации ДНК. Предпочтительными генами, участвующими в процессах транскрипции, трансляции и репликации, являются гены, кодирующие ферменты, участвующие в процессах транскрипции, трансляции и/или репликации (ДНК). Другие предпочтительные примеры включают гены, кодирующие фактор транскрипции или фактор трансляции. Рибосомные гены являются другими предпочтительными примерами генов, участвующих в процессах транскрипции, трансляции и репликации.

Ген, участвующий в модификации белка, обычно означает ген, который кодирует белок, участвующий в модификации белка. Предпочтительными примерами таких генов являются гены, кодирующие ферменты, участвующие в модификации белка, в частности в процессах пост-трансляционной модификации. Предпочтительные примеры ферментов, участвующих в посттрансляционной модификации, включают (i) ферменты, участвующие в добавлении гидрофобных групп, в частности, для локализации мембран, например, ферменты, индуцированные в миристоилировании, пальмитоилировании, изопренилировании или пренилировании, фарнезилировании, геранилировании или в глипиалировании; (ii) ферменты, участвующие в добавлении кофакторов для повышения ферментативной активности, например, ферменты, участвующие в липоилировании, в присоединении фрагмента флавина, в присоединении гема С, к фосфопантэтеинилированию или в образовании ретинилидена основания шиффа; (iii) ферменты, участвующие в модификации трансляционных факторов, например, в образовании дифтамида, в присоединении фосфоглицерина этаноламина или в образовании гипузина; и (vi) ферменты, участвующие в добавлении небольших химических групп, например, в ацилировании, например, ацетилировании и формилирование, алкилировании, например в метилировании, образовании амидной связи, например, в амидировании на С-конце, и в добавлении аминокислоты (например, в аргинилировании, полиглутамилировании и полиглицилировании), бутирилировании, гамма-карбоксилировании, гликозилировании, малонилировании, гидроксилировании, йодировании, добавлении нуклеотидов, окислении, формировании фосфатного эфира или фосфорамидатов, например, в фосфорилировании и аденилировании, пропионилировании, образовании пироглутамата, S-глутатионилировании, S-нитрозилировании, сукцинилировании и сульфатировании.

Геном, участвующим в процессах деления клеток, обычно является ген, который кодирует белок, участвующий в делении клеток. Деление клеток - это процесс, с помощью которого родительская клетка делится на две или более дочерних клеток. Деление клеток обычно являеся составляющей более крупного клеточного цикла. У эукариот существуют два различных типа деления клеток: вегетативное деление, при котором каждая дочерняя клетка генетически идентична родительской клетке (митоз) и редуктивное клеточное деление, при котором количество хромосом в дочерних клетках уменьшается на половину, для получения гаплоидных гамет (мейоз). Соответственно, предпочтительный ген, участвующий в процессе деления клеток, кодирует белок, вовлеченный в митоз и/или мейоз.

Фиг. 4 представляет аббревиатуру для фактор-индуцированного гена. Ген на фиг.4 кодирует полифосфоинозитидфосфатазу, также называемую фосфатидилинозитол 3,5-бисфосфат-5-фосфатазой или SAC домен-содержащим белком 3 (Sac3).

Предпочтительно, молекула искусственной нуклеиновой кислоты согласно настоящему изобретению:

(i) содержит, по меньшей мере, один элемент 3'-UTR и по меньшей мере один элемент 5'-UTR, причем предпочтительно (каждый из) по меньшей мере одного элемента 3'-UTR и по меньшей мере одного элемента 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR или 5'-UTR, соответственно, гена, кодирующего белок человека или мыши;

(ii) по меньшей мере один элемент 3'-UTR, по меньшей мере один элемент 5'-UTR и по меньшей мере одна открытая рамка считывания все являются гетерологичными по отношению друг к другу;

(iii) по меньшей мере один элемент 5'-UTR является производным гена, выбранного из группы, состоящей из генов домашнего хозяйства, генов, кодирующих мембранные белки, генов, участвующих в клеточном метаболизме, генов, участвующих в процессах транскрипции, трансляции и репликации, генов, участвующих в модификации белков, и гены, участвующие в делении клеток;

(iv) 5'-UTR предпочтительно не является 5 'TOP UTR; а также

(v) 3'-UTR предпочтительно не являются производными гена, кодирующего рибосомальный белок или альбумин, или гена, педставленного на фиг. 4.

Более предпочтительно такая молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением:

(i) содержит, по меньшей мере, один элемент 3'-UTR и по меньшей мере один элемент 5'-UTR, где предпочтительно (каждый из) по меньшей мере одного элемента 3'-UTR и по меньшей мере одного элемента 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая получена из 3'-UTR или 5'-UTR, соответственно, гена, кодирующего белок человека или мыши;

(ii) по меньшей мере один элемент 3'-UTR, по меньшей мере один элемент 5'-UTR и по меньшей мере одна открытая рамка считывания являются все гетерологичными по отношению друг к другу;

(ii) по меньшей мере один элемент 3'-UTR, по меньшей мере один элемент 5'-UTR и по меньшей мере одна открытая рамка считывания являются все гетерологичными отношению друг к другу;

(iii) по меньшей мере один элемент 3'-UTR получен из гена человека или мыши, выбранного из группы, состоящей из генов домашнего хзяйства, генов, кодирующих мембранные белки, генов, участвующих в клеточном метаболизме, генов, участвующих в процессах транскрипции, трансляции и репликации, генов, участвующих в модификации белка, и генов, участвующие в делении клеток;

(iv) 3'UTR не является производной гена, кодирующего рибосомальный белок, или альбумин, или из ген, представленный на фиг. 4;

(v) по меньшей мере один элемент 5'-UTR, который является производным гена человека или мыши, выбранного из группы, состоящей из генов домашнего хозяйства, генов, кодирующих мембранные белки, генов, участвующих в клеточном метаболизме, генов, участвующих в процессах транскрипции, трансляции и репликации, генов, участвующих в модификации белка, и генов, участвующих в делении клеток; а также

(vi) 5'-UTR не является 5 'TOP UTR.

Таким образом, в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением предпочтительно, чтобы 3'-UTR и 5'-UTR являлись производными генов домашнего хозяйства человека или мыши. Также предпочтительно, чтобы 3'-UTR и 5'-UTR являлись производными гена человека или мыши, кодирующего мембранный белок. Также предпочтительно, чтобы 3'-UTR и 5'-UTR являлись производными гена человека или мыши, участвующего в клеточном метаболизме. Также предпочтительно, чтобы 3'-UTR и 5'-UTR являлись производными гена человека или мыши, кодирующего в процессах транскрипции, трансляции и репликации. Также предпочтительно, чтобы 3'-UTR и 5'-UTR являлись производными гена человека или мыши участвующего в модификации белка. Также предпочтительно, чтобы 3'-UTR и 5'-UTR являлись производными гена человека или мыши участвующего в делении клеток. В этом контексте специалисту в данной области очевидно, что если (i) 3'-UTR и 5'-UTR являются производными генов, принадлежащих к одному и тому же классу генов, и (ii) по меньшей мере один 3'-UTR и по меньшей мере один 5'-UTR гетерологичны друг другу, то 3'-UTR и 5'-UTR получены не из одного и того же гена, а из разных генов, принадлежащих к одному и тому же классу генов. Соответственно, предпочтительно, чтобы по меньшей мере один 3'-UTR и по меньшей мере один 5'-UTR являются производными разных генов, принадлежащих к одному и тому же классу генов.

В контексте настоящего изобретения понятие «класс генов» относится к классификации генов. Примеры генных классов включают (i) гены домашнего хозяйства, (ii) гены, кодирующие мембранный белок, (iii) гены, участвующие в клеточном метаболизме, (iv) гены, участвующие в процессах транскрипции, трансляции и репликации, (v) гены, участвующие в модификации белка, и (vi) гены, участвующие в делении клеток. Иначе говоря, «гены домашнего хозяйства» - это один класс генов, а «гены, участвующие в транскрипции», представляют другой класс генов, «гены, участвующие в клеточном метаболизме», представляют еще один класс генов, и т.д.

Также предпочтительно, если в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением 3'-UTR и 5'-UTR, являющиеся производными гена человека или мыши, выбраны из группы, состоящей из генов, кодирующих мембранный белок, генов, участвующих в клеточном метаболизме, генов, участвующих в процессах транскрипции, трансляции и репликации, генов, участвующих в модификации белка, и генов, участвующих в делении клеток, где 3'-UTR и 5'-UTR выбраны из генов разных классов.

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или, по меньшей мере, один элемент 5'-UTR функционально связан с ORF. Это означает, что предпочтительно, чтобы элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR был ассоциирован с ORF таким образом, чтобы он мог выполнять функцию, например, усиления или стабилизации экспрессии закодированного пептида или белка или стабилизирующую функцию на молекуле искусственной нуклеиновой кислоты. Предпочтительно, ORF и элемент 3'-UTR ассоциированы в 5'→3' направлении и/или элемент 5'-UTR и ORF ассоциированы в 5'→3' направлении. Таким образом, предпочтительно, чтобы молекула искусственной нуклеиновой кислоты содержала в основном структуру 5'-[элемент 5'-UTR]-(необязательно)-линкер-ORF-(необязательно)-линкер-[элемент 3'-UTR]-3', причем молекула искусственной нуклеиновой кислоты может содержать только элемент 5'-UTR, но не элемент 3'-UTR, только элемент 3'-UTR, но не элемент 5'-UTR, или оба элемента - 3'-UTR и 5'-UTR. Кроме того, линкер может присутствовать или отсутствовать. Например, линкером может быть один или несколько нуклеотидов, например, фрагмент из 1-50 или 1-20 нуклеотидов, например, содержащий или не состоящий один или несколько сайтов распознавания ферментом рестрикции (сайты рестрикции).

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Ybx1 (Y-Box-связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8), CNTN1 (контактин 1), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, GRAMD1C, C11orf80, C9orf46, ANXA4, ТВСК, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN кДНК 2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, D HRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1.

В особенно предпочтительном варианте осуществления настоящего изобретения по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Ybx1 (Y-Box-связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8), CNTN1 (контактин 1), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, GRAMD1C, C11orf80, C9orf46, ANXA4, ТВСК, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrspl2, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappca6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1.

Более предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая является производной от 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, состоящей из GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (ген кДНК 2010107Е04 RIKEN), Ybx1 (Y-Box-связывающий белок 1), NODFb8 (NADH дегидрогеназа (убихинон) 1 бета-подкомплекс 8), CNTN1 (контактин 1) и NDUFA4 (НАДГ дегидрогеназа (убихинон) 1 альфа-подкомплекс 4).

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из «функционального фрагмента», «функционального варианта» или «функциональный фрагмент варианта» 3'-UTR и/или 5'-UTR транскрипта гена.

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена человека, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, GRAMD1C, C11orf80, C9orf46, ANXA4, ТВСК, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1.

В другом варианте или дополнительно также предпочтительно, если по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена мыши, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001 J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1 и Gaa.

Предпочтительно, по меньшей мере, один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, ТМЕМ14А, GRAMD1C, C11orf80, ANXA4, ТВСК, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, РССВ, АВСВ7, PGCP, NFU1, ОМА1, HHLA3, АСАА2, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ss4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1. Более предпочтительно, по меньшей мере, один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH-дегидрогеназа (убихинон) 1 бета-субкомплекс 8) и CNTN1 (контактин 1).

В особенно предпочтительном варианте осуществления настоящего изобретения по меньшей мере один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, ТМЕМ14А, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ss4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrp123, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1. Более предпочтительно, по меньшей мере один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH-дегидрогеназа (убихинон) 1 бета-субкомплекс 8) и CNTN1 (контактин 1).

Более предпочтительно, по меньшей мере, один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, TMEM14A, GRAMD1C, C11orf80, ANXA4, TBCK, IFI6, C2orD4, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, HADHB, ANAPC4, PCCB, ABCB7, PGCP, NFU1, OMA1, HHLA3, ACAA2, GSTM4, ALG8, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1; предпочтительно, по меньшей мере, один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена человека, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH дегидрогеназае (убихинон) 1 бета субкомплекс 8) и CNTN1 (контактин 1).

Соответственно, предпочтительно, если по меньшей мере один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена мыши, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH дегидрогеназае (убихинон) 1 бета субкомплекс 8) и CNTN1 (контактин 1), Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Atp5I, Tmsb10, Nenf, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001 J03Rik, Ndufal3, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Ndufb11, Map1lc3a, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp и Gaa; предпочтительно, по меньшей мере, один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR транскрипта гена мыши, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8) и CNTN1 (контактин 1).

Предпочтительно, по меньшей мере, один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта гена, выбранного из группы, включающей МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, C9orf46, ANXA4, IFI6, C2orD4, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAMI75A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, МССС2, CAT, ANAPC4, PHKB, АВСВ7, GPD2, ТМЕМ38 В, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapcl3, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstml; Atp5o; Tspo; Taldo1; Bloc1s1; и Hexa. Более предпочтительно по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта МР68 (RIKEN кДНК 2010107Е04 ген) или NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4).

В одном из предпочтительных вариантов осуществления настоящего изобретения по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта гена, выбранного из группы, включающей МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; и Hexa. Более предпочтительно по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта МР68 (RIKEN кДНК 2010107Е04 ген) или NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4).

Более предпочтительно по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта гена человека, выбранного из группы, включающей МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, PHKB, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS и GSTM4; предпочтительно по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта гена человека МР68 (RIKEN кДНК 2010107Е04 ген) или NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4).

Соответственно, более предпочтительно, если по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта гена мыши, выбранного из группы, включающей МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1 и Неха; предпочтительно по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR транскрипта гена мыши МР68 (RIKEN кДНК 2010107Е04 ген) или NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4).

Понятие «последовательность нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена», предпочтительно относится к последовательности нуклеиновой кислоты, которая основана на последовательности 3'-UTR и/или последовательности 5'-UTR транскрипта гена, или его фрагмента, или части его фрагмента, предпочтительно природного гена или его фрагмента или части его фрагмента. Это понятие включает последовательности, соответствующие всей последовательности 3'-UTR и/или всей последовательности 5'-UTR, то есть последовательности полной длины 3'-UTR и/или 5'-UTR транскрипта гена, и последовательности, соответствующие к фрагменту последовательности 3'-UTR и/или последовательности 5'-UTR транскрипта гена. Предпочтительно фрагмент транскрипта гена 3'-UTR и/или 5'-UTR состоит из непрерывного участка нуклеотидов, соответствующего непрерывному участку нуклеотидов в транскрипте гена 3'-UTR и/или 5'-UTR полной длины, который представляет по меньшей мере 5%, 10%, 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90% транскрипта гена 3'-UTR и/или 5'-UTR полной длины. Такой фрагмент, в контексте настоящего изобретения предпочтительно является функциональным фрагментом согласно описанному в настоящем изобретении. Предпочтительно фрагмент сохраняет регуляторную функцию для трансляции ORF, связанной с 3'-UTR и/или 5'-UTR или ее фрагментом.

Понятия «вариант 3'-UTR и/или вариант 5'-UTR транскрипта гена» и «его вариант» в контексте 3'-UTR и/или 5'-UTR транскрипта гена относится к варианту 3'-UTR и/или 5'-UTR транскрипта природного гена, предпочтительно к варианту 3'-UTR и/или 5'-UTR транскрипта гена позвоночного, более предпочтительно к варианту 3'-UTR и/или 5'-UTR транскрипта гена млекопитающего, еще более предпочтительно к варианту 3'-UTR и/или 5'-UTR транскрипта гена примата, особенно гена человека согласно описанному выше. Такой вариант может быть модифицированным транскриптом гена 3'-UTR и/или 5'-UTR. Например, вариант 3'-UTR и/или вариант 5'-UTR могут проявлять одну или несколько нуклеотидных делеций, инсерций, добавок и/или замещений по сравнению с встречающимися в природе 3'-UTR и/или 5'-UTR, производными которых является эти варианты. Предпочтительно вариант 3'-UTR и/или вариант 5'-UTR транскрипта гена идентичен по меньшей мере на 40%, предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, более предпочтительно на менее на 70%, еще более предпочтительно по меньшей мере на 80%, еще более предпочтительно по меньшей мере на 90%, наиболее предпочтительно по меньшей мере на 95% природному варианту 3'-UTR и/или 5'-UTR, от которого он происходит. Предпочтительно вариант является функциональным вариантом по настоящему изобретению.

Понятие «последовательность нуклеиновой кислоты, которая является производной варианта транскрипта гена 3'-UTR и/или варианта 5'-UTR», предпочтительно относится к последовательности нуклеиновой кислоты, которая основана на варианте последовательности транскрипта гена 3'-UTR и/или 5'-UTR или его фрагмента или части фрагмента согласно описанному выше. К этому понятию относятся последовательности, соответствующие всей последовательности варианта 3'-UTR и/или 5'-UTR транскрипта гена, то есть полной длины последовательности варианта 3'-UTR и/или полной длины варианта 5'-UTR последовательности транскрипта гена и последовательностей, соответствующих фрагменту варианта 3'-UTR последовательности и/или фрагмента варианта 5'-UTR последовательности транскрипта гена. Предпочтительно фрагмент варианта 3'-UTR и/или 5'-UTR транскрипта гена состоит из непрерывного участка нуклеотидов, соответствующего непрерывному участку нуклеотидов в варианте полной длины 3-UTR и/или 5'-UTR транскрипта гена, который представляет по меньшей мере 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно, по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90% варианта 3'-UTR и/или 5'-UTR транскрипта ген полной длины. Такой фрагмент варианта в контексте настоящего изобретения предпочтительно является функциональным фрагментом варианта, описанного в настоящем изобретении.

Понятия «функциональный вариант», «функциональный фрагмент» и «функциональный фрагмент варианта» (также называемый «фрагмент функционального варианта») в контексте настоящего изобретения означают, что фрагмент 3'-UTR и/или 5'-UTR, вариант 3'-UTR и/или 5'-UTR или фрагмент варианта 3'-UTR и/или 5'-UTR транскрипта гена выполняют по меньшей мере одну, предпочтительно более чем одну функцию встречающегося в природе 3'-UTR и/или 5'-UTR транскрипта гена, из которого получен вариант, фрагмент или фрагмент варианта. Такой функцией может быть, например, стабилизация мРНК и/или повышение, стабилизация и/или продление выработки белка с мРНК, и/или увеличение экспрессии белка или общей продуктивности белка из мРНК, предпочтительно в клетках млекопитающего, например, в клетках человека. Предпочтительно, функция 3'-UTR и/или 5'-UTR относится к трансляции белка, кодируемого ORF. Более предпочтительно, эта функция заключается в повышении эффективности трансляции ORF, связанной с 3'-UTR и/или 5'-UTR, или с его фрагментом или вариантом. Особенно предпочтительно, если вариант, фрагмент и фрагмент варианта в контексте настоящего изобретения выполняют функцию стабилизации мРНК, предпочтительно в клетках млекопитающего, например, в клетках человека, по сравнению с мРНК, содержащей контрольную 3'-UTR и/или контрольную 5'-UTR, или без 3'-UTR и/или 5'-UTR, и/или функцию усиления, стабилизации и/или продления выработки белка с мРНК, предпочтительно в клетках млекопитающего, например, в клетках человека, по сравнению с мРНК, содержащей контрольный 3'-UTR и/или контрольный 5'-UTR или без 3'-UTR и/или 5'-UTR, и/или функцию увеличения выработки белка с мРНК, предпочтительно в клетках млекопитающего, например, в клетках человека, по сравнению с мРНК, содержащей эталонную 3'-UTR и/или контрольную 5'-UTR или без 3'-UTR и/или 5'-UTR. Контрольной 3'-UTR и/или контрольной 5'-UTR может быть, например, 3'-UTR и/или 5'-UTR, встречающаяся в природе в комбинации с ORF. Кроме того, функциональный вариант, функциональный фрагмент или фрагмент функционального варианта 3'-UTR и/или 5'-UTR транскрипта гена предпочтительно не оказывают существенного снижения эффективности трансляции мРНК, которая содержит такой вариант, фрагмент или фрагмент варианта 3'-UTR и/или 5'-UTR по сравнению с 3'-UTR дикого типа и/или 5'-UTR дикого типа, от которых производны вариант, фрагмент или фрагмент варианта. Особенно предпочтительная функция «функционального фрагмента», «функционального варианта» или «фрагмента функционального варианта» 3'-UTR и/или 5'-UTR транскрипта гена в контексте настоящего изобретения представляет усиление, стабилизацию и/или продление выработки белка путем экспрессии мРНК, несущей функциональный фрагмент, функциональный вариант или функциональный фрагмент варианта согласно описанному выше.

Предпочтительно, эффективность одной или нескольких функций, оказываемых функциональным вариантом, функциональным фрагментом или функциональным вариантом фрагмента, например, эффективность стабилизации мРНК и/или белка, и/или эффективность увеличения выработки белка, увеличиваются, по меньшей мере, на 5%, более предпочтительно по меньшей мере на 10%, более предпочтительно по меньшей мере на 20%, более предпочтительно по меньшей мере на 30%, более предпочтительно по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, еще более предпочтительно, по меньшей мере, на 70%, еще более предпочтительно по меньшей мере на 80%, наиболее предпочтительно по меньшей мере на 90% по отношению к эффективности стабилизации мРНК и/или белка и/или повышению эффективности производства белка, проявляемому природным 3'-UTR и/или 5'-UTR транскриптом гена, производным которого является вариант, фрагмент или фрагмент варианта.

В контексте настоящего изобретения фрагмент 3'-UTR и/или 5'-UTR транскрипта гена или варианта 3'-UTR и/или 5'-UTR транскрипта гена предпочтительно имеет длину, по меньшей мере, примерно из 3 нуклеотидов, предпочтительно по меньшей мере примерно из 5 нуклеотидов, более предпочтительно по меньшей мере примерно из 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно из 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно из 70 нуклеотидов. Предпочтительно такой фрагмент 3'-UTR и/или 5'-UTR транскрипта гена или варианта 3'-UTR и/или 5'-UTR транскрипта гена является функциональным фрагментом согласно описанному выше. В предпочтительном варианте осуществления настоящего изобретения 3'-UTR и/или 5'-UTR транскрипта гена, или его фрагмента, или его варианта имеет длину от 3 до 500 нуклеотидов, предпочтительно от 5 до 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70. Обычно элемент 5'-UTR и/или элемент 3'-UTR характеризуются менее чем 500, 400, 300, 200, 150 или менее чем 100 нуклеотидами.

Предпочтительно, по меньшей мере, один 3'-UTR-элемент содержит или состоит из последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 1,2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере, примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентична последовательности нуклеиновой кислоты, выбранной из группы, состоящей из последовательностей SEQ ID NO: 1-24 и SEQ ID NO: 49-318 или соответствующей последовательности РНК соответственно, или где по меньшей мере один 3'-UTR содержит или состоит из фрагмента последовательности нуклеиновой кислоты, которая имеет идентичность по меньшей мере около 40%, предпочтительно по меньшей мере около 50%, предпочтительно по меньшей мере примерно 60%, предпочтительно по меньшей мере около 70% более предпочтительно по меньшей мере около 80%, более предпочтительно по меньшей мере около 90%, еще более предпочтительно по меньшей мере около 95%, еще более предпочтительно по меньшей мере, приблизительно 99% к последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: от 1 до 24 и SEQ ID NO: 49-318 или соответствующей последовательности РНК, соответственно:

Homo sapiens SLC38A6 3'-UTR

SLC38A6-001 ENST00000267488

Homo sapiens DECR1 3'-UTR

NM_001359.1

Homo sapiens PIGK 3'-UTR

Homo sapiens FAM175A 3'-UTR

FAM175A-009 ENST00000506553

Homo sapiens PHYH 3'-UTR

PHYH-002 ENST00000396913

Homo sapiens TBC1D19 3'-UTR

TBC1D19-001 ENST00000264866

Homo sapiens TBC1D19 NM_018317.2 3'-UTR

Homo sapiens PIGB 3'-UTR

PIGB-201 ENST00000539642

Homo sapiens ALG6 3'-UTR

ALG6-006 ENST00000263440

Homo sapiens CRYZ 3'-UTR

CRYZ-005 ENST00000370871

Homo sapiens BRP44L 3'-UTR

BRP44L-001 ENST00000360961

Homo sapiens ACADSB 3'-UTR

ACADSB-004

Homo sapiens TMEM14A 3'-UTR

NM_014051.3

Homo sapiens GRAMD1C 3'-UTR

GRAMD1C-005 ENST00000472026

Homo sapiens C11orf80 3'-UTR

C11orf80-201 ENST00000360962

Homo sapiens ANXA4 3'-UTR

ANXA4-002 ENST00000409920

Homo sapiens TBCK 3'-UTR

TBCK-002 ENST00000361687

Homo sapiens IFI6 3'-UTR

IFI6-001 ENST00000361157

Homo sapiens CAMKMT 3'-UTR

(synonym C2orf34) ENST00000378494

Homo sapiens ALDH6A1 3'-UTR

NM_005589.2

Homo sapiens AGTPBP1 3'-UTR

AGTPBP1-004 ENST00000357081

Homo sapiens CCDC53 3'-UTR

CCDC53-001 ENST00000240079

Homo sapiens LRRC28 3'-UTR

LRRC28-002 ENST00000331450

Homo sapiens CCDC109B 3'-UTR

NM_017918.4

Homo sapiens PUS10 3'-UTR

PUS10-001 ENST00000316752

Homo sapiens CCDC104 3'-UTR

CCDC104-002 ENST00000339012

Homo sapiens CASP1 3'-UTR

CASP1-007 ENST00000527979

Homo sapiens SNX14 3'-UTR

SNX14-007 ENST00000513865

Homo sapiens SKAP2 3'-UTR

SKAP2-201 (part of SKAP2.001 ENST00000345317)

Homo sapiens NDUFB6 3'-UTR

NM_182739.2

Homo sapiens EFHA1 3'-UTR

EFHA1-001 ENST00000382374

Homo sapiens BCKDHB 3'-UTR

BCKDHB-005 ENST00000356489

Homo sapiens BCKDHB 3'-UTR

NM_001164783.1

Homo sapiens BBS2 3'-UTR

NM_031885.3

Homo sapiens LMBRD1 3'UTR

NM_018368.3

Homo sapiens ITGA6 3'-UTR

ITGA6-003 ENST00000409532

Homo sapiens HERC5 3'-UTR

HERC5-001 ENST00000264350

Homo sapiens HADHB 3'-UTR

HADHB-001 ENST00000317799

Homo sapiens ANAPC4 3'-UTR

ANAPC4-001 ENST00000315368

Homo sapiens PCCB 3'-UTR

NM_000532.4

Homo sapiens ABCB7 3'-UTR

ABCB7-001 ENST00000253577

Homo sapiens PGCP 3'-UTR

CPQ-001 ENST00000220763

Homo sapiens NFU1 3'-UTR

NM_001002755.2

Homo sapiens OMA1 3'-UTR

OMA1-001 ENST00000371226

Homo sapiens HHLA3 3'-UTR

NM_001036646.1

Homo sapiens HHLA3 3'-UTR

NM_001031693.2

Homo sapiens ACAA2 3'-UTR

NM_006111.2

Homo sapiens GSTM4 3'-UTR

GSTM4-001 ENST00000369836

Homo sapiens GSTM4 3'-UTR

GSTM4-003 ENST00000326729

Homo sapiens ALG8 3'-UTR

NM_001007027.2

Homo sapiens C11orf74 3'UTR

Mus musculus Ndufa1 3'-UTR

Ndufa1-001 ENSMUST00000016571

Mus musculus Atp5e 3'-UTR

NM_025983

Mus musculus Gstm5 3'-UTR

NM_010360

Mus musculus Uqcr11 3'-UTR

NM_025650

Mus musculus IFi27I2a 3'-UTR

IFi27I2a-001 ENSMUST00000055071; NM_029803

Mus musculus Cbr2 3'-UTR

NM_007621

Mus musculus Atp5l 3'-UTR

Atp5l-201 ENSMUST00000043675

Mus musculus Tmsb10 3'-UTR

NM_025284

Mus musculus Nenf 3'-UTR

NM_025424

Mus musculus Atp5k 3'-UTR

NM_007507

Mus musculus 1110008P14Rik 3'-UTR

1110008P14Rik-001 ENSMUST00000048792

Mus musculus Cox4i1 3'-UTR

NM_009941

Mus musculus Cox6a1 3'-UTR

NM_007748

Mus musculus Ndufs6 3'-UTR

NM_010888

Mus musculus Sec61b 3'-UTR

NM_024171

Mus musculus Romo1 3'-UTR

NM_025946

Mus musculus Gnas 3'-UTR

NM_010309

Mus musculus Snrpd2 3'-UTR

NM_026943

Mus musculus Mgst3 3'-UTR

NM_025569

Mus musculus Aldh2 3'-UTR

NM_009656

Mus musculus Mp68 (2010107E04Rik) 3'-UTR

NM_027360

Mus musculus Ssr4 3'-UTR

NM_001166480

Mus musculus Myl6 3'-UTR

NM_010860

Mus musculus Prdx4 3'-UTR

Prdx4-001, NM_016764

Mus musculus Ubl5 3'-UTR

NM_025401

Mus musculus 1110001J03Rik 3'-UTR

NM_025363

Mus musculus Ndufa13 3'-UTR

Ndufa13-201 ENSMUST00000110167

Mus musculus Ndufa3 3'-UTR

NM_025348

Mus musculus Gstp2 3'-UTR

NM_181796

Mus musculus Tmem160 3'-UTR

NM_026938

Mus musculus Ergic3 3'-UTR

NM_025516

Mus musculus Pgcp 3'-UTR

NM_018755

Mus musculus Slpi 3'-UTR

NM_011414

Mus musculus Myeov2 3'-UTR

NM_001163425

Mus musculus Ndufa4 3'-UTR

NM_010886

Mus musculus Ndufs5 3'-UTR

NM_001030274

Mus musculus Gstm1 3'-UTR

NM_010358

Mus musculus 1810027O10Rik 3'-UTR

1810027O10Rik-001 ENSMUST00000094065

Mus musculus 1810027O10Rik 3'-UTR

BC117077

Mus musculus Atp5o 3'-UTR

NM_138597

Mus musculus Shfm1 3'-UTR

NM_009169

Mus musculus Tspo 3'-UTR

NM_009775

Mus musculus S100a6 3'-UTR

NM_011313

Mus musculus Taldo1 3'-UTR

NM_011528

Mus musculus Bloc1s1 3'-UTR

NM_015740

Mus musculus Ndufb11 3'-UTR

NM_019435

Mus musculus Map1lc3a 3'-UTR

NM_025735

Mus musculus Morn2 3'-UTR

NM_194269

Mus musculus Gpx4 3'-UTR

NM_008162.2

Mus musculus Mif 3'-UTR

NM_010798.2

Mus musculus Cox6b1 3'-UTR

NM_025628

Mus musculus RIKEN cDNA2900010J23 (Swi5) 3'-UTR

NM_175190

Mus musculus Sec61g 3'-UTR

NM_011343.3

Mus musculus 2900010M23Rik 3'-UTR

BC_030629

Mus musculus Anapc5 3'-UTR

Anapc5-201 ENSMUST00000086216

Mus musculus Mars2 3'-UTR

BC132343.1

Mus musculus Phpt1 3'-UTR

NM_029293

Mus musculus Ndufb8 3'-UTR

NM_026061

Mus musculus Pfdn5 3'-UTR

NM_027044

Mus musculus Arpc3 3'-UTR

NM_019824

Mus musculus Ndufb7 3'-UTR

NM_025843

Mus musculus Atp5h 3'-UTR

NM_027862

Mus musculus Mrpl23 3'-UTR

NM_011288

Mus musculus Tomm6 3'-UTR

NM_025365.3

Mus musculus Tomm6 3'-UTR

Tomm6-002 ENSMUST00000113301

Mus musculus Tomm6 3'-UTR

Mus musculus Mtch1 3'-UTR

NM_019880

Mus musculus Pcbd2 3'-UTR

NM_028281

Mus musculus Ecm1 3'-UTR

NM_007899

Mus musculus Hrsp12 3'-UTR

Hrsp12-001 ENSMUST00000022946

Mus musculus Mecr 3'-UTR

NM_025297

Mus musculus Uqcrq 3'-UTR

NM_025352

Mus musculus Gstm3 3'-UTR

NM_010359

Mus musculus Lsm4 3'-UTR

NM_015816

Mus musculus Park7 3'-UTR

NM_020569

Mus musculus Usmg5 3'-UTR

NM_023211

Mus musculus Cox8a 3'-UTR

NM_007750

Mus musculus Ly6c1 3'-UTR

NM_010741

Mus musculus Ly6c1 3'-UTR

NM_001252058.1

Mus musculus Cox7b 3'-UTR

NM_025379

Mus musculus Ppib 3'-UTR

NM_011149

Mus musculus Bag1 3'-UTR

NM_009736

Mus musculus S100a4 3'-UTR

S100a4-201 ENSMUST00000001046

Mus musculus Bcap31 3'-UTR

NM_012060

Mus musculus Tecr 3'-UTR

NM_134118

Mus musculus Rabac1 3'-UTR

NM_010261

Mus musculus Robld3 3'-UTR

NM_031248 (Lamtor2)

Mus musculus Sod1 3'-UTR

NM_011434

Mus musculus Nedd8 3'-UTR

NM_008683

Mus musculus Higd2a 3'-UTR

NM_025933

Mus musculus Trappc6a 3'-UTR

Trappc6a-001 ENSMUST00000002112

Mus musculus Ldhb 3'-UTR

Ldhb-001 ENSMUST00000032373

Mus musculus Nme2 3'-UTR

Nme2-001 ENSMUST00000021217

Mus musculus Snrpg 3'-UTR

NM_026506

Mus musculus Ndufa2 3'-UTR

NM_010885

Mus musculus Serf1 3'-UTR

Serf1-003 ENSMUST00000142155

Mus musculus Oaz1 3'-UTR

Oaz1-001 ENSMUST00000180036

Mus musculus Ybx1 3'-UTR

Ybx1-001 ENSMUST00000079644

Mus musculus Ybx1(v2) 3'-UTR

с мутацией T128bpG и делецией del236-237bp

Mus musculus Sepp1 3'-UTR

NM_009155

Mus musculus Gaa 3'-UTR

Gaa-001 ENSMUST00000106259

Homo sapiens ACTR10 3'-UTR

ACTR10-002 ENST00000254286

Homo sapiens PIGF 3'-UTR

NM_173074

Homo sapiens PIGF 3'-UTR

NM_002643.3

Homo sapiens MGST3 3'-UTR

MGST3-001 ENST00000367889

Homo sapiens SCP2 3'-UTR

NM_001193599

Homo sapiens SCP2 3'-UTR

SCP2-015 ENST00000435345

Homo sapiens HPRT1 3'-UTR

HPRT1-001 ENST00000298556

ACSF2

Homo sapiens

Homo sapiens VPS13A 3'-UTR

NM_033305

Homo sapiens CTH 3'-UTR

NM_001190463.1

Homo sapiens CTH 3'-UTR

CTH-001 ENST00000370938

Homo sapiens CTH 3'-UTR

CTH-002 ENST00000346806

Homo sapiens NXT2 3'-UTR

NXT2-004 ENST00000372107

Homo sapiens MGST2 3'-UTR

NM_002413

Homo sapiens MGST2 3'-UTR

NM_001204366.1

Homo sapiens C11orf67 3'-UTR

AAMDC-005 ENST00000526415

Homo sapiens PCCA 3'-UTR

NM_000282

Homo sapiens GLMN 3'-UTR

NM_053274

Homo sapiens DHRS1 3'-UTR

NM_001136050

Homo sapiens PON2 3'-UTR

PON2-001 ENST00000433091

Homo sapiens NME7 3'-UTR

NM_013330

Homo sapiens ETFDH 3'-UTR

NM_004453

Homo sapiens ALG13 3'-UTR

BC117377

Homo sapiens ALG13 3'-UTR

NM_001099922.2

Homo sapiens DDX60 3'-UTR

DDX60-001 ENST00000393743

Homo sapiens DYNC2LI1 3'-UTR

NM_015522.3

Homo sapiens VPS8 3'-UTR

NM_001009921, NM_015303

Homo sapiens ITFG1 3'-UTR

NM_030790

Homo sapiens CDK5 3'-UTR

NM_004935

Homo sapiens C1orf112 3'-UTR

BC091516

Homo sapiens IFT52 3'-UTR

NM_016004

Homo sapiens CLYBL 3'-UTR

CLYBL-003 ENST00000339105

Homo sapiens FAM114A2 3'-UTR

FAM114A2-006 ENST00000520667

Homo sapiens NUDT7 3'-UTR

NM_001243661

Homo sapiens AKD1 3'-UTR

NM_001145128

Homo sapiens MAGED2 3'-UTR

NM_014599

Homo sapiens HRSP12 3'-UTR

HRSP12-001 ENST00000254878

Homo sapiens STX8 NM_004853 3'-UTR

Homo sapiens ACAT1 3'-UTR

ACAT1-001 ENST00000265838

Homo sapiens IFT74 3'-UTR

IFT74-201 ENST00000433700

Homo sapiens KIFAP3 3'-UTR

NM_014970

Homo sapiens CAPN1 3'-UTR

NM_005186

Homo sapiens COX11 3'-UTR

NM_001162861

Homo sapiens GLT8D4 3'-UTR

BC127733

Homo sapiens GLT8D4 3'-UTR

NM_001080393

Homo sapiens HACL1 3'-UTR

NM_012260

Homo sapiens IFT88 3'-UTR

NM_175605

Homo sapiens IFT88 3'-UTR

IFT88-001 ENST00000351808

Homo sapiens NDUFB3 3'-UTR

NM_002491

Homo sapiens ANO10 3'-UTR

NM_018075

Homo sapiens ANO10 3'-UTR

ANO10-005 ENST00000451430

Homo sapiens ARL6 3'-UTR

NM_032146

Homo sapiens LPCAT3 3'-UTR

NM_005768

Homo sapiens ABCD3 3'-UTR

NM_001122674

Homo sapiens COPG2 3'-UTR

NM_012133

Homo sapiens MIPEP 3'-UTR

NM_005932

Homo sapiens LEPR 3'-UTR

NM_002303

Homo sapiens LEPR 3'-UTR

NM_001198688

Homo sapiens C2orf76 3'-UTR

NM_001017927

Homo sapiens C2orf76 3'-UTR

C2orf76-001 ENST00000409466

Homo sapiens ABCA6 3'-UTR

NM_080284.2

Homo sapiens LY96 3'-UTR

NM_015364.4

Homo sapiens CROT 3'-UTR

NM_001243745.1

Homo sapiens ENPP5 3'-UTR

ENPP5-002 ENST00000230565

Homo sapiens SERPINB7 3'-UTR

SERPINB7-203 ENST00000546027

Homo sapiens TCP11L2 3'-UTR

NM_152772

Homo sapiens IRAK1BP1 3'-UTR

NM_001010844

Homo sapiens CDKL2 3'-UTR

CDKL2-002 ENST00000307465

Homo sapiens GHR 3'-UTR

GHR-202 ENST00000537449

Homo sapiens KIAA1107 3'-UTR

NM_015237

Homo sapiens RPS6KA6 3'-UTR

RPS6KA6-001 ENST00000262752

Homo sapiens CLGN 3'-UTR

NM_004362, NM_001130675

Homo sapiens CLGN-202 3'-UTR

NM_004362, NM_001130675

ENST00000325617

Homo sapiens TMEM45A 3'-UTR

NM_018004

Homo sapiens TBC1D8B 3'-UTR

TBC1D8B-007 ENST00000276175

Homo sapiens ACP6 3'-UTR

NM_016361

Homo sapiens RP6-213H19.1 3'-UTR

MST4-003 (RBM4B-003 ENST00000496850)

Homo sapiens SNRPN 3'-UTR

NM_022807

Homo sapiens GLRB 3'-UTR

GLRB-005 ENST00000512619

Homo sapiens HERC6 3'-UTR

NM_017912

Homo sapiens CFH 3'-UTR

NM_000186

Homo sapiens GALC 3'-UTR

GALC-002 ENST00000393569

Homo sapiens GALC 3'-UTR

GALC-005 ENST00000393568

Homo sapiens PDE1A 3'-UTR

NM_001003683.2

Homo sapiens PDE1A 3'-UTR

PDE1A-003 ENST00000410103

Homo sapiens GSTM5 3'-UTR

NM_000851

Homo sapiens CADPS2 3'-UTR

CADPS2-002 ENST00000412584

Homo sapiens CADPS2 3'-UTR

CADPS2-001 ENST00000449022

Homo sapiens AASS 3'-UTR

AASS-001 ENST00000417368

Homo sapiens TRIM6-TRIM34 3'-UTR

NM_001003819

Homo sapiens SEPP1 3'-UTR

NM_005410

Homo sapiens SEPP1 3'-UTR

SEPP1-004 ENST00000506577

Homo sapiens PDE5A 3'-UTR

PDE5A-002 ENST00000264805

Homo sapiens SATB1 3'-UTR

SATB1-004 ENST00000417717

Homo sapiens CCPG1 3'-UTR

CCPG1-002 ENST00000442196

Homo sapiens CCPG1 3'-UTR

CCPG1-004 ENST00000425574

Homo sapiens CNTN1 3'-UTR

CNTN1-002 ENST00000348761

Homo sapiens CNTN1 3'-UTR

CNTN1-004 ENST00000547849

Homo sapiens CNTN1 3'-UTR

CNTN1-004 ENST00000547849

+T в позиции 30 п.о., мутации G727bpT, A840bpG

Homo sapiens LMBRD2 3'-UTR

Homo sapiens TLR3 3'-UTR

NM_003265

Homo sapiens BCAT1 3'-UTR

BCAT1-002 ENST00000342945

Homo sapiens BCAT1 3'-UTR

Homo sapiens TOM1L1 3'-UTR

TOM1L1-001 ENST00000575882

Homo sapiens SLC35A1 3'-UTR

SLC35A1-201 ENST00000369556

Homo sapiens GLYATL2 3'-UTR

GLYATL2-003 ENST00000532258

Homo sapiens STAT4 3'-UTR

STAT4-002 ENST00000392320

Homo sapiens GULP1 3'-UTR

GULP1-002 ENST00000409609

Homo sapiens GULP1 3'-UTR

GULP1-010 ENST00000409805

Homo sapiens EHHADH 3'-UTR

EHHADH-002 ENST00000456310

Homo sapiens NBEAL1 3'-UTR

NM_001114132.1

Homo sapiens KIAA1598 3'-UTR

NM_001258299.1

Homo sapiens HFE 3'-UTR

HFE-006 ENST00000317896

Homo sapiens HFE 3'-UTR

HFE-004 ENST00000349999

Homo sapiens HFE 3'-UTR

HFE-005 ENST00000397022

Homo sapiens HFE 3'-UTR

HFE-012 ENST00000336625

Homo sapiens KIAA1324L 3'-UTR

KIAA1324L-005 ENST00000416314

Homo sapiens MANSC1 NM_018050 3'-UTR

Предпочтительно, по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере, примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95% еще более предпочтительно по меньшей мере примерно на 99% идентична последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 25 или SEQ ID NO: 30 и SEQ ID NO: 319-338, или соответствующей последовательности ДНК или РНК, соответственно, или в которой по меньшей мере один элемент 5'-UTR содержит или состоит из фрагмента последовательности нуклеиновой кислоты, который по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, и еще более предпочтительно по меньшей мере примерно на 99% идентичен последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 25 или SEQ ID NO: 30 и SEQ ID NO: 319-338 или соответствующей последовательности ДНК или РНК, соответственно:

Homo sapiens LTA4H 5'-UTR

LTA4H-001 ENST00000228740

Homo sapiens DECR1 5'-UTR

DECR1-001 ENST00000220764

Homo sapiens PIGK 5'-UTR

Homo sapiens BRP44L 5'-UTR

BRP44L-001

Homo sapiens ACADSB 5'-UTR

ACADSB-004 NM_001609.3 ENST00000368869

Homo sapiens SUPT3H 5'-UTR

SUPT3H-006 ENST00000371459

Homo sapiens TMEM14A 5'-UTR

NM_014051.3

Homo sapiens C9orf46 5'-UTR

AF225420.1

Homo sapiens ANXA4 5'-UTR

NM_001153.3

Homo sapiens IFI6 5'-UTR

NM_022873.2

Homo sapiens C2orf34 5'-UTR

CAMKMT-008 ENST00000402247

Homo sapiens C2or04 5'-UTR

NM_024766.3

Homo sapiens ALDH6A1 5'-UTR

ALDH6A1-002 ENST00000350259

Homo sapiens CCDC53 5'-UTR

CCDC53-002 ENST00000545679

Homo sapiens CASP1 5'-UTR

NM_001257119.1

Homo sapiens NDUFB6 5'-UTR

NM_182739.2

Homo sapiens BCKDHB 5'-UTR

BCKDHB-002 ENST00000369760

Homo sapiens BCKDHB 5'-UTR

NM_001164783.1

Homo sapiens BBS2 5'-UTR

NM_031885.3

Homo sapiens HERC5 5'-UTR

HERC5-001 ENST00000264350

Homo sapiens FAM175A 5'-UTR

NM_139076.2

Homo sapiens NT5DC1 5'-UTR

NT5DC1-002 ENST00000319550

Homo sapiens RAB7A 5'-UTR

RAB7A-001 ENST00000265062

Homo sapiens AGA 5'-UTR

AGA-001 ENST00000264595

Homo sapiens TPK1 5'-UTR

TPK1-001 ENST00000360057

Homo sapiens MBNL3 5'-UTR

MBNL3-001 ENST00000370839

Homo sapiens MCCC2 5'-UTR

MCCC2-001 ENST00000340941

Homo sapiens CAT 5'-UTR

CAT-001 ENST00000241052

Homo sapiens ANAPC4 5'-UTR

ANAPC4-001 ENST00000315368

Homo sapiens RNAB 5'-UTR

PHKB-002 ENST00000323584

Homo sapiens ABCB7 5'-UTR

ABCB7-001 ENST00000253577

Homo sapiens GPD2 5'-UTR

GPD2-002 ENST00000438166

Homo sapiens TMEM38B 5'-UTR

TMEM38B-001 ENST00000374692

Homo sapiens NFU1 5'-UTR

NM_001002755.2

Homo sapiens LOC128322/NUTF2 5'-UTR

NM_005796.1

Homo sapiens NUBPL 5'-UTR

NM_025152.2

Homo sapiens LANCL1 5'-UTR

LANCL1-004 ENST00000233714

Homo sapiens PIR 5'-UTR

PIR-002 ENST00000380420

Homo sapiens CTBS 5'-UTR

NM_004388.2

Homo sapiens GSTM4 5'-UTR

NM_000850.4

Mus musculus Ndufal 5'-UTR

Ndufa1-001 ENSMUST00000016571

Mus musculus Atp5e 5'-UTR

NM_025983

Mus musculus Gstm5 5'-UTR

NM_010360

Mus musculus Cbr2 5'-UTR

NM_007621

Mus musculus Anapc13 5'-UTR

NM_181394

Mus musculus Ndufa7 5'-UTR

NM_023202

Mus musculus Atp5k 5'-UTR

NM_007507

Mus musculus Cox4i1 5'-UTR

NM_009941

Mus musculus Ndufs6 5'-UTR

NM_010888

Mus musculus Sec61b 5'-UTR

NM_024171

Mus musculus Snrpd2 5'-UTR

NM_026943

Mus musculus Mgst3 5'-UTR

NM_025569

Mus musculus Mp68 (2010107E04Rik) 5'-UTR

NM_027360

Mus musculus Prdx4-001, 5'-UTR

NM_016764

Mus musculus Pgcp 5'-UTR

NM_176073

Mus musculus Myeov2 5'-UTR

NM_001163425

Mus musculus Ndufa4 5'-UTR

NM_010886

Mus musculus Ndufs5 5'-UTR

NM_001030274

Mus musculus Gstm1 5'-UTR

NM_010358

Mus musculus Atp5o 5'-UTR

NM_138597

Mus musculus Tspo 5'-UTR

NM_009775

Mus musculus Taldo1 5'-UTR

NM_011528

Mus musculus Bloc1s1 5'-UTR

NM_015740

Mus musculus Hexa 5'-UTR

NM_010421

Предпочтительно, по меньшей мере, один элемент 3'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности 3'-UTR транскрипта гена, выбранного из группы, состоящей из GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), Ybx1 (Y-Box-связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8), CNTN1 (контактин 1); где CNTN1-004 является особенно предпочтительным). Наиболее предпочтительно, по меньшей мере, один элемент 3'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50% предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности, выбранной из группы, состоящей из SEQ ID NO: 1 - SEQ ID NO: 24, или соответствующих последовательностей РНК:

SEQ ID NO: 1

SEQ ID NO: 2

SEQ ID NO: 3

SEQ ID NO: 4

SEQ ID NO: 5

SEQ ID NO: 6

SEQ ID NO: 7

SEQ ID NO: 8

SEQ ID NO: 9

SEQ ID NO: 10

SEQ ID NO: 11

SEQ ID NO: 12

SEQ ID NO: 13

SEQ ID NO: 14

SEQ ID NO: 15

SEQ ID NO: 16

SEQ ID NO: 17

SEQ ID NO: 18

SEQ ID NO: 19

SEQ ID NO: 20

SEQ ID NO: 21

SEQ ID NO: 22

SEQ ID NO: 23

SEQ ID NO: 24

Предпочтительно, по меньшей мере, один элемент 5'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности 5'-UTR транскрипта МР68 (RIKEN кДНК 2010107Е04 ген) или NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа-подкомплекс 4). Наиболее предпочтительно, по меньшей мере, один элемент 5'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит или состоит из последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50% предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности SEQ ID NO: 25 или SEQ ID NO: 30 или соответствующей последовательности РНК:

SEQ ID NO: 25

SEQ ID NO: 26

SEQ ID NO: 27

SEQ ID NO: 28

SEQ ID NO: 29

SEQ ID NO: 30

По меньшей мере один элемент 3'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может также содержать или состоять из фрагмента последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности нуклеиновой кислоты 3'-UTR транскрипта гена, например, 3'-UTR последовательности SEQ ID NO: 1-24 и SEQ ID NO: 49-318, причем фрагмент предпочтительно представляет функциональный фрагмент или фрагмент функционального, варианта описанный выше. Такой фрагмент предпочтительно имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления настоящего изобретения его фрагмент или его вариант имеет длину от 3 до 500 нуклеотидов, предпочтительно от 5 до 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90 нуклеотидов, наиболее предпочтительно от 20 до 70 нуклеотидов. Предпочтительно указанные варианты, фрагменты или фрагменты вариантов являются функциональными вариантами, функциональными фрагментами или функциональными фрагментами вариантов 3'-UTR, продлевающими выработку белка с молекулы искусственной нуклеиновой кислоты по настоящему изобретению с эффективностью продления выработки белка по меньшей мере 30%, предпочтительно с эффективностью по меньшей мере 40%, более предпочтительно по меньшей мере 50%, более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере 90%, проявляемой молекулой искусственной нуклеиновой кислоты, содержащей последовательность нуклеиновой кислоты, выбранную из группы, состоящей из SEQ ID NO: 1 - SEQ ID NO: 24.

По меньшей мере один 5'-UTR-элемент молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может также содержать или состоять из фрагмента последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности нуклеиновой кислоты 5'-UTR транскрипта гена, например, 5'-UTR последовательности в соответствии с SEQ ID NO: 25 или SEQ ID NO: 30 и SEQ ID NO: 319-338, причем фрагмент предпочтительно представляет функциональный фрагмент или фрагмент функционального варианта согласно описанному выше. Такой фрагмент предпочтительно имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления настоящего изобретения фрагмент или вариант имеет длину от 3 до 500 нуклеотидов, предпочтительно от 5 до 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90 нуклеотидов, наиболее предпочтительно от 20 до 70 нуклеотидов. Предпочтительно указанные варианты, фрагменты или фрагменты вариантов являются функциональными вариантами, функциональными фрагментами или функциональными фрагментами вариантов 5'-UTR, которые увеличивают выработку белка с молекулы искусственной нуклеиновой кислоты согласно настоящему изобретению с эффективностью, превышающей по меньшей мере на 30%, предпочтительно с эффективностью по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, еще более предпочтительно по меньшей мере на 70%, еще более предпочтительно по меньшей мере на 80%, предпочтительно по меньшей мере на 90% относительно эффективности выработки белка, проявляемой с молекулы искусственной нуклеиновой кислоты, содержащей последовательность нуклеиновой кислоты, выбранную из группы, состоящей из SEQ ID NO: 25 - SEQ ID NO: 30.

Предпочтительно, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением имеет длину, по меньшей мере, около 3 нуклеотидов, предпочтительно по меньшей мере около 5 нуклеотиды, более предпочтительно по меньшей мере около 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере около 50 нуклеотидов, наиболее предпочтительно по меньшей мере около 70 нуклеотидов. Верхний предел длины по меньшей мере одного элемента 3'-UTR и/или по меньшей мере одного элемента 5'-UTR может составлять 500 нуклеотидов или менее, например, 400, 300, 200, 150 или 100 нуклеотидов. Для других вариантов осуществления настоящего изобретения верхний предел может быть выбран в пределах от 50 до 100 нуклеотидов. Например, фрагмент или его вариант может иметь длину от 3 до 500 нуклеотидов, предпочтительно от 5 до 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90 нуклеотидов, наиболее предпочтительно от 20 до 70 нуклеотидов.

Кроме того, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может содержать более одного 3'-UTR-элемента и/или более одного элемента 5'-UTR согласно описанному выше. Например, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может содержать один, два, три, четыре или более элементов 3'-UTR и/или один, два, три, четыре или более элементов 5'-UTR, отдельные элементы 3'-UTR могут быть одинаковыми или могут быть разными, и аналогичным образом отдельные элементы 5'-UTR могут быть одинаковыми или могут быть разными. Например, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может содержать два по существу идентичных элемента 3'-UTR согласно описанному выше, например, два элемента 3'-UTR, содержащие или состоящие из последовательности нуклеиновой кислоты, которая получена из 3'-UTR транскрипта гена, например, последовательность в соответствии с SEQ ID NO: 1-24 и SEQ ID NO: 49-318 или из фрагмента или варианта 3'-UTR транскрипта гена, его функциональных вариантов, его функциональных фрагментов или их функциональных фрагментов согласно описанному выше. Соответственно, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, может содержать два по существу идентичных элемента 5'-UTR согласно описанному выше, например, два элемента 5'-UTR, содержащие или состоящие из последовательности нуклеиновой кислоты, которая получена из 5'-UTR транскрипта гена, например, последовательность в соответствии с SEQ ID NO: 25-30 и SEQ ID NO: 319-338 или из фрагмента или варианта 5'-UTR транскрипта гена, его функциональных вариантов, функциональных фрагментов или их функциональных фрагментов согласно описанному выше.

Неожиданно в настоящем изобретении было установлено, что молекула искусственной нуклеиновой кислоты, содержащая элемент 3'-UTR согласно описанному выше, и/или элемент 5'-UTR согласно описанному выше, может представлять или может предусматривать молекулу мРНК, которая позволяет увеличить, продлить и/или стабилизировать выработку белка. Таким образом, элемент 3'-UTR по настоящему изобретению и/или элемент 5'-UTR по настоящему изобретению может улучшить стабильность экспрессии белка с молекулы мРНК и/или улучшить эффективность трансляции.

В частности, молекула искусственной нуклеиновой кислоты по настоящему изобретению может содержать (i) по меньшей мере один элемент 3'-UTR и по меньшей мере один элемент 5'-UTR, который продлевает и/или увеличивает выработку белка; (ii) по меньшей мере один элемент 3'-UTR, который продлевает и/или увеличивает выработку белка, но не содержит элемент 5'-UTR, который продлевает и/или увеличивает выработку белка; или (iii) по меньшей мере один элемент 5'-UTR, который продлевает и/или увеличивает выработку белка, но не содержит 3'-UTR-элемент, который продлевает и/или увеличивает выработку белка.

Однако, в частности, в случае (ii) и (iii), но, возможно, также в случае (i), молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может дополнительно содержать один или несколько «дополнительных элементов 3'-UTR и/или элементов 5'-UTR», т.е. элементы 3'-UTR и/или элементы 5'-UTR, которые в полной мере не отвечают описанным выше требованиям. Например, молекула искусственной нуклеиновой кислоты по настоящему изобретению, которая содержит элемент 3'-UTR в соответствии с настоящим изобретением, то есть элемент 3'-UTR, который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, может дополнительно содержат какие-либо дополнительные 3'-UTR и/или какие-либо дополнительные 5'-UTR, в частности дополнительный 5'-UTR, например 5'-ТОР UTR или какую-либо другую 5'-UTR или какой-либо другой элемент 5'-UTR. Сходным образом, например, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, которая содержит 5'-UTR-элемент в соответствии с настоящим изобретением, то есть элемент 5'-UTR, который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, может дополнительно содержать какие-либо дополнительные 3'-UTR и/или какие-либо дополнительные 5'-UTR, в частности дополнительные 3'-UTR, например 3'-UTR, производные от 3'-UTR гена альбумина, особенно предпочтительно 3'-UTR, содержащую последовательность SEQ ID NO: 31 или 32, в частности, SEQ ID NO: 32, или какую-либо другую 3'-UTR или какой-либо другой элемент 3'-UTR.

Кроме того, в настоящем изобретении по меньшей мере один элемент 5'-UTR и/или по меньшей мере один элемент 3'-UTR, который продлевает и/или увеличивает выработку белка, а также дополнительно 3'-UTR (элемент) и/или дополнительно 5'-UTR (элемент) присутствуют в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, дополнительный 5'-UTR (элемент) и/или дополнительный 3'-UTR (элемент) могут взаимодействовать с элементом 3'-UTR по настоящему изобретению и/или с элемент 5'-UTR по настоящему изобретению и, таким образом, поддерживать увеличение и/или продление эффекта элемента 3'-UTR по настоящему изобретению и/или элемента 5'-UTR по настоящему изобретению, соответственно. Такие дополнительные 3'-UTR и/или 5'-UTR (элементы) могут дополнительно поддерживать стабильность и эффективность трансляции. Боле того, если в молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением присутствуют оба элемента, а именно 3'-UTR по настоящему изобретению и 5'-UTR по настоящему изобретению, то эффект элемента 5'-UTR по настоящему изобретению и элемента 3'-UTR по настоящем изобретению в виде продления и/или увеличения предпочтительно приводит к синергетическому эффекту в виде увеличенной и продленной выработки белка.

Предпочтительно, дополнительная 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая получена из 3'-UTR гена, выбранного из группы, состоящей из гена альбумина, гена α-глобина, гена β-глобина, гена тирозингидроксилазы, гена липоксигеназы и гена коллагена альфа, например, гена коллагена альфа 1(I), или из варианта 3'-UTR гена, выбранного из группы, состоящей из гена альбумина, гена α-глобина, гена β-глобина, гена тирозингидроксилазы, гена липоксигеназы и гена коллагена альфа, например, гена коллагена альфа 1(I) в соответствии с SEQ ID NO: 1369-1390 в патентной заявке WO 2013/143700, сущность которой включена в настоящее изобретение в виде ссылки. В особенно предпочтительном варианте осуществления настоящего изобретения дополнительный 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR гена альбумина, предпочтительно гена альбумина позвоночных, более предпочтительно гена альбумина млекопитающих, наиболее предпочтительно ген альбумина человека в соответствии с SEQ ID NO: 31:

SEQ ID NO: 31:

(3'-UTR альбумина человека; соответствует SEQ ID NO: 1369 патентной заявки WO 2013/143700)

В этом контексте особенно предпочтительно, чтобы молекула нуклеиновой кислоты по настоящему изобретению содержала дополнительно элемент 3'-UTR, производный от нуклеиновых кислот, соответствующих последовательностям SEQ ID N 1369-1390 из патентной заявки WO 2013/143700, или их фрагментам, гомологам или его вариантам.

Наиболее предпочтительно дополнительный 3'-UTR содержит последовательность нуклеиновой кислоты, производную от фрагмента гена альбумина человека, соответствующего SEQ ID NO: 32:

SEQ ID NO: 32:

(альбумин 7 3'-UTR; соответствует SEQ ID No: 1376 в патентной заявке WO 2013/143700)

В этом контексте особенно предпочтительно, чтобы дополнительная 3'-UTR молекулы искусственной нуклеиновой кислоты по настоящему изобретению содержал или состоял из последовательности нуклеиновой кислоты в соответствии с SEQ ID NO: 32, или соответствующей последовательности РНК.

Дополнительная область 3'-UTR может также содержать или состоять из последовательности нуклеиновой кислоты, производной от гена, кодирующего рибосомальный белок, причем гены, кодирующие рибосомный белок, от которых может быть получена дополнительная 3'-UTR, включают, но ими не ограничиваются, рибосомальный белок L9 (RPL9), рибосомальный белок L3 (RPL3), рибосомальный белок L4 (RPL4), рибосомальный белок L5 (RPL5), рибосомальный белок L6 (RPL6), рибосомальный белок L7 (RPL7), рибосомальный белок L7a (RPL7A), рибосомальный белок L11 (RPL11), рибосомальный белок L12 (RPL12), рибосомальный белок L13 (RPL13), рибосомальный белок L23 (RPL23), рибосомальный белок L18 (RPL18), рибосомальный белок L18a (RPL18A), рибосомальный белок L19 (RPL19), рибосомальный белок L21 (RPL21), рибосомальный белок L22 (RPL22), рибосомальный белок L23a (RPL23A), рибосомальный белок L17 (RPL17), рибосомальный белок L24 (RPL24), рибосомальный белок L26 (RPL26), рибосомальный белок L27 (RPL27), рибосомальный белок L30 (RPL30), рибосомальный белок L27a (RPL27A), рибосомальный белок L28 (RPL28), рибосомальный белок L29 (RPL29), рибосомальный белок L31 (RPL31), рибосомальный белок L32 (RPL32), рибосомальный белок L35a (RPL35A), рибосомальный белок L37 (RPL37), рибосомальный белок L37a (RPL37A), рибосомальный белок L38 (RPL38), рибосомальный белок L39 (RPL39), рибосомный белок, большой, Р0 (RPLP0), рибосомальный белок, большой, Р1 (RPLP1), рибосомальный белок, большой, Р2 (RPLP2), рибосомальный белок S3 (RPS3), рибосомальный белок S3A (RPS3A), рибосомальный белок S4, X-связанный (RPS4X), рибосомальный белок S4, Y-linked 1 (RPS4Y1), ribosomal protein S5 (RPS5), ribosomal protein S6 (RPS6), рибосомальный белок S7 (RPS7), рибосомальный белок S8 (RPS8), рибосомальный белок S9 (RPS9), рибосомальный белок S10 (RPS10), рибосомальный белок S11 (RPS11), рибосомальный белок S12 (RPS12), рибосомальный белок S13 (RPS13), рибосомальный белок S15 (RPS15), рибосомальный белок S15a (RPS15A), рибосомальный белок S16 (RPS16), рибосомальный белок S19 (RPS19), рибосомальный белок S20 (RPS20), рибосомальный белок S21 (RPS21), рибосомальный белок S23 (RPS23), рибосомальный белок S25 (RPS25), рибосомальный белок S26 (RPS26), рибосомальный белок S27 (RPS27), рибосомальный белок S27a (RPS27a), рибосомальный белок S28 (RPS28), рибосомальный белок S29 (RPS29), рибосомальный белок L15 (RPL15), рибосомальный белок S2 (RPS2), рибосомальный белок L14 (RPL14), рибосомальный белок S14 (RPS14), рибосомальный белок L10 (RPL10), рибосомальный белок L10a (RPL10A), рибосомальный белок L35 (RPL35), рибосомальный белок L13a (RPL13A), рибосомальный белок L36 (RPL36), рибосомальный белок L36a (RPL36A), рибосомальный белок L41 (RPL41), рибосомальный белок S18 (RPS18), рибосомальный белок S24 (RPS24), рибосомальный белок L8 (RPL8), рибосомальный белок L34 (RPL34), рибосомальный белок S17 (RPS17), рибосомальный белок SA (RPSA), убиквитин А-52 остаточный рибосомальный белок гибридный продукт 1 (ген UBA52), Вирус саркомы мышей Finkel-Biskis-Reilly (FBR-MuSV) повсеместно экспрессируемый (FAU), рибосомальный белок L22-like 1 (RPL22L1), рибосомальный белок S17 (RPS17), рибосомальный белок L39-like (RPL39L), рибосомальный белок L10-like (RPL10L), рибосомальный белок L36a-like (RPL36AL), рибосомальный белок L3-like (RPL3L), рибосомальный белок S27-like (RPS27L), рибосомальный белок L26-like 1 (RPL26L1), рибосомальный белок L7-like 1 (RPL7L1), рибосомальный белок L13a псевдогена (RPL13AP), рибосомальный белок L37a псевдогена 8 (RPL37AP8), рибосомальный белок S10 псевдогена 5 (RPS10P5), рибосомальный белок S26 псевдогена 11 (RPS26P11), рибосомальный белок L39 псевдогена 5 (RPL39P5), рибосомальный белок, крупный, РО псевдогена 6 (RPLP0P6) и рибосомальный белок L36 псевдогена 14 (RPL36P14).

Предпочтительно, дополнительная 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR гена ТОР или которая получена из фрагмента, гомолога или варианта 5'-UTR гена ТОР.

Особенно предпочтительно, чтобы элемент 5'-UTR не содержал ТОР-мотив или 5'ТОР согласно описанному выше. В частности, предпочтительно, чтобы 5'-UTR гена ТОР представлял 5'-UTR гена ТОР, не обладающего ТОР-мотивом.

Последовательность нуклеиновой кислоты, которая является производной 5'-UTR гена ТОР эукариот, предпочтительно гена ТОР животного или животного, более предпочтительно гена ТОР хордовых, еще более предпочтительно гена ТОР позвоночных, наиболее предпочтительно ген ТОР млекопитающих, например, ген ТОР человека.

Например, дополнительный 5'-UTR предпочтительно выбирают из элементов 5'-UTR, содержащих или состоящих из последовательности нуклеиновой кислоты, которая получена из последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700, сущность которой включена в настоящее изобретение в виде ссылки, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700, из ее варианта или предпочтительно из соответствующей последовательности РНК. Понятие «гомологи SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700» относится к последовательностям других видов, помимо Homo sapiens, которые гомологичны последовательностям SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700.

В предпочтительном варианте осуществления настоящего изобретения дополнительная 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая является производной от последовательности нуклеиновой кислоты, расположенной от нуклеотида в положении 5 (т.е. нуклеотида, который находится в положении 5 в последовательности) до положения нуклеотида сразу после 5' к стартовому кодону (расположенному на 3'-конце последовательностей), например, положение нуклеотида сразу после 5' к последовательности ATG, последовательности нуклеиновой кислоты, выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700, из ее варианта или соответствующей последовательности РНК. Особенно предпочтительно, что дополнительная 5'-UTR является производной от последовательности нуклеиновой кислоты, расположенной от нуклеотида в положении сразу от 3' к 5'ТОР до положения нуклеотида сразу от 5' до стартового кодона (расположенного на 3'-конце последовательности), например, в положении нуклеотида сразу 5' к последовательности ATG, последовательности нуклеиновой кислоты, выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 из патентной заявки WO 2013/143700, от гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422 патентной заявки WO 2013/143700, от ее варианта или соответствующей последовательности РНК.

В особенно предпочтительном варианте осуществления настоящего изобретения дополнительный 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR гена ТОР, кодирующего рибосомальный белок, или от варианта 5'-UTR гена ТОР, кодирующего рибосомальный белок. Например, 5'-UTR-элемент содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR последовательности нуклеиновой кислоты в соответствии с какой-либо из последовательностей SEQ ID NO: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 или 1360 из патентной заявки WO 2013/143700, от соответствующей последовательности РНК, ее гомолога или варианта согласно описанию настоящего изобретения предпочтительно без 5'-ТОР-мотива. Согласно описанному выше последовательность, простирающаяся от положения 5 до нуклеотида, непосредственно после 5' к ATG (который расположен в 3'-конце последовательностей), соответствует 5'-UTR указанных последовательностей.

Предпочтительно дополнительная 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR гена ТОР, кодирующего рибосомальный большой белок (RPL) или от гомолога или варианта 5'-UTR гена ТОР, кодирующего рибосомальный большой белок (RPL). Например, S'-UTR-элемент содержит или состоит из последовательности нуклеиновой кислоты, которая получена из 5'-UTR последовательности нуклеиновой кислоты в соответствии с какой-либо из SEQ ID NO: SEQ ID NO: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 и 1422 из патентной заявки WO 2013/143700, соответствующей последовательности РНК, ее гомолога или варианта согласно описанию настоящего изобретения, предпочтительно без 5'ТОР-мотива.

В особенно предпочтительном варианте осуществления настоящего изобретения элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая производна от 5'-UTR гена рибосомного белка большого 32, предпочтительно от гена рибосомального белка большого 32 (L32) позвоночных, более предпочтительно от гена большого 32 (L32) белка рибосомного млекопитающих, наиболее предпочтительно от гена большого 32 (L32) белка рибосомы человека, или от варианта 5'-UTR гена рибосомального белка большого 32, предпочтительно от гена рибосомального белка большого 32 (L32) позвоночного, более предпочтительно от гена рибосомного белка большого 32 (L32) млекопитающего, наиболее предпочтительно от гена рибосомального белка большого 32 (L32) человека, причем также предпочтительно, что 5'-UTR не содержит 5'ТОР указанного гена.

Соответственно, в особенно предпочтительном варианте осуществления настоящего изобретения дополнительный 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая идентична по меньшей мере приблизительно на 40%, предпочтительно по меньшей мере приблизительно на 50%, предпочтительно по меньшей мере приблизительно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно, по меньшей мере примерно на 99% последовательности нуклеиновой кислоты в соответствии с SEQ ID NO: 33 (5'-UTR рибосомального белка большого 32 человека, не имеющего 5'-концевого олигопиримидинового тракта:

соответствующего SEQ ID NO: 1368 в патентной заявке WO 2013/143700) или предпочтительно соответствующего последовательности РНК, или где дополнительно 5'-UTR содержит или состоит из фрагмента последовательности нуклеиновой кислоты, которая по меньшей мере примерно на 40%, предпочтительно от по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно, по меньшей мере, примерно на 95% более предпочтительно по меньшей мере примерно на 99% к последовательности нуклеиновой кислоты в соответствии с SEQ ID NO: 33 или более предпочтительно к соответствующей последовательности РНК, причем предпочтительно фрагмент является описанным выше, то есть является непрерывным отрезком нуклеотидов, представляющим по меньшей мере 20% и т.д. 5'-UTR полной длины. Предпочтительно длина фрагмента составляет по меньшей мере примерно 20 нуклеотидов или более, предпочтительно по меньшей мере около 30 нуклеотидов или более, более предпочтительно по меньшей мере примерно 40 нуклеотидов или более. Предпочтительно, фрагмент является функциональным фрагментом, описанным в настоящем изобретении.

В некоторых вариантах осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты включает дополнительную область 5'-UTR, которая включает или состоит из последовательности нуклеиновой кислоты, полученной из 5'-UTR гена ТОР позвоночных, например, гена млекопитающего, например, гена ТОР человека, выбранного из RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB или из их гомологов или вариантов, причем предпочтительная 5'-UTR не содержит ТОР-мотива или 5'ТОР указанных генов, и необязательно дополнительная 5'-UTR начинается с 5'-конца с нуклеотида, расположенного в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 вниз по цепи 5'-концевого олигопиримидинового тракта (ТОР), а также необязательно дополнительно область 5'-UTR, производная от 5'-UTR гена ТОР, заканчивается на 3'-конце нуклеотидом, расположенным в положениях 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 вверх по цепи от стартового кодона (A(U/T)G) гена, производным которого он является.

Искусственная молекула нуклеиновой кислоты в соответствии с настоящим изобретением может представлять РНК, например, мРНК или вирусную РНК или репликон, ДНК, например, плазмидную ДНК или вирусную ДНК, или может быть модифицированную молекулу РНК или ДНК. Она может быть предусмотрена в виде двухцепочечной молекулы, имеющей смысловую цепь и антисмысловую цепь, например, в виде молекулы ДНК, имеющей смысловую цепь и антисмысловую цепь.

Молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может дополнительно содержать необязательно 5'-кэп. Необязательный 5'-кэп предпочтительно локализован в положении 5' к ORF, более предпочтительно 5' по меньшей мере к одной 5'-UTR или к какой-либо дополнительной 5'-UTR внутри молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением.

Предпочтительно, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением дополнительно содержит поли(А) последовательность и/или сигнал полиаденилирования. Предпочтительно, чтобы необязательная поли(А) последовательность локализована с 3'-конца по меньшей мере одного элемента 3'-UTR или какой-либо дополнительной 3'-UTR, более предпочтительно необязательная полу(А) последовательность соединена с 3'-концом элемента 3'-UTR. Соединение может быть прямым или опосредованным, например, через отрезок из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, например, с помощью линкера из 1-50, предпочтительно из 1-20 нуклеотидов, например, содержащих или состоящих из одного или нескольких сайтов рестрикции. Однако даже если молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не содержит 3'-UTR, например, если она содержит только по меньшей мере один элемент 5'-UTR, то она предпочтительно все еще содержит поли(А) последовательность и/или сигнал полиаденилирования.

В одном варианте осуществления необязательный сигнал полиаденилирования расположен ниже по цепи от 3'-конца элемента 3'-UTR. Предпочтительно, сигнал полиаденилирования содержит консенсусную последовательность NN(U/T)ANA, с N=А или U, предпочтительно AA(U/T)AAA или A(U/T)(U/T)AAA. Такая консенсусная последовательность может быть распознана большинством животных и бактериальных клеточных систем, например, факторами полиаденилирования, например, специфическим фактором расщепления/полиаденилирования (CPSF), взаимодействующего с CstF, PAP, РАВ2, CFI и/или CFII. Предпочтительно, сигнал полиаденилирования, предпочтительно консенсусная последовательность NNUANA, расположен менее чем примерно в 50 нуклеотидах, более предпочтительно менее чем примерно в 30 основаниях, наиболее предпочтительно менее чем примерно в 25 основаниях, например, на 21 основании ниже по цепи от 3'-конца 3'-UTR или ORF, если нет элемента 3'-UTR.

Транскрипция молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, молекула искусственной ДНК, содержащая сигнал полиаденилирования ниже по цепи от элемента 3'-UTR (или от ORF), приводит к незрелой РНК, содержащей сигнал полиаденилирования ниже по цепи от элемента 3'-UTR (или ORF).

Использование соответствующей системы транскрипции приводит к присоединению последовательности поли(А) к незрелой РНК. Например, молекула искусственной нуклеиновой кислоты по настоящему изобретению может быть молекулой ДНК, содержащей элемент 3'-UTR согласно описанному выше и сигнал полиаденилирования, что может приводить к полиаденилированию РНК после транскрипции соответствующей молекулы ДНК. Соответственно, получаемая РНК может содержать комбинацию элемента 3'-UTR по настоящему изобретению, за которым следует последовательность поли(А).

Потенциальными системами транскрипции являются системы транскрипции in vitro или клеточные системы транскрипции и др. Соответственно, транскрипция молекулы искусственной нуклеиновой кислоты по настоящему изобретению, например, транскрипция молекулы искусственной нуклеиновой кислоты, содержащей открытую рамку считывания, элемент 3'-UTR и/или элемент 5'-UTR и, необязательно, сигнал полиаденилирования, может приводить к тому, что молекула мРНК содержит открытую рамку считывания, элемент 3'-UTR и, необязательно, последовательность поли(А).

Соответственно, настоящее изобретение также предусматривает молекулу искусственной нуклеиновой кислоты, которая представляет молекулу мРНК, содержащую открытую рамку считывания, элемент 3'-UTR по настоящему изобретению, и/или элемент 5'-UTR согласно описанному выше и необязательно последовательность поли(А).

В другом варианте осуществления 3'-UTR молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением не содержит сигнала полиаденилирования или последовательности поли(А). Кроме того, предпочтительно, чтобы молекула искусственной нуклеиновой кислоты по настоящему изобретению не содержала сигнала полиаденилирования или последовательности поли(А). Более предпочтительно, 3'-UTR молекулы искусственной нуклеиновой кислоты или сама молекула искусственной нуклеиновой кислоты по настоящему изобретению не содержит сигнала полиаденилирования, в частности, не содержит сигнала полиаденилирования AAU/TAAA.

В предпочтительном варианте осуществления настоящего изобретения предусматривают молекулу искусственной нуклеиновой кислоты, которая представляет молекулу искусственной РНК, содержащую открытую рамку считывания и последовательность РНК, соответствующую последовательности ДНК, выбранной из группы, состоящей из последовательностей SEQ ID NO: 1-30, предпочтительно из группы, состоящей из последовательностей SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 8, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 25 и SEQ ID NO: 28, или последовательностей, которые по меньшей мере примерно на 40% или более идентичны последовательностям SEQ ID NO: 1-30, предпочтительно SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 8, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 25 и SEQ ID NO: 28 или их фрагментам согласно описанному выше. Кроме того, также предусматривают соответствующие искусственные молекулы ДНК.

В другом предпочтительном варианте осуществления настоящее изобретение относится к молекуле искусственной нуклеиновой кислоты, которая представляет молекулу искусственной ДНК, содержащую открытую рамку считывания и последовательность, выбранную из группы, состоящей из последовательностей SEQ ID NO: 1-30, предпочтительно из группы, состоящей из последовательностей SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 8, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 25 и SEQ ID NO: 28, или последовательностей, которые идентичны по меньшей мере примерно на 40% или более последовательностям SEQ ID NO: 1-30, предпочтительно последовательностям SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 8, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 25 и SEQ ID NO: 28.

Настоящее изобретение также предусматривает молекулу искусственной нуклеиновой кислоты, которая может служить матрицей для молекулы РНК, предпочтительно для молекулы мРНК, которая стабилизируется и оптимизируется для эффективности трансляции. Иначе говоря, молекула искусственной нуклеиновой кислоты может быть ДНК, которую можно использовать в качестве матрицы для выработки мРНК. С получаемой мРНК, в свою очередь, можно транслировать требуемый пептид или белок, кодируемый открытой рамкой считывания. Если молекула искусственной нуклеиновой кислоты является ДНК, ее можно, например, применять в качестве двухцепочечной формы хранения для продолжения и повторения получения мРНК in vitro или in vivo. Таким образом, понятие «in vitro» относится, в частности, к («живым») клеткам и/или тканям, включая ткань живого субъекта. Клетки включают, в частности, линии клеток, первичные клетки, клетки в ткани или в субъектах. В некоторых вариантах осуществления настоящего изобретения типы клеток могут быть применимы в рамках настоящего изобретения. Особенно предпочтительными являются клетки млекопитающих, например, клетки человека и клетки мыши. В особенно предпочтительных вариантах осуществления настоящего изобретения используют линии клеток человека HeLa и U-937 и линии клеток мыши NIH3T3, JAWSII и L929. Кроме того, первичные клетки являются особенно предпочтительными, в частности предпочтительными вариантами осуществления могут быть использованы дермальные фибробласты человека человеческие дермальные фибробласты (human dermal fibroblasts - HDF). В другом варианте также можно использоваться ткань субъекта.

В одном из вариантов осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением дополнительно содержит последовательность поли(А). Например, молекула ДНК, содержащая ORF, необязательно сопровождаемую 3'-UTR, может содержать участок тимидиновых нуклеотидов, который может быть транскрибирован в последовательность поли(А) в формируемой мРНК. Длина последовательности poly(A) может изменяться. Например, последовательность поли(А) может состоять в длину примерно от 20 адениновых нуклеотидов до примерно 300 адениновых нуклеотидов, предпочтительно примерно от 40 до примерно 200 адениновых нуклеотидов, более предпочтительно примерно от 50 до примерно 100 адениновых нуклеотидов, например, примерно из 60, 70, 80, 90 или 100 адениновых нуклеотидов. Наиболее предпочтительно нуклеиновая кислота по настоящему изобретению содержит последовательность поли(А), состоящую примерно из 60-70 нуклеотидов, наиболее предпочтительно из 64 адениновых нуклеотидов.

Искусственные молекулы РНК также могут быть получены in vitro обычными методами химического синтеза, не требующими транскрипции с родительской ДНК.

В особенно предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением представляет молекулу РНК, предпочтительно молекулу мРНК, содержащую в направлении от 5' к 3' открытую рамку считывания, элемент 3'-UTR согласно описанному выше и последовательность поли(А), или содержащую в направлении от 5' к 3' элемент 5'-UTR согласно описанному выше открытую рамку считывания и последовательность поли(А).

В предпочтительном варианте осуществления настоящего изобретения открытая рамка считывания является производной гена, который отличен от гена, от которого является производным элемент 3'-UTR и/или элемент 5'-UTR искусственной нуклеиновой кислоты по настоящему изобретению. В некоторых других предпочтительных вариантах осуществления настоящего изобретения открытая рамка считывания не кодирует гена, выбранного из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глутатион-S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Ybx1 (Y-Box-связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8), CNTN1 (контактин 1), предпочтительно CNTN1-004 или его варианты, при условии, что элемент 3'-UTR и/или элемент 5'-UTR является последовательность, выбранной из группы, состоящей из последовательностей от SEQ ID NO: 1 до SEQ ID NO: 30.

В предпочтительном варианте осуществления ORF не кодирует рибосомальные белки человека или растения, в частности Arabidopsis, в частности не кодирует рибосомальный белок человека S6 (RPS6), рибосомальный белок человека L36a-подобный (RPL36AL) или рибосомальный белок S16 (RPS16) Arabidopsis. В другом предпочтительном варианте осуществления настоящего изобретения открытая рамка считывания (ORF) не кодирует рибосомальный белок S6 (RPS6), рибосомальный белок L36a-подобный (RPL36AL) или рибосомальный белок S16 (RPS16) независимо от его происхождения.

В одном из вариантов осуществления настоящего изобретения предусматривают искусственную молекулу ДНК, содержащую открытую рамку считывания, предпочтительно открытую рамку считывания, производную от гена, который отличается от гена, от которого получен элемент 3'-UTR и/или элемент 5'-UTR выводится; элемент 3'-UTR, содержащий или состоящий из последовательности, которая по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере на 99%, еще более предпочтительно на 100% идентична последовательности ДНК, выбранной из группы, состоящей из последовательностей SEQ ID NO: 1-24, и/или элемент 5'-UTR, содержащий или состоящий из последовательности, которая по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере на 99%, еще более предпочтительно на 100% идентична последовательности ДНК, выбранной из группы, состоящей из последовательностей SEQ ID NO: 25-30; и сигнал полиаденилирования и/или последовательность поли(А).

В другом варианте осуществления настоящего изобретения предусматривают композицию, содержащую множество молекул РНК по настоящему изобретению в фармацевтически приемлемом носителе, причем по меньшей мере примерно 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более РНК в композиции содержит последовательность поли(А), которая отличается по длине не более чем на 10 нуклеотидов. В предпочтительном варианте осуществления настоящего изобретения по меньшей мере примерно 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более РНК в композиции содержат последовательность поли(А) одинаковой длины. В некоторых вариантах осуществления настоящего изобретения последовательность поли(А) расположена на 3'-конце РНК, причем никакие другие нуклеотиды не располагаются с 3'-конца относительно последовательности поли(А). В еще одном варианте осуществления настоящего изобретения предусматривают композицию, содержащую множество молекул РНК согласно описанию настоящего изобретения в фармацевтически приемлемом носителе, где указанное множество молекул РНК содержит как кэпированные, так и некэпированные РНК. Например, в некоторых аспектах композиция содержит множество молекул РНК, в которых не более 95%, 90%, 80%, 70% или 60% молекул РНК содержат кэп, а оставшиеся молекулы РНК являются некэпированными.

В настоящем изобретении также предусматривают молекулу искусственной РНК, предпочтительно молекулу искусственной молекулы мРНК или молекулу искусственной вирусной РНК, содержащую открытую рамку считывания, предпочтительно открытую рамку считывания, производную гена, который отличается от гена, от которого происходит элемент 3'-UTR и/или элемент 5'-UTR, элемент 3'-UTR, содержащий или состоящий из последовательности, которая по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере на 99%, еще более предпочтительно на 100% идентична последовательности РНК, соответствующей последовательности ДНК, выбранной из группы, состоящей из последовательностей SEQ ID NO: 1-24, и/или элемент 5'-UTR, содержащий или состоящий из последовательности, которая по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере на 99%, еще более предпочтительно на 100% идентична последовательности РНК, соответствующей последовательности ДНК, выбранной из группы, состоящей из последовательностей SEQ ID NO: 25-30; и сигнал полиаденилирования и/или последовательность поли(А).

Настоящее изобретение также предусматривает молекулу искусственной нуклеиновой кислоты, предпочтительно искусственную мРНК, которая может отличаться повышенной и/или более длительной экспрессией закодированного пептида или белка. Предположительно, повышенная стабильность экспрессии белка и, следовательно, более длительная экспрессия белка могут быть результатом уменьшения разрушения молекулы искусственной нуклеиновой кислоты, например, молекулы искусственной мРНК в соответствии с настоящим изобретением. Соответственно, элемент 3'-UTR по настоящему изобретению и/или элемент 5'-UTR по настоящему изобретению могут препятствовать разрушению искусственной нуклеиновой кислоты.

Предпочтительно, молекула искусственной нуклеиновой кислоты может дополнительно содержать гистонную структуру стебель-петля. Таким образом, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может, например, содержать в направлении от 5'-к-3' ORF, элемент 3'-UTR, необязательно последовательность гистонной структуры стебель-петля, необязательно последовательность поли(А) или сигнал полиаденилирования и необязательно последовательность поли(С), или в направлении от 5' к 3' элемент 5'-UTR, ORF, необязательно последовательность гистонной структуры стебель-петля, необязательно последовательность поли(А) или сигнал полиаденилирования и необязательно последовательность поли(С), или в направлении 5'-к-3' элемент 5'-UTR, ORF, элемент 3'-UTR, необязательно последовательность гистонной структуры стебель-петля, необязательно последовательность поли(А) или сигнал полиаденилирования и необязательно последовательность поли(С). Она также может содержать в направлении 5'-к-3' ORF, элемент 3'-UTR, необязательно последовательность поли(А), необязательно последовательность поли(С) и необязательно последовательность гистонной структуры стебель-петля или в направлении 5'-к-3' элемент 5'-UTR, ORF, необязательно последовательность поли(А), необязательно последовательность поли(С) и необязательно последовательность гистонной структуры стебель-петля, или в направлении от 5'-к-3' элемент 5'-UTR, ORF, элемент 3'-UTR, необязательно последовательность поли(А), необязательно последовательность поли(С) и необязательно последовательность гистонной структуры стебель-петля.

В предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты по настоящему изобретению включает по меньшей мере одну последовательность гистонной структуры стебель-петля.

Такие последовательности гистонной структуры стебель-петля предпочтительно выбраны из последовательностей гистонной структуры стебель-петля, описанных в WO 2012/019780, сущность которой включена в настоящее изобретение в виде ссылки.

Последовательность гистонной структуры стебель-петля, пригодную для применения в рамках настоящего изобретения, предпочтительно выбирают по меньшей мере по одной из следующих формул (I) или (II):

формула (I) (последовательность структуры стебель-петля без ограничительных элементов в части стебля):

формула (II) (последовательность структуры стебель-петля с ограничительными элементами в части стебля):

где:

ограничительные элементы в части стебля 1 или стебля 2 N1-6 представляют последовательность, включающую от 1 до 6, предпочтительно от 2 до 6, более предпочтительно от 2 до 5, еще более предпочтительно от 3 до 5, наиболее предпочтительно от 4 до 5 или 5 N, где каждый N независимо от другого представляет нуклеотид, выбранный из нуклеотидов A, U, Т, G и С или их нуклеотидных аналогов;

где

стебель 1 и стебель 2 способны к спариванию оснований друг с другом, образуя обратно-комплементарную последовательность, в которой спаривание оснований может происходить между стеблем 1 и стеблем 2, например, путем спаривания оснований по Уотсону и Крику А и U/T или G и С или не путем спаривания оснований по Уотсону и Крику, например, путем спаривания оснований по Хугстину, путем обратного спаривания оснований по Хугстину, или путем спаривания оснований друг с другом, образуя частично обратную комплементарную последовательность, где может происходить неполное спаривание оснований между стеблем 1 и стеблем 2, на основе, заключающейся в том, что одно или несколько оснований в одном стебле не имеют комплементарного основания или оснований в обратной комплементарной последовательности другого стебля.

В соответствии с еще одним предпочтительным вариантом осуществления настоящего изобретения последовательность гистонной структуры стебель-петля может быть выбрана в соответствии, по меньшей мере, с одной из следующих формул (Ia) или (IIa):

формула (Ia) (последовательность структуры стебель-петля без ограничительных элементов в части стебля):

формула (IIa) (последовательность структуры стебель-петля с ограничительными элементами в части стебля):

где

значения N, С, G, Т и U те же, что и описанные выше.

В соответствии с еще более предпочтительным вариантом осуществления настоящего изобретения, касающегося первого объекта, молекула искусственной нуклеиновой кислоты может содержать, по меньшей мере, одну последовательность гистонной структуры стебель-петля в соответствии с одной из следующих формул (Iб) или (IIб):

формула (Iб) (последовательность структуры стебель-петля без ограничительных элементов в части стебля):

формула (IIб) (последовательность структуры стебель-петля с ограничительными элементами в части стебля):

где

значения N, С, G, Т и U такие же, как и описанные выше.

Определенная предпочтительная последовательность гистонной структуры стебель-петля является последовательностью SEQ ID NO: 34: CAAAGGCTCTTTTCAGAGCCACCA или, более предпочтительно, соответствующая последовательность РНК последовательности нуклеиновой кислоты в соответствии с SEQ ID NO: 34.

В качестве примера, отдельные элементы могут присутствовать в молекуле искусственной нуклеиновой кислоты в следующем порядке:

5'-кэп - 5'-UTR (элемент) - ORF - 3'-UTR (элемент) - гистонная структура стебель-петля - последовательность поли(А)/(С);

5'-кэп - 5'-UTR (элемент) - ORF - 3'-UTR (элемент) - последовательность поли(А)/(С) - гистонная структура стебель-петля;

5'-кэп - 5'-UTR (элемент) - ORF - IRES - ORF - 3'-UTR (элемент) - гистонная структура стебель-петля - последовательность поли(А)/(С);

5'-кэп - 5'-UTR (элемент) - ORF - IRES - ORF - 3'-UTR (элемент) - гистонная структура стебель-петля - последовательность поли(А)/(С) -последовательность поли(А)/(С);

5'-кэп - 5'-UTR (элемент) - ORF - IRES - ORF - 3'-UTR (элемент) - последовательность поли(А)/(С) - гистонная структура стебель-петля;

5'-кэп - 5'-UTR (элемент) - ORF - IRES - ORF - 3'-UTR (элемент) - последовательность поли(А)/(С) - последовательность поли(А)/(С) - гистонная структура стебель-петля;

5'-кэп - 5'-UTR (элемент) - ORF - 3'-UTR (элемент) - последовательность поли(А)/(С) - последовательность поли(А)/(С);

5'-кэп - 5'-UTR (элемент) - ORF - 3'-UTR (элемент) - последовательность поли(А)/(С) - последовательность поли(А)/(С) - гистонная структура стебель-петля; и др.

В некоторых вариантах осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты содержит дополнительные элементы, например, 5'-кэп, последовательность поли (С) и/или IRES-мотив. 5'-кэп может быть добавлен во время транскрипции или после транскрипции к 5'-концу РНК. Кроме того, молекула искусственной нуклеиновой кислоты по настоящему изобретению, в частности, если нуклеиновая кислота находится в форме мРНК или кодирует мРНК, может быть модифицирована последовательностью по меньшей мере из 10 цитидинов, предпочтительно по меньшей мере из 20 цитидинов, более предпочтительно по меньшей мере из 30 цитидинов (так называемая «последовательность поли (С)»). В частности, молекула искусственной нуклеиновой кислоты по изобретению может содержать, особенно если нуклеиновая кислота находится в форме (м)РНК или кодирует мРНК, последовательность поли (С) обычно составляет примерно от 10 до 200 цитидиновых нуклеотидов, предпочтительно примерно от 10 до 100 цитидиновых нуклеотидов, более предпочтительно примерно от 10 до 70 цитидиновых нуклеотидов или еще более предпочтительно от 20 до 50 или даже от 20 до 30 цитидиновых нуклеотидов. Наиболее предпочтительно нуклеиновая кислота по настоящему изобретению содержит последовательность поли(С) из 30 остатков цитидина. Таким образом, предпочтительно, если молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением содержит, предпочтительно, в направлении 5'-3' по меньшей мере один элемент 5'-UTR согласно описанному выше, ORF, по меньшей мере один элемент 3'-UTR согласно описанному выше, последовательность поли(А) или сигнал полиаденилирования, а также последовательность поли(С) или, в направлении 5'-3', необязательно дополнительно 5'-UTR, ORF, по меньшей мере один элемент 3'-UTR согласно описанному выше, последовательность поли(А) или сигнал полиаденилирования, а также последовательность поли(С) или, в направлении 5'-3' по меньшей мере один элемент 5'-UTR согласно описанному выше, ORF, необязательно дополнительно 3'-UTR, последовательность поли(А) или сигнал полиаденилирования и последовательность поли(С).

Участок внутренней посадки рибосомы (internal ribosome entry site - IRES) или IRES-мотив может отделять несколько открытых рамок считывания, например, если молекула искусственной нуклеиновой кислоты кодирует два или более пептидов или белков. IRES-последовательность может быть особенно полезна, если молекула искусственной нуклеиновой кислоты представляет собой молекулу двух- или полицистронной нуклеиновой кислоты.

Кроме того, молекула искусственной нуклеиновой кислоты может содержать дополнительные 5'-элементы, предпочтительно промотор или промотор-содержащую последовательность. Промотор может направлять и регулировать транскрипцию молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, молекулы искусственной ДНК согласно настоящему изобретению.

Предпочтительно молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, предпочтительно открытая рамка считывания, по меньшей мере частично была модифицирована по G/C. Таким образом, молекула искусственной нуклеиновой кислоты по настоящему изобретению может быть термодинамически стабилизирована путем модификации содержания G (гуанозина)/С (цитидина) в молекуле. Содержание G/C в открытой рамке считывания молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может быть увеличено по сравнению с содержанием G/C в открытой рамке считывания соответствующей последовательности дикого типа, предпочтительно путем использования вырожденности генетического кода. Таким образом, закодированную аминокислотную последовательность молекулы искусственной нуклеиновой кислоты предпочтительно не модифицируют путем изменения содержания G/C по сравнению с закодированной аминокислотной последовательностью определенной последовательности дикого типа. Кодоны кодирующей последовательности или целой молекулы искусственной нуклеиновой кислоты, например, мРНК, поэтому может варьироваться по сравнению с кодирующей последовательностью дикого типа, таким образом, что включают повышенное количество нуклеотидов G/C, хотя транслируемая аминокислотная последовательность остается неизменной. Из-за того, что несколько кодонов кодируют одну и ту же аминокислоту (так называемое вырождение генетического кода), возможно изменение кодонов без изменения кодируемой последовательности пептида/белка (так называемое использование альтернативных кодонов). Следовательно, можно специфически интродуцировать определенные кодоны (в обмен на соответствующие кодоны дикого типа, кодирующие одну и ту же аминокислоту), которые являются более благоприятными в плане стабильности РНК и/или в плане использования кодонов у субъекта (так называемая оптимизация кодонов).

В зависимости от аминокислоты, кодируемой кодирующей областью молекулы искусственной нуклеиновой кислоты по настоящему изобретению, существуют различные возможности для модификации последовательности нуклеиновой кислоты, например, открытой рамки считывания, по сравнению с областью кодирования дикого типа. В случае аминокислот, которые кодируются кодонами, содержащими исключительно нуклеотиды G или С, модификации кодона не требуется. Таким образом, кодоны для Pro (ССС или CCG), Arg (CGC или CGG), Ala (GCC или GCG) и Gly (GGC или GGG) не требуют модификации, поскольку они не содержат А или U/T.

Напротив, кодоны, которые содержат нуклеотиды А и/или U/T могут быть модифицированы путем замены других кодонов, которые кодируют одни и те же аминокислоты, но не содержат А и/или U/T. Например:

кодоны Pro СС(UT) или ССА могут быть заменены на ССС или CCG;

кодоны Arg CG(U/T), или CGA, или AGA, или AGG могут быть заменены на CGC или CGG;

кодоны Ala GC(U/T) или GCA могут быть заменены на GCC или GCG;

кодоны Gly GG(U/T) или GGA могут быть заменены на GGC или GGG.

В других случаях, хотя нуклеотиды А или (U/T) не могут быть элиминированы из кодонов, однако можно уменьшить содержание А и (U/T) с использованием кодонов, которые содержат меньше нуклеотидов А и/или (U/T). Примерами являются:

кодоны Phe (U/T)(U/T)(U/T) могут быть заменены на (U/T) (U/T)C;

кодоны Leu (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) или C(U/T)A могут быть заменены на C(U/T)C или C(U/T)G;

кодоны Ser (U/T)C(U/T), или (U/T)CA, или AG(U/T) могут быть заменены на (U/T)CC, (U/T)CG или AGC;

кодон Tyr (U/T)A(U/T) может быть заменен на (U/T)AC;

кодон Cys (U/T)G(U/T) может быть заменен на (U/T)GC;

кодон His CA(U/T) может быть заменен на САС;

кодон Gln САА может быть заменен на CAG;

кодоны Ile A(U/T)(U/T) или А(U/Т)А могут быть заменены на A(U/T)C;

кодоны Thr AC(U/T) или АСА могут быть заменены на АСС или ACG;

кодон Asn AA(U/T) может быть заменен на ААС;

кодон Lys AAA может быть заменен на AAG;

кодоны Val G(U/T)(U/T) или G(U/T)A могут быть заменены на G(U/T)C или G(U/T)G;

кодон Asp GA(U/T) может быть заменен на GAC;

кодон Glu GAA может быть заменен на GAG;

стоп-кодон (U/T)AA может быть заменен на (U/T)AG или (U/T)GA.

Для кодонов Met (A(U/T)G) и Trp ((U/T)GG) не существует возможности изменения последовательности нуклеотидов без изменения закодированной аминокислоты.

Замещения, перечисленные выше, можно использовать отдельно или во всех возможных комбинациях для увеличения содержания G/C в открытой рамке считывания молекулы искусственной нуклеиновой кислоты согласно описанному выше, по сравнению с соответствующей открытой рамкой считывания дикого типа (то есть исходной последовательностью). Так, например, все кодоны Thr, встречающиеся в последовательности дикого типа, могут быть модифицированы в АСС (или ACG).

Предпочтительно содержание G/C в открытой рамке считывания молекулы искусственной нуклеиновой кислоты по настоящему изобретению согласно описанному выше, увеличивается по меньшей мере на 7%, более предпочтительно по меньшей мере на 15%, особенно предпочтительно по меньшей мере на 20% по сравнению с G/C в кодирующей области дикого типа без изменения закодированной аминокислотной последовательности, то есть за счет использования вырожденности генетического кода В одном из вариантов осуществления настоящего изобретения, по меньшей мере, 5%, 10%, 20%, 30%, 40%, 50%, 60%, более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90%, 95% или даже 100% замещаемых кодонов в открытой рамке считывания молекулы искусственной нуклеиновой кислоты по настоящему изобретению или ее фрагмента, варианта или производного замещены, в результате чего содержание G/C в открытой рамке считывания увеличивается.

В этом контексте особенно предпочтительно увеличить содержание G/C в открытой рамке считывания молекулы искусственной нуклеиновой кислоты по настоящему изобретению до максимума (т.е. до 100% замещаемых кодонов) по сравнению с открытой рамкой считывания дикого типа без изменения закодированной аминокислотной последовательности.

Кроме того, открытая рамка считывания предпочтительно, по меньшей мере, частично оптимизирована по кодонам. Оптимизация по кодонам основана на том, что эффективность трансляции может быть определена путем другой частоты присутствия транспортной РНК (тРНК) в клетках. Таким образом, если так называемые «редкие кодоны» присутствуют в кодирующей области молекулы искусственной нуклеиновой кислоты по настоящему изобретению в большей степени, трансляция с соответствующей модифицированной последовательности нуклеиновой кислоты менее эффективна, чем в том случае, когда присутствуют кодоны, кодирующие относительно «частые» тРНК.

Таким образом, открытая рамка считывания молекулы искусственной нуклеиновой кислоты по настоящему изобретению предпочтительно модифицирована по сравнению с соответствующей кодирующей областью дикого типа таким образом, что по меньшей мере один кодон последовательности дикого типа, который соответствует тРНК, которая относительно редко встречается в клетке, обменивают на кодон, который соответствует тРНК, которая сравнительно часто встречается в клетке и несет ту же самую аминокислоту, что и относительно редкая тРНК. Благодаря такой модификации открытую рамку считывания молекулы искусственной нуклеиновой кислоты по настоящему изобретению модифицируют таким образом, что кодоны, для которых имеются часто встречающиеся тРНК, могут быть заменены кодонами, которые соответствуют редким тРНК. Другими словами, в соответствии с настоящим изобретением посредством такой модификации все кодоны открытой рамки считывания дикого типа, которые кодируют редкую тРНК, могут быть заменены на кодоны, которые соответствуют тРНК, которая чаще встречается в клетке и которая несет ту же аминокислоту, что и редко встречающаяся тРНК. Какие тРНК встречаются относительно часто в клетке и какие, напротив, встречаются относительно редко, известно специалистам в данной области (см., например, Akashi, Curr. Opin. Genet. Dev. 11(6), 2001, 660-666). Соответственно предпочтительно, чтобы открытая рамка считывания была оптимизирована по кодонам, предпочтительно в отношении системы, в которой молекула искусственной нуклеиновой кислоты согласно настоящему изобретению должна экспрессироваться, предпочтительно по отношению к системе, в которой молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением должна транслироваться. Предпочтительно использование кодонов в открытой рамке считывания оптимизируют по кодонам в соответствии с использованием кодонами млекопитающих, более предпочтительно в соответствии с кодонами человека. Предпочтительно, если открытая рамка считывания оптимизирована по кодонам и модифицирована по содержанию G/C.

Для дальнейшего повышения устойчивости к разрушению, например, устойчивости к разрушению in vivo (или in vitro, в соответствии с описанным выше) экзо- или эндонуклеазой, и/или для дальнейшего улучшения стабильности экспрессии белка с молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, молекула искусственной нуклеиновой кислоты может дополнительно содержать модификации, например, модификации сахара и/или модификации основания, например, модификации липидов или другие. Предпочтительно, транскрипция и/или трансляция молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением существенно не ухудшаются при осуществлении указанных модификаций.

Обычно, молекула искусственной нуклеиновой кислоты по настоящему изобретению может включать какой-либо нативный (природный) нуклеотид, например, гуанозин, урацил, аденозин и/или цитозин или их аналог. В этом отношении нуклеотидные аналоги рассматривают в качестве нативных и неприродных вариантов встречающихся в природе нуклеотидов аденозина, цитозина, тимидина, гуанозина и уридина. Соответственно, аналоги представляют собой, например, химически дериватизированные нуклеотиды с неприродными функциональными группами, которые предпочтительно добавляют или удаляют из природного нуклеотида, или которыми заменяют природные функциональные группы нуклеотида. Соответственно, каждый компонент природного нуклеотида может быть модифицирован, а именно компонент основания, компонент сахара (рибозы) и/или компонент фосфата, которые формируют каркас последовательности РНК (см. выше). Аналоги гуанозина, уридина, аденозина, тимидина и цитозина включают, без каких-либо ограничений, какие-либо изначально встречающиеся или не встречающиеся в природе гуанозин, уридин, аденозин, тимидин или цитозин, которые были изменены, например, химически, например, путем ацетилирования, метилирования, гидроксилирования и т.д.; к таким аналогам относятся 1-метиладенозин, 1-метилгуанозин, 1-метилинозин, 2,2-диметилгуанозин, 2,6-диаминопурин, 2'-амино-2'-дезоксиаденозин, 2'-амино-2'-дезоксицитидин, 2'-амино-2'-дезоксигуанозин, 2'-амино-2'-дезоксиуридин, 2-амино-6-хлорпуринрибозид, 2-аминопуринрибозид, 2'-арааденозин, 2'-арацитидин, 2'-арауридин, 2'-азидо-2'дезоксиаденозин, 2'-азидо-2'-дезоксицитидин, 2'-азидо-2'-дезоксигуанозин, 2'-азидо-2'-дезоксиуридин, 2-хлораденозин, 2'-фтор-2'-дезоксиаденозин, 2'-фтор-2'-дезоксицитидин, 2'-фтор-2'-дезоксигуанозин, 2'-фтор-2'-дезоксиуридин, 2'-фтортимидин, 2-метиладенозин, 2-метилгуанозин, 2-метилтио-N6-изопенениладенозин, 2'-O-метил-2-аминоаденозин, 2'-O-метил-2'-дезоксиаденозин, 2'-O-метил-2'-дезоксицитидин, 2'-O-метил-2'-дезоксигуанозин, 2'-O-метил-2'-дезоксиуридин, 2'-O-метил-5-метилуридин, 2'-О-метилинозин, 2'-О-метилпсевдоуридин, 2-тиоцитидин, 2-тиоцитозин, 3-мметилцитозин, 4-ацетилцитозин, 4-тиоуридин, 5-(карбоксигидроксиметил)урацил, 5,6-дигидроуридин, 5-аминоаллилцидин, 5-аминоаллилдезоксиуридин, 5-бромуридин, 5-карбоксиметиламинометил-2-тио-урацил, 5-карбоксиметиламинометилурацил, 5-хлор-ара-цитозин, 5-фтор-уридин, 5-иодуридин, 5-метоксикарбонилметил-уридин, 5-метокси-уридин, 5-метил-2-тиоуридин, 6-азацитидин, 6-азауридин, 6-Хлор-7-дезазагуанозин, 6-хлорпуринрибозид, 6-меркапто-гуанозин, 6-метилмеркаптопуринрибозид, 7-деаза-2'-дезоксигуанозин, 7-деазааденозин, 7-метилгуанозин, 8-азааденозин, 8-бромаденозин, 8-бромгуанозин, 8-меркаптогуанозин, 8-оксогуанозин, бензимидазолрибозид, бета-D-маннозил- квеозин, дигидроурацил, инозин, N1-метиладенозин, N6-([6-аминогексил] карбамоилметил)аденозин, N6-изопентенил-аденозин, N6-метил-аденозин, N7-метил-ксантозин, метиловый эфир N-урацил-5-оксиуксусной кислоты, пуромицин, квеозин, урацил-5-оксиуксусная кислота, метиловый эфир Урацил-5-оксиуксусной кислоты сложный эфир, вибутоксозин, ксантозин и ксилоаденозин. Получение таких аналогов известно специалисту в данной области, например, из патентов US 4373771, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4976779, US 5047524, US 5131418, US 533319, US 5262530 и US 5700642. В случае описанных выше аналогов определенное предпочтение может быть отдано в соответствии с некоторыми вариантами осуществления настоящего изобретения тем аналогам, которые увеличивают экспрессию кодируемого белка или пептида, или которые увеличивают иммуногенность молекулы искусственной нуклеиновой кислоты по настоящему изобретению и/или не мешают дополнительной модификации молекулы искусственной нуклеиновой кислоты, которая была интродуцирована.

В соответствии с определенным вариантом осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты по настоящему изобретению может содержать липидную модификацию.

В предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты содержит, предпочтительно, в направлении от 5' к 3' следующие элементы:

элемент 5'-UTR, который продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, предпочтительно с последовательности нуклеиновой кислоты какой-либо из последовательностей SEQ ID NO: 25-30 и SEQ ID NO: 319-338, более предпочтительно 5'-UTR МР68 или NDUFA4; или дополнительно 5'-UTR, предпочтительно 5'-ТОР UTR;

по меньшей мере одну открытую рамку считывания (ORF), причем ORF предпочтительно включает, по меньшей мере, одну модификацию относительно последовательности дикого типа;

элемент 3'-UTR, который продлевает и/или повышает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, предпочтительно с последовательности нуклеиновой кислоты какой-либо из SEQ ID NO: 1-24 и SEQ ID NO: 49-318, более предпочтительно 3'-UTR из GNAS, MORN2, GSTM1, NDUFA1, CBR2, YBX1, NDUFB8, или CNTN1; или дополнительно 3'-UTR, предпочтительно 3'-UTR albumin7;

последовательность поли(А), предпочтительно включающая 64 аденилата;

последовательность поли(С), предпочтительно включающая 30 цитидилатов;

последовательность гистонной структуры стебель-петля.

В другом предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты включает или состоит из нуклеотидной последовательности, выбранной из группы, состоящей из последовательностей нуклеиновой кислоты SEQ ID NO: 36-40, SEQ ID NO: 42 и 43, SEQ ID NO: 45-48 и SEQ ID NO: 384-388 (см. фиг. 2-6, фиг. 8, 9, 11, фиг. 19-21 и фиг. 26-30), или комплементарной последовательности ДНК.

В особенно предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты по настоящему изобретению может дополнительно включать одну или несколько модификаций, описанных ниже:

Химические модификации:

В контексте настоящего изобретения понятие «модификация», используемое в настоящем изобретении в отношении молекулы искусственной нуклеиновой кислоты, может относиться к химическим модификациям, включающим модификации каркаса молекулы, а также модификации сахара или модификации основания.

В этом контексте молекула искусственной нуклеиновой кислоты, предпочтительно молекула РНК по настоящему изобретению, может содержать нуклеотидные аналоги/модификации, например, модификации каркаса молекулы, модификации сахара или модификации основания. Модификация каркаса молекулы в связи с настоящим изобретением представляет модификацию, в которой фосфаты каркаса молекулы из нуклеотидов, содержащихся в молекуле нуклеиновой кислоты согласно описанному выше, являются химически модифицированными. Модификация сахара в связи с настоящим изобретением представляет собой химическую модификацию сахара нуклеотидов молекулы нуклеиновой кислоты согласно описанию настоящего изобретения. Кроме того, модификация оснований в связи с настоящим изобретением представляет химическую модификацию основной части из нуклеотидов молекулы нуклеиновой кислоты. В этом контексте нуклеотидные аналоги или модификации предпочтительно выбирают из нуклеотидных аналогов, которые применимы для транскрипции и/или трансляции.

Модификации сахаров

Модифицированные нуклеозиды и нуклеотиды, которые могут быть инкорорированы в молекулу искусственной нуклеиновой кислоты, предпочтительно РНК, согласно описанному в настоящем изобретении, могут быть модифицированы в части молекулы, представленной сахаром. Например, 2'-гидроксильная группа (ОН) молекулы РНК может быть модифицирована или замещена несколькими различными «окси» или «дезокси» заместителями. Примеры модификаций «окси»-2' гидроксильной группы включают, но ими перечень не ограничивается, алкокси или арилокси (-OR, например, R=Н, алкил, циклоалкил, арил, аралкил, гетероарил или сахар); полиэтиленгликоли (ПЭГ), -O(CH2CH2O)nCH2CH2OR; «закрытые» нуклеиновые кислоты («locked» nucleic acids - LNA), в которых 2'-гидроксил соединен, например, метиленовым мостиком с 4'-углеродом того же рибозного сахара; и аминогруппы (-О-амино, где аминогруппа, например, NRR, может представлять собой алкиламино, диалкиламино, гетероциклил, ариламино, диариламино, гетероариламино или дигетероарил амино, этилендиамин, полиамино) или аминоалкокси.

Модификации «дезокси» включают водород, амино (например, NH2, алкиламино, диалкиламино, гетероциклил, ариламино, диариламино, гетероариламино, дигетероарил амино или аминокислоту); или аминогруппа может быть присоединена к сахару через линкер, где линкер содержит один или несколько атомов С, N и О.

Группа сахара также может содержать один или несколько атомов углерода, которые имеют противоположную стереохимическую конфигурацию, чем конфигурация соответствующего углерода в рибозе. Таким образом, модифицированная молекула нуклеиновой кислоты может включать нуклеотиды, содержащие в качестве сахара, например, арабинозу.

Модификации каркаса молекул

Фосфатный каркас молекулы может быть дополнительно модифициран в модифицированных нуклеозидах и нуклеотидах, которые могут быть включены в молекулу искусственной нуклеиновой кислоты, предпочтительно в РНК согласно описанию настоящего изобретения. Фосфатные группы каркаса молекулы могут быть модифицированы путем замены одного или нескольких атомов кислорода на другой заместитель. Кроме того, модифицированные нуклеозиды и нуклеотиды могут включать полную замену немодифицированных фосфатных частей молекулы на модифицированные фосфаты согласно описанию настоящего изобретения. Примеры модифицированных фосфатных групп включают, но ими перечень не ограничивается, фосфоротиоат, фосфороселенаты, боранофосфаты, сложные эфиры боранофосфата, гидрогенфосфанаты, фосфороамидаты, алкил- или арилфосфонаты и фосфотриэфиры. Фосфородитиоаты имеют два несвязывающих кислорода, замещенных серой. Фосфатный линкер также может быть модифицирован заменой связующего кислорода азотом (связующие фосфороамидаты), серой (связующие фосфоротиоаты) и углеродом (связующие метиленфосфонаты).

Модификации оснований

Модифицированные нуклеозиды и нуклеотиды, которые могут быть инкорпорированы в молекулу искусственной нуклеиновой кислоты, предпочтительно молекулу РНК по описанию настоящего изобретения, могут быть дополнительно модифицированы в части нуклеиновых оснований. Примеры нуклеиновых оснований, обнаруженных в РНК, включают, но ими перечень не ограничивается, аденин, гуанин, цитозин и урацил. Например, нуклеозиды и нуклеотиды, описанные в настоящем изобретении, могут быть химически модифицированы на поверхности большой канавки. В некоторых вариантах осуществления настоящего изобретения химические модификации большой канавки могут включать аминогруппу, тиольную группу, алкильную группу или галогеновую группу.

В особенно предпочтительных вариантах осуществления настоящего изобретения нуклеотидные аналоги/модификации выбирают из модификаций оснований, которые предпочтительно выбирают из 2-амино-6-хлорпуринерибозид-5'-трифосфата, 2-аминопуринрибозид-5'-трифосфата, 2-аминоаденозин-5'-трифосфата, 2'-амино-2'-дезоксицитидинтрифосфата, 2-тиоцитидин-5'-трифосфата, 2-тиоуридин-5'-трифосфата, 2'-фтортимидин-5'-трифосфата, 2'-O-метилинозин-5'-трифосфата, 4-тиоуридин-5'-трифосфата, 5-аминоаллилцидин-5'-трифосфата, 5-аминоаллилуридин-5'трифосфата, 5-бромцитидин-5'-трифосфата, 5-бромуридин-5'-трифосфата, 5-бром-2'-дезоксицитидин-5'-трифосфата, 5-бром-2'-дезоксиуридин-5'-трифосфата, 5-иодцитидин-5'-трифосфата, 5-иод-2'-дезоксицитидин-5'-трифосфата, 5-йодоридин-5'-трифосфата, 5-йод-2'-дезоксиуридин-5'-трифосфата, 5-метилцитидин-5'-трифосфата, 5-метилуридин-5'-трифосфата, 5-пропинил-2'-дезоксицитидин-5'-трифосфата, 5-пропинил-2'-дезоксиуридин-5'-трифосфата, 6-азацитидин-5'-трифосфата, 6-азауридин-5'-трифосфата, 6-хлорпуринергибозид-5'-трифосфата, 7-деазаэденозин-5'-трифосфата, 7-дезагагуанозин-5'-трифосфата, 8-азааденозин-5'-трифосфата, 8-азидоаденозин-5'-трифосфата, бензимидазол-рибозид-5'-трифосфата, N1-метиладенозин-5'-трифосфата, N1-метилгуанозин-5'-трифосфата, N6-метиладенозин-5'-трифосфата, O6-метилгуанозин-5'-трифосфата, псевдоуридин-5'-трифосфат или пуромицин-5'-трифосфат, ксантозин-5'-трифосфат. Особое предпочтение отдают нуклеотидам с модифицированными основаниями, выбранными из группы нуклеотидов с модифицированными основаниями, состоящими из 5-метилцитидин-5'-трифосфата, 7-дезазагуанозин-5'-трифосфата, 5-бромцитидин-5'-трифосфата и псевдоуридин-5'-трифосфата.

В некоторых вариантах осуществления настоящего изобретения модифицированные нуклеозиды включают пиридин-4-он рибонуклеозид, 5-аза-уридин, 2-тио-5-аза-уридин, 2-тиоуридин, 4-тио-псевдоуридин, 2-тио-псевдоуридин, 5-гидроксиуридин, 3-метилуридин, 5-карбоксиметил-уридин, 1-карбоксиметил-псевдоуридин, 5-пропинил-уридин, 1-пропинил-псевдоуридин, 5-тауринометилуридин, 1-тауринометил-псевдоуридин, 5-тауринометил-2-тиоуридин, 1-тауринометил-4-тиоуридин, 5-метил-уридин, 1-метил-псевдоуридин, 4-тио-1-метил-псевдоуридин, 2-тио-1-метил-псевдуридин, 1-метил-1-деаза-псевдоуридин, 2-тио-1-метил-1-деаза-псевдоуридин, дигидроуридин, дигидропсевдоуридин, 2-тиодигидроуридин, 2-тиодигидропсудуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метокси-псевдуридин и 4-метокси-2-тио-псевдоуридин.

В некоторых вариантах осуществления настоящего изобретения модифицированные нуклеозиды включают 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метилпсевдоизоцитидин, пирролоцитидин, пирролопсевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тио-псевдоизоцитидин, 4-тио-1-метил-псевдоизоцитидин, 4-тио-1-метил-1-деаза-псевдоизоцитидин, 1-метил-1-дезазапсевдоизоцитидин, зебуларин, 5-азазебуларин, 5-метил-зебуларин, 5-аза-2-тио-зебуларин, 2-тиозебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метоксипсевдоизоцитидин и 4-метокси-1-метил-псевдоизоцитидин.

В других вариантах осуществления настоящего изобретения модифицированные нуклеозиды включают 2-аминопурин, 2,6-диаминопурин, 7-деазааденин, 7-дезаза-8-азааденин, 7-дезаза-2-аминопурин, 7-дезаза-8-аза-2-аминопурин, 7-дезаза-2,6-диаминопурин, 7-дезаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6-(цис-гидроксиизопентенил)аденозин, 2-метилтио-N6-(цисгидроксиизопентенил)аденозин, N6-глицинилкарбамоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6, N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин и 2-метоксиаденин.

В других вариантах осуществления настоящего изобретения модифицированные нуклеозиды включают инозин, 1-метилинозин, виозин, вибутозин, 7-дезазагуанозин, 7-дезаза-8-азагуанозин, 6-тиогуанозин, 6-тио-7-дезазагуанозин, 6-тио-7-дезаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2,N2-диметилгуанозин, 8-оксогуанозин, 7-метил-8-оксогуанозин, 1-метил-6-тиогуанозин, N2-метил-6-тиогуанозин и N2,N2-диметил-6-тиогуанозин.

В некоторых вариантах осуществления настоящего изобретения нуклеотид может быть модифицирован на поверхности большой канавки и может включать замену водорода по С-5 урацила метильной группой или галогеновой группой.

В некоторых вариантах осуществления настоящего изобретения модифицированный нуклеозид представляет 5'-O-(1-тиофосфат)аденозин, 5'-O-(1-тифосфат)цитидин, 5'-O-(1-тифосфат)гуанозин, 5'-O-(1-тифосфат)уридин или 5'-O-(1-тиофосфат)псевдоуридин.

В других вариантах осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты, предпочтительно молекула РНК, может содержать модификации нуклеозидов, выбранные из 6-аза-цитидина, 2-тиоцитидина, альфа-тиоцитидина, псевдоизотицитидина, 5-аминоаллилуридина, 5-йодуриди, N1-метилпсевдоуридина, 5,6-дигидроуридина, альфа-тиоуридина, 4-тиоуридина, 6-азауридина, 5-гидроксиуридина, дезокситимидина, 5-метилуридина, пирролоцитидина, инозина, альфа-тиогуанозина, 6-метилгуанозин, 5-метилцитидина, 8-оксогуанозина, 7-дезазагуанозина, N1-метиладенозина, 2-амино-6-хлор-пурина, N6-метил-2-аминопурина, псевдоизоцитидина, 6-хлорпурина, N6-метиладенозина, альфа-тиоаденозина, 8-азидоаденозина, 7-дезазааденозина.

Модификации липидов

В еще одном из вариантов осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты, предпочтительно РНК согласно описанному выше может содержать липидную модифицированные липиды. Такая липид-модифицированная РНК обычно представляет РНК по настоящему изобретению. Такая модифицированная липидом молекула РНК по настоящему изобретению обычно дополнительно содержит, по меньшей мере, один линкер, ковалентно связанный с такой молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером. В другом варианте осуществления настоящего изобретения модифицированная липидом РНК представляет по меньшей мере одну молекулу РНК по настоящему изобретению и по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с такой молекулой РНК. Согласно третьему варианту молекула РНК, модифицированная липидом, представляет молекулу искусственной нуклеиновой кислоты, предпочтительно молекулу РНК по настоящему изобретению, по меньшей мере один линкер, ковалентно связанный с молекулой РНК и по меньшей мере один липид, ковалентно связанный с соответствующим линкером, а также, по меньшей мере, один (бифункциональный) липид, ковалентно связанный (без линкера) с такой молекулой РНК. В этом контексте особенно предпочтительно, чтобы липидная модификация присутствовала на концах линейной последовательности РНК.

Модификация 5'-конца модифицированной РНК

В другом предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты, предочтительно молекула РНК по настоящему изобретению может быть модифицирована путем добавления так называемой структуры «5' САР (5'-кэп)».

Структура 5'-кэп обычно представляет модифицированную нуклеотидную структуру, которая обычно «накрывает» 5'-конец зрелой мРНК. Структура 5'-кэп обычно может быть образована модифицированным нуклеотидом, в частности, производным гуанинового нуклеотида. Предпочтительно структура 5'-кэп связана с 5'-концом через 5'-5'-трифосфатную связь. Структура 5'-кэп может быть метилирована, например, m7GpppN, где N представляет собой концевой 5'-нуклеотид нуклеиновой кислоты, несущий 5'-кэп, обычно 5'-конец РНК. m7GpppN представляет структуру 5'-кэп, которая естественным образом встречается в мРНК, транскрибируемой полимеразой II, и поэтому не рассматривается в качестве модификации, содержащейся в модифицированной РНК по настоящему изобретению. Это означает, что молекула искусственной нуклеиновой кислоты, предпочтительно молекула РНК, в соответствии с настоящим изобретением может содержать m7GpppN в виде структуры 5'-кэп, но дополнительно молекула искусственной нуклеиновой кислоты, предпочтительно молекула РНК, содержит по меньшей мере одну дополнительную модификацию по настоящему изобретению.

К другим примерам стпуктур 5'-кэп относятся глицерил, инвертированный дезоксиабазиновый остаток (часть молекулы), 4',5'-метиленовый нуклеотид, 1-(бета-D-эритрофуранозил)нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситный нуклеотид, L-нуклеотиды, альфа-нуклеотид, модифицированное основание нуклеотида, трео-пентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный фрагмент без азотистого основания, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный фрагмент без азотистого основания, 1,4-бутандиолфосфат, 3'-фосфорамидат, гексилфосфат, аминогексилфосфат, 3'-фосфат, 3'-фосфоротиоат, фосфородитиоат или связующий или несвязующий метилфосфонатный фрагмент. Эти модифицированные структуры 5'-кэп рассматривают в качестве по меньшей мере одной модификации, представляющей молекулу искусственной нуклеиновой кислоты, предпочтительно молекулу РНК в соответствии с настоящим изобретением.

Особенно предпочтительными модифицированными структурами 5'-CAP являются САР1 (метилирование рибозы соседнего нуклеотида от m7G), САР2 (метилирование рибозы второго нуклеотида ниже по цепи от m7G), САР3 (метилирование рибозы 3-го нуклеотида ниже по цепи от m7G), САР4 (метилирование рибоза 4-го нуклеотида ниже по цепи от m7G), ARCA (антиреверсный аналог САР), модифицированный ARCA (например, модифицированный фосфотиоатом ARCA), инозин, N1-метилгуанозин, 2'-фторгуанозин, 7-дезаза-гуанозин, 8-оксо-гуанозин, 2-аминогуанозин, LNA-гуанозин и 2-азидогуанозин.

В предпочтительном варианте осуществления настоящего изобретения по меньшей мере одна открытая рамка считывания кодирует терапевтический белок или пептид. В другом варианте осуществления настоящего изобретения антиген кодируется по меньшей мере одной открытой рамкой считывания, например, патогенный антиген, опухолевый антиген, аллергенный антиген или аутоиммунный антиген. В этом случае введение молекулы искусственной нуклеиновой кислоты, кодирующей антиген, используют в методе генетической вакцинации против заболевания, включающего указанный антиген.

В другом варианте осуществления настоящего изобретения антитело или антигенспецифичный Т-клеточный рецептор или его фрагмент кодируются по меньшей мере одной открытой рамкой считывания молекулы искусственной нуклеиновой кислоты согласно настоящему изобретению.

Антигены

Патогенные антигены

Молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением может кодировать белок или пептид, который включает патогенный антиген или его фрагмент, вариант или их производное. Такие патогенные антигены производны от патогенных организмов, в частности бактериальных, вирусных или протозойных (многоклеточных) патогенных организмов, которые вызывают иммунологическую реакцию у субъекта, в частности субъекта млекопитающих, в частности человека. Точнее, патогенные антигены предпочтительно представляют собой поверхностные антигены, например, белки (или фрагменты белков, например внешнюю часть поверхностного антигена), расположенные на поверхности вируса, или бактерии, или простейшего.

Патогенными антигенами являются пептидные или белковые антигены, предпочтительно полученные от патогена, связанного с инфекционным заболеванием, которые предпочтительно выбирают из антигенов, полученных от патогенов Acinetobacter baumannii, Anaplasma genus, Anaplasma phagocytophilum, Ancylostoma braziliense, Anapylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, из рода Aspergillus, Astroviridae, из рода Babesia, Bacillus anthracis, Bacillus cereus, Bartillella henselae, вируса BK, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, Borrelia, Borrelia spp., из рода Brucella, Brugia malayi, Bunyaviridae, Burkholderia cepacia и других видов Burkholderia, Burkholderia mallei, Burkholderia pseudomallei, из семейства Caliciviridae, из рода Campylobacter, Candida albicans, Candida spp., Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, прионов CJD, Clonorchis sinensis, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp., Clostridium tetani, Coccidioides spp., коронавирусов, Corynebacterium diphtheriae, Coxiella burnetii, вируса крымско-конгской геморрагической лихорадки, Cryptococcus neoformans, Cryptosporidium, цитомегаловируса (CMV), вирусов денге (DEN-1, DEN-2, DEN-3 и DEN-4), Dientamoeba fragilis, вируса эболы (EBOV), из рода Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, из рода Ehrlichia, Entamoeba histolytica, из рода Enterococcus, из рода энтеровирусов, преимущественно вируса Коксаки А и энтеровируса 71 (EV71), Epidermophyton spp., вируса Эпштейна-Барра (EBV), Escherichia coli O157: Н7, О111 и О104: Н4, Fasciola hepatica и Fasciola gigantica, приона FFI, из суперсемейства Filarioidea, от флавивирусов, Francisella tularensis, из рода Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp., от приона GSS, вируса Guanarito, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, Henipavirus (вируса Hendra, вируса Nipah), вируса гепатита А, вируса гепатита (HBV), вируса гепатита (HCV), вируса гепатита D, вируса гепатита Е, вируса простого герпеса 1 и 2 (HSV-1 и HSV-2), Histoplasma capsulatum, ВИЧ (вирус иммунодефицита человека), Hortaea werneckii, Human bocavirus (HBoV), вируса герпеса человека 6 (HHV-6) и вируса герпеса человека 7 (HHV-7), Human metapneumovirus (hMPV), Human papillomavirus (HPV), вируса Human parainfluenza (HPIV), вируса Japanese encephalitis, вируса JC, вируса Junin, Kingella kingae, Kelbsiella granulomatis, приона куру, вируса Ласса, Legionella pneumophila, из рода Leishmania, из рода Leptospira, Listeria monocytogenes, вируса Lymphocytic choriomeningitis virus (LCMV), вируса Machupo, вируса Malassezia spp., вируса марбург, вируса кори, Metagonimus yokagawai, Microsporidia phylum, Molluscum contagiosum virus (вируса контагиозного вируса - MCV), вируса свинки (Mumps virus), Mycobacterium leprae и Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp., Onchocerca volvulus, Orientia tsutsugamushi, Orthomyxoviridae {Influenza), Paracoccidioides brasiliensis, Paragonimus spp., Paragonimus westermani, парвовируса В19, из рода Pasteurella, из рода Plasmodium, Pneumocystis jirovecii, полиовируса, вируса бешенства, респираторного синцитиального вируса (Respiratory syncytial virus - RSV), Rhinovirus, риновирусов, риноцирусы, Rickettsia akari, Rickettsia genus, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, вируса лихорадки долины Рифт, ротавируса, вируса краснухи, вируса Сабии, из рода Salmonella, Sarcoptes scabiei, коронавируса SARS, из рода Schistosoma, из рода Shigella, вируса Sin Nombre, хантавируса, Sporothrix schenckii, из рода Staphylococcus, из рода Staphylococcus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, из рода Taenia, Taenia solium, вируса клещевого энцефалита (Tick-borne encephalitis virus - TBEV), Toxocara canis или Toxocara cati, Toxoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp., Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, вируса ветряной оспы (Varicella zoster virus - VZV), Variola major или Variola minor (вирусы черной оспы), приона vCJD, вируса венесуэльского энцефалита лошадей, Vibrio cholerae, вируса Западного Нила, вируса западного энцефалита лошадей, Wuchereria bancrofti, вируса желтой лихорадки, Yersinia enterocolitica, Yersinia pestis и Yerinia pseudotuberculosis.

Опухолевые антигены

В другом варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты по настоящему изобретению может кодировать белок или пептид, который представляет белок или пептид, включающий опухолевый антиген, фрагмент, вариант или производное указанного опухолевого антигена, предпочтительно, где опухолевый антиген является специфичным для меланоцитов антигеном, антигеном рака семенников или опухолеспецифичным антигеном, предпочтительно антигеном СТ-Х, не-ХСТ-антигеном, связующим партнером для антигена СТ-Х или связующим партнером для не-Х-СТ-антигена или опухолеспецифичным антигеном, более предпочтительно антигеном СТ-Х, связующий партнером для не-Х-СТ-антигена или опухолеспецифичного антигена или фрагмента, варианта или производного указанного опухолевого антигена; причем каждая из последовательностей нуклеиновой кислоты кодирует другой пептид или белок; по меньшей мере одна из последовательностей нуклеиновой кислоты кодирует 5Т4, 707-АР, 9D7, AFP, AlbZIP HPG1, альфа-5-бета-1-интегрин, альфа-5-бета-6-интегрин, альфа-актинин-4/м, альфа-метилацил-кофермент А рацемаза, ART-4, ARTC1/m, В7Н4, BAGE-1, BCL-2, bcr/abl, бета-катенин/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, CA 19-9, CA72-4, CA125, карлетикулин, CAMEL, CASP-8/m, катепсин В, катепсин L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, coactosin-подобный белок, коллаген XXIII, COX-2, CT-9/BRD6, Cten, циклин B1, циклин D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, гепсин, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, гомеобокс NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, незрелый рецептор ламинина, калликреин-2, калликреин-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, маммаглобин A, MART-1/melan-A, MART-2, MART-2/m, белок матрикса 22, MC1R, M-CSF, ME1/m, мезотелин, MG50/PXDN, MMP11, MN/CA IX-антиген, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, класс I/m миозина, NA88-A, N-ацетилглюкозаминилтрансфераза-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, остеокальцин, остеопонтин, p15, p190 minor bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PAP, PART-1, PATE, PDEF, Pim-1-Kinase, Pin-1, Pml/PARalpha, POTE, PRAME, PRDX5/m, простеин, протеиназа-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP-1, сурвивин, сурвивин-2В, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGFbeta, TGFbetaRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, тирозиназа, UPA, VEGFR1, VEGFR-2/FLK-1, WT1 и идиотин иммуноглобулина лимфоидных клеток крови или идиотии рецептора Т-клеток лимфоидных клеток крови, или фрагмент, или вариант, или производное указанного опухолевого антигена; предпочтительно сурвивин или его гомолог, антиген из семейства MAGE, или его связующий партнер, или фрагмент, вариант или производное указанного опухолевого антигена. Особенно предпочтительными в этом контексте являются опухолевые антигены NY-ESO-1, 5Т4, MAGE-C1, MAGE-C2, Сурвивин, Muc-1, PSA, PSMA, PSCA, STEAP и РАР.

В предпочтительном варианте осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты кодирует белок или пептид, который представляет терапевтический белок или его фрагмен, вариант или производное.

В настоящем изобретении терапевтические белки являются пептидами или белками, которые полезны для лечения какого-либо наследственного или приобретенного заболевания или которые улучшают состояние индивидуума. В частности, терапевтические белки играют важную роль при разработке терапевтических агентов, которые могут модифицировать и репарировать генетические ошибки, разрушать раковые клетки или инфицированные патогеном клетки, лечить расстройства иммунной системы, лечить метаболические или эндокринные расстройства, наряду с другими функциями. Например, эритропоэтин (Erythropoietin - ЕРО), гормон белковой природы, может быть использован для лечения пациентов с дефицитом эритроцитов, что является распространенной причиной осложнений на почках. Кроме того, к терапевтическим антителам относят адъювантные белки, терапевтические антитела, а также с ними связывают гормонально-заместительную терапию, которую, например, используют для лечения женщин в период менопаузы. В недавно разработанных подходах соматические клетки пациента используют для их перепрограммирования в плюрипотентные стволовые клетки, которые заменяют спорную терапию стволовыми клетками. Также эти белки, используемые для перепрограммирования соматических клеток или используемые для дифференциации стволовых клеток, определены в настоящем изобретении в качестве терапевтических белков. Кроме того, терапевтические белки могут быть применимы для других целей, например, для заживления ран, регенерации тканей, ангиогенеза и т.д. Кроме того, антигенспецифичные рецепторы В-клеток и их фрагменты и варианты определены в настоящем изобретении в качестве терапевтических белков.

Таким образом, терапевтические белки могут быть применены для различных целей, включая лечение различных заболеваний, например, инфекционных заболеваний, новообразований (например, раковых или опухолевых заболеваний), заболеваний крови и кроветворных органов, эндокринных, пищевых и метаболических заболеваний, заболеваний нервной системы, заболеваний системы кровообращения, заболеваний органов дыхания, заболеваний пищеварительной системы, заболеваний кожи и подкожной клетчатки, заболеваний опорно-двигательного аппарата и соединительной ткани, а также заболеваний мочеполовой системы, независимо друг от друга, если они наследственные или приобретенные.

В этом контексте особенно предпочтительны следующие терапевтические белки, которые могут быть использованы наряду с другими средствами для лечения метаболических или эндокринных расстройств (в скобках - конкретное заболевание, для лечения которого применяют терапевтический белок): кислая сфингомиелиназа (болезнь Ниманна-Пика), адипотид (ожирение), агалзидаза-бета (галактозидаза А человека) (болезнь Фабри, предотвращает накопление липидов, которые могут приводить к почечным и сердечно-сосудистым осложнениям), альглюкозидаза (болезнь Помпе (гликогеноз II типа)), альфа галактозидаза А (альфа-GAL А, агализидаза альфа) (болезнь Фабри), альфа-глюкозидаза (гликогеноз (GSD), Morbus Pompe), альфа-L-идуронидаза (мукополисахаридоз (MPS), синдром Херлера, синдром Шеи), альфа-N-ацетилглюкозаминидаза (синдром Санфилиппо), амфирегулин (рак, нарушение обмена веществ), ангиопоэтин ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (ангиогенез, созревание сосудов), бетацеллюлин (метаболическое расстройство), бетаглюкоронидаза (синдром Слая), белок морфогенеза костей BMP (ВМР1, ВМР2, ВМР3, ВМР4, ВМР5, ВМР6, ВМР7, ВМР8а, BMP8b, ВМР10, ВМР15) (регенеративный эффект, связанные с костью состояния, хроническая почечная недостаточность (chronic kidney disease - CKD)), белок CLN6 (болезнь CLN6 - атипичный поздний инфантильный, вариант с поздним началом, ранняя ювенильная, нейрональный цероидный липофусциноз (Neuronal Ceroid Lipofuscinoses - NCL)), эпидермальный фактор роста (Epidermal growth factor - EGF) (заживление ран, регуляция роста клеток, пролиферация и дифференцировка), эпиген (метаболическое расстройство), эпирегулин (метаболическое расстройство), фактор роста фибробластов (Fibroblast Growth Factor - FGF; FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF- 8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (заживление ран, ангиогенез, эндокринные расстройства, регенерация тканей), галсульфаза (мукополисахаридоз VI), грелин (синдром раздраженной толстой кишки (irritable bowel syndrome - IBS), ожирение, синдром Прадера-Вилли, диабет II типа), глюкоцереброзидаза (болезнь Гоше), GM-CSF (регенеративный эффект, производство белых кровяных клеток, рак), связывающий гепарин EGF-подобный фактор роста (HB-EGF) (заживление ран, сердечная гипертрофия и развитие и функция сердца), фактор роста гепатоцитов (Hepatocyte growth factor - HGF, регенеративный эффект, заживление ран), гепсидин (расстройства метаболизма железа, бета-талассемия), альбумин человека (снижение производства альбумина (гипопротеинемия), увеличение потери альбумина (нефротический синдром), гиповолемия, гипербилирубинемия), идурсульфаза (идурон-2-сульфатаза) (мукополисахаридоз II (Синдром Хантера)), интегрины αVβ3, αVβ5 и α5β1 (макромолекулы связывания матрикса и протеиназы, ангиогенез), индуронатсульфотаза (синдром Хантера), ларонидаза (формы синдрома Гурлер и Гурлер-Шейе мукополисахаридоза I), N-ацетилгалактозамин-4-сульфатаза (rhASB; галсульфаза, арилсульфатаза A (ARSA), арилсульфатаза В (ARSB)) (дефицит арилсульфатазы В, синдром Марото-Лами, мукополисахаридоз VI), N-ацетилглюкозамин-6-сульфатаза (синдром Санфилиппо), фактор роста нервов (Nerve growth factor - NGF, производный от мозга нейротрофический Фактор (Brain-Derived Neurotrophic Factor - BDNF), нейротрофин-3 (NT-3) и нейротрофин 4/5 (NT-4/5) (регенеративный эффект, сердечно-сосудистые заболевания, коронарный атеросклероз, ожирение, диабет 2 типа, метаболический синдром, острые коронарные синдромы, слабоумие, депрессия, шизофрения, аутизм, синдром Ретта, нервная анорексия, нервная булимия, заживление ран, язвы кожи, язвы роговицы, болезнь Альцгеймера), нейрегулин (NRG1, NRG2, NRG3, NRG4) (метаболическое расстройство, шизофрения), нейропилин (NRP-1, NRP-2) (ангиогенез, наведение аксонов, выживаемость клеток, миграция), обестатин (синдром раздраженной толстой кишки (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет II типа), производный от тромбоцитов фактор роста (Platelet Derived Growth factor - PDGF; PDFF-A, PDGF-B, PDGF-C, PDGF-D) (регенеративный эффект, заживление ран, нарушение в ангиогенезе, артериосклерозе, фиброзе, раке), бета-рецепторы TGF (эндоглин, рецептор TGF-бета 1, рецептор TGF-бета 2, рецептор TGF-бета 3) (почечный фиброз, заболевание почек, диабет, в итоге конечная стадия болезни почек (end-stage renal disease - ESRD), ангиогенез), тромбопоэтин (ТНРО) (фактор роста и развития мегакариоцитов (Megakaryocyte growth and development factor - MGDF)) (расстройства тромбоцитов, тромбоциты для донорства, восстановление количества тромбоцитов после миелосупрессивной химиотерапии), трансформирующий фактор роста (Transforming Growth factor -TGF; (TGF-альфа, TGF-бета (TGFbeta1, TGFbeta2 и TGFbeta3))) (регенеративный эффект, заживление ран, иммунитет, рак, сердечные заболевания, диабет, синдром Марфана, синдром Лойеса-Дитца), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F и PIGF) (регенеративный эффект, ангиогенез, заживление ран, рак, проницаемость), несиритид (острая декомпенсированная застойная сердечная недостаточность), трипсин (пролежни, варикозная язва, очищение язв, дегенерирующая рана, солнечный ожог, мекониевая непроходимость кишечника), адренокортикотрофный гормон (АКТГ) (болезнь Аддисона, мелкоклеточная карцинома, адренолейкодистрофия, врожденная гиперплазия надпочечников, синдром Кушинга, синдром Нельсона, инфантильные спазмы), предсердный натрийуретический пептид (Atrial-natriuretic peptide - ANP) (эндокринные расстройства), холецистокинин (разнообразный), гастрин (гипогастринемия), лептин (диабет, гипертриглицеридемия, ожирение), окситоцин (стимулируют грудное вскармливание, не прогрессирует родов), соматостатин (симптоматическое лечение карциноидного синдрома, острое варикозное кровотечение и акромегалия, поликистозные заболевания печени и почек, акромегалия и симптомы, вызванные нейроэндокринными опухолями), вазопрессин (антидиуретический гормон) (несахарный диабет), кальцитонин (постменопаузальный остеопороз, гиперкальциемия, болезнь Педжета, метастазы в костях, фантомная боль конечностей, спинальный стеноз), экзенатид (устойчивый к лечению метформином и сульфонилмочевиной диабет второго типа), гормон роста (Growth hormone - GH), соматотропин (сбой роста из-за дефицита GH или хронической почечной недостаточности, синдром Прадера-Вилли, синдром Тернера, упадок сил или кахексия при СПИД при противовирусной терапии), инсулин (сахарный диабет, диабетический кетоацидоз, гиперкалиемия), инсулиноподобный фактор роста 1 IGF-1 (нарушение роста у детей с делецией гена GH или первичной тяжелой недостаточностью IGF1, нейродегенеративное заболевание, сердечнососудистые заболевания, сердечная недостаточность), мекасермин ринфабат, аналог IGF-1 (нарушение роста у детей с делецией гена GH или первичной тяжелой недостаточностью IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мекасермин, IGF-1 аналог (нарушение роста у детей с делецией гена GH или первичной тяжелой недостаточностью IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), пегвизомант (акромегалия), прамлинтид (при сахарном диабете, в сочетании с инсулином), терипаратид (1-34 гормона паращитовидной железы человека) (тяжелый остеопороз), бекаплермин (очистка диабетических язв), диботермин-альфа (костный морфогенетический белок 2) (операция спинального слияния, восстановление повреждений костей), гистрелин ацетат (гонадотропин-высвобождающий гормон; gonadotropin releasing hormone - GnRH) (досрочное половое созревание), октреотид (акромегалия, симптоматическое облегчение ацетил-секреции VIP-секретирующей аденомы и метастазирующих карциноидных опухолей) и палифермин (фактор роста кератиноцитов, keratinocyte growth factor - KGF) (тяжелый оральный мукозит у пациентов, проходящих химиотерапию, заживление ран).

Эти и другие белки оценивают в качестве терапевтических, поскольку они предназначены для лечения субъекта путем замены его дефектной эндогенной выработки функционального белка в достаточных количествах. Соответственно, такими терапевтическими белками обычно являются белки млекопитающие, в частности белки человека.

Для лечения заболеваний крови, заболеваний сердечно-сосудистой системы, заболеваний органов дыхания, рака или опухолевых заболеваний, инфекционных заболеваний или иммунодефицитов после терапевтических белков могут быть применены(в скобках указаны конкретные заболевания, для которых в лечении используют терапевтический белок): альтеплаза (активатор тканевого плазминогена, tPA) (легочная эмболия, инфаркт миокарда, острый ишемический инсульт, окклюзия устройств центрального венозного доступа), анистреплаза (тромболизис), антитромбин III (АТ-III) (наследственный дефицит АТ-III, тромбоэмболия), бивалирудин (снижение риска свертывания крови при коронарной ангиопластике и индуцированной гепарином тромбоцитопении), дарбепоэтин альфа (лечение анемии у пациентов с хронической почечной недостаточностью (+/- диализ)), дротрекогин альфа (активированный белок С) (тяжелый сепсис с высоким риском смерти), эритропоэтин, эпоэтин альфа, эритропоэтин, эртропоэтин (анемия при хронических заболеваниях, милеодисплазия, анемия из-за почечной недостаточности или химиотерапии, предоперационная подготовка), фактор IX (гемофилия В), фактор VIIa (кровоизлияние у пациентов с гемофилией А или В и ингибиторы фактора VIII или фактора IX), фактор VIII (гемофилия А), лепирудин (индуцированная гепарином тромбоцитопения), концентрат белка С (венозный тромбоз, молниеносная пурпура), ретеплаза (деелция мутеина tPA) (лечение острого инфаркта миокарда, улучшение функции желудочков), стрептокиназа (острый эвалюирующий трансмуральный инфаркт миокарда, эмболия легочной артерии, тромбоз глубоких вен, артериальный тромбоз или эмболия, окклюзия артериовенозной канюли), тенектеплаза (острый инфаркт миокарда), урокиназа (легочная эмболия), ангиостатин (рак), анти-CD22-иммунотоксин (рецидивирующий CD33+ острый миелоидный лейкоз), денилейкин-дифтитокс (кожная Т-клеточная лимфома (Cutaneous T-cell lymphoma - CTCL)), иммуноцианин (рак мочевого пузыря и простаты), металлопанстимулин (Metallopanstimulin - MPS) (рак), афлиберцепт (немелкоклеточный рак легкого (Non-small cell lung cancer - NSCLC), метастатический колоректальный рак (mCRC), гормон-рефрактерный метастатический рак предстательной железы, мокрая дегенерация желтого пятна), эндостатин (рак, воспалительные заболевания, например, ревматоидный артрит, болезнь Крона, диабетическая ретинопатия, псориаз и эндометриоз), коллагеназа (удаление хронических кожных язв и сильно обожженных областей, контрактура Дюпюитрена, болезнь Пейрони), дезокси-рибонуклеаза I человека, дорназа (кистозный фиброз; уменьшает инфекции дыхательных путей у отдельных пациентов с FVC более чем на 40% от прогнозируемого), гиалуронидаза (используется в качестве адъюванта для увеличения абсорбции и дисперсии инъецированных лекарств, особенно анестетиков в офтальмохирургии, а также некоторых средств визуализации), папаин (удаление некротической ткани или сжижение шелушения при острых и хронических поражениях, например, пролежней, варикозных и диабетических язв, ожогов, послеоперационных ран, пилонидальных кист, карбункулов и других ран), L-аспарагиназа (острый лимфоцитарный лейкоз, который требует экзогенного аспарагина для пролиферации), ПЭГ-аспарагиназа (острый лимфоцитарный лейкоз, который требует экзогенного аспарагина для пролиферации), расбуриказа (педиатрические пациенты с лейкозой, лимфомой и солидными опухолями, проходящие противоопухолевую терапию, которая может вызвать синдром лизиса опухоли), хорионический гонадотропин человека (HCG) (вспомогательное воспроизведение), фолликулостимулирующий гормон человека (FSH) (вспомогательное воспроизведение), лютропин альфа (бесплодие с дефицитом лютеинизирующего гормона), пролактин (гипопролактинемия, дефицит пролактина сыворотки, дисфункция яичников у женщин, тревожность, артериогенная эректильная дисфункция, преждевременная эякуляция, олигозооспермия, астеноспермия, гипофункция семенных пузырьков, гипоандрогенизм у мужчин), альфа-1 ингибитор протеиназы (дефицит врожденного антитрипсина), лактаза (газ, вздутие живота, судороги и диарея из-за невозможности переваривать лактозу), ферменты поджелудочной железы (липаза, амилаза, протеаза) (кистозный фиброз, хронический панкреатит, недостаточность поджелудочной железы, после операции по шунтированию желудка по Бильрот II, обструкция поджелудочной железы, стеаторея, плохое пищеварение, газы, вздутие живота), аденозиндезаминаза (пэгадемаза быка, PEG-ADA) (тяжелое комбинированное иммунодефицитное заболевание из-за дефицита аденозиндезаминазы), абатасепт (ревматоидный артрит (особенно при трудно поддающемуся лечению ингибирования TNFalpha)), алефасепт (пятнистый псориаз), анакинра (ревматоидный артрит), этанерцепт (ревматоидный артрит, многосуставный ювенильный ревматоидный артрит, псориатический артрит, анкилозирующий спондилоартрит, псориаз бляшек, анкилозирующий спондилоартрит), антагонист рецептора интерлейкина-1 (IL-1), анакинра (дегенерация воспаления и хряща, связанная с ревматоидным артритом), тимулин (нейродегенеративные заболевания, ревматизм, нервная анорексия), антагонист TNF-альфа (аутоиммунные нарушения, например, ревматоидный артрит, анкилозирующий спондилоартрит, болезнь Крона, псориаз, гнойный гидраденит, рефрактерная астма), энфувиртид (инфекция ВИЧ-1) и тимозин α1 (гепатит В и С).

В другом варианте осуществления настоящего изобретения предусматривают вектор, включающий:

а. открытую рамку считывания (ORF) и/или сайт клонирования, например, для инсерции открытой рамки считывания или последовательности, содержащей открытую рамку считывания; а также

б. по меньшей мере, один элемент 3'-нетранслируемой области (элемент 3'-UTR) и/или по меньшей мере один элемент 5'-нетранслируемой области (5'-UTR-элемент), причем по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR продлевает и/или увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты, и по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR является производным стабильной мРНК.

В общем, вектор в соответствии с настоящим изобретением может содержать молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением согласно описанному выше. В частности, предпочтительные варианты осуществления настоящего изобретения, описанные выше для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, также применимы для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, которая состоит из вектора в соответствии с настоящим изобретением. Например, в векторе по настоящему изобретению по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR и ORF являются описанными выше для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, включая предпочтительный варианты. Например, в векторе в соответствии с настоящим изобретением стабильная мРНК, производным которой является по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR, предпочтительно может отличаться распадом мРНК, причем соотношение количества указанной мРНК во второй временной точке к количеству указанной мРНК в первой временной точке составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%).

Клонируемым сайтом может быть какая-либо последовательность, которая применима для интродукции открытой рамки считывания или последовательности, содержащей открытую рамку считывания, например, один или несколько сайтов рестрикции. Таким образом, вектор, содержащий клонируемый сайт, предпочтительно применим для инсерции открытой рамки считывания в вектор, предпочтительно для инсерции открытой рамки считывания с 3'-конца к элементу 5'-UTR и/или с 5'-конца к элементу 3'-UTR. Предпочтительно клонируемый сайт или ORF расположены с 3'-конца элемента 5'-UTR и/или с 5'-конца элемента 3'-UTR, предпочтительно в непосредственной близости от 3'-конца 5'-UTR-элемента и/или от 5'-конца элемента 3'-UTR. Например, клонируемый сайт или ORF могут быть непосредственно подключены к 3'-концу 5'-UTR-элемента и/или к 5'-концу элемента 3'-UTR или они могут быть соединены отрезком нуклеотидов, например, из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, согласно описанному выше для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением.

Предпочтительно вектор согласно настоящему изобретению подходит для получения молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, предпочтительно для получения искусственной мРНК в соответствии с настоящим изобретением, например, путем необязательной инсерции открытой рамки считывания или последовательности, включающей открытую рамку считывания, в вектор, и транскрибирования вектора. Таким образом, предпочтительно вектор содержит элементы, необходимые для транскрипции, например, промотора, например, промотора РНК-полимеразы. Предпочтительно, такой вектор применим для транскрипции с использованием эукариотических, прокариотических, вирусных или фаговых транскрипционных систем, например, эукариотических клеток, прокариотических клеток или эукариотических, прокариотических, вирусных или фаговых систем транскрипции in vitro. Так, например, вектор может содержать промоторную последовательность, которая распознается полимеразой, такой как РНК-полимераза, например, эукариотической, прокариотической, вирусной или фаговой РНК-полимеразой. В предпочтительном варианте осуществления настоящего изобретения вектор содержит промотор фаговой РНК-полимеразы, например, SP6, Т3 или Т7, предпочтительно промотор Т7. Предпочтительно, этот вектор применим для транскрипции in vitro с использованием системы транскрипции in vitro, основанной на фаге, например, Т7-РНК-полимеразы, основанной на системе транскрипции in vitro.

В другом варианте осуществления настоящего изобретения вектор может быть применен непосредственно для экспрессии закодированного пептида или белка в клетках или ткани. Для этой цели вектор содержит определенные элементы, которые необходимы для экспрессии в этих клетках/тканях, например, определенные промоторные последовательности, например, промотор CMV.

Вектор может дополнительно содержать последовательность поли(А) и/или сигнал полиаденилирования согласно описанному выше для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением.

Вектор может быть РНК-вектором или ДНК-вектором. Предпочтительно вектор является ДНК-вектором. Вектор может быть каким-либо вектором, известным специалистам в данной области, например, вирусным вектором или плазмидным вектором. Предпочтительно, вектор является плазмидным вектором, предпочтительно плазмидным ДНК-вектором.

В предпочтительном варианте осуществления настоящего изобретения вектор по настоящему изобретению содержит молекулу искусственной нуклеиновой кислоты по настоящему изобретению.

Предпочтительно, ДНК-вектор по настоящему изобретению содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности нуклеиновой кислоты 3'-UTR транскрипта гена, например, последовательности нуклеиновой кислоты в соответствии с SEQ ID NO: 1-24 и SEQ ID NO: 49-318.

Предпочтительно, ДНК-вектор по настоящему изобретению содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% идентична последовательности нуклеиновой кислоты 5'-UTR транскрипта гена, например, последовательности нуклеиновой кислоты в соответствии с SEQ ID NO: 25-30 и SEQ ID NO: 319-382.

Предпочтительно, ДНК-вектор по настоящему изобретению содержит последовательность, выбранную из группы, состоящей из последовательностей ДНК в соответствии с SEQ ID NO: 1-30, или последовательность, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентична последовательностям ДНК согласно SEQ ID NO: 1-30 или их фрагментам согласно описанному выше, предпочтительно функциональным фрагментам.

Предпочтительно, РНК-вектор по настоящему изобретению содержит последовательность, выбранную из группы, состоящей из последовательностей РНК в соответствии с последовательностями ДНК в соответствии с SEQ ID NO: 1-30, или последовательность, которая по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентична последовательностям ДНК в соответствии с SEQ ID NO: 1-30 или их фрагментам согласно описанному выше, предпочтительно функциональным фрагментам.

Предпочтительно, вектор представляет кольцевую молекулу. Предпочтительно, вектор представляет двухцепочечную молекулу, например, двухцепочечную молекулу ДНК. Такую кольцевую, предпочтительно двухцепочечную молекулу ДНК удобно использовать в качестве формы хранения для молекулы искусственной нуклеиновой кислоты по настоящему изобретению. Кроме того, вектор может быть использован для трансфекции клеток, например культивируемых клеток. Также вектор может быть использован для транскрипции in vitro для получения молекулы искусственной РНК в соответствии с настоящим изобретением.

Предпочтительно вектор, предпочтительно кольцевой вектор, линеаризуют, например, путем расщепления ферментом рестрикции. В предпочтительном варианте осуществления настоящего изобретения вектор содержит сайт расщепления, например, сайт рестрикции, предпочтительно уникальный сайт расщепления, расположенный сразу с 3'-конца в ORF, или, если присутствует, расположенный сразу с 3'-конца элемента 3'-UTR, или, если присутствует, находится с 3'-конца поли(А) последовательности или сигнала полиаденилирования, или, если присутствует, находится с 3'-конца поли(С) последовательности, или, если присутствует, находится с 3'-конца гистонной структуры стебель-петля. Таким образом, предпочтительно продукт, полученный линеаризацией вектора, заканчивается на 3'-конце 3'-концом ORF или, если присутствует, на 3'-конце 3'-концом элемента 3'-UTR, или, если присутствует, 3'-концом поли(А) последовательности или сигналом полиаденилирования, или, если присутствует, 3'-концом поли(С) последовательности. В одном из вариантов осуществления настоящего изобретения, в котором вектор в соответствии с настоящим изобретением содержит молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, сайт рестрикции, предпочтительно уникальный сайт рестрикции, предпочтительно расположен сразу с 3'-конца до 3'-конца молекулы искусственной нуклеиновой кислоты.

В другом варианте осуществления настоящее изобретение относится к клетке, содержащей молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением или вектор в соответствии с настоящим изобретением. Клеткой может быть любая клетка, например, бактериальная клетка, клетка насекомого, растительная клетка, клетка позвоночных, например, клетка млекопитающего. Такие клетки могут быть, например, использованы для репликации вектора по настоящему изобретению, например, бактериальные клетки. Кроме того, клетка может быть применена для транскрипции молекулы искусственной нуклеиновой кислоты или вектора в соответствии с настоящим изобретением и/или трансляции открытой рамки считывания молекулы искусственной нуклеиновой кислоты или вектора в соответствии с настоящим изобретением. Например, клетка может быть применена для выработки рекомбинантного белка.

Клетки в соответствии с настоящим изобретением, например, могут быть получены стандартными методами передачи нуклеиновой кислоты, например, стандартными методами трансфекции, трансдукции или трансформации. Например, молекула искусственной нуклеиновой кислоты или вектор в соответствии с настоящим изобретением могут быть перенесены в клетку путем электропорации, липофекции, например, на основе катионных липидов и/или липосом, осаждения фосфатом кальция, трансфекцией на основе наночастиц, трансфекцией на основе вируса или на основе катионных полимеров, например, DEAE-декстрана или полиэтилененимина, и т.д.

Предпочтительно клетки являются клетками млекопитающего, например, клетками человека, домашнего животного, лабораторного животного, например, мыши или крысы. Предпочтительно клетками являются клетки человека. Клетки могут быть клетками определенной клеточной линии, например, СНО, BHK, 293Т, COS-7, HELA, HEK и т.д., или клетки могут быть первичными клетками, например, клетками дермальных фибробластов человека (human dermal fibroblast - HDF) и т.д., предпочтительно клетками, выделенными из организма. В предпочтительном варианте осуществления настоящего изобретения клетками являются изолированные клетки субъекта млекопитающего, предпочтительно человека. Например, клетки могут быть иммунными клетками, например, дендритными клетками, раковыми клетками или опухолевыми клетками, или какими-либо соматическими клетками и т.д., предпочтительно субъекта млекопитающего, предпочтительно субъекта человека.

В другом варианте осуществления настоящее изобретение относится к фармацевтической композиции, содержащей молекулу искусственной нуклеиновой кислоты по настоящему изобретению, вектор по настоящему изобретению или клетку по настоящему изобретению. Фармацевтическую композицию согласно изобретению можно применять, например, в качестве вакцины, например, для генетической вакцинации. Таким образом, ORF может, например, кодировать антиген для введения пациенту для вакцинации. Таким образом, в предпочтительном варианте осуществления фармацевтическая композиция в соответствии с настоящим изобретением представляет собой вакцину. Кроме того, фармацевтическая композиция в соответствии с настоящим изобретением может быть использована, например, для генной терапии.

Предпочтительно фармацевтическая композиция дополнительно содержит один или несколько фармацевтически приемлемых носителей, разбавителей и/или эксципиентов и/или один или нескольких адъювантов. В контексте настоящего изобретения фармацевтически приемлемый носитель обычно представляет жидкую или нежидкую основу для фармацевтической композиции по настоящему изобретению. В одном из вариантов осуществления настоящего изобретения фармацевтическую композицию получают в жидкой форме. В этом контексте предпочтительно, чтобы чтобы растворитель был на водной основе, например, на пирогенной воде, изотоническом солевом растворе или буферных (водных) растворах, например, фосфатных, цитратных и т.п.буферных растворах. Буфер может быть гипертоническим, изотоническим или гипотоническим по отношению к определенной сравниваемой среде, то есть буфер может иметь более высокое, равное или более низкое содержание соли по отношению к определенной сравниваемой среде, причем предпочтительно могут быть использованы такие концентрации вышеупомянутых солей, которые не приводят к повреждению клеток млекопитающих из-за осмоса или других эффектов, связанных с концентрациями. Контрольными средами являются, например, жидкости, используемые в методах «in vivo», например, кровь, лимфатические, цитозольные жидкости или другие жидкости организма или, например, жидкости, которые можно использовать в качестве эталонных сред в методах «in vitro», например, обычные буферы или жидкости. Такие обычные буферы или жидкости известны специалистам. Раствор Рингера-лактата особенно предпочтителен в качестве жидкой основы.

Один или несколько совместимых твердых или жидких наполнителей, или разбавителей, или инкапсулирующих соединений, пригодных для введения пациенту, также могут использоваться в фармацевтической композиции по настоящему изобретению. Используемое в настоящем изобретении понятие «совместимые» означает, что компоненты фармацевтической композиции по настоящему изобретению могут смешиваться с искусственной нуклеиновой кислотой, вектором или клетками по настоящему изобретению таким образом, чтобы не происходило никакого взаимодействия, которое могло бы существенно уменьшить фармацевтическую эффективность фармацевтической композиции по настоящему изобретению в типичных условиях применения.

Фармацевтическая композиция в соответствии с настоящим изобретением может необязательно дополнительно содержать один или несколько дополнительных фармацевтически активных компонентов. Фармацевтически активный компонент в этом контексте является соединением, которое проявляет терапевтический эффект, направленный на лечение, облегчение состояния или предотвращения определенного симптома или заболевания. Такие соединения включают, но ими не ограничиваются, пептиды или белки, нуклеиновые кислоты (терапевтически активные), низкомолекулярные органические или неорганические соединения (с молекулярной массой менее 5000, предпочтительно менее 1000), сахара, антигены или антитела, уже известные в предшествующем уровне техники терапевтические агенты, антигенные клетки, антигенные клеточные фрагменты, клеточные фракции, компоненты клеточных стенок (например, полисахариды), модифицированные, ослабленные или деактивированные (например, химически или облучением) патогены (вирусы, бактерии и т.д.).

Кроме того, фармацевтическая композиция по настоящему изобретению может содержать носитель для молекулы искусственной нуклеиновой кислоты или вектора. Такой носитель может быть пригодным в качестве средства для растворения в физиологически приемлемых жидкостях, для переноса и поглощении клетками молекул фармацевтической активной искусственной нуклеиновой кислоты или вектора. Соответственно, такой носитель может быть компонентом, который может быть пригодным в качестве депо и доставки молекулы искусственной нуклеиновой кислоты или вектора в соответствии с настоящим изобретением. Такими компонентами могут быть, например, катионные или поликатионные носители или соединения, которые могут служить в качестве агентов трансфекции или комплексообразования.

Особенно предпочтительными агентами трансфекции или комплексообразования в этом контексте являются катионные или поликатионные соединения, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, например, поли-L-лизин (poly-L-lysine - PLL), полиаргинин, основные полипептиды, проникающие в клетки пептиды (cell penetrating peptides -СРР), включая ВИЧ-связывающие пептиды, ВИЧ-1 Tat (ВИЧ), Tat-производные пептиды, пенетратин, VP22-производные или аналоговые пептиды, HSV VP22 (Herpes simplex), MAP, KALA или домены трансдукции белка (protein transduction domains - PTD), PpT620, пептиды с высоким содержанием пролина, пептиды с высоким содержанием аргинина, пептиды с высоким содержанием лизина, MPG-пептиды, Рер-1, L-олигомеры, пептид (пептиды) кальцитонина, пептиды, полученные из Antennapedia (особенно от Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB (1), pVEC, hCT-производные пептиды, SAP или гистоны.

Кроме того, такие катионные или поликатионные соединения или носители могут быть катионными или поликатионными пептидами или белками, которые предпочтительно содержат или дополнительно модифицированы таким образом, чтобы включать по меньшей мере одну группу -SH. Предпочтительно катионный или поликатионный носитель выбирают из катионных пептидов, имеющих следующую общую формулу (I):

где l+m+n+о+х=3-100 и 1, m, n или о независимо друг от друга представляют число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 и 91-100, при условии, что среднее содержание Arg (аргинина), Lys (лизина), His (гистидина) и Orn (орнитина) составляет по меньшей мере 10% от всех аминокислот в олигопептиде; Хаа означает какую-либо аминокислоту, выбранную из нативных (= природных) или ненативных аминокислот, за исключением Arg, Lys, His или Orn; х означает какое-либо число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, при условии, что среднее содержание Хаа не превышает 90% от всех аминокислот в олигопептиде. Какая-либо из аминокислот Arg, Lys, His, Orn и Хаа может быть расположена в каком-либо месте пептида. В этом контексте катионные пептиды или белки в диапазоне 7-30 аминокислот особенно предпочтительны.

Кроме того, катионный или поликатионный пептид или белок, если его определенный по указанной выше формуле {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (формула (I)), включает или является дополнительно модифицированным таким образом, чтобы содержать по меньшей мере одну группу -SH, возможно ею не ограничиваясь, выбранный по субформуле (Ia):

где (Arg)l;(Lys)m;(His)n;(Orn)o; и х являются такими же, что и описанные выше, Хаа' означает какую-либо аминокислоту, выбранную из нативных (= природных) или ненативных аминокислот, за исключением Arg, Lys, His, Orn или Cys, и у означает какое-либо число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, при условии, что среднее содержание Arg (аргинина), Lys (лизина), His (гистидина) и Orn (орнитина) составляет по меньшей мере 10% от всех аминокислот олигопептида. Кроме того, катионный или поликатионный пептид может быть выбран по субформуле (Iб):

причем эмпирическая формула {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (формула (III)) является описанной в настоящем изобретении и образует ядро аминокислотной последовательности согласно (полуэмпирической) формуле (III) и где Cys1 и Cys2 являются цистеинами, проксимальными или концевыми в отношении (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x.

Другие предпочтительные катионные или поликатионные соединения, которые могут быть использованы в качестве агентов трансфекции или комплексообразования, могут включать катионные полисахариды, например хитозан, полибрен, катионные полимеры, например, полиэтиленимин (polyethyleneimine - PEI), катионные липиды, например, DOTMA: [1-(2,3-сиолейлокси)пропил)-N,N,N-триметиламмоний хлорид, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI:

димиристооксипропилдиметилгидроксиэтиламмоний бромид, DOTAP: диолеилокси-3-(триметиламмонио)пропан, DC-6-14: O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламин хлорид, CLIP1: rac-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]-диметиламмоний хлорид, CLIP6: rac-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]-триметиламмоний, CLIP9: rac-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин или катионные или поликатионные полимеры, например модифицированные полиаминокислоты, например, β-аминокислотные полимеры или реверсированные полиамиды и т.д., модифицированные полиэтилены, например, PVP (поли(N-этил-4-винилпиридиний бромид)) и т.д., модифицированные акрилаты, например, pDMAEMA (поли(диметиламиноэтилметилакрилат) и т.д., модифицированные амидоамины, например, рАМАМ (поли(амидоамин)) и т.д., модифицированный полибетааминоэфир (РВАЕ), например, модифицированные по диаминовому концу 1,4-бутандиолдиакрилат-со-5-амино-1-пентанольные полимеры, дендримеры, например, полипропиламинные дендримеры или дендримеры на основе рАМАМ и т.д., полиимин (полиимины), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахаров, например, полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозана и т.д., полимеры с каркасом из силана, например, сополимеры PMOXA-PDMS и т.д., блокполимеры, состоящие из комбинации одного или нескольких катионных блоков (например, выбранных из катионного полимера, указанного выше), и один или несколько гидрофильных или гидрофобных блоков (например, полиэтиленгликолевых); и т.п.

В другом варианте осуществления настоящего изобретения фармацевтическая композиция по настоящему изобретению может содержать адъювант для усиления иммуностимулирующих свойств фармацевтической композиции. В этом контексте адъювантом может быть какое-либо соединение, которое пригодно в качестве вспомогательного средства для введения и доставки компонентов, например, молекулы искусственной нуклеиновой кислоты или вектора, содержащихся в фармацевтической композиции по настоящему изобретению. Кроме того, такой адъювант может, не будучи связанным с ними, инициировать или увеличивать иммунный ответ врожденной иммунной системы, то есть неспецифический иммунный ответ. Иначе говоря, при введении фармацевтическая композиция в соответствии с настоящим изобретением обычно инициирует адаптивный иммунный ответ в отношении антигена, кодируемого молекулой искусственной нуклеиновой кислоты. Кроме того, фармацевтическая композиция по настоящему изобретению может вырабатывать (поддерживающий) врожденный иммунный ответ за счет добавления адъюванта, согласно описанию настоящего изобретения, к фармацевтической композиции в соответствии с настоящим изобретением.

Такой адъювант может быть выбран из каких-либо адъювантов, известных специалисту в данной области и пригодных для настоящего изобретения, то есть способствующих индукции иммунного ответа у млекопитающего. Предпочтительно, адъювант может быть выбран из группы, включающей, но ими перечень не ограничивается, TDM, MDP, мурамилдипептид, плюроники, раствора квасцов, гидроксида алюминия, ADJUMERTM (полифосфазен); алюминиевый фосфатный гель; глюканы из водорослей; алгаммулин; гель гидроксида алюминия (квасцы); высокоадсорбирующий белки гель гидроксида алюминия; гель с низкой вязкостью гидроксида алюминия; AF или SPT (эмульсия сквалана (5%), Твин 80 (0,2%), плюроник L121 (1,25%), забуференный фосфатом физиологический раствор, рН 7,4); AVRIDINETM (пропандиамин); BAY R1005TM (N-(2-дезокси-2-L-лейциламино-b-D-глюкопиранозил)-N-октадецилдодеканоиламида гидроацетат), CALCITRIOLTM (1-альфа, 25-дигидрокси-витамин D3), гель кальций фосфатный; САРТМ (наночастицы фосфата кальция), голотоксин холеры, фрагмент гибридного белка холерного токсина-А1-белка-AD, субъединица В холерного токсина, CRL 1005 (блок-сополимер Р1205), цитокинсодержащие липосомы, DDA (диметилдиоктадециламмоний бромид), DHEA (дегидроэпиандростерон), DMPC (димиристоилфосфатидилхолин), DMPG (димиристоилфосфатидилглицерин), DOC/комплекс квасцов (натриевая соль дезоксихолевой кислоты), полный адъювант Фрейнда, неполный адъювант Фрейнда, гамма-инулин, адъювант Гербу (смесь: i) N-ацетилглюкозаминил-(Р1-4)-N-ацетилмурамил-L-аланил-D-глутамина (GMDP), ii) диметилдиоктадециламмоний хлорида (DDA), iii) комплекса соли цинка-L-пролина (ZnPro-8); GM-CSF); GMDP (N-ацетилглюкозаминил-(b1-4)-N-ацетилмурамил-L-аланил-D-изоглутамин); имиквимод (1-(2-метилпропил)-1Н-имидазо[4,5-с]хинолин-4-амин); ImmTherTM (N-ацетилглюкозаминил-N-ацетилмурамил-L-Ала-D-изоGlu-L-Ala-глицерин дипальмитат); DRV (иммунолипосомы, полученные из везикул дегидратации-регидратации); интерферон-гамма; интерлейкин-1-бета; интерлейкин-2; интерлейкин-7; интерлейкин-12; ISCOMSTM; ISCOPREP 7.0.3. ТМ; липосомы; LOXORIBINETM (7-аллил-8-оксогуанозин); LT оральный адъювант (лабильный энтеротоксин-протоксин Е. coli); микросферы и микрочастицы какой-либо композиции; MF59TM; (сквален-водная эмульсия); MONTANIDE ISA 51ТМ (очищенный неполный адъювант Фрейнда); MONTANIDE ISA 720ТМ (метаболизируемый масленый адъювант); MPLTM (3-Q-дезацил-4'-монофосфорильный липид А); липосомы МТР-РЕ и МТР-РЕ ((N-ацетил-L-аланил-D-изоглутаминил-L-аланин-2-(1,2-дипальмитоил-sn-глицеро-3-(гидроксифосфорилокси))-этиламид, мононатриевая соль), MURAMETIDETM (Nac-Mur-L-Ala-D-Gln-ОСН3), MURAPALMITINETM и D-MURAPALMITINETM (Nac-Mur-L-Thr-D-isoGIn-sn-глицеролдипальмитоил), NAGO (нейраминидаза-галактозоксидаза); наносферы или наночастицы какого-либо состава, NISV (неионные верикулы поверхностно-активных веществ), PLEURANTM (-глюкан), PLGA, PGA и PLA (гомо- и сополимеры молочной кислоты и гликолевой кислоты, микросферы/наносферы), PLURONIC L121TM; ПММА (полиметилметакрилат), PODDSTM (протеиноидные микросферы), производные полиэтиленкарбамата, поли-rA: поли-rU (комплекс полиадениловой кислоты и полиуридиловой кислоты), полисорбат 80 (Tween 80), белковые кохлеаты (фирма Avanti Polar Lipids, Inc., Alabaster, Алабама), STIMULONTM (QS-21), Quil-A (Quil-a-сапонин), S-28463 (4-амино-otec-диметил-2-этоксиметил-1Н-имидазо [4,5c] хинолин-1-этанол), SAF-1TM («синтекс-адъювантная композиция»), протеолипосомы вируса сендай и сендай-содержащие липидные матрицы; Span-85 (сорбитан-триолеат); Specol (эмульсия Marcol 52, Span 85 и Tween 85); сквален или продукт Robane® (2,6,10,15,19,23-гексаметилтетракозан и 2,6,10,15,19,23-гексаметил-2,6,10,14,18,22-тетракозагексан); стеарилтирозин (октадецилтирозин гидрохлорид); продукт Theramid® (N-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-изоGlu-L-Ala-дипальмитоксипропиламид); Теронил-MDP (TermurtideTM или [thr 1]-MDP; N-ацетилмурамил-L-треонил-D-изоглутамин); Ту-частицы (Ty-VLP или вирусоподобные частицы); kипосомы Уолтера-Рида (липосомы, содержащие липид А, адсорбированные на гидроксиде алюминия) и липопептиды, включая Pam3Cys, в частности соли алюминия, например, продукты Adju-phos, Alhydrogel и Rehydragel; эмульсии, включая CFA, SAF, IFA, MF59, продукты Provax, TiterMax, Montanide, Vaxfectin; сополимеры, включая Optivax (CRL1005), L121, Poloaxmer4010) и т.д.; липосомы, включая Stealth, cochleates, включая BIORAL; растительные адъюванты, включая QS21, Quil A, Iscomatrix, ISCOM; адъюванты, применимые для костимуляции, включая томатин, биополимеры, включая PLG, РММ, инулин; адъюванты на основе микроорганизмов, включая ромуртид, DETOX, MPL, CWS, Mannose, CpG последовательности нуклеиновых кислот, CpG7909, лиганды TLR 1-10 человека, лиганды TLR 1-13 мыши, ISS-1018, IC31, имидазохинолины, Ampligen, Ribi529, IMOxine, IRIV, VLP, токсин холеры, термолабильный токсин, Pam3Cys, флагеллин, GPI anchor, LNFPIII/Lewis X, антимикробные пептиды, UC-1V150, гибридный белок RSV, cdiGMP; адъюванты, применимые для антагонистов, включая нейропептид CGRP.

Пригодные адъюванты также могут быть выбраны из катионных или поликатионных соединений, причем адъювант предпочтительно получают при комплексообразовании молекулы искусственной нуклеиновой кислоты или вектора фармацевтической композиции с катионным или поликатионным соединением. Ассоциация или комплексообразование молекулы искусственной нуклеиновой кислоты или вектора фармацевтической композиции с катионными или поликатионными соединениями по настоящему соединению, предпочтительно обеспечивает адъювантные свойства и придает стабилизирующий эффект молекуле искусственной нуклеиновой кислоты или вектору фармацевтической композиции. В частности, такие предпочтительные, катионные или поликатионные соединения выбраны из катионных или поликатионных пептидов или белков, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, например, поли-L-лизин (PLL), полиаргинин, основные полипептиды, проникающие в клетку пептиды (СРР), включая ВИЧ-связывающие пептиды, Tat, HIV-1 Tat (ВИЧ), Tat-производные пептиды, пенетратин, VP22 или аналоговые пептиды, HSV VP22 (Herpes simplex), MAP, KALA или (ПТД, РрТ620, обогащенные пролином пептиды, обогащенные аргинином пептиды, обогащенные лизином пептиды, MPG-пептид (-пептиды), Рер-1, L-олигомеры, пептид (пептиды) кальцитонина, пептиды, полученные из Antennapedia (в частности, от Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB (1), pVEC, hCT-производные пептиды, SAP, протамин, спермин, спермидин или гистоны. К другим катионным или поликатионным соединениям могут относиться катионные полисахариды, например, хитозан, полибрен, катионные полимеры, т.е. полиэтиленимин (PEI), катионные липиды, например, DOTMA: -N,N,N-триметиламмоний]1-(2,3-сиолейлокси)пропил)[хлорид, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI:

димиристооксипропилдиметилгидроксиэтиламмоний бромид, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: O,O-дитретрадеканоил-N-(-триметиламмоний ацетил)диэтаноламин α хлорид, CLIP1: rac-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмоний хлорид, CLIP6: rac-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: rac-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные аминокислотные полимеры или ревертированные β-полиаминокислоты, например, полиамиды и т.д., модифицированные полиэтилены, например, PVP (поли(N-этил-4-винилпиридиний бромид)) и т.д., модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, например, рАМАМ (поли(амидоамин)) и т.д., модифицированный полибетааминоэфир (РВАЕ), например, модифицированные по диаминовому концу 1,4-бутандиол-диакрилат-со-5-амино-1-пентанольные полимеры и т.д., дендримеры, например, полипропиламиновые дендримеры или дендримеры на основе рАМАМ и т.д., полиимин (полиимины), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахаров, например, основанные на циклодекстрине полимеры, полимеры на основе декстрана, хитозан и т.д., полимеры на основе силана, например, сополимеры PMOXA-PDMS и т.д., блокполимеры, состоящие из комбинации одного или нескольких катионных блоков (например, выбранных из катионного полимера, согласно описанному выше), и один или несколько гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.п.

Кроме того, предпочтительные катионные или поликатионные белки или пептиды, которые могут быть использованы в качестве адъюванта путем комплексообразования молекулы искусственной нуклеиновой кислоты или вектора (предпочтительно РНК) в композиции, могут быть выбраны из следующих белков или пептидов, имеющих следующую общую формулу (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x, где l+m+n+о+х=8-15, и l, m, n или о независимо друг от друга могут быть каким-либо числом, выбранным из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, при условии, что общее содержание Arg, Lys, His и Orn представляют по меньшей мере 50% всех аминокислот олигопептида; и Хаа может представлять какую-либо аминокислоту, выбранную из нативных (= природных) или неприродных аминокислот, за исключением Arg, Lys, His или Orn; и х может быть каким-либо числом, выбранным из 0, 1, 2, 3 или 4, при условии, что общее содержание Хаа не превышает 50% всех аминокислот олигопептида. Особенно предпочтительными олигоаргининами в этом контексте являются, например, Arg7, Arg8, Arg9, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH) 4, Y (RKH) 2R и т.д.

Соотношение искусственной нуклеиновой кислоты или вектора к катионному или поликатионному соединению может быть рассчитано на основе соотношения азот/фосфат (отношение N/P) всего комплекса нуклеиновых кислот. Например, 1 мкг РНК обычно содержит около 3 нмоль фосфатных остатков, при условии, что РНК имеет статистическое распределение оснований. Кроме того, 1 мкг пептида обычно содержит примерно х нмолей остатков азота, в зависимости от молекулярной массы и количества основных аминокислот. По примерной оценке для (Arg)9 (молекулярная масса 1424 г/моль, 9 атомов азота) 1 мкг (Arg)9 содержит примерно 700 пмоль (Arg)9 и, таким образом, 700×9=6300 пмоль основных аминокислот = 6,3 нмоль атомов азота. Для соотношения масс, примерно равного 1:1 PHK/(Arg) 9, можно рассчитать соотношение N/P, примерно равное 2. При примерном вычислении для протамина (молекулярная масса примерно 4250 г/моль, 21 атом азота, когда используется протамин лосося) с массовым соотношением примерно 2:1 с 2 мкг РНК, 6 нмоль фосфата рассчитывают для РНК; 1 мкг протамина содержит примерно 235 пмоль молекул протамина и, таким образом, 235×21=4935 пмоль основных атомов азота = 4,9 нмоль атомов азота. Для соотношения масс примерно 2:1 РНК/протамина можно рассчитать соотношение N/P примерно 0,81. Для соотношения масс примерно 8:1 РНК/протамина можно рассчитать соотношение N/P примерно 0,2. В контексте настоящего изобретения соотношение N/P предпочтительно находится в интервале приблизительно от 0,1 до 10, предпочтительно в диапазоне приблизительно 0,3-4 и наиболее предпочтительно в диапазоне приблизительно 0,5-2 или 0,7-2 относительно соотношения нуклеиновой кислоты : пептид в комплексе и наиболее предпочтительно в пределах около 0,7-1,5.

Патентная заявка WO 2010/037539, описание которой включено в настоящее изобретение в виде ссылки, описывает иммуностимулирующую композицию и способы получения иммуностимулирующей композиции. Соответственно, в предпочтительном варианте осуществления настоящего изобретения композицию получают за две отдельные стадии, чтобы получить как эффективный иммуностимулирующий эффект, так и эффективную трансляцию молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением. При этом так называемый «адъювантный компонент» получают на первой стадии путем комплексообразования молекулы искусственной нуклеиновой кислоты или вектора, предпочтительно РНК, адъювантного компонента с катионным или поликатионным соединением в определенном соотношении для формирования стабильного комплекса. В этом контексте важно, что после образования комплекса с нуклеиновой кислотой в адъювантном компоненте не остается свободного катионного или поликатионного соединения, а только возможно пренебрежительно малое его количество. Соответственно, соотношение нуклеиновой кислоты и катионного или поликатионного соединения в адъювантном компоненте обычно выбирают в таком диапазоне, в котором нуклеиновая кислота полностью входит в комплекс, и в композиции не остается свободного катионного или поликатионного соединения или только их пренебрежительно малое количество. Предпочтительно соотношение адъювантного компонента, т.е. соотношение нуклеиновой кислоты к катионному или поликатионному соединению, выбирают из диапазона примерно от 6:1 (мас./мас.) до примерно 0,25:1 (мас./мас.), более предпочтительно примерно от 5:1 (мас./мас.) до примерно 0,5:1 (мас./мас.), еще более предпочтительно примерно от 4:1 (мас./мас.) до примерно 1:1 (мас./мас.) или примерно от 3:1 (мас./мас.) до примерно 1:1 (мас./мас.), наиболее предпочтительно примерно от 3:1 (мас./мас.) до примерно 2:1 (мас./мас.).

В предпочтительном варианте осуществления настоящего изобретения молекулу искусственной нуклеиновой кислоты или вектор, предпочтительно молекулу РНК по настоящему изобретению, добавляют на второй стадии к комплексной молекуле нуклеиновой кислотой, предпочтительно РНК, адъювантного компонента, для образования (иммуностимулирующей) композиции по настоящему изобретению. В этом случае молекулу искусственной нуклеиновой кислоты или вектор, предпочтительно РНК по настоящему изобретению, добавляют в виде свободной нуклеиновой кислоты, то есть нуклеиновой кислоты, которая не образуется в комплексе с другими соединениями. Перед добавлением молекула свободной искусственной нуклеиновой кислоты или вектор не образуют комплекса и предпочтительно не будут подвергаться какой-либо обнаруживаемой или значительной реакции комплексообразования при добавлении адъювантного компонента.

К другим применимым адъювантам относят нуклеиновые кислоты, имеющие формулу (II): GlXmGn, где G означает гуанозин, урацил или аналог гуанозина или урацила; X означает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеупомянутых нуклеотидов; 1 означает целое число от 1 до 40, причем если 1=1, G означает гуанозин или его аналог, когда 1>1, то по меньшей мере 50% нуклеотидов представляют гуанозин или его аналог; m означает целое число, которое не менее 3; если m=3, то X означает урацил или его аналог, если m>3 - по меньшей мере 3 последовательно расположенных урацила или аналога урацила; n означает целое число от 1 до 40, причем если n=1, то G означает гуанозин или его аналог, если n>1 по меньшей мере 50% нуклеотидов являются гуанозином или его аналогами.

К другим применимым адъювантам относят нуклеиновые кислоты, имеющие формулу (III): ClXmCn, где С означает цитозин, урацил или аналог цитозина или урацила; X означает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеупомянутых нуклеотидов; 1 означает целое число от 1 до 40, причем если 1=1, то С означает цитозин или его аналог, если 1>1, то по меньшей мере 50% нуклеотидов являются цитозином или его аналогами; m означает целое число, которое не менее 3; если m=3, то X означает урацил или его аналог, если m>3, то по меньшей мере 3 последовательнно расположенных урацила или аналога урацила; n означает целое число от 1 до 40, причем если n=1, то С означает цитозин или его аналог, если n>1, то по меньшей мере 50% нуклеотидов являются цитозином или его аналогами.

Фармацевтическая композиция в соответствии с настоящим изобретением предпочтительно включает «безопасное и эффективное количество» компонентов фармацевтической композиции, в частности, молекулы искусственной нуклеиновой кислоты по настоящему изобретению, вектора и/или клеток, согласно описанному. В контексте настоящего изобретения понятие «безопасное и эффективное количество» означает количество, достаточное для существенной индукции положительной модификации заболевания или расстройства согласно описанному. В то же время понятие «безопасное и эффективное количество» предпочтительно означает отсутствие тяжелых побочных эффектов и обеспечение разумного баланса между преимуществом и риском. Определение этих пределов обычно входит в сферу обоснованного медицинского заключения.

В другом варианте осуществления настоящее изобретение относится к молекуле искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, к вектору в соответствии с настоящим изобретением, к клеткам в соответствии с настоящим изобретением или к фармацевтической композиции в соответствии с настоящим изобретением для применения в качестве лекарственного средства, например, в качестве вакцины (при генетической вакцинации) или генной терапии.

Искусственная молекула нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическая композиция в соответствии с настоящим изобретением особенно пригодны для какого-либо медицинского применения, в котором важно терапевтическое действие или свойство пептидов, полипептидов или белков, или в котором требуется дополнительное введение определенного пептида или белка. Таким образом, настоящее изобретение предлагает молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическую композицию в соответствии с настоящим изобретением для использования при лечении или профилактике болезни или расстройства, поддающихся лечению терапевтическим действием или действием пептидов, полипептидов или белков, или поддающихся лечению путем добавления определенного пептида, полипептида или белка. Например, молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическая композиция в соответствии с настоящим изобретением могут быть применены для лечения или профилактики генетических заболеваний, аутоиммунных заболеваний, раковых или опухолевых заболеваний, инфекционных заболеваний, хронических заболеваний и т.п., например, путем генетической вакцинации или генной терапии.

В частности, такое терапевтическое лечение, польза от которого связана с повышенным и продленным присутствием терапевтических пептидов, полипептидов или белков у подлежащего лечению субъекта, особенно пригодно для медицинского применения в контексте настоящего изобретения, поскольку элемент 3'-UTR по настоящему изобретению обеспечивает стабильность и продолжительность экспрессии пептида или белка, закодированного в молекуле искусственной нуклеиновой кислоты или в векторе по настоящему изобретению, и/или элемент 5'-UTR по настоящему изобретению обеспечивает повышенную экспрессию пептида или белка, закодированного в молекуле искусственной нуклеиновой кислоты или в векторе по настоящему изобретению.

Таким образом, особенно применимым медицинским назначением для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектора в соответствии с настоящим изобретением, клеток в соответствии с настоящим изобретением или фармацевтической композиции в соответствии с настоящим изобретением является вакцинация. Таким образом, настоящее изобретение предусматривает молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическую композицию в соответствии с настоящим изобретением для вакцинации субъекта, предпочтительно субъект млекопитающего, более предпочтительно человека. Предпочтительная вакцинация представляет вакцинацию против инфекционных заболеваний, например, бактериальных, протозойных или вирусных инфекций, и противоопухолевую вакцинацию. Такие процедуры вакцинации могут быть профилактическими или терапевтическими.

В зависимости от заболевания, подлежащего лечению, или заболевания, которое нужно предотвратить, может быть выбрана ORF. Например, открытая рамка считывания может кодировать белок, который должен быть доставлен пациенту, страдающему от полного отсутствия или, по меньшей мере, частичной потери функции белка, например, пациенту с генетическим заболеванием. Кроме того, открытая рамка считывания может быть выбрана из ORF, кодирующих пептид или белок, который благотворно влияет на состояние больного субъекта. Кроме того, открытая рамка считывания может кодировать пептид или белок, который приводит к снижению регуляции патологически избыточной выработки природного пептида или белка или к элиминации клеток, экспрессирующих патологический белок или пептид. Такой недостаток, потеря функции или патологически избыточная выработка, могут, например, возникать в случае опухоли и неоплазии, аутоиммунных заболеваний, аллергии, инфекций, хронических заболеваний или других заболеваний. Кроме того, открытая рамка считывания может кодировать антиген или иммуноген, например, эпитоп патогена или опухолевого антигена. Таким образом, в предпочтительных вариантах осуществления настоящего изобретения молекула искусственной нуклеиновой кислоты или вектор в соответствии с настоящим изобретением содержит ORF, кодирующую аминокислотную последовательность, содержащую или состоящую из антигена или иммуногена, например, эпитоп патогена или связанный с опухолью антиген, 3'-UTR-элемент согласно описанному выше и/или 5'-UTR-элемент согласно описанному выше и необязательные дополнительные компоненты, например, поли(А) последовательность и другие.

В контексте медицинского применения, в частности, в контексте вакцинации, предпочтительно, чтобы молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением представляла собой РНК, предпочтительно мРНК, поскольку ДНК несет риск вызова иммунного ответа против ДНК и имеет тенденцию встраиваться в геномную ДНК. Однако в некоторых вариантах осуществления настоящего изобретения, например, если применяют в качестве носителя вирус, например аденовирус для доставки молекулы искусственной нуклеиновой кислоты или вектора в соответствии с настоящим изобретением, например, в контексте лечения методами генной терапии, может быть желательно, чтобы молекула искусственной нуклеиновой кислоты или вектор были молекулой ДНК.

Молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическая композиция в соответствии с настоящим изобретением могут вводиться перорально, парентерально, путем ингаляционного спрея, местно, ректально, назально, буккально, вагинально, через имплантированный резервуар или путем инъекции струей. Понятие «парентерально» в настоящем изобретении означает метод введения подкожный, внутривенный, внутримышечный, внутрисуставной, внутрисинусовый, внутригрудинный, интратекальный, внутрипеченочный, внутриочаговый, внутричерепной, трансдермальный, внутрикожный, внутрилегочный, внутрибрюшинный, внутрисердечный, внутриартериальный и сублингвальный путем инъекции или инфузии. В предпочтительном варианте осуществления настоящего изобретения молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическую композицию в соответствии с настоящим изобретением вводят посредством инъекции без иглы (например, безыгольным впрыскиванием).

Предпочтительно молекулу искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическую композицию в соответствии с настоящим изобретением вводят парентерально, например, путем парентеральной инъекции, более предпочтительно подкожно, внутривенно, внутримышечно, внутрисуставно, внутрисиновиально, интрастернально, интратекально, внутрипеченочно, внутричерепной инъекцией, чрезкожно, внутрикожно, внутрилегочно, внутрибрюшинно, внутрисердечно, внутриартериально, подъязычной инъекцией или с помощью инфузионных методов. Особенно предпочтительными являются внутрикожная и внутримышечная инъекции. Стерильные инъекционные формы фармацевтической композиции по настоящему изобретению могут быть водной или масляной суспензией. Эти суспензии могут быть переработаны в соответствии со способами, известными специалистам в данной области, с использованием подходящих диспергирующих или смачивающих агентов и суспендирующих агентов. Предпочтительно растворы или суспензии вводят посредством инъекции без иглы (например, безыгольным впрыскиванием).

Молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическую композицию в соответствии с настоящим изобретением также могут вводить орально в орально приемлемых дозовых формах, включая, но ими не ограничиваясь, капсулы, таблетки, водные суспензии или растворы.

Молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическую композицию в соответствии с настоящим изобретением также могут вводить местно, особенно когда мишень для лечения представляет часть органа, легко доступную для местного введения, например, при заболеваниях кожи или каких-либо других доступных эпителиальных тканей. Соответствующие местные составы легко приготовить для каждого из таких мест тела или органов. Для местного применения молекула искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектор в соответствии с настоящим изобретением, клетки в соответствии с настоящим изобретением или фармацевтическая композиция в соответствии с настоящим изобретением могут быть переработаны в подходящей мази, суспендированной или растворенной в одном или нескольких носителях.

В одном варианте осуществления настоящего изобретения применение в качестве лекарственного средства включает стадию трансфекции клеток млекопитающих, предпочтительно трансфекцию клеток млекопитающих in vitro или ex vivo, более предпочтительно трансфекцию in vitro выделенных клеток субъекта, подлежащего лечению лекарственным средством. Если применение включает трансфекцию in vitro выделенных клеток, применение в качестве лекарственного средства может дополнительно включать повторное введение трансфицированных клеток пациенту. Использование разработанных молекул искусственной нуклеиновой кислоты или вектора в качестве лекарственного средства может дополнительно включать стадию отбора успешно трансфицированных выделенных клеток. Таким образом, может оказаться полезным, если вектор дополнительно содержит селективный маркер. Кроме того, применение в качестве лекарственного средства может включать трансфекцию in vitro выделенных клеток и очистку продукта экспрессии, то есть закодированного пептида или белка из этих клеток. Этот очищенный пептид или белок затем может вводиться субъекту, нуждающемуся в этом.

Настоящее изобретение также относится к способу лечения или предупреждения заболевания или расстройства согласно описанному выше, включающему введение молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, вектора в соответствии с настоящим изобретением, клеток в соответствии с настоящим изобретением или фармацевтической композиции в соответствии с настоящим изобретением, субъекту, который в этом нуждается.

Кроме того, настоящее изобретение относится к способу лечения или предупреждения заболевания или расстройства, включающего трансфекцию клетки молекулой искусственной нуклеиновой кислоты в соответствии с настоящим изобретением или вектором в соответствии с настоящим изобретением. Указанная трансфекция может быть выполнена in vitro, ex vivo или in vivo. В предпочтительном варианте осуществления настоящего изобретения трансфекцию клетки осуществляют in vitro и трансфицированные клетки вводят субъекту, нуждающемуся в этом, предпочтительно субъекту человеку. Предпочтительно клетка, которая должна быть трансфицирована in vitro, является выделенной клеткой субъекта, предпочтительно пациента человека. Таким образом, настоящее изобретение относится к способу лечения, включающему стадии выделения клеток из субъекта, предпочтительно из человека, трансфицирования выделенных клеток искусственной нуклеиновой кислотой согласно настоящему изобретению или вектором согласно настоящему изобретению, и введения трансфицированных клеток субъекту, предпочтительно пациенту человека.

Способ лечения или профилактики расстройства по настоящему изобретению предпочтительно представляет способ вакцинации или способ генной терапии, описанные выше.

Выше было описано, что представленный в настоящем изобретении элемент 3'-UTR и/или представленный в настоящем изобретении элемент 5'-UTR способны продлевать и/или увеличивать выработку белка с мРНК. Таким образом, другой объект настоящего изобретения относится к способу увеличения и/или продления выработки белка с молекулы искусственной нуклеиновой кислоты, предпочтительно с молекулы мРНК или вектора, который включает стадию ассоциации открытой рамки считывания с элементом 3'-UTR и/или элементом 5'-UTR, причем элемент 3'-UTR и/или элемент 5'-UTR продлевает и/или увеличивает выработку белка с получаемой молекулы искусственной нуклеиновой кислоты, и по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR является производным от стабильной мРНК, для получения молекулы искусственной нуклеиновой кислоты, предпочтительно молекулы мРНК по настоящему изобретению согласно описанному выше, или вектора по настоящему изобретению согласно описанному выше.

Предпочтительно способ повышения и/или продления выработки белка с молекулы искусственной нуклеиновой кислоты, предпочтительно с молекулы мРНК или вектора, причем в соответствии с настоящим изобретением элемент 3'-UTR и/или элемент 5'-UTR включает или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, состоящей из GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глютатион S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, РССВ, PHKB, АВСВ7, PGCP, GPD2, ТМЕМ38В, NFU1, ОМА1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, АСАА2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN CDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1; предпочтительно из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глютатион S-трансфераза, mu 1), NDUFA1 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8) и CNTN1 (контактин 1).

Понятие «ассоциация молекулы искусственной нуклеиновой кислоты или вектора с элементом 3'-UTR и/или элементом 5'-UTR» в контексте настоящего изобретения предпочтительно означает функциональное связывание или функциональное объединение молекулы искусственной нуклеиновой кислоты или вектора с элементом 3'-UTR и/или с элементом 5'-UTR. Это означает, что молекула искусственной нуклеиновой кислоты или вектор и элемент 3'-UTR и/или элемент 5'-UTR, предпочтительно элемент 3'-UTR и/или 5'-UTR-элемент, описанные выше, ассоциированы или связаны таким образом, что действует функция элемента 3'-UTR и/или элемента 5'-UTR, например продления и/или увеличения количества РНК и/или белка. Обычно это означает, что элемент 3'-UTR и/или элемент 5'-UTR интегрируют в молекулу искусственной нуклеиновой кислоты или в вектор, предпочтительно в молекулу мРНК, 3' и/или 5', соответственно, к открытой рамке считывания, предпочтительно сразу с 3' в открытую рамку считывания и/или сразу с 5' в открытую рамку считывания, элемент 3'-UTR предпочтительно между открытой рамкой считывания и поли(А) последовательностью или сигналом полиаденилирования. Предпочтительно элемент 3'-UTR и/или элемент 5'-UTR интегрируют в молекулу искусственной нуклеиновой кислоты или вектор, предпочтительно мРНК, в виде 3'-UTR и/или как 5'-UTR соответственно, таким образом, что элемент 3'-UTR и/или элемент 5'-UTR представляет 3'-UTR и/или 5'-UTR, соответственно, молекулы искусственной нуклеиновой кислоты или вектора, предпочтительно мРНК, то есть таким образом, что 5'-UTR заканчивается непосредственно перед 5'-концом ORF, а 3'-UTR простирается от 3'-стороны открытой рамки считывания до 5'-стороны поли(А) последовательности или полиаденилирующего сигнала, необязательно связанный посредством короткого линкера, например такой последовательностью, содержащей из одного или нескольких сайтов рестрикции. Таким образом, предпочтительно, понятие «ассоциация молекулы искусственной нуклеиновой кислоты или вектора с элементом 3'-UTR и/или элементом 5'-UTR» означает функциональную ассоциацию элемента 3'-UTR и/или элемента 5'-UTR с открытой рамкой считывания, расположенной внутри молекулы искусственной нуклеиновой кислоты или вектора, предпочтительно в молекуле мРНК. 3'-UTR и/или 5'-UTR и ORF являются такими, как описано выше для молекулы искусственной нуклеиновой кислоты в соответствии с настоящим изобретением, например, предпочтительно ORF и 3'-UTR являются гетерологичными и/или ORF и 5'-UTR являются гетерологичными соответственно, например, полученными от разных генов, что описано выше.

В другом объекте настоящего изобретения предусматривают применение элемента 3'-UTR и/или элемента 5'-UTR, преимущественно элемента 3'-UTR согласно описанному выше и/или элемента 5'-UTR согласно описанному выше, для увеличения и/или продления выработки белка с молекулы искусственной нуклеиновой кислоты, предпочтительно с молекулы мРНК или вектора, причем элемент 3'-UTR и/или элемент 5'-UTR включает или состоит из последовательности нуклеиновой кислоты, которая производна от 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, состоящей из GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глютатион S-трансфераза, mu 1), NDUFA1 (NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, GRAMD1C, C11orf80, C9orf46, ANXA4, ТВСК, IFI6, C2orD4, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufs5, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lc3a, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, СОХ11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1; предпочтительно из группы, включающей GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексный локус), MORN2 (MORN-повтор содержащий 2), GSTM1 (глютатион S-трансфераза, mu 1), NDUFA1 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс), CBR2 (карбонилредуктаза 2), МР68 (RIKEN кДНК 2010107Е04 ген), NDUFA4 (NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4), Ybx1 (Y-Box связывающий белок 1), Ndufb8 (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8) и CNTN1 (контактин 1).

Применение в соответствии с настоящим изобретением предпочтительно включает связывание молекулы искусственной нуклеиновой кислоты, вектора или РНК с элементом 3'-UTR согласно описанному выше и/или с элементом 5'-UTR согласно описанному выше.

Соединения и ингредиенты фармацевтической композиции по настоящему изобретению могут также изготавливаться и продаваться отдельно друг от друга. Таким образом, изобретение относится также к набору или набору частей, содержащих молекулу искусственной нуклеиновой кислоты по настоящему изобретению, вектор по настоящему изобретению, клетки по настоящему изобретению и/или фармацевтическую композицию по настоящему изобретению. Предпочтительно такой набор или наборы частей может дополнительно содержать инструкции по применению, клетки для трансфекции, адъювант, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разбавления молекулы искусственной нуклеиновой кислоты, вектора, клеток или фармацевтической композиции.

В другом объекте настоящего изобретения предусматривают способ идентификации элемента 3'-нетранслируемой области (элемента 3'-UTR) и/или элемента 5'-нетранслируемой области (элемента 5'-UTR), который является производным стабильной мРНК, включающий следующие стадии:

а. анализа стабильности мРНК, включающего подстадии:

i. определения количества мРНК в первой временной точке во время процесса распада указанной мРНК,

ii. определения количества мРНК во второй временной точке во время процесса распада указанной мРНК, и

iii. рассчета соотношения количества указанной мРНК, определенной на стадии (i), к количеству указанной мРНК, определенной на стадии (ii);

б. отбора стабильных мРНК, у которых соотношение, рассчитанное на подстадии (iii), составляет по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%); а также

в. определения нуклеотидной последовательности элемента 3'-UTR и/или элемента 5'-UTR указанной стабильной мРНК.

Таким образом, стабильность мРНК предпочтительно оценивают в стандартных условиях, например стандартных условиях (стандартная среда, инкубация и т.д.) для определенной линии клеток или используемого типа клеток.

Для анализа стабильности мРНК процесс распада мРНК оценивают путем определения количества или концентрации указанной мРНК в первой и во второй временных точках во время процесса распада указанной мРНК (см. стадии a) i. и а) ii).

Для определения количества или концентрации мРНК во время процесса распада РНК in vivo или in vitro согласно описанному выше (т.е. in vitro, относящиеся, в частности, к («живым») клеткам и/или тканям, включая ткань живого субъекта; применяют определенные клеточные линии, первичные клетки, клетки в ткани или в субъектах, предпочтительными являются клетки млекопитающих, например клетки человека и клетки мыши, особенно предпочтительными являются линии клеток человека HeLa и U-937, а также линии клеток мыши NIH3T3, JAWSII и L929; кроме того, особенно предпочтительными являются первичные клетки, в особенно предпочтительных вариантах осуществления настоящего изобретения дермальные фибробласты человека (HDF)), могут быть применены различные методы, известные специалистам в данной области. К примерам, не ограничивающим области охвата настоящего изобретения, относят методы общего подавления транскрипции, например, ингибитором транскрипции, таким как актиномицин D, использование индуцируемых промоторов для специфической индукции временной транскрипции, например, c-fos-индуцибельную промоторную систему и регуляторную промоторную систему Tet-off, а также методы кинетической маркировки, например, импульсной маркировки.

Например, если на стадии а) применяют арест транскрипции, опосредованный ингибитором транскрипции, для определения количества или концентрации мРНК во время процесса распада РНК in vivo или in vitro согласно описанному выше, могут быть применены ингибиторы транскрипции, например, актиномицин D (ActD), 5, 6-дихлор-1-D-рибофуранозил-бензимидазол (DRB) или α-аманитин (α-Am). Таким образом, для оценки распада мРНК ингибиторы транскрипции обычно добавляют к клеткам и обычно в результате ингибируется транскрипция, и расщепление РНК можно наблюдать без помехи в виде непрерывной транскрипции.

В другом варианте индуцируемые промоторы для специфической индукции временной транскрипции могут быть применены на стадии а), при этом задача заключается в том, чтобы обеспечить стимул, который активирует транскрипцию и приводит к всплеску синтеза мРНК, затем удаляют стимул, чтобы отключить транскрипцию и контролировать распад мРНК. Таким образом, индуцибельный промотор обеспечивает строгий контроль, поэтому индукция и глушение транскрипции осуществляются в узком временном диапазоне. Известно, что в клетках млекопитающих промотор cfos полезен для этой цели, поскольку он может быть индуцирован в ответ на быстрое и временное добавление сыворотки, тем самым обеспечивая надежный и простой способ достижения временного всплеска транскрипции. Система промотора Tet-off обеспечивает еще одну возможность, еще больше расширяя применение импульсного подхода к транскрипции для изучения оборота мРНК в клетках млекопитающих.

Однако в настоящем изобретении методы кинетической маркировки предпочтительны на стадии а) для определения количества мРНК во время процесса распада РНК in vivo или in vitro согласно описанному выше. В кинетической маркировке обычно маркируют РНК, причем метку включают в определенные меченые нуклеотиды и меченые нуклеозиды, и особенно предпочтительными являются меченый уридин и меченый урацил. Примеры предпочтительных меток включают 4-тиоуридин (4sU), 2-тиоуридин, 6-тиогуанозин, 5-этинилуридин (ЕС), 5-бром-уридин (BrU), биотин-16-аминоаниллилуридин, 5-аминоаллилуридин, 5-аминоаллилцитидин, и т.д., где более предпочтительными являются 4-тиоуридин (4sU), 5-этинилуридин (ЕС) или 5'-бром-уридин (BrU). Особенно предпочтительным является 4-тиоуридин (4sU). 4-Тиоуридин (4sU) предпочтительно используют в концентрации 100-500 мкМ. Кроме того, могут быть использованы также радиоактивно меченые нуклеотиды, например, уридин-3Н. Также могут быть использованы комбинации вышеуказанных меченых нуклеотидов, в связи с чем особенно предпочтительна комбинация 4-тиоуридина и 6-тиогуанозина.

При кинетической маркировке обычно образующуюся РНК метят, например, путем включения маркированного уридина или урацила во время транскрипции. Через некоторое время поступление метки прекращают, и затем распад РНК можно наблюдать путем оценки специфически меченной РНК, не ингибируя транскрипцию в целом.

Для определения количества мРНК во время процесса распада РНК на стадии а) предпочтительна импульсная маркировка, и особенно предпочтительна методика вытеснения метки. Используемое в настоящем изобретении понятие «импульсная маркировка» относится к методу, в котором метка, например, описанная выше метка, используется для измерения скоростей синтеза и/или распада соединений в живых клетках. Обычно клетки подвергаются воздействию небольшого количества метки на протяжении короткого периода, поэтому применяют понятие «импульс». В методе импульсного вытеснения после импульсной маркировки обычно требуется значительно большее количество немеченого соединения, соответствующего «импульсу» (например, немеченный уридин, если уридин с меткой используют в качестве импульса) добавляют в течение требуемого периода обработки меткой. Эффект конкуренции между меченым и немеченым соединением заключается в том, чтобы уменьшить до незначительного уровня дальнейшее поглощение меченого соединения, отсюда понятие «вытеснение».

Для определения количества или концентрации мРНК обычно необходимо выделить мРНК. Специалистам в данной области техники известны различные методы выделения РНК, например, экстракция гуанидинием тиоцианат-фенол-хлороформом или выделение на основе капиллярной кварцевой колонки. Также можно применять доступные наборы, например, набор RNeasy фирмы Qiagen.

Кроме того, может потребоваться стадия выделения, в частности, если используют кинетическую маркировку (в отличие от ингибитора транскрипции, где полная РНК представляет собой «разрушающуюся» РНК, поскольку транскрипция обычно ингибируется). На стадии экстракции меченую РНК (то есть представляющую «разрушающуюся» РНК) экстрагируют из общей выделенной РНК. Таким образом, средства извлечения могут быть выбраны в зависимости от используемой метки. Например, можно применять иммуноочистку антителами к метке.

Кроме того, например, для извлечения тио-меченых молекул РНК, например, меченых 4-тиоуридином (4sU), HPDP-биотин (активированный пиридилдитиолом, сульфгидрил-реактивный реагент биотинилирования, который конъюгирует через расщепляемую (обратимую) дисульфидную связь), может быть инкубирован с выделенной «полной РНК». Этот реагент специфически реагирует с восстановленными тиолами (-SH) в РНК, меченой 4-тиоуридином (4SU), с образованием обратимых дисульфидных связей. Биотинилирование позволяет связывать тио-меченые, например. 4-тиоуридином (4SU), РНК со стрептавидином, и поэтому РНК может быть выделена из общей РНК путем восстановления дисульфидной связи с дитиотреитолом или бета-меркаптоэтанолом (или каким-либо другим восстанавливающим агентом).

В случае меченых биотином нуклеотидов, например, биотин-16-аминоаллилуридина, стрептавидин можно непосредственно применять для извлечения меченой РНК из общей РНК.

Например, для извлечения вновь транскрибированных меченных 5-этинилуридином (ЕС) РНК из общей РНК может быть использовано биотинилирование ЕС в катализируемой медью реакции циклоприсоединения (часто называемой клик-химией), за которой следует аффинная очистка с применением стрептавидина. Этот метод коммерчески доступен в виде набора для захвата РНК (Click-iT Nascent RNA Capture Kit (номнр в каталоге С10365, фирма Invitrogen). В инструкции изготовителя этого набора рекомендуют, чтобы время импульсной маркировки составляло от 30 до 60 минут для дозы 0,5 мМ ЕС или от 1 до 24 часов для дозы 0,1 или 0,2 мМ ЕС.

Например, BrU-меченые молекулы РНК могут быть экстрагированы путем иммуноочистки антителом против бромдезоксиуридина (например, клон 2 В1, номер в каталоге MI-11-3, фирма MBL) и белком G-сефарозой.

Количество или концентрация мРНК, то есть уровень транскрипта, затем могут быть измерены различными методами, известными специалистам в данной области. Примерами таких методов, не ограничивающих рамок охвата настоящего изобретения, являются микроматричный анализ, нозерн-блоттинг, количественная ПЦР или секвенирование нового поколения (высокопроизводительное секвенирование). Особенно предпочтительными являются микроматричный анализ и секвенирование нового поколения. Кроме того, особенно предпочтительны цельногеномные подходы к геному в целом/анализ целых транскриптом, например, микроматричный анализ всего генома, например, Affymetrix Human Gene 1.0 ST, или 2.0 ST, или Affymetrix Mouse Gene 1.0 ST, или 2.0 ST, или микроматричный анализ всего транскриптома с последующим секвенированием.

На субстадиях i. и ii. стадии а) количество мРНК определяют в первой и во второй временных точках во время процесса распада мРНК. Обычно это означает, что выделяют мРНК в первой и во второй временных точках во время процесса распада мРНК для определения соответствующих количеств мРНК. Таким образом, понятия «в первый момент времени» и «во второй момент времени» относятся, в частности, к таким моментам в ходе распада РНК, когда РНК выделяют для определения ее количества. Соответственно, «второй момент времени» наступает позже по ходу распада РНК, чем «первый момент времени».

Предпочтительно, первый момент времени выбирают таким образом, чтобы рассматривать только мРНК, подвергающуюся процессу распада, то есть возникающая мРНК, например, в результате продолжающейся транскрипции, исключается. Например, если применяют методы кинетической маркировки, например, импульсной маркировки, первую временную точку предпочтительно выбирают таким образом, чтобы включение метки в мРНК завершалось, то есть не происходило постоянного включения метки в мРНК. Таким образом, если используют кинетическую маркировку, первый момент времени может составлять по меньшей мере 10 мин, по меньшей мере 20 мин, по меньшей мере 30 мин, по меньшей мере 40 мин, по меньшей мере 50 мин, по меньшей мере 60 мин, по меньшей мере 70 мин, по меньшей мере, 80 мин или по меньшей мере 90 мин после окончания процедуры маркировки, например после окончания инкубации клеток с меткой.

Например, первая временная точка может быть предпочтительно через от 0 до 6 ч после остановки транскрипции (например, вызванной ингибитором транскрипции), остановки индукции промотора в случае индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания маркировки. Более предпочтительно, первая временная точка может быть в интервале от 30 мин до 5 ч, еще более предпочтительно от 1 ч до 4 ч и особенно предпочтительно примерно через 3 ч после прекращения транскрипции (например, вызванного ингибитором транскрипции), прекращения индукции промотора в случае индуцируемых промоторов или после прекращения подачи импульсов или меток, например после окончания маркировки.

Предпочтительно вторую временную точку выбирают как можно позже во время процесса распада мРНК. Однако, если рассматривают множество видов мРНК, вторую временную точку предпочтительно выбирают таким образом, что все еще значительное количество видов мРНК из имеющегося множества мРНК, предпочтительно по меньшей мере 10% видов мРНК, содержится в фиксируемом количестве, то есть более 0. Предпочтительно вторая временная точка наступает через по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч, по меньшей мере 12 ч, по меньшей мере 13 ч, по меньшей мере 14 ч или по меньшей мере 15 ч после остановки транскрипции (например, ингибитором транскрипции), после индукции промотора в случае индуцируемых промоторов или после прекращения подачи импульса или метки, например после окончания маркировки.

Например, вторая временная точка может быть предпочтительно от 3 до 48 ч после прекращения транскрипции (например, ингибитором транскрипции), остановки индукции промотора в случае индуцибельных промоторов или после прекращения подачи импульса или метки, например, после окончания маркировки. Более предпочтительно, вторая временная точка может быть через от 6 мин до 36 ч, еще более предпочтительно от 10 ч до 24 ч и особенно предпочтительно примерно через 15 ч после прекращения транскрипции (например, ингибитором транскрипции), прекращения индукции промотора в случай индуцируемых промоторов или после прекращения подачи импульсов или меток, например после окончания маркировки.

Таким образом, временной интервал между первой временной точкой и второй временной точкой предпочтительно является максимально возможным в указанных выше интервалах. Следовательно, временной интервал между первой временной точкой и второй временной точкой составляет предпочтительно не менее 4 ч, по меньшей мере 5 ч, по меньшей мере 6 ч, по меньшей мере 7 ч, по меньшей мере 8 ч, по меньшей мере 9 ч, по меньшей мере 10 ч, по меньшей мере 11 ч или по меньшей мере 12 ч, причем особенно предпочтительным является временной интервал примерно в 12 ч. В общем, второй временной интервал по меньшей мере на 10 мин позже первого временного интервала.

На субстадии iii. стадии а) рассчитывают отношение количества мРНК, определенного на стадии (i), к количеству мРНК, определенного на стадии (ii). С этой целью количество мРНК (уровень транскрипта), определенное согласно описанному выше во второй временной точке, делят на количество мРНК (уровень транскрипта), определенное согласно описанному выше в первой временной точке. Это соотношение показывает, что стабильные мРНК, которые уже в первый момент времени присутствуют только в очень малых количествах, не учитываются в отношении мРНК, которые присутствуют в больших количествах.

На стадии б) выбирают такую мРНК, которая имеет соотношение, вычисленное на субстадии (iii) стадии а) и составляющее по меньшей мере 0,5 (50%), по меньшей мере 0,6 (60%), по меньшей мере 0,7 (70%), по меньшей мере 0,75 (75%), по меньшей мере 0,8 (80%), по меньшей мере 0,85 (85%), по меньшей мере 0,9 (90%) или по меньшей мере 0,95 (95%). Такую мРНК в настоящем изобретении рассматривают в качестве особенно стабильной мРНК.

На стадии в) определяют нуклеотидную последовательность элемента 3'-UTR и/или элемента 5'-UTR указанной мРНК, то есть мРНК, выбранной на стадии б). С этой целью могут быть применены различные способы, известные специалистам в данной области, например, секвенирования или выбора из общедоступной базы данных, например, из NCBI (National Center for Biotechnology Information - Национальный центр биотехнологической информации). Например, по последовательности мРНК, выбранной на стадии б), может быть проведен поиск в базе данных, и 3'-UTR и/или элемента 5'-UTR могут быть получены из последовательности мРНК, присутствующей в базе данных.

В частности, в описанном выше способе идентификации элемент 3'-нетранслируемой области (3'-UTR-элемент) и/или элемент 5'-нетранслируемой области (5'-UTR-элемент), который является производным от стабильной мРНК, понятия «мРНК» и/или «стабильная мРНК» соответственно могут также относиться к виду мРНК, описанному в настоящем изобретении, и/или к виду стабильной мРНК, соответственно.

Кроме того, в предпочтительном варианте осуществления настоящего изобретения «стабильная мРНК» может иметь более медленный распад мРНК по сравнению со средним распадом мРНК, предпочтительно оцениваемым in vivo или in vitro согласно описанному выше. Таким образом, «средний распад мРНК» может быть оценен путем исследования распада множества видов мРНК.

Соответственно, настоящее изобретение предусматривает еще один вариант способа идентификации элемента 3'-нетранслируемой области (элемент 3'-UTR) и/или элемента 5'-нетранслируемой области (элемент 5'-UTR), который является производным стабильной мРНК, включающего следующие стадии:

а. анализа стабильности множества видов мРНК, включающего следующие подстадии:

i. определения количества мРНК каждого вида из указанного множества видов мРНК в первой временной точке во время процесса распада указанных видов мРНК,

ii. определения количества мРНК каждого вида из указанного множества видов мРНК во второй временной точке во время процесса распада указанных видов мРНК, и

iii. рассчета соотношения количества мРНК каждого вида из указанного множества видов мРНК, определенного на стадии (i), к количеству мРНК каждого вида из указанного множества, определенного на стадии (ii);

б. ранжирования видов мРНК из множества видов мРНК в соответствии с соотношением, рассчитанным на подстадии (iii) для каждого вида мРНК;

в. отбора одного или нескольких видов мРНК, имеющих наивысшее соотношение или наивысшие соотношения, рассчитанные на подстадии (iii); и

г. Определения нуклеотидной последовательности элемента 3'-UTR и/или элемента 5'-UTR указанной стабильной мРНК.

В контексте настоящего изобретения понятие «вид мРНК» означает единицу геномного транскрипта, т.е. обычно ген. В рамках «одного вида мРНК» могут быть разные транскрипты, например, из-за процессинга мРНК. Например, вид мРНК может быть представлен пятном на микрочипе. Соответственно микрочип представляет перспективный инструмент для определения количества видов мРНК в множесте молекул, например, в определенной точке времени в ходе распада мРНК. Однако специалистам также известны другие методы, которые могут быть применены, например, RNA-seq (также метод называется методом дробовика для секвенирования целого транскриптома), количественной ПЦР и другие.

Предпочтительно понятие «множество видов мРНК» относится по меньшей мере к 100, по меньшей мере к 300, по меньшей мере к 500, по меньшей мере к 1000, по меньшей мере к 2000, по меньшей мере к 3000, по меньшей мере к 4000, по меньшей мере к 5000, по меньшей мере к 6000, по меньшей мере к 7000, по меньшей мере к 8000, по меньшей мере к 9000, по меньшей мере к 10000, по меньшей мере к 11000, по меньшей мере к 12000, по меньшей мере к 13000, по меньшей мере к 14000, по меньшей мере к 15000, по меньшей мере к 16000, по меньшей мере к 17000, по меньшей мере к 18000, по меньшей мере к 19000, по меньшей мере к 20000, по меньшей мере к 21000, по меньшей мере к 22000, по меньшей мере к 23000, по меньшей мере к 24000, по меньшей мере к 25000, по меньшей мере к 26000, по меньшей мере к 27000, по меньшей мере к 28000, по меньшей мере к 29000 или по меньшей мере к 30000 видам мРНК. Особенно предпочтительно, если оценивают весь транскриптом, или так много видов мРНК транскриптома, кнасколько это возможно. Это может быть достигнуту, например, за счет применения микрочипа, обеспечивающего покрытие всего транскрипта.

Стадия а) этого способа с субстадиями i.-iii. по существу соответствует стадии а) с субстадиями i.-iii. ранее описанного способа, но отличается только тем, что количество каждого вида мРНК из множества видов мРНК определяют в первую и во вторую временные точки, и тем, что соотношение рассчитывают для каждого вида мРНК. Соответственно, в настоящем изобретении подробно описанные способы и предпочтительные варианты осуществления настоящего изобретения, описанные выше, применяют в настоящем изобретении, а также соотношение для отдельных видов мРНК (и для каждого отдельного вида мРНК, соответственно) может быть определено так же, как описано выше для «мРНК».

Однако, в отличие от указанного выше способа, стабильность мРНК оценивают не по абсолютной величине соотношения, а по ранжированию видов мРНК из множества видов мРНК в соответствии с соотношением, вычисленным на субстадии (iii) стадии а) для каждого вида мРНК. Затем на субстадии в) выбирают один или несколько видов мРНК, имеющих наивысшее соотношение или наивысшие соотношения, вычисленные на субстадии (iii) стадии а).

В этом контексте особенно предпочтительно выбрать 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% наиболее стабильных видов мРНК на стадии в). В другом варианте или дополнительно на стадии в) могут быть выбраны такие виды мРНК, у которых соотношение, вычисленное на субстадии iii. стадии а), соответствуют по меньшей мере 100% среднего соотношения, рассчитанного по всем исследованным видам мРНК. Более предпочтительно выбирают такие виды мРНК, которые показывают соотношение, составляющее по меньшей мере 150%, еще более предпочтительно по меньшей мере 200% и наиболее предпочтительно по меньшей мере 300% от среднего соотношения, рассчитанного по всем проанализированным видам мРНК.

На стадии г) нуклеотидную последовательность элемента 3'-UTR и/или элемента 5'-UTR мРНК, выбранной на стадии в), определяют согласно описанному выше для стадии в) ранее описанного способа по настоящему изобретению.

Предпочтительно в обоих описанных выше способах идентификации элемента 3'-UTR и/или элемента 5'-UTR мРНК в соответствии с настоящим изобретением период времени между первой временной точкой и второй временной точкой составляет по меньшей мере 5 ч, предпочтительно по меньшей мере 6 ч, предпочтительно по меньшей мере 7 ч, более предпочтительно по меньшей мере 8 ч, более предпочтительно по меньшей мере 9 ч, еще более предпочтительно по меньшей мере 10 ч, еще более предпочтительно по меньшей мере 11 ч и особенно предпочтительно по меньшей мере 12 ч.

Предпочтительно в обоих описанных выше способах идентификации элемента 3'-UTR и/или элемента 5'-UTR мРНК в соответствии с настоящим изобретением стабильность мРНК анализируют путем импульсной маркировки, предпочтительно с использованием метода вытеснения метки.

В другом варианте осуществления настоящего изобретения также предусматривают способ идентификации элемента 3'-нетранслируемой области (элемент 3'-UTR) и/или элемента 5'-нетранслируемой области (элемент 5'-UTR), который продлевает и/или увеличивает выработку белка с молекулы искусственной нуклеиновой кислоты и которая является производной стабильной мРНК, включающий следующие стадии:

а) идентификации элемента 3'-UTR и/или элемента 5'-UTR, который происходит от стабильной мРНК, методом идентификации элемента 3'-UTR и/или элемента 5'-UTR по какому-либо способу, описанному выше:

б) синтеза молекулы искусственной нуклеиновой кислоты, содержащей, по меньшей мере, одну открытую рамку считывания и, по меньшей мере, один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR, который соответствует или состоит из элемента 3'-UTR и/или 5'-UTR, идентифицированных на стадии а);

в) анализа экспрессии белка, кодируемого по меньшей мере одной открытой рамкой считывания (ORF) молекулы искусственной нуклеиновой кислоты, синтезированной на стадии б);

г) анализа экспрессии белка, кодируемого, по меньшей мере, одной открытой рамкой считывания контрольной молекулы искусственной нуклеиновой кислоты без элемента 3'-UTR и/или элемента 5'-UTR;

д) сравнения экспрессии белка с молекулы искусственной нуклеиновой кислоты, проанализированной на стадии в), с экспрессией белка с контрольной молекулы искусственной нуклеиновой кислоты, проанализированной на стадии г); а также

е) отбора элемента 3'-UTR и/или элемент 5'-UTR, если экспрессия белка с молекулы искусственной нуклеиновой кислоты, проанализированная на стадии в), продлевается и/или увеличивается по сравнению с экспрессией белка с контрольной молекулы искусственной нуклеиновой кислоты, проанализированной на стадии г).

В этом способе сначала идентифицируют элемент 3'-UTR и/или элемент 5'-UTR способом по настоящему изобретению, описанным выше. Это позволяет синтезировать элемент 3'- и/или элемент 5'-UTR способами, известными специалистам в данной области техники, например, с помощью ПЦР-амплификации. Праймеры, используемые для такой ПЦР, предпочтительно могут содержать сайты рестрикции для клонирования. В другом варианте элемент 3'-UTR и/или элемент 5'-UTR может быть синтезирован, например, химическим синтезом или отжигом. Соответственно, на стадии б) синтезируют молекулу искусственной нуклеиновой кислоты, содержащую по меньшей мере одну открытую рамку считывания и по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR, который соответствует или состоит из элемента 3'-UTR и/или элемента 5'-UTR, идентифицированных на стадии а). В частности, по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR обычно объединяют с открытой рамкой считывания, что приводит к образованию искусственной нуклеиновой кислоты, содержащей элемент 3'-UTR и/или элемент 5'-UTR в соответствии с настоящим изобретением, если элемент 3'-UTR и/или элемент 5'-UTR соответствует в полной мере требованиям, то есть, если они продлевают и/или увеличивают экспрессию белка. Чтобы проверить это, элемент 3'-UTR и/или элемент 5'-UTR, идентифицированный на стадии а), или фрагмент ПЦР или его синтезированная последовательность, соответственно, могут быть клонированы в определенный вектор, предпочтительно в вектор экспрессии, чтобы оценить экспрессию белка с соответствующей ORF.

Экспрессия белка с молекулы искусственной нуклеиновой кислоты, содержащей по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR, затем оценивают на стадии в) согласно описанию настоящего изобретения и сравнивают с экспрессией белка, оценку которой получают на стадии г), с соответствующей контрольной молекулы искусственной нуклеиновой кислоты, не содержащей элемента 3'-UTR и/или элемента 5'-UTR согласно описанию настоящего изобретения на стадии д).

Затем на стадии е) выбирают такой элемент 3'-UTR и/или элемент 5'-UTR, который продлевает и/или увеличивает экспрессию белка с молекулы искусственной нуклеиновой кислоты, проанализированной на стадии в), по сравнению с экспрессией белка с контрольной молекулы искусственной нуклеиновой кислоты, исследованной на стадии г). Сравнение экспрессии белка с молекулы нуклеиновой кислоты по настоящему изобретению с экспрессией белка с исходной молекулы нуклеиновой кислоты осуществляют согласно описанию настоящего изобретения, в частности в контексте разработанной молекулы искусственной нуклеиновой кислоты по настоящему изобретению.

Кроме того, настоящее изобретение предусматривает особенно предпочтительный способ идентификации 3'-нетранслируемого элемента области (элемент 3'-UTR) и/или 5'-нетранслируемый элемент области (элемент 5'-UTR), который продлевает и/или увеличивает выработку белка с молекулы искусственной нуклеиновой кислоты, являющейся производной от стабильной мРНК; способ включает следующие стадии:

а. питания/инкубирования клеток с меченым нуклеотидом для инкорпорирования во вновь транскрибируемые молекулы РНК (пульс-вытеснение метки);

б. выделения общей РНК клеток в первой временной точке и, по меньшей мере, в одной более поздней второй временной точке;

в. выделения меченых молекул РНК из общей РНК, выделенной на стадии б);

г. измерения количества/уровня транскриптов разных видов мРНК в составе меченой РНК;

д. вычисления соотношения количества/уровня транскрипта видов мРНК, присутствующих по меньшей мере на одну секунду позже по времени, к количеству/уровню транскрипта видов мРНК, присутствующих в первой временной точке;

е. ранжирования видов мРНК в соответствии с соотношением, определенным на этапе д);

ж. отбора наиболее стабильных видов мРНК;

з. определения нуклеотидной последовательности 3'-UTR и/или 5'-UTR наиболее стабильных видов мРНК, выбранных на стадии ж);

и. синтеза элемента 3'-UTR и/или элемента 5'-UTR, включенного в 3'-UTR и/или 5'-UTR, определенных на стадии з);

к. комбинирования элемента 3'-UTR и/или элемента 5'-UTR, синтезированных на стадии i), с открытой рамкой считывания для получения нуклеиновой кислоты, описанной в настоящем изобретении; и

л. необязательно сравнения экспрессии открытой рамки считывания, присутствующей в нуклеиновой кислоте по настоящему изобретению, по сравнению с экспрессией открытой рамки считывания в исходной нуклеиновой кислоте без элемента 3'- и/или элемента 5'-UTR согласно описанию настоящего изобретения.

Таким образом, подробности и предпочтительные варианты осуществления, описанные выше для способов по настоящему изобретению, также применимы в настоящем изобретении в пределах, указанных на стадиях от а) до л).

В частности, следующие меченые нуклеотиды являются предпочтительными для питания клеток на стадии а) предлагаемого способа: 4-тиуоридин (4sU), 2-тиоуридин, 6-тиогуанозин, 5-этинилуридин (ЕС), 5-бром-уридин (BrU), биотин-16-аминоаллилуридин, 5-аминоаллилулридин, 5-аминоаллилцитидин и т.д. Особенно предпочтительным является 4-тиоуридин (4sU). 4-тиоуридин предпочтительно используют в концентрации 100-500 мкМ. В другом варианте могут быть использованы радиоактивно меченые нуклеотиды, например, уридин-3Н. Могут быть использованы комбинации указанных выше нуклеотидов. Особенно предпочтительной является комбинация 4-тиоуридина и 6-тиогуанозина.

Инкубирование клеток с меченым нуклеотидом на стадии а) можно варьировать. Особенно предпочтительным является инкубирование (время питания клеток) от 10 минут до 24 ч. Особенно предпочтительными являются от 2 до 6 ч, более предпочтительно от 2 до 3 ч.

Клетки, которые могут быть применены в способах настоящего изобретения, в частности, линии клеток, первичные клетки, клетки в ткани или клетки субъектов. В некоторых вариантах осуществления настоящего изобретения в способе по настоящему изобретению могут быть применимы типы клеток, которые можно культивировать. Особенно предпочтительными являются клетки млекопитающих, например, клетки человека и клетки мыши. В особенно предпочтительных вариантах осуществления настоящего изобретения используют линии клеток человека HeLa и U-937 и линии клеток мыши NIH3T3, JAWSII и L929. Кроме того, первичные клетки особенно предпочтительны; в частности могут быть применимы дермальные фибробласты человека (HDF). В других вариантах меченый нуклеотид также можно наносить на ткань субъекта, и после окончания времени инкубирования РНК выделяют из ткани в соответствии со стадией в).

Для определения наиболее стабильных мРНК клеток (типов) общую РНК экстрагируют в первой временной точке, согласно описанному выше, например, через 0-6 ч после маркировки, предпочтительно через 3 ч после маркировки, и во второй временной точке в соответствии с описанным выше, например, через 3-48 ч после маркировки, предпочтительно через 10-24 ч, наиболее предпочтительно через 15 ч после маркировки. Вторая временная точка по времени по меньшей мере на 10 мин позже первой.

На стадии е) виды мРНК ранжируют в соответствии с соотношением, рассчитанным на этапе д). В этом контексте особенно предпочтительно выбирать 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 10%), 15%, 20% наиболее стабильных видов мРНК.

В этом контексте также предпочтительно выбирать виды мРНК, показывающие уровень транскрипта/количество мРНК, которое меньше по меньшей мере на 50% (меньше в 0,5 раза), по меньшей мере на 60% (меньше в 0,6 раза), по меньшей мере на 70% (меньше в 0,7 раза), по меньшей мере на 90% в (меньше в 0,9 раза) или по меньшей мере на 95% (меньше в 0,95 раза) во второй, более поздней временной точке по сравнению с первой. Этот вариант осуществления настоящего изобретения особенно предпочтителен, если РНК выделяют через 3 часа (первая временная точка) и через 15 ч (вторая временная точка) после маркировки.

В другом варианте или дополнительно отбирают такие виды мРНК, которые показывают соотношение, вычисленное на стадии д), соответствующее, по меньшей мере, 100% среднего соотношения, рассчитанного по всем проанализированным видам мРНК. Более предпочтительно такие выбранные виды мРНК, показывают соотношение по меньшей мере 150%, более предпочтительно по меньшей мере 200% и наиболее предпочтительно по меньшей мере 300% от среднего соотношения, рассчитанного по всем проанализированным видам мРНК.

На следующей стадии способа по настоящему изобретению определяют нуклеотидную последовательность 3'-UTR и/или 5'-UTR наиболее стабильных видов мРНК, выбранных на стадии ж), и на стадии и) 3'-UTR и/или 5'-UTR синтезируют, например, с помощью ПЦР-амплификации. Праймеры, используемые для ПЦР, предпочтительно могут содержать сайты рестрикции для клонирования. В другом варианте элемент 3'-UTR и/или элемент 5'-UTR предпочтительно может быть синтезирован (например, путем химического синтеза или отжигом).

На стадии к) способа по настоящему изобретению полученный фрагмент ПЦР или синтезированная последовательность объединяют с открытой рамкой считывания, в результате чего получают искусственную нуклеиновую кислоту, содержащую элемент 3'-UTR и/или элемент 5'-UTR по настоящему изобретению. Предпочтительно фрагмент или последовательность ПЦР могут быть клонированы в вектор.

В особенно предпочтительном варианте осуществления настоящего изобретения предусматривают способ, включающий стадии от а) до л) для идентификации элементов 3'-нетранслируемой области (элементов 3'-UTR) и/или элементов 5'-нетранслируемой области (элементов 5'-UTR), причем элементы 3'-UTR и/или элементы 5'-UTR продлевают выработку белка с молекулы искусственной нуклеиновой кислоты, включающей по меньшей мере один из элементов 3'-UTR и/или по меньшей мере один из элементов 5'-UTR.

В другом варианте осуществления настоящее изобретение также предусматривает способ выработки молекулы искусственной нуклеиновой кислоты, причем молекула искусственной нуклеиновой кислоты включает по меньшей мере одну открытую рамку считывания и по меньшей мере один из элементов 3'-UTR и/или по меньшей мере один из элементов 5'-UTR, идентифицированных методом идентификации элемента 3'-UTR и/или элемента 5'-UTR по настоящему изобретению согласно описанному выше. Синтез такой молекулы искусственной нуклеиновой кислоты обычно осуществляют способами, известными специалистам, например, методами клонирования, например, общеизвестными или описанными в настоящем изобретении.

Предпочтительно, вектор по настоящему изобретению, описанный в настоящем изобретении, применяют в таком способе по настоящему изобретению, для получения молекулы искусственной нуклеиновой кислоты.

Предпочтительно, молекула искусственной нуклеиновой кислоты, полученная таким способом получения молекулы искусственной нуклеиновой кислоты, представляет собой молекулу нуклеиновой кислоты в соответствии с настоящим изобретением.

Кроме того, настоящее изобретение также предусматривает молекулу искусственной нуклеиновой кислоты, получаемую способом получения молекулы искусственной нуклеиновой кислоты в соответствии с описанным настоящим изобретением.

Приводимые ниже фигуры, последовательности и примеры являются иллюстрациями настоящего изобретения. Они никоим образом не ограничивают рамок охвата настоящего изобретения.

Фиг. 1-11, 19-21 и 25-30 представляют последовательности, кодирующие мРНК, которые могут быть получены в результате транскрипции in vitro. Используют следующие аббревиатуры:

• PpLuc (GC): GC-обогащенная последовательность мРНК, кодирующая люциферазу Photinus pyralis;

• А64: поли(А)-последовательность, аденилированная 64 раза;

• С30: poly(С)-последовательность, цитидинилированная 30 раз;

• hSL: последовательность гистонной структуры стебель-петля, взятая из работы Cakmakci с соавтю, Mol. Cell. Biol. 28(3), 2008, 1182-1194;

• 32L4: 5'-UTR рибосомального белка человека, большой субъединицы 32, без 5'-концевого олигопиримидинового тракта;

• albumin7: 3'-UTR альбумина человека, три отдельные точечные мутации, интродуцированные для удаления сигнала терминации Т7, а также сайты рестрикции HindIII и XbaI;

• gnas: элемент 3'-UTR, производный от 3'-UTR gnas мыши; Mus musculus GNAS (белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий) комплексный локус (Gnas), мРНК;

• morn2: элемент 3'-UTR, производный от 3'-UTR morn2мыши; Mus musculus MORN-повтор содержащий 2 (Morn2), мРНК;

• gstml: элемент 3'-UTR, производный от gstm1 мыши; Mus musculus глутатион-S-трансфераза, mu 1mu 1 (Gstm1), мРНК;

• ndufa1: элемент 3'-UTR, производный от 3'-UTR ndufa1 мыши; Mus musculus NADH-дегидрогеназа (убихинон) 1 альфа-субкомплекс, (Ndufa1), мРНК;

• cbr2: элемент 3'-UTR, производный от 3'-UTR cbr2 мыши; Mus musculus карбонилредуктаза 2 (Cbr2), мРНК;

• mp68: элемент 5'-UTR, производный от 5'-UTR mp68 мыши; Mus musculus RIKEN кДНК 2010107E04 ген (2010107E04Rik), мРНК;

• ndufa4: элемент 5'-UTR, производный от 5'-UTR nudfa4 мыши; Mus musculus NADH дегидрогеназа (убихинон) 1 альфа субкомплекс 4 (Ndufa4), мРНК;

• Ybx1: элемент 3'-UTR, производный от 3'-UTR Ybx1 мыши (Y-Box связывающий белок 1);

• Ndufb8: элемент 3'-UTR, производный от 3'-UTR Ndufb8 мыши (NADH дегидрогеназа (убихинон) 1 бета субкомплекс 8);

• CNTN1: элемент 3'-UTR, производный от 3'-UTR CNTN1 человека (контактин 1).

Фиг. 1. Последовательность SEQ ID NO: 35, т.е. последовательность мРНК 32L4 - PpLuc(GC) - А64 - С30 - hSL. (R2464). 5'-UTR является производным мРНК рибосомального белка человека большой субъединицы 32 без 5' концевого олигопиримидинового тракта. ORF PpLuc (GC) выделена курсивом.

Фиг. 2. Последовательность SEQ ID NO: 36, т.е. последовательность мРНК 32L4 - PpLuc(GC) - gnas-A64-C30-hSL. (R3089). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от транскрипта Gnas мыши, подчеркнут.

Фиг. 3. Последовательность SEQ ID NO: 37, т.е. последовательность мРНК 32L4 - PpLuc(GC) - morn2- А64 - С30 - hSL. (R3106). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от morn2 мыши, подчеркнут.

Фиг. 4. Последовательность SEQ ID NO: 38, т.е. последовательность мРНК 32L4 - PpLuc(GC) - gstm1- А64 - С30 - hSL. (R3107). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от gstm1 мыши, подчеркнут.

Фиг. 5. Последовательность SEQ ID NO: 39, т.е. последовательность мРНК 32L4 - PpLuc(GC) - ndufal - А64 - С30 - hSL. (R3108). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от ndufa1 мыши, подчеркнут.

Фиг. 6. Последовательность SEQ ID NO: 40, т.е. последовательность мРНК 32L4 - PpLuc(GC) - cbr2 - А64 - С30 - hSL. (R3109). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от cbr2 мыши, подчеркнут.

Фиг. 7. Последовательность SEQ ID NO: 41, т.е. последовательность мРНК PpLuc(GC)-albumin7-A64-C30-hSL. (R2463). Элемент 3'-UTR, производный от альбумина человека с тремя точечными мутациями, интродуцированными для удаления сигнала терминации Т7, а также сайтами рестрикции HindIII и XbaI (albumin7). ORF PpLuc(GC) выделена курсивом.

Фиг. 8. Последовательность SEQ ID NO: 42, т.е. последовательность мРНК Мр68 - PpLuc(GC) - albumin7-A64-C30-hSL. (R3111). ORF PpLuc(GC) выделена курсивом. Элемент 5'-UTR, производный от mp68 мыши, подчеркнут.

Фиг. 9. Последовательность SEQ ID NO: 43, т.е. последовательность мРНК Ndufa4 - PpLuc(GC)-albumin7-A64-C30-hSL. (R3112). ORF PpLuc(GC) выделена курсивом. Элемент 5'-UTR, производный от Ndufa4 мыши, подчеркнут.

Фиг. 10. Последовательность SEQ ID NO: 44, т.е. последовательность мРНК PpLuc(GC)-A64-C30-hSL (R2462) The PpLuc(GC) ORF is highlighted in italics.

Фиг. 11. Последовательность SEQ ID NO: 45, т.е. последовательность мРНК PpLuc(GC)-gnas-A64-C30-hSL (R3116). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от Gnas мыши, подчеркнут.

Фиг. 12. Различные элементы 3'-UTR, а именно элементы 3'-UTR, которые являются производными gnas, morn2, gstm1, ndufa1 и cbr2 и очевино продлевают экспрессию белка с мРНК.

Исследуют влияние элементов 3'-UTR по настоящему изобретению, производных от gnas, morn2, gstm1, ndufa1 и cbr2 3'-UTR, на экспрессию люциферазы с мРНК, и сравнивают с экспрессией люциферазы с мРНК, не содержащей 3'-UTR. С этой целью HeLa человека трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряли в разное время после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc в течение 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч. 3'-UTR продлевают экспрессию люциферазы. Показаны средние значения трех независимых экспериментов. Значения суммированы в примере 7.а.

Фиг. 13. Различные элементы 3'-UTR, а именно элементы 3'-UTR, производные от gnas, morn2, gstm1, ndufa1 и cbr2, очевидно продлевают экспрессию белка с мРНК.

Исследуют влияние элементов 3'-UTR по настоящему изобретению, производных от gnas, morn2, gstm1, ndufa1 и cbr2 3'-UTR, на экспрессию люциферазы с мРНК, и сравнивают с экспрессией люциферазы с мРНК, не содержащей 3'-UTR. С этой целью дермальные фибробласты человека (human dermal fibroblasts - HDF) трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют в разное время после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc в течение 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч. 3'-UTR продлевают экспрессию люциферазы. Показаны средние значения трех независимых экспериментов. Значения суммированы в примере 7.а.

Фиг. 14. Различные элементы 5'-UTR, а именно элементы 5'-UTR, производные от Мр68 и ndufa4, очевидно повышают экспрессию белка с мРНК.

Исследуют влияние элементов 5'-UTR по настоящему изобретению, производных от Мр68 и ndufa4, на экспрессию люциферазы с мРНК. С этой целью клетки человека HeLa (human dermal fibroblasts - HDF) трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют через 6, 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Вычисляют общую экспрессию белка (площадь под кривой). Для сравнения уровней экспрессии с мРНК, содержащих элементы 5'-UTR по настоящему изобретению, с мРНК, не содержащей 5'-UTR, уровни экспрессии контрольной конструкции без 5 'UTR устанавливают равными 1. Показаны средние значения трех независимых экспериментов. Значения суммированы в примере 7.б.

Фиг. 15. Различные элементы 5'-UTR, а именно элементы 5'-UTR, производные от Мр68 и ndufa4, очевидно повышают экспрессию белка с мРНК.

Исследуют влияние элементов 5'-UTR по настоящему изобретению, производных от Мр68 и ndufa4, на экспрессию люциферазы с мРНК. С этой целью клетки HDF трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют через 6, 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Вычисляют общую экспрессию белка (площадь под кривой). Для сравнения уровней экспрессии с мРНК, содержащих элементы 5'-UTR по настоящему изобретению, с мРНК, не содержащей 5'-UTR, уровни экспрессии контрольной конструкции без 5 'UTR устанавливают равными 1. Показаны средние значения трех независимых экспериментов. Значения суммированы в примере 7.б.

Фиг. 16. элемент 3'-UTR, производный от gnas, очевидно продлевает экспрессию белка с мРНК.

Исследуют влияние элементов 3'-UTR по настоящему изобретению, производных от gnas 3'-UTR, на экспрессию люциферазы с мРНК, и сравнивают с экспрессией люциферазы с мРНК, не содержащей 3'-UTR. С этой целью клетки человека HDF трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют через 24, 48 и 72 после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc в течение 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч. Установлено, что gnas 3'-UTR продлевает экспрессию люциферазы. Результаты суммированы в примере 7.в.

Фиг. 17. Различные элементы 3'-UTR, производные от gnas, очевидно продлевают экспрессию белка с мРНК.

Исследуют влияние элемента 3'-UTR по настоящему изобретению, производному от gnas 3'-UTR, на экспрессию люциферазы с мРНК, и сравнивают с экспрессией люциферазы с мРНК, не содержащей 3'-UTR. С этой целью клетки HeLa трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют на 2 и 3 сутки (соответственно, d2 и d3) после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc в течение 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч. Установлено, что gnas 3'-UTR продлевает экспрессию люциферазы. Результаты суммированы в примере 7.в.

Фиг. 18. Различные элементы 3'-UTR, производные от ybx1(V2), ndufb8 и cntn1-004(V2), очевидно продлевают экспрессию белка с мРНК.

Исследуют влияние элемента 2'-UTR по настоящему изобретению, производному от ybx1(V2), ndufb8 и cntn1-004(V2) 3'-UTR, на экспрессию люциферазы с мРНК, и сравнивают с экспрессией люциферазы с мРНК, не содержащей 3'-UTR. С этой целью клетки HDF трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют в разные сроки после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc к 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч. Установлено, что 3'-UTR продлевает экспрессию люциферазы. Результаты суммированы в примере 7.г.

Фиг. 19. Элемент SEQ ID NO: 46, т.е. последовательность мРНК 32L4-PpLuc(GC)-Ybx1-001(V2)-A64-C30-hSL (R3623) mus musculus 3'UTR с мутацией T128bpG и делецией del236-237bp. ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от транскрипта Ybx1 мыши, подчеркнут.

Фиг. 20. Элемент SEQ ID NO: 47, т.е. последовательность 32L4-PpLuc(GC)-Ndufb8-A64-C30-hSL (R3624).

Фиг. 21. Элемент SEQ ID NO: 48, т.е. последовательность мРНК 32L4-PpLuc(GC)-Cntn1-004(V2)-A64-C30-hSL (R3625) +Т в положении 30 п.о., мутации G727bpT, A840bpG. ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от транскрипта Cntn1 человека, подчеркнут.

Фиг. 22. Различные элементы 3'-UTR, а именно элементы 3'-UTR, производные от gnas, morn2, ndufal (Mm; mus musculus) и NDUFA1 (Hs; homo sapiens), явно продлевают экспрессию с мРНК. Исследуют влияние элементов 3'-UTR по настоящему изобретению, производные от gnas, morn2, ndufa1 (Mm; mus musculus) и NDUFA1 (Hs; homo sapiens), на экспрессию люциферазы с мРНК и сравнивают с экспрессией люциферазы с мРНК без 3'-UTR. С этой целью клетки Hela человека трансфицируют соответствующими мРНК путем липофекции. Уровни люциферазы измеряют в разное время после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc к 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч. Установлено, что 3'-UTR продлевает экспрессию люциферазы. Показаны средние значения трех независимых экспериментов. Результаты суммированы в табл. 8.

Фиг. 23. Различные элементы 5'-UTR, а именно элементы 5'-UTR, производные от Мр68 и ndufa4, очевидно повышают экспрессию суммарного белка с мРНК. Исследуют влияние элементов 5'-UTR по настоящему изобретению, производных от Мр68 и ndufa4, на экспрессию люциферазы с мРНК. С этой целью клетки Hela человека трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют через 6, 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Рассчитывают общую экспрессию белка (площадь под кривой). Для сравнения уровней экспрессии мРНК, содержащей элементы 5'-UTR по настоящему изобретению, с мРНК без 5'-UTR, уровни контрольной конструкции без 5'-UTR устанавливают на 1. Показаны средние значения. Результаты суммированы в табл. 9.

Фиг. 24. Различные элементы 5'-UTR, а именно элементы 5'-UTR, производные от Мр68 и ndufa4, очевидно повышают экспрессию суммарного белка с мРНК. Исследуют влияние элементов 5'-UTR по настоящему изобретению, производных от Мр68 и ndufa4, на экспрессию люциферазы с мРНК. С этой целью клетки Hela человека трансфицируют различными мРНК путем липофекции. Уровни люциферазы измеряют через 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Рассчитывают общую экспрессию белка (площадь под кривой). Для сравнения уровней экспрессии мРНК, содержащих элементы 5'-UTR по настоящему изобретению, с мРНК без 5'-UTR, уровни экспрессии контрольной конструкции без 5'-UTR устанавливают на 1. Показаны средние значения. Результаты суммированы в табл. 9.

Фиг. 25. SEQ ID NO: 383, т.е. последовательность мРНК 32L4-PpLuc(GC)-A64-C30-hSL (R2462). ORF PpLuc(GC) выделена курсивом.

Фиг. 26. SEQ ID NO: 384, т.е. последовательность мРНК PpLuc(GC)-morn2-А64-С30-hSL. (R3948). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от morn2 мыши, подчеркнут.

Фиг. 27. SEQ ID NO: 385, т.е. последовательность мРНК PpLuc(GC)-ndufa1-A64-C30-hSL. (R4043). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от ndufa1 мыши, подчеркнут.

Фиг. 28. SEQ ID NO: 386, т.е. последовательность мРНК PpLuc(GC)-NDFUA1-A64-C30-hSL. (R3948). ORF PpLuc(GC) выделена курсивом. Элемент 3'-UTR, производный от NDUFA1 человека, подчеркнут.

Фиг. 29. SEQ ID NO: 387, т.е. последовательность мРНК Mp68-PpLuc(GC)-A64-C30-hSL. (R3954). ORF PpLuc(GC) выделена курсивом. Элемент 5'-UTR, производный от mp68 мыши, подчеркнут.

Фиг. 30. SEQ ID NO: 388, т.е. последовательность мРНК Ndufa4-PpLuc(GC)-A64-С30-hSL. (R3951). ORF PpLuc(GC) выделена курсивом. Элемент 5'-UTR, производный от ndufa4 мыши, подчеркнут.

Примеры

1. Идентификация элементов 3'-нетранслируемой области (элементов 3'-UTR) и/или элементов 5'-нетранслируемой области (элементов 5'-UTR), продлевающих и/или увеличивающих выработку белка

Распад мРНК в разных типах клеток человека и мыши оценивают методом вытеснения метки. С этой целью три разных типа клеток человека (HeLa, HDF и U-937) и три разных типа клеток мыши (NIH3T3, JAWSII и L929) высевают на ночь в соответствующую для них среду: HeLa, U-937, L929 в среду RPMI, JAWSII и NIH3T3 в среду DMEM и HDF в среду для роста фибробластов 2 (Fibroblast Growth Medium 2). Клетки инкубируют в течение 3 ч в соответствующей среде, содержащей 200 мкМ 4-тиоуридина (4sU), чтобы пометить вновь синтезированную РНК («импульс»). После инкубирования (нанесения метки) клетки промывают один раз и среду заменяют свежей средой, обогащенной 2 мМ уридином («вытеснение»). Клетки инкубируют дополнительно в течение 3 ч (1-я временная точка) или 15 ч (2-я временная точка) до завершения эксперимента.

Соответственно, клетки собирают через 3 ч (1-я временная точка) или 15 ч (2-я временная точка) после окончания нанесения метки. Суммарную РНК выделяют из этих клеток с использованием набора RNeasy Mini Kit (фирма Qiagen).

Затем HPDP-биотин (EZ-Link Biotin-HPDP, фирма Thermo Scientific; пиридилдитиол-активированный, сульфгидрил-реагирующий реагент для биотинилирования, который конъюгирует через расщепляемую (обратимую) дисульфидную связь) инкубируют с суммарной РНК с целью экстракции 4-тиоуридин(4sU)-меченой РНК. HPDP-биотин специфически реагирует с восстановленными тиолами (-SH) в 4-тиоуридиновый (4sU)-меченой РНК с образованием обратимых дисульфидных связей. Биотинилированную РНК подвергают ультрафильтрованию с использованием устройства Amicon-30, инкубируют со стрептавидин-связанными парамагнитными микрочастицами dynabeads (фирма Life Technologies) и извлекают из стрептавидина с помощью DTT. Затем РНК очищают с использованием набора RNeasy Mini Kit. Для каждой клеточной линии проводят три независимых эксперимента.

Выделенную 4sU-меченую РНК используют для в анализа на микрочипе для определения уровней транскрипции большого количества разнообразных видов мРНК (то есть количества видов мРНК), присутствующих в первой временной точке (через 3 часа после нанесения метки), и уровней транскрипции большого разнообразия видов мРНК (т.е. количества видов мРНК), присутствующих во второй временной точке (через 15 ч после нанесения метки). Используют микрочипы Affymetrix Human Gene 1.0 ST и Affymetrix Mouse Gene 1.0 ST. Микрочип Affymetrix Human Gene 1.0 ST содержит 36079 видов мРНК. Микрочип Affymetrix Mouse Gene 1.0 ST содержит 26166 видов мРНК.

Поскольку такие микрочипы обеспечивают полный охват транскриптов, то есть они обеспечивают полный профиль экспрессии мРНК, соотношение уровня транскриптов определенных видов мРНК во второй временной точке к уровню транскриптов тех же видов мРНК в первой временной точке, соответственно, определяют для большого числа видов мРНК. Эти соотношения, таким образом, отражают х-кратность уровней транскриптов видов мРНК (показанных в виде генных символов) во второй временной точке по сравнению с первой временной точкой.

Результаты этих экспериментов показаны ниже в табл. 1-3. Каждая из табл. 1-3 показывает ранжирование наиболее стабильных видов мРНК, то есть в соответствии с соотношением уровня транскрипта определенного вида мРНК во второй временной точке к уровню транскрипта определенного вида мРНК в первой временной точке (табл. 1: комбинированный анализ типов клеток человека (HeLa, HDF и U-937); табл. 2: комбинированный анализ линий клеток мыши (NIH3T3, JAWSII и L929); табл. 3: линия клеток человека HDF (дермальные фибробласты человека). Такие виды мРНК рассматривают в качестве «наиболее устойчивых видов мРНК», которые показывают величину соотношения уровня транскриптов в первой временной точке к уровню транскриптов во второй временной точке равной, по меньшей мере, 0,549943138 (приблизительно 55%, табл. 1), 0,676314425 (приблизительно 68%, табл. 2) или 0,8033973 (приблизительно 80%, табл. 3).

Также рассчитывают связь соотношения определенного вида мРНК со средним соотношением (т.е. средним соотношением всех определенных видов мРНК, показанном в таблицах в графе «Среднее соотношение») и приводят в качестве процента средней величины.

Таблица 1. Стабильные мРНК, образованные в результате комбинированного анализа типов клеток человека (HeLa, HDF и U-937) с микрочипом Affymetrix Human Gene 1.0 ST. 113 видов мРНК от 36079 образцов мРНК выбирают в качестве «наиболее стабильных» видов мРНК. Это соответствует 0,31% видов мРНК, находящихся на микрочипе.

Таблица 2. Стабильные мРНК, образованные в результате комбинированного анализа линий клеток мыши (NIH3T3, JAWSII и L929) с микрочипом Mouse Gene 1.0 ST: 99 видов мРНК от 26166 образцов мРНК на микрочипе выбирают в качестве «наиболее стабильных» видов мРНК. Это соответствует 0,38% видов мРНК, находящихся на микрочипе.

Таблица 3. Стабильные мРНК, образованные в результате анализа линии клеток человека HDF (дермальные фибробласты человека) с микрочипом Affymetrix Human Gene 1.0 ST: 46 видов мРНК из 36079 видов мРНК на микрочипе выбирают в качестве «наиболее стабильных» видов мРНК. Это соответствует 0,13% видов мРНК, находящихся на микрочипе.

2. Клонирование элементов 5'-UTR и 3'-UTR стабильно экспрессируемых мРНК

Нуклеотидную последовательность 5'- и/или 3'-UTR видов мРНК, показанных в табл. 1-3, определяют путем анализа базы данных и амплифицируют с помощью ПЦР или синтезировали путем олиго-отжига. Получаемые фрагменты ПЦР клонируют в векторе, что подробно описано в примере 3 ниже. Элементы 5'-UTR клонируют в векторе PpLuc (GC)-albumin7-A64-C30-hSL (SEQ ID NO: 41, фиг. 7); элементы 3'-UTR клонируют в векторе 32L4-PpLuc (GC)-A64-C30-hSL (SEQ ID NO: 35, фиг. 1) или в векторе PpLuc (GC)-A64-C30-hSL (SEQ ID NO: 44, фиг. 10).

3. Получение матриц ДНК

Конструируют вектор для транскрипции in vitro, содержащий промотор Т7 и последовательность, обогащенную GC, которая кодирует люциферазу Photinus pyralis (PpLuc (GC)). Последовательность A64 поли(А), за которой следует С30 и гистонная структура стебель-петля, инсертируют с 3'-конца PpLuc(GC). За последовательностью гистонной структуры стебель-петля следует сайт рестрикции, используемый для линеаризации вектора перед транскрипцией in vitro.

Для исследования влияния различных 3'-UTR элементов на экспрессию белка используют описанный выше вектор, который модифицируют, чтобы включить целевой элемент 3'-UTR. В другом варианте вектор конструируют согласно выше описанному, в результате чего 5'-нетранслируемую область (5'-UTR) 32L4 (рибосомальный белок большой субъединицы 32) инсертируют с 5'-конца PpLuc (GC). Затем этот вектор модифицируют, чтобы включить различные 3'-UTR-элементы, или не включать 3'-UTR (контроль).

В частности, следующие мРНК получают с этих векторов путем транскрипции in vitro (последовательности мРНК показаны на фиг. 1-6, фиг. 10, 11 и фиг. 19-21):

32L4-PpLuc(GC)-А64-С30-hSL (SEQ ID NO: 35, фиг. 1);

32L4-PpLuc(GC)-gnas-A64-C30-hSL (SEQ ID NO: 36, фиг. 2);

32L4-PpLuc(GC)-morn2-A64-C30-hSL (SEQ ID NO: 37, фиг. 3);

32L4-PpLuc(GC)-gstm1-A64-C30-hSL (SEQ ID NO: 38, фиг. 4);

32L4-PpLuc(GC)-ndufa1-A64-C30-hSL (SEQ ID NO: 39, фиг.5);

32L4-PpLuc(GC)-cbr2-A64-C30-hSL (SEQ ID NO: 40, фиг. 6);

PpLuc(GC)-A64-C30-hSL (SEQ ID NO: 44, фиг. 10);

PpLuc(GC)-gnas-A64-C30-hSL (SEQ ID NO: 45, фиг. 11);

32L4-PpLuc(GC)-Ybx1(V2)-A64-C30-hSL (SEQ ID NO: 46, фиг. 19);

32L4-PpLuc(GC)-Ndufb8-A64-C30-hSL (SEQ ID NO: 47, фиг. 20); и

32L4-PpLuc(GC)-Cntn1-004(V2)-A64-C30-hSL (SEQ ID NO: 48, фиг. 21).

Другой вариант последовательности конструкции 32L4-PpLuc(GC)-A64-С30-hSL показан на фиг. 25 (SEQ ID NO: 383). Однако, SEQ ID NO: 35, фиг. 1, применяют в описанных в настоящем изобретении примерах, и таким образом, она предпочтительнее для конструкции 32L4-PpLuc(GC)-A64-C30-hSL.

Для исследования влияния различных элементов 5'-UTR на экспрессию белка, конструируют вектор согласно описанному выше, в результате чего 3'-нетранслируемую область (3'-UTR) albumin7 (3'-UTR гена альбумина человека с тремя точечными мутациями, интродуцированными для удаления сигнала терминации Т7, а также сайта рестрикции HindIII и XbaI) инсертируют с 3'-конца PpLuc (GC). Этот вектор модифицируют таким образом, чтобы либо включить различные элементы 5'UTR, либо не включать 5'-UTR (контроль).

В частности, следующие мРНК получают с таких векторов путем транскрипции in vitro (последовательности мРНК представлены на фиг. 7-9): PpLuc(GC) albumin7-A64-C30-hSL (SEQ ID NO: 41, фиг. 7);

Mp68-PpLuc(GC)-albumin7-A64-C30-hSL (SEQ ID NO: 42, фиг. 8); и

Ndufa4-PpLuc(GC)-albumin7-A64-C30-hSL (SEQ ID NO: 43, фиг. 9);

4. Транскрипция in vitro

Матрицы ДНК в примерах 2 и 3 линеаризуруют и транскрибируют in vitro, используя полимеразу T7-RNA. Матрицы ДНК затем расщепляют обработкой ДНКазой. Транскрипты мРНК, содержащие структуру 5'-САР, получают добавлением избытка М7-метил-гуанозин-5'-трифосфат-5'-гуанозин в реакцию транскрипции. Полученную таким образом мРНК очищают и ресуспендируют в воде.

5. Экспрессия люциферазы путем липофекции мРНК

Дермальные фибробласты человека (Human dermal fibroblasts - HDF) и клетки HeLa высевают в 96-луночный планшет в количестве 1×104 клеток на лунку. На следующий день клетки промывают в Opti-MEM и трансфицируют с помощью 12,5 нг на лунку объединенной с Lipofectamine2000 PpLuc-кодирующей мРНК в Opti-MEM. Нетрансфицированные клетки служат контролем. Трансфицируют мРНК, кодирующую люциферазу Renilla reniformis (RrLuc), вместе с мРНК PpLuc для контроля эффективности трансфекции (1 нг RrLuc мРНК на лунку). Через 90 мин после начала трансфекции Opti-MEM заменяют средой. Через 6, 24, 48, 72 ч после трансфекции среду отсасывают и клетки лизируют в 100 мкл буфера Passive Lysis buffer (фирма Promega). Лизаты хранят при -80°С до измерения активности люциферазы.

6. Измерение люциферазы

Активность люциферазы измеряют в относительных световых единицах (relative light units - RLU) в планшетном ридере Hidex Chameleon. Активность Ppluc и Rrluc измеряют последовательно из одного образца путем двойного анализа люциферазы. Сначала измеряют активность PpLuc, время измерения 2 сек, используя 20 мкл лизата и 50 мкл лизирующего реактива Beetle juice (фирма pjk GmbH). После 1500 мсек задержки измеряют активность RrLuc с 50 мкл лизирующего реактива Beetle juice (фирма pjk GmbH).

7. Результаты

7а. Экспрессию белка с мРНК, содержащей элементы 3'-UTR по настоящему изобретению, повышают и продлевают.

Чтобы исследовать влияние различных элементов 3'-UTR на экспрессию белка с мРНК, мРНК, содержащие различные элементы 3'-UTR, сравнивают с мРНК без 3'-UTR.

Клетки человека HeLa и HDF трансфицируют мРНК, кодирующими люциферазу, и измеряют уровни люциферазы (в RLU) через 6, 24, 48 и 72 ч после трансфекции.

Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc к 24 ч принимают за 100% и рассчитывают относительную экспрессию за 24 ч (см. ниже табл. 4, а также фиг. 12 (клетки HeLa) и фиг. 13 (клетки HDF)).

Табл. 4 показывает относительную экспрессию PpLuc, нормализованную по RrLuc (приведены средние значения трех независимых экспериментов).

Люцифераза экспрессируется с мРНК, не содержащей 3'-UTR. Тем не менее, 3'-UTR-элементы по настоящему изобретению, gnas, morn2, gstml, ndufa и cbr2, существенно продлевают экспрессию люциферазы.

7б. Экспрессия белка с мРНК, содержащей элементы 5'-UTR по настоящему изобретению, повышена и/или продлена.

Чтобы исследовать влияние различных элементов 5'-UTR на экспрессию белка с мРНК, мРНК, содержащие различные 5'-UTR, сравнивают с мРНК, не содержащей 5'-UTR.

Клетки HeLa и HDF человека трансфицируют мРНК, кодирующими люциферазу, и уровни люциферазы измеряют через 6, 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Общую экспрессию белка от 0 до 72 часов рассчитывают в виде площади под кривой (AUC). Уровни контрольной конструкции без 5 'UTR устанавливают равными 1 (см. ниже табл. 5 и фиг. 14 (клетки HeLa) и фиг. 15 (клетки HDF)).

В табл. 5 показана общая экспрессия PpLuc, нормализованная по RrLuc (приведены средние значения трех независимых экспериментов).

Люцифераза экспрессируется с мРНК без 5'-UTR. Однако, элементы 5'-UTR по настоящему изобретению mp68 и ndufa4 значительно увеличивают экспрессию люциферазы.

7в. Экспрессия белка с мРНК, содержащей элементы 3'-UTR по настоящему изобретению, продлевается.

Чтобы исследовать влияние различных 3'UTR на экспрессию белка с мРНК, мРНК, содержащие разные 3'UTR, сравнивают с мРНК без 3'UTR.

Клетки HeLa и HDF человека трансфицируют мРНК, кодирующими люциферазу, и уровни люциферазы (в RLU) измеряют через 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc.

Общую экспрессию белка от 0 до 72 ч рассчитывают в виде площади под кривой (AUC). Уровни контрольной конструкции без 5 'UTR устанавливают равными 1 (см. ниже табл. 5 и фиг. 14 (клетки HeLa) и фиг. 15 (клетки HDF)). Нормализованные уровни PpLuc к 24 ч устанавливают на 100% и рассчитывают относительную экспрессию к 24 ч (см. табл. 6 и 16 (клетки HeLa) и табл. 17 (клетки HDF)).

В табл. 6 показана относительная экспрессия PpLuc, нормализованная по RrLuc (приведены средние значения трех независимых экспериментов).

7г. Продленная экспрессия белка с мРНК, содержащей элементы 3'-UTR по настоящему изобретению.

Чтобы исследовать влияние различных 3'UTR на экспрессию белка с мРНК, мРНК, содержащие различные 3'UTR, сравнивают с мРНК без 3'UTR.

Клетки HeLa и HDF человека трансфицируют мРНК, кодирующими люциферазу, и уровни люциферазы измеряют через 6, 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Общую экспрессию белка от 0 до 72 ч рассчитывают в качестве площади под кривой (AUC). Уровни контрольной конструкции без 5 'UTR устанавливают равными 1 (см. ниже табл. 7 и фиг. 18 (клетки HDF) и фиг. 17 (клетки HeLa)).

Клетки HeLa и HDF человека трансфицируют мРНК, кодирующей люциферазу, и уровни люциферазы (в RLU) измеряют через 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Нормализованные уровни PpLuc в течение 24 ч устанавливают на 100% и рассчитывают относительную экспрессию к 24 ч (см. табл. 7 и фиг. 18 (клетки HDF)).

В табл. 7 показывают относительную экспрессию PpLuc, нормализованную по RrLuc (приводят средние значения трех независимых экспериментов).

8. Влияние дополнительных 3'UTR на экспрессию белка

Чтобы дополнительно исследовать влияние различных 3'UTR на экспрессию белка с мРНК, получают новые конструкции мРНК, и эти мРНК, содержащие разные 3'UTR, сравнивают с мРНК без 3'UTR.

С этой целью, выбранные элементы 3'-UTR (gnas, morn2, ndufa1 и NDUFA1) клонируют в векторе PpLuc(GC)-A64-C30-hSL (SEQ ID NO: 44, фиг. 10), который конструируют таким образом, что он включает промотор Т7 и GC-обогащенную последовательность, кодирующую люциферазу Photinus pyralis (PpLuc(GC)). Последовательность A64 поли(А), за которой следует С30 и гистонная структура стебель-петля, инсертируют с 3'-конца PpLuc(GC). За последовательностью гистонной структуры стебель-петля следует сайт рестрикции, используемый для линеаризации вектора перед транскрипцией in vitro.

В частности, с таких векторов были получены следующие мРНК путем транскрипции in vitro (последовательности мРНК показаны на фиг. 11, 26-28):

PpLuc(GC)-gnas-A64-C30-hSL (SEQ ID NO: 45, фиг. 11);

PpLuc(GC)-morn2-A64-C30-hSL (SEQ ID NO: 384, фиг. 26);

PpLuc(GC)-ndufa1-A64-C30-hSL (SEQ ID NO: 385, фиг. 27); и

PpLuc(GC)-NDUFA1-A64-C30-hSL (SEQ ID NO: 386, фиг. 28).

Клетки HeLa человека трансфицируют мРНК, кодирующими люциферазу, и измеряют уровни люциферазы через 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc (см. ниже табл. 8 и фиг. 22).

Эти данные и данные, представленные на фиг. 22, показывают, что экспрессия белка с мРНК, содержащей элементы 3'-UTR, продлена.

9. Воздействие дополнительных 5'UTR на экспрессию белка.

Для дальнейшего исследования воздействия различных 5'UTR на экспрессию белка с мРНК получают новые конструкции мРНК, и те мРНК, которые содержат разные 5'UTR, сравнивают с мРНК без 5'UTR.

Для этой цели, отобранные элементы 5'-UTR (mp68 и ndufa4) клонируют в векторе PpLuc(GC)-A64-C30-hSL (SEQ ID NO: 44, фиг. 10), который конструируют, включая промотор Т7 и GC-обогащенную последовательность, кодирующую люциферазу Photinus pyralis (PpLuc(GC)).

Последовательность А64 поли(А), за которой следует С30 и гистонная структура стебель-петля, инсертируют с 3'-конца PpLuc(GC). За последовательностью гистонной структуры стебель-петля следует сайт рестрикции, используемый для линеаризации вектора перед транскрипцией in vitro.

В частности, следующие мРНК получают с таких векторов путем транскрипции in vitro (последовательности мРНК показаны на фиг. 29 и 30):

Mp68-PpLuc(GC)-A64-C30-hSL (SEQ ID NO: 387, фиг. 29); и

Ndufa4-PpLuc(GC)-A64-C30-hSL (SEQ ID NO: 388, фиг. 30).

Клетки HDF и HeLa человека трансфицируют мРНК, кодирующими люциферазу, и уровни люциферазы измеряют через 24, 48 и 72 ч после трансфекции. Сигнал PpLuc корректируют по эффективности трансфекции сигналом котрансфицированного RrLuc. Расчитывают общую экспрессию белка (область под кривой). Уровни контрольной конструкции без 5'-UTR устанавливают на 1 (см. приведенные ниже табл. 9, а также фиг. 23 и 24).

Эти данные и данные, представленные на фиг. 23 и 24, показывают, что экспрессия белка с мРНК, содержащей элементы 5'-UTR в соответствии с настоящим изобретением, увеличивается.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> CUREVAC AG

<120> Novel artificial nucleic acid molecules

<130> CU01P167WO1

<150> PCT/EP2014/003479

<151> 2014-12-30

<160> 388

<170> PatentIn version 3.5

<210> 1

<211> 351

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus GNAS 3'-UTR

<400> 1

gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60

gtacaagcag ttggtcaccc accatagggc atgatcaaca ccgcaacctt tcctttttcc 120

cccagtgatt ctgaaaaacc cctcttccct tcagcttgct tagatgttcc aaatttagta 180

agcttaaggc ggcctacaga agaaaaagaa aaaaaaggcc acaaaagttc cctctcactt 240

tcagtaaata aaataaaagc agcaacagaa ataaagaaat aaatgaaatt caaaatgaaa 300

taaatattgt ttgtgcagca ttaaaaaatc aataaaaatt aaaaatgagc a 351

<210> 2

<211> 353

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus GNAS 3'-UTR

<400> 2

gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60

tgtacaagca gttggtcacc caccataggg catgatcaac accgcaacct ttcctttttc 120

ccccagtgat tctgaaaaac ccctcttccc ttcagcttgc ttagatgttc caaatttagt 180

aagcttaagg cggcctacag aagaaaaaga aaaaaaaggc cacaaaagtt ccctctcact 240

ttcagtaaat aaaataaaag cagcaacaga aataaagaaa taaatgaaat tcaaaatgaa 300

ataaatattg tgttgtgcag cattaaaaaa tcaataaaaa ttaaaaatga gca 353

<210> 3

<211> 385

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GNAS 3'-UTR

<400> 3

gaagggaacc cccaaattta attaaagcct taagcacaat taattaaaag tgaaacgtaa 60

ttgtacaagc agttaatcac ccaccatagg gcatgattaa caaagcaacc tttcccttcc 120

cccgagtgat tttgcgaaac ccccttttcc cttcagcttg cttagatgtt ccaaatttag 180

aaagcttaag gcggcctaca gaaaaaggaa aaaaggccac aaaagttccc tctcactttc 240

agtaaaaata aataaaacag cagcagcaaa caaataaaat gaaataaaag aaacaaatga 300

aataaatatt gtgttgtgca gcattaaaaa aaatcaaaat aaaaattaaa tgtgagcaaa 360

gaatgaaaaa aaaaaaaaaa aaaaa 385

<210> 4

<211> 1476

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GNAS 3'-UTR

<400> 4

tggaggacgc cgtccagatt ctccttgttt tcatggattc aggtgctgga gaatctggta 60

aaagcaccat tgtgaagcag atgaggatcc tgcatgttaa tgggtttaat ggagagggcg 120

gcgaagagga cccgcaggct gcaaggagca acagcgatgg cagtgagaag gcaaccaaag 180

tgcaggacat caaaaacaac ctgaaagagg cgattgaaac cattgtggcc gccatgagca 240

acctggtgcc ccccgtggag ctggccaacc ccgagaacca gttcagagtg gactacatcc 300

tgagtgtgat gaacgtgcct gactttgact tccctcccga attctatgag catgccaagg 360

ctctgtggga ggatgaagga gtgcgtgcct gctacgaacg ctccaacgag taccagctga 420

ttgactgtgc ccagtacttc ctggacaaga tcgacgtgat caagcaggct gactatgtgc 480

cgagcgatca ggacctgctt cgctgccgtg tcctgacttc tggaatcttt gagaccaagt 540

tccaggtgga caaagtcaac ttccacatgt ttgacgtggg tggccagcgc gatgaacgcc 600

gcaagtggat ccagtgcttc aacgatgtga ctgccatcat cttcgtggtg gccagcagca 660

gctacaacat ggtcatccgg gaggacaacc agaccaaccg cctgcaggag gctctgaacc 720

tcttcaagag catctggaac aacagatggc tgcgcaccat ctctgtgatc ctgttcctca 780

acaagcaaga tctgctcgct gagaaagtcc ttgctgggaa atcgaagatt gaggactact 840

ttccagaatt tgctcgctac actactcctg aggatgctac tcccgagccc ggagaggacc 900

cacgcgtgac ccgggccaag tacttcattc gagatgagtt tctgaggatc agcactgcca 960

gtggagatgg gcgtcactac tgctaccctc atttcacctg cgctgtggac actgagaaca 1020

tccgccgtgt gttcaacgac tgccgtgaca tcattcagcg catgcacctt cgtcagtacg 1080

agctgctcta agaagggaac ccccaaattt aattaaagcc ttaagcacaa ttaattaaaa 1140

gtgaaacgta attgtacaag cagttaatca cccaccatag ggcatgatta acaaagcaac 1200

ctttcccttc ccccgagtga ttttgcgaaa cccccttttc ccttcagctt gcttagatgt 1260

tccaaattta gaaagcttaa ggcggcctac agaaaaagga aaaaaggcca caaaagttcc 1320

ctctcacttt cagtaaaaat aaataaaaca gcagcagcaa acaaataaaa tgaaataaaa 1380

gaaacaaatg aaataaatat tgtgttgtgc agcattaaaa aaaatcaaaa taaaaattaa 1440

atgtgagcaa agaatgaaaa aaaaaaaaaa aaaaaa 1476

<210> 5

<211> 117

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus MORN2 3'-UTR

<400> 5

acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60

ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcaccc 117

<210> 6

<211> 135

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus MORN2 3'-UTR

<400> 6

acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60

ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcacccaca 120

aaaaaaaaaa aaaaa 135

<210> 7

<211> 210

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MORN2 3'-UTR

<400> 7

catgtagatg tgatgttaaa ttaaagttga aatgtagtaa ttgaagcttt tagttgtaag 60

gaaagcaact taatctgtta tttgaaatga cttcatacac tacccctata agtttgccaa 120

taaaaccatc acctgcttac acctttttga actttatatt cattgtctta caattagttt 180

aaaataaatg acatgattca aaaaaaaaaa 210

<210> 8

<211> 438

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus GSTM1 3'-UTR

<400> 8

gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60

tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120

tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180

ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240

tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300

gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360

agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420

tgaaacacac ttgccatg 438

<210> 9

<211> 455

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus GSTM1 3'-UTR

<400> 9

gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60

tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120

tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180

ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240

tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300

gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360

agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420

tgaaacacac ttgccatgaa aaaaaaaaaa aaaaa 455

<210> 10

<211> 531

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GSTM1 3'-UTR

<400> 10

ggccttgaag gccaggaggt gggagtgagg agcccatact cagcctgctg cccaggctgt 60

gcagcgcagc tggactctgc atcccagcac ctgcctcctc gttcctttct cctgtttatt 120

cccatcttta ctcccaagac ttcattgtcc ctcttcactc cccctaaacc cctgtcccat 180

gcaggccctt tgaagcctca gctacccact atccttcgtg aacatcccct cccatcatta 240

cccttccctg cactaaagcc agcctgacct tccttcctgt tagtggttgt gtctgcttta 300

aagggcctgc ctggcccctc gcctgtggag ctcagccccg agctgtcccc gtgttgcatg 360

aaggagcagc attgactggt ttacaggccc tgctcctgca gcatggtccc tgccttaggc 420

ctacctgatg gaagtaaagc ctcaaccaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 531

<210> 11

<211> 133

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus NDUFA1 3'-UTR

<400> 11

ggaagcattt tcctggctga ttaaaagaaa ttactcagct atggtcatct gttcctgtta 60

gaaggctatg cagcatatta tatactatgc gcatgttatg aaatgcataa taaaaaattt 120

taaaaaatct aaa 133

<210> 12

<211> 148

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NDUFA1 3'-UTR

<400> 12

ggaagcattt tcctgattga tgaaaaaaat aactcagtta tggccatcta cccctgctag 60

aaggttacag tgtattatgt agcatgcaat gtgttatgta gtgcttaata aaaataaaat 120

gaaaaaaatg caaaaaaaaa aaaaaaaa 148

<210> 13

<211> 237

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus CBR2 3'-UTR

<400> 13

tctgctcagt tgccgcggac atctgagtgg ccttcttagc cccaccctca gccaaagcat 60

ttactgatct cgtgactccg ccctcatgct acagccacgc ccaccacgca gctcacagtt 120

ccacccccat gttactgtcg atcccacaac cactccaggc gcagaccttg ttctctttgt 180

ccactttgtt gggctcattt gcctaaataa acgggccacc gcgttacctt taactat 237

<210> 14

<211> 416

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus YBX1 3'-UTR

<400> 14

atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60

tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120

tttgcccgct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180

tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240

aaaaaaaggc ctggtttttc tcaatacacc tttaacggtt tttaaattgt ttcatatctg 300

gtcaagttga gatttttaag aacttcattt ttaatttgta ataaagttta caacttgatt 360

ttttcaaaaa agtcaacaaa ctgcaagcac ctgttaataa aggtcttaaa taataa 416

<210> 15

<211> 418

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus YBX1 3'-UTR

<400> 15

atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60

tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120

tttgccctct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180

tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240

aaaaaaaaag gcctggtttt tctcaataca cctttaacgg tttttaaatt gtttcatatc 300

tggtcaagtt gagattttta agaacttcat ttttaatttg taataaagtt tacaacttga 360

ttttttcaaa aaagtcaaca aactgcaagc acctgttaat aaaggtctta aataataa 418

<210> 16

<211> 415

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens YBX1 3'-UTR

<400> 16

atgccggctt accatctcta ccatcatccg gtttagtcat ccaacaagaa gaaatatgaa 60

attccagcaa taagaaatga acaaaagatt ggagctgaag acctaaagtg cttgcttttt 120

gcccgttgac cagataaata gaactatctg cattatctat gcagcatggg gtttttatta 180

tttttaccta aagacgtctc tttttggtaa taacaaacgt gttttttaaa aaagcctggt 240

ttttctcaat acgcctttaa aggtttttaa attgtttcat atctggtcaa gttgagattt 300

ttaagaactt catttttaat ttgtaataaa agtttacaac ttgatttttt caaaaaagtc 360

aacaaactgc aagcacctgt taataaaggt cttaaataat aaaaaaaaaa aaaaa 415

<210> 17

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufb8 3'-UTR

<400> 17

ggaggcttga tgggcttttt gccctcgttc ctagaggctt aaccataata aaatccctaa 60

taaagc 66

<210> 18

<211> 125

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens Ndufb8 3'-UTR

<400> 18

ggaggcttcg tgggcttttg ggtcctctaa ctaggactcc ctcattccta gaaatttaac 60

cttaatgaaa tccctaataa aactcagtgc tgtgttattt gtgcctcaaa aaaaaaaaaa 120

aaaaa 125

<210> 19

<211> 377

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens Ndufb8 3'-UTR

<400> 19

gtgaggaaga ggagtgctgt tcctgccttc ctagcccagc tgggtctgac cagaggctac 60

tgtgtaccca tttaccatgc gtgattgtta actcagagtg gggtgtagcc aggtattgac 120

tgaatgtatg ttcttgctga cctgtgtttt tttctgtagg gaccaaagca gtatccttac 180

aataatctgt acctggaacg aggcggtgat ccctccaaag aaccagagcg ggtggttcac 240

tatgagatct gaggaggctt cgtgggcttt tgggtcctct aactaggact ccctcattcc 300

tagaaattta accttaatga aatccctaat aaaactcagt gctgtgttat ttgtgcctca 360

aaaaaaaaaa aaaaaaa 377

<210> 20

<211> 922

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1-004 3'-UTR

<400> 20

tcgttgacac tcaccatttc tgtgaaagac tttttttttt tttaacatat tatactagat 60

ttgactaact caatcttgta gcttctgcag ttctccccac ccccaaccta gttcttagag 120

tatgtttccc cttttgaaac atgtaaacat actttgggca taaatatttt ttaaaatata 180

actataatgc ttcactaata ccttaaaaat gcctagtgaa ctaactcagt acattatata 240

atggccaagt gaaagttttg tgttttcatg tcctgttttt ctttgaaatt atatagccca 300

gaaattagct cattatctga aaaacgtata agaactgatg aattgtataa tacaggagta 360

ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420

tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480

tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540

caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600

gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660

ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720

tagatctttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780

ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaatg 840

ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900

ataattttga ttttcttaga ca 922

<210> 21

<211> 922

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1-004 3'-UTR

<400> 21

tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60

tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120

atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180

ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240

tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300

aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360

ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420

tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480

tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540

caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600

gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660

ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720

tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780

ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840

ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900

ataattttga ttttcttaga ca 922

<210> 22

<211> 928

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1-004 3'-UTR

<400> 22

ttttttcgtt gacactcacc atttctgtga aagacttttt ttttttttaa catattatac 60

tagatttgac taactcaatc ttgtagcttc tgcagttctc cccaccccca acctagttct 120

tagagtatgt ttcccctttt gaaacatgta aacatacttt gggcataaat attttttaaa 180

atataactat aatgcttcac taatacctta aaaatgccta gtgaactaac tcagtacatt 240

atataatggc caagtgaaag ttttgtgttt tcatgtcctg tttttctttg aaattatata 300

gcccagaaat tagctcatta tctgaaaaac gtatgaagaa ctgatgaatt gtataataca 360

ggagtattgc cattgaatgt actgtttgat ttattcaagc aggtaatgaa caatgttgtc 420

aaactctcta atgagacatc ataattagga cataagctaa aaggggcatt actccggcag 480

tctttttttc ttaatcctag taccatacat attctttggc atgaaagaat gaaaagcatt 540

agtaaacaac tgaagtccta ccatggctct gtagggtttt tggaacaatt cctggaattg 600

gaaagtgaaa atggatagca tgtgggggaa accctcatct gagtagcaag attttagtaa 660

agatgactaa gccattaaca gcatgcattc atatttaatt ttattgactc ctgccatcag 720

cttttgtaga tcttttgggt ggaaggttgt gatttttact gggaggactt gagtagaagt 780

ggatgattaa aattgaggag tatataattc tttctgggac tgcttaaatg ttattgtttg 840

aaaatgcctt cactttcccc ctttggtcaa agagatgtgc ttaaaattct tattccttca 900

caataaataa ttttgatttt cttagaca 928

<210> 23

<211> 2380

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1-004 3'-UTR

<400> 23

atgtgttgtg acagctgctg ttcccatccc agctcagaag acacccttca accctgggat 60

gaccacaatt ccttccaatt tctgcggctc catcctaagc caaataaatt atactttaac 120

aaactattca actgatttac aacacacatg atgactgagg cattcgggaa ccccttcatc 180

caaaagaata aacttttaaa tggatataaa tgatttttaa ctcgttccaa tatgccttat 240

aaaccactta acctgattct gtgacagttg catgatttaa cccaatggga caagttacag 300

tgttcaattc aatactatag gctgtagagt gaaagtcaaa tcaccatata caggtgcttt 360

aaatttaata acaagttgtg aaatataata gagattgaaa tgttggttgt atgtggtaaa 420

tgtaagagta atacagtctc ttgtactttc ctcactgttt tgggtactgc atattattga 480

atggccccta tcattcatga catcttgagt tttcttgaaa agacaataga gtgtaacaaa 540

tattttgtca gaaatcccat tatcaaatca tgagttgaaa gattttgact attgaaaacc 600

aaattctaga acttactatc agtattctta ttttcaaagg aaataatttt ctaaatattt 660

gattttcaga atcagttttt taatagtaaa gttaacatac catatagatt tttttttact 720

tttatattct actctgaagt tattttatgc ttttcttatc aatttcaaat ctcaaaaatc 780

acagctctta tctagagtat cataatattg ctatatttgt tcatatgtgg agtgacaaat 840

tttgaaaagt agagtgcttc cttttttatt gagatgtgac agtctttaca tggttaggaa 900

taagtgacag ttaagtgaat atcacaatta ctagtatgtt ggtttttctg cttcattcct 960

aagtattacg tttctttatt gcagatgtca gatcaaaaag tcacctgtag gttgaaaaag 1020

ctaccgtatt ccattttgta aaaataacaa taataataat aataataatt agttttaagc 1080

tcatttccca cttcaatgca atactgaaaa ctggctaaaa ataccaaatc aatatactgc 1140

taatggtact ttgaagagta tgcaaaactg gaaggccagg aggaggcaaa taatatgtct 1200

ttccgatggt gtctcccaag tgttggtgct ttgggttttt ataagttgtg aaaaggaaga 1260

tgcacatttc ttcattctcc atggtgtgca tggaaatgtg tttgagtgtg gatgtaaaag 1320

aaatcgagta ataaagaatt agctggcttg tgaaatagtg cagtgttgga tgcttcaaga 1380

ggtataatcc tattttatta gcacaaactt gctagctaat tagagtttat ctttttagaa 1440

aggacaccgt ataggttcgt aaaaaatatt tacaggaagc aaaatagatc tattactact 1500

ttaccgactt tacccccttt ctttaatttg tataattttt gtactatata tcgatgtgta 1560

aatgtttaga gtcttcatta tgaaaatatc aataaatatt tcattagttt acatttaact 1620

ctggtataaa atgaaacttt taaaaataag tgaaatggat gatttcccag tggaagtatg 1680

tcaacagtct taagatcatt gccagatttc ataaaatatt taagtatttg aaaaagaaac 1740

aaaatgtctt catactttag ggaaacgaat accctgtata ccttctgtac aaatgtttgt 1800

gttttcattg ttacactttg gggttttact tttgcaatgt gacccatgtt gggcattttt 1860

atataatcaa caactaaatc ttttgccaaa tgcatgcttg ccttttattt tctaatatat 1920

gataataacg agcaaaactg gttagatttt gcatgaaatg gttctgaaag gtaagaggaa 1980

aacagacttt ggaggttgtt tagttttgaa tttctgacag agataaagta gtttaaaatc 2040

tctcgtacac tgataactca agcttttcat tttctcatac agttgtacag atttaactgg 2100

gaccatcagt tttaaactgt tgtcaagcta actaataatc atctgcttta agacgcaaga 2160

ttctgaatta aactttatat aggtatagat acatctgttg tttctttgta tttcaggaaa 2220

ggtgatagta gttttatttg atactgataa atattgaatt gattttttag ttatttttta 2280

tcattttttc aatggagtag tataggactg tgctttgtcc tttttatgaa tgaaaaaatt 2340

agtataaagt aataaatgtc ttatgttacc caagaaaaaa 2380

<210> 24

<211> 1204

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1-004 3'-UTR

<400> 24

tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60

tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120

atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180

ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240

tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300

aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360

ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420

tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480

tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540

caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600

gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660

ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720

tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780

ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840

ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900

ataattttga ttttcttaga caggtttgtg tttaggtatg agtttctctt ttacttcatc 960

tagcaattct ctctgtggtc agaagaactc tgaagaaagc tttgagggaa atgaatataa 1020

ctcttaaatt attatatgtg tgtgtatata tatagtttaa ctttaaaaat aatttattag 1080

tcatcataaa gaaataaatg tctctggctc aagatgttac ttatttcctt cttttatatt 1140

ttctagtctc aattactgtt ccaaaaggag ctatcttaga acttagacta gagatccaga 1200

ttaa 1204

<210> 25

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus MP68 5'-UTR

<400> 25

ctttcccatt ctgtagcaga atttggtgtt gcctgtggtc ttggtcccgc ggag 54

<210> 26

<211> 97

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MP68 5'-UTR

<400> 26

cttcccggca tcccctgcgc gcgcctgcgc gctcggtgac ctttccgagt tggctgcaga 60

tttgtggtgc gttctgagcc gtctgtcctg cgccaag 97

<210> 27

<211> 315

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MP68 5'-UTR

<400> 27

cttcccggca tcccctgcgc gcgcctgcgc gctcggtgac ctttccgagt tggctgcaga 60

tttgtggtgc gttctgagcc gtctgtcctg cgccaaggga gcgtaccttg gccttgagag 120

gttcagctgc ctaacccaga ggctacgcag agttagagaa gccagagtcc aagccaagaa 180

ctctgactcc acatccagtc ccttctctcc tttataactc aagtttcctt gcgccacact 240

gccctccacg ttatgctgta catgacaact tgggtgaggc aacagggaag ctgaaaagag 300

atcatacggt gctga 315

<210> 28

<211> 81

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus NDUFA4 5'-UTR

<400> 28

gtccgctcag ccaggttgca gaagcggctt agcgtgtgtc ctaatcttct ctctgcgtgt 60

aggtaggcct gtgccgcaaa c 81

<210> 29

<211> 81

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NDUFA4 5'-UTR

<400> 29

guccgcucag ccagguugca gaagcggcuu agcguguguc cuaaucuucu cucugcgugu 60

agguaggccu gugccgcaaa c 81

<210> 30

<211> 129

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NDUFA4 5'-UTR

<400> 30

gggtccttca ggtaggaggt cctgggtgac tttggaagtc cgtagtgtct cattgcagat 60

aatttttagc ttagggcctg gtggctaggt cggttctctc ctttccagtc ggagacctct 120

gccgcaaac 129

<210> 31

<211> 186

<212> DNA

<213> Artificial Sequence

<220>

<223> Human albumin 3'-UTR

<400> 31

catcacattt aaaagcatct cagcctacca tgagaataag agaaagaaaa tgaagatcaa 60

aagcttattc atctgttttt ctttttcgtt ggtgtaaagc caacaccctg tctaaaaaac 120

ataaatttct ttaatcattt tgcctctttt ctctgtgctt caattaataa aaaatggaaa 180

gaatct 186

<210> 32

<211> 186

<212> DNA

<213> Artificial Sequence

<220>

<223> albumin7 3'-UTR

<400> 32

catcacattt aaaagcatct cagcctacca tgagaataag agaaagaaaa tgaagatcaa 60

tagcttattc atctcttttt ctttttcgtt ggtgtaaagc caacaccctg tctaaaaaac 120

ataaatttct ttaatcattt tgcctctttt ctctgtgctt caattaataa aaaatggaaa 180

gaacct 186

<210> 33

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<223> 5'-UTR of human ribosomal protein Large 32 lacking the 5'

terminal oligopyrimidine tract

<400> 33

ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42

<210> 34

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> histone stem-loop

<400> 34

caaaggctct tttcagagcc acca 24

<210> 35

<211> 1848

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - A64 - C30 - hSL

<400> 35

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguagaucu aaaaaaaaaa aaaaaaaaaa 1740

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaugcauc cccccccccc 1800

cccccccccc cccccccccc aaaggcucuu uucagagcca ccagaauu 1848

<210> 36

<211> 2201

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - gnas-A64-C30-hSL

<400> 36

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uagugaaggg aacacccaaa uuuaauucag 1740

ccuuaagcac aauuaauuaa gagugaaacg uaauuguaca agcaguuggu cacccaccau 1800

agggcaugau caacaccgca accuuuccuu uuucccccag ugauucugaa aaaccccucu 1860

ucccuucagc uugcuuagau guuccaaauu uaguaagcuu aaggcggccu acagaagaaa 1920

aagaaaaaaa aggccacaaa aguucccucu cacuuucagu aaauaaaaua aaagcagcaa 1980

cagaaauaaa gaaauaaaug aaauucaaaa ugaaauaaau auuguguugu gcagcauuaa 2040

aaaaucaaua aaaauuaaaa augagcaaga ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa 2100

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc aucccccccc cccccccccc 2160

cccccccccc cccaaaggcu cuuuucagag ccaccagaau u 2201

<210> 37

<211> 1965

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - morn2- A64 - C30 - hSL

<400> 37

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguaccugc ugccuuaacg cugagaugug 1740

gccucugcaa ccccccuuag gcaaagcaac ugaaccuucu gcuaaaguga ccugcccucu 1800

uccguaaguc caauaaaguu gucaugcacc cagaucuaaa aaaaaaaaaa aaaaaaaaaa 1860

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc 1920

cccccccccc cccccccaaa ggcucuuuuc agagccacca gaauu 1965

<210> 38

<211> 2286

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - gstm1- A64 - C30 - hSL

<400> 38

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uagugcccuu gcuacacggg cacucacuag 1740

gaggaccugu ccacacuggg gauccugcag gcccugggug gggacagcac ccuggccuuc 1800

ugcacugugg cuccugguuc ucucuccuuc ccgcucccuu cugcagcuug gucagcccca 1860

ucuccucacc cucuucccag ucaaguccac acagccuuca uucuccccag uuucuuucac 1920

auggccccuu cuucauuggc ucccugaccc aaccucacag cccguuucug cgaacugagg 1980

ucuguccuga acucacgcuu ccuagaauua ccccgauggu caacacuauc uuagugcuag 2040

cccucccuag aguuaccccg aaggucaaua cuugagugcc agccuguucc ugguggagua 2100

gccuccccag gucugucucg ucuacaauaa agucugaaac acacuugcca ugagaucuaa 2160

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220

aaugcauccc cccccccccc cccccccccc ccccccccaa aggcucuuuu cagagccacc 2280

agaauu 2286

<210> 39

<211> 1981

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - ndufa1 - A64 - C30 - hSL

<400> 39

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguggaagc auuuuccugg cugauuaaaa 1740

gaaauuacuc agcuaugguc aucuguuccu guuagaaggc uaugcagcau auuauauacu 1800

augcgcaugu uaugaaaugc auaauaaaaa auuuuaaaaa aucuaaaaga ucuaaaaaaa 1860

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc 1920

aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag ccaccagaau 1980

u 1981

<210> 40

<211> 2085

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - cbr2 - A64 - C30 - hSL

<400> 40

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguucugcu caguugccgc ggacaucuga 1740

guggccuucu uagccccacc cucagccaaa gcauuuacug aucucgugac uccgcccuca 1800

ugcuacagcc acgcccacca cgcagcucac aguuccaccc ccauguuacu gucgauccca 1860

caaccacucc aggcgcagac cuuguucucu uuguccacuu uguugggcuc auuugccuaa 1920

auaaacgggc caccgcguua ccuuuaacua uagaucuaaa aaaaaaaaaa aaaaaaaaaa 1980

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc 2040

cccccccccc cccccccaaa ggcucuuuuc agagccacca gaauu 2085

<210> 41

<211> 1997

<212> RNA

<213> Artificial Sequence

<220>

<223> PpLuc(GC) - albumin7- A64 - C30 - hSL

<400> 41

gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60

cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120

ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180

guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240

ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300

ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360

gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420

gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480

gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540

cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600

caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660

cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720

cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780

ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840

gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900

cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960

gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020

cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080

ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140

ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200

gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260

cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320

cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380

gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440

cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500

gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560

cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620

ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuagugcau 1680

cacauuuaaa agcaucucag ccuaccauga gaauaagaga aagaaaauga agaucaauag 1740

cuuauucauc ucuuuuucuu uuucguuggu guaaagccaa cacccugucu aaaaaacaua 1800

aauuucuuua aucauuuugc cucuuuucuc ugugcuucaa uuaauaaaaa auggaaagaa 1860

ccuagaucua aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920

aaaaaaaaaa aaaugcaucc cccccccccc cccccccccc ccccccccca aaggcucuuu 1980

ucagagccac cagaauu 1997

<210> 42

<211> 2048

<212> RNA

<213> Artificial Sequence

<220>

<223> Mp68 - PpLuc(GC) - albumin7- A64 - C30 - hSL

<400> 42

gggcuuuccc auucuguagc agaauuuggu guugccugug gucuuggucc cgcggagaag 60

cuugaggaug gaggacgcca agaacaucaa gaagggcccg gcgcccuucu acccgcugga 120

ggacgggacc gccggcgagc agcuccacaa ggccaugaag cgguacgccc uggugccggg 180

cacgaucgcc uucaccgacg cccacaucga ggucgacauc accuacgcgg aguacuucga 240

gaugagcgug cgccuggccg aggccaugaa gcgguacggc cugaacacca accaccggau 300

cguggugugc ucggagaaca gccugcaguu cuucaugccg gugcugggcg cccucuucau 360

cggcguggcc gucgccccgg cgaacgacau cuacaacgag cgggagcugc ugaacagcau 420

ggggaucagc cagccgaccg ugguguucgu gagcaagaag ggccugcaga agauccugaa 480

cgugcagaag aagcugccca ucauccagaa gaucaucauc auggacagca agaccgacua 540

ccagggcuuc cagucgaugu acacguucgu gaccagccac cucccgccgg gcuucaacga 600

guacgacuuc gucccggaga gcuucgaccg ggacaagacc aucgcccuga ucaugaacag 660

cagcggcagc accggccugc cgaagggggu ggcccugccg caccggaccg ccugcgugcg 720

cuucucgcac gcccgggacc ccaucuucgg caaccagauc aucccggaca ccgccauccu 780

gagcguggug ccguuccacc acggcuucgg cauguucacg acccugggcu accucaucug 840

cggcuuccgg gugguccuga uguaccgguu cgaggaggag cuguuccugc ggagccugca 900

ggacuacaag auccagagcg cgcugcucgu gccgacccug uucagcuucu ucgccaagag 960

cacccugauc gacaaguacg accugucgaa ccugcacgag aucgccagcg ggggcgcccc 1020

gcugagcaag gaggugggcg aggccguggc caagcgguuc caccucccgg gcauccgcca 1080

gggcuacggc cugaccgaga ccacgagcgc gauccugauc acccccgagg gggacgacaa 1140

gccgggcgcc gugggcaagg uggucccguu cuucgaggcc aagguggugg accuggacac 1200

cggcaagacc cugggcguga accagcgggg cgagcugugc gugcgggggc cgaugaucau 1260

gagcggcuac gugaacaacc cggaggccac caacgcccuc aucgacaagg acggcuggcu 1320

gcacagcggc gacaucgccu acugggacga ggacgagcac uucuucaucg ucgaccggcu 1380

gaagucgcug aucaaguaca agggcuacca gguggcgccg gccgagcugg agagcauccu 1440

gcuccagcac cccaacaucu ucgacgccgg cguggccggg cugccggacg acgacgccgg 1500

cgagcugccg gccgcggugg uggugcugga gcacggcaag accaugacgg agaaggagau 1560

cgucgacuac guggccagcc aggugaccac cgccaagaag cugcggggcg gcgugguguu 1620

cguggacgag gucccgaagg gccugaccgg gaagcucgac gcccggaaga uccgcgagau 1680

ccugaucaag gccaagaagg gcggcaagau cgccguguaa gacuagugca ucacauuuaa 1740

aagcaucuca gccuaccaug agaauaagag aaagaaaaug aagaucaaua gcuuauucau 1800

cucuuuuucu uuuucguugg uguaaagcca acacccuguc uaaaaaacau aaauuucuuu 1860

aaucauuuug ccucuuuucu cugugcuuca auuaauaaaa aauggaaaga accuagaucu 1920

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980

aaaaugcauc cccccccccc cccccccccc cccccccccc aaaggcucuu uucagagcca 2040

ccagaauu 2048

<210> 43

<211> 2075

<212> RNA

<213> Artificial Sequence

<220>

<223> Ndufa4 - PpLuc(GC) - albumin7- A64 - C30 - hSL

<400> 43

gggguccgcu cagccagguu gcagaagcgg cuuagcgugu guccuaaucu ucucucugcg 60

uguagguagg ccugugccgc aaacaagcuu gaggauggag gacgccaaga acaucaagaa 120

gggcccggcg cccuucuacc cgcuggagga cgggaccgcc ggcgagcagc uccacaaggc 180

caugaagcgg uacgcccugg ugccgggcac gaucgccuuc accgacgccc acaucgaggu 240

cgacaucacc uacgcggagu acuucgagau gagcgugcgc cuggccgagg ccaugaagcg 300

guacggccug aacaccaacc accggaucgu ggugugcucg gagaacagcc ugcaguucuu 360

caugccggug cugggcgccc ucuucaucgg cguggccguc gccccggcga acgacaucua 420

caacgagcgg gagcugcuga acagcauggg gaucagccag ccgaccgugg uguucgugag 480

caagaagggc cugcagaaga uccugaacgu gcagaagaag cugcccauca uccagaagau 540

caucaucaug gacagcaaga ccgacuacca gggcuuccag ucgauguaca cguucgugac 600

cagccaccuc ccgccgggcu ucaacgagua cgacuucguc ccggagagcu ucgaccggga 660

caagaccauc gcccugauca ugaacagcag cggcagcacc ggccugccga aggggguggc 720

ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc cgggacccca ucuucggcaa 780

ccagaucauc ccggacaccg ccauccugag cguggugccg uuccaccacg gcuucggcau 840

guucacgacc cugggcuacc ucaucugcgg cuuccgggug guccugaugu accgguucga 900

ggaggagcug uuccugcgga gccugcagga cuacaagauc cagagcgcgc ugcucgugcc 960

gacccuguuc agcuucuucg ccaagagcac ccugaucgac aaguacgacc ugucgaaccu 1020

gcacgagauc gccagcgggg gcgccccgcu gagcaaggag gugggcgagg ccguggccaa 1080

gcgguuccac cucccgggca uccgccaggg cuacggccug accgagacca cgagcgcgau 1140

ccugaucacc cccgaggggg acgacaagcc gggcgccgug ggcaaggugg ucccguucuu 1200

cgaggccaag gugguggacc uggacaccgg caagacccug ggcgugaacc agcggggcga 1260

gcugugcgug cgggggccga ugaucaugag cggcuacgug aacaacccgg aggccaccaa 1320

cgcccucauc gacaaggacg gcuggcugca cagcggcgac aucgccuacu gggacgagga 1380

cgagcacuuc uucaucgucg accggcugaa gucgcugauc aaguacaagg gcuaccaggu 1440

ggcgccggcc gagcuggaga gcauccugcu ccagcacccc aacaucuucg acgccggcgu 1500

ggccgggcug ccggacgacg acgccggcga gcugccggcc gcgguggugg ugcuggagca 1560

cggcaagacc augacggaga aggagaucgu cgacuacgug gccagccagg ugaccaccgc 1620

caagaagcug cggggcggcg ugguguucgu ggacgagguc ccgaagggcc ugaccgggaa 1680

gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc aagaagggcg gcaagaucgc 1740

cguguaagac uagugcauca cauuuaaaag caucucagcc uaccaugaga auaagagaaa 1800

gaaaaugaag aucaauagcu uauucaucuc uuuuucuuuu ucguuggugu aaagccaaca 1860

cccugucuaa aaaacauaaa uuucuuuaau cauuuugccu cuuuucucug ugcuucaauu 1920

aauaaaaaau ggaaagaacc uagaucuaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1980

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa augcaucccc cccccccccc cccccccccc 2040

cccccccaaa ggcucuuuuc agagccacca gaauu 2075

<210> 44

<211> 1810

<212> DNA

<213> Artificial Sequence

<220>

<223> PpLuc(GC) - A64 - C30 - hSL

<400> 44

gggagaaagc ttgaggatgg aggacgccaa gaacatcaag aagggcccgg cgcccttcta 60

cccgctggag gacgggaccg ccggcgagca gctccacaag gccatgaagc ggtacgccct 120

ggtgccgggc acgatcgcct tcaccgacgc ccacatcgag gtcgacatca cctacgcgga 180

gtacttcgag atgagcgtgc gcctggccga ggccatgaag cggtacggcc tgaacaccaa 240

ccaccggatc gtggtgtgct cggagaacag cctgcagttc ttcatgccgg tgctgggcgc 300

cctcttcatc ggcgtggccg tcgccccggc gaacgacatc tacaacgagc gggagctgct 360

gaacagcatg gggatcagcc agccgaccgt ggtgttcgtg agcaagaagg gcctgcagaa 420

gatcctgaac gtgcagaaga agctgcccat catccagaag atcatcatca tggacagcaa 480

gaccgactac cagggcttcc agtcgatgta cacgttcgtg accagccacc tcccgccggg 540

cttcaacgag tacgacttcg tcccggagag cttcgaccgg gacaagacca tcgccctgat 600

catgaacagc agcggcagca ccggcctgcc gaagggggtg gccctgccgc accggaccgc 660

ctgcgtgcgc ttctcgcacg cccgggaccc catcttcggc aaccagatca tcccggacac 720

cgccatcctg agcgtggtgc cgttccacca cggcttcggc atgttcacga ccctgggcta 780

cctcatctgc ggcttccggg tggtcctgat gtaccggttc gaggaggagc tgttcctgcg 840

gagcctgcag gactacaaga tccagagcgc gctgctcgtg ccgaccctgt tcagcttctt 900

cgccaagagc accctgatcg acaagtacga cctgtcgaac ctgcacgaga tcgccagcgg 960

gggcgccccg ctgagcaagg aggtgggcga ggccgtggcc aagcggttcc acctcccggg 1020

catccgccag ggctacggcc tgaccgagac cacgagcgcg atcctgatca cccccgaggg 1080

ggacgacaag ccgggcgccg tgggcaaggt ggtcccgttc ttcgaggcca aggtggtgga 1140

cctggacacc ggcaagaccc tgggcgtgaa ccagcggggc gagctgtgcg tgcgggggcc 1200

gatgatcatg agcggctacg tgaacaaccc ggaggccacc aacgccctca tcgacaagga 1260

cggctggctg cacagcggcg acatcgccta ctgggacgag gacgagcact tcttcatcgt 1320

cgaccggctg aagtcgctga tcaagtacaa gggctaccag gtggcgccgg ccgagctgga 1380

gagcatcctg ctccagcacc ccaacatctt cgacgccggc gtggccgggc tgccggacga 1440

cgacgccggc gagctgccgg ccgcggtggt ggtgctggag cacggcaaga ccatgacgga 1500

gaaggagatc gtcgactacg tggccagcca ggtgaccacc gccaagaagc tgcggggcgg 1560

cgtggtgttc gtggacgagg tcccgaaggg cctgaccggg aagctcgacg cccggaagat 1620

ccgcgagatc ctgatcaagg ccaagaaggg cggcaagatc gccgtgtaag actagtagat 1680

ctaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740

aaaaaatgca tccccccccc cccccccccc cccccccccc ccaaaggctc ttttcagagc 1800

caccagaatt 1810

<210> 45

<211> 2163

<212> RNA

<213> Artificial Sequence

<220>

<223> PpLuc(GC) - gnas- A64 - C30 - hSL

<400> 45

gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60

cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120

ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180

guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240

ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300

ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360

gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420

gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480

gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540

cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600

caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660

cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720

cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780

ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840

gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900

cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960

gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020

cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080

ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140

ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200

gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260

cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320

cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380

gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440

cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500

gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560

cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620

ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuagugaag 1680

ggaacaccca aauuuaauuc agccuuaagc acaauuaauu aagagugaaa cguaauugua 1740

caagcaguug gucacccacc auagggcaug aucaacaccg caaccuuucc uuuuuccccc 1800

agugauucug aaaaaccccu cuucccuuca gcuugcuuag auguuccaaa uuuaguaagc 1860

uuaaggcggc cuacagaaga aaaagaaaaa aaaggccaca aaaguucccu cucacuuuca 1920

guaaauaaaa uaaaagcagc aacagaaaua aagaaauaaa ugaaauucaa aaugaaauaa 1980

auauuguguu gugcagcauu aaaaaaucaa uaaaaauuaa aaaugagcaa gaucuaaaaa 2040

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaau 2100

gcaucccccc cccccccccc cccccccccc cccccaaagg cucuuuucag agccaccaga 2160

auu 2163

<210> 46

<211> 2264

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - Ybx1(V2)-A64-C30-hSL

<400> 46

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguaugccg gcuuaccauc ucuaccauca 1740

uccgguuugg ucauccaaca agaagaaaug aauaugaaau uccagcaaua agaaaugaac 1800

aaagauugga gcugaagacc uuaagugcuu gcuuuuugcc cgcugaccag auaacauuag 1860

aacuaucugc auuaucuaug cagcaugggg uuuuuauuau uuuuaccuaa agaugucucu 1920

uuuugguaau gacaaacgug uuuuuuaaga aaaaaaaaaa aggccugguu uuucucaaua 1980

caccuuuaac gguuuuuaaa uuguuucaua ucuggucaag uugagauuuu uaagaacuuc 2040

auuuuuaauu uguaauaaag uuuacaacuu gauuuuuuca aaaaagucaa caaacugcaa 2100

gcaccuguua auaaaggucu uaaauaauaa agaucuaaaa aaaaaaaaaa aaaaaaaaaa 2160

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ugcauccccc cccccccccc 2220

cccccccccc ccccccaaag gcucuuuuca gagccaccag aauu 2264

<210> 47

<211> 1914

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - Ndufb8-A64-C30-hSL

<400> 47

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguggaggc uugaugggcu uuuugcccuc 1740

guuccuagag gcuuaaccau aauaaaaucc cuaauaaagc agaucuaaaa aaaaaaaaaa 1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ugcauccccc 1860

cccccccccc cccccccccc ccccccaaag gcucuuuuca gagccaccag aauu 1914

<210> 48

<211> 2771

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - Cntn1-004(V2)-A64-C30-hSL

<400> 48

ggggcgcugc cuacggaggu ggcagccauc uccuucucgg caucaagcuu gaggauggag 60

gacgccaaga acaucaagaa gggcccggcg cccuucuacc cgcuggagga cgggaccgcc 120

ggcgagcagc uccacaaggc caugaagcgg uacgcccugg ugccgggcac gaucgccuuc 180

accgacgccc acaucgaggu cgacaucacc uacgcggagu acuucgagau gagcgugcgc 240

cuggccgagg ccaugaagcg guacggccug aacaccaacc accggaucgu ggugugcucg 300

gagaacagcc ugcaguucuu caugccggug cugggcgccc ucuucaucgg cguggccguc 360

gccccggcga acgacaucua caacgagcgg gagcugcuga acagcauggg gaucagccag 420

ccgaccgugg uguucgugag caagaagggc cugcagaaga uccugaacgu gcagaagaag 480

cugcccauca uccagaagau caucaucaug gacagcaaga ccgacuacca gggcuuccag 540

ucgauguaca cguucgugac cagccaccuc ccgccgggcu ucaacgagua cgacuucguc 600

ccggagagcu ucgaccggga caagaccauc gcccugauca ugaacagcag cggcagcacc 660

ggccugccga aggggguggc ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc 720

cgggacccca ucuucggcaa ccagaucauc ccggacaccg ccauccugag cguggugccg 780

uuccaccacg gcuucggcau guucacgacc cugggcuacc ucaucugcgg cuuccgggug 840

guccugaugu accgguucga ggaggagcug uuccugcgga gccugcagga cuacaagauc 900

cagagcgcgc ugcucgugcc gacccuguuc agcuucuucg ccaagagcac ccugaucgac 960

aaguacgacc ugucgaaccu gcacgagauc gccagcgggg gcgccccgcu gagcaaggag 1020

gugggcgagg ccguggccaa gcgguuccac cucccgggca uccgccaggg cuacggccug 1080

accgagacca cgagcgcgau ccugaucacc cccgaggggg acgacaagcc gggcgccgug 1140

ggcaaggugg ucccguucuu cgaggccaag gugguggacc uggacaccgg caagacccug 1200

ggcgugaacc agcggggcga gcugugcgug cgggggccga ugaucaugag cggcuacgug 1260

aacaacccgg aggccaccaa cgcccucauc gacaaggacg gcuggcugca cagcggcgac 1320

aucgccuacu gggacgagga cgagcacuuc uucaucgucg accggcugaa gucgcugauc 1380

aaguacaagg gcuaccaggu ggcgccggcc gagcuggaga gcauccugcu ccagcacccc 1440

aacaucuucg acgccggcgu ggccgggcug ccggacgacg acgccggcga gcugccggcc 1500

gcgguggugg ugcuggagca cggcaagacc augacggaga aggagaucgu cgacuacgug 1560

gccagccagg ugaccaccgc caagaagcug cggggcggcg ugguguucgu ggacgagguc 1620

ccgaagggcc ugaccgggaa gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc 1680

aagaagggcg gcaagaucgc cguguaagac uaguucguug acacucacca uuucugugaa 1740

agacuuuuuu uuuuuuuaac auauuauacu agauuugacu aacucaaucu uguagcuucu 1800

gcaguucucc ccacccccaa ccuaguucuu agaguauguu uccccuuuug aaacauguaa 1860

acauacuuug ggcauaaaua uuuuuuaaaa uauaacuaua augcuucacu aauaccuuaa 1920

aaaugccuag ugaacuaacu caguacauua uauaauggcc aagugaaagu uuuguguuuu 1980

cauguccugu uuuucuuuga aauuauauag cccagaaauu agcucauuau cugaaaaacg 2040

uaugaagaac ugaugaauug uauaauacag gaguauugcc auugaaugua cuguuugauu 2100

uauucaagca gguaaugaac aauguuguca aacucucuaa ugagacauca uaauuaggac 2160

auaagcuaaa aggggcauua cuccggcagu cuuuuuuucu uaauccuagu accauacaua 2220

uucuuuggca ugaaagaaug aaaagcauua guaaacaacu gaaguccuac cauggcucug 2280

uaggguuuuu ggaacaauuc cuggaauugg aaagugaaaa uggauagcau gugggggaaa 2340

cccucaucug aguagcaaga uuuuaguaaa gaugacuaag ccauuaacag caugcauuca 2400

uauuuaauuu uauugacucc ugccaucagc uuuuguagau cuuuugggug gaagguugug 2460

auuuuuacug ggaggacuug aguagaagug gaugauuaaa auugaggagu auauaauucu 2520

uucugggacu gcuuaaaugu uauuguuuga aaaugccuuc acuuuccccc uuuggucaaa 2580

gagaugugcu uaaaauucuu auuccuucac aauaaauaau uuugauuuuc uuagacaaga 2640

ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2700

aaaaaaaugc aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag 2760

ccaccagaau u 2771

<210> 49

<211> 201

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SLC38A6 3'-UTR

SLC38A6-001 ENST00000267488

<400> 49

aagaaatatt ttcctacttc ttacaagaat aatatacccc tagttgcaag aatgaattat 60

tccggaagac accctggatg aaaaataaca ttttaataaa aattattaac agaaaagcag 120

aacaaaatgg cagtgggtat ggggaagtaa gagtgtggca gttttaatca aaaaaagaaa 180

caaactcgaa atgctcttaa a 201

<210> 50

<211> 102

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens DECR1 3'-UTR

NM_001359.1

<400> 50

gaccactttg gccttcatct tggttacaga aaagggaata gaaatgaaac aaattatctc 60

tcatcttttg actatttcaa gtctaataaa ttcttaatta ac 102

<210> 51

<211> 369

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PIGK 3'-UTR

<400> 51

acttgatgat gaatgaagaa tgcatggagg actgcaaact tggataataa tttatgtcat 60

tatatatttt taaaaatgtg tttctcttgt atgaattgga aataagtata aggaaactaa 120

atttgaatca actattaatt ttataactta aagaaaaata attgttaatg caactgctta 180

atggcactaa atatattcca gttttgtatt ttgtgtatta taaaagcgaa tgagacagag 240

atcagaatac attgactgtt tttgaaaata gtaatttccc cttatcccct tttcatttgg 300

aaaagaaaca attgtgaaga cattaaattc tcactaacag aagtaacttt ggttaattat 360

tttttgtat 369

<210> 52

<211> 460

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens FAM175A 3'-UTR

FAM175A-009 ENST00000506553

<400> 52

tccttttaac cttacaagga gattttttta tttggctgat gggtaaagcc aaacatttct 60

attgttttta ctatgttgag ctacttgcag taagttcatt tgtttttact atgttcacct 120

gtttgcagta atacacagat aactcttagt gcatttactt cacaaagtac tttttcaaac 180

atcagatgct tttatttcca aacctttttt tcacctttca ctaagttgtt gaggggaagg 240

cttacacaga cacattcttt agaattggaa aagtgagacc aggcacagtg gctcacacct 300

gtaatcccag cacttaggga agacaagtca ggaggattga ttgaagttag gagttagaga 360

ccagcctggg caacgtattg agaccatgtc tattaaaaaa taaaatggaa aagcaagaat 420

agccttattt tcaaaatatg gaaagaaatt tatatgaaaa 460

<210> 53

<211> 505

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PHYH 3'-UTR

PHYH-002 ENST00000396913

<400> 53

aatagccatc tgctataact ctttcaacag aaaaccaaaa ccaaacgaaa tgtctaagga 60

aaatgttttc ttaatgagat gatgtaacct tttctatcac ttgttaaaag cagaaaacat 120

gtatcaggta cttaattgca tagagttagt tttgcagcac aatggtgttg ctttaatgga 180

aaaaaaaaac agtaaaagtg aaatattact gttttaagga aaactaattt agggtggcag 240

ccaataaagg tggttggtgt ctaatttaag tgttaaatca atttctttca ttcagttagc 300

tctttaccca agaagaagtg aatgatttgg agcttagggt atgttttgta tcccctttct 360

gataaaccca ttccctacca attttatgtc ataagagatt tttttccccc aaatctagaa 420

caatgtataa tacattcaca tctagtcaag ggcataggaa cggtgtcatg gagtccaaat 480

aaagtggata ttcctgctcg gacaa 505

<210> 54

<211> 404

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TBC1D19 3'-UTR

TBC1D19-001 ENST00000264866

<400> 54

tcttcttcac agtcactggc aacacatcta gtttttcatt agaaacaaat catgaactat 60

gcaaactctg cataaaacca aaatgaaact ttgcatataa gccaataaag atcatgttcc 120

ctcttcagtt aaacctaagt agtttctcac tttttgaaac aataactctg caccaaatat 180

tgcatcgcat gctgctgatt ttcaagagag aagcaataaa cacaacttct gctaaattga 240

gcattatata tataatatta taatatatat ataatcctga cttgtcaatg gcatgtaata 300

atatatgcaa taagaactaa agatactgta ataaacttca agaggtaatg tagcttcttg 360

gataattctt ttatgtcagt ttataaattt atctctagat aatg 404

<210> 55

<211> 353

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TBC1D19 NM_018317.2 3'-UTR

<400> 55

tcttcttcac agtcactggc aacacatcta gtttttcatt agaaacaaat catgaactat 60

gcaaactctg cataaaacca aaatgaaact ttgcatataa gccaataaag atcatgttcc 120

ctcttcagtt aaacctaagt agtttctcac tttttgaaac aataactctg caccaaatat 180

tgcatcgcat gctgctgatt ttcaagagag aagcaataaa cacaacttct gctaaattga 240

gcattatata tataatatta taatatatat ataatcctga cttgtcaatg gcatgtaata 300

atatatgcaa taagaactaa agatactgta ataaacttca agaggtaaaa aaa 353

<210> 56

<211> 242

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PIGB 3'-UTR

PIGB-201 ENST00000539642

<400> 56

aaattcaaca tgaagatgaa attctgaact ttcctagata aattaacatt gctgggtgga 60

aatattcaga tgctgcttaa atacttcggt aaacactggg taagattcat ggaacttaga 120

aaaaagctgt atgaactgct ttaccaaata tcactactga ggaaatgtat aaaataccac 180

atagtataaa attacatgtt aatacaatgc cagattttaa ataaagacct ttagttttcc 240

tc 242

<210> 57

<211> 157

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ALG6 3'-UTR

ALG6-006 ENST00000263440

<400> 57

ctgtattcct aaacaaattg tttcctaaac aaatgtgaaa atgtgaacag tgctgaaagg 60

ttttgtgaac tttttgctat gtataaatga aattaccatt ttgagaacca tggaaccaca 120

ggaaaggaaa tggtgaaaag tcattgttgt ctacaca 157

<210> 58

<211> 324

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CRYZ 3'-UTR

CRYZ-005 ENST00000370871

<400> 58

tgattaattc tttcatggat ttcctatgta attagaggta ctgtctttcc cccagttgta 60

cttaccctat cttttcttta attaacattc gattccatga gcttcttatg tgaaaaaata 120

agatttttct ttagagagca gaagcagaag agtaaaattt attgtatagc tagcaatatt 180

tttttatgcc atctgtctca aatcaaagag tcatcatagt aggaaataac atgttagttg 240

tcatttggca tgagtgtgca ttccagtaat tcttaattga tatttgatta attccatacc 300

tttgattaaa acatgctagt tcaa 324

<210> 59

<211> 510

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BRP44L 3'-UTR

BRP44L-001 ENST00000360961

<400> 59

caatggaaaa ggaagaacaa ggtcttgaag ggacagcatt gccagctgct gctgagtcac 60

agatttcatt ataaatagcc tccctaagga aaatacactg aatgctattt ttactaacca 120

ttctattttt atagaaatag ctgagagttt ctaaaccaac tctctgctgc cttacaagta 180

ttaaatattt tacttctttc cataaagagt agctcaaaat atgcaattaa tttaataatt 240

tctgatgatg gttttatctg cagtaatatg tatatcatct attagaattt acttaatgaa 300

aaactgaaga gaacaaaatt tgtaaccact agcacttaag tactcctgat tcttaacatt 360

gtctttaatg accacaagac aaccaacagc tggccacgta cttaaaattt tgtccccact 420

gtttaaaaat gttacctgtg tatttccatg cagtgtatat attgagatgc tgtaacttaa 480

tggcaataaa tgatttaaat atttgttaaa 510

<210> 60

<211> 354

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ACADSB 3'-UTR

ACADSB-004

<400> 60

cgtctatagg agtgggaccc ctccctggtg tcactgctgt aaaattttaa acggttgtgt 60

cttgttggga gtaagtgcct tgcgtgggaa taaacttcca cagcattcga atattttaat 120

gaagccctta gtcagggtcc tggtgttggc ctttttggtt ttctcttttc aggctgttta 180

acttaggcac aggagatcca cttttaaact tgggaaataa gcacctgtat ttttttccaa 240

aactgttttt aaagctgtat acgcatacat atatatattt ttactctgtc ttactctgtc 300

acccaggcta gagtgcagtg gcgcgatctc agctcactgc agccttgacc tcct 354

<210> 61

<211> 539

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TMEM14A 3'-UTR

NM_014051.3

<400> 61

gcatctggag gaacagaaaa ctaagttcat gtcatcctgc tgtaatgggc agagcatatt 60

ttttttgtat ttaaaagata aacttcaata tggaatgcta gaaacacaaa tagcactgtc 120

acctctaata tgaacattag tttgaggtag tttttttcta aagcaaaaat tttaactgtt 180

ttctaattgt caagcactat tttcattaaa agtgtctaat gaatcatgat atactcttcc 240

atttgttgtg tctatttttt atatatttgg tattttttga aaattccaaa tactcatgtc 300

tcaagtaagc ttaaactaca acttgtcaca taaaggaagt cttaagtgga gttcacagaa 360

tgataatgta tctatttgtc atttgtgtta tatttgaaat tattagaaat tatgcttttt 420

ccattttaat tgtattgctg ccagtgctat ttttttcttt aaaaaatttt attcttagca 480

cactgttatg tcctaactga atgtattcag tattcaaata aaagacattt tggttcaaa 539

<210> 62

<211> 292

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GRAMD1C 3'-UTR

GRAMD1C-005 ENST00000472026

<400> 62

tgatctgaag gactaaaacc gcagagatac ttggaactta aagaaaatac ctggaagaaa 60

accagacgaa tgaaggattt tggcatagaa catttctatg ttttttcatt attgagattt 120

ctaatatgaa catttctttc agtaacattt atttgataat tagtttctgc tggccttaat 180

aatccatcct ttcacttctt atagatattt ttaagctgtg aatttcttca gtgaaccatg 240

aaatatatta tagaactgaa tttctctgat acaaaaagaa aatgacacac cc 292

<210> 63

<211> 94

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C11orf80 3'-UTR

C11orf80-201 ENST00000360962

<400> 63

gccgggtccc cttccgcaag cgcccaccga tccggaggct gcgggcagcc gttatcccgt 60

ggtttaataa agctgccgcg cgctcaccaa gtcc 94

<210> 64

<211> 266

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ANXA4 3'-UTR

ANXA4-002 ENST00000409920

<400> 64

aataaaaatc ccagaaggac aggaggattc tcaacacttt gaattttttt aacttcattt 60

ttctacactg ctattatcat tatctcagaa tgcttatttc caattaaaac gcctacagct 120

gcctcctaga atatagactg tctgtattat tattcaccta taattagtca ttatgatgct 180

ttaaagctgt acttgcattt caaagcttat aagatataaa tggagatttt aaagtagaaa 240

taaatatgta ttccatgttt ttaaaa 266

<210> 65

<211> 490

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TBCK 3'-UTR

TBCK-002 ENST00000361687

<400> 65

agaaccaaga gtgtgactgc caaaacttag tgtggcatca gcaccaacag cacagttctt 60

catatccacg ccactctcag acaaaactag atgtccagat tgttgcattt ccgtaaagtt 120

tgtcacgaga cattttttaa aatctcataa cccacatgtt cagttatcca tgcaagaaac 180

ttgactctac atgtattgct gaaagaattt tcttaacagt gaaatctgat catatatttt 240

taccacactg ccacataaag cccaagaaat tcagctgaca agacagattt agcattatca 300

agaaatccca tttgccctga aaaagctgtc ctccattgta ctgaacagac agtcctgtcg 360

attgtgttat ttagaaacat acactgaatg tgggctgaaa tcatcatctt tccataatga 420

aaactgagaa actattcaca atgcattcct tataaataaa tgctacattt agtaactcat 480

ttcacccaaa 490

<210> 66

<211> 320

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IFI6 3'-UTR

IFI6-001 ENST00000361157

<400> 66

ccagcagctc ccagaacctc ttcttccttc ttggcctaac tcttccagtt aggatctaga 60

actttgcctt tttttttttt tttttttttt tgagatgggt tctcactata ttgtccaggc 120

tagagtgcag tggctattca cagatgcgaa catagtacac tgcagcctcc aactcctagc 180

ctcaagtgat cctcctgtct caacctccca agtaggatta caagcatgcg ccgacgatgc 240

ccagaatcca gaactttgtc tatcactctc cccaacaacc tagatgtgaa aacagaataa 300

acttcaccca gaaaacactt 320

<210> 67

<211> 479

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CAMKMT 3'-UTR

(synonym C2orf34) ENST00000378494

<400> 67

aagattaagc ttctcaaaga cgaagaaacg tatcaagtgc atagggaata tttttacaaa 60

aacggaaatc tgtaaggggt ataatcgcct gcctgcgccc tttgcagcat ttcacgtgtg 120

ggctatggac tccacctgtc ctcacccacg ttattcccca gctgccctct ccagctccct 180

ccccgcctct ttttacactc tgcttgttgc tcgtcctgcc ctaaaccttt gtttgtcttt 240

aaatgtgtat aagctgcctg tctgtgactt gaatttgact ggtgaacaaa ctaaatattt 300

ttccctgtaa ttgagacaga atttcttttg atgataccca tccctccttc attttttttt 360

tttttttggt ctttgttctg ttttggtggt ggtagttttt aatcagtaaa cccagcaaat 420

atcatgattc tttcctggtt agaaaaataa ataaagtgta tctttttatc tccctccaa 479

<210> 68

<211> 476

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ALDH6A1 3'-UTR

NM_005589.2

<400> 68

aaacaagttt gtttaagact gactccatcc tgagtaatct ccctttattt ttgaccagct 60

tcatttgtca gctttgctca gatcagatcg atgggattgg aatacattgt aactaaaatc 120

ttcctcagga ctattaaccc ccgcaaagtt tctataggga actgcctagt gtaacaatga 180

aaccagattt ctcacttgct cttcatactt ctattttgag gtaactgttg taactatgaa 240

atgcttatct gaaagtagtg cttaaacctg atttctaaaa attatcccat tttctgatga 300

tttgaagggg agaaaagcca gtgtatgtaa agaaaatgtt ccagccaggc gcggtggctc 360

acgcctgtaa ttccatcatt ttgggaggcc acagtgggca gattgcttga gcccaggagt 420

tgaagaacgt ggcgaaaccc cgtatctatt atttaaaaaa attgaaaaag taaaaa 476

<210> 69

<211> 567

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens AGTPBP1 3'-UTR

AGTPBP1-004 ENST00000357081

<400> 69

gcccgctgcc atctcttgtt aactgcaaag aataaatgaa atatcttggt ttttatttcc 60

caggaagctt gagagaaatg agtttataca gagctgactc aaaaagacaa aaagtaactt 120

gggccagttt ggtttcaaga taataaatgt gttattaatt aatgataaaa ttggcgcttg 180

ttttattttc gatattcaat gcactttatg tagcattgaa tgatcaaata ttggatttac 240

ctttaaaaaa aaaacctgag tatcattgca tgaattttta tctccctatg gttatatcct 300

gcatcaagtg gataattttg aagtgtgttc agaatataaa attgaaattt tagagttgtt 360

gaaaatcctg acttgttgaa aactaatata tatgtacatg gatttctata gatgtgtttg 420

tttagaagtg ggtagatatt gcagataaga ctgttcttca gaatcatgtt aactattggg 480

ttgtgactga agtagtccag ggtttgcctt gaaaccatta cattctacat ttaccaaatt 540

aaacaaataa aaactgtatt aaatgtt 567

<210> 70

<211> 169

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CCDC53 3'-UTR

CCDC53-001 ENST00000240079

<400> 70

gcttaatttt gataagaatt acatatgcat gcataggggt acatttacat tctgtaagag 60

attgagcctg aactctctta gtcataaaaa catcaaatgg ccacatgtcc actaccaagc 120

ttcttctatg ttaaaaaaat aataataaag cagttttaac ctgccagta 169

<210> 71

<211> 194

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LRRC28 3'-UTR

LRRC28-002 ENST00000331450

<400> 71

taaacactca agaacctcag gagcgctgcc agcttgacac tggggaatcc agccagtcca 60

gcacactctt ccatcctgtc ctgtccaatg cgggggcact gcagaactct ctagaaatgt 120

catgattgag cttcagagct aaaatgcctt cacccttccc ccaagttgga atatatcctc 180

ccccaaatta agga 194

<210> 72

<211> 120

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CCDC109B 3'-UTR

NM_017918.4

<400> 72

tcttacagtt ttaaatgtcg tcagattttc cattatgtat tgattttgca acttaggatg 60

tttttgagtc ccatggttca ttttgattgt ttaatctttg ttattaaatt cttgtaaaac 120

<210> 73

<211> 426

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PUS10 3'-UTR

PUS10-001 ENST00000316752

<400> 73

ctttcaaatt tggagacaaa gagtatggtt ttcctggcat gatgtggaca tccatggagc 60

acatgccgta aaatggctgt ttacccacca taacggtgtc ttgaaaacta tttggatcat 120

gttgatctat ataattgtta atttgttgta acatctcagg atctatatat gtgtatattt 180

tgtgttaaat tgttccaagg atgtcttagg atttttctca ttccctcttt cacccccaca 240

aaccaaacta tgaataatga aataattctc cttaattctt tcatttagag aggtgcacaa 300

acaggacaca ttctctgtta acctaagaag ctgtaatttc agcaagattt ccctccacaa 360

gagatatacc acctttaaaa tcatgttcta atttttgtaa attatctgaa taaaagttat 420

atctag 426

<210> 74

<211> 71

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CCDC104 3'-UTR

CCDC104-002 ENST00000339012

<400> 74

taattaagaa caatttaaca aaatggaagt tcaaattgtc ttaaaaataa attatttagt 60

ccttacactg a 71

<210> 75

<211> 125

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CASP1 3'-UTR

CASP1-007 ENST00000527979

<400> 75

aataaggaaa ctgtatgaat gtctgtgggc aggaagtgaa gagatccttc tgtaaaggtt 60

tttggaatta tgtctgctga ataataaact tttttgaaat aataaatctg gtagaaaaat 120

gaaaa 125

<210> 76

<211> 174

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SNX14 3'-UTR

SNX14-007 ENST00000513865

<400> 76

acacttggat ttggtataga ataacccatt gaaatttctg ctgtgcgagg gtggtagaaa 60

tttacttttt tgggtatatt cttatatata ttatgtacat cgctgtctga aattttagtt 120

attttttgtt tttaataaag actaacacaa acttaatgat taaaagtgat tgag 174

<210> 77

<211> 237

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SKAP2 3'-UTR

SKAP2-201 (part of SKAP2.001 ENST00000345317)

<400> 77

gagtcctgga aaaggaaaat tcttctgctt gtctgcaaat gctttggatt tagaagcgtc 60

atgaaagcac gagtgacagc tcctaacctc tccttgtttt attaaacatt acttatcttt 120

gactgttatt ttatgcagtc gctcattaaa atattcctct gatgtgaaat taaatgaagg 180

atattaatgt aaattagatg caaccagtta agttatacct gttgctattt tgcaaag 237

<210> 78

<211> 362

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NDUFB6 3'-UTR

NM_182739.2

<400> 78

agattatgta aaaagttaaa aggcttatga gcctaagttt gttcctatat taccatattt 60

actgaatttt ctggaaaagt aactttaata aagtttaatc tcagaaattg tcatatctgt 120

tttcaagcat tgtacaattt gagactgagt aatttaacaa taagtaaaaa gtggacatgc 180

taaacaaata tgagagacta cctacttttt ctggtcattc ttgacttgga aaacggtatg 240

gaaaagtatt tagttacatg tttgtttgtt tttttcttac acagtactta cactaatttg 300

gtatcagggt atgcaacagt gaaatatcac aataaacaaa tgtaagaaca aaaaaaaaaa 360

aa 362

<210> 79

<211> 549

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens EFHA1 3'-UTR

EFHA1-001 ENST00000382374

<400> 79

taaaagatat aatagtatgg caattatatt gttccaaatg tcaaaatttg tgatttttta 60

gaagtacttg ctatttatct tcttaagtct tcattgatat tctgtgtgaa ataagcatgt 120

cttgtacttg ctttctgatt cataatttta ttaaagaact tagtagaaag aaaagtaagt 180

ataaaaatag atattggatt ctgtcagaag gcctagattt gaaataatgt tttgtacttc 240

ggtaagatgg aaaacttagt gattcactga tttcttagac actctaatat gatatgcttt 300

ctggaaggat aaaacaaata catatgggaa aaagtacttg agaccaaggc cagcatcaat 360

tccagacatc ttcatgttcc taataggcta aatgaagtta aaaacttatt tcagattttt 420

ctcatctgta ccttatatct cataaattta ttgcatattt tatgtcagta gcttagctgt 480

ttattgtctt taaaataaca tgtaaacttc aatgttctat ctggaagcag aataaaatat 540

ttacataga 549

<210> 80

<211> 288

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BCKDHB 3'-UTR

BCKDHB-005 ENST00000356489

<400> 80

ccatatagaa aagctggaag attatgacta gatatggaaa tattttttct gaattttttt 60

ttatatttcc tccgacttac ctctttttga aaagagagtt tttattaagt gaaccatcac 120

gatattggct gaaaagttct acattctatt attgtattgt aacacacatg tattgatgat 180

tttcattaag agtttcagat taactttgaa aaatattcca catggtaatc ttataaattc 240

tgtttaatta catctgtaaa tattatgtgt gtgatagtat tcaataaa 288

<210> 81

<211> 414

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BCKDHB 3'-UTR

NM_001164783.1

<400> 81

gacctgctca gcccaccccc acccatcctc agctaccccg agaggtagcc ccactctaag 60

gggagcaggg ggacctgaca gcacaccact gtcttcccca gtcagctccc tctaaaatac 120

tcagcggcca gggcggctgc cactcttcac ccctgctcct cccggctgtt acattgtcag 180

gggacagcat ctgcagcagt tgctgaggct ccgtcagccc cctcttcacc tgttgttaca 240

gtgccttctc ccaggggctg ggtgagggca cattcaggac tagaagcccc tctgggcatg 300

gggtggacat ggcaggtcag cctgtggaac ttgcgcaggt gcgagtggcc agcagaggtc 360

acgaataaac tgcatctctg cgcctggctc tctaccaaaa aaaaaaaaaa aaaa 414

<210> 82

<211> 414

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BBS2 3'-UTR

NM_031885.3

<400> 82

gtgaggaaaa tacaggtcat gaagttcctg gcaaagattt tctgttaaaa acctatgctg 60

gtttgctttg gatcacaccc tggtgaaccc cgggtgctaa gaatgaaaat aaccttggtg 120

agttgtacaa attaaagaca aagaactaca tgtgaagata gacttgcttt ctatttttaa 180

atcagtagta gtactgttgc tgaataatac taggttttta tggaatagga tgaatgcttt 240

tgaagtatta gggcttcaga gtccaatttt gcttatttat ggtatataaa tacatatttt 300

tttcttgaaa ttgcaattga gtttgtactt ttcaaataga ttatctactt tttcattaaa 360

atgtaaagat gttaaacttt gtgttgattg attataaaat caccaccaaa tcag 414

<210> 83

<211> 409

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LMBRD1 3'UTR

NM_018368.3

<400> 83

cagccttctg tcttaaaggt tttataatgc tgactgaata tctgttatgc atttttaaag 60

tattaaacta acattaggat ttgctaacta gctttcatca aaaatgggag catggctata 120

agacaactat attttattat atgttttctg aagtaacatt gtatcataga ttaacatttt 180

aaattaccat aatcatgcta tgtaaatata agactactgg ctttgtgagg gaatgtttgt 240

gcaaaatttt ttcctctaat gtataatagt gttaaattga ttaaaaatct tccagaatta 300

atattccctt ttgtcacttt ttgaaaacat aataaatcat ctgtatctgt gccttaggtt 360

ctccagagtg atgtggaatt ttaaagtgtc tctctctgat tgcctccaa 409

<210> 84

<211> 466

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ITGA6 3'-UTR

ITGA6-003 ENST00000409532

<400> 84

tattgatcta cttctgtaat tgtgtggatt ctttaaacgc tctaggtacg atgacagtgt 60

tccccgatac catgctgtaa ggatccggaa agaagagcga gagatcaaag atgaaaagta 120

tattgataac cttgaaaaaa aacagtggat cacaaagtgg aacgaaaatg aaagctactc 180

atagcggggg cctaaaaaaa aaaagcttca cagtacccaa actgcttttt ccaactcaga 240

aattcaattt ggatttaaaa gcctgctcaa tccctgagga ctgatttcag agtgactaca 300

cacagtacga acctacagtt ttaactgtgg atattgttac gtagcctaag gctcctgttt 360

tgcacagcca aatttaaaac tgttggaatg gatttttctt taactgccgt aatttaactt 420

tctgggttgc ctttattttt ggcgtggctg acttacatca tgtgtt 466

<210> 85

<211> 285

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HERC5 3'-UTR

HERC5-001 ENST00000264350

<400> 85

ccagcttgct tgtccaacag ccttattttg ttgttgttat cgttgttgtt gttgttgttg 60

ttgttgtttc tctactttgt tttgttttag gcttttagca gcctgaagcc atggtttttc 120

atttctgtct ctagtgataa gcaggaaaga gggatgaaga agagggttta ctggccggtt 180

agaacccgtg actgtattct ctcccttgga tacccctatg cctacatcat attccttacc 240

tcttttggga aatatttttc aaaaataaaa taaccgaaaa attaa 285

<210> 86

<211> 515

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HADHB 3'-UTR

HADHB-001 ENST00000317799

<400> 86

tagatccaga agaagtgacc tgaagtttct gtgcaacact cacactaggc aatgccattt 60

caatgcatta ctaaatgaca tttgtagttc ctagctcctc ttaggaaaac agttcttgtg 120

gccttctatt aaatagtttg cacttaagcc ttgccagtgt tctgagcttt tcaataatca 180

gtttactgct ctttcaggga tttctaagcc accagaatct cacatgagat gtgtgggtgg 240

ttgtttttgg tctctgttgt cactaaagac taaatgaggg tttgcagttg ggaaagaggt 300

caactgagat ttggaaatca tctttgtaat atttgcaaat tatacttgtt cttatctgtg 360

tcctaaagat gtgttctcta taaaatacaa accaacgtgc ctaattaatt atggaaaaat 420

aattcagaat ctaaacacca ctgaaaactt ataaaaaatg tttagataca taaatatggt 480

ggtcagcgtt aataaagtgg agaaatattg gagaa 515

<210> 87

<211> 116

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ANAPC4 3'-UTR

ANAPC4-001 ENST00000315368

<400> 87

tctagcttgc cattattgtg tgtgtaatta tggccaaaag gacataggag atggactaag 60

atgtcttgga ccacctttgt gtaacaaaga aataaacagt aaattttatt ttttca 116

<210> 88

<211> 154

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PCCB 3'-UTR

NM_000532.4

<400> 88

acaaatcaaa ggaaaagaaa ccaagaactg aattactgtc tgcccattca catcccattc 60

ctgccttttg caatcatgaa acctgggaat ccaaatagtt ggataactta gaataactaa 120

gtttattaaa ttctagaaag atctcaaaaa aaaa 154

<210> 89

<211> 90

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ABCB7 3'-UTR

ABCB7-001 ENST00000253577

<400> 89

gtcacataag acattttctt tttttgttgt tttggactac atatttgcac tgaagcagaa 60

ttgttttatt aaaaaaatca tacattccca 90

<210> 90

<211> 318

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PGCP 3'-UTR

CPQ-001 ENST00000220763

<400> 90

aaacagtaag aaagaaacgt tttcatgctt ctggccagga atcctgggtc tgcaactttg 60

gaaaactcct cttcacataa caatttcatc caattcatct tcaaagcaca actctatttc 120

atgctttctg ttattatctt tcttgatact ttccaaattc tctgattcta gaaaaaggaa 180

tcattctccc ctccctccca ccacatagaa tcaacatatg gtagggatta cagtgggggc 240

atttctttat atcacctctt aaaaacattg tttccacttt aaaagtaaac acttaataaa 300

tttttggaag atctctga 318

<210> 91

<211> 133

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NFU1 3'-UTR

NM_001002755.2

<400> 91

aataatctgg attttctttg ggcataacag tcagacttgt tgataatata tatcaagttt 60

ttattattaa tatgctgagg aacttgaaga ttaataaaat atgctcttca gagaatgata 120

tataaatatt gca 133

<210> 92

<211> 246

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens OMA1 3'-UTR

OMA1-001 ENST00000371226

<400> 92

attaaaattt atgagacaca agatatatga agaatgttgc agtccttatc attttatgtt 60

actttttaaa aaatgatgtt tgaagtgaaa aaaaaaagga tattcagggt caaatcatgt 120

acattacaga tattatctaa attcttctag aatttatttt tcatgaaata ttgatgtatt 180

ttaatctatg ttaaaatatc ttcaatgagg aaaatgtcac agaataaatt tatattacac 240

atttta 246

<210> 93

<211> 423

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HHLA3 3'-UTR

NM_001036646.1

<400> 93

ggcgaatcca tagagtaagc ttagtgatgt gtgtcagacc tctgagccca agcaaagcca 60

tcatatcccc tgtgacctgc atgtatacat ccagatggcc tgaagcaagt gaagaatcac 120

aaaagaagtg aaaagggccg gttcctgcct taactgatga cattccacca ttgtgatttg 180

ttcctgcccc accttaactg agcgattaac ctgtgaactt ccttctcctg gctcagaagc 240

ttccccactg agcaccttgt gacccccgcc cctgcctgcc atagaacaac cccctttgat 300

tgtaattttc ctttacctac ccaaatccta taaaacggcc ccacccctat ctcccttcgc 360

tgacactctc tttggactca gcctgcctgc acctaggtga ttaaaaagct ttattgctca 420

cgc 423

<210> 94

<211> 292

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HHLA3 3'-UTR

NM_001031693.2

<400> 94

aaagggccgg ttcctgcctt aactgatgac attccaccat tgtgatttgt tcctgcccca 60

ccttaactga gcgattaacc tgtgaacttc cttctcctgg ctcagaagct tccccactga 120

gcaccttgtg acccccgccc ctgcctgcca tagaacaacc ccctttgatt gtaattttcc 180

tttacctacc caaatcctat aaaacggccc cacccctatc tcccttcgct gacactctct 240

ttggactcag cctgcctgca cctaggtgat taaaaagctt tattgctcac gc 292

<210> 95

<211> 342

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ACAA2 3'-UTR

NM_006111.2

<400> 95

agagaccagt gagctcactg tgacccatcc ttactctact tggccaggcc acagtaaaac 60

aagtgacctt cagagcagct gccacaactg gccatgccct gccattgaaa cagtgattaa 120

gtttgatcaa gccatggtga cacaaaaatg cattgatcat gaataggagc ccatgctaga 180

agtacattct ctcagatttg aaccagtgaa atatgatgta tttctgagct aaaactcaac 240

tatagaagac attaaaagaa atcgtattct tgccaagtaa ccaccacttc tgccttagat 300

aatatgatta taaggaaatc aaataaatgt tgccttaact tc 342

<210> 96

<211> 446

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GSTM4 3'-UTR

GSTM4-001 ENST00000369836

<400> 96

tgccttgaag gccaggaggt gggagtgagg agcccatact cagcctgctg cccaggctgt 60

gcagcgcagc tggactctgc atcccagcac ctgcctcctc gttcctttct cctgtttatt 120

cccatcttta cccccaagac tttattgggc ctcttcactt cccctaaacc cctgtcccat 180

gcaggccctt tgaagcctca gctacccact ttccttcatg aacatccccc tcccaacact 240

acccttccct gcactaaagc cagcctgacc ttccttcctg ttagtggttg tatctgcttt 300

gaagggccta cctggcccct cgcctgtgga gctcagccct gagctgtccc cgtgttgcat 360

gacagcattg actggtttac aggccctgct cctgcagcat ggcccctgcc ttaggcctac 420

ctgatcaaaa taaagcctca gccaca 446

<210> 97

<211> 465

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GSTM4 3'-UTR

GSTM4-003 ENST00000326729

<400> 97

tggtcaattt tctgcatcaa cttgactggg ctaagggatg ctcagatggc aggtaaaatc 60

attgtgcttg tgagggtgtt tccagaagag atttgccttt gaatcagaag acagcaaaga 120

tttccttcag caatgaagga ggcatccacc aaactgtcag ggcccagaga gaagaaaaag 180

acaggaaggg tgaatttgac ctctctgact gggacatcca tctctgccta tcctgggacc 240

tccacactcc tggttctctg gccttcagac ttgatcaggg actaacacca tcgcctccca 300

cccccacctt tgttctgagg cctttagcct ctgaatgata ccactggctt tcctgcttct 360

ctatcctgca gtcggcagat catgggactt cttcactcca aaattgtgtg agccaattcc 420

cataacagat agataaattt ataaataaac acacaaattt cctac 465

<210> 98

<211> 274

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ALG8 3'-UTR

NM_001007027.2

<400> 98

ctgaaacctc cgcctcccag aaaagaaaaa cctcttttta attggatgga aactttctac 60

ctgcttggcc tggggcctct ggaagtctgc tgtgaatttg tattcccttt cacctcctgg 120

aaggtgaagt accccttcat ccctttgtta ctaacctcag tgtattgtgc agtaggcatc 180

acatatgctt ggttcaaact gtatgtttca gtattgattg actctgctat tggcaagaca 240

aagaaacaat gaataaagga actgcttaga tatg 274

<210> 99

<211> 122

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C11orf74 3'UTR

<400> 99

ttcacagagg cattttgtgt gtgtgtgctt attttaattt tgttcttatt ctagcaacat 60

tagaataaaa gataaaccta ctataattcc ctttgtggaa atttaaaaaa aaaaaaaaaa 120

aa 122

<210> 100

<211> 133

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa1 3'-UTR

Ndufa1-001 ENSMUST00000016571

<400> 100

ggaagcattt tcctggctga ttaaaagaaa ttactcagct atggtcatct gttcctgtta 60

gaaggctatg cagcatatta tatactatgc gcatgttatg aaatgcataa taaaaaattt 120

taaaaaatct aaa 133

<210> 101

<211> 155

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5e 3'-UTR

NM_025983

<400> 101

ctgaatctga agcctgaagt gctgagtctt gaaggtgaag catgtgggcc cctgttctgg 60

cagatggaaa tcaacctcac ctcctggggg acaggctgcc catctcgttg ataaattgac 120

tatgccaata aattaacatg gttcactttc aaaaa 155

<210> 102

<211> 136

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gstm5 3'-UTR

NM_010360

<400> 102

gccagagctc gctgctgctg agccatcttg ccctgagggg cccacactct tagctcactg 60

tcagtcttgt tccatcctgt cctgagggcc cccactctgt ctcctctgct ctttctaata 120

aacagcagtt gcatta 136

<210> 103

<211> 189

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Uqcr11 3'-UTR

NM_025650

<400> 103

gcagcccctc ccccaccaca ggcctcgatg gtaccatgtg ccgaggcctc agacacagcg 60

tagtcctgtg gaagacactg aggaagctgg acactggaga ggtctgcacc gctcagggag 120

cttccatgtt gacagacact agggctgcct tgatgggtgc agcattaaac cttattctta 180

tgccttgga 189

<210> 104

<211> 143

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus IFi27I2a 3'-UTR

IFi27I2a-001 ENSMUST00000055071; NM_029803

<400> 104

gcttaggaga tgacacttct atcagctcaa ctcaaagcct gtacagacta cgcaggagat 60

gaagttccaa aaggcacctt cagaaccctc actgatgtca aagaatgatg aaaacaacaa 120

agtatatggg ctggtgttcc taa 143

<210> 105

<211> 237

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cbr2 3'-UTR

NM_007621

<400> 105

tctgctcagt tgccgcggac atctgagtgg ccttcttagc cccaccctca gccaaagcat 60

ttactgatct cgtgactccg ccctcatgct acagccacgc ccaccacgca gctcacagtt 120

ccacccccat gttactgtcg atcccacaac cactccaggc gcagaccttg ttctctttgt 180

ccactttgtt gggctcattt gcctaaataa acgggccacc gcgttacctt taactat 237

<210> 106

<211> 118

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5l 3'-UTR

Atp5l-201 ENSMUST00000043675

<400> 106

agaccaatct ttaacttctg atttgagttc ttatttgaat gttcttggac catgtgtaac 60

aggactgcta tctgaataaa atactaggtg ttgaaaacac tgctgtgttt tctctgtc 118

<210> 107

<211> 271

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tmsb10 3'-UTR

NM_025284

<400> 107

aagcctagga agatttcccc accccacccc accccgcccc atcatctcca agaccccctc 60

gtgatgtgga ggaagagcca cctgcaagat ggacgcgagc cacaagctgc actgtgaaac 120

ccgggcactc cgagccgatg ccaccggccc gcgggtctct gaaggggacc cctccactaa 180

tcggactgcc aaatttcacc ggtttgccct gggatattat agaaaattat ttgtatgatt 240

gatgaaaata aaaacacctc gtggcatggt t 271

<210> 108

<211> 116

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Nenf 3'-UTR

NM_025424

<400> 108

tgtctagctg agaagcagcc ggttctaggg agaagtgagg ggacaggagt taagtgtccc 60

tcggaacaag cggaggaagc ctccgagtgc cctgcagctg aataaagcga atgttt 116

<210> 109

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5k 3'-UTR

NM_007507

<400> 109

ggcgtcagcg agcttgcttt tctctagtcg ttgagaacga ataaagcttc attgtgtgaa 60

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120

aaa 123

<210> 110

<211> 260

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus 1110008P14Rik 3'-UTR

1110008P14Rik-001 ENSMUST00000048792

<400> 110

gtgccgggag cccccatcca ggccctaccc tcacctctct aggccatgtt ctggcctggg 60

tagatactac ttggcttaga caccatctcg ggtactggcc tccagatcct agtgggtcta 120

ccagcctgga ccagtcccca ttcactgccc atcacccttc ctggagtcag gtgcaatcct 180

acagttctcc cacttgtctg tcttctttcc cctccatcca gactgagagt ccgaattaaa 240

gatgtctccc acaccactgc 260

<210> 111

<211> 102

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cox4i1 3'-UTR

NM_009941

<400> 111

gagcccgctg cctgccggct ccctgcctcc ctcactccct cggcatgctg gaagctgccg 60

tatccaatgg tccatgctaa taaaagacca gtttacgtgg tg 102

<210> 112

<211> 189

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cox6a1 3'-UTR

NM_007748

<400> 112

agagaacctg gcctccccca ggcaacaaag ggaccacagc actggttttg gacccttact 60

ctgtgtggac cacgaaaacc ctttggatgc taagctcgtg tctcctttcc tcagatggcg 120

accattactc tgatcttcca tcccttctgc ttgtaagagg agatgcctta aataaataac 180

ttaaactca 189

<210> 113

<211> 139

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufs6 3'-UTR

NM_010888

<400> 113

tgtgggctgt gtcctggtcc tctgactcct atggaacatc tccacgctgg gtgttctgtg 60

tgaggccact gctctgtgaa tggtgtccct tgttttgaat aaaggatgct cccaccatga 120

aaaaaaaaaa aaaaaaaaa 139

<210> 114

<211> 171

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Sec61b 3'-UTR

NM_024171

<400> 114

attgggctac atccatctgt catctgaaga agaagaagaa ggaaaaaaac ccaacatatc 60

ttggaccaaa agtgtagtga ttttctgttc acgtgtatta ttttacagag aataagaatt 120

gactttgaga aatcagtttt ttctatggct aataaacttt ggaattgctt t 171

<210> 115

<211> 101

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Romo1 3'-UTR

NM_025946

<400> 115

ttagggctag gatgccctgc aatacctaaa cttccccatc catttcgacc cttgtacaat 60

aataaagttg ttttcttctc gttaaaaaaa aaaaaaaaaa a 101

<210> 116

<211> 370

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gnas 3'-UTR

NM_010309

<400> 116

gaagggaaca cccaaattta attcagcctt aagcacaatt aattaagagt gaaacgtaat 60

tgtacaagca gttggtcacc caccataggg catgatcaac accgcaacct ttcctttttc 120

ccccagtgat tctgaaaaac ccctcttccc ttcagcttgc ttagatgttc caaatttagt 180

aagcttaagg cggcctacag aagaaaaaga aaaaaaaggc cacaaaagtt ccctctcact 240

ttcagtaaat aaaataaaag cagcaacaga aataaagaaa taaatgaaat tcaaaatgaa 300

ataaatattg tgttgtgcag cattaaaaaa tcaataaaaa ttaaaaatga gcaaaaaaaa 360

aaaaaaaaaa 370

<210> 117

<211> 96

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Snrpd2 3'-UTR

NM_026943

<400> 117

agcctgctcc ctgccctgcg aaggcctgca gaaccctgcc cagtgggcga gaaataaaac 60

cctgtgcttt ttggttaaaa aaaaaaaaaa aaaaaa 96

<210> 118

<211> 119

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mgst3 3'-UTR

NM_025569

<400> 118

ggtgtggagg gccttccgac tctcactcac ctccagcgac tcaccctgat ttccagttgc 60

actggttttt tttttttttt taatataata aaaacttatc tggcatcagc ctcatacct 119

<210> 119

<211> 304

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Aldh2 3'-UTR

NM_009656

<400> 119

agcggcatgc ctgcttcctc agcccgcacc cgaaaaccca acaagatata ctgagaaaaa 60

ccgccacaca cactgcgcct ccaaagagaa accccttcac caaagtgtct tgggtcaaga 120

aagaatttta taaacagggc ggggctggtg ggggggaaag ctcctgataa actgggtagg 180

ggatgaagct caatgcagac cgatcacgcg tccagatgtg caggatgctg ccttcaacct 240

gcagtcccta agcagcaaat gagcaataaa aatcagcaga tcaaagccac ggggtcagtt 300

ctct 304

<210> 120

<211> 134

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mp68 (2010107E04Rik) 3'-UTR

NM_027360

<400> 120

ctgctccgaa tccacaagat gaagacgtcg gctaaacttg agcaagcttt gttagatggg 60

aacatggaac atcactgtac acttatctaa gtaccattta taatgtggca ttaataaatg 120

tatctgtgaa tacc 134

<210> 121

<211> 87

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ssr4 3'-UTR

NM_001166480

<400> 121

gggcagcaac ttcagccgtc cattgcttct ttcaataaac agtcactatt tgacatgagt 60

acattcaaga aaaaaaaaaa aaaaaaa 87

<210> 122

<211> 186

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Myl6 3'-UTR

NM_010860

<400> 122

ggacattctg tatcccgagt ctgttccttg cccagtgtga tttctgtgtg gctccagagg 60

ctcccctgtc acagcacctt gcccatttgg tttcttttgg atgatgtttg ccttccccaa 120

ataaaatttg ctctctttgc cctccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 180

aaaaaa 186

<210> 123

<211> 58

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Prdx4 3'-UTR

Prdx4-001, NM_016764

<400> 123

aaagtacttc agttatgatg tttggacctt ctcaataaag gtcattgtgt tattacca 58

<210> 124

<211> 130

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ubl5 3'-UTR

NM_025401

<400> 124

agggggattc cttctcctcc tcgccctgct ctgccctgcc ctcctctccc atcctcatct 60

gacactggtg tagatggtca tttttaacag ttcacatgaa taaaaacttg gctgctgctt 120

tgctgctgtc 130

<210> 125

<211> 87

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus 1110001J03Rik 3'-UTR

NM_025363

<400> 125

tgcagagagt cctcagatgt tccttcattc aagagtttaa ccatttctaa caatatgtag 60

ttatcattaa atctttttta aagtgtg 87

<210> 126

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa13 3'-UTR

Ndufa13-201 ENSMUST00000110167

<400> 126

ggcctgagcc aacgcacata ataaagagtg gtc 33

<210> 127

<211> 69

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa3 3'-UTR

NM_025348

<400> 127

atgcctctgc tgatggaaga ggccccttcc ctgttgctct ccaataaaaa tgtgaaaact 60

aataacccc 69

<210> 128

<211> 96

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gstp2 3'-UTR

NM_181796

<400> 128

tggactgaag agacaagagc ttcttgtccc cgttttccca gcactaataa agtttgtaag 60

acaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 96

<210> 129

<211> 89

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tmem160 3'-UTR

NM_026938

<400> 129

acaacagggc tgtggggact ggctgggcct gacgactggg acattaaaac ctgacccttc 60

cgcaaaaaaa aaaaaaaaaa aaaaaaaaa 89

<210> 130

<211> 129

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ergic3 3'-UTR

NM_025516

<400> 130

ctctctccct tccccacagc ttgtcctgcc ctctcttccc ctgtgggttt accctccagc 60

ctgtcaacta cccatatcct ctcctcagcc agcccagccc agggcaataa atatgaattg 120

tgataggaa 129

<210> 131

<211> 295

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Pgcp 3'-UTR

NM_018755

<400> 131

ggagaacaag aagagaggac cttgttctct gtagttggga atcccaactc tgaatcttta 60

caacatccat cgtcacaaaa gagtgttata catttaatcc acagggcata gttttcttta 120

taccttctgt taatcatctt tccttaatac tttcttatct gtttctagaa taaatcatga 180

tccctactgc accaccttga aaatgttgtt tccagtttta aaataagcaa taaatatttg 240

aaatgcttct gatttttcat tttcatttaa aaacattaaa ttaaatgtaa tgaga 295

<210> 132

<211> 263

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Slpi 3'-UTR

NM_011414

<400> 132

gcctgatccc tgacattggc gccggctctg gactcgtgct cggtgtgctc tggaaactac 60

ttccctgctc ccaggcgtcc ctgctccggg ttccatggct cccggctccc tgtatcccag 120

gcttggatcc tgtggaccag ggttactgtt ttaccactaa catctccttt tggctcagca 180

ttcaccgatc tttagggaaa tgctgttgga gagcaaataa ataaacgcat tcatttctct 240

atgcaaaaaa aaaaaaaaaa aaa 263

<210> 133

<211> 241

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Myeov2 3'-UTR

NM_001163425

<400> 133

ggccgcccgg tcctatgtgc tccatgtctg tgatgtgtct ggagtctctc gggacacgac 60

cagctgattg tagacaccgt gttgatatca ctagaaatga agaccttgtc aaccaataga 120

ggaactgtct gaaccaactg ggtactgatg tctctgggaa tgccagcccg tgtccttgtt 180

taagttaata aagaacactg taacacgcag ggtgatttta aaaaaaaaaa aaaaaaaaaa 240

a 241

<210> 134

<211> 162

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa4 3'-UTR

NM_010886

<400> 134

actatgaagt tcactgtaaa gctgctgata atgaaggtct ttcagaagcc atccgcacaa 60

ttttccactt aagcaggaaa tatgtctctg aatgcatgaa atcatgttga tttttttttt 120

ttttggagtt tattacactg atgaataaat ctctgaaact tg 162

<210> 135

<211> 143

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufs5 3'-UTR

NM_001030274

<400> 135

gcggggcagc tggaggccgc tgtcatgctc tgttttcccc tggagagaat atttaaggaa 60

agctccttca ttaagtatta agtatgtgga aataaagaat tactcagtct taaaaaaaaa 120

aaaaaaaaaa aaaaaaaaaa aaa 143

<210> 136

<211> 455

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gstm1 3'-UTR

NM_010358

<400> 136

gcccttgcta cacgggcact cactaggagg acctgtccac actggggatc ctgcaggccc 60

tgggtgggga cagcaccctg gccttctgca ctgtggctcc tggttctctc tccttcccgc 120

tcccttctgc agcttggtca gccccatctc ctcaccctct tcccagtcaa gtccacacag 180

ccttcattct ccccagtttc tttcacatgg ccccttcttc attggctccc tgacccaacc 240

tcacagcccg tttctgcgaa ctgaggtctg tcctgaactc acgcttccta gaattacccc 300

gatggtcaac actatcttag tgctagccct ccctagagtt accccgaagg tcaatacttg 360

agtgccagcc tgttcctggt ggagtagcct ccccaggtct gtctcgtcta caataaagtc 420

tgaaacacac ttgccatgaa aaaaaaaaaa aaaaa 455

<210> 137

<211> 109

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus 1810027O10Rik 3'-UTR

1810027O10Rik-001 ENSMUST00000094065

<400> 137

agtctcttgt ttaagcgccc agtcctggcc tttctgggta attgggcgca gagggaagga 60

gccaatgttg aagcagaaaa gaaattaaaa gaaaaaggca tataaagaa 109

<210> 138

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus 1810027O10Rik 3'-UTR

BC117077

<400> 138

agtctcttgt ttaagcgccc agtcctggcc tttctgggta attgggcgc 49

<210> 139

<211> 55

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5o 3'-UTR

NM_138597

<400> 139

gagactgtca cctgtgtgag ctcttgtcct tggagcaaca ataaaatgct tcctg 55

<210> 140

<211> 174

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Shfm1 3'-UTR

NM_009169

<400> 140

catctgggaa tgtcccagga acctcaatca tggactctac cacagtctag gacagagaaa 60

gcaggacggg atactttaaa gaacatgttt atttcattat ctgcttcaat ttatttttgt 120

tttataacaa aaaaaataag taaataaatg ttttgattta atctttttgg ttca 174

<210> 141

<211> 260

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tspo 3'-UTR

NM_009775

<400> 141

aggcacccag ccatcaggaa tgcagccctg ccagccaggc accatgggtg gcagccatca 60

tgcttttatg accattgggc ctgctggtct acctggtctt agcccaggaa gccaccaggt 120

aggttagggt ggtcagtgcc gagtctcctg cagacacagt tatacctgcc tttctgcact 180

gctccaggca tgcccttaga gcatggtgtt ttaaagctaa ataaagtctc taacttcatg 240

tgtaaaaaaa aaaaaaaaaa 260

<210> 142

<211> 92

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus S100a6 3'-UTR

NM_011313

<400> 142

aatgggaccg ttgagatgac ttccgggggc ctctctcggt caaatccagt ggtgggtagt 60

tatacaataa atatttcgtt tttgttatgc ct 92

<210> 143

<211> 200

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Taldo1 3'-UTR

NM_011528

<400> 143

tgcaacaccc gaggccccag tcctgcaccg aggctgaccc cagacctgca ctgcctttga 60

gctgggtcct aattgcacat ggcttgtgac gaatgaatct tgcatttttt agtgatcgga 120

gaagggatgg atcataggat tctgatttta tgtgaaattt tgtctaattc attaaagcag 180

ttgcttttcc tatgctgttt 200

<210> 144

<211> 83

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Bloc1s1 3'-UTR

NM_015740

<400> 144

actaaaaccc acccctctta cttcaccctc ctggacagga gggaaactgg tgagccacga 60

ataaaaacac aagcttccat tct 83

<210> 145

<211> 93

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufb11 3'-UTR

NM_019435

<400> 145

tggcttaccg agcagggcct aagaagcatt actcatccgc tgcttgttat ttacctggtt 60

cctcagaaca ccttattaaa ggaattgaaa gta 93

<210> 146

<211> 454

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Map1lc3a 3'-UTR

NM_025735

<400> 146

gtcaagagga ggggaggggg gtggctggga gttctggtca ggttctcccc agggaggtcc 60

tggctcctaa actaagctat ttcagtcccc agtggattag gcagagatgt gacacccact 120

ccccccccca ggtaggggcc accagccagc ctaccacatc ctgggtaggt cctgggccag 180

tcatgttcgg gttgctcttt tgggtgctgg ctgggttggg agtgggtggg gagcagcatc 240

cctgctctgt ggggtttgtc attttgttag gcccttgcct gtctgcccat cttgcccctc 300

atccacctga ggctttgcct cctgccagga cctgccccac ccctgaaagg ctggctcccc 360

ttgtcctgac tcggtgtatg gatctgtggt catttcctct gcagaaagaa taaagactgc 420

tcaggcctgc ctggccaaaa aaaaaaaaaa aaaa 454

<210> 147

<211> 135

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Morn2 3'-UTR

NM_194269

<400> 147

acctgctgcc ttaacgctga gatgtggcct ctgcaacccc ccttaggcaa agcaactgaa 60

ccttctgcta aagtgacctg ccctcttccg taagtccaat aaagttgtca tgcacccaca 120

aaaaaaaaaa aaaaa 135

<210> 148

<211> 238

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gpx4 3'-UTR

NM_008162.2

<400> 148

ctagccctac aagtgtgtgc ccctacaccg agcccccctg ccctgtgacc cctggagcct 60

tccaccccgg cactcatgaa ggtctgcctg aaaaccagcc tgctggtggg gcagtcctga 120

ggacctggcg tgcatccctg ccggaggaag gtccagaggc ctgtggccct gggctcgagc 180

ttcaccctgg ctgccttgtg ggaataaaat gtagaaatgt gaaaaaaaaa aaaaaaaa 238

<210> 149

<211> 124

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mif 3'-UTR

NM_010798.2

<400> 149

gtcctggccc cacttacctg caccgctgtt ctttgagcct cgctccacgt agtgttctgt 60

gtttatccac cggtagcgat gcccaccttc cagccgggag aaataaatgg tttataagag 120

acca 124

<210> 150

<211> 135

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cox6b1 3'-UTR

NM_025628

<400> 150

cctggctccg cccacctctc ctctgttctt tgtctttctc cccggataga aaagggggac 60

ctcagcatat gatggtcctt accctgggac cctgaatcat gatgcaacta ctaataaaaa 120

ctcactggaa aagtt 135

<210> 151

<211> 267

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus RIKEN cDNA2900010J23 (Swi5) 3'-UTR

NM_175190

<400> 151

gcagcttctt ggagattttc atctacagcc cacagggaca ggaggatggg ggcataaaag 60

gcagagtcta gacagtatgt tcatatggtt ttcagatttt aaaagatgct agaagccctc 120

caaagtttgg ggtgggttct agagaagagg agtattggga ggggtgggta ttgtcaatgt 180

taaggttcct aaacatactt gtgagtaggt gtgtgtggtt gtcccttttg ttaataaaca 240

tatgagcagt caaaaaaaaa aaaaaaa 267

<210> 152

<211> 160

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Sec61g 3'-UTR

NM_011343.3

<400> 152

gtccttctca tcatgggacg agtgagccag agcgggggaa agggcatgaa gtaaagcgtt 60

gcctgaatgc tgtgtggtgt tttgtttctt cctccttcct atgaggtttt ctacttctca 120

attaaaataa tttcaaaata aacacttttt ccataacaga 160

<210> 153

<211> 62

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus 2900010M23Rik 3'-UTR

BC_030629

<400> 153

ccgtggggtc tgatactcat caataaaact gcctggtttc tcccacaaaa aaaaaaaaaa 60

aa 62

<210> 154

<211> 338

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Anapc5 3'-UTR

Anapc5-201 ENSMUST00000086216

<400> 154

ccaggactcc ctgcttgatg gtgtgcattt aggggtgggt cattacatgc tatcttgtca 60

ataaactgtt ctgatcagtt tgtctgaagt gggttttttt ttatttttct gggttgaatt 120

gtcagtatct ttgttaagaa ctgtgtatct aggggctgga gagatggctt agcagttaag 180

agcactaact gttcttctaa aggacctggg ttcaattcct agcaccctca tgacagctca 240

cagctgtctg taactcctgt tccagggact ctgacaccct caggcagaca taaaagcagt 300

caaaacaccg atgtacataa aattaaaata aattattt 338

<210> 155

<211> 71

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mars2 3'-UTR

BC132343.1

<400> 155

gaactcagct cttactgact ggtagtaaaa gatcaaatgt attctttttg cgtttttaag 60

taaagtcatg c 71

<210> 156

<211> 176

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Phpt1 3'-UTR

NM_029293

<400> 156

agctctgccc caccccccac cccccggact aagtcaggtc tctgctcttg ctgtgttctg 60

ttttgagggg ctggccctgt gctttccttt tgtaccttag gcagcatagc acctgccagg 120

ccttagaggc cagaccaatc tggtccatag gaattaaaag cattgatatg cctact 176

<210> 157

<211> 66

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufb8 3'-UTR

NM_026061

<400> 157

ggaggcttga tgggcttttt gccctcgttc ctagaggctt aaccataata aaatccctaa 60

taaagc 66

<210> 158

<211> 170

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Pfdn5 3'-UTR

NM_027044

<400> 158

gagtgcactg cagaaatgaa gcagagtgag ggacccttct tcaaggggcc tgggactttt 60

tccggcaatg gcctcctggg aaagtggcct gggaagagag tgttttgtgt ttaatgttaa 120

taaatgtgac cgctgcgcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 170

<210> 159

<211> 278

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Arpc3 3'-UTR

NM_019824

<400> 159

gaggagcctg ggcagcacca tcacgtggag acacatcata ggacacacag gccaatgtgt 60

ctgttcatac ctaccgtatc aaggagagaa gagagcctgt ctttgctgga aaagctcttg 120

gtcaagaatt gggagggtgg gtgttgggcg atttcgattt ttggcagttt taagctggta 180

cttaatatat aataaatgtc actgcttatg ttagacattg aattaaaaca tttttgagaa 240

aaagctttaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 278

<210> 160

<211> 58

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufb7 3'-UTR

NM_025843

<400> 160

ggattacccg ccagcctgtg gacctatcag tgaaataaaa gctttgggtc acctgcct 58

<210> 161

<211> 51

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5h 3'-UTR

NM_027862

<400> 161

agcagcctgg gacggagccc cggccgacat gaaataaaac atttaaatag t 51

<210> 162

<211> 80

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mrpl23 3'-UTR

NM_011288

<400> 162

cctatgacag caggatttgg accacagacc ctagtgagca cagtggttct gacaagccca 60

aataaaaatt ctttgtggag 80

<210> 163

<211> 387

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tomm6 3'-UTR

NM_025365.3

<400> 163

ccagagaatg gaactcctgt gtattcagac tttccaaaga cagcctactg tctgtgacca 60

caagatccta cctgagtggc agctgaagtt gactccctct ccttgcctga accccccccc 120

actgcccccc catcccccag tgtcggctga gatgttgcct ctgcacggtt ctgtgtgcag 180

ttcccaactt tctgcagaag atggtccttg cccttgtcct gaagagtagt aatggttctt 240

gaaaaagatt tcaaataaag cctgcacata aaagacaggt attttattct tttaataaga 300

aacttattac aaaaacaagg tgtaaaaagt ccgcttacaa aaatcaaata aacatgactt 360

gtatttcaaa aaaaaaaaaa aaaaaaa 387

<210> 164

<211> 327

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tomm6 3'-UTR

Tomm6-002 ENSMUST00000113301

<400> 164

ccaggtgaga gcagttctcc tgtgtttccc cgtttctgat gctgttatct gcttacagag 60

aatggaactc ctgtgtattc agactttcca aagacagcct actgtctgtg accacaagat 120

cctacctgag tggcagctga agttgactcc ctctccttgc ctgaaccccc ccccactgcc 180

cccccatccc ccagtgtcgg ctgagatgtt gcctctgcac ggttctgtgt gcagttccca 240

actttctgca gaagatggtc cttgcccttg tcctgaagag tagtaatggt tcttgaaaaa 300

gatttcaaat aaagcctgca cataaaa 327

<210> 165

<211> 273

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tomm6 3'-UTR

<400> 165

ccagagaatg gaactcctgt gtattcagac tttccaaaga cagcctactg tctgtgacca 60

caagatccta cctgagtggc agctgaagtt gactccctct ccttgcctga accccccccc 120

actgcccccc catcccccag tgtcggctga gatgttgcct ctgcacggtt ctgtgtgcag 180

ttcccaactt tctgcagaag atggtccttg cccttgtcct gaagagtagt aatggttctt 240

gaaaaagatt tcaaataaag cctgcacata aaa 273

<210> 166

<211> 631

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mtch1 3'-UTR

NM_019880

<400> 166

cctaagctgc ccgaccaaac atttatgggg tcttagccta cccctggtga ggacccatca 60

tctcagatgc ccaagggtga ctccagccca gcctggcttc atgtccatat ttgccatgtg 120

tctgtccaga tgtgggctgg tggaggtggg tcacctggga cctggggaag cctgggggag 180

cagtgttggg gtggcatccc cttcctgcct agaggtactg gagtccatct tgtactcagg 240

cagaggcagg ctgcagaggc aaacgtcact cagtggcaag gcttccctgc acctctagcc 300

cagctcatcc tgccagtcag ccagaagcac ccccgccccc cacttcctgc tttgtaaatt 360

gggcgccatc acacctgggc catgggaggc tggagctatg ttcccaacac taattttctt 420

atacaagggt ggtgccttct cctgaatagg aaatcatgtt ctcctcagac catcccctca 480

tctgcttgtc tgtgctggtg acgccaggtg tgagggttca gtcactgtgc tgggtgcgaa 540

tacgcacagg ttacataggc cgacatctag tcctcccctc gtggtaagat agacccatct 600

cctcgaataa atgtattggt ggtgatttgg a 631

<210> 167

<211> 158

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Pcbd2 3'-UTR

NM_028281

<400> 167

tctgcgcctg ccttgtctgc agcgttgttt gcaagccact tatgttaata aattgtcata 60

aagtagttca tagttacatg tatacattgt tgtatgattg atgctcaaat acagaatgat 120

ttgaagccaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 158

<210> 168

<211> 93

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ecm1 3'-UTR

NM_007899

<400> 168

gtcaccctga gcctcagagg attagatggg ggaactccgc cctactccac cctcctcgaa 60

cactcattac aataaatgcc tcttggattt ggc 93

<210> 169

<211> 458

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Hrsp12 3'-UTR

Hrsp12-001 ENSMUST00000022946

<400> 169

ctataagtag ccatgctgat gttgactccg gaggttttag aatgtctttc acactttaat 60

ttttacaaat gatgctggga agtataaaaa tgaccagagt ggttgaagtt attgtggaag 120

tgatcaaata tgtggagatt tgacattaat tggagattat tcagtatagt gactgatgtt 180

ctaatttcac ttatgttgct gggtgtgaga gaagaggtgc acagctactg agatgggaag 240

cagaaggaaa gatgggctgt tgtacatgag aaatagtaag gagcacatct acttaaatca 300

tattaatttg ctcatgtgaa atacttagtt cttatgttag atataagaaa ctaaattgaa 360

atattcaaac ttgaatagta ccaggagaac aagtggacca aaatcttata cagataatat 420

tactttaatt gaaataaaaa atagatgtgt aactttcc 458

<210> 170

<211> 183

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mecr 3'-UTR

NM_025297

<400> 170

ttgctccaga ggaccaggag gaaagcagga gaggcaagac tggctgtctg ctggcccctc 60

catgagaacc ccagccttcc cagactgcct cacccatatt gtctcttcct accaggaggg 120

tgggggacca actctaggct ccctaataaa cccttaactt cccgagtgga ggatgaagag 180

tac 183

<210> 171

<211> 120

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Uqcrq 3'-UTR

NM_025352

<400> 171

acggcctgca cctgggtgac agtcccctgc ctctgaaaga cccttctctg ggagaggaat 60

ccacactgta gtcttgaaga caataaacta cttatggact tccctttgaa aaaaaaaaaa 120

<210> 172

<211> 511

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gstm3 3'-UTR

NM_010359

<400> 172

gcccctgcca tgctgtcact cagagtgggg gacctgtcca tactgcggat cctgcaggct 60

ctgggtgggg acagcaccct ggccttctgc actgtggctc ccggttctct ctccttcccg 120

ctcccttctg cagcttggtc agccccatct cctcatcctc accccagtca agcccatgca 180

gcctttattc tccccatttt tttttcacat ggccccttct tcattggtgc ccagacccaa 240

cctcacagcc cttttctgca atctgaggtc tgtcctgaac tcaggctccc tagagttacc 300

ccaatggtca acactatctt agtgccagcc ctccctagag ataccctgat ggtcaatact 360

atcttagtga cggccctccc tagagttacc ctgaaggtca atactcgagt gccagcctgt 420

tcctgtttaa ggagctgccc caggcctgtc tcatgtacaa taaagcctga aacacacttg 480

aaacacaata aacactgaac acttgctgtg a 511

<210> 173

<211> 312

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Lsm4 3'-UTR

NM_015816

<400> 173

tcactccctg cctgagccga gcccagaacg gtgggtgagg cctcagggca cctttgtgtg 60

aagccccact tggcgtctgg tccagtgaag tccctcgctg gccactgact cagtttctgg 120

aaggttccga gtctgaggtg cctgtggagc cttagatgcc ctttgaaggg ctgacttctt 180

ccaggcatgt ttgagtttca gttggagctg caggctcagc ccatggcggc tcacctgtcc 240

tttaccagcc ataccctgta catcttctgt ttgaaaaata aaagcaaaca ccatagaaag 300

aaaaaaaaaa aa 312

<210> 174

<211> 195

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Park7 3'-UTR

NM_020569

<400> 174

agcccaagcc ctgggcccca cgcttgagca ggcattggaa gcccactggt gtgtccagag 60

cccagggaac ctcagcagta gtatgtgaag cagccgccac acggggctct catcccgggt 120

ctgtatgttt ctgaaccttg ctagtagaat aaacagttta ccaagctcct gccagctaaa 180

aaaaaaaaaa aaaaa 195

<210> 175

<211> 131

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Usmg5 3'-UTR

NM_023211

<400> 175

atggattttg aaatgtctga cctcacctgt taagtcccat gcctgaagaa gctgatgtga 60

actcatcatg taatactcaa tttgtacaat aaattatgaa cccaaaaaaa aaaaaaaaaa 120

aaaaaaaaaa a 131

<210> 176

<211> 231

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cox8a 3'-UTR

NM_007750

<400> 176

agggagcagt cttccctcat cctttgacta gaccactttt gccagcccac cttgatcatg 60

ttgcctgcat tcctggctgg ccttccccgg gatcatgtta ttcaattcca gtcacctctt 120

ctgcaatcat gacctctcga tgtctccatg gtgacaactg ggaccacatg tattggctct 180

gcttggtggg gtcccccttt gtaacaataa agtctattta aaccttgctc c 231

<210> 177

<211> 403

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ly6c1 3'-UTR

NM_010741

<400> 177

tggtccttcc aatgaccccc acccttttcc ttttatcttc atgtgcaacc actctttcct 60

ggagtcctct agtgacaaat tatatgttat agaaggtcca atgtggggat agtgtgtgga 120

acaccctgtt tcacctttat agcccctgct gggtaagtgc ccgactcctc tctagggctt 180

tcaaatctgt acttcttgca atgccattta gttgtggatt tctattcttg gccctggagg 240

catgtggcca gcacatgcaa caggcagtat tccaaggtat tatagtatca ccatccacac 300

ataagtatct ggggtcctgc agggttccca tgtatgcctg tcaatgaccc ctgttgagtc 360

caataaaagc tttgttctcc cagccaaaaa aaaaaaaaaa aaa 403

<210> 178

<211> 309

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ly6c1 3'-UTR

NM_001252058.1

<400> 178

actcataaaa atgctcctgc ctcggtcttc caagttctag gattgcaagt ctgacttcaa 60

catgccttac agacaactct gggacatcca ggcctagtgg catgttgccc agatatgggg 120

atgctctgtg gcccctgcat aagaagtgag tcactccctg atttcttgca gactctcaaa 180

gaaggaaact aaagacccgt cagtgccttt ctttctgccc tgctggtgtg ccaatcaggg 240

atcctaacat cagggagagg acttcctgtt gcagcgaaga cctctgcaat gcagcagttc 300

ccactgcag 309

<210> 179

<211> 802

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cox7b 3'-UTR

NM_025379

<400> 179

tcgtgccagc tggtacaata atcaaggaat tgtttaaaac caacttataa gtgaatgcca 60

agtcaaagaa tcatgtactc attatactat ggcagattga agaacaaata aagaaataaa 120

gtaccttaac cttcattcta ggctttgttt ttttcctttg taaatgaagc ccaagcatgg 180

tgacttctca tttatttaag ctgtattgtc tcttaaaatg gctttttacc ctatgaggtg 240

gtatgaggga aatctatgat caggagggca cctttatagt aagctgaaat tacagagaat 300

gaagaaataa gcacagagct gttttaggag cccactgggt cattggccat ataggttatg 360

cttactgccc tctacctcgt ggttatattt ggaattgcca ttagctccct tctgcttaga 420

gactggactg tcaccaaacc caaggggata gtgatcctgt aatgatcctg tgtgaactag 480

gtttgctaaa gactaccacc tccttacact gtatggcata ttcatctgaa ataggtgcta 540

atttttcagc ataatcctta atctttagga tctgtcatac ttcctagtaa tttaactgtt 600

gctgaagaaa taaaggctat ctgttaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 660

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 720

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780

aaaaaaaaaa aaaaaaaaaa aa 802

<210> 180

<211> 231

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ppib 3'-UTR

NM_011149

<400> 180

agagcctggg ggacctcatc cctctaagca gctgtctgtg tgggtcctgt caatccccac 60

acagacgaag gtagccagtc acaaggttct gtgccaccct ggccctagtg cttccatctg 120

atggggtgac cacacccctc acattccaca ggcctgattt ttataaaaaa ctaccaatgc 180

tgatcaataa agtgggtttt ttttatagct tgaaaaaaaa aaaaaaaaaa a 231

<210> 181

<211> 205

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Bag1 3'-UTR

NM_009736

<400> 181

agtgcagtgg agagtggctg tactggcctg aagagcagct ttacagccct gccctctctg 60

gaacagaagt cgcctgtttc tccatggctg ccaggggcaa ctagccaaat gtcaatttcc 120

ctgctcctcc gtcggttctc aatgaaaaag tcctgtcttt gcaacctgaa ttagacttgt 180

gttttctcaa aaaaaaaaaa aaaaa 205

<210> 182

<211> 140

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus S100a4 3'-UTR

S100a4-201 ENSMUST00000001046

<400> 182

agactcctca gatgaagtgt tggggtgtag tttgccagtg ggggatcttc cctgttggct 60

gtgagcatag tgccttactc tggcttcttc gcacatgtgc acagtgctga gcaaattcaa 120

taaaaggttt tgaaactatt 140

<210> 183

<211> 374

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Bcap31 3'-UTR

NM_012060

<400> 183

aggcttggtg tttccctgcc tgccgctggc ttctacctga cccatgctta ctgcttcctt 60

ggagcccaga ctatccctct ggtacttggg tttattccct acttccccaa ttttcttcca 120

tggcttatag atcattattt tggcaccatt acacatactg ctcttatacc aaaagggacc 180

tgattgttgt ttattcagag tacttttgcc actgttctgc ctggctaggg cactttccac 240

tcctggaagt gtagaaaagc actggtgacc tggcctgcag tttgaacccc tttttatttt 300

gcaatgtacc ctaaaggagg ctgctgtgaa gcaggtcaac tgttttatcc tgaggggaat 360

aaatgttgtt atgt 374

<210> 184

<211> 126

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tecr 3'-UTR

NM_134118

<400> 184

gcagctcctc acggctctgc ccagtaatac tctccacccc tcactgcccc tgtcctgatg 60

tgtggctggc catggctctc cagcagcaac aataaaacct gcttacccaa aaaaaaaaaa 120

aaaaaa 126

<210> 185

<211> 171

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Rabac1 3'-UTR

NM_010261

<400> 185

agtgtcctcc aggacctgcc ggcctctcct gccggccggc tgtcccatct ctgtctgttc 60

tcgtcctacc tggccttgct gctcagctcc gagccttcca cctgaggcct caaacccagg 120

gaggggcttt tgtctttgga aataaagctg ttacaattgc tatttggcca a 171

<210> 186

<211> 144

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Robld3 3'-UTR

NM_031248 (Lamtor2)

<400> 186

cagcgtgatg gaggctggag tagaaaaggg atgatgatct ggagggaggg gcggggccct 60

agaaacgcca tatcgggcga ggtacaggaa gggggggttg cttttttctg aataaatttt 120

caactcttaa aaaaaaaaaa aaaa 144

<210> 187

<211> 80

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Sod1 3'-UTR

NM_011434

<400> 187

acattccctg tgtggtctga gtctcagact catctgctac cctcaaacca ttaaactgta 60

atctgaaaaa aaaaaaaaaa 80

<210> 188

<211> 262

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Nedd8 3'-UTR

NM_008683

<400> 188

agaaacttgg ttccgtttac ctccttgccc tgccaatcat aatgtggcat cacatatcct 60

ctcactctct gggacaccag agccactgcc ccctctcttg gatgcccaat cttgtgtgtc 120

tactggtggg agaatgtgag gaccccaggg tgcagtgttc ctggcccaga tggcccctgc 180

tggctattgg gttttagttt gcagtcatgt gtgcttccct gtcttatggc tgtatccttg 240

gttatcaata aaatatttcc tg 262

<210> 189

<211> 257

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Higd2a 3'-UTR

NM_025933

<400> 189

gtatagccgg gtcttaaagc gccatggaaa ccattacaaa acccaggaac aacagacatc 60

cctgtcagac ttgctccctc cgtttcagac cggaccttat tgtcatttgg gtgaggaagt 120

ggccgatttt gtaactgatt tgcgcttcca ccgctgcccc ctcccgctcc caaaatccca 180

ggttcatttc agttgggttg catgcttcta tttgtgatgc gtccccttaa ttacttaata 240

aaagcttatt acacttg 257

<210> 190

<211> 268

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Trappc6a 3'-UTR

Trappc6a-001 ENSMUST00000002112

<400> 190

ggaccccaga ccccaggctt gcccttccct aagcttagcc tcggaatgtg gcacctgacc 60

ctgcctcact gctcaccttt gcaggtcgcc ttgaagctgg agctcacagg ctctggggag 120

gtcacatgtg cttcagacaa gggaatgaaa gggccgggag ggtcccggga ggtgggacca 180

tcccctgagt tccaagtcag catggaggga cattagggca tcacccagat gacagatgtt 240

cagtaaaggt tctttatgtg caaacaga 268

<210> 191

<211> 188

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ldhb 3'-UTR

Ldhb-001 ENSMUST00000032373

<400> 191

ctgccagtct ctaggctgta gaacacaaac ctccaatgtg accatgaacc tttagtcttc 60

agccatgtat gtaggtcaca gtttgcttct tccctgacat gtgatatgag ctcacagatc 120

aaagcccagg cttgtttgat gtttgcacta ggagctcctg atcaaataaa gttagcaatt 180

gcagcata 188

<210> 192

<211> 112

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Nme2 3'-UTR

Nme2-001 ENSMUST00000021217

<400> 192

acatgaagaa accagaatcc ttttcagcac tactgatggg tttctggaca gagctcttca 60

tcccactgac aggatggatc atcttttcta aaacaataaa gactttggaa ct 112

<210> 193

<211> 119

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Snrpg 3'-UTR

NM_026506

<400> 193

cctgtgctca gcaagcagtg tccacatccc tccccaaagg cctgtttgat tgtgatgtag 60

aattaggtca tgtacatttt catatggaac tttttactaa ataaactttt gtgatactc 119

<210> 194

<211> 235

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa2 3'-UTR

NM_010885

<400> 194

aggtctccac tgaggactgt gagcgagagc agctgaacct gctggactga agacagtgtg 60

gggaaatgtg tgctttgggt ccttataaag cttacgctgt acagtgtccc ttcagaatgt 120

cctcttcatt accttctccc tcttactgcg caacactgag gcaaagtagt tttatataaa 180

aatactcctt tatttctcct caaaaaaaaa aaaaaaaaaa acccaccagg tgcca 235

<210> 195

<211> 196

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Serf1 3'-UTR

Serf1-003 ENSMUST00000142155

<400> 195

tgactggctt tttggaaaac ctgggtgcta ttgccagtgg gtgcatcata cgctctaaga 60

ttaaaatttc acagtgacta atcattatat gtgttataac ttgtccttat aaaactattt 120

taaactttac tcttcagcct atcttaatgt gatgttttaa gaccatcaaa aaataaagta 180

ctgaccttgc atgtaa 196

<210> 196

<211> 286

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Oaz1 3'-UTR

Oaz1-001 ENSMUST00000180036

<400> 196

gtgccagccc tgcccagtgt ccctgtgccc tctcctgggt tagtccacat gtcgtgattg 60

tgcagaataa acgctcactc cattagcggg gtgcttcttc gagctgaatg ctgtgtttgt 120

cacactcaag tgttggcttt aattctaaat aaaggtttct attttacttt tttattgctg 180

tttaagatgg tcaggtgacc tatgctatag cagtctcctt tgaagtctgg aaaaatagtg 240

tcacctcccc tggctcaaat ccaataaagt gatctcgttc attggc 286

<210> 197

<211> 418

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ybx1 3'-UTR

Ybx1-001 ENSMUST00000079644

<400> 197

atgccggctt accatctcta ccatcatccg gtttggtcat ccaacaagaa gaaatgaata 60

tgaaattcca gcaataagaa atgaacaaag attggagctg aagaccttaa gtgcttgctt 120

tttgccctct gaccagataa cattagaact atctgcatta tctatgcagc atggggtttt 180

tattattttt acctaaagat gtctcttttt ggtaatgaca aacgtgtttt ttaagaaaaa 240

aaaaaaaaag gcctggtttt tctcaataca cctttaacgg tttttaaatt gtttcatatc 300

tggtcaagtt gagattttta agaacttcat ttttaatttg taataaagtt tacaacttga 360

ttttttcaaa aaagtcaaca aactgcaagc acctgttaat aaaggtctta aataataa 418

<210> 198

<211> 421

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ybx1(v2) 3'-UTR

with mutation T128bpG and deletion del236-237bp

<400> 198

tttttatgcc ggcttaccat ctctaccatc atccggtttg gtcatccaac aagaagaaat 60

gaatatgaaa ttccagcaat aagaaatgaa caaagattgg agctgaagac cttaagtgct 120

tgctttttgc ccgctgacca gataacatta gaactatctg cattatctat gcagcatggg 180

gtttttatta tttttaccta aagatgtctc tttttggtaa tgacaaacgt gttttttaag 240

aaaaaaaaaa aaggcctggt ttttctcaat acacctttaa cggtttttaa attgtttcat 300

atctggtcaa gttgagattt ttaagaactt catttttaat ttgtaataaa gtttacaact 360

tgattttttc aaaaaagtca acaaactgca agcacctgtt aataaaggtc ttaaataata 420

a 421

<210> 199

<211> 798

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Sepp1 3'-UTR

NM_009155

<400> 199

attatttaaa acaaggcata cctctcccca actcagtcta aagacacaat ttcattttga 60

gaatgtttac agcccattta attaatcagt gaactaaaag tcatagaaat tggatttgtg 120

caaatgtaga gaaatctacc atattggctt ccaaaattta aaaattttat gccacagaac 180

atttcatcca aatcagattt gtacaatagg gcacctgaaa agtgactgca gcctttggtt 240

aatatgtctt tctttttcct ttttccagtg ttctagttac attaatgaga acagaaacat 300

aaactatgac ctaggggttt ctgttggata gcttgtaatt aagaacggag aaagaacaac 360

aaagacatat tttccagttt tttttttctt tacttaaact ctgaaaacaa cagaaacttt 420

gtcttcctac tcttacattc taaaccgatg aaatctttaa cagattacac tttaaatatc 480

tactcatcat tttctctctc agagtcctag cttgagttgc actgcatgta tctgtgcatc 540

ttgttctctt catttaatgc tgtactgttc tgctgagctc tgagggacta tcttgagaga 600

tgtaatggaa ggaaagcgtg gtgttaatct gcgtactgct taagacagta tttccataat 660

caatgatggt ttcatagaga aactaagtcc tatgaacctg acctctttta tggctaatac 720

gactaagcaa gaatggagta cagaattaag tggctacagt acacacttat caaaataaat 780

gcaattttaa aacctttc 798

<210> 200

<211> 390

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gaa 3'-UTR

Gaa-001 ENSMUST00000106259

<400> 200

gagagtccgt cgtttacaga ggcctccagg gaggcagagg gagcttgagc tggctctggc 60

tggtggctcc tgtaaggacc tgcgtcctgc tctcctgaca catctttgag cttttcccac 120

cgtgttactg catgcgcccc tgaagctctg tgttcttagg agagtgaggc tcgcctcacc 180

tgccccaccc cagctgtctg tccctcacct ggcactagag aatgtggagc tcggcgtggg 240

gacatcgtgt ctgcaccaac atcaggctgt gcagccactg cagccgcaac cctgcagaga 300

cagagctggt gccttcacca ggttcccaag actcgagaaa cttactgtga agtgtactta 360

cttttaataa aaaggatatt gtttggaagc 390

<210> 201

<211> 481

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ACTR10 3'-UTR

ACTR10-002 ENST00000254286

<400> 201

aagtttgatt aaaaatcaac cttgcttcat atcaaatatt taaccaatta taagcaaatt 60

gtacaaagta tgtaggatgt tttgttatag aggactatag tggaagtgaa agcattctgt 120

gtttactctt tgcattaata tataattctt ttgactttgt ttctcttgtg tagtggtaaa 180

atggtagctg gtgcttattg agatttgctg tatttatatc aataaagtat agtaaagcag 240

tttgattttg gaagtttgtt atgtggcttt tttttttttt ttttttttga gacggagtct 300

cgctctgtca cttaggctgg agtgcagtgg cacaatctct actcattgca agctccgcct 360

cccgggttta cgccattctg tctcagcctc ctgagtagct gggactatag gcatacgcca 420

ccccgcccgg ctaatttttt gtatatttag tagagacggg gtttcaccat gttagccagg 480

a 481

<210> 202

<211> 347

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PIGF 3'-UTR

NM_173074

<400> 202

gtaacttaat cctgacaacc gtagtgcaag gtatggccca tctcctgtac gcttggagcg 60

acctttggct acgtggctgg ccttgttatt tcaccactct ggatatactg gaatagaaag 120

caacttacat acaagaacaa ttaactggag caaagggaga tatttctttg tgcagattct 180

gtaagggctg ggcagaaatg tgtatggtca aagccaagca gttccattta cagctctgtt 240

ttttacgtag ttacaacatg atgtgattgt agctttttaa actatgaaac ccctgagaga 300

ttgtaccttc tagttgaaat aaagtattta taatagattg tggcttc 347

<210> 203

<211> 233

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PIGF 3'-UTR

NM_002643.3

<400> 203

ctggagcaaa gggagatatt tctttgtgca gattctgtaa gggctgggca gaaatgtgta 60

tggtcaaagc caagcagttc catttacagc tctgtttttt acgtagttac aacatgatgt 120

gattgtagct ttttaaacta tgaaacccct gagagattgt accttctagt tgaaataaag 180

tatttataat agattgtggc ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 233

<210> 204

<211> 116

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MGST3 3'-UTR

MGST3-001 ENST00000367889

<400> 204

agaattatag gggtttaaaa actctcattc attttaaatg acttaccttt atttccagtt 60

acattttttt tctaaatata ataaaaactt acctggcatc agcctcatac ctaaaa 116

<210> 205

<211> 913

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SCP2 3'-UTR

NM_001193599

<400> 205

agaactccct ttggctactt ttgaaaatca agatgagata tatagatata tatccataca 60

ttttattgtc agaatttaga ctgaaactac acattggcaa atagcgtggg atagatttgt 120

ttcttaatgg gtgtgaccaa tcctgttttt cctatgctct gggtgaatag agcctgatgg 180

tatactactg ctttgcggaa ttgcatacaa ctgtgcatta caaagttaat atggtaatta 240

tggtctgggg taaaattgag tttcagaata aaattaggaa cagtaaaatc caaagaacta 300

tgtaaacaaa aaagcttttg ttttgcttac aaagtatatt taaggattat tctgctgaag 360

attcagttta agagttttcc ttgggagaac taagtaagaa acacaatgcc aacagctggc 420

cagtaattag tgttgtgcac ttcatgtcat taatcaattt ctcaatagtt cttaaaatta 480

gtgagattaa aaatctaaaa attttgcatt tcatgctatc agaaacagta ttttcttccc 540

aaatcaaaat aaaagaaata tgatcagagc ttgaacacag gcttattttt aaaataaaaa 600

tatttttaac atgggtttcc ttattgaaaa atcagtgtat tagtcataaa acaccatcat 660

taagaataat tgaacaataa agtttgcttt cagatgcagt tttcaaatta taatctcatt 720

tcaatttata acgttctcag tcctttgtta taattttcct ttttcatgta agtttaatta 780

tctgcattta tcttttttcc tagtttttct aatactaatg ttatttctta aaattcagtg 840

agatatagga taaaataatg ctttgagaag aatgtttaat agaaaattaa aataactttt 900

tctggcctct ctt 913

<210> 206

<211> 409

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SCP2 3'-UTR

SCP2-015 ENST00000435345

<400> 206

agaactccct ttggctactt ttgaaaatca agatgagata tatagatata tatccataca 60

ttttattgtc agaatttaga ctgaaactac acattggcaa atagcgtggg atagatttgt 120

ttcttaatgg gtgtgaccaa tcctgttttt cctatgctct gggtgaatag agcctgatgg 180

tatactactg ctttgcggaa ttgcatacaa ctgtgcatta caaagttaat atggtaatta 240

tggtctgggg taaaattgag tttcagaata aaattaggaa cagtaaaatc caaagaacta 300

tgtaaacaaa aaagcttttg ttttgcttac aaagtatatt taaggattat tctgctgaag 360

attcagttta agagttttcc ttgggagaac taagtaagaa acacaatgc 409

<210> 207

<211> 591

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HPRT1 3'-UTR

HPRT1-001 ENST00000298556

<400> 207

gatgagagtt caagttgagt ttggaaacat ctggagtcct attgacatcg ccagtaaaat 60

tatcaatgtt ctagttctgt ggccatctgc ttagtagagc tttttgcatg tatcttctaa 120

gaattttatc tgttttgtac tttagaaatg tcagttgctg cattcctaaa ctgtttattt 180

gcactatgag cctatagact atcagttccc tttgggcgga ttgttgttta acttgtaaat 240

gaaaaaattc tcttaaacca cagcactatt gagtgaaaca ttgaactcat atctgtaaga 300

aataaagaga agatatatta gttttttaat tggtatttta atttttatat atgcaggaaa 360

gaatagaagt gattgaatat tgttaattat accaccgtgt gttagaaaag taagaagcag 420

tcaattttca catcaaagac agcatctaag aagttttgtt ctgtcctgga attattttag 480

tagtgtttca gtaatgttga ctgtattttc caacttgttc aaattattac cagtgaatct 540

ttgtcagcag ttccctttta aatgcaaatc aataaattcc caaaaattta a 591

<210> 208

<211> 283

<212> DNA

<213> Artificial Sequence

<220>

<223> ACSF2

Homo sapiens

<400> 208

ataaagcagc aggcctgtcc tggccggttg gcttgactct ctcctgtcag aatgcaacct 60

ggctttatgc acctagatgt ccccagcacc cagttctgag ccaggcacat caaatgtcaa 120

ggaattgact gaacgaacta agagctcctg gatgggtccg ggaactcgcc tgggcacaag 180

gtgccaaaag gcaggcagcc tgcccaggcc ctccctcctg tccatccccc acattcccct 240

gtctgtcctt gtgatttggc ataaagagct tctgttttct ttg 283

<210> 209

<211> 555

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens VPS13A 3'-UTR

NM_033305

<400> 209

aattcatatg ttctttattt tacttggaat gtttcattaa catgttttgt atgacttata 60

ccataatgcc catatgtcca tttataggga ggtaaaacac attttctttt aaaatgtttt 120

cctacacatt ttcataaagc aaaataattg tattatttaa gcacagaaaa aaatgtatct 180

tacatccaaa gtagggaggg catccaacat attatagatt tgcttttata tattttatag 240

ctttgtattg catagtttgt ctttaagagt tcaagttaga cttaaatata attttgatgt 300

tcactggttt tattttaaat tgccttctta tttgttagca aaatgccttt ttttaatggt 360

ctctgtaaat tttctgggct ttaatgtaat gccactgtgt aaaaaaaaag gaagaaaata 420

gtaatagcca tttaatgttt tatatttatc attttaaaga tatttttgtc aaatttcttt 480

taataataat aaacatatgt aatctaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540

aaaaaaaaaa aaaaa 555

<210> 210

<211> 724

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CTH 3'-UTR

NM_001190463.1

<400> 210

tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60

aatggaccaa caatgagcct ttgcaaaatt ttcaagcgga aattttaagg cacctcatta 120

tctttcataa ctgtaatttt cttagggatc atctctgtta aaaagttttc tgtatgtcat 180

gttataatta caggtcaatt ctgttaatat ctttttgtta attttgctct atgtttgcct 240

ctgaaggagg tgagatttgt gctactttgg gagattatgt tcttttttca tgtctaagat 300

ttattttgat catgtttata atataatggt aattcatttt tgatgttttg tgaagaattt 360

aaatttaaac gaatgttctt aaatcaagtg tgattttttt gcatatcatt gaaaagaaca 420

ttaaaagcaa tggtttacac ttagttacca taagccgaaa atcaaatact tgaaaagttt 480

actgtgaaat tctactgatt taagactata cttaatattt ttaaaaaaat aaatcagctg 540

ggcgcggtgg ctcacgcatg taatgccagc acttttggag gataaggcgg gcggatcacg 600

aggtcaggag attgagacca tcctggctag cgcagtgaaa cccccatctc tactaaaaat 660

gcaaaaaaaa ttagacggac gtggtggcgg gtgcctgtag tcccagctac ttgggaggct 720

gagg 724

<210> 211

<211> 443

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CTH 3'-UTR

CTH-001 ENST00000370938

<400> 211

tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60

aatggaccaa caatgagcct ttgcaaaatt ttcaagcgga aattttaagg cacctcatta 120

tctttcataa ctgtaatttt cttagggatc atctctgtta aaaagttttc tgtatgtcat 180

gttataatta caggtcaatt ctgttaatat ctttttgtta attttgctct atgtttgcct 240

ctgaaggagg tgagatttgt gctactttgg gagattatgt tcttttttca tgtctaagat 300

ttattttgat catgtttata atataatggt aattcatttt tgatgttttg tgaagaattt 360

aaatttaaac gaatgttctt aaatcaagtg tgattttttt gcatatcatt gaaaagaaca 420

ttaaaagcaa tggtttacac tta 443

<210> 212

<211> 77

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CTH 3'-UTR

CTH-002 ENST00000346806

<400> 212

tattccagag ctgctattag aagctgcttc ctgtgaagat caaatcttcc tgagtaatta 60

aatggaccaa caatgag 77

<210> 213

<211> 286

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NXT2 3'-UTR

NXT2-004 ENST00000372107

<400> 213

aggggcaaaa gtccattctc atttggtcca ttagttccag caattgaaat ttatgtgaat 60

tattttgatt gtagaagcac tataatatgt gctgaaacta aatttcttta atattttcta 120

ttcctgtcag caccttttct agcagctgcc agtttggagc attgccctct aagagcttta 180

aaactatttt tttacatgcc ttatatacat tccactaatg acattcttat aataatatta 240

aacacatgat cttggtacta acatactcac tgtgaaccca gcctat 286

<210> 214

<211> 121

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MGST2 3'-UTR

NM_002413

<400> 214

ctttttctct tccctttaat gcttgcagaa gctgttccca ccatgaaggt aatatggtat 60

catttgttaa ataaaaataa agtctttatt ctgtttttct tgaaaaaaaa aaaaaaaaaa 120

a 121

<210> 215

<211> 582

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MGST2 3'-UTR

NM_001204366.1

<400> 215

ctttttctct tccctttaat gcttgcagaa gctgttccca ccatgaaggc ttgaagccac 60

agtgcatggc cagaaccagc cagacctttg gagttcaaga actcgagagg tgggtgaaaa 120

ctgccattgc ctccacagac tgtcttctcc gtggaaagaa gacctgagtc accagggctg 180

ggaaacctgc accactgaga cgagcacagc ctctgccggc atgcaagtgg ccgctgtcag 240

gacacatgga ctgaaagtgg tttgtcagct gctccattag gtttttttta cccatatgtt 300

tgctaccttt ctttccttga tttaaaaata gggaggggga gcagtctcag ctgtcttcag 360

ctgctaggga gatttttttc cccctcctga gctactgttt cccccaaccc gagcctttct 420

ctcttattgt acccaccctt tctgatgaag tcatcaaagc aaagattgca taactgatgc 480

ataggcctat cttgtgttat actgggagac aggccaatgt ttccattaat agacaagagc 540

accaccacgc tgccaaatgg agctctctgc tgcaaccact ac 582

<210> 216

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C11orf67 3'-UTR

AAMDC-005 ENST00000526415

<400> 216

tggagcctta agaggagaat aaatcactaa gtgccta 37

<210> 217

<211> 266

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PCCA 3'-UTR

NM_000282

<400> 217

aggatttata acctttcagt catcacccaa tttaattagc catttgcatg atgctttcac 60

acacaattga ttcaagcatt atacaggaac acccctgtgc agctacgttt acgtcgtcat 120

ttattccaca gagtcaagac caatattctg ccaaaaaatc accaatggaa attttcattg 180

atataaatac ttgtacatat gatttgtact tctgctgtga gattccctag tgtcaaaatt 240

aaatcaataa aactgagcat ttgtct 266

<210> 218

<211> 142

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GLMN 3'-UTR

NM_053274

<400> 218

aagttccatt tcctaaataa aaactaataa aatatagtac tttccattat gattcattta 60

atacctttat aaaaaatttt tctgtaaaaa tttactgctt gaaaaataaa tgtagctttt 120

ctcatttatc aaaaaaaaaa aa 142

<210> 219

<211> 276

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens DHRS1 3'-UTR

NM_001136050

<400> 219

ccctcctggt ctgacactac gtctctgctt gtcttctcat ttggacttgg tggttcgtcc 60

tgtctcagtg aaacagcagc ctttcttgtt tacccatacc cttgatatga agagaagccc 120

tctgctgtgt gtccgtggtg agttctgggg tgcgcctagg tcccttcttt gtgccttggt 180

tttccttgtc cttcttttta ctttttgcct tagtattgaa aaatgctctt ggagctaata 240

aaagtctcat ttctctttca aaaaaaaaaa aaaaaa 276

<210> 220

<211> 450

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PON2 3'-UTR

PON2-001 ENST00000433091

<400> 220

attgtacttt tggcatgaaa gtgcgataac ttaacaatta attttctatg aattgctaat 60

tctgagggaa tttaaccagc aacattgacc cagaaatgta tggcatgtgt agttaatttt 120

attccagtaa ggaacggccc ttttagttct tagagcactt ttaacaaaaa aggaaaatga 180

acaggttctt taaaatgcca agcaagggac agaaaagaaa gctgctttcg aataaagtga 240

atacattttg cacaaagtaa gcctcacctt tgccttccaa ctgccagaac atggattcca 300

ctgaaataga gtgaattata tttccttaaa atgtgagtga cctcacttct ggcactgtga 360

ctactatggc tgtttagaac tactgataac gtattttgat gttttgtact tacatctttg 420

tttaccatta aaaagttgga gttatattaa 450

<210> 221

<211> 277

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NME7 3'-UTR

NM_013330

<400> 221

tggtgtggaa agtaaagaag tcacaggttg ggacatttag acaagagtga atcacacacg 60

aggaatgtgt tcattctttt attgtccgtt gttttaacct gactgaatac aagatcaaca 120

agagcactgt actcctggca attattacat atgttagaac atggattttg cactgtagac 180

aacatttaac accagtctat ggggtactgc attgcttttt ataaagttca aaataaagat 240

ttattttcaa acaaaaaaaa aaaaaaaaaa aaaaaaa 277

<210> 222

<211> 163

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ETFDH 3'-UTR

NM_004453

<400> 222

actgcagcta gccagtttct ttcaagtatg gcaagctaac gttaaaatgt ttagagatta 60

acagatttca gaatgtcttt ctgcatatta ctgaacagaa tagtcacaaa atgattatca 120

aataaaaatt ttatactata tgtaagattg tcccataaag aaa 163

<210> 223

<211> 275

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ALG13 3'-UTR

BC117377

<400> 223

gatccagcag tatgaagtat tcttgcactg ccattttctt gctgtttttg tttttaaaaa 60

gtattttatg ttagtggtta aatgatttag gtgattagtg tttactattg tatttgtctt 120

taaaattatt ttatcttttg atttaaaata gtactttaaa attaaggggt attattttgg 180

gctgtgacta aggaaattga gatggatgta caactagccc catattgagc atacttcatt 240

gtattcagct gttttcctgt cagccatttg tcagc 275

<210> 224

<211> 664

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ALG13 3'-UTR

NM_001099922.2

<400> 224

gatccagcag tatgaagtat tcttgcactg ccattttctt gctgtttttg tttttaaaaa 60

gtattttatg ttagtggtta aatgatttag gtgattagtg tttactattg tatttgtctt 120

taaaattatt ttatcttttg atttaaaata gtactttaaa attaaggggt attattttgg 180

gctgtgacta aggaaattga gatggatgta caactagccc catattgagc atacttcatt 240

gtattcagct gttttcctgt cagccatttg tcagctttat attagctgat ggtaccaatt 300

gataaaatga atataaagta tttcattggt tcaaaaatca cacatcatat taaaccatgc 360

agaattggag taacttccac ttttttctag aaagtaaaac caagagcctt tgcttctgga 420

taactcactt aatattaaat taaagagctc ttcacgtttc ttgagaatta tctgaagcca 480

gttgcattct gtgatatcag ttttgaaggc acatggttct ctgctttaga tttatcccat 540

atgctattgt ttaatactgg atgtatgtaa gtgttttact gcactgtatt gaattggtgt 600

cttttgcaca gttagcagta aataaaaatt agcatttaaa attgccaaaa aaaaaaaaaa 660

aaaa 664

<210> 225

<211> 640

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens DDX60 3'-UTR

DDX60-001 ENST00000393743

<400> 225

aaacaaagtc tatgcaaacc acttaaaaat aattccatag tagtttttca ggtcacgttt 60

ttgattctta tgcttcttgc cagaaataca ttatgataaa gtggaaatac attacgatga 120

agtggaaaga gcaaacactt tggaatcaaa cagagttgca atcaaacctg ccatgttctg 180

tcatgaatac tcacaaatta tttagtatac ctgaatcttg gtttcttttt ataactgagt 240

aataatggtt acatctcagg tagtttgagg attgactaaa aaaatgcgag aatgttgtat 300

gtgactgaat aacaattttt actctgcgaa gccaaagtaa atataatatt atcagtaact 360

ttatccccag tgtcagtatt tataaaatgt ttattaaggc tagaaaaaat gaatacaata 420

tcctgaaggt gaaatatatt ctcttcaatt agcataaata tgatttacat aagttagcta 480

tacagctatt gagatagtac tttctagtaa acttaaacta ctttttaaac atacattttg 540

tgatgattta acaaaaatat agagaatgat ttgctttatt gtaattgtat ataagtgact 600

ggaaaagcac aaagaaataa agtgggttcg atctgtttac 640

<210> 226

<211> 451

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens DYNC2LI1 3'-UTR

NM_015522.3

<400> 226

aattcatttg atgtagatga acctgttcac tggaaaatta cagcaattta ttaaaacctc 60

agtaagagca aaacaaggaa gaagattcct tatatcttct tgttagacat cttctgtgat 120

tgttatggca tattacacca atcagagaaa tagagtttta aagtagtggt ttgatattga 180

ttttataatc tctgtaaaaa tgaagataaa aagccagatt gtacaaaagt cacctgacaa 240

agactagatg aagctacaac tttaagcaag gggtagagtt gtaatagcct tcaccatcac 300

tctgtatttt acattcattt cgtttctgtc acttattcag tatcttttta tcatctgaca 360

gctaattaaa ttataaagtt gctatgatgg taacacaagt tcttcaaata caataataaa 420

tatcatcatc tggaaaaaaa aaaaaaaaaa a 451

<210> 227

<211> 606

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens VPS8 3'-UTR

NM_001009921, NM_015303

<400> 227

tgactccatg gagcctggcc caggagaacc agagatgatc ccgaggcagc tggggagagg 60

ccccgcctct ggtgggcttg gcctccacca cctcccacgc ttctgagaag aggttccaaa 120

ttgggcttct gtgcccagag cgtccacagc accattccca gtgtagactc ccagtcttct 180

ccacattgct gtcatggcgt cagttcacca gactcattga ttttgttttg cttgttaagc 240

aaaggaatgt cacatacctc tgtccagctt tttaggaaat acatttcgcc tattgcgact 300

ttttccattt accctgaagc ctagaaagta ggtggaactc acacaaatgg cattccagag 360

tctgccatac tccgtctcct ccagctgctg gataatacag aggaacttca acttctacag 420

ggaacagtgg ttggccaggc tgcagtataa ctgaagcatg ccttggagag agcagacact 480

gtgggggcca gggccatctc cctttaatgt gttcatgtta aaacctattt gagtgtaaga 540

cttgcccttt ctaacaataa atgctccgtg tttaagttct gcaggtctca aaaaaaaaaa 600

aaaaaa 606

<210> 228

<211> 360

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ITFG1 3'-UTR

NM_030790

<400> 228

cttgccttta atattacata atggaatggc tgttcacttg attagttgaa acacaaattc 60

tggcttgaaa aaatagggga gattaaatat tatttataaa tgatgtatcc catggtaatt 120

attggaaagt attcaaataa atatggtttg aatatgtcac aaggtctttt tttttaaagc 180

actttgtata taaaaatttg ggttctctat tctgtagtgc tgtacatttt tgttcctttg 240

tggaatgtgt tgcatgtact ccagtgtttg tgtatttata atcttatttg catcatgatg 300

atggaaaaag ttgtgtaaat aaaaataatt aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360

<210> 229

<211> 215

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CDK5 3'-UTR

NM_004935

<400> 229

gccccgggac ccccggcctc caggctgggg cctggcctat ttaagccccc tcttgagagg 60

ggtgagacag tgggggtgcc tggtgcgctg tgctccagca gtgctgggcc cagccggggt 120

ggggtgcctg agcccgaatt tctcactccc tttgtggact ttatttaatt tcataaattg 180

gctcctttcc cacagtcaaa aaaaaaaaaa aaaaa 215

<210> 230

<211> 146

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C1orf112 3'-UTR

BC091516

<400> 230

aacttatcac taggcagaac tgggtttgat gctttgtcaa ctgaaaatac ttatgtctgt 60

acattttcta acagatataa aacaaatttt gtaaagttga aaaaaaaaaa aaaaaaaaaa 120

aaaaaaaaaa aaaaaaaaaa aaaaaa 146

<210> 231

<211> 239

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IFT52 3'-UTR

NM_016004

<400> 231

agaccatgcc tcttgaagct ttttctgcct cctgattctc tctttgtaaa ctattttcaa 60

attgtttttc aactccttat caaaattgtt tatacactct ttcctccatg agctctggaa 120

ggtatatgca tcttctgtaa tactcagata ggtataagat ttttcacaaa atccttatgt 180

aagatacatt ccatttttaa aaattaaatg tatggttgca tctgtctttt tatacccta 239

<210> 232

<211> 146

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CLYBL 3'-UTR

CLYBL-003 ENST00000339105

<400> 232

tctgttaaat gaagctgtca tcaggctaaa gggtattgaa gctgcagagg gatcaacttg 60

tgcttgccag aggacgccaa tgaagtttga aacaccaaca atcagagatt ttgtttctgt 120

tcctcattaa atcatgagct tttgtg 146

<210> 233

<211> 477

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens FAM114A2 3'-UTR

FAM114A2-006 ENST00000520667

<400> 233

agaatggaga cgttttgacc tgggacttgt gacggccaag gaatgccacc ttattctggc 60

tactcctgca gaaatgaagg agtggggtta ttttagtata taaaaattca ggcaggagag 120

atggtttaaa gaggaagatt gttgccttca gtgtttgatt gaagtattca ggttctcaca 180

gtattctttc cagttgttgt aattcataaa ttatttgaaa agaaactttt gtagaaagtc 240

caagaataat aactctagat aaagattagt gggacactca ggcaaaaatg ttggtctttc 300

tttgacatgt tgcaaaatgt tatcaatttt gtcatggata taatttgcag cccatggata 360

taactggttg ataagccaga gaaaaataat ttagtgttct aaaattcatg gcatgtgtgg 420

tttattaatg ccatgtactt tctcctttct ggaataaaat ctatggcttt aagaaaa 477

<210> 234

<211> 310

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NUDT7 3'-UTR

NM_001243661

<400> 234

tttactagag caagagacaa agaactattc acgaggattc tgtgtgtgct tattcgtaga 60

acaacaacaa tgccagctgt tggaatttga caggtgtgaa tattttttct gcagtatgta 120

gttagaatcc ttgcctcttt tccagttgcc ttctattgtc tgaaaaagta aaagccattc 180

aaaaatgaaa actatgttca tagtgttgca tattttcacc cacaatatgt taataatatt 240

tttcttacac atataataaa gaatatctgg cacatactag gcccttaata aagatttttt 300

gaatatataa 310

<210> 235

<211> 513

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens AKD1 3'-UTR

NM_001145128

<400> 235

tttacttagg tgatagcagc ctgaatctca agagttatct gaaagtgata gagggaaact 60

gagagaagta gattgaaaat ctgggcctct tggaagtact tttgcctcct gagcaaggta 120

ccatggctgc cagacttcag gtgaactcaa aggtctgcca gccaggaagg agcactctta 180

tggaaacaag ttttaataca attttaaaat gtattgctct ttgcctgaac tttgatgctt 240

taacaaaata aacattctat ttataattcc atatagaaaa gttaagtgac ttatttaata 300

aatgtattat tttccttttt aacattttca gtagaaaagt cagtctctgt taaaattact 360

cattaaatgt tagaaagctt taagacattt aacattgtta taaatgaaac caaaatatgg 420

gttatacatt ttacatacaa aactgtttgt gaactttgtg aacataagat actatcattt 480

tcccaataaa ataaatggat tttgcaacaa ctt 513

<210> 236

<211> 160

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MAGED2 3'-UTR

NM_014599

<400> 236

gattttagat attgttaatc ctgccagtct ttctcttcaa gccagggtgc atcctcagaa 60

acctactcaa cacagcactc taggcagcca ctatcaatca attgaagttg acactctgca 120

ttaaatctat ttgccatttc aaaaaaaaaa aaaaaaaaaa 160

<210> 237

<211> 498

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HRSP12 3'-UTR

HRSP12-001 ENST00000254878

<400> 237

gtgggcccag tgctgtgtag tctggaattg ttaacatttt aatttttaca attgatgtaa 60

catcttaatt aaccttttaa ttttcacaat tgatgacagt gtgagtttga tgaaaatatc 120

tgaagctatt atggaaatac catgtaatag ggagagttga acatgaatat tagagaagga 180

atccagttac ttttttaaat tacacctgtg tgcacctgta ttactgaata taggaaagag 240

atacccatta catagttact cagtaaacaa aagagaaata ccaggtagga aagaagagtt 300

actattcctg agaaataatc aagaacatat ttaatttaaa ctaatgatgt gaactattta 360

gttttgatgt ccgttatgtg attctgcttt tacttgagta aaattaaagt gtttaaattt 420

gagatcaagg agaagatagt ggaacaaaat gttatataga taatattttt ctaatggaaa 480

taaaataggc agatttcc 498

<210> 238

<211> 127

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens STX8 NM_004853 3'-UTR

<400> 238

tggcagtaaa gagaccacca gcagtgacac ctgccaatga cagatgcaag cccaacaccc 60

ttttggtacg caaaacctgc tctcaataaa ttcccccaaa gctctgaaaa aaaaaaaaaa 120

aaaaaaa 127

<210> 239

<211> 386

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ACAT1 3'-UTR

ACAT1-001 ENST00000265838

<400> 239

acaacctctg ctatttaagg agacaaccct atgtgaccag aaggcctgct gtaatcagtg 60

tgactactgt gggtcagctt atattcagat aagctgtttc attttttatt attttctatg 120

ttaactttta aaaatcaaaa tgatgaaatc ccaaaacatt ttgaaattaa aaataaattt 180

cttcttctgc ttttttcttg gtaaccttga aaagtttgat acatttttgc attctgagtc 240

tatacttatc gaaatatggt agaaatacca atgtgtaata ttagtgactt acataagtag 300

ctagaagttt ccatttgtga gaacacattt atatttttga ggattgttaa aggtcaagtg 360

aatgctcttt ataggtaatt tacatt 386

<210> 240

<211> 189

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IFT74 3'-UTR

IFT74-201 ENST00000433700

<400> 240

gtttaagtcc actgaaagtc tctaaggaag tatcctcttg ctgctaaact tggtacaagt 60

tgactaccaa aaaaaaaaaa agcttacttt tggagtttac ctaaaatttc tgaatgttat 120

aatttttgtg gcctctttta agaatgatat tttaaaatag taaatagttc aataaatggt 180

ttgcatatt 189

<210> 241

<211> 361

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens KIFAP3 3'-UTR

NM_014970

<400> 241

taaagtatct gtttccatgt gtaatctcag cttagaagaa atctgtgtgg gttgggttaa 60

ttttggatct ttgcctaata atgcatgttg atgttattgt gggtctgtgt ttgtttttat 120

ttttatatgt tgttagctgc agattaaccc cagcccctct gtcttctgtt aagtacagtt 180

gatactgaca ttgttcactc atcaaaccac atcttgatgc taagtaacat ttcccatgag 240

ccacaaaact gaatgctgaa aagctactag actggaaaac aaacactgca ttatgtatgt 300

taagtgacta atttaatttc aattaaaaag cgtaaagtga aaatgaaaaa aaaaaaaaaa 360

a 361

<210> 242

<211> 783

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CAPN1 3'-UTR

NM_005186

<400> 242

ggcagggact cggtccccct tgccgtgctc ccctccctcc tcgtctgcca agcctcgcct 60

cctaccacac cacaccaggc caccccagct gcaagtgcct tccttggagc agagaggcag 120

cctcgtcctc ctgtcccctc tcctcccagc caccatcgtt catctgctcc gggcagaact 180

gtgtggcccc tgcctgtgcc agccatgggc tcgggatgga ctccctgggc cccacccatt 240

gccaagccag gaaggcagct ttcgcttgtt cctgcctcgg gacagccccg ggtttcccca 300

gcatcctgat gtgtcccctc tccccacttc agaggccacc cactcagcac caccggcctg 360

gccttgcctg cagactataa actataacca ctagctcgac acagtctgca gtccaggcgt 420

gtggagccgc ctcccggctc ggggaggccc cggggctggg aacgcctgtg ccttcctgcg 480

ccgaagccaa cgccccctct gtccttccct ggccctgctg ccgaccagga gctgcccagc 540

ctgtgggcgg tcggccttcc ctccttcgct ccttttttat attagtgatt ttaaagggga 600

ctcttcaggg acttgtgtac tggttatggg ggtgccagag gcactaggct tggggtgggg 660

aggtcccgtg ttccatatag aggaacccca aataataaaa ggccccacat ctgtctgtga 720

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 780

aaa 783

<210> 243

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens COX11 3'-UTR

NM_001162861

<400> 243

agagttggca cctttgatgt ggtagtgagc tgatcatcca ctttcttcta aaataaagag 60

aagaaaatgg ccagtaaaaa aaaaaaaa 88

<210> 244

<211> 77

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GLT8D4 3'-UTR

BC127733

<400> 244

atattttgtc ttgttgcaag tcaattaggt gtcttgtgaa caaggaaata ctaatctcta 60

agctgcctgg gtctttt 77

<210> 245

<211> 215

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GLT8D4 3'-UTR

NM_001080393

<400> 245

atattttgtc ttgttgcaag tcaattaggt gtcttgtgac caaggaaata ctaatctcta 60

agctgcctgg gtctttttgt gtgaatattt aatggtgctc catgactgtt gagttttaaa 120

aacctcgtta aattttgcca aatcagttgc ccccaaaagg gaatatgctt ttccttattt 180

ttttttctaa aatgctattt atctctaagg aaaaa 215

<210> 246

<211> 140

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HACL1 3'-UTR

NM_012260

<400> 246

ataaagacgc cagttggtgg tcttgagttt tctctttctt gcaagatgaa attttatttt 60

ccacagcaaa attactctac tgttaaaatt gtgcaaaata aaataaacat ttaaaatgac 120

attttacagt aaaaaaaaaa 140

<210> 247

<211> 273

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IFT88 3'-UTR

NM_175605

<400> 247

tattcacttt aatatttatt aaaggaaaga aattgcctta tgagatcatc ctcatgttaa 60

accttggatt aaatatctaa cctgtaatta ttttttttca ctgtcaaaac ttaagtaagt 120

gtattctatt ctgtatgtat gcatttaagt tgtttttttc ttttaaggaa taaaaacagg 180

taaaactaat actttaggcc agtgacttcc ttagcttttt gaaaacattg acacacagga 240

agaaataaat ttcataacac aaaaaaaaaa aaa 273

<210> 248

<211> 187

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IFT88 3'-UTR

IFT88-001 ENST00000351808

<400> 248

tattcacttt aatatttatt aaaggaaaga aattgcctta tgagatcatc ctcatgttaa 60

accttggatt aaatatctaa cctgtaatta ttttttttca ctgtcaaaac ttaagtaagt 120

gtattctatt ctgtatgtat gcatttaagt tgtttttttc ttttaaggaa taaaaacagg 180

taaaact 187

<210> 249

<211> 150

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NDUFB3 3'-UTR

NM_002491

<400> 249

agataatacc tggaagcatc atagtggttt cttaactctc caaaataaga tttcttctct 60

gtagcctact tgtctggttt atcccttaca gaatattagt aagatttaat caattaaaat 120

atatatatat gccaaaaaaa aaaaaaaaaa 150

<210> 250

<211> 589

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ANO10 3'-UTR

NM_018075

<400> 250

gtgcccagcg tgcccagctg ccctgttggc agaggcctgt gtctgtgcca cacctgccac 60

ggtggcaggg ggggtacccg gggcagcatc gtggctcctg aacccagacc caatgcttag 120

ccaaacgaag tggctcccat gtggcaagca cccttctcag tttcgcagtg gcttggctcg 180

ggatccttgg cagttccccc agccccaccc tgtctgctcc ttcccagttc cttcccgggc 240

cccacacgct gctccagctg ccaactttgc tgcagagcca ctgccgccct tgagcctctc 300

accatgagtg agccaccagc tctccacgtt cccctcatag cagtgtcact cccaacccca 360

ccatggccca gggacccgtg gacaggttgg ggatggggtg tgtgcccact gtgctcatca 420

caggagcctc agttgagagt gagcggggta cagtaaggca gtgcttccca cactggacct 480

ctttcctggt tctcttttgc aatacattaa cagacccttt atcaacataa acaatagtaa 540

ctgagctatt aaaggcaacc tctctgactc cttctgccta aaaaaaaaa 589

<210> 251

<211> 263

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ANO10 3'-UTR

ANO10-005 ENST00000451430

<400> 251

gtgcccagcg tgcccagctg ccctgttggc agaggcctgt gtctgtgcca cacctgccac 60

ggtggcaggg ggggtacccg gggcagcatc gtggctcctg aacccagacc caatgcttag 120

ccaaacgaag tggctcccat gtggcaagca cccttctcag tttcgcagtg gcttggctcg 180

ggatccttgg cagttccccc agccccaccc tgtctgctcc ttcccagttc cttcccgggc 240

cccacacgct gctccagctg cca 263

<210> 252

<211> 486

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ARL6 3'-UTR

NM_032146

<400> 252

aaagataata gttggaaacc tcagcaattt tcaattcaag gaatctatct aagacaaata 60

gaatacattt tgtaaaagat gtttatgcat caaaaaatat aattttctgc ttgcatttat 120

ggactctgac ctttttaaga acataggact tcaggtatgc taatttggcc attaattatt 180

taaaaactaa atattccctc aaaagggctc cctagaatta tcaagttctt agtgaaggtc 240

tacatttgat tgtacgtaga atgtttaaaa gtcagttata agccatctca tcccatcata 300

atttatgata tgtttaatat attttatttt ttaattgtct ttttaaaaaa tttagtttat 360

gactttgcag tatgaattgt gcttgtgaaa aagaacttta aatatttata agggaccatg 420

ggtaattaat atatattcaa tttttactat gtgtcactgt caataaaatg taaaatataa 480

tgtgcc 486

<210> 253

<211> 719

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LPCAT3 3'-UTR

NM_005768

<400> 253

tccatttccc tggtggcctg tgcgggactg gtgcagaaac tactcgtctc ccttttcaca 60

gcactccttt gccccagagc agagaatgga aaagccaggg aggtggaaga tcgatgcttc 120

cagctgtgcc tctgctgcca gccaagtctt catttggggc caaaggggaa actttttttt 180

ggagaaggcg tcttgctttg tcacccacgc tggaatgcag tggcgggatc tcagctcacc 240

gcaacctcca cctcctgggt tcaagtgatt ttcctgcctc agcctcccaa gtagctggga 300

atacaggcac gccaccatgc ccagctaatt tttgtatttt cagtagaaac gggatttcac 360

cacgttggcc aggctggtct cgaactcctg accgcaagtg atccacccgc ctccgcctcc 420

caaagtgctg ggattacagg cgtgagccac cgtgcccggc ccaaagggga aactcttgtg 480

ggaggagcag aggggctcac atctcccctc tgattccccc atgcacattg ccttatctct 540

ccccatctag ccaggaatct attgtgtttt tcttctgcca atttactatg attgtgtatg 600

tgccgctacc accacccccc ccatgggggg gtggagaggg gtgcaaggcc ctgcctgctc 660

cactttttct accttggaac tgtattagat aaaatcactt ctgtttgttc agtttttca 719

<210> 254

<211> 154

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ABCD3 3'-UTR

NM_001122674

<400> 254

aaaccagaca aatgtattgg ccaggcgtgg tggctcatgc ctgtaatccc agcactttgg 60

gaggctgaga tgggaggatc gcttgaatcc aggagttcga gacaagcctg gacaaaaagc 120

gagacccgct tctttaaaaa ataataataa aaca 154

<210> 255

<211> 448

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens COPG2 3'-UTR

NM_012133

<400> 255

atgcttactg gacaagagga aactgatgca cactacatgg tcagtgggct tttaggctag 60

tggcatcagt ttcccagaat cagacttttg aagatgaatg actttggaga agcaaattaa 120

acatttggcc ctgagccagc agatcaagca aatgtctatc tttgcgcatg ggttgttttt 180

tttttttttc tttttattct acttggtcag ctttgggacg atagtgcagc tttgggtgat 240

cttgaaaatc aaatactatc ctatactcca gctgcttaac ttcattttat tctttaatgt 300

gtacctgaaa gctcctggca atgctggaaa atttttatcc cagaggggtg ggggggaggg 360

gggaggggaa gccagagtcc acttttgtca caattcattt ttattaatag aaaataaaca 420

cttattccag tttcaaaaaa aaaaaaaa 448

<210> 256

<211> 176

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MIPEP 3'-UTR

NM_005932

<400> 256

aagaaacact ctacacctct taaatcaagg tcatgtagat aatgactttg ttataaatgc 60

tacagctgtg agagcttgtt tctgatttca ttgttcgctt ctgtaattct gaaaaacttt 120

aaactggtag aacttggaat aaataatttg ttttaattaa aaaaaaaaaa aaaaaa 176

<210> 257

<211> 478

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LEPR 3'-UTR

NM_002303

<400> 257

tttcactgaa gaaaccttca gatttgtgtt ataatgggta atataaagtg taatagatta 60

tagttgtggg tgggagagag aaaagaaacc agagtcaaat ttgaaaataa ttgttccaaa 120

tgaatgttgt ctgtttgttc tctcttagta acatagacaa aaaatttgag aaagccttca 180

taagcctacc aatgtagaca cgctcttcta ttttattccc aagctctagt gggaaggtcc 240

cttgtttcca gctagaaata agcccaacag acaccatctt ttgtgagatg taattgtttt 300

ttcagagggc gtgttgtttt acctcaagtt tttgttttgt accaacacac acacacacac 360

acattcttaa cacatgtcct tgtgtgtttt gagagtatat tatgtattta tattttgtgc 420

tatcagactg taggatttga agtaggactt tcctaaatgt ttaagataaa cagaattc 478

<210> 258

<211> 64

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LEPR 3'-UTR

NM_001198688

<400> 258

gaaatgcttg tagactacgt cctacctcgc tgccgcacct gctctccctg aggtgtgcac 60

aatg 64

<210> 259

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C2orf76 3'-UTR

NM_001017927

<400> 259

aaacatctcg agggcttcct ttttgcat 28

<210> 260

<211> 244

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C2orf76 3'-UTR

C2orf76-001 ENST00000409466

<400> 260

aaacatctcg agggcttcct ttttgcatac ctgtattaag ctctttattc cactgctgaa 60

tttttgaaat tgacaaacaa atcttaaaaa attaatccca ggctatactc tttgagctaa 120

aatctggtta tttctttctc ttcaggtctt tccttctctc tttctttttc tttgttgttg 180

taaaataata tattatgaga aaaacatttg atctttttaa agggaaataa attgttatta 240

aaaa 244

<210> 261

<211> 267

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ABCA6 3'-UTR

NM_080284.2

<400> 261

aacctcaaac ctagtaattt tttgttgatc tcctataaac tcatgtttta tgtaataatt 60

aatagtatgt ttaattttaa agatcattta aaattaacat caggtatatt ttgtaaattt 120

agttaacaaa tacataaatt ttaaaattat tcttcctctc aaacataggg gtgatagcaa 180

acctgtgata aaggcaatac aaaatattag taaagtcacc caaagagtca ggcactgggt 240

attgtggaaa taaaactata taaactt 267

<210> 262

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LY96 3'-UTR

NM_015364.4

<400> 262

aataaattga gtatttaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 45

<210> 263

<211> 755

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CROT 3'-UTR

NM_ 001243745.1

<400> 263

tgatgatgtt taaagaatga taaataaaaa gtgcatagtt tttattttta aattattgct 60

gtaaaaattt ttacagttat tattgttatt ttcataatcc aaaagaagga atgaatcact 120

taactttggg agttttcagt gggtggattc gggaacttgt taaaatgcag atttgctggg 180

ataagtgatt ctgattcaca tggctggaat gaggcccaga gattcttatt ttaacaatca 240

cttcatgtgg tttggctgca ggtaatctgt agaccatgct gaaggaaaac attttgtcca 300

ggtgactagc ttgaaaaatc agaaacacta aaatagacat gtcacatagg tggcatagaa 360

atattttcgt agtacaatgg agaaagggaa tcattaaaaa tcagagtgga gaatggttat 420

gtatattgta tatttcagtt agataaattg aggaagctag tataataatt attgaaggtc 480

tcaataattt tccacaaaat tctttaactt cttcagctca accatttctg tacttctcta 540

ctatgaatca gaggatgagg ttgtataatt caaaagcatt gccttagtct agaaataatt 600

attgtaccta tcatttagtt ttagaaataa aaagcaagct gatttttttt gatgaaccat 660

ttatatctgt gatggaataa taaaatttca cacttccgga ttcctttgtt ctcaattttg 720

agccttgagt tgttttaatt aaagaggggt aaagg 755

<210> 264

<211> 911

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ENPP5 3'-UTR

ENPP5-002 ENST00000230565

<400> 264

tgttactttg aagtggattt gcatattgaa gtggagattc cataattatg tcagtgttta 60

aaggtttcaa attctgggaa accagttcca aacatttgca gaaaccatta agcagttaca 120

tatttaggta tacacacaca cacacacaca catacacaca cacggaccaa aatacttaca 180

cctgcaaagg aataaagatg tgagagtatg tctccattgt tcactgtagc atagggatag 240

ataagatcct gctttatttg gacttggcgc agataatgta tatatttagc aactttgcac 300

tatgtaaagt accttatgta ttgcacttta aatttctctc ctgatgggta ctttaatttg 360

aaatgcactt tatgcacagt tatgtcttat aacttgattg aaaatgacaa ctttttgcac 420

ccatgtcaca gaatacttgt tacgcattgt tcaaactgaa ggaaatttct aataatcccg 480

aataatgaac gtagaaatct atctccataa attgagagaa gaagaaggtg ataagtgttg 540

aaaattaaat gtgataacct ttgaaccttg aattttggag atgtattccc aacagcagaa 600

tgcaactgtg ggcatttctt gtcttatttc tttccagaga acgtggtttt catttatttt 660

tccctcaaaa gagagtcaaa tactgacaga ttcgttctaa atatattgtt tctgtcataa 720

aattattgtg atttcctgat gagtcatatt actgtgattt tcataataat gaagacacca 780

tgaatatact ttttttctat atagttcagc aatggcctga atagaagcaa ccaggcacca 840

tctcagcaat gttttctctt gtttgtaatt atttgctcct ttgaaaatta aatcactatt 900

aattacatta a 911

<210> 265

<211> 300

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SERPINB7 3'-UTR

SERPINB7-203 ENST00000546027

<400> 265

aaatccaatt ggtttctgtt atagcagtcc ccacaacatc aaagaaccac cacaagtcaa 60

tagatttgag tttaattgga aaaatgtggt gtttcctttg agtttatttc ttcctaacat 120

tggtcagcag atgacactgg tgacttgacc cttcctagac acctggttga ttgtcctgat 180

ccctgctctt agcattctac caccatgtgt ctcacccatt tctaatttca ttgtctttct 240

tcccacgctc atttctatca ttctccccca tgacccgtct ggaaattatg gagagtgctc 300

<210> 266

<211> 509

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TCP11L2 3'-UTR

NM_152772

<400> 266

agaagaactg acattggacg agagattgga aatccagtac tttggtatcc agtccacttc 60

cattgatggc attagagatc cagcacattc tcagtactgt ggtgcagtat tagcccaaat 120

ctgtgtaatg ggtaatatta gcattacaga agacacacac atcacataga ccctcagaag 180

acgtaaacat cacatagacc ctatttgtgc atcattttca agtttaaaac agatatttgt 240

aatgaacaga aaacaatttg taattaatta tattacctat ataatacttg taaatgtttt 300

cttaaccatt tatatttggc ttatgacatt taacccctaa ggagttgttt ttctcacttg 360

ttattatcaa acctaatggt ttttaatttt ggtacaactc cttaaagggt tgaaggttgt 420

gacaataact gagggaactg atgttctgaa taaatgatgt gaagtaaaca caattgtatt 480

tgaaaaaaaa aaaaaaaaaa aaaaaaaaa 509

<210> 267

<211> 84

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IRAK1BP1 3'-UTR

NM_001010844

<400> 267

aattccaaac aaattatatt gtacttgtat ctttttacct atttttatac tttttataat 60

gtttacgttt gtcctgaata tata 84

<210> 268

<211> 338

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CDKL2 3'-UTR

CDKL2-002 ENST00000307465

<400> 268

gaaccatttt ggttctgaac tggatgatgc tcttgcactt gagatgacat cttcttgcag 60

caagagtgct gatatcccaa gaggagagat tcatggtttt gatcatttcc ttctgaactg 120

cctgcatttt ctgaggaagg ccttctagaa gaaggaaaga caaagacttc caaatgtttc 180

aaaggaagat tgaacaaatg gccctcccca actgttatcc cattaccttt cacgtccacc 240

gatgctattt caagacatat ccagtggaat aacagtgata tggttcttgt tacatgaatg 300

tgtatttact gttaggagat tgtatatttt aagttacc 338

<210> 269

<211> 367

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GHR 3'-UTR

GHR-202 ENST00000537449

<400> 269

cctttctttg gtttcccaag agctacgtat ttaatagcaa agaattgact ggggcaataa 60

cgtttaagcc aaaacaatgt ttaaaccttt tttgggggag tgacaggatg gggtatggat 120

tctaaaatgc cttttcccaa aatgttgaaa tatgatgtta aaaaaataag aagaatgctt 180

aatcagatag atattcctat tgtgcaatgt aaatatttta aagaattgtg tcagactgtt 240

tagtagcagt gattgtctta atattgtggg tgttaatttt tgatactaag cattgaatgg 300

ctatgttttt aatgtatagt aaatcacgct ttttgaaaaa gcgaaaaaat caggtggctt 360

ttgcggt 367

<210> 270

<211> 406

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens KIAA1107 3'-UTR

NM_015237

<400> 270

gtgttaacat tttggaaaaa tttatgccac tcctttattt tttgatgcct atattatatc 60

caaatgataa ttgcattagc cggatataaa ctttctttaa tattgagtct ttccaattta 120

atgaggtaaa catagtttat ttattaatat atcacatata gaaaaatgtt tttctaaagt 180

ttttgagcat gttttctcta attattagag aaattagaag acttataagg aaaccctagc 240

ttcagttttc ctttcctagc tgatgatttg ttcacttaat cattattcaa gaatttaaaa 300

tgtgaatgca gaagtagatc agtcccttta ctttttgctc tgcatagggt aacatagtaa 360

tttaacaata aaaacttacc gtgcttgtgt ccaaaaaaaa aaaaaa 406

<210> 271

<211> 301

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens RPS6KA6 3'-UTR

RPS6KA6-001 ENST00000262752

<400> 271

gatttgtggt gttcctaggc caaactggat gaagatgaaa ttaaatgtgt ggcttttttc 60

ctattcttat caaaggcatc gttgtctgct aaattacttg aatattaagt aatattaaat 120

ccccattttt aggggaagtg agatttaaaa aaccattcac aggtccacaa tattcatact 180

atgtgtttgc agtagtgttc aagtgtttat ttaagcatat aattggtgtc caccaggtcc 240

tcacaacttc tctgcacaca agcttctaaa attcctttca aataaagtta ctttaatatt 300

t 301

<210> 272

<211> 777

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CLGN 3'-UTR

NM_004362, NM_001130675

<400> 272

actagattga aatattttta attcccgaga gggatgtttg gcattgtaaa aatcagcatg 60

ccagacctga actttaatca gtctgcacat cctgtttcta atatctagca acattatatt 120

ctttcagaca tttattttag tccttcattt cagaggaaaa agaagcaact ttgaagttac 180

ctcatctttg aatttagaat aaaagtggca cattacatat cggatctaag agattaatac 240

cattagaagt tacacagttt tagttgtttg gagatagttt tggtttgtac agaacaaaat 300

aatatgtagc agcttcattg ctattggaaa aatcagttat tggaatttcc acttaaatgg 360

ctatacaaca atataactgg tagttctata ataaaaatga gcatatgttc tgttgtgaag 420

agctaaatgc aataaagttt ctgtatggtt gtttgattct atcaacaatt gaaagtgttg 480

tatatgaccc acatttacct agtttgtgtc aaattatagt tacagtgagt tgtttgctta 540

aattatagat tcctttaagg acatgccttg ttcataaaat cactggatta tattgcagca 600

tattttacat ttgaatacaa ggataatggg ttttatcaaa acaaaatgat gtacagattt 660

tttttcaagt ttttatagtt gctttatgcc agagtggttt accccattca caaaatttct 720

tatgcataca ttgctattga aaataaaatt taaatatttt ttcatcctga aaaaaaa 777

<210> 273

<211> 466

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CLGN-202 3'-UTR

NM_004362, NM_001130675

ENST00000325617

<400> 273

actagattga aatattttta attcccgaga gggatgtttg gcattgtaaa aatcagcatg 60

ccagacctga actttaatca gtctgcacat cctgtttcta atatctagca acattatatt 120

ctttcagaca tttattttag tccttcattt cagaggaaaa agaagcaact ttgaagttac 180

ctcatctttg aatttagaat aaaagtggca cattacatat cggatctaag agattaatac 240

cattagaagt tacacagttt tagttgtttg gagatagttt tggtttgtac agaacaaaat 300

aatatgtagc agcttcattg ctattggaaa aatcagttat tggaatttcc acttaaatgg 360

ctatacaaca atataactgg tagttctata ataaaaatga gcatatgttc tgttgtgaag 420

agctaaatgc aataaagttt ctgtatggtt gtttgattct atcaac 466

<210> 274

<211> 423

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TMEM45A 3'-UTR

NM_018004

<400> 274

ctttgatgag cttccagttt ttctagataa accttttctt ttttacattg ttcttggttt 60

tgtttctcga tcttttgttt ggagaacagc tggctaagga tgactctaag tgtactgttt 120

gcatttccaa tttggttaaa gtatttgaat ttaaatattt tctttttagc tttgaaaata 180

ttttgggtga tactttcatt ttgcacatca tgcacatcat ggtattcagg ggctagagtg 240

atttttttcc agattatcta aagttggatg cccacactat gaaagaaata tttgttttat 300

ttgccttata gatatgctca aggttactgg gcttgctact atttgtaact ccttgaccat 360

ggaattatac ttgtttatct tgttgctgca atgagaaata aatgaatgta tgtattttgg 420

tgc 423

<210> 275

<211> 152

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TBC1D8B 3'-UTR

TBC1D8B-007 ENST00000276175

<400> 275

atccctagga attgcctatc atagacaagt ttactaacat tcctgtagct gtcagtttga 60

ttcctgtgag tagggctcag ggatttatct tgttaccaat gtgtctgaag gccaaaatat 120

atatccagaa gcacaatgca tcattccttt gt 152

<210> 276

<211> 81

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ACP6 3'-UTR

NM_016361

<400> 276

ctgatttata aaagcaggat gtgttgattt taaaataaag tgcctttata caatgccaaa 60

aaaaaaaaaa aaaaaaaaaa a 81

<210> 277

<211> 111

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens RP6-213H19.1 3'-UTR

MST4-003 (RBM4B-003 ENST00000496850)

<400> 277

gaaacttatt attggcttct gtttcatatg gacccagaga gccccaccaa acctacgtca 60

agattaacaa tgcttaaccc atgagctcca tgtgcctttt ggatctttgc a 111

<210> 278

<211> 138

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SNRPN 3'-UTR

NM_022807

<400> 278

catactgttg atccatctca gtcacttttt cccctgcaat gcgtcttgtg aaattgtgta 60

gagtgtttgt gagctttttg ttccctcatt ctgcattaat aatagctaat aataaatgca 120

tagagcaatt aaactgtg 138

<210> 279

<211> 425

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GLRB 3'-UTR

GLRB-005 ENST00000512619

<400> 279

gatctaatga cttcagcatt gttggaagct taccaagaga ttttgaacta tccaattatg 60

actgctatgg aaaacccatt gaagttaaca acggacttgg gaaatctcag gctaagaaca 120

acaagaagcc tccccctgcg aaacctgtta ttccaacagc agcaaagcga attgatcttt 180

atgcaagagc attgtttcct ttctgcttct tgttcttcaa tgttatatat tggtctatat 240

atttatgata aatcttttcc atttgtacaa aataaaattc catttcattg tgacctactc 300

ctttcataaa tgccaatctg tgagaacttt tgaattttca tagcaacatt gcattttgga 360

tgccatttga ttgtaataaa actgtggcac cttaattttg aatggcagca tgatcatgta 420

atatc 425

<210> 280

<211> 651

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HERC6 3'-UTR

NM_017912

<400> 280

tcacctctga gagactcagg gtgggctttc tcacacttgg atccttctgt tcttccttac 60

acctaaataa tacaagagat taatgaatag tggttagaag tagttgaggg agagattggg 120

ggaatgggga gatgatgatg atggtcaaag ggtgcaaaat ctcacacaag actgaggcag 180

gagaataggg tacagagata gggatctaag gatgacttgg acacactccc tggcactgaa 240

gagtctgaac actggcctgt gattggtcca ttccaggacc ttcatttgca taaggtatca 300

aaccacatca gcctctgatt ggccatgggc cagacctgca ctctggccaa tgattggttc 360

attccaggac attcatttgc ataaggagtc aaaccacacc agtcttggat tggctgtgag 420

ccaattcacc tcagtctcta attggctgtg agtcagtctt tcatttacat agggtgtaac 480

catcaagaaa cctctacagg gtacttaagc cccagaagat tttgctacca gggctcttga 540

gccacttgct ctagcccact cccaccctgt ggaatgtact ttcacttttg ctgcttcact 600

gccttgtgct ccaataaatc cactccttca ccacccaaaa aaaaaaaaaa a 651

<210> 281

<211> 264

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CFH 3'-UTR

NM_000186

<400> 281

aatcaatcat aaagtgcaca cctttattca gaactttagt attaaatcag ttctcaattt 60

cattttttat gtattgtttt actccttttt attcatacgt aaaattttgg attaatttgt 120

gaaaatgtaa ttataagctg agaccggtgg ctctcttctt aaaagcacca tattaaatcc 180

tggaaaacta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240

aaaaaaaaaa aaaaaaaaaa aaaa 264

<210> 282

<211> 401

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GALC 3'-UTR

GALC-002 ENST00000393569

<400> 282

tacttaacag ggcatcatag aatactctgg attttcttcc cttctttttg gttttggttc 60

agagccaatt cttgtttcat tggaacagta tatgaggctt ttgagactaa aaataatgaa 120

gagtaaaagg ggagagaaat ttatttttaa tttaccctgt ggaagatttt attagaatta 180

attccaaggg gaaaactggt gaatctttaa cattacctgg tgtgttccct aacattcaaa 240

ctgtgcattg gccataccct taggagtggt ttgagtagta cagacctcga agccttgctg 300

ctaacactga ggtagctctc ttcatcttat ttgcaagcgg tcctgtagat ggcagtaact 360

tgatcatcac tgagatgtat ttatgcatgc tgaccgtgtg t 401

<210> 283

<211> 51

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GALC 3'-UTR

GALC-005 ENST00000393568

<400> 283

tacttaacag ggcatcatag aatactctgg attttcttcc cttctttttg g 51

<210> 284

<211> 360

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PDE1A 3'-UTR

NM_001003683.2

<400> 284

acacctttaa gtaaaacctc gtgcatggtg gcagctctaa tttgaccaaa agacttggag 60

attttgatta tgcttgctgg aaatctaccc tgtcctgtgt gagacaggaa atctattttt 120

gcagattgct caataagcat catgagccac ataaataaca gctgtaaact ccttaattca 180

ccgggctcaa ctgctaccga acagattcat ctagtggcta catcagcacc ttgtgctttc 240

agatatctgt ttcaatggca ttttgtggca tttgtcttta ccgagtgcca ataaattttc 300

tttgagcagc taattgctaa ttttgtcatt tctacaataa agcttggtcc acctgttttc 360

<210> 285

<211> 308

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PDE1A 3'-UTR

PDE1A-003 ENST00000410103

<400> 285

acacctttaa gtaaaacctc gtgcatggtg gcagctctaa tttgaccaaa agacttggag 60

attttgatta tgcttgctgg aaatctaccc tgtcctgtgt gagacaggaa atctattttt 120

gcagattgct caataagcat catgagccac ataaataaca gctgtaaact ccttaattca 180

ccgggctcaa ctgctaccga acagattcat ctagtggcta catcagcacc ttgtgctttc 240

agatatctgt ttcaatggca ttttgtggca tttgtcttta ccgagtgcca ataaattttc 300

tttgagca 308

<210> 286

<211> 855

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GSTM5 3'-UTR

NM_000851

<400> 286

ggcccagtga tgccagaaga tgggagggag gagccaacct tgctgcctgc gaccctggag 60

gacagcctga ctccctggac ctgccttctt cctttttcct tctttctact ctcttctctt 120

ccccaaggcc tcattggctt cctttcttct aacatcatcc ctccccgcat cgaggctctt 180

taaagcttca gctccccact gtcctccatc aaagtccccc tcctaacgtc ttcctttccc 240

tgcactaacg ccaacctgac tgcttttcct gtcagtgctt ttctcttctt tgagaagcca 300

gactgatctc tgagctccct agcactgtcc tcaaagacca tctgtatgcc ctgctccctt 360

tgctgggtcc ctaccccagc tccgtgtgat gcccagtaaa gcctgaacca tgcctgccat 420

gtcttgtctt attccctgag gctcccttga ctcaggactg tgctcgaatt gtgggtggtt 480

ttttgtcttc tgttgtccac agccagagct tagtggatgg gtgtgtgtgt gtgtgtgttg 540

ggggtggtga tcaggcaggt tcataaattt ccttggtcat ttctgccctc tagccacatc 600

cctctgttcc tcactgtggg gattactaca gaaaggtgct ctgtgccaag ttcctcactc 660

attcgcgctc ctgtaggccg tctagaactg gcatggttca aagaggggct aggctgatgg 720

ggaagggggc tgagcagctc ccaggcagac tgccttcttt caccctgtcc tgatagactt 780

ccctgatcta gatatccttc gtcatgacac ttctcaataa aacgtatccc accgtattgt 840

aaaaaaaaaa aaaaa 855

<210> 287

<211> 419

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CADPS2 3'-UTR

CADPS2-002 ENST00000412584

<400> 287

tatcacacag ctttgcagaa ggaaggaaga ccttgatcga cattgttttt tattttttta 60

accttgtcct tgtaattaca ttcattgttt gttttggcca aataaaaatg cttgtatttc 120

tttaaaaagt aagcctgaat gtagagtaaa aggggaaatg ccaagatttt ggggtttttt 180

tgtttccttt ttttgtttgt ttgtttgttt gtttttttgg agaagagcat cctcttttgt 240

gtagtttgac ctaaaaatga accttggctc tgcttgtgat cagaacatga actttttttt 300

ttaaagaaga tttgagcatt tttctgtaat cacatcaaaa tgatgttttc tgtgtaaagc 360

gagatacata tttctcataa tgcagcattg tgagaagtca gttcggacca ctgcaccaa 419

<210> 288

<211> 162

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CADPS2 3'-UTR

CADPS2-001 ENST00000449022

<400> 288

tatcacacag ctttgcagaa ggaaggaaga ccttgatcga cattgttttt tattttttta 60

accttgtcct tgtaattaca ttcattgttt gttttggcca aataaaaatg cttgtatttc 120

tttaaaaagt aagcctgaat gtagagtaaa aggggaaatg cc 162

<210> 289

<211> 247

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens AASS 3'-UTR

AASS-001 ENST00000417368

<400> 289

ttgggaatta tattttgttt ttttcttccc aggcaataca cctctgaaca tgtgtgtgat 60

aaatgggttt gctaatgtgc tgttttaaag tataaagcat aatatgtttt ggttaacaca 120

atgtactttt tgaactataa atctttattt taatatggaa atgtttggaa caggagatgc 180

aagccactaa cagagaactt taataattct accctgtatt ttataaatac gtatgtgaaa 240

gtgatga 247

<210> 290

<211> 695

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TRIM6-TRIM34 3'-UTR

NM_001003819

<400> 290

attttctcat ttcttcacct acaacccttt gtcttgactt atctcctgca actgactcat 60

ctgcaacatt cacaccattg cttccttgtg gtttcccttc tttagaactt ttactcatcc 120

ttgagatgta tggtgtattt ggcttgagtt atgagagatg cttatttatt catttactct 180

ttttcatatt ttcagagaaa gttacctaat ccctcctaaa gacacagcag tatgggtata 240

acatccttgc cttcccattt atccatgttt cactttatca ctgatatgaa gaggcccaaa 300

gcctgttagc caccatccat gctacctagg tagtccatag gaaccacccc catgaccacc 360

accaacatca actaaaggtt cttggagggt atgtcagtgt gttgctcagg ataccccagg 420

tacatcaagg aatcaaggag aggaaaatat gagcaatatg tgtattcaga gtgaagattt 480

tatgtccaga gtatttgagc tcaaaccttg cctgttgttt tctaatcatg atgaatactt 540

tctcagtttc tttttcctga aatataaatt gggatttaag actgtaccta actattaaga 600

tcactgtgta aaactaagtg tctctaaatg taatgcatcg atttagtgtc tggaacataa 660

taaatatttg ctctcatgat tgctaaaaaa aaaaa 695

<210> 291

<211> 918

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SEPP1 3'-UTR

NM_005410

<400> 291

atatttaaaa taggacatac tccccaattt agtctagaca caatttcatt tccagcattt 60

ttataaacta ccaaattagt gaaccaaaaa tagaaattag atttgtgcaa acatggagaa 120

atctactgaa ttggcttcca gattttaaat tttatgtcat agaaatattg actcaaacca 180

tattttttat gatggagcaa ctgaaaggtg attgcagctt ttggttaata tgtctttttt 240

tttctttttc cagtgttcta tttgctttaa tgagaataga aacgtaaact atgacctagg 300

ggtttctgtt ggataattag cagtttagaa tggaggaaga acaacaaaga catgctttcc 360

atttttttct ttacttatct ctcaaaacaa tattactttg tcttttcaat cttctacttt 420

taactaataa aataagtgga ttttgtattt taagatccag aaatacttaa cacgtgaata 480

ttttgctaaa aaagcatata taactatttt aaatatccat ttatcttttg tatatctaag 540

actcatcctg atttttacta tcacacatga ataaagcctt tgtatctttc tttctctaat 600

gttgtatcat actcttctaa aacttgagtg gctgtcttaa aagatataag gggaaagata 660

atattgtctg tctctatatt gcttagtaag tatttccata gtcaatgatg gtttaatagg 720

taaaccaaac cctataaacc tgacctcctt tatggttaat actattaagc aagaatgcag 780

tacagaattg gatacagtac ggatttgtcc aaataaattc aataaaaacc ttaaagctga 840

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 900

aaaaaaaaaa aaaaaaaa 918

<210> 292

<211> 589

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SEPP1 3'-UTR

SEPP1-004 ENST00000506577

<400> 292

atatttaaaa taggacatac tccccaattt agtctagaca caatttcatt tccagcattt 60

ttataaacta ccaaattagt gaaccaaaaa tagaaattag atttgtgcaa acatggagaa 120

atctactgaa ttggcttcca gattttaaat tttatgtcat agaaatattg actcaaacca 180

tattttttat gatggagcaa ctgaaaggtg attgcagctt ttggttaata tgtctttttt 240

tttctttttc cagtgttcta tttgctttaa tgagaataga aacgtaaact atgacctagg 300

ggtttctgtt ggataattag cagtttagaa tggaggaaga acaacaaaga catgctttcc 360

atttttttct ttacttatct ctcaaaacaa tattactttg tcttttcaat cttctacttt 420

taactaataa aataagtgga ttttgtattt taagatccag aaatacttaa cacgtgaata 480

ttttgctaaa aaagcatata taactatttt aaatatccat ttatcttttg tatatctaag 540

actcatcctg atttttacta tcacacatga ataaagcctt tgtatcttt 589

<210> 293

<211> 60

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PDE5A 3'-UTR

PDE5A-002 ENST00000264805

<400> 293

gtggcctatt tcatgcagag ttgaagttta cagagatggt gtgttctgca atatgcctag 60

<210> 294

<211> 422

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SATB1 3'-UTR

SATB1-004 ENST00000417717

<400> 294

gataaaagta tttgtttcgt tcaacagtgc cactggtatt tactaacaaa atgaaaagtc 60

caccttgtct tctctcagaa aacctttgtt gttcattgtt tggccaatga atcttcaaaa 120

acttgcacaa acagaaaagt tggaaaagga taatacagac tgcactaaat gttttcctct 180

gttttacaaa ctgcttggca gccccaggtg aagcatcaag gattgtttgg tattaaaatt 240

tgtgttcacg ggatgcacca aagtgtgtac cccgtaagca tgaaaccagt gttttttgtt 300

ttttttttag ttcttattcc ggagcctcaa acaagcatta taccttctgt gattatgatt 360

tcctctccta taattatttc tgtagcactc cacactgatc tttggaaact tgccccttat 420

tt 422

<210> 295

<211> 981

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CCPG1 3'-UTR

CCPG1-002 ENST00000442196

<400> 295

ttcacaattg agttaaatta gacaactgta agagaaaaat ttatgctttg tataatgttt 60

ggtattgaaa ctaatgaaat taccaagatg acaatgtctt ttcttttgtt tctaagtatc 120

agtttgataa ctttatatta ttcctcagaa gcattagtta aaagtctact aacctgcatt 180

ttcctgtagt ttagcttcgt tgaatttttt ttgacactgg aaatgttcaa ctgtagtttt 240

attaaggaag ccaggcatgc aacagatttt gtgcatgaaa tgagacttcc tttcagtgta 300

agagcttaaa gcaagctcag tcatacatga caaagtgtaa ttaacactga tgtttgtgtt 360

aaatttgcag cagagcttga gaaaagtaca ttgttctgga atttcatcat taacatttta 420

taatcttaca ctcacttctt gtctttttgt gggttcaaga gccctctgac ttgtgaagaa 480

tttgctgccc tcttaagagc ttgctgactt gttttcttgt gaaatttttt gcacatctga 540

atatcgtgga agaaacaata aaactacacc atgaggaaaa ctaaaggtct ttatttaaaa 600

tctggcattg tattaacatg taattttata ctatgtggta ttttatacat ttcctcagta 660

gtgatatttg gtaaagcagt tcatacagct tttttctaag ttccatgaat cttacccagt 720

gtttaccgaa gtatttaagc agcatctgaa tatttccacc cagcaatgtt aatttatcta 780

ggaaagttca gaatttcatc ttcatgttga atttcccttt taacttccgt tcatagacat 840

atatgtgact tccaattcga ccctctggca agtgagtgtg gaagaaaaca gcagttcttt 900

tataattgct tgaaattagg aaagcgctta tttcctagaa gcaaataaat gtttaagtaa 960

ataaaggcta cattttgctg a 981

<210> 296

<211> 575

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CCPG1 3'-UTR

CCPG1-004 ENST00000425574

<400> 296

ttcacaattg agttaaatta gacaactgta agagaaaaat ttatgctttg tataatgttt 60

ggtattgaaa ctaatgaaat taccaagatg acaatgtctt ttcttttgtt tctaagtatc 120

agtttgataa ctttatatta ttcctcagaa gcattagtta aaagtctact aacctgcatt 180

ttcctgtagt ttagcttcgt tgaatttttt ttgacactgg aaatgttcaa ctgtagtttt 240

attaaggaag ccaggcatgc aacagatttt gtgcatgaaa tgagacttcc tttcagtgta 300

agagcttaaa gcaagctcag tcatacatga caaagtgtaa ttaacactga tgtttgtgtt 360

aaatttgcag cagagcttga gaaaagtaca ttgttctgga atttcatcat taacatttta 420

taatcttaca ctcacttctt gtctttttgt gggttcaaga gccctctgac ttgtgaagaa 480

tttgctgccc tcttaagagc ttgctgactt gttttcttgt gaaatttttt gcacatctga 540

atatcgtgga agaaacaata aaactacacc atgag 575

<210> 297

<211> 230

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1 3'-UTR

CNTN1-002 ENST00000348761

<400> 297

atgtgttgtg acagctgctg ttcccatccc agctcagaag acacccttca accctgggat 60

gaccacaatt ccttccaatt tctgcggctc catcctaagc caaataaatt atactttaac 120

aaactattca actgatttac aacacacatg atgactgagg cattcgggaa ccccttcatc 180

caaaagaata aacttttaaa tggatataaa tgatttttaa ctcgttccaa 230

<210> 298

<211> 922

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1 3'-UTR

CNTN1-004 ENST00000547849

<400> 298

tcgttgacac tcaccatttc tgtgaaagac tttttttttt ttaacatatt atactagatt 60

tgactaactc aatcttgtag cttctgcagt tctccccacc cccaacctag ttcttagagt 120

atgtttcccc ttttgaaaca tgtaaacata ctttgggcat aaatattttt taaaatataa 180

ctataatgct tcactaatac cttaaaaatg cctagtgaac taactcagta cattatataa 240

tggccaagtg aaagttttgt gttttcatgt cctgtttttc tttgaaatta tatagcccag 300

aaattagctc attatctgaa aaacgtatga agaactgatg aattgtataa tacaggagta 360

ttgccattga atgtactgtt tgatttattc aagcaggtaa tgaacaatgt tgtcaaactc 420

tctaatgaga catcataatt aggacataag ctaaaagggg cattactccg gcagtctttt 480

tttcttaatc ctagtaccat acatattctt tggcatgaaa gaatgaaaag cattagtaaa 540

caactgaagt cctaccatgg ctctgtaggg tttttggaac aattcctgga attggaaagt 600

gaaaatggat agcatgtggg ggaaaccctc atctgagtag caagatttta gtaaagatga 660

ctaagccatt aacagcatgc attcatattt aattttattg actcctgcca tcagcttttg 720

tagatcgttt gggtggaagg ttgtgatttt tactgggagg acttgagtag aagtggatga 780

ttaaaattga ggagtatata attctttctg ggactgctta aatgttattg tttgaaaata 840

ccttcacttt ccccctttgg tcaaagagat gtgcttaaaa ttcttattcc ttcacaataa 900

ataattttga ttttcttaga ca 922

<210> 299

<211> 928

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CNTN1 3'-UTR

CNTN1-004 ENST00000547849

+T at pos. 30bp, mutations G727bpT, A840bpG

<400> 299

ttttttcgtt gacactcacc atttctgtga aagacttttt ttttttttaa catattatac 60

tagatttgac taactcaatc ttgtagcttc tgcagttctc cccaccccca acctagttct 120

tagagtatgt ttcccctttt gaaacatgta aacatacttt gggcataaat attttttaaa 180

atataactat aatgcttcac taatacctta aaaatgccta gtgaactaac tcagtacatt 240

atataatggc caagtgaaag ttttgtgttt tcatgtcctg tttttctttg aaattatata 300

gcccagaaat tagctcatta tctgaaaaac gtatgaagaa ctgatgaatt gtataataca 360

ggagtattgc cattgaatgt actgtttgat ttattcaagc aggtaatgaa caatgttgtc 420

aaactctcta atgagacatc ataattagga cataagctaa aaggggcatt actccggcag 480

tctttttttc ttaatcctag taccatacat attctttggc atgaaagaat gaaaagcatt 540

agtaaacaac tgaagtccta ccatggctct gtagggtttt tggaacaatt cctggaattg 600

gaaagtgaaa atggatagca tgtgggggaa accctcatct gagtagcaag attttagtaa 660

agatgactaa gccattaaca gcatgcattc atatttaatt ttattgactc ctgccatcag 720

cttttgtaga tcttttgggt ggaaggttgt gatttttact gggaggactt gagtagaagt 780

ggatgattaa aattgaggag tatataattc tttctgggac tgcttaaatg ttattgtttg 840

aaaatgcctt cactttcccc ctttggtcaa agagatgtgc ttaaaattct tattccttca 900

caataaataa ttttgatttt cttagaca 928

<210> 300

<211> 734

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LMBRD2 3'-UTR

<400> 300

agtctgaaaa agtttgtggg accactaacc aaggtcaaca catcagttca gtcttgatga 60

acatctgtgt accctagaat ttcctctata cacagtgaaa agtgtcaaga taacaaaaaa 120

ggcactgaga attaattata tcttaggaat aatagtttaa tgtgcattga atagagtatc 180

acctttttca acaagattta ttacatatca tttcctaagc atctgcctta gaaatacagt 240

tacagtggaa ggactttaag aaagatcaac atatgttaag aacatgcagt tcagtttgtt 300

tcagattaat tttttttcaa gagagttatt ttaaagattc aaggaagcca taagtcatac 360

taaataatat tatatacagt tttgttattg tgacttacat ttttgttact tctaaaaagt 420

atattcaacc tgtatttccc aaagaaatgt aagtgaatgg agacctcaaa taataactgt 480

attcataaaa ctcgtgtctt aaaacaaggc ttacttacta gacataactg aatgtaaaaa 540

gtgctttttc aaatctgttt gcaaactcgt gggggatttt tgcatgtata agattaagat 600

tatacttcaa gtgatgcgtg tctgtgtatt tagcatgtgt actataatca ggtgatatag 660

tattccttca gtctttgtag taactggatt tttttatgct tctggtattg ctttataaaa 720

gattttcatt tcag 734

<210> 301

<211> 241

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TLR3 3'-UTR

NM_003265

<400> 301

atttatttaa atattcaatt agcaaaggag aaactttctc aatttaaaaa gttctatggc 60

aaatttaagt tttccataaa ggtgttataa tttgtttatt catatttgta aatgattata 120

ttctatcaca attacatctc ttctaggaaa atgtgtctcc ttatttcagg cctatttttg 180

acaattgact taattttacc caaaataaaa catataagca cgtaaaaaaa aaaaaaaaaa 240

a 241

<210> 302

<211> 527

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BCAT1 3'-UTR

BCAT1-002 ENST00000342945

<400> 302

atggaaaata gaggatacaa tggaaaatag aggataccaa ctgtatgcta ctgggacaga 60

ctgttgcatt tgaattgtga tagatttctt tggctacctg tgcataatgt agtttgtagt 120

atcaatgtgt tacaagagtg attgtttctt catgccagag aaaatgaatt gcaatcatca 180

aatggtgttt cataacttgg tagtagtaac ttaccttacc ttacctagaa aaacattaat 240

gtaagccata taacatggga ttttcctcaa tgattttagt gcctcctttt gtacttcact 300

cagatactaa atagtagttt attctttaat ataagttaca ttctgctcct caaacaaatg 360

caattttttg tgtgtgtttg aaagctaatt tgagaaaatt tcataggtta catttcctgc 420

agcctatctt tatccacaga aagtgttttc ttttttttaa atcaagactt ttaaaactgg 480

atttcctccc atcactgttt tttgaaggtc ctccaagtcc gtgttaa 527

<210> 303

<211> 199

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BCAT1 3'-UTR

<400> 303

atggaaaata gaggatacaa tggaaaatag aggataccaa ctgtatgcta ctgggacaga 60

ctgttgcatt tgaattgtga tagatttctt tggctacctg tgcataatgt agtttgtagt 120

atcaatgtgt tacaagagtg attgtttctt catgccagag aaaatgaatt gcaatcatca 180

aatggtgttt cataacttg 199

<210> 304

<211> 716

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TOM1L1 3'-UTR

TOM1L1-001 ENST00000575882

<400> 304

gaagaaagtg gatgatcagc tcactaccac atcaaaggtg ccaactctct aaaacgtaga 60

ctctgtgcag ctttgaagcc tggaagacaa tacctaccaa catgtcaaag ccatggtggc 120

acatttctgc tataatgaag attaaataga ataacagttc caggataaca ctgattcctg 180

acaacagcgt gagatttcaa cagaacttgt ttggaacaaa tactcactta aaacttcagc 240

agaagaaaaa ttacttagtc cttaggccaa ccaatttaac tgcagtgtca tgtttcacag 300

gccttcctac atttagaaat cgtcacacag ctgtgataag agtagattat tttactatga 360

aataattctg aatagatgaa agcataaaat gtgagaaact gaatgtatta ttcaggaaga 420

atactgagtg ccttcattta actaaagttg aatgtaaaag tcaatttgca cttctttata 480

atcctctggt ttagaattat aaattgttaa aaccttgata attgtcattt aattatattt 540

caggtgtcct gaacaggtca ctagactcta cattgggcag cctttaaata tgattctttg 600

taatgctaaa tagccttttt ttctcttttt actgcaactt aatatttcta tttagaacac 660

agaaaatgaa aatatttaga ataagttgta catttgatga caaataaatc actatt 716

<210> 305

<211> 804

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SLC35A1 3'-UTR

SLC35A1-201 ENST00000369556

<400> 305

ttttagcctc acgtgagact ccttttaaga ctaaaccatt tgcattaaac tagagcctta 60

agtcaatctc agaaggtagc ataaacaaat aaaaattaac tgtatggcat gatcagtgcg 120

gttatgtgga aacaacaaca aacaaacgaa gctatctgag tgaactgcta atacagaaac 180

ttaatgtaga cctgtttggg gtctactatt gttttagaat gaaggaattg tattattgtg 240

tgtatatata atttgtaaat aaaaagtatg gagatgatac ggtgttaaaa aaaatcatgg 300

taaggctaca atactcaagt aacaaggttt gggacaatgt ctaagggtta aagtgccaaa 360

gccatttctg tactaactgt tctcttgttc cggtaccggg gagaaggatg acccctcctt 420

attctccaat tcatgtacag tattttgtcc tagcagcata aagacctagc tcttttctta 480

caagaggcag aaacaagaca ggctagttca taaacaaact gtgtaacttc tcaaaatgaa 540

tctatttcat aactcggaca atttctgggt ggtgactgag taccccttta gtgagtaccc 600

ctttagtgct atatttgtgc cattcattat ctggttcata tttcttttct gttagatgat 660

acacatttct tcaaaaaaat ttctaatgtc acttttgtac ttttttaaat aaagtatgtt 720

taactgttgg gctctcaata atttgtgaaa tttcagtgtt ttctataatg ttaatgggga 780

aattcagcaa taaactttat ttgt 804

<210> 306

<211> 332

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GLYATL2 3'-UTR

GLYATL2-003 ENST00000532258

<400> 306

ttgattccac tgtccatttc aaatctttct tatcagtaaa aaaacattaa ttcaaacaca 60

agcattgtga tctacattag cacaaaatgc aactgattat ctaggatctg tgtattactt 120

aagctcaccc ttaacagttt taccttcctt ctcctctgta ttcttacaga aaattagaag 180

ctcaatttta tggtctcata atttccttta tgacagacat ctcagaatta aaatcaccca 240

aagccaatca ttagtgccaa gataaccctt taacggcaac actttcttaa atgaagacta 300

tttctttcat gaaaaaattc acttttatga ct 332

<210> 307

<211> 260

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens STAT4 3'-UTR

STAT4-002 ENST00000392320

<400> 307

caggataaac tctgacgcac caagaaagga agcaaatgaa aaagtttaaa gactgttctt 60

tgcccaataa ccacatttta tttcttcagc tttgtaaata ccaggttcta ggaaatgttt 120

gacatctgaa gctctcttca cactcccgtg gcactcctca attgggagtg ttgtgactga 180

aatgcttgaa accaaagctt cagataaact tgcaagataa gacaacttta agaaaccagt 240

gttaataaca atattaacag 260

<210> 308

<211> 270

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GULP1 3'-UTR

GULP1-002 ENST00000409609

<400> 308

catcaagaac aagaaatcct gattcatgtt aaatgtgttt gtatacacat gtcatttatt 60

attattactt taagataggt attattcatg tgtcaatgtt tttgaatatt ttaatatttt 120

gaaaattttc tcagttaaat ttcctcacct tcactattga tctgtaattt ttattttaaa 180

aacagcttac tgtaaagtag atcatacttt tatgttcctt tctgtttcta ctgtagatga 240

atttgtaatt gaaagacata ttatacaaat 270

<210> 309

<211> 79

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GULP1 3'-UTR

GULP1-010 ENST00000409805

<400> 309

catcaagaac aagaaatcct gattcatgtt aaatgtgttt gtatacacat gtcatttatt 60

attattactt taagatagg 79

<210> 310

<211> 256

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens EHHADH 3'-UTR

EHHADH-002 ENST00000456310

<400> 310

ttcagtcttc cagattatgc ctcacatgct agcatcaggt aatgctgact gaatttcagt 60

gaaattaaat caaaaatcca aagtaagatt gttctgaaat acaaagcaaa ataaataatc 120

attagaatct tctgtgtaac gactctaatg gtcaaatctt taggaatgtg cttcctatgc 180

ctctgaatct gtccttatca gataaattca atgcatgaac ttgtgtgaat ataataccat 240

aatagctaat gaaaga 256

<210> 311

<211> 640

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NBEAL1 3'-UTR

NM_001114132.1

<400> 311

ttgttatttc cattttctgt tatgattact gaaacctgat ttattgcttt gtcactttaa 60

ccacatctct caactctctg caatgttgca aggcttttat ccctgaaaat catttacaga 120

taaccacaat ttgctgtggt atataaacta attcttggtc tatactaaga tgtatttgag 180

aaaatacatt tgatttgatt ttgtggccca ttcctaaagg tcattgtatc catttttaaa 240

acaaactaaa atgagaacat taggttcaat tttcttatta ttccaaatga taaaatttaa 300

gatttttcta ataaaagagt acagataatg ggacagttga gagagatggc tttaaataca 360

ttcttaagta atcattttcc tatttactga ccactgtaat gaaaatatat caatttattt 420

atggaactcc tgattgggga taatatttta aaggtatctg ttgcacactt ggattttcaa 480

aactcggtga aagttacaag tttgcatggt aagaataaaa taagaatatt gaaactggta 540

cattagctaa ttctattact acttagcgtg tttctaatga gaagttactg aaatctatta 600

ctgtccttaa taaaaattga gtagaaaaaa gtggaactag 640

<210> 312

<211> 225

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens KIAA1598 3'-UTR

NM_001258299.1

<400> 312

tctgaatcag aaaatactgc aactccttcc tccttttgtc tgccttttgt tctccaaaag 60

taagtggaaa ttacatttcc aagaaaggaa atgaaataat tgcaggccca aggtctgcaa 120

aatatgtgtt gaattgacag tgaaaaggat ccatgtgttg acagacacag ttgttagatg 180

ccataaaggc agatgtgaag ctcaatttat ttctcatctt gcttg 225

<210> 313

<211> 991

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HFE 3'-UTR

HFE-006 ENST00000317896

<400> 313

cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60

catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120

gaactccttg attttagcct tctctgttca tttcctcaaa aagatttccc catttaggtt 180

tctgagttcc tgcatgccgg tgatccctag ctgtgacctc tcccctggaa ctgtctctca 240

tgaacctcaa gctgcatcta gaggcttcct tcatttcctc cgtcacctca gagacataca 300

cctatgtcat ttcatttcct atttttggaa gaggactcct taaatttggg ggacttacat 360

gattcatttt aacatctgag aaaagctttg aaccctggga cgtggctagt cataacctta 420

ccagattttt acacatgtat ctatgcattt tctggacccg ttcaactttt cctttgaatc 480

ctctctctgt gttacccagt aactcatctg tcaccaagcc ttggggattc ttccatctga 540

ttgtgatgtg agttgcacag ctatgaaggc tgtacactgc acgaatggaa gaggcacctg 600

tcccagaaaa agcatcatgg ctatctgtgg gtagtatgat gggtgttttt agcaggtagg 660

aggcaaatat cttgaaaggg gttgtgaaga ggtgtttttt ctaattggca tgaaggtgtc 720

atacagattt gcaaagttta atggtgcctt catttgggat gctactctag tattccagac 780

ctgaagaatc acaataattt tctacctggt ctctccttgt tctgataatg aaaattatga 840

taaggatgat aaaagcactt acttcgtgtc cgactcttct gagcacctac ttacatgcat 900

tactgcatgc acttcttaca ataattctat gagataggta ctattatccc catttctttt 960

ttaaatgaag aaagtgaagt aggccgggca c 991

<210> 314

<211> 761

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HFE 3'-UTR

HFE-004 ENST00000349999

<400> 314

cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60

catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120

gaactccttg attttagcct tctctgttca tttcctcaaa aagatttccc catttaggtt 180

tctgagttcc tgcatgccgg tgatccctag ctgtgacctc tcccctggaa ctgtctctca 240

tgaacctcaa gctgcatcta gaggcttcct tcatttcctc cgtcacctca gagacataca 300

cctatgtcat ttcatttcct atttttggaa gaggactcct taaatttggg ggacttacat 360

gattcatttt aacatctgag aaaagctttg aaccctggga cgtggctagt cataacctta 420

ccagattttt acacatgtat ctatgcattt tctggacccg ttcaactttt cctttgaatc 480

ctctctctgt gttacccagt aactcatctg tcaccaagcc ttggggattc ttccatctga 540

ttgtgatgtg agttgcacag ctatgaaggc tgtacactgc acgaatggaa gaggcacctg 600

tcccagaaaa agcatcatgg ctatctgtgg gtagtatgat gggtgttttt agcaggtagg 660

aggcaaatat cttgaaaggg gttgtgaaga ggtgtttttt ctaattggca tgaaggtgtc 720

atacagattt gcaaagttta atggtgcctt catttgggat g 761

<210> 315

<211> 142

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HFE 3'-UTR

HFE-005 ENST00000397022

<400> 315

cacgcagcct gcagactcac tgtgggaagg agacaaaact agagactcaa agagggagtg 60

catttatgag ctcttcatgt ttcaggagag agttgaacct aaacatagaa attgcctgac 120

gaactccttg attttagcct tc 142

<210> 316

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HFE 3'-UTR

HFE-012 ENST00000336625

<400> 316

cacgcagcct gcagactcac tgtgggaagg a 31

<210> 317

<211> 394

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens KIAA1324L 3'-UTR

KIAA1324L-005 ENST00000416314

<400> 317

agagacagtg ctgtagcctt gagactaatg aacaaagaaa cctgctctag ttttacagga 60

ccatatttta gggtctgtcc tcatacctgt cacattggtg atctcacaga ggagggccat 120

gccgctgaaa agggaaggag attgaaacat ttgattgcct tatcacatgg tcaagtacct 180

tgccaaataa aggaaagcaa atgatttggg tctcaactga agatgaagct caactcagga 240

agagatttat ctgtatatac acataactga aaaccaagtt taagcccacc aatgcactgc 300

tgatgcatgc catataatta atgggtaact tttattcttt atgatgtcta cataacaagt 360

gtgatttgga aggcacatgt gagcatatgc atta 394

<210> 318

<211> 743

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MANSC1 NM_018050 3'-UTR

<400> 318

ggatggaact cggtgtctct taattcattt agtaaccaga agcccaaatg caatgagttt 60

ctgctgactt gctagtctta gcaggaggtt gtattttgaa gacaggaaaa tgcccccttc 120

tgctttcctt tttttttttt ggagacagag tcttgctttg ttgcccaggc tggagtgcag 180

tagcacgatc tcggctctca ccgcaacctc cgtctcctgg gttcaagcga ttctcctgcc 240

tcagcctcct aagtatctgg gattacaggc atgtgccacc acacctgggt gatttttgta 300

tttttagtag agacggggtt tcaccatgtt ggtcaggctg gtctcaaact cctgacctag 360

tgatccaccc tcctcggcct cccaaagtgc tgggattaca ggcatgagcc accacagctg 420

gcccccttct gttttatgtt tggtttttga gaaggaatga agtgggaacc aaattaggta 480

attttgggta atctgtctct aaaatattag ctaaaaacaa agctctatgt aaagtaataa 540

agtataattg ccatataaat ttcaaaattc aactggcttt tatgcaaaga aacaggttag 600

gacatctagg ttccaattca ttcacattct tggttccaga taaaatcaac tgtttatatc 660

aatttctaat ggatttgctt ttctttttat atggattcct ttaaaactta ttccagatgt 720

agttccttcc aattaaatat ttg 743

<210> 319

<211> 142

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LTA4H 5'-UTR

LTA4H-001 ENST00000228740

<400> 319

aagaaacttc ctttcccggc gtgcaccgcg aatccctcct cctcttcttt acctctctcc 60

ctcctcctca ggttctctat cgacgagtct ggtagctgag cgttgggctg taggtcgctg 120

tgctgtgtga tcccccagag cc 142

<210> 320

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens DECR1 5'-UTR

DECR1-001 ENST00000220764

<400> 320

tccagccccg agaactttgt tctttttgtc ccgccccctg cgcccaaccg cctgcgccgc 60

cttccggccc gagttctgga gactcaac 88

<210> 321

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PIGK 5'-UTR

<400> 321

actgcctccg ccccttcagg tgcgggaagt ctgaagccgg taaac 45

<210> 322

<211> 122

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BRP44L 5'-UTR

BRP44L-001

<400> 322

gtcgtgaggc gggccttcgg gctggctcgc cgtcggctgc cggggggttg gccggggtgt 60

cattggctct gggaagcggc agcagaggca gggaccactc ggggtctggt gtcggcacag 120

cc 122

<210> 323

<211> 117

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ACADSB 5'-UTR

ACADSB-004 NM_001609.3 ENST00000368869

<400> 323

agggattaag ggggggtgtg tgcggggcgg gtactgagtg ggcggggcct tgctcgggta 60

actcccaggg gctggctaga gacccagagg cgcagagcgg agaggcctgc ggcgagg 117

<210> 324

<211> 166

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens SUPT3H 5'-UTR

SUPT3H-006 ENST00000371459

<400> 324

cacagccgag tcaccttttc cctttctaca ctccacactc tcagtccccc accccgcccc 60

tttccaagcg tgtcccgggc cgcagcagca gaaaccgcac catctccacc cccacattct 120

cctcgcggga agcgcagcag tgcctccaag ggttcttaaa gcagag 166

<210> 325

<211> 176

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TMEM14A 5'-UTR

NM_014051.3

<400> 325

gtttccagga gggagcggcc tttgctcagc gcgagacggc tgggcgccga gtgggacagc 60

gctggtgcgg agactgcttc cggactccag gtaccgcgct tggcggcagc tggccccaga 120

cttctgtctt ttcagctgca gtgaaggctc ggggctgcag aattgcaacc ttgcca 176

<210> 326

<211> 222

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C9orf46 5'-UTR

AF225420.1

<400> 326

gagcgaggcc cggtccctgc agcgggcgaa aggagcccgg gcctggaggt ttgcgtaccg 60

gtcgcctggt cccggcacca gcgccgccca gtgtggtttc ccataaggaa gctcttcttc 120

ctgcttggct tccaccttta acccttccac ctgggagcgt cctctaacac attcagacta 180

caagtccaga cccaggagag caaggcccag aaagaggtca aa 222

<210> 327

<211> 227

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ANXA4 5'-UTR

NM_001153.3

<400> 327

gccccaggtg cgcttcccct agagagggat tttccggtct cgtgggcaga ggaacaacca 60

ggaacttggg ctcagtctcc accccacagt ggggcggatc cgtcccggat aagacccgct 120

gtctggccct gagtagggtg tgacctccgc agccgcagag gaggagcgca gcccggcctc 180

gaagaacttc tgcttgggtg gctgaactct gatcttgacc tagagtc 227

<210> 328

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens IFI6 5'-UTR

NM_022873.2

<400> 328

ccagccttca gccggagaac cgtttactcg ctgctgtgcc catctatcag caggctccgg 60

gctgaagatt gcttctcttc tctcctccaa ggtctagtga cggagcccgc gcgcggcgcc 120

acc 123

<210> 329

<211> 58

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C2orf34 5'-UTR

CAMKMT -008 ENST00000402247

<400> 329

tcctggcagg ggacgagctg cggcggtggc acctccgggt gtggaaggct ccagtgag 58

<210> 330

<211> 104

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens C2orf34 5'-UTR

NM_024766.3

<400> 330

gagggtgccg ggcgtcacag gtcctgacag ggaagaagtt ggcaggtcct ggcaggggac 60

gagctgcggc ggtggcacct ccgggtgtgg aaggctccag tgag 104

<210> 331

<211> 53

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ALDH6A1 5'-UTR

ALDH6A1-002 ENST00000350259

<400> 331

agtgcttctg ggcagtagag gcgcggggtg cggagctagg gcggccgaga gcc 53

<210> 332

<211> 117

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CCDC53 5'-UTR

CCDC53-002 ENST00000545679

<400> 332

ggaagggccc cggaggcggg cacttggggg gaaagttgag acgtgattac cgggttgggc 60

gggccccatc tgggaggggt ttgtgggtga actcggggtc caccgcccgc tgaggag 117

<210> 333

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CASP1 5'-UTR

NM_001257119.1

<400> 333

atactttcag tttcagtcac acaagaaggg aggagagaaa agcc 44

<210> 334

<211> 124

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NDUFB6 5'-UTR

NM_182739.2

<400> 334

gtaataaccg cgcgcggcgc tcggcgttcc cgcaaggtcg ctttgcagag cgggagcgcg 60

cttaagtaac tagtccgtag ttcgagggtg cgccgtgtcc ttttgcgttg gtaccagcgg 120

cgac 124

<210> 335

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BCKDHB 5'-UTR

BCKDHB-002 ENST00000369760

<400> 335

aggcggcgtg cggctgcata gcctgagaat cccggtggtg agcgggg 47

<210> 336

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BCKDHB 5'-UTR

NM_001164783.1

<400> 336

ctacgtgagt gccggaccgc tgagtggttg ttagccaag 39

<210> 337

<211> 234

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens BBS2 5'-UTR

NM_031885.3

<400> 337

cacagaaggc gccgaggctc caccgcgcag ccgcaaaaag agcggacggg tctgcgccgc 60

cgcaggagga gcaggcggta cctggacggg ttcgtcccgg gctgtttcgc gtccggcctg 120

aggcggctgg ggccgcgcag gtagtgtccc tgcacttctt gcccgggcgc gtgaggccag 180

ctccgctgcg cttgtctcca gcttccagcc ctcctcccct aagccgccgc catc 234

<210> 338

<211> 153

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens HERC5 5'-UTR

HERC5-001 ENST00000264350

<400> 338

tcagtagctg aggctgcggt tccccgacgc cacgcagctg cgcgcagctg gttcccgctc 60

tgcagcgcaa cgcctgaggc agtgggcgcg ctcagtcccg ggaccaggcg ttctctcctc 120

tcgcctctgg gcctgggacc ccgcaaagcg gcg 153

<210> 339

<211> 65

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens FAM175A 5'-UTR

NM_139076.2

<400> 339

accacagggt cttgcctccg cgcgccccgc cctcgtcctc ttgtgtagcc tgaggcggcg 60

gtagc 65

<210> 340

<211> 82

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NT5DC1 5'-UTR

NT5DC1-002 ENST00000319550

<400> 340

cggtcctgtc ccgcagcgtc ccgccagcca gctccttgca cccttcgcgg ccgaggcgct 60

ccctggtgct ccccgcgcag cc 82

<210> 341

<211> 246

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens RAB7A 5'-UTR

RAB7A-001 ENST00000265062

<400> 341

gtctcgtgac aggtacttcc gctcggggcg gcggcggtgg cggaagtggg agcgggcctg 60

gagtcttggc cataaagcct gaggcggcgg cagcggcgga gttggcggct tggagagctc 120

gggagagttc cctggaacca gaacttggac cttctcgctt ctgtcctccg tttagtctcc 180

tcctcggcgg gagccctcgc gacgcgcccg gcccggagcc cccagcgcag cggccgcgtt 240

tgaagg 246

<210> 342

<211> 128

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens AGA 5'-UTR

AGA-001 ENST00000264595

<400> 342

agggacgcct gagcgaaccc ccgagagagc gggcgtgggc gccaggcggg cggggcactg 60

gggattaatt gttcggcgat cgctggctgc cgggactttt ctcgcgctgg tctcttcggt 120

ggtcaggg 128

<210> 343

<211> 103

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TPK1 5'-UTR

TPK1-001 ENST00000360057

<400> 343

aaggctcctc agccgagcgc cgagcggtcg atcgccgtag ctcccgcagc ctgcgatctc 60

cagtctgtgg ctcctaccag ccattgtagg ccaataatcc gtt 103

<210> 344

<211> 79

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MBNL3 5'-UTR

MBNL3-001 ENST00000370839

<400> 344

aattcatttt taatccttta atagtccaca gtaatattgt cctaaagagg gtacattgga 60

ttttaatttt gctttcaat 79

<210> 345

<211> 129

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens MCCC2 5'-UTR

MCCC2-001 ENST00000340941

<400> 345

agaatcagag aaaccttctc tggggctgca aggacctgag ctcagcttcc gccccagcca 60

gggaagcggc aggggaaagc accggctcca ggccagcgtg ggccgctctc tcgctcggtg 120

cccgccgcc 129

<210> 346

<211> 89

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CAT 5'-UTR

CAT-001 ENST00000241052

<400> 346

actcggggca acaggcagat ttgcctgctg agggtggaga cccacgagcc gaggcctcct 60

gcagtgttct gcacagcaaa ccgcacgct 89

<210> 347

<211> 142

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ANAPC4 5'-UTR

ANAPC4-001 ENST00000315368

<400> 347

cccgacgccg gaagtgcctg gagcgcgcga cagcggcggg gcggggcggc ctggaggctg 60

tggcgcgcgg ccggcagagg gaggggagag gccactgggg ccgtgttagt ctgccggtgg 120

ggactcttgc agggccgtcc cc 142

<210> 348

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PHKB 5'-UTR

PHKB-002 ENST00000323584

<400> 348

ggccaaggcg gcgaccggag cgcg 24

<210> 349

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens ABCB7 5'-UTR

ABCB7-001 ENST00000253577

<400> 349

ctcggttcct ctttcctcgc tcaag 25

<210> 350

<211> 133

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GPD2 5'-UTR

GPD2-002 ENST00000438166

<400> 350

cccgcgcgcc tcgctgggag cacccgggcc gaggctctga ttctgggggg aggccgactc 60

caccctggct ggaggaactg ggtgctcctg cccgctggcc cctcgcgcgt gaggatctat 120

ctcaggctaa gaa 133

<210> 351

<211> 117

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens TMEM38B 5'-UTR

TMEM38B-001 ENST00000374692

<400> 351

gctggagccg gcgcggagga gcgggcggcc gcggctgtgc cctctcctac tcctcaccgc 60

gcgagcgcgg ggaaccagta gccgcggctg cttcggttgc cgcggtcggt ggtcgtt 117

<210> 352

<211> 206

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NFU1 5'-UTR

NM_001002755.2

<400> 352

gggaaaggtt ccccggcctc tcttggtcag ggtgacgcag tagcctgcaa acctcggcgc 60

gtaggccacc gcacttatcc gcagcaggac cgcccgcagc cggtagggtg ggctcttccc 120

agtgcccgcc cagctaccgg ccagcctgcg gctgcgcaga tctttcgtgg ttctgtcagg 180

gagaccctta ggcactccgg actaag 206

<210> 353

<211> 99

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LOC128322/NUTF2 5'-UTR

NM_005796.1

<400> 353

ggaagggaca gtcggccgca gaccgcgctg ggttgccgct gccgctgccg ccatcgtgcc 60

agcccctcgg gtctccgtga ggccgggtga cgctccaga 99

<210> 354

<211> 55

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens NUBPL 5'-UTR

NM_025152.2

<400> 354

actccgcgcc acccgcgaca gtttcccagc agggctcaca gcagcgttcc gcgtc 55

<210> 355

<211> 75

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens LANCL1 5'-UTR

LANCL1-004 ENST00000233714

<400> 355

gagaagggct tcaggacgcg ggaggcgcac ttgcttcaag tcgcgggcgt gggaacgggg 60

cttgcttccg gcgtc 75

<210> 356

<211> 204

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens PIR 5'-UTR

PIR-002 ENST00000380420

<400> 356

cctcccgcct cctctaggcc gccggccgcg aagcgctgag tcacggtgag gctactggac 60

ccacactctc ttaacctgcc ctccctgcac tcgctcccgg cggctcttcg cgtcaccccc 120

gccgctaagg ctccaggtgc cgctaccgca gcccctccat cctctacagc tcagcatcag 180

aacactctct ttttagactc cgat 204

<210> 357

<211> 65

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens CTBS 5'-UTR

NM_004388.2

<400> 357

gacgcgcagc aggccccgcc cacccaggcg gtaggaaccc actccggccc gctagacctg 60

ctgct 65

<210> 358

<211> 314

<212> DNA

<213> Artificial Sequence

<220>

<223> Homo sapiens GSTM4 5'-UTR

NM_000850.4

<400> 358

aagctggcga ggccgagccc ctcctagtgc ttccggacct tgctccctga acactcggag 60

gtggcggtgg atcttactcc ttccagccag tgaggatcca gcaacctgct ccgtgcctcc 120

cgcgcctgtt ggttggaagt gacgaccttg aagatcggcc ggttggaagt gacgaccttg 180

aagatcggcg ggcgcagcgg ggccgagggg gcgggtctgg cgctaggtcc agcccctgcg 240

tgccgggaac cccagaggag gtcgcagttc agcccagctg aggcctgtct gcagaatcga 300

caccaaccag catc 314

<210> 359

<211> 73

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa1 5'-UTR

Ndufa1-001 ENSMUST00000016571

<400> 359

gccggaagag aggtaaagcc gggtcacctc tgaggagccg gtgacgggtt ggcgtgcgag 60

taacggtgcg gag 73

<210> 360

<211> 105

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5e 5'-UTR

NM_025983

<400> 360

cccacccctt ccgctactca ggcctgacct tcctgctgcc gggccggttt gaggctactc 60

tgaagcgacc cagcggttct gcccgacgcg cccgctcgag acacc 105

<210> 361

<211> 100

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gstm5 5'-UTR

NM_010360

<400> 361

gagacagttc ggtcgcgtca gcccggccca cagcgtccag tataaagtta gccgcccaca 60

gtccatcgct gtatccccga aggggctaag atcgcccaaa 100

<210> 362

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cbr2 5'-UTR

NM_007621

<400> 362

ataaaagctg agcccatctc ttgcttcgga agaagctggt gtcagcagc 49

<210> 363

<211> 78

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Anapc13 5'-UTR

NM_181394

<400> 363

gtgacccaga agaagggcgg ggccgggagg aagccgacgc gcgcgcagtg ggcctgacaa 60

gatcaaagct gcaggagg 78

<210> 364

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa7 5'-UTR

NM_023202

<400> 364

tcggagcgga aggaat 16

<210> 365

<211> 17

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5k 5'-UTR

NM_007507

<400> 365

cgaaggtcac ggacaaa 17

<210> 366

<211> 67

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Cox4i1 5'-UTR

NM_009941

<400> 366

cttccggtcg cgagcacccc agggtgtaga gggcggtcgc ggcggtcgcc tgggcagcgg 60

tggcaga 67

<210> 367

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufs6 5'-UTR

NM_010888

<400> 367

ttggtacgac gcgtggggtc aagggtcacc ggcaag 36

<210> 368

<211> 90

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Sec61b 5'-UTR

NM_024171

<400> 368

agagcctgta tctacgagag ttctgagtgc tcggcaactt cacgacttcc ctcttcctgc 60

ctcctgtgcc caccgttctt aggcatcagc 90

<210> 369

<211> 55

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Snrpd2 5'-UTR

NM_026943

<400> 369

aaggctggag caacgcgctt ggaggcggga gtgatctgcg agcgaaacct acacc 55

<210> 370

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mgst3 5'-UTR

NM_025569

<400> 370

actgctgtgc ttctcaggtc tgtaccaggc gcacgaaggt gagccagagc caag 54

<210> 371

<211> 54

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Mp68 (2010107E04Rik) 5'-UTR

NM_027360

<400> 371

ctttcccatt ctgtagcaga atttggtgtt gcctgtggtc ttggtcccgc ggag 54

<210> 372

<211> 92

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Prdx4-001, 5'-UTR

NM_016764

<400> 372

gcgcggtctc cagcgcgccg ttttagctgg ctgcctggcg gcaggggact ctgtgcttta 60

gcagagggac gtgttttcgc gcttgcttgg tc 92

<210> 373

<211> 215

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Pgcp 5'-UTR

NM_176073

<400> 373

gctgtcctgg cacacaaaga agccaggcct gcagactact ggggctccgg gctgttcctg 60

aggcctctgg aggcccgccc tgtggctcca gtgcgctctg aggaccttcc tggtcccgcc 120

cccgaacgtg cctgtggtct gcaggcctca ccgggtgttg tggccgctgc tgctccgcag 180

agcctcgtga tcaggaagaa aagcaactag gaaca 215

<210> 374

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Myeov2 5'-UTR

NM_001163425

<400> 374

agaaggggct ggccggaagt gagcgcaacg ccgccttgtc gag 43

<210> 375

<211> 81

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufa4 5'-UTR

NM_010886

<400> 375

gtccgctcag ccaggttgca gaagcggctt agcgtgtgtc ctaatcttct ctctgcgtgt 60

aggtaggcct gtgccgcaaa c 81

<210> 376

<211> 76

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Ndufs5 5'-UTR

NM_001030274

<400> 376

acggcaggcg tctgcgtcct cccgcagccg gcggtcggga attgcaccag ggacctgaca 60

agggcactgc agagcc 76

<210> 377

<211> 198

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Gstm1 5'-UTR

NM_010358

<400> 377

ctgccttccg ctttagggtc tgctgctctg gttacagacc taggaagggg agtgcctaat 60

tgggattggt gcagggttgg gagggacccg ctgttttgtc ctgcccacgt ttctctagta 120

gtctgtataa agtcacaact ccaaacacac aggtcagtcc tgctgaagcc agtttgagaa 180

gaccacagca ccagcacc 198

<210> 378

<211> 75

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Atp5o 5'-UTR

NM_138597

<400> 378

ctggcgcgcg cgcgtgcgct ctggcgccag tagtctcttt tcatttgggt ttgacctaca 60

gccgcccggg aaaag 75

<210> 379

<211> 101

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Tspo 5'-UTR

NM_009775

<400> 379

gtcagcggct accaacctct gtgcgcagtg tccttcacgg aacaaccagc gactgcgtga 60

gcggggctgt ggatctttcc agaacatcag ttgcaatcac c 101

<210> 380

<211> 62

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Taldo1 5'-UTR

NM_011528

<400> 380

gacgcgcggg gcattgtggg ttagcacgca ccggctaccg cctcagctgt tcgcgtttcg 60

cc 62

<210> 381

<211> 89

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Bloc1s1 5'-UTR

NM_015740

<400> 381

gtgacgcctt ccgggtgagc caaggcatag tccagttcct gcagccttag ggaggggtcc 60

gccgtgccca cacccagcca gactcgacc 89

<210> 382

<211> 57

<212> DNA

<213> Artificial Sequence

<220>

<223> Mus musculus Hexa 5'-UTR

NM_010421

<400> 382

agctgaccgg ggctcacgtg ggctcagcct gctggaaggg gagctggccg gtgggcc 57

<210> 383

<211> 1810

<212> RNA

<213> Artificial Sequence

<220>

<223> 32L4 - PpLuc(GC) - A64-C30-hSL

<400> 383

gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60

cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120

ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180

guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240

ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300

ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360

gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420

gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480

gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540

cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600

caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660

cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720

cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780

ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840

gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900

cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960

gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020

cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080

ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140

ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200

gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260

cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320

cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380

gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440

cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500

gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560

cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620

ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguagau 1680

cuaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740

aaaaaaugca uccccccccc cccccccccc cccccccccc ccaaaggcuc uuuucagagc 1800

caccagaauu 1810

<210> 384

<211> 1927

<212> RNA

<213> Artificial Sequence

<220>

<223> PpLuc(GC) - morn2- A64 - C30 - hSL

<400> 384

gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60

cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120

ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180

guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240

ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300

ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360

gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420

gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480

gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540

cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600

caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660

cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720

cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780

ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840

gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900

cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960

gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020

cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080

ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140

ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200

gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260

cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320

cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380

gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440

cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500

gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560

cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620

ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguaccu 1680

gcugccuuaa cgcugagaug uggccucugc aaccccccuu aggcaaagca acugaaccuu 1740

cugcuaaagu gaccugcccu cuuccguaag uccaauaaag uugucaugca cccagaucua 1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860

aaaugcaucc cccccccccc cccccccccc ccccccccca aaggcucuuu ucagagccac 1920

cagaauu 1927

<210> 385

<211> 1943

<212> RNA

<213> Artificial Sequence

<220>

<223> PpLuc(GC) - ndufa1- A64 - C30 - hSL

<400> 385

gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60

cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120

ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180

guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240

ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300

ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360

gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420

gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480

gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540

cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600

caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660

cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720

cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780

ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840

gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900

cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960

gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020

cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080

ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140

ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200

gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260

cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320

cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380

gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440

cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500

gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560

cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620

ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguggaa 1680

gcauuuuccu ggcugauuaa aagaaauuac ucagcuaugg ucaucuguuc cuguuagaag 1740

gcuaugcagc auauuauaua cuaugcgcau guuaugaaau gcauaauaaa aaauuuuaaa 1800

aaaucuaaaa gaucuaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860

aaaaaaaaaa aaaaaaaaau gcaucccccc cccccccccc cccccccccc cccccaaagg 1920

cucuuuucag agccaccaga auu 1943

<210> 386

<211> 1941

<212> RNA

<213> Artificial Sequence

<220>

<223> PpLuc(GC) - NDUFA1- A64 - C30 - hSL

<400> 386

gggagaaagc uugaggaugg aggacgccaa gaacaucaag aagggcccgg cgcccuucua 60

cccgcuggag gacgggaccg ccggcgagca gcuccacaag gccaugaagc gguacgcccu 120

ggugccgggc acgaucgccu ucaccgacgc ccacaucgag gucgacauca ccuacgcgga 180

guacuucgag augagcgugc gccuggccga ggccaugaag cgguacggcc ugaacaccaa 240

ccaccggauc guggugugcu cggagaacag ccugcaguuc uucaugccgg ugcugggcgc 300

ccucuucauc ggcguggccg ucgccccggc gaacgacauc uacaacgagc gggagcugcu 360

gaacagcaug gggaucagcc agccgaccgu gguguucgug agcaagaagg gccugcagaa 420

gauccugaac gugcagaaga agcugcccau cauccagaag aucaucauca uggacagcaa 480

gaccgacuac cagggcuucc agucgaugua cacguucgug accagccacc ucccgccggg 540

cuucaacgag uacgacuucg ucccggagag cuucgaccgg gacaagacca ucgcccugau 600

caugaacagc agcggcagca ccggccugcc gaagggggug gcccugccgc accggaccgc 660

cugcgugcgc uucucgcacg cccgggaccc caucuucggc aaccagauca ucccggacac 720

cgccauccug agcguggugc cguuccacca cggcuucggc auguucacga cccugggcua 780

ccucaucugc ggcuuccggg ugguccugau guaccgguuc gaggaggagc uguuccugcg 840

gagccugcag gacuacaaga uccagagcgc gcugcucgug ccgacccugu ucagcuucuu 900

cgccaagagc acccugaucg acaaguacga ccugucgaac cugcacgaga ucgccagcgg 960

gggcgccccg cugagcaagg aggugggcga ggccguggcc aagcgguucc accucccggg 1020

cauccgccag ggcuacggcc ugaccgagac cacgagcgcg auccugauca cccccgaggg 1080

ggacgacaag ccgggcgccg ugggcaaggu ggucccguuc uucgaggcca agguggugga 1140

ccuggacacc ggcaagaccc ugggcgugaa ccagcggggc gagcugugcg ugcgggggcc 1200

gaugaucaug agcggcuacg ugaacaaccc ggaggccacc aacgcccuca ucgacaagga 1260

cggcuggcug cacagcggcg acaucgccua cugggacgag gacgagcacu ucuucaucgu 1320

cgaccggcug aagucgcuga ucaaguacaa gggcuaccag guggcgccgg ccgagcugga 1380

gagcauccug cuccagcacc ccaacaucuu cgacgccggc guggccgggc ugccggacga 1440

cgacgccggc gagcugccgg ccgcgguggu ggugcuggag cacggcaaga ccaugacgga 1500

gaaggagauc gucgacuacg uggccagcca ggugaccacc gccaagaagc ugcggggcgg 1560

cgugguguuc guggacgagg ucccgaaggg ccugaccggg aagcucgacg cccggaagau 1620

ccgcgagauc cugaucaagg ccaagaaggg cggcaagauc gccguguaag acuaguggaa 1680

gcauuuuccu gauugaugaa aaaaauaacu caguuauggc caucuacccc ugcuagaagg 1740

uuacagugua uuauguagca ugcaaugugu uauguagugc uuaauaaaaa uaaaaugaaa 1800

aaaaugcaga ucuaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860

aaaaaaaaaa aaaaaaaugc aucccccccc cccccccccc cccccccccc cccaaaggcu 1920

cuuuucagag ccaccagaau u 1941

<210> 387

<211> 1861

<212> RNA

<213> Artificial Sequence

<220>

<223> Mp68 - PpLuc(GC) - A64 - C30 - hSL

<400> 387

gggcuuuccc auucuguagc agaauuuggu guugccugug gucuuggucc cgcggagaag 60

cuugaggaug gaggacgcca agaacaucaa gaagggcccg gcgcccuucu acccgcugga 120

ggacgggacc gccggcgagc agcuccacaa ggccaugaag cgguacgccc uggugccggg 180

cacgaucgcc uucaccgacg cccacaucga ggucgacauc accuacgcgg aguacuucga 240

gaugagcgug cgccuggccg aggccaugaa gcgguacggc cugaacacca accaccggau 300

cguggugugc ucggagaaca gccugcaguu cuucaugccg gugcugggcg cccucuucau 360

cggcguggcc gucgccccgg cgaacgacau cuacaacgag cgggagcugc ugaacagcau 420

ggggaucagc cagccgaccg ugguguucgu gagcaagaag ggccugcaga agauccugaa 480

cgugcagaag aagcugccca ucauccagaa gaucaucauc auggacagca agaccgacua 540

ccagggcuuc cagucgaugu acacguucgu gaccagccac cucccgccgg gcuucaacga 600

guacgacuuc gucccggaga gcuucgaccg ggacaagacc aucgcccuga ucaugaacag 660

cagcggcagc accggccugc cgaagggggu ggcccugccg caccggaccg ccugcgugcg 720

cuucucgcac gcccgggacc ccaucuucgg caaccagauc aucccggaca ccgccauccu 780

gagcguggug ccguuccacc acggcuucgg cauguucacg acccugggcu accucaucug 840

cggcuuccgg gugguccuga uguaccgguu cgaggaggag cuguuccugc ggagccugca 900

ggacuacaag auccagagcg cgcugcucgu gccgacccug uucagcuucu ucgccaagag 960

cacccugauc gacaaguacg accugucgaa ccugcacgag aucgccagcg ggggcgcccc 1020

gcugagcaag gaggugggcg aggccguggc caagcgguuc caccucccgg gcauccgcca 1080

gggcuacggc cugaccgaga ccacgagcgc gauccugauc acccccgagg gggacgacaa 1140

gccgggcgcc gugggcaagg uggucccguu cuucgaggcc aagguggugg accuggacac 1200

cggcaagacc cugggcguga accagcgggg cgagcugugc gugcgggggc cgaugaucau 1260

gagcggcuac gugaacaacc cggaggccac caacgcccuc aucgacaagg acggcuggcu 1320

gcacagcggc gacaucgccu acugggacga ggacgagcac uucuucaucg ucgaccggcu 1380

gaagucgcug aucaaguaca agggcuacca gguggcgccg gccgagcugg agagcauccu 1440

gcuccagcac cccaacaucu ucgacgccgg cguggccggg cugccggacg acgacgccgg 1500

cgagcugccg gccgcggugg uggugcugga gcacggcaag accaugacgg agaaggagau 1560

cgucgacuac guggccagcc aggugaccac cgccaagaag cugcggggcg gcgugguguu 1620

cguggacgag gucccgaagg gccugaccgg gaagcucgac gcccggaaga uccgcgagau 1680

ccugaucaag gccaagaagg gcggcaagau cgccguguaa gacuaguaga ucuaaaaaaa 1740

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaugc 1800

aucccccccc cccccccccc cccccccccc cccaaaggcu cuuuucagag ccaccagaau 1860

u 1861

<210> 388

<211> 1888

<212> RNA

<213> Artificial Sequence

<220>

<223> Ndufa4 - PpLuc(GC) - A64 - C30 - hSL

<400> 388

gggguccgcu cagccagguu gcagaagcgg cuuagcgugu guccuaaucu ucucucugcg 60

uguagguagg ccugugccgc aaacaagcuu gaggauggag gacgccaaga acaucaagaa 120

gggcccggcg cccuucuacc cgcuggagga cgggaccgcc ggcgagcagc uccacaaggc 180

caugaagcgg uacgcccugg ugccgggcac gaucgccuuc accgacgccc acaucgaggu 240

cgacaucacc uacgcggagu acuucgagau gagcgugcgc cuggccgagg ccaugaagcg 300

guacggccug aacaccaacc accggaucgu ggugugcucg gagaacagcc ugcaguucuu 360

caugccggug cugggcgccc ucuucaucgg cguggccguc gccccggcga acgacaucua 420

caacgagcgg gagcugcuga acagcauggg gaucagccag ccgaccgugg uguucgugag 480

caagaagggc cugcagaaga uccugaacgu gcagaagaag cugcccauca uccagaagau 540

caucaucaug gacagcaaga ccgacuacca gggcuuccag ucgauguaca cguucgugac 600

cagccaccuc ccgccgggcu ucaacgagua cgacuucguc ccggagagcu ucgaccggga 660

caagaccauc gcccugauca ugaacagcag cggcagcacc ggccugccga aggggguggc 720

ccugccgcac cggaccgccu gcgugcgcuu cucgcacgcc cgggacccca ucuucggcaa 780

ccagaucauc ccggacaccg ccauccugag cguggugccg uuccaccacg gcuucggcau 840

guucacgacc cugggcuacc ucaucugcgg cuuccgggug guccugaugu accgguucga 900

ggaggagcug uuccugcgga gccugcagga cuacaagauc cagagcgcgc ugcucgugcc 960

gacccuguuc agcuucuucg ccaagagcac ccugaucgac aaguacgacc ugucgaaccu 1020

gcacgagauc gccagcgggg gcgccccgcu gagcaaggag gugggcgagg ccguggccaa 1080

gcgguuccac cucccgggca uccgccaggg cuacggccug accgagacca cgagcgcgau 1140

ccugaucacc cccgaggggg acgacaagcc gggcgccgug ggcaaggugg ucccguucuu 1200

cgaggccaag gugguggacc uggacaccgg caagacccug ggcgugaacc agcggggcga 1260

gcugugcgug cgggggccga ugaucaugag cggcuacgug aacaacccgg aggccaccaa 1320

cgcccucauc gacaaggacg gcuggcugca cagcggcgac aucgccuacu gggacgagga 1380

cgagcacuuc uucaucgucg accggcugaa gucgcugauc aaguacaagg gcuaccaggu 1440

ggcgccggcc gagcuggaga gcauccugcu ccagcacccc aacaucuucg acgccggcgu 1500

ggccgggcug ccggacgacg acgccggcga gcugccggcc gcgguggugg ugcuggagca 1560

cggcaagacc augacggaga aggagaucgu cgacuacgug gccagccagg ugaccaccgc 1620

caagaagcug cggggcggcg ugguguucgu ggacgagguc ccgaagggcc ugaccgggaa 1680

gcucgacgcc cggaagaucc gcgagauccu gaucaaggcc aagaagggcg gcaagaucgc 1740

cguguaagac uaguagaucu aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800

aaaaaaaaaa aaaaaaaaaa aaaaugcauc cccccccccc cccccccccc cccccccccc 1860

aaaggcucuu uucagagcca ccagaauu 1888

<---

1. Молекула искусственной нуклеиновой кислоты для экспрессии белка или пептида in vivo, включающая: а. по меньшей мере, одну открытую рамку считывания – ORF и б. по меньшей мере один элемент 3'-нетранслируемой области – элемент 3'-UTR, причем по меньшей мере один элемент 3'-UTR продлевает и/или увеличивает выработку белка указанной молекулы искусственной нуклеиновой кислоты и происходит от стабильной мРНК, в которой по меньшей мере один элемент 3'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая происходит от 3'-UTR транскрипта – GNAS - белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующие комплексные локусы.

2. Молекула искусственной нуклеиновой кислоты по п. 1, дополнительно содержащая по меньшей мере элемент 5'-нетранслируемой области – элемент 5'-UTR.

3. Молекула искусственной нуклеиновой кислоты по п. 2, в которой открытая рамка считывания происходит от гена, который отличается от гена, из которого происходит по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR.

4. Молекула искусственной нуклеиновой кислоты по п. 3, в которой каждые по меньшей мере одна открытая рамка считывания, по меньшей мере один элемент 3'-UTR и по меньшей мере один элемент 5'-UTR гетерологичны друг другу.

5. Молекула искусственной нуклеиновой кислоты по пп. 2-4, причем стабильная мРНК, из которой происходит по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR, отличается распадом мРНК, причем соотношение количества указанной мРНК во второй временной точке к количеству указанной мРНК в первой временной точке составляет по меньшей мере 0,5 - 50%, по меньшей мере 0,6 - 60%, по меньшей мере 0,7 - 70%, по меньшей мере 0,75 - 75%, по меньшей мере 0,8 - 80%, по меньшей мере 0,85 - 85%, по меньшей мере 0,9 - 90% или по меньшей мере 0,95 - 95%.

6. Молекула искусственной нуклеиновой кислоты по пп. 2-5, причем молекула искусственной нуклеиновой кислоты не содержит 3'-UTR и/или 5'-UTR рибосомального белка S6, RPL36AL, rps16 или рибосомального белка L9, и открытая рамка считывания молекулы искусственной нуклеиновой кислоты не кодирует белок GFP и где открытая рамка считывания молекулы искусственной нуклеиновой кислоты предпочтительно не кодирует репортерный белок.

7. Молекула искусственной нуклеиновой кислоты по пп. 2-6, в которой по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR продлевают выработку белка указанной молекулой искусственной нуклеиновой кислоты по меньшей мере в 1,2 раза, предпочтительно по меньшей мере в 1,5 раза, более предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза, по сравнению с выработкой белка контрольной молекулой нуклеиновой кислоты, не содержащей 3'-UTR и/или по меньшей мере одного 5'-UTR, соответственно, и/или в которой по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR увеличивает выработку белка с указанной молекулы искусственной нуклеиновой кислоты по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза по сравнению с выработкой белка с контрольной молекулы нуклеиновой кислоты, не содержащей 3'-UTR и/или по меньшей мере одного 5'-UTR, соответственно.

8. Молекула искусственной нуклеиновой кислоты по пп. 2-7, в которой по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR дополнительно содержит последовательность нуклеиновой кислоты, которая происходит от 3'-UTR и/или 5'-UTR транскрипта гена, выбранного из группы, состоящей из: NDUFA1 - альфа-субкомплекс 1 NADH-дегидрогеназа-убихинон, MORN2 – белок, содержащий 2 MORN-повтор, GSTM1 - глутатион-S-трансфераза, mu 1, CBR2 - карбонилредуктаза 2, МР68 - RIKEN кДНК 2010107Е04 ген, NDUFA4 - 1 альфа субкомплекс 4 NADH дегидрогеназа-убихинон, LTA4H, SLC38A6, DECR1, PIGK, FAM175A, PHYH, TBC1D19, PIGB, ALG6, CRYZ, BRP44L, ACADSB, SUPT3H, TMEM14A, GRAMD1C, C11orf80, C9orf46, ANXA4, TBCK, IFI6, C2orf34, ALDH6A1, AGTPBP1, CCDC53, LRRC28, CCDC109B, PUS10, 3 CCDC104, CASP1, SNX14, SKAP2, NDUFB6, EFHA1, BCKDHB, BBS2, LMBRD1, ITGA6, HERC5, NT5DC1, RAB7A, AGA, TPK1, MBNL3, HADHB, MCCC2, CAT, ANAPC4, PCCB, PHKB, ABCB7, PGCP, GPD2, TMEM38B, NFU1, OMA1, LOC128322/NUTF2, NUBPL, LANCL1, HHLA3, PIR, ACAA2, CTBS, GSTM4, ALG8, Ndufa1, Atp5e, Gstm5, Uqcr11, Ifi27I2a, Cbr2, Anapc13, Atp5I, Tmsb10, Nenf, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Cox6a1, Ndufs6, Sec61b, Romo1, Gnas, Snrpd2, Mgst3, Aldh2, Ssr4, Myl6, Prdx4, Ubl5, 1110001J03Rik, Ndufa13, Ndufa3, Gstp2, Tmem160, Ergic3, Pgcp, Slpi, Myeov2, Ndufa4, Ndufs5, Gstm1, 1810027O10Rik, Atp5o, Shfm1, Tspo, S100a6, Taldo1, Bloc1s1, Hexa, Ndufb11, Map1lс3а, Morn2, Gpx4, Mif, Cox6b1, RIKEN cDNA2900010J23 (Swi5), Sec61g, 2900010M23Rik, Anapc5, Mars2, Phpt1, Ndufb8, Pfdn5, Arpc3, Ndufb7, Atp5h, Mrpl23, Uba52, Tomm6, Mtch1, Pcbd2, Ecm1, Hrsp12, Mecr, Uqcrq, Gstm3, Lsm4, Park7, Usmg5, Cox8a, Ly6c1, Cox7b, Ppib, Bag1, S100a4, Bcap31, Tecr, Rabac1, Robld3, Sod1, Nedd8, Higd2a, Trappc6a, Ldhb, Nme2, Snrpg, Ndufa2, Serf1, Oaz1, Rps4x, Rps13, Ybx1, Sepp1, Gaa, ACTR10, PIGF, MGST3, SCP2, HPRT1, ACSF2, VPS13A, CTH, NXT2, MGST2, C11orf67, PCCA, GLMN, DHRS1, PON2, NME7, ETFDH, ALG13, DDX60, DYNC2LI1, VPS8, ITFG1, CDK5, C1orf112, IFT52, CLYBL, FAM114A2, NUDT7, AKD1, MAGED2, HRSP12, STX8, ACAT1, IFT74, KIFAP3, CAPN1, COX11, GLT8D4, HACL1, IFT88, NDUFB3, ANO10, ARL6, LPCAT3, ABCD3, COPG2, MIPEP, LEPR, C2orf76, ABCA6, LY96, CROT, ENPP5, SERPINB7, TCP11L2, IRAK1BP1, CDKL2, GHR, KIAA1107, RPS6KA6, CLGN, TMEM45A, TBC1D8B, ACP6, RP6-213H19.1, SNRPN, GLRB, HERC6, CFH, GALC, PDE1A, GSTM5, CADPS2, AASS, TRIM6-TRIM34 (сквозной транскрипт), SEPP1, PDE5A, SATB1, CCPG1, CNTN1, LMBRD2, TLR3, BCAT1, TOM1L1, SLC35A1, GLYATL2, STAT4, GULP1, EHHADH, NBEAL1, KIAA1598, HFE, KIAA1324L и MANSC1; предпочтительно из группы, состоящей из NDUFA1 - альфа-субкомплекс 1 NADH-дегидрогеназа-убихинон, GNAS - белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующий комплексные локусы, MORN2 – белок, содержащий 2 MORN-повтора, GSTM1 - глутатион-S-трансфераза, mu 1, CBR2 - карбонилредуктаза2, МР68 - RIKEN кДНК 2010107Е04 ген, NDUFA4 - 1 альфа субкомплекс 4 NADH дегидрогеназа -убихинон, Ybx1 - Y-Box-связывающий белок 1, Ndufb8 - 1 бета субкомплекс 8 NADH дегидрогеназа убихинон и CNTN1 - контактин 1.

9. Молекула искусственной нуклеиновой кислоты по любому пп. 1-7, в которой по меньшей мере один элемент 3'-UTR содержит последовательность нуклеиновой кислоты, которая происходит от 3'-UTR транскрипта гена, выбранного из группы, состоящей из GNAS-белок, связывающий гуаниновые нуклеотиды, альфа-стимулирующие комплексные локусы человека или мыши.

10. Молекула искусственной нуклеиновой кислоты по п. 8, в которой по меньшей мере один элемент 5'-UTR дополнительно включает последовательность нуклеиновой кислоты, происходящую от 5'-UTR транскрипта гена, выбранного из группы, состоящей из: МР68 - RIKEN кДНК 2010107Е04 ген, NDUFA4 - 1 альфа субкомплекс 4 NADH дегидрогеназа-убихинон, LTA4H, DECR1, PIGK, TBC1D19, BRP44L, ACADSB, SUPT3H, ТМЕМ14А, C9orf46, ANXA4, IFI6, C2orf34, ALDH6A1, CCDC53, CCDC104, CASP1, NDUFB6, BCKDHB, BBS2, HERC5, FAM175A, NT5DC1, RAB7A, AGA, TPK1, MBNL3, MCCC2, CAT, ANAPC4, РНКВ, ABCB7, GPD2, TMEM38B, NFU1, LOC128322/NUTF2, NUBPL, LANCL1, PIR, CTBS, GSTM4, Ndufa1, Atp5e, Gstm5, Cbr2, Anapc13, Ndufa7, Atp5k, 1110008P14Rik, Cox4i1, Ndufs6, Sec61b, Snrpd2, Mgst3, Prdx4; Pgcp; Myeov2; Ndufa4; Ndufs5; Gstm1; Atp5o; Tspo; Taldo1; Bloc1s1; и Hexa; предпочтительно по меньшей мере один элемент 5'-UTR содержит или состоит из последовательности нуклеиновой кислоты, которая происходит от 5'-UTR транскрипта МР68 - RIKEN кДНК 2010107Е04 ген или NDUFA4 - 1 альфа субкомплекс 4 NADH дегидрогеназа-убихинон.

11. Молекула искусственной нуклеиновой кислоты по пп. 1-9, в которой по меньшей мере один элемент 3'-UTR включает или состоит из последовательности нуклеиновой кислоты, которая, по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентична последовательности нуклеиновой кислоты, выбранной из группы, включающей SEQ ID NO: 1-24 и SEQ ID NO: 49-318, или в которой по меньшей мере один элемент 3'-UTR включает или состоит из фрагмента последовательности нуклеиновой кислоты, который, по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентичен фрагменту последовательности нуклеиновой кислоты, выбранной из группы, включающей SEQ ID NO: 1-24 и SEQ ID NO: 49-318.

12. Молекула искусственной нуклеиновой кислоты по любому из пп. 2-8 и 10, в которой по меньшей мере один элемент 5'-UTR включает или состоит из последовательности нуклеиновой кислоты, которая, по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентична последовательности нуклеиновой кислоты, выбранной из группы, включающей SEQ ID NO: 25-30 и SEQ ID NO: 319-382, или в которой по меньшей мере один элемент 5'-UTR включает или состоит из фрагмента последовательности нуклеиновой кислоты, который, по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% идентичен фрагменту последовательности нуклеиновой кислоты, выбранной из группы, включающей SEQ ID NO: 25-30 и SEQ ID NO: 319-382.

13. Молекула искусственной нуклеиновой кислоты по пп. 1-12, дополнительно включающая в. последовательность поли(А) и/или сигнал полиаденилирования, в которой последовательность поли(А) и/или сигнал полиаденилирования предпочтительно расположен с 3'-конца элемента 3'-UTR, и/или в которой сигнал полиаденилирования включает консенсусную последовательность NN(U/T)ANA, где N=А или U, предпочтительно AA(U/T)AAA или 6 A(U/T)(U/T)AAA, и/или в которой сигнал полиаденилирования, предпочтительно консенсусная последовательность NNUANA, предпочтительно расположен менее чем примерно в 50 нуклеотидах ниже по цепи от 3'-конца элемента 3'-UTR, и/или в которой последовательность поли(А) имеет в длину предпочтительно примерно от 20 до примерно 300 адениновых нуклеотидов, предпочтительно примерно от 40 до примерно 200 адениновых нуклеотидов, более предпочтительно примерно от 50 до примерно 100 адениновых нуклеотидов, еще более предпочтительно примерно от 60 до примерно 70 адениновых нуклеотидов.

14. Молекула искусственной нуклеиновой кислоты по любому из пп. 1-13, дополнительно включающая структуру 5'-кэп, последовательность поли(С), гистонную структуру стебель-петля и/или мотив IRES, в которой гистонная структура стебель-петля содержит последовательность SEQ ID NO:34.

15. Молекула искусственной нуклеиновой кислоты по пп. 1-13, в которой нуклеиновая кислота включает 5'-TOP UTR, и/или в которой молекула нуклеиновой кислоты включает 3'-UTR, которая содержит или состоит из последовательности нуклеиновой кислоты, которая происходит от 3'-UTR гена альбумина, и/или в которой молекула искусственной нуклеиновой кислоты, предпочтительно открытая рамка считывания, является по меньшей мере частично G/C модифицированной, предпочтительно содержание G/C в открытой рамке считывания увеличено по сравнению с открытой рамкой считывания дикого типа, и/или в которой открытая рамка считывания включает кодон-оптимизированную область, предпочтительно, в которой открытая рамка считывания является кодон-оптимизированной, и/или является молекулой РНК, предпочтительно молекулой мРНК.

16. Вектор для обеспечения транскрипции молекулы нуклеиновой кислоты по любому из пп.1-15, который является плазмидным или вирусным ДНК-вектором, содержащим молекулу нуклеиновой кислоты по любому из пп. 1-15.

17. Клетка для обеспечения транскрипции молекулы нуклеиновой кислоты по пп.1-15, включающая молекулу искусственной нуклеиновой кислоты по любому пп.1-15 или вектор по п.16, которая является клеткой млекопитающего.

18. Способ получения белка или пептида, синтезируемого искусственной молекулой нуклеиновой кислоты по любому из пп. 1-15 или вектором по п. 16 in vivo, предусматривающий получение соответствующей молекулы или вектора в результате ассоциирования открытой рамки считывания с элементом 3'-UTR и/или элементом 5'-UTR, причем элемент 3'-UTR и/или элемент 5'-UTR продлевает и/или увеличивает выработку белка или пептида полученной молекулой искусственной нуклеиновой кислоты, и по меньшей мере один элемент 3'-UTR и/или по меньшей мере один элемент 5'-UTR происходит от молекулы стабильной мРНК, с последующим применением полученной молекулы мРНК или вектора для синтеза белка или пептида.

19. Применение элемента 3'-UTR и/или элемента 5'-UTR для получения белка или пептида in vivo за счет увеличения и/или продления его выработки молекулой искусственной нуклеиновой кислоты или вектором, причем элемент 3'-UTR и/или элемент 5'-UTR включает или состоит из последовательности нуклеиновой кислоты, которая происходит от 3'-UTR и/или 5'-UTR транскрипта гена GNAS - белка, связывающий гуаниновые нуклеотиды, альфа-стимулирующие комплексные локусы.



 

Похожие патенты:

Изобретение относится к области биотехнологии, в частности к гуманизированной иммунодефицитной без ожирения с диабетом (NOD) мыши в качестве модели, а также к способу ее создания. Также раскрыто применение вышеуказанной мыши в способе прогнозирования ранжирования эффективности множества противоопухолевых средств для лечения опухоли, способе тестирования комбинированной терапии для лечения опухоли с применением двух или более кандидатных средств, способе определения эффективности режима дозирования для лечения опухоли с использованием средства, а также в способе определения безопасности режима дозирования для лечения опухоли с использованием средства.

Изобретение относится к области биотехнологии, в частности к гуманизированной иммунодефицитной без ожирения с диабетом (NOD) мыши в качестве модели, а также к способу ее создания. Также раскрыто применение вышеуказанной мыши в способе прогнозирования ранжирования эффективности множества противоопухолевых средств для лечения опухоли, способе тестирования комбинированной терапии для лечения опухоли с применением двух или более кандидатных средств, способе определения эффективности режима дозирования для лечения опухоли с использованием средства, а также в способе определения безопасности режима дозирования для лечения опухоли с использованием средства.

Изобретение относится к области биотехнологии, в частности к комплексу редактирования генома яйцеклетки мыши на основе CRISPR/Cas9, состоящему из мРНК белка Cas9 S.Pyogenes, РНК-гида и короткой одноцепочечной ДНК (ssODN), а также к способу редактирования генома яйцеклетки мыши с его использованием. Также раскрыта линия мышей c гуманизированной нуклеотидной последовательностью экзона 6 гена Gnao1.

Настоящее изобретение относится к области биотехнологии и медицины и раскрывает экспрессионный линеаризованный вектор, состоящий из конститутивного CAG-промотора, STOP-кассеты, терминирующей транскрипцию с данного промотора и фланкированной LoxP-сайтами, и открытой рамки считывания гена hACE2 Homo sapiens, содержащей полноразмерной кДНК hACE2, экспрессия которого индуцируется тканеспецифично путем введения Cre-рекомбиназы, отличающийся тем, что кДНК гена hACE2 встроена в вектор по сайтам узнавания эндонуклеаз рестрикции BshTI – MluI.

Настоящее изобретение относится к области биотехнологии и медицины и раскрывает экспрессионный линеаризованный вектор, состоящий из конститутивного CAG-промотора, STOP-кассеты, терминирующей транскрипцию с данного промотора и фланкированной LoxP-сайтами, и открытой рамки считывания гена hACE2 Homo sapiens, содержащей полноразмерной кДНК hACE2, экспрессия которого индуцируется тканеспецифично путем введения Cre-рекомбиназы, отличающийся тем, что кДНК гена hACE2 встроена в вектор по сайтам узнавания эндонуклеаз рестрикции BshTI – MluI.

Изобретения относятся к области биотехнологии. Представлены способ получения антитела, включающий следующие этапы: культивирование клеток млекопитающих и получение антитела из клетки или культуральной среды, где первая экспрессионная кассета и вторая экспрессионная кассета расположены в разных направлениях для кратковременной продукции антитела, а также способ получения антитела, содержащий: культивирование кратковременно трансфецированных клеток млекопитающих и получение антитела из кратковременно трансфецированных клеток или культуральной среды.

Изобретение относится к области биотехнологии, конкретно к CD19-специфическому полипептиду химерного антигенного рецептора (CAR), кодируемому последовательностью ДНК с SEQ ID NO:5, нуклеотидами 1-1485 SEQ ID NO:5 или нуклеотидами 67-1485 SEQ ID NO:5, и может быть использовано в медицине. Изобретение позволяет получить Т-клетки, нацеленные на CD19, которые можно использовать для эффективной терапии CD19+ злокачественных новообразований.

Группа изобретений относится к области фармацевтики и может быть использована для лечения рака мозга. Раскрыта молекула нуклеиновой кислоты, кодирующая химерный рецептор антигена, где данный химерный рецептор антигена содержит аминокислотную последовательность SEQ ID NO: 26 или SEQ ID NO: 27.

Изобретение относится к области биотехнологии, в частности к генетически модифицированной мыши, содержащей последовательность нуклеиновой кислоты, кодирующую терминальную дезоксинуклеотидилтрансферазу (TdT) человека, функционально связанную с элементом контроля транскрипции, и вариабельную область иммуноглобулина, а также к ее ЭС-клетке.

Изобретение относится к области биотехнологии, конкретно к способу получения Т-клеток для иммунотерапии, и может быть использовано в медицине. Заявленный способ, включающий инактивацию гена бета 2-микроглобулина (В2М) и по меньшей мере одного гена, кодирующего компонент Т-клеточного рецептора (TCR), путем применения направленных редкощепящих эндонуклеаз, позволяет получать Т-клетки для экспрессии химерного антигенного рецептора (CAR), пригодные для аллотрансплантации и иммунотерапии рака.

Изобретения относятся к области биотехнологии. Представлены способ получения антитела, включающий следующие этапы: культивирование клеток млекопитающих и получение антитела из клетки или культуральной среды, где первая экспрессионная кассета и вторая экспрессионная кассета расположены в разных направлениях для кратковременной продукции антитела, а также способ получения антитела, содержащий: культивирование кратковременно трансфецированных клеток млекопитающих и получение антитела из кратковременно трансфецированных клеток или культуральной среды.
Наверх