Композиции для модулирования экспрессии c9orf72

Авторы патента:


Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
Композиции для модулирования экспрессии c9orf72
C12N2310/11 - Микроорганизмы или ферменты; их композиции (биоциды, репелленты или аттрактанты или регуляторы роста растений, содержащие микроорганизмы, вирусы, микробные грибки, ферменты, агенты брожения или вещества, получаемые или экстрагируемые из микроорганизмов или из материала животного происхождения A01N 63/00; пищевые составы A21,A23; лекарственные препараты A61K; химические аспекты или использование материалов для бандажей, перевязочных средств, впитывающих подкладок или хирургических приспособлений A61L; удобрения C05); размножение, консервирование или сохранение микроорганизмов (консервирование живых тканей или органов людей или животных A01N 1/02); мутации или генная инженерия; питательные среды (среды для микробиологических испытаний C12Q)
C12N15/113 - Получение мутаций или генная инженерия; ДНК или РНК, связанные с генной инженерией, векторы, например плазмиды или их выделение, получение или очистка; использование их хозяев (мутанты или микроорганизмы, полученные генной инженерией C12N 1/00,C12N 5/00,C12N 7/00; новые виды растений A01H; разведение растений из тканевых культур A01H 4/00; новые виды животных A01K 67/00; использование лекарственных препаратов, содержащих генетический материал, который включен в клетки живого организма, для лечения генетических заболеваний, для генной терапии A61K 48/00 пептиды вообще C07K)

Владельцы патента RU 2736574:

ИОНИС ФАРМАСЬЮТИКАЛЗ, ИНК. (US)

Изобретение относится к области биотехнологии. Заявлена группа изобретений, включающая модифицированный олигонуклеотид, имеющий последовательность SEQ ID NO: 33, или его соль, натриевую соль вышеуказанного олигонуклеотида, фармацевтическую композицию, содержащую терапевтически эффективное количество вышеуказанного модифицированного олигонуклеотида для лечения заболевания, ассоциированного с C9ORF72 (варианты), фармацевтическую композицию, содержащую терапевтически эффективное количество натриевой соли модифицированного олигонуклеотида для лечения заболевания, ассоциированного с C9ORF72. В одном из вариантов реализации модифицированный олигонуклеотид характеризуется последовательностью нуклеиновых оснований 5'-GCCCCTAGCGCGCGACTC-3' (SEQ ID NO: 33), где каждый цитозин представляет собой 5-метилцитозин; и где межнуклеозидные связи модифицированного олигонуклеотида, в направлении 5'-3', представляют собой soosssssssssoooss, где каждая s представляет собой тиофосфатную связь, и каждая о представляет собой фосфодиэфирную связь. Изобретение расширяет арсенал средств для лечения заболеваний, ассоциированных с C9ORF72. 8 н. и 12 з.п. ф-лы, 17 табл., 14 пр.

 

Перечень последовательностей

Настоящая заявка подана вместе с перечнем последовательностей в электронном формате. Перечень последовательностей представлен в виде файла под названием BIOL0269WOSEQ_ST25.txt, созданного 15 апреля 2016 года, размером 104 Кб. Информация о перечне последовательностей в электронном формате в полном объеме включена в данный документ посредством ссылки.

Область изобретения

Предложены композиции и способы модулирования экспрессии мРНК и белка C9ORF72 в клетках и у животных. Указанные композиции и способы подходят для лечения, предупреждения, облегчения или замедления прогрессирования нейродегенеративных заболеваний, включая боковой амиотрофический склероз (ALS - amyotrophic lateral sclerosis), лобно-височную деменцию (FTD - frontotemporal dementia), синдром кортико-базальной дегенерации (CBD - corticobasal degeneration syndrome), атипический синдром паркинсонизма и оливопонтоцеребеллярную дегенерацию (OPCD - olivopontocerebellar degeneration).

Уровень техники

Боковой амиотрофический склероз (ALS) представляет собой неизлечимое нейродегенеративное заболевание, клинически характеризующееся прогрессирующим параличом, приводящим к смерти вследствие дыхательной недостаточности, обычно в течение двух-трех лет после возникновения симптома (Rowland and Shneider, N. Engl. J. Med., 2001, 344, 1688-1700). ALS является третьим по распространенности нейродегенеративным заболеванием в западном мире (Hirtz et al., Neurology, 2007, 68, 326-337), и в настоящее время не существует эффективных терапевтических способов лечения. Около 10% случаев являются наследственными по своей природе, при этом основная масса пациентов, у которых диагностировано указанное заболевание, классифицируется как спорадическая, поскольку болезнь возникает в популяции случайным образом (Chio et al., Neurology, 2008, 70, 533-537). На основании клинических, генетических и эпидемиологических данных растет понимание того, что ALS и лобно-височная деменция (FTD) представляют собой перекрывающийся, сплошной спектр заболевания, патологически характеризующийся наличием TDP-43-положительных включений в центральной нервной системе (Lillo and Hodges, J. Clin. Neurosci., 2009, 16, 1131-1135; Neumann et al., Science, 2006, 314, 130-133).

В настоящее время открыто множество генов, являющихся причиной классического наследственного ALS, например, SOD1, TARDBP, FUS, OPTN и VCP (Johnson et al., Neuron, 2010, 68, 857-864; Kwiatkowski et al., Science, 2009, 323, 1205-1208; Maruyama et al., Nature, 2010, 465, 223-226; Rosen et al., Nature, 1993, 362, 59-62; Sreedharan et al., Science, 2008, 319, 1668-1672; Vance et al., Brain, 2009, 129, 868-876). Проведенный недавно анализ генетических связей между родственниками с многочисленными случаями ALS, FTD и ALS-FTD позволил предположить, что существует важный локус указанного заболевания на коротком плече хромосомы 9 (Boxer et al., J. Neurol. Neurosurg. Psychiatry, 2011, 82, 196-203; Morita et al., Neurology, 2006, 66, 839-844; Pearson et al. J. Nerol., 2011, 258, 647-655; Vance et al., Brain, 2006, 129, 868-876). Мутация в гене C9ORF72 является наиболее распространенной генетической причиной ALS и FTD. Мутация, вызывающая ALS-FTD, представляет собой экспансию крупного гексануклетоидного (GGGGCC) повтора в первом интроне гена C9ORF72 (Renton et al., Neuron, 2011, 72, 257-268; DeJesus-Hernandez et al., Neuron, 2011, 72, 245-256). Гаплотип-основатель, охватывающий ген C9ORF72, в большинстве случаев присутствует в связанной форме с указанной областью (Renton et al., Neuron, 2011, 72, 257-268). Указанный локус на хромосоме 9р21 обусловливает около половины случаев наследственного ALS и около четверти всех случаев ALS в группе из 405 финских пациентов (Laaksovirta et al, Lancet Neurol., 2010, 9, 978-985).

Гаплотип-основатель, охватывающий ген C9ORF72, в большинстве случаев присутствует в связанной форме с указанной областью.

В настоящее время не существует эффективных способов терапевтического лечения указанных нейродегенеративных заболеваний. Таким образом, цель настоящего изобретения заключается в обеспечении композиций и способов лечения указанных нейродегенеративных заболеваний.

Сущность изобретения

В некоторых вариантах реализации предложены способы, соединения и композиции для ингибирования экспрессии мРНК и белка C9ORF72 в клетках, тканях и у животных. В некоторых вариантах реализации предложены способы, соединения и композиции для снижения уровней мРНК и белка C9ORF72 в клетках, тканях и у животных. В некоторых вариантах реализации предложены антисмысловые соединения, направленные на нуклеиновую кислоту C9ORF72. В некоторых вариантах реализации изобретения антисмысловые соединения представляют собой модифицированные олигонуклеотиды. В некоторых вариантах реализации модифицированные олигонуклеотиды являются одноцепочечными.

В некоторых вариантах реализации обеспечено снижение продуктов ассоциированной с повтором C9ORF72, не связанной с ATG трансляции (RAN-зависимой трансляции). В некоторых вариантах реализации изобретения продукты C9ORF72-ассоциированной RAN-зависимой трансляции представляют собой поли(глицин-пролин), поли(глицин-аланин) и поли(глицин-аргинин). В некоторых вариантах реализации предпочтительно сокращены некоторые варианты мРНК C9ORF72. В некоторых вариантах реализации предпочтительно сокращенные варианты мРНК C9ORF72 представляют собой варианты, процессированные из пре-мРНК, содержащей интрон 1. В некоторых вариантах реализации интрон 1 содержит экспансию гексануклеотидного повтора. В некоторых вариантах реализации предпочтительно сокращенный вариант мРНК C9ORF72 представляет собой патоген-ассоциированный вариант мРНК C9ORF72. В некоторых вариантах реализации патоген-асоциированный вариант мРНК C9ORF72 представляет собой NM_001256054.1 (SEQ ID NO: 1). В некоторых вариантах реализации экспансия гексануклеотидного повтора связана с C9ORF72-ассоциированным заболеванием. В некоторых вариантах реализации экспансия гексануклеотидного повтора связана с заболеванием, ассоциированным с экспансией гексануклеотидного повтора C9ORF72. В некоторых вариантах реализации экспансия гексануклеотидного повтора содержит по меньшей мере 30 повторов GGGGCC, более 30 повторов GGGGCC, более 100 повторов GGGGCC, более 500 повторов GGGGCC или более 1000 повторов GGGGCC. В некоторых вариантах реализации экспансия гексануклеотидного повтора ассоциирована с ядерными очагами. В некоторых вариантах реализации продукты C9ORF72-ассоциированной RAN-зависимой трансляции ассоциированы с ядерными очагами. В некоторых вариантах реализации продукты C9ORF72-ассоциированной RAN-зависимой трансляции представляют собой поли(глицин-пролин), поли(глицин-аланин) и поли(глицин-аргинин). В некоторых вариантах реализации композиции и способы, описанные в настоящем документе, пригодны для снижения уровней мРНК C9ORF72, уровней белка C9ORF72, продуктов RAN-зависимой трансляции C9ORF72 и ядерных очагов. В некоторых вариантах реализации композиции и способы, описанные в настоящем документе, пригодны для селективного сокращения патоген-ассоциированных вариантов мРНК C9ORF72. Подобные сокращения могут возникать в зависимости от времени или в зависимости от дозы.

Предложены также способы, пригодные для предупреждения, лечения, облегчения и замедления прогрессирования заболеваний, связанных с C9ORF72. В некоторых вариантах реализации указанные заболевания, связанные с C9ORF72, представляют собой нейродегенеративные заболевания. В некоторых вариантах реализации нейродегенеративное заболевание представляет собой боковой амиотрофический склероз (ALS), лобно-височную деменцию (FTD), синдром кортико-базальной дегенерации (CBD), атипический синдром паркинсонизма и оливопонтоцеребеллярную дегенерацию (OPCD).

Такие заболевания могут в совокупности иметь один или несколько факторов риска, причин или последствий. Некоторые факторы риска и причины развития нейродегенеративного заболевания и, в частности, ALS и FTD, включают генетическую предрасположенность и пожилой возраст.

В некоторых вариантах реализации изобретения способы лечения включают введение антисмыслового соединения против C9ORF72 индивидууму, нуждающемуся в этом. В некоторых вариантах реализации антисмысловое соединение представляет собой одноцепочечный модифицированный олигонуклеотид. В некоторых вариантах реализации одноцепочечный модифицированный олигонуклеотид комплементарен нуклеиновой кислоте C9ORF72.

Подробное описание изобретения

Следует понимать, что изложенное выше общее описание и следующее подробное описание являются лишь примерными и пояснительными, и не являются ограничивающими заявленное изобретение. В данном документе использование единственного числа включает множественное число, если специально не указано иное. В данном контексте термин «или» означает «и/или», если не указано иное. Кроме того, в данном контексте применение термина «и» означает «и/или», если не указано иное. Кроме того, использование термина «включающий», а также других форм, таких как «включает» и «включенный», не является ограничивающим. Также, такие термины как «элемент» или «компонент» охватывают как элементы и компоненты, содержащие одну единицу, так и элементы и компоненты, которые содержат более одной субъединицы, если специально не указано иное.

Соединения согласно настоящему изобретению включают разновидности описанных соединений, в которых один или более атомов водорода, углерода, азота, кислорода или серы заменен на стабильный изотоп того же элемента.

Названия разделов, используемые в настоящем документе, предназначены лишь для организационных целей, и их не следует толковать как ограничение описанного объекта изобретения. Все документы или фрагменты документов, цитируемые в настоящем изобретении, включая, но не ограничиваясь ими, патенты, патентные заявки, опубликованные патентные заявки, статьи, книги, монографии и учетные номера GENBANK, а также информацию об ассоциированной последовательности, получаемую посредством баз данных, таких как Национальный центр информации по биотехнологии (NCBI), и другие данные, указанные в в тексте настоящего описания, явным образом включены в настоящий документ посредством ссылки в отношении тех фрагментов документов, которые рассмотрены в настоящем документе, а также в полном объеме.

Определения

При отсутствии конкретных определений, номенклатура, используемая в связи с ними, а также в связи с приемами и методиками аналитической химии, синтетической органической химии, а также медицинской и фармацевтической химии, описанная в настоящем документе, является общеизвестной и общепринятой в данной области техники. Для химического синтеза и химического анализа могут быть использованы стандартные методы.

Если не указано иное, следующие термины имеют следующие значения:

«2'-O-метоксиэтил» (также 2'-МОЕ и 2'-ОСН2СН2-ОСН3 и МОЕ) относится к О-метоксиэтильной модификации в 2' положении фуранозного кольца. 2'-O-метоксиэтил-модифицированный сахар представляет собой модифицированный сахар.

«2'-МОЕ нуклеозид» (также 2'-O-метоксиэтил-нуклеозид) означает нуклеозид, содержащий модифицированный МОЕ фрагмент сахара.

«2'-замещенный нуклеозид» означает нуклеозид, содержащий отличный от Н или ОН заместитель в 2'-положении фуранозного кольца. В некоторых вариантах реализации 2'-замещенные нуклеозиды включают нуклеозиды с бициклическими сахарными модификациями.

«5-Метилцитозин» обозначает цитозин, модифицированный метильной группой, присоединенной в 5' положении. 5-Метилцитозин представляет собой модифицированное нуклеиновое основание.

«Вводят совместно» относится к совместному введению двух фармацевтических агентов любым способом, при котором фармакологические эффекты обоих проявляются у пациента одновременно. Совместное применение не требует, чтобы оба фармацевтических агента вводились в одной фармацевтической композиции, в одной лекарственной форме или одним способом введения. Эффекты обоих фармацевтических агентов не обязательно должны проявляться одновременно. Эффекты должны только перекрываться в промежутке времени и не обязательно должны иметь одинаковую продолжительность.

«Введение» означает обеспечение фармацевтическим агентом животного и включает, но не ограничивается этим, введение медицинским работником и самостоятельное введение.

«Улучшение» относится к уменьшению, замедлению, остановке или инвертированному течению по меньшей мере одного показателя тяжести состояния или заболевания. Степень тяжести показателей может быть определена субъективными или объективными показателями, которые известны специалистам в данной области техники.

«Животное» относится к человеку или животному, которое не является человеком, включая, но не ограничиваясь ими, мышей, крыс, кроликов, собак, кошек, свиней и приматов, включая, но не ограничиваясь ими, обезьян и шимпанзе.

«Антитело» относится к молекуле, характеризующейся специфическим взаимодействием с антигеном каким-либо образом, при этом антитело и антиген определены относительно друг друга. Антитело может относиться к целой молекуле антитела, или какому-либо ее фрагменту или области, такой как тяжелая цепь, легкая цепь, область Fab и область Fc.

«Антисмысловая активность» означает любую обнаруживаемую или поддающуюся измерению активность, обусловленную гибридизацией антисмыслового соединения с его нуклеиновой кислотой-мишенью. В неких вариантах реализации изобретения антисмысловая активность представляет собой уменьшение количества или экспрессии нуклеиновой кислоты-мишени или белка, кодируемого такой нуклеиновой кислотой-мишенью.

«Антисмысловое соединение» означает олигомерное соединение, которые способно гибридизоваться с целевой нуклеиновой кислотой посредством водородной связи. Примеры антисмысловых соединений включают одноцепочечные и двухцепочечные соединения, такие как антисмысловые олигонуклеотиды, миРНК, мшРНК, оцРНК и соединения на их основе.

«Антисмысловое ингибирование» означает снижение уровней целевой нуклеиновой кислоты в присутствии антисмыслового соединения комплементарного целевой нуклеиновой кислоте по сравнению с уровнями целевой нуклеиновой кислоты или в отсутствие антисмыслового соединения.

«Антисмысловые механизмы» представляют собой все те механизмы гибридизации соединения с целевой нуклеиновой кислотой, отличающиеся тем, что результат или эффект гибридизации или целевой деградации, или целевой занятости с сопутствующей остановкой клеточных механизмов, при участии, например, транскрипции или сплайсинга.

«Антисмысловой олигонуклеотид» означает одноцепочечный олигонуклеотид, содержащий последовательности, обеспечивающие гибридизацию соответствующему сегменту целевой нуклеиновой кислоты.

«Комплементарность основания» относится к способности спаривания конкретной пары нуклеиновых оснований антисмыслового олигонуклеотида с соответствующими нуклеиновыми основаниями в нуклеиновой кислоте-мишени (т.е. гибридизации), опосредованной уотсон-криковским, хугстиновским или обратным хугстиновским водородным связыванием между соответствующими нуклеиновыми основаниями.

«Бициклический сахар» означает фуранозное кольцо, модифицированное образованием мостика между двумя атомами. Бициклический сахар представляет собой модифицированный сахар.

«Бициклический нуклеозид» (также БНК) означает нуклеозид, содержащий фрагмент сахара, содержащий мостик, соединяющий два атома углерода сахарного кольца, в результате чего образуется бициклическая кольцевая система. В некоторых вариантах реализации, мостик соединяет 4'-углерод и 2'-углерод сахарного кольца.

«Антисмысловой транскрипт C9ORF72» означает транскрипты, полученные из некодирующей цепи (также антисмысловой цепи и матричной цепи) гена C9ORF72. Антисмысловой транскрипт C9ORF72 отличается от канонически транскрибированного «смыслового транскрипта C9ORF72», который образуется из кодирующей цепи (также смысловой цепи) гена C9ORF72. В некоторых вариантах реализации антисмысловой транскрипт C9ORF72 представляет собой SEQ ID NO: 18.

«Специфический ингибитор антисмыслового транскрипта C9ORF72» относится к любому агенту, способному специфически ингибировать экспрессию антисмыслового транскрипта C9ORF72 и/или продукты его экспрессии на молекулярном уровне. В данном контексте «специфический» означает снижение или ингибирование экспрессии антисмыслового транскрипта C9ORF72 без существенного снижения нецелевого транскрипта (например, специфический ингибитор антисмыслового транскрипта C9ORF72 снижает экспрессию антисмыслового транскрипта C9ORF72, но существенно не снижает экспрессию смыслового транскрипта C9ORF72). Специфические ингибиторы антисмыслового транскрипта C9ORF72 включают антисмысловые соединения, миРНК, аптамеры, антитела, пептиды, низкомолекулярные соединения и другие агенты, способные ингибировать экспрессию антисмыслового транскрипта C9ORF72 и/или продукты его экспрессии, такие как продукты RAN-зависимой трансляции, ассоциированной с антисмысловым транскриптом C9ORF72.

«Связанное с C9ORF72 заболевание» обозначает любое заболевание, связанное с любой нуклеиновой кислотой C9ORF72 или продуктом ее экспрессии. Такие заболевания могут включать нейродегенеративное заболевание. Такие нейродегенеративные заболевания могут включать ALS и FTD. В некоторых вариантах реализации заболевание, связанное с C9ORF72, вызвано (или ассоциировано с) экспансией гексануклеотидного повтора. В некоторых вариантах реализации экспансия гексануклеотидного повтора может содержать GGGGCC, GGGGGG, GGGGGC или GGGGCG, повторяющиеся по меньшей мере 30 раз, более 30 раз, более 100 раз, более 500 раз или более 1000 раз.

«Продукты C9ORF72-ассоциированной RAN-зависимой трансляции» означают аберрантные пептидные или дипептидные полимеры, транслированные посредством RAN-трансляции (т.е. ассоциированной с повтором и не зависимой от ATG трансляции). В некоторых вариантах реализации продукты C9ORF72- ассоциированной RAN-зависимой трансляции представляют собой любой из поли(глицин-пролина), поли(глицин-аланина) и поли(глицин-аргинина).

«Нуклеиновая кислота C9ORF72» означает любую нуклеиновую кислоту, кодирующую C9ORF72. Например, в некоторых вариантах реализации изобретения нуклеиновая кислота C9ORF72 включает последовательность ДНК, кодирующую C9ORF72, последовательность РНК, транскрибированную из ДНК, кодирующей C9ORF72, в том числе, геномной ДНК, содержащей интроны и экзоны (т.е. пре-мРНК), и последовательность мРНК, кодирующую C9ORF72. «мРНК C9ORF72» обозначает мРНК, кодирующую белок C9ORF72.

«Патоген-ассоциированный вариант мРНК C9ORF72» означает вариант мРНК C9ORF72, процессированный из варианта пре-мРНК C9ORF72, содержащего гексануклеотидный повтор. Пре-мРНК C9ORF72 содержит гексануклеотидный повтор, если транскрипция пре-мРНК начинается в области от сайта инициации экзона 1А к сайту инициации экзона 1В, например, с 1107 по 1520 нуклеотиды геномной последовательности (SEQ ID NO: 2, комплемент номера доступа GENBANKNT_008413.18, усеченной по нуклеозидам с 27535000 по 27565000). В некоторых вариантах реализации измеряют уровень патоген-ассоциированного варианта мРНК C9ORF72 для определения уровня пре-мРНК C9ORF72, содержащей гексануклеотидный повтор, в образце.

«Специфический ингибитор C9ORF72 «относится к любому агенту, способному специфически ингибировать экспрессию мРНК C9ORF72 и/или белка C9ORF72 на молекулярном уровне. Например, специфические ингибиторы C9ORF72 включают нуклеиновые кислоты (включая антисмысловые соединения), миРНК, аптамеры, антитела, пептиды, низкомолекулярные соединения и другие агенты, способные ингибировать экспрессию мРНК C9ORF72 и/или белка C9ORF72. Аналогичным образом, в некоторых вариантах реализации изобретения специфические ингибиторы C9ORF72 могут влиять на другие молекулярные процессы у животного.

«Кэп-структура» или «кэп-терминальный фрагмент» означает химические модификации, которые были сделаны на любом конце антисмыслового соединения.

«cEt» или «стерически затрудненный этил» означает бициклический нуклеозид, содержащий фрагмент сахара, содержащий мостик, соединяющий 4'-углерод и 2'-углерод, причем мостик имеет формулу: 4'-СН(СН3)-O-2'.

«Нуклеозид со стерически затрудненным этилом» (также cEt нуклеозид) означает нуклеозид, содержащий бициклический фрагмент сахара, содержащий 4'-СН(СН3)-O-2' мостик.

«Химически отличная область» означает область антисмыслового соединения, которая некоторым образом химически отличается от другой области того же антисмыслового соединения. Например, область, содержащая 2'-O-метоксиэтил-нуклеозиды, химически отличается от области, содержащей нуклеозиды без 2'-O-метоксиэтильных модификаций.

«Химерное антисмысловое соединение» означает антисмысловое соединение, которое имеет по меньшей мере две химически различные области, каждая позиция имеет множество субъединиц.

«Совместное введение» означает введение индивидууму двух или более фармацевтических агентов. Два или более фармацевтических агентов могут быть в одной фармацевтической композиции или могут быть в отдельных фармацевтических композициях. Каждый из двух или более фармацевтических агентов может быть введен таким же или другим способом введения. Совместное введение включает параллельное или последовательное введение.

«Комплементарность» означает способность к спариванию нуклеиновых оснований первой нуклеиновой кислоты и второй нуклеиновой кислоты.

«Включать», «включает» и «включающий» следует понимать как включение указанной стадии или элемента, или группы элементов или стадий, но не исключение любого другого элемента или стадии, или группы стадий или элементов.

«Смежные нуклеиновые основания» означают нуклеиновые основания, непосредственно примыкающие друг к другу.

«Конструирование» или «сконструированный для» относиться к процессу конструирования олигомерного соединения, которое специфически гибридизуется с выбранной молекулой нуклеиновой кислоты.

«Разбавитель» означает ингредиент в композиции, который не обладает фармакологической активностью, но необходим или желателен с фармацевтической точки зрения. Например, в препаратах, которые вводят парентерально, разбавитель может быть жидкостью, например, солевым раствором.

«Доза» означает количество указанного фармацевтического агента, обеспечиваемое за одно введение или за определенный период времени. В некоторых вариантах реализации доза может быть введена в виде одного, двух или более болюсов, таблеток или инъекций. Например, в определенных вариантах реализации, где необходимо подкожное введение, нужная доза требует объема, который не помещается в одной инъекции, поэтому для достижения желаемой дозы могут быть использованы две или более инъекций. В некоторых вариантах реализации изобретения фармацевтический агент вводят путем инфузии в течение длительного периода времени или непрерывно. Дозы могут быть указаны как количество фармацевтического агента в час, день, неделю, или месяц.

«Эффективное количество» в контексте модулирования активности или лечения или предупреждения состояния, означает введение данного количества фармацевтического агента субъекту, нуждающемуся в такой модуляции, лечении или профилактике, или в однократной дозе или как часть серии, которое является эффективным для модуляции данного эффекта, или для лечения или профилактики или улучшения данного состояния. Эффективное количество может варьировать среди индивидуумов в зависимости от здоровья и физического состояния индивидуума, подлежащего лечению, таксономической группы индивидуумов, подлежащих лечению, рецептуры композиции, оценки индивидуального состояния здоровья и других релевантных факторов.

«Эффективность» означает способность производить желаемый эффект.

«Экспрессия» включает в себя все функции, благодаря которым информация, закодированная в гене, преобразуется в структуры, присутствующие и функционирующие в клетке. Такие структуры включают, но не ограничиваются ими, продукты транскрипции и трансляции.

«Очаг» или «очаги» означает ядерное или цитоплазматическое тело, содержащее транскрипт C9ORF72. В некоторых вариантах реализации очаг содержит по меньшей мере один транскрипт C9ORF72. В некоторых вариантах реализации очаги C9ORF72 содержат транскрипты, содержащие любой из следующих гексануклеотидных повторов: GGGGCC, GGGGGG, GGGGGC и/или GGGGCG.

«Полностью комплементарный» или «100% комплементарный» означает, что каждое нуклеиновое основание первой нуклеиновой кислоты имеет комплементарное нуклеиновое основание во второй нуклеиновой кислоте. В некоторых вариантах реализации первая нуклеиновая кислота представляет собой антисмысловое соединение, а нуклеиновая кислота-мишень представляет собой вторую нуклеиновую кислоту.

«Гэпмер» означает химерное антисмысловое соединение, в котором внутренняя область, имеющая множество нуклеозидов, которые поддерживают расщепление РНКазой Н, располагается между внешними областями, имеющими один или более нуклеозидов, причем нуклеозиды, составляющие внутреннюю область, химически отличаются от нуклеозида или нуклеозидов, составляющих внешние области. Внутренняя область может быть описана как «гэп», а внешние области могут быть описаны как «крылья».

«Экспансия гексануклеотидного повтора» означает серию из шести оснований (например, GGGGCC, GGGGGG, GGGGCG или GGGGGC), повторяющуюся по меньшей мере дважды. В некоторых вариантах реализации экспансия гексануклеотидного повтора может быть расположена в интроне 1 нуклеиновой кислоты C9ORF72. В некоторых вариантах реализации патогенная экспансия гексануклеотидного повтора содержит по меньшей мере 30, более 30, более 100, более 500 или более 1000 повторов GGGGCC, GGGGGG, GGGGCG или GGGGGC в нуклеиновой кислоте C9ORF72 и ассоциирована с заболеванием. В некоторых вариантах реализации указанные повторы являются последовательными. В некоторых вариантах реализации указанные повторы прерваны 1 или более нуклеиновыми основаниями. В некоторых вариантах реализации экспансия гексануклеотидного повтора дикого типа содержит 23 или менее повторов GGGGCC, GGGGGG, GGGGCG или GGGGGC в нуклеиновой кислоте C9ORF72. В некоторых вариантах реализации указанные повторы являются последовательными. В некоторых вариантах реализации указанные повторы прерваны 1 или более нуклеиновыми основаниями.

«Гибридизация» означает соединение комплементарных молекул нуклеиновых кислот. В некоторых вариантах реализации комплементарные молекулы нуклеиновых кислот включают, но не ограничиваются ими, антисмысловое соединение и нуклеиновую кислоту-мишень. В некоторых вариантах реализации комплементарные молекулы нуклеиновых кислот включают, но не ограничиваются ими, антисмысловой олигонуклеотид и нуклеиновую кислоту-мишень.

«Идентификация животного, имеющего C9ORF72-ассоциированное заболевание» означает определение животного, которому поставлен диагноз C9ORF72-ассоциированного заболевания, или которое предрасположено к развитию C9ORF72-ассоциированного заболевания. Индивидуумы, предрасположенные к развитию C9ORF72-ассоциированного заболевания, включают тех, у кого присутствуют один или более факторов риска развития C9ORF72-ассоциированного заболевания, включая личный или семейный анамнез или генетическую предрасположенность к одному или более C9ORF72-ассоциированным заболеваниям. Такая идентификация может быть выполнена любым способом, включая оценку истории болезни человека и стандартными клиническими испытаниями или оценками, такими как генетическое тестирование.

«Непосредственно примыкающий» означает, что нет никаких промежуточных элементов между непосредственно примыкающими элементами.

«Индивидуум» означает человека или животное, не являющееся человеком, выбранное для лечения или терапии.

«Ингибирование C9ORF72» обозначает снижение уровня или экспрессии мРНК и/или белка C9ORF72. В некоторых вариантах реализации изобретения уровни мРНК и/или белка C9ORF72 ингибируются в присутствии антисмыслового соединения, нацеленного на C9ORF72, включая антисмысловой олигонуклеотид, нацеленный на C9ORF72, по сравнению с экспрессией мРНК и/или уровнями белка C9ORF72 в отсутствие антисмыслового соединения против C9ORF72, такого как антисмысловой олигонуклеотид.

«Ингибирование экспрессии или активности» означает снижение или блокаду экспрессии или активности и не обязательно говорит о полном прекращении экспрессии или активности.

«Межнуклеозидная связь» означает химическую связь между нуклеозидами.

«Связанные нуклеозиды» означают соседние нуклеозиды, связанные между собой межнуклеозидной связью.

«Заблокированная нуклеиновая кислота» или «ЗНК» или «ЗНК нуклеозид» означает, что мономеры нуклеиновой кислоты имеют мостик, соединяющий два атома углерода между 4' и 2' положениями сахарной части нуклеозида, тем самым образуя бициклический сахар. Примеры такого бициклического сахара включают, но не ограничиваются ими, А) α-L-метиленокси (4'-СН2-O-2') ЗНК, (В) β-D-метиленокси (4'-СН2-O-2') ЗНК, (С) этиленокси (4'-(СН2)2-O-2') ЗНК, (D) аминоокси (4'-СН2-O-N(R)-2') ЗНК и (Е) оксиамино (4'-СН2-N(R)-O-2') ЗНК, как показано ниже.

В данном контексте соединения ЗНК включают, но не ограничиваются ими, соединения, имеющие по меньшей мере один мостик между 4' и 2' положениями сахара, причем каждый из мостиков независимо содержит 1 или от 2 до 4 связанных групп, независимо выбранных из -[C(R1)(R2)]n-, -C(R1)=C(R2)-, -C(R1)=N-, -C(=NR1)-, -C(=O)-, -C(=S)-, -O-, -Si(R1)2-, -S(=O)x- и -N(R1)-; где: x равен 0, 1 или 2; n равен 1, 2, 3 или 4; каждый R1 и R2 независимо представляет собой Н, защитную группу, гидроксилный радикал, С112 алкильный радикал, замещенный С112 алкильный радикал, С212 алкенильный радикал, замещенный С212 алкенильный радикал, C2-C12 алкинильный радикал, замещенный С212 алкинильный радикал, С520 арильный радикал, замещенный С520 арильный радикал, гетероциклический радикал, замещенный гетероциклический радикал, гетероарильный радикал, замещенный гетероарильный радикал, С57 алициклический радикал, замещенный С57 алициклический радикал, галоген, OJ1, NJ1J2, SJ1, N3, COOJ1, ацильный радикал (С(=O)-Н), замещенный ацильный радикал, CN, сульфонильный радикал (S(=O)2-J1) или сульфоксильный радикал (S(=O)-J1); и каждый J1 and J2 независимо представляет собой Н, С1-C12 алкильный радикал, замещенный С112 алкильный радикал, С212 алкенильный радикал, замещенный С212 алкенильный радикал, С212 алкинильный радикал, замещенный С212 алкинильный радикал, С520 арильный радикал, замещенный С520 арильный радикал, ацильный радикал (С(=O)-Н), замещенный ацильный радикал, гетероциклический радикал, замещенный гетероциклический радикал, С112 аминоалкильный радикал, замещенный С112 аминоалкильный радикал или защитную группу.

Примеры 4'-2' мостиковых групп, входящих в определение ЗНК, включают, но не ограничиваются ими, одну из формул: -[C(R1)(R2)]n-, -[C(R1)(R2)]n-O-, -C(R1R2)-N(R1)-О- или -C(R1R2)-O-N(R1)-. Кроме того, другие мостиковые группы, входящие в определение ЗНК, представляют собой мостики 4'-СН2-2', 4'-(СН2)2-2', 4'-(СН2)3-2', 4'-СН2-O-2', 4'-(СН2)2-O-2', 4'-СН2-O-N(R1)-2' и 4'-СН2-N(R1)-O-2'-, где каждый R1 и R2 независимо представляет собой Н, защитную группу или C112 алкильный радикал.

Также в определение ЗНК согласно настоящему изобретению включены ЗНК, в которых 2'-гидроксильная группа рибозильного сахарного кольца соединена с 4' атомом углерода сахарного кольца, с образованием таким образом метиленоксильного мостика (4'-СН2-O-2'), формируя бициклический фрагмент сахара. Мостик также может быть метиленовой группой (-СН2-), соединяющей атом кислорода 2' и атом углерода 4', для которой используется термин метиленокси (4'-СН2-O-2') ЗНК. Кроме того, в случае бициклического фрагмента сахара, содержащего группу этиленового мостика в данном положении, применяется термин этиленокси (4'-СН2СН2-O-2') ЗНК. α-L-метиленокси (4'-СН2-O-2'), изомер метиленокси (4'-СН2-O-2') ЗНК, также попадает под определение ЗНК в данном контексте.

«Несоответствие» или «некомплементарное нуклеиновое основание» относится к случаю, когда нуклеиновое основание первой нуклеиновой кислоты не способно связываться с соответствующим нуклеиновым основанием второй или нуклеиновой кислоты-мишени.

«Модифицированная межнуклеозидная связь» относится к замене или любому изменению природной межнуклеозидной связи (т.е. фосфодиэфирной межнуклеозидной связи).

«Модифицированное нуклеиновое основание» означает любое нуклеиновое основание, отличное от аденина, цитозина, гуанина, тимидина или урацила. «Немодифицированное нуклеиновое основание» означает пуриновые основания аденин (А) и гуанин (G), и пиримидиновые основания тимин (Т), цитозин (С) и урацил (U).

«Модифицированный нуклеозид» обозначает нуклеозид, содержащий независимо модифицированный фрагмент сахара и/или модифицированное нуклеиновое основание.

«Модифицированный нуклеотид» означает нуклеотид, содержащий независимо модифицированный фрагмент сахара, модифицированную межнуклеозидную связь и/или модифицированное нуклеиновое основание.

«Модифицированный олигонуклеотид» обозначает олигонуклеотид, содержащий по меньшей мере одну модифицированную межнуклеозидную связь, модифицированный сахар и/или модифицированное нуклеиновое основание.

«Модифицированный сахар» означает замещение и/или изменение любого из природных фрагментов сахаров.

«Мономер» означает одно звено олигомера. Мономеры включают, но не ограничиваются ими, нуклеозиды и нуклеотиды, природные или модифицированные.

«Мотив» означает конфигурацию из немодифицированных и модифицированных нуклеозидов в антисмысловом соединении.

«Природный фрагмент сахара» означает фрагмент сахара, находящийся в ДНК (2'-Н) или РНК (2'-ОН).

«Природная межнуклеозидная связь» означает 3'-5' фосфодиэфирную связь.

«Некомплементарное нуклеиновое основание» относится к паре нуклеиновых оснований нуклеиновых кислот, которые не образуют водородных связей друг с другом или иным образом не поддерживают гибридизацию.

«Нуклеиновая кислота» означает молекулы, состоящие из мономерных нуклеотидов. Нуклеиновая кислота включает, но не ограничивается ими, рибонуклеиновые кислоты (РНК), дезоксирибонуклеиновые кислоты (ДНК), одноцепочечные нуклеиновые кислоты, двуцепочечные нуклеиновые кислоты, малые интерферирующие рибонуклеиновые кислоты (миРНК) и микроРНК.

«Нуклеиновое основание» означает гетероциклический фрагмент, способный спариваться с основанием другой нуклеиновой кислоты.

«Комплементарность нуклеиновых оснований» означает нуклеиновое основание, способное спариваться с другим нуклеиновым основанием. Например, в ДНК аденин (А) комплементарен тимину (Т). Например, в РНК аденин (А) комплементарен урацилу (U). В некоторых вариантах реализации изобретения комплементарное нуклеиновое основание означает нуклеиновое основание антисмыслового соединения, способное спариваться с нуклеиновым основанием его нуклеиновой кислоты-мишени. Например, если нуклеиновое основание в определенном положении антисмыслового соединения способно к водородному связыванию с нуклеиновым основанием в определенном положении нуклеиновой кислоты-мишени, то это положение водородного связывания между олигонуклеотидом и нуклеиновой кислотой-мишенью считается комплементарным по этой паре нуклеиновых оснований.

«Последовательность нуклеиновых оснований» означает порядок смежных нуклеиновых оснований, независимый от любой модификации сахара, связи или нуклеинового основания.

«Нуклеозид» означает нуклеиновое основание, связанное с сахаром.

«Миметик нуклеозида» включает структуры, используемые для замены сахара или сахара и основания и необязательно связи в одном или нескольких положениях олигомерного соединения, например, такие как миметики нуклеозидов, содержащие морфолиновые, циклогексениловые, циклогексиловые, тетрагидропираниловые, бициклические или трициклические сахарные миметики, например, нефуранозные сахарные звенья. Миметик нуклеотида включает структуры, используемые для замены нуклеозида и связи в одном или более положениях олигомерного соединения, такие как, например, пептидные нуклеиновые кислоты или морфолины (морфолины, связанные -N(H)-C(=O)-O- или другой нефосфодиэфирной связью). Заменитель сахара пересекается с более широким термином нуклеозид-миметик, но предназначен для обозначения замены только сахарной части (фуранозного кольца). Тетрагидропираниловые кольца, представленные в настоящем документе, иллюстрируют пример заменителя сахара, в котором фуранозная группа сахара заменена тетрагидропираниловой кольцевой системой. «Миметик» относится к группам, которые заменяют сахар, нуклеиновое основание и/или межнуклеозидную связь. Как правило, миметик используют вместо сахара или комбинации сахара с межнуклеозидной связью, а нуклеиновое основание сохраняется для гибридизации с выбранной мишенью.

«Нуклеотид» означает нуклеозид, содержащий фосфатную группу, ковалентно связанную с сахарной частью нуклеозида.

«Нецелевой эффект» означает нежелательный или вредный биологический эффект, связанный с модуляцией экспрессии РНК или белка гена, отличного от нуклеиновой кислоты-мишени.

«Олигомерное соединение» или «олигомер» означает полимер из связанных мономерных субъединиц, которые способны к гибридизации с по меньшей мере областью молекулы нуклеиновой кислоты.

«Олигонуклеотид» означает полимер из связанных нуклеозидов, каждый из которых может быть модифицированным или немодифицированным, независимо друг от друга.

«Парентеральное введение» означает введение путем инъекций (например, болюсная инъекция) или инфузии. Парентеральное введение включает подкожное введение, внутривенное введение, внутримышечное введение, внутриартериальное введение, внутрибрюшинное введение или внутричерепное введение, например, интратекальное или интрацеребровентрикулярное введение.

«Пептид» означает, что молекула образуется путем связывания по меньшей мере двух аминокислот посредством амидных связей. Без ограничений, в данном контексте пептид относится к полипептидам и белкам.

«Фармацевтический агент» означает вещество, которое обеспечивает терапевтический эффект при введении индивидууму. Например, в некоторых вариантах реализации изобретения антисмысловой олигонуклеотид, нацеленный на C9ORF72, представляет собой фармацевтический агент.

«Фармацевтически приемлемое производное» включает фармацевтически приемлемые соли, конъюгаты, пролекарства или изомеры соединений, описанных в настоящем документе.

«Фармацевтически приемлемые соли» обозначает физиологически и фармацевтически приемлемые соли антисмысловых соединений, т.е. соли, которые сохраняют желательную биологическую активность исходного олигонуклеотида и не вызывают нежелательных токсикологических эффектов.

«Тиофосфатная связь» означает связь между нуклеозидами, в которой фосфодиэфирная связь модифицирована путем замены одного из не образующих мостик атомов кислорода на атом серы. Тиофосфатная связь представляет собой модифицированную межнуклеозидную связь.

«Часть» означает определенное количество смежных (т.е. связанных) нуклеиновых оснований нуклеиновой кислоты. В некоторых вариантах реализации часть представляет собой определенное количество смежных нуклеиновых оснований нуклеиновой кислоты-мишени. В некоторых вариантах реализации часть представляет собой определенное количество смежных нуклеиновых оснований антисмыслового соединения.

«Предупреждать» или «предупреждение» относится к задержке или предотвращению появления или развития заболевания, расстройства или патологического состояния в течение периода времени от нескольких минут до дней, недель или месяцев, или на неопределенный срок.

«Пролекарство» означает терапевтический агент, который получен в неактивной форме, которая преобразуется в активную форму в организме или его клетках под действием эндогенных ферментов или других химических веществ или условий.

«Профилактически эффективное количество» означает такое количество фармацевтического агента, которое обеспечивает профилактический или превентивный эффект для животного.

«Область» определяют как фрагмент нуклеиновой кислоты-мишени, имеющий по меньшей мере одну идентифицируемую структуру, функцию или характеристику.

«Рибонуклеотид» означает нуклеотид, имеющий гидрокси-группу в 2' положении сахарной части нуклеотида. Рибонуклеотиды могут быть модифицированы с помощью любого из множества заместителей.

«Соли» означает физиологически и фармацевтически приемлемые соли антисмысловых соединений, т.е. соли, которые сохраняют требуемую биологическую активность исходного олигонуклеотида и не вызывают нежелательных токсикологических эффектов.

«Сегменты» определяют как меньшие или субфрагменты областей в составе нуклеиновой кислоты-мишени.

«Укороченные» или «усеченные» версии антисмысловых олигонуклеотидов представленные в настоящем документе имеющие один, два или более удаленных нуклеозида.

«Побочные эффекты» означают отличающиеся от желаемых физиологические ответы, приписываемые лечению. В некоторых вариантах реализации побочные эффекты включают, без ограничения, реакции в месте инъекции, аномалии функциональных проб печени, отклонения в функциях почек, гепатотоксичность, нефротоксичность, аномалии центральной нервной системы и миопатии.

«Одноцепочечный олигонуклеотид» означает олигонуклеотид, который не гибридизуется с комплементарной цепью. «Одноцепочечный модифицированный олигонуклеотид» означает модифицированный олигонуклеотид, который не гибридизуется с комплементарной цепью.

«Сайты» в данном контексте определяют как уникальные положения нуклеиновых оснований в нуклеиновой кислоте-мишени.

«Замедляет прогрессирование» означает ослабление развития указанного заболевания.

«Специфично гибридизуется» обозначает антисмысловое соединение, обладающее достаточной степенью комплементарности между антисмысловым олигонуклеотидом и нуклеиновой кислотой-мишенью, чтобы вызывать желаемый эффект, минимально или никак не влияния на нецелевые нуклеиновые кислоты в условиях, в которых специфическое связывание является желательным, т.е. в физиологических условиях в случае анализов in vivo и терапевтического лечения.

«Строгие условия гибридизации» или «жесткие условия» означают условия, при которых олигомерное соединение гибридизуется со своей целевой последовательностью, но с минимальным количеством других последовательностей.

«Субъект» означает человека или животного, не являющегося человеком, выбранного для лечения или терапии.

«Целевой» относится к белку, модуляция которого является желательной.

«Ген-мишень» означает ген, кодирующий белок-мишень.

«Нацеливание» или «нацеленный» означает процесс конструирования и выбора антисмыслового соединения, которое будет специфически гибридизоваться с целевой нуклеиновой кислотой и вызывать требуемый эффект.

«Целевая нуклеиновая кислота», «целевая РНК» и «целевой РНК транскрипт» и «нуклеиновые кислоты-мишени» означает нуклеиновую кислоту, способную стать мишенью для антисмысловых соединений.

«Область-мишень» означает фрагмент нуклеиновой кислоты-мишени, на который нацелено одно или более антисмысловых соединений.

«Сегмент-мишень» означает последовательность нуклеотидов нуклеиновой кислоты-мишени, на которую нацелено антисмысловое соединение. «5' сайт-мишень» относится к крайнему 5' нуклеотиду сегмента-мишени. «3' сайт-мишень» относится к крайнему 3' нуклеотиду сегмента-мишени.

«Терапевтически эффективное количество» означает количество фармацевтического агента, которое обеспечивает терапевтический эффект для индивидуума.

«Лечить» или «лечение», или «терапия» обозначает введение композиции с целью достижения изменения или облегчения заболевания или патологического состояния.

«Немодифицированные нуклеиновые основания» означает пуриновые основания: аденин (А) и гуанин (G), и пиримидиновые основания: тимин (Т), цитозин (С) и урацил (U).

«Немодифицированный нуклеотид» означает нуклеотид, состоящий из природных нуклеиновых оснований, фрагментов сахаров и межнуклеозидных связей. В некоторых вариантах реализации изобретения немодифицированный нуклеотид представляет собой РНК нуклеотид (т.е. β-D-рибонуклеозид) или ДНК нуклеотид (т.е., β-D-дезоксирибонуклеозид).

«Сегмент крыла» означает множество нуклеозидов, модифицированных для придания олигонуклеотиду свойств, таких как усиленная ингибирующая активность, повышенная аффинность связывания с нуклеиновой кислотой-мишенью или устойчивость к разложению нуклеазами in vivo.

Некоторые варианты реализации изобретения

В некоторых вариантах реализации предложены композиции и способы снижения общей экспрессии мРНК и белка C9ORF72.

В некоторых вариантах реализации предложены композиции и способы для снижения патоген-ассоциированных вариантом мРНК C9ORF72.

В некоторых вариантах реализации предложены способы лечения, предупреждения, облегчения или замедления прогрессирования заболеваний, связанных с C9ORF72, у индивидуума, нуждающегося в этом. Предусмотрены также способы получения лекарственного средства для лечения, предупреждения или облегчения заболевания, связанного с C9ORF72. C9ORF72-ассоциированные заболевания включают нейродегенеративные заболевания. В некоторых вариантах реализации нейродегенеративное заболевание может представлять собой ALS или FTD. В некоторых вариантах реализации нейродегенеративное заболевание может быть наследственным или спорадическим.

В настоящем описании предложены следующие неограничивающие нумерованные варианты реализации:

Вариант реализации 1. Соединение, содержащее модифицированный олигонуклеотид, состоящий из 12-30 связанных нуклеозидов и имеющий последовательность нуклеиновых оснований, содержащую по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 11, по меньшей мере 12, по меньшей мере 13, по меньшей мере 14, по меньшей мере 15, по меньшей мере 16, по меньшей мере 17, по меньшей мере 18, по меньшей мере 19 или по меньшей мере 20 последовательных нуклеиновых оснований любой из последовательностей нуклеиновых оснований SEQ ID NO: 22-55.

Вариант реализации 2. Соединение по варианту реализации 1, отличающееся тем, что последовательность нуклеиновых оснований модифицированного олигонуклеотида по меньшей мере на 80%, по меньшей мере на 81%, по меньшей мере на 82%, по меньшей мере на 83%, по меньшей мере на 84%, по меньшей мере на 85%, по меньшей мере на 86%, по меньшей мере на 87%, по меньшей мере на 88%, по меньшей мере на 89%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98%, по меньшей мере на 99% или 100% комплементарна SEQ ID NO: 1 или SEQ ID NO: 2.

Вариант реализации 3. Соединение по вариантам реализации 1 и 2, отличающееся тем, что модифицированный олигонуклеотид представляет собой одноцепочечный модифицированный олигонуклеотид.

Вариант реализации 4. Соединение по любому из вариантов реализации 1-3, отличающееся тем, что модифицированный олигонуклеотид содержит по меньшей мере одну модифицированную межнуклеозидную связь.

Вариант реализации 5. Соединение по варианту реализации 4, отличающееся тем, что по меньшей мере одна модифицированная межнуклеозидная связь представляет собой тиофосфатную межнуклеозидную связь.

Вариант реализации 6. Соединение по любому из вариантов реализации 4 и 5, отличающееся тем, что модифицированный олигонуклеотид содержит по меньшей мере одну фосфодиэфирную связь.

Вариант реализации 7. Соединение по варианту реализации 5, отличающееся тем, что каждая модифицированная межнуклеозидная связь представляет собой тиофосфатную межнуклеозидную связь.

Вариант реализации 8. Соединение по любому из вариантов реализации 1-7, отличающееся тем, что по меньшей мере один нуклеозид содержит модифицированное нуклеиновое основание.

Вариант реализации 9. Соединение по варианту реализации 8, отличающееся тем, что модифицированное нуклеиновое основание представляет собой 5-метилцитозин.

Вариант реализации 10. Соединение по любому из вариантов реализации 1-9, отличающееся тем, что по меньшей мере один нуклеозид модифицированного олигонуклеотида содержит модифицированный сахар.

Вариант реализации 11. Соединение по варианту реализации 10, отличающееся тем, что каждый нуклеозид модифицированного олигонуклеотида содержит модифицированный сахар.

Вариант реализации 12. Соединение по вариантам реализации 10 или 11, отличающееся тем, что по меньшей мере один модифицированный сахар представляет собой бициклический сахар.

Вариант реализации 13. Соединение по варианту реализации 12, отличающееся тем, что бициклический сахар содержит химический мостик между положениями 4' и 2' сахара, при этом указанный химический мостик выбран из: 4'-CH(R)-O-2' и 4'-(СН2)2-O-2', где R независимо представляет собой Н, C16 алкильный радикал и C16 алкоксильный радикал.

Вариант реализации 14. Соединение по варианту реализации 13, отличающееся тем, что химический мостик представляет собой 4'-CH(R)-O-2', и где R представляет собой метальный радикал.

Вариант реализации 15. Соединение по варианту реализации 13, отличающееся тем, что химический мостик представляет собой 4'-CH(R)-O-2', и где R представляет собой Н.

Вариант реализации 16. Соединение по варианту реализации 13, отличающееся тем, что химический мостик представляет собой 4'-CH(R)-O-2', и где R представляет собой -CH2-О-СН3.

Вариант реализации 17. Соединение по вариантам реализации 10 или 11, отличающееся тем, что по меньшей мере один модифицированный сахар содержит 2'-O-метоксиэтильную группу.

Вариант реализации 18. Соединение по любому из вариантов реализации 1-10 или 12-16, отличающееся тем, что модифицированный олигонуклеотид представляет собой гэпмер.

Вариант реализации 19. Соединение по варианту реализации 18, отличающееся тем, что гэпмер представляет собой любой из 3-8-7 МОЕ гэпмера, 3-10-7 МОЕ гэпмера, 4-8-6 МОЕ гэпмера, 4-10-6 МОЕ гэпмера, 6-10-4 МОЕ гэпмера, 6-8-4 МОЕ гэпмера, 7-8-3 МОЕ гэпмера или 7-10-3 МОЕ гэпмера.

Вариант реализации 20. Соединение по п. 5, отличающееся тем, что модифицированный олигонуклеотид содержит межнуклеозидные связи в любом из следующих паттернов: soossssssssssooooss, sooossssssssssoooss, sooooossssssssssoss, soooooossssssssssss, soooosssssssssooss, sooosssssssssoooss, sooooosssssssssoss, soosssssssssoooss, soooosssssssssoss, sosssssssssooooss или sooooosssssssssss, где,

s = тиофосфатная межнуклеозидная связь, и

о = фосфодиэфирная межнуклеозидная связь.

Вариант реализации 19. Композиция, содержащая соединение по любому из предыдущих вариантов реализации или его соль и по меньшей мере один фармацевтически приемлемый носитель или разбавитель.

Вариант реализации 20. Композиция по варианту реализации 19, дополнительно содержащая специфический ингибитор антисмыслового транскрипта C9ORF72.

Вариант реализации 21. Композиция по варианту реализации 20, отличающаяся тем, что специфический ингибитор антисмыслового транскрипта C9ORF72 представляет собой антисмысловое соединение.

Вариант реализации 22. Композиция по варианту реализации 21, отличающаяся тем, что антисмысловое соединение представляет собой модифицированный олигонуклеотид.

Вариант реализации 23. Композиция по варианту реализации 22, отличающаяся тем, что модифицированный олигонуклеотид является одноцепочечным.

Вариант реализации 24. Композиция по вариантам реализации 22 или 23, отличающаяся тем, что модифицированный олигонуклеотид имеет последовательность нуклеиновых оснований, которая по меньшей мере на 80%, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98%, по меньшей мере на 99% или на 100% комплементарна антисмысловому транскрипту C9ORF72.

Вариант реализации 25. Композиция по варианту реализации 24, отличающаяся тем, что антисмысловой транскрипт C9ORF72 имеет последовательность нуклеиновых оснований SEQ ID NO: 18.

Вариант реализации 26. Способ, включающий введение животному соединения или композиции по любому из предыдущих вариантов.

Вариант реализации 27. Способ по варианту реализации 26, отличающийся тем, что животное представляет собой человека.

Вариант реализации 28. Способ по вариантам реализации 26 и 27, отличающийся тем, что введение соединения обеспечивает предупреждение, лечение, облегчение или замедление прогрессирования заболевания, связанного с C9ORF72.

Вариант реализации 29. Способ по варианту реализации 28, отличающийся тем, что заболевание, связанное с C9ORF72, вызвано экспансией гексануклеотидного повтора.

Вариант реализации 30. Способ по варианту реализации 28, отличающийся тем, что заболевание, связанное с C9ORF72, представляет собой боковой амиотрофический склероз (ALS), лобно-височную деменцию (FTD), синдром кортико-базальной дегенерации (CBD), атипический синдром паркинсонизма и оливопонтоцеребеллярную дегенерацию (OPCD).

Вариант реализации 31. Способ по вариантам реализации 26-30, отличающийся тем, что введение обеспечивает уменьшение ядерных очагов.

Вариант реализации 32. Способ по вариантам реализации 26-31, отличающийся тем, что введение обеспечивает снижение экспрессии продуктов C9ORF72-ассоциированной RAN-зависимой трансляции.

Вариант реализации 33. Способ по варианту реализации 32, отличающийся тем, что продукты C9ORF72-ассоциированной RAN-зависимой трансляции представляют собой любой из поли(глицин-пролина), поли(глицин-аланина) и поли(глицин-аргинина).

Вариант реализации 34. Применение соединения или композиции по любому из вариантов реализации 1-33 для производства лекарственного средства для лечения нейродегенеративного расстройства.

Вариант реализации 35. Соединение, состоящее из модифицированного олигонуклеотида согласно следующей формуле или его соли:

Вариант реализации 36. Композиция, состоящая из натриевой соли модифицированного олигонуклеотида согласно следующей формуле:

Вариант реализации 37. Соединение, состоящее из модифицированного олигонуклеотида согласно следующей формуле или его соли:

Вариант реализации 38. Композиция, состоящая из натриевой соли модифицированного олигонуклеотида согласно следующей формуле:

Вариант реализации 39. Соединение, состоящее из модифицированного олигонуклеотида согласно следующей формуле или его соли:

Вариант реализации 40. Композиция, состоящая из натриевой соли модифицированного олигонуклеотида согласно следующей формуле:

Вариант реализации 41. Соединение, состоящее из модифицированного олигонуклеотида согласно следующей формуле или его соли:

Вариант реализации 42. Композиция, состоящая из натриевой соли модифицированного олигонуклеотида согласно следующей формуле:

Вариант реализации 43. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что указанное соединение или композиция может снижать экспрессию мРНК или белка человеческого C9ORF72 у млекопитающего.

Вариант реализации 44. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что соединение или композиция может облегчать по меньшей мере один симптом бокового амиотрофического склероза (ALS), лобно-височной деменции (FTD), синдрома кортико-базальной дегенерации (CBD), атипического синдрома паркинсонизма или оливопонтоцеребеллярной дегенерации (OPCD).

Вариант реализации 45. Соединение или композиция по варианту реализации 44, отличающиеся тем, что симптом ALS представляет собой любой из двигательного дефекта, тревожного расстройства и денервации.

Вариант реализации 46. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что соединение или композиция может вызывать отсрочку прогрессирования заболевания.

Вариант реализации 47. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что соединение или композиция может увеличивать продолжительность жизни.

Вариант реализации 48. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что соединение или композиция может уменьшать продукты C9ORF72-ассоциированной RAN-зависимой трансляции.

Вариант реализации 49. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что соединение или композиция может селективно снижать патоген-ассоциированные варианты мРНК C9ORF72.

Вариант реализации 50. Соединение или композиция по любому из вариантов реализации 1-25 или 35-42, отличающиеся тем, что соединение или композиция может сокращать ядерные очаги.

Вариант реализации 51. Соединение, состоящее из модифицированного олигонуклеотида согласно следующей формуле или его соли:

Вариант реализации 52. Способ, включающий введение животному соединения по варианту реализации 51.

Вариант реализации 53. Способ по варианту реализации 52, отличающийся тем, что животное представляет собой человека.

Вариант реализации 54. Способ по варианту реализации 53, отличающийся тем, что введение обеспечивает ингибирование C9ORF72.

Вариант реализации 55. Способ по варианту реализации 53, отличающийся тем, что введение обеспечивает предупреждение, лечение, облегчение или замедление прогрессирования заболевания, связанного с C9ORF72.

Вариант реализации 56. Способ по варианту реализации 55, отличающийся тем, что заболевание, связанное с C9ORF72, вызвано экспансией гексануклеотидного повтора.

Вариант реализации 57. Способ по варианту реализации 55, отличающийся тем, что заболевание, связанное с C9ORF72, представляет собой любое из бокового амиотрофического склероза (ALS), лобно-височной деменции (FTD), синдрома кортико-базальной дегенерации (CBD), атипического синдрома паркинсонизма или оливопонтоцеребеллярной дегенерации (OPCD).

Вариант реализации 58. Способ по варианту реализации 53, отличающийся тем, что введение обеспечивает сокращение ядерных очагов.

Вариант реализации 59. Способ по варианту реализации 53, отличающийся тем, что введение обеспечивает снижение экспрессии продуктов C9ORF72-ассоциированной RAN-зависимой трансляции.

Вариант реализации 60. Способ по варианту реализации 59, отличающийся тем, что продукты C9ORF72-ассоциированной RAN-зависимой трансляции представляют собой любой из поли(глицин-пролина), поли(глицин-аланина) и поли(глицин-аргинина).

Вариант реализации 61. Композиция, состоящая из натриевой соли модифицированного олигонуклеотида согласно следующей формуле:

Вариант реализации 62. Способ, включающий введение животному композиции по варианту реализации 60.

Вариант реализации 63. Способ по варианту реализации 62, отличающийся тем, что животное представляет собой человека.

Вариант реализации 64. Способ по варианту реализации 63, отличающийся тем, что введение обеспечивает ингибирование C9ORF72.

Вариант реализации 65. Способ по варианту реализации 62, отличающийся тем, что введение обеспечивает предупреждение, лечение, облегчение или замедление прогрессирования заболевания, связанного с C9ORF72.

Вариант реализации 66. Способ по варианту реализации 65, отличающийся тем, что заболевание, связанное с C9ORF72, вызвано экспансией гексануклеотидного повтора.

Вариант реализации 67. Способ по варианту реализации 65, отличающийся тем, что заболевание, связанное с C9ORF72, представляет собой любое из бокового амиотрофического склероза (ALS), лобно-височной деменции (FTD), синдрома кортико-базальной дегенерации (CBD), атипического синдрома паркинсонизма или оливопонтоцеребеллярной дегенерации (OPCD).

Вариант реализации 68. Способ по варианту реализации 63, отличающийся тем, что введение обеспечивает сокращение ядерных очагов.

Вариант реализации 69. Способ по варианту реализации 63, отличающийся тем, что введение обеспечивает снижение экспрессии продуктов C9ORF72-ассоциированной RAN-зависимой трансляции.

Вариант реализации 70. Способ по варианту реализации 69, отличающийся тем, что продукты C9ORF72-ассоциированной RAN-зависимой трансляции представляют собой любой из поли(глицин-пролина), поли(глицин-аланина) и поли(глицин-аргинина).

Антисмысловые соединения

Олигомерные соединения включают, но не ограничиваются ими, олигонуклеотиды, олигонуклеозиды, аналоги олигонуклеотидов, миметики олигонуклеотидов, антисмысловые соединения, антисмысловые олигонуклеотиды и миРНК. Олигомерное соединение может быть «антисмысловым» к нуклеиновой кислоте-мишени, что означает, что оно способно подвергаться гибридизации с нуклеиновой кислотой-мишенью посредством водородного связывания.

В некоторых вариантах реализации изобретения антисмысловое соединение содержит последовательность нуклеиновых оснований, которая, при написании в направлении от 5' к 3', содержит обратный комплемент целевого сегмента нуклеиновой кислоты-мишени, на которую она нацелена. В некоторых таких вариантах реализации антисмысловой олигонуклеотид содержит последовательность нуклеиновых оснований, которая при написании в 5'-3' направлении, содержит обратный комплемент целевого сегмента нуклеиновой кислоты-мишени, на которую она нацелена.

В некоторых вариантах реализации изобретения длина антисмыслового соединения, нацеленного на нуклеиновую кислоту C9ORF72, составляет 12-30 субъединиц. Другими словами, длина таких антисмысловых соединений составляет 12-30 связанных субъединиц. В других вариантах реализации изобретения антисмысловое соединение содержит 8-80,12-50, 15-30, 18-24, 19-22 или 20 связанных субъединиц. В некоторых вариантах реализации антисмысловые соединения имеют 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79 или 80 связанных субъединиц в длину или количество в диапазоне, определенном любыми двумя из указанных выше значений. В некоторых вариантах реализации антисмысловое соединение представляет собой антисмысловой олигонуклеотид, и связанными субъединицами являются нуклеозиды.

В некоторых вариантах реализации изобретения антисмысловые олигонуклеотиды, нацеленные на нуклеиновую кислоту C9ORF72, могут быть укороченными или усеченными. Например, одна субъединица может быть удалена с 5' конца (5' усечение), или же с 3' конца (3' усечение). В укороченном или усеченном антисмысловом соединении, нацеленном на нуклеиновую кислоту C9ORF72, две субъединицы могут быть удалены на 5' конце или, в качестве альтернативы, две субъединицы могут быть удалены на 3' конце антисмыслового соединения. В альтернативном варианте удаленные нуклеозиды могут быть рассеяны по всему антисмысловому соединению, например, в антисмысловом соединении с одним нуклеозидом, удаленным с 5' конца, и одним нуклеозидом, удаленным с 3' конца.

Если в удлиненном антисмысловом соединении присутствует одна дополнительная субъединица, то дополнительная субъединица может быть расположена на 5' или 3' конце антисмыслового соединения. При наличии двух или более дополнительных субъединиц, добавленные субъединицы могут быть расположены рядом друг с другом, например, в антисмысловом соединении, имеющем две субъединицы, добавленные на 5' конце (5' присоединение) или, в альтернативном варианте, на 3' конце (3' присоединение). В альтернативном варианте присоединенные субъединицы могут быть рассеяны по всему антисмысловому соединению, например, в антисмысловом соединении, имеющем одну субъединицу, присоединенную к 5' концу, и одну субъединицу, присоединенную к 3' концу.

Длина антисмыслового соединения, такого как антисмысловой олигонуклеотид, может быть увеличена или уменьшена, и/или могут быть введены некомплементарные основания без потери активности. Например, в Woolf et al. (Proc. Natl. Acad. Sci. USA 89: 7305-7309, 1992) ряд антисмысловых олигонуклеотидов длиной 13-25 нуклеиновых оснований был испытан на предмет способности индуцировать расщепление целевой РНК в модели инъекции ооцита. Антисмысловые олигонуклеотиды длиной 25 нуклеиновых оснований с 8 или 11 некомплементарными основаниями вблизи концов антисмысловых олигонуклеотидов были способны направлять специфическое расщепление целевой мРНК, хотя и в меньшей степени, чем антисмысловые олигонуклеотиды, которые не содержали никаких несоответствий. Аналогичным образом целевое специфическое расщепление было достигнуто с использованием антисмысловых олигонуклеотидов длиной 13 нуклеиновых оснований, включая те, которые имели 1 или 3 несоответствия.

Gautschi et al (J. Natl. Cancer Inst. 93: 463-471, March 2001) продемонстрировали способность олигонуклеотида, обладающего 100% комплементарностью мРНК bcl-2 и содержащего 3 рассогласованных основания по отношению к мРНК bcl-xL, уменьшать экспрессию как bcl-2, так и bcl-xL in vitro и in vivo. Кроме того, данный олигонуклеотид продемонстрировал высокую противоопухолевую активность in vivo.

Maher and Dolnick (Nuc. Acid. Res. 16: 3341-3358,1988) провели испытания серии тандемов антисмысловых олигонуклеотидов из 14 нуклеиновых оснований и антисмысловых олигонуклеотидов из 28 и 42 нуклеиновых оснований, состоящих из последовательности двух или трех тандемов антисмысловых олигонуклеотидов, соответственно, на их способность к блокированию трансляции ДГФР человека в анализе на ретикулоцитах кролика. Каждый из трех антисмысловых олигонуклеотидов длиной 14 нуклеиновых оснований по отдельности мог воспрепятствовать трансляции, хотя на более низком уровне, чем антисмысловые олигонуклеотиды длиной 28 или 42 нуклеиновых основания.

Мотивы антисмысловых соединений

В некоторых вариантах реализации изобретения антисмысловые соединения, нацеленные на нуклеиновую кислоту C9ORF72, содержат химически модифицированные субъединицы, организованные в паттерны или мотивы, для обеспечения таких свойств антисмысловых соединений, как повышенная ингибирующая активность, повышенная аффинность связывания с нуклеиновой кислотой-мишенью или устойчивость к расщеплению нуклеазами in vivo.

Как правило, химерные антисмысловые соединения содержат по меньшей мере одну область, модифицированную таким образом, чтобы придать повышенную устойчивость к разложению под действием нуклеаз, усиленное клеточное поглощение, повышенную аффинность связывания с целевой нуклеиновой кислотой, и/или повышенную ингибирующую активность. Второй химерный участок антисмыслового соединения может дополнительно служить в качестве субстрата для клеточной эндонуклеазы РНКазы Н, которая отщепляет нить РНК в дуплексе РНК:ДНК.

Антисмысловые соединения, имеющие гэпмерный мотив, представляют собой химерные антисмысловые соединения. В гэпмере внутренняя область, имеющая множество нуклеотидов, которые поддерживают расщепление РНКазой Н, расположена между внешними областями, имеющими множество нуклеотидов, химически отличающихся от нуклеозидов внутренней области. В случае антисмыслового олигонуклеотида, имеющего гэпмерный мотив, сегмент гэпа, как правило, служит в качестве субстрата для расщепления эндонуклеазой, в то время как сегменты крыльев содержат модифицированные нуклеозиды. В некоторых вариантах реализации изобретения области гэпмера различаются по типам фрагментов сахаров в составе каждой отдельной области. Типы фрагментов сахаров, которые используют для дифференциации областей гэпмера, в некоторых вариантах реализации могут включать β-D-рибонуклеозиды, β-D-дезоксирибонуклеозиды, 2'-модифицированные нуклеозиды (такие 2'-модифицированные нуклеозиды могут включать, среди прочего, 2'-МОЕ и 2'-O-СН3) и модифицированные бициклическими сахарами нуклеозиды (такие модифицированные бициклическими сахарами нуклеозиды могут включать те, которые имеют мостик 4'-(СН2)n-O-2', где n=1 или n=2, и 4'-СН2-O-СН2-2'). Предпочтительно, каждая отдельная область содержит одинаковые фрагменты сахаров. Мотив крыло-гэп-крыло часто описывают как «Х-Y-Z», в котором «X» представляет длину области 5' крыла, «Y» представляет длину гэпа, и «Z» представляет длину области У крыла. В данном контексте гэпмер, описанный как «Х-Y-Z», имеет такую конфигурацию, что сегмент гэп расположен непосредственно примыкающим к каждому из сегмента 5' крыла и сегмента 3' крыла. Таким образом, отсутствуют промежуточные нуклеотиды между сегментом 5' крыла и сегментом гэп или сегментом гэп и сегментом У крыла. Любое из антисмысловых соединений, описанных в данном документе, может иметь гэпмерный мотив. В некоторых вариантах реализации изобретения X и Z являются одинаковыми; в других вариантах реализации изобретения они являются различными. В предпочтительном варианте реализации изобретения длина Y составляет от 8 до 15 нуклеотидов. X, Y или Z могут составлять 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30 или более нуклеотидов. Таким образом, гэпмеры, описанные в настоящем документе, включают, но не ограничиваются ими, например, 5-10-5, 5-10-4, 4-10-4, 4-10-3, 3-10-3, 2-10-2, 5-9-5, 5-9-4, 4-9-5, 5-8-5, 5-8-4, 4-8-5, 5-7-5, 4-7-5, 5-7-4 или 4-7-4.

В некоторых вариантах реализации изобретения антисмысловое соединение содержит мотив «вингмера», который имеет конфигурацию крыло-гэп или гэп-крыло, т.е. конфигурацию X-Y или Y-Z, как описано выше для конфигурации гэпмера. Таким образом, конфигурации вингмера, описанные в настоящем документе, включают, но не ограничиваются ими, например, 5-10, 8-4, 4-12, 12-4, 3-14, 16-2, 18-1, 10-3, 2-10, 1-10, 8-2, 2-13, 5-13, 5-8 или 6-8.

В некоторых вариантах реализации изобретения антисмысловые соединения, нацеленные на нуклеиновую кислоту C9ORF72, содержат гэпмерный мотив 5-10-5.

В некоторых вариантах реализации изобретения антисмысловые соединения, нацеленные на нуклеиновую кислоту C9ORF72, содержат гэпмерный мотив 5-8-5.

В некоторых вариантах реализации антисмысловые соединения, нацеленные на нуклеиновую кислоту C9ORF72, содержат сахарные модификации в любом из следующих паттернов: eeekkdddddddkkeee, eekkddddddddkkeee, ekddddddddekekeee, kekeddddddddekeke и ekekddddddddkekee; где

e=2'-O-метоксиэтил-модифицированный нуклеозид,

d=2'-дезоксинуклеозид, и

k=cEt нуклеозид.

В некоторых вариантах реализации изобретения антисмысловое соединение, нацеленное на нуклеиновую кислоту C9ORF72, содержит суженный гэп-мотив. В некоторых вариантах реализации антисмысловой олигонуклеотид с суженным гэп, нацеленный на нуклеиновую кислоту C9ORF72, содержит сегмент гэп из 9, 8, 7 или 6 2'-дезоксинуклеотидов, расположенных непосредственно рядом и между сегментами крыльев из 5, 4, 3, 2 или 1 химически модифицированного нуклеозида. В некоторых вариантах реализации химическая модификация включает бициклический сахар. В некоторых вариантах реализации бициклический сахар содержит мостик от 4' к 2', выбранный из: мостика 4'-(СН2)n-O-2', где n равен 1 или 2; и 4'-СН2-O-СН2-2'. В некоторых вариантах реализации бициклический сахар содержит мостик 4'-СН(СН3)-O-2'. В некоторых вариантах реализации химическая модификация включает не бициклический 2'-модифицированный фрагмент сахара. В некоторых вариантах реализации не бициклический 2'-модифицированный фрагмент сахара содержит 2'-O-метоксиэтильную группу или 2'-O-метильную группу.

Нуклеиновые кислоты-мишени, области-мишени и нуклеотидные последовательности

Нуклеотидные последовательности, которые кодируют C9ORF72 включают, без ограничения, следующие: комплемент номера доступа GENBANKNM_001256054.1 (включенной в настоящий документ как SEQ ID NO: 1), комплемент номера доступа GENBANKNT_008413.18, усеченной по нуклеиновым основаниям с 27535000 по 27565000 (включенной в настоящий документ как SEQ ID NO: 2), номер доступа GENBANKBQ068108.1 (включенная в настоящий документ как SEQ ID NO: 3), номер доступа GENBANKNM_018325.3 (включенная в настоящий документ как SEQ ID NO: 4), номер доступа GENBANKDN993522.1 (включенная в настоящий документ как SEQ ID NO: 5), номер доступа GENBANKNM_145005.5 (включенная в настоящий документ как SEQ ID NO: 6), номер доступа GENBANKDB079375.1 (включенная в настоящий документ как SEQ ID NO: 7), номер доступа GENBANKBU194591.1 (включенная в настоящий документ как SEQ ID NO: 8), идентификатор последовательности 4141_014_А (включенная в настоящий документ как SEQ ID NO: 9) и 4008_73_А (включенная в настоящий документ как SEQ ID NO: 10) и номер доступа GENBANKNW_001101662.1, усеченная по нуклеозидам с 8522000 по 8552000 (включенная в настоящий документ как SEQ ID NO: 11).

Следует понимать, что последовательность, изложенная в каждой SEQ ID NO в примерах, содержащихся в данном документе, является независимой от любой модификации фрагмента сахара, межнуклеозидной связи или нуклеинового основания. Следовательно, антисмысловое соединение, определяемое по SEQ ID NO, может независимо содержать одну или более модификаций фрагмента сахара, межнуклеозидной связи или нуклеинового основания. Антисмысловые соединения, описанные по номеру Isis (Isis №), указывают сочетание последовательности нуклеиновых оснований и мотива.

В некоторых вариантах реализации изобретения целевая область представляет собой структурно определенную область нуклеиновой кислоты-мишени. Например, целевая область может содержать 3' нетранслируемую область, 5' нетранслируемую область, экзон, интрон, экзон-интронное сочленение, кодирующую область, область инициации трансляции, область терминации трансляции или другую определенную область нуклеиновой кислоты. Структурно определенные области для C9ORF72 могут быть получены по номеру доступа из баз данных последовательностей, таких как NCBI, и такая информация включена в данное описание посредством ссылки. В некоторых вариантах реализации целевая область может охватывать последовательность от 5' сайта-мишени одного целевого сегмента в пределах области-мишени до 3' сайта-мишени другого целевого сегмента в пределах той же области-мишени.

Нацеливание включает определение по меньшей мере одного сегмента-мишени, с которым гибридизуется антисмысловое соединение, например, для достижения желаемого эффекта. В некоторых вариантах реализации изобретения желаемый эффект представляет собой снижение уровней мРНК нуклеиновой кислоты-мишени. В некоторых вариантах реализации изобретения желаемый эффект представляет собой снижение уровней белка, кодируемого нуклеиновой кислотой-мишенью, или фенотипическое изменение, связанное с нуклеиновой кислотой-мишенью.

Область-мишень может содержать один или более сегментов-мишеней. Множество сегментов-мишеней в области-мишени могут быть перекрывающимися. В альтернативном варианте они могут быть не перекрывающимися. В некоторых вариантах реализации изобретения сегменты-мишени в пределах области-мишени разделены не более чем около 300 нуклеотидами. В некоторых вариантах реализации целевые сегменты в пределах области-мишени разделены числом нуклеотидов, равным, равным около, не более чем, не более чем около 250, 200, 150, 100, 90, 80, 70, 60, 50, 40, 30, 20 или 10 нуклеотидами в нуклеиновой кислоте-мишени, или находится в пределах, определяемых любыми двумя из предшествующих значений. В некоторых вариантах реализации изобретения сегменты-мишени в пределах области-мишени разделены не более чем или не более чем около 5 нуклеотидами в нуклеиновой кислоте-мишени. В некоторых вариантах реализации изобретения сегменты-мишени являются смежными. Предусмотрены области-мишени, определенные диапазоном, имеющим стартовую нуклеиновую кислоту, которая представляет собой любую из 5' сайта-мишени или 3' сайта-мишени, перечисленных в настоящем документе.

Подходящие сегменты-мишени могут быть расположены в пределах 5' UTR, кодирующей области, 3' UTR, интрона, экзона или соединения экзон/интрон. Сегменты-мишени, содержащие старт-кодон или стоп-кодон, также представляют собой подходящие сегменты-мишени. Подходящий целевой сегмент может специфически исключать некоторые структурно определенные области, такие как старт-кодон или стоп-кодон.

Определение пригодных сегментов-мишеней может включать сравнение последовательности нуклеиновой кислоты-мишени с другими последовательностями в геноме. Например, для идентификации областей сходства среди различных нуклеиновых кислот может быть использован алгоритм BLAST. Такое сравнение может предотвратить отбор последовательностей антисмыслового соединения, которые способны гибридизоваться неспецифическим образом с последовательностями, отличными от выбранной нуклеиновой кислоты-мишени (т.е. нецелевыми или побочными последовательностями).

Могут быть вариации в активности (например, определенной по процентному снижению уровней нуклеиновой кислоты-мишени) антисмысловых соединений внутри целевой области. В некоторых вариантах реализации изобретения снижение уровней мРНК C9ORF72 является индикатором ингибирования экспрессии C9ORF72. Снижение уровней белка C9ORF72 также указывает на подавление экспрессии мРНК-мишени. Уменьшение наличия очагов РНК с расширенным C9ORF72 является показателем ингибирования экспрессии C9ORF72. Кроме того, на ингибирование экспрессии C9ORF72 указывают фенотипические изменения. Например, улучшение двигательной функции и дыхания может быть показателем ингибирования экспрессии C9ORF72.

Гибридизация

В некоторых вариантах реализации гибридизация происходит между антисмысловым соединением, описанным в настоящем документе, и нуклеиновой кислотой C9ORF72. Наиболее общий механизм гибридизации включает участие водородной связи (например, уотсон-криковское, хугстиновское или обратное хугстиновское образование водородной связи) между комплементарными нуклеиновыми основаниями молекул нуклеиновой кислоты.

Гибридизация может происходить в различных условиях. Жесткие условия являются последовательность-зависимыми и определяются природой и составом гибридизуемых молекул нуклеиновых кислот.

Способы определения того, является ли последовательность специфически гибридизуемой с целевой нуклеиновой кислотой, хорошо известны в данной области техники. В некоторых вариантах реализации антисмысловые соединения, представленные в настоящем документе, являются специфически гибридизуемыми с нуклеиновой кислотой C9ORF72.

Комплементарность

Антисмысловое соединение и нуклеиновая кислота-мишень комплементарны друг другу, если достаточное количество нуклеиновых оснований антисмыслового соединения может образовывать водородную связь с соответствующими нуклеиновыми основаниями нуклеиновой кислоты-мишени, таким образом, что будет достигаться желательный эффект (например, антисмысловое ингибирование нуклеиновой кислоты-мишени, такой как нуклеиновая кислота C9ORF72).

Некомплементарные нуклеиновые основания между антисмысловым соединением и нуклеиновой кислотой C9ORF72 могут быть допустимыми при условии, что антисмысловое соединение сохраняет способность специфично гибридизоваться с нуклеиновой кислотой-мишенью. Кроме того, антисмысловое соединение может гибридизоваться с одним или несколькими сегментами нуклеиновой кислоты C9ORF72 таким образом, что промежуточные или смежные сегменты не участвуют в гибридизации (например, петлевая структура, рассогласование или структура шпильки).

В некоторых вариантах реализации антисмысловые соединения, представленные в настоящем изобретении, или определенные их части, являются или по меньшей мере на 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, или 100% комплементарны к нуклеиновой кислоте C9ORF72, области-мишени, сегменту-мишени или определенной ее части. Процент комплементарности антисмыслового соединения к нуклеиновой кислоте-мишени может быть определен с применением стандартных способов.

Например, антисмысловое соединение, в котором 18 из 20 нуклеиновых оснований антисмыслового соединения являются комплементарными к области-мишени, и поэтому будут специфически гибридизоваться, будут имеет 90 процентов комплементарности. В данном примере оставшиеся некомплементарные нуклеиновые основания могут быть расположены кластерно или вперемешку с комплементарными нуклеиновыми основаниями и не обязаны быть смежными друг с другом или комплементарными нуклеиновыми основаниям. Таким образом, антисмысловое соединение, длина которого составляет 18 нуклеиновых оснований, содержащее 4 (четыре) некомплементарных нуклеиновых основания, фланкированных двумя областями полной комплементарности с нуклеиновой кислотой-мишенью, обладает общей комплементарностью с нуклеиновой кислотой-мишенью 77,8%, и таким образом, входит в границы объема настоящего изобретения. Процент комплементарности антисмыслового соединения с областью нуклеиновой кислоты-мишени может быть определен с помощью программ BLAST (поисковые инструменты для основного локального выравнивания) и программ PowerBLAST, известных в данной области техники (Altschul et al., J. Mol. Biol., 1990, 215, 403 410; Zhang and Madden, Genome Res., 1997, 7, 649 656). Процент гомологии, идентичность или комплементарность последовательностей, могут быть определены, например, программой Gap (висконсинский пакет анализа последовательностей, версия 8 для Unix, Genetics Computer Group, Висконсинский Университет, Мэдисон штат Висконсин), используя настройки по умолчанию, которые используют алгоритм Смита и Ватермана (Adv. Appl. Math., 1981, 2, 482 489).

В некоторых вариантах реализации антисмысловые соединения, предложенные в настоящем документе, или их определенные части полностью комплементарны (т.е. на 100% комплементарны) нуклеиновой кислоте-мишени или определенной ее части. Например, антисмысловое соединение может быть полностью комплементарно нуклеиновой кислоте C9ORF72 или ее области-мишени, или ее сегменту-мишени, или ее последовательности-мишени. В данном контексте «полностью комплементарный» означает, что каждое нуклеиновое основание антисмыслового соединения способно точно спариваться с соответствующими нуклеиновыми основаниями нуклеиновой кислоты-мишени. Например, антисмысловое соединение длиной 20 нуклеиновых оснований является полностью комплементарным к последовательности-мишени, длина которой составляет 400 нуклеиновых оснований при условии, что в нуклеиновой кислоте-мишени присутствует соответствующая часть длиной 20 нуклеиновых оснований, которая является полностью комплементарной к антисмысловому соединению. Полностью комплементарный может также использоваться в отношении определенной части первой и/или второй нуклеиновой кислоты. Например, часть длиной 20 нуклеиновых оснований антисмыслового соединения длиной 30 нуклеиновых оснований может быть «полностью комплементарной» к последовательности-мишени длиной 400 нуклеиновых оснований. Часть длиной 20 нуклеиновых оснований олигонуклеотида длиной 30 нуклеиновых оснований полностью комплементарна к последовательности-мишени, если последовательность-мишень содержит соответствующую часть длиной 20 нуклеиновых оснований, причем каждое нуклеиновое основание комплементарно к части антисмыслового соединения длиной 20 нуклеиновых оснований. В то же время, полноразмерное антисмысловое соединение длиной 30 нуклеиновых оснований может быть или не быть полностью комплементарным к последовательности-мишени, в зависимости от того, будут ли остальные 10 нуклеиновых оснований антисмыслового соединения также комплементарными к последовательности-мишени.

Некомплементарное нуклеиновое основание может располагаться на 5' конце или 3' конце антисмыслового соединения. В альтернативном варианте некомплементарное нуклеиновое основание или нуклеиновые основания могут быть внутри антисмыслового соединения. При наличии двух или более некомплементарных нуклеиновых оснований, они могут быть смежными (т.е. связанными) или не смежными. В одном варианте реализации изобретения некомплементарное нуклеиновое основание расположено в сегменте крыла гэпмера антисмыслового олигонуклеотида.

В некоторых вариантах реализации антисмысловые соединения, которые содержат точно или до 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеиновых оснований в длину, содержат не более 4, не более 3, не более 2 или не более 1 некомплементарного нуклеинового основания(-ий) относительно нуклеиновой кислоты-мишени, такой как нуклеиновая кислота C9ORF72, или ее определенной части.

В некоторых вариантах реализации антисмысловые соединения, которые содержат точно или до 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеиновых оснований в длину, содержат не более 6, не более 5, не более 4, не более 3, не более 2 или не более 1 некомплементарного нуклеинового основания(-ий) относительно нуклеиновой кислоты-мишени, такой как нуклеиновая кислота C9ORF72, или ее определенной части.

Антисмысловые соединения, представленные в данном документе, включают также те, которые являются комплементарными части нуклеиновой кислоты-мишени. В данном контексте «часть» относится к некоторому количеству смежных (т.е., связанных) нуклеиновых оснований в пределах области или сегмента нуклеиновой кислоты-мишени. «Часть» также может относиться к определенному количеству смежных нуклеиновых оснований антисмыслового соединения. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 8 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 9 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 10 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 11 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 12 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 13 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 14 нуклеиновых оснований. В некоторых вариантах реализации антисмысловые соединения комплементарны части целевого сегмента из по меньшей мере 15 нуклеиновых оснований. Также предусмотрены антисмысловые соединения, которые комплементарны части сегмента-мишени длиной по меньшей мере 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеиновых оснований или с длиной в интервале, определенном любыми двумя из этих значений.

Идентичность

Антисмысловые соединения, представленные в настоящем документе, также могут иметь определенный процент идентичности конкретной нуклеотидной последовательности, SEQ ID NO, или соединению, представленному конкретным номером Isis, или его части. В данном контексте антисмысловое соединение идентично последовательности, описанной в данном документе, если оно обладает такой же способностью к спариванию с нуклеиновыми основаниями. Например, РНК, которая содержит урацил вместо тимидина в описанной последовательности ДНК, считалась бы идентичной последовательности ДНК, поскольку и урацил, и тимидин спариваются с аденином. Также предусматриваются укороченные и удлиненные версии антисмысловых соединений, описанных в данном документе, а также соединения, содержащие неидентичные основания относительно антисмысловых соединений, представленных в данном документе. Неидентичные основания могут быть смежными по отношению друг к другу или рассеянными по всему антисмысловому соединению. Процент идентичности антисмыслового соединения вычисляют согласно количеству оснований с идентичным спариванием оснований относительно последовательности, с которой его сравнивают.

В некоторых вариантах реализации изобретения антисмысловые соединения или их части являются по меньшей на 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичными одному или более антисмысловым соединениям или SEQ ID NO, или их частей, описанных в данном документе.

В некоторых вариантах реализации фрагмент антисмыслового соединения сравнивают с равной по длине части нуклеиновой кислоты-мишени. В некоторых вариантах реализации сравнивают часть из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 нуклеиновых оснований с равной по длине частью нуклеиновой кислоты-мишени.

В некоторых вариантах реализации часть антисмыслового олигонуклеотида сравнивают с равной по длине частью нуклеиновой кислоты-мишени. В некоторых вариантах реализации сравнивают часть из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 нуклеиновых оснований с равной по длине частью нуклеиновой кислоты-мишени.

Модификации

Нуклеозид представляет собой комбинацию основание-сахар. Нуклеиновое основание (также известное как основание) - часть нуклеозида, обычно представляющая собой фрагмент гетероциклического основания. Нуклеотиды представляют собой нуклеозиды, которые дополнительно содержат фосфатную группу, ковалентно связанную с сахарной частью нуклеозида. Для тех нуклеозидов, которые содержат пентофуранозильный сахар, фосфатная группа может быть связана с 2', 3' или 5' гидроксильной группой сахара. Олигонуклеотиды образуются посредством ковалентного связывания смежных нуклеозидов друг с другом с образованием линейного полимерного олигонуклеотида. В пределах структуры олигонуклеотида, фосфатные группы обычно называют образующими межнуклеозидные связи олигонуклеотида.

Модификации антисмысловых соединений включают замены или модификации межнуклеозидных связей, фрагментов сахаров или нуклеиновых оснований. Модифицированные антисмысловые соединения зачастую предпочтительны по сравнению с нативными формами за счет желаемых свойств, таких как, например, улучшенное клеточное поглощение, повышенная аффинность связывания с нуклеиновой кислотой-мишенью, повышенная стабильность в присутствии нуклеаз или повышенная ингибирующая активность.

Химически модифицированные нуклеозиды также могут быть использованы для повышения аффинности связывания укороченного или усеченного антисмыслового олигонуклеотида с его нуклеиновой кислотой-мишенью. Следовательно, сопоставимые результаты часто могут быть получены с помощью более коротких антисмысловых соединений, которые имеют такие химически модифицированные нуклеозиды.

Модифицированные межнуклеозидные связи

Природная межнуклеозидная связь РНК и ДНК представляет собой 3'-5' фосфодиэфирную связь. Антисмысловые соединения, содержащие одну или более модифицированных, т.е., неприродных межнуклеозидных связей, часто предпочтительны по сравнению с антисмысловыми соединениями, содержащими природные межнуклеозидные связи, благодаря желательным свойствам, например, таких как улучшенное клеточное поглощение, повышенная аффинность к нуклеиновым кислотам-мишеням и повышенная устойчивость в присутствии нуклеаз.

Олигонуклеотиды, имеющие модифицированные межнуклеозидные связи, включают межнуклеозидные связи, которые сохраняют атом фосфора, а также межнуклеозидные связи, которые не имеют атома фосфора. Иллюстративные фосфорсодержащие межнуклеозидные связи включают, но не ограничиваются ими, фосфодиэфиры, фосфотриэфиры, метилфосфонаты, фосфорамидаты и тиофосфаты. Способы получения фосфорсодержащих и не содержащих фосфор связей являются хорошо известными.

В некоторых вариантах реализации антисмысловые соединения, направленные на нуклеиновую кислоту C9ORF72, содержат одну или более модифицированных межнуклеозидных связей. В некоторых вариантах реализации модифицированные межнуклеозидные связи рассеяны по всему антисмысловому соединению. В некоторых вариантах реализации изобретения модифицированные межнуклеозидные связи представляют собой тиофосфатные связи. В некоторых вариантах реализации изобретения каждая межнуклеозидная связь антисмыслового соединения представляет собой тиофосфатную межнуклеозидную связь. В некоторых вариантах реализации антисмысловые соединения, направленные на нуклеиновую кислоту C9ORF72, содержат по меньшей мере одну фосфодиэфирную связь и по меньшей мере одну тиофосфатную связь.

В некоторых вариантах реализации антисмысловые соединения, направленные на нуклеиновую кислоту C9ORF72, содержат межнуклеозидные связи в любом из следующих паттернов: soooossssssssssooss, sooosssssssssooss, soosssssssssooss и sosssssssssoooss; где

s = тиофосфатная межнуклеозидная связь, и

о = фосфодиэфирная межнуклеозидная связь.

Модифицированные фрагменты сахаров

Антисмысловые соединения согласно настоящему изобретению необязательно могут содержать один или более нуклеозидов, в которых сахарная группа модифицирована. Такие нуклеозиды с модифицированным сахаром могут придавать антисмысловым соединениями повышенную устойчивость к нуклеазам, повышенную аффинность связывания или некоторые другие полезные биологические свойства. В некоторых вариантах реализации изобретения нуклеозиды содержат химически модифицированные фрагменты рибофуранозного кольца. Примеры химически модифицированных рибофуранозных колец включают, не ограничиваясь ими, добавление групп заместителей (включая 5' и 2' группы заместителей, соединение мостиком негеминальных кольцевых атомов с образованием бициклических нуклеиновых кислот (БНК), замену атома кислорода в рибозильном кольце на S, N(R) или C(R1)(R2) (R, R1 и R2, каждый независимо, представляют собой Н, С11 алкил или защитную группу) и их комбинации. Примеры химически модифицированных сахаров включают 2'-F-5'-метил-замещенный нуклеозид (см. международную заявку РСТ WO 2008/101157, опубликованную 8/21/08, где представлены другие описанные 5',2'-бис-замещенные нуклеозиды) или замену атома кислорода рибозильного кольца на S с дополнительным замещением в 2'-положении (см. опубликованную заявку на патент США US 2005-0130923, опубликованную 16 июня 2005 года), или в альтернативном варианте с 5'-замещением БНК (см. международную заявку РСТ WO 2007/134181, опубликованную 11/22/07, где ЗНК замещена, например, 5'-метальной или 5'-винильной группой).

Примеры нуклеозидов, имеющих модифицированные фрагменты сахаров, включают, но не ограничиваясь ими, нуклеозиды, содержащие 5'-винильные, 5'-метильные (R или S), 4'-S, 2'-F, 2'-ОСН3, 2'-ОСН2СН3, 2'-OCH2CH2F и 2'-О(СН2)2ОСН3 группы заместителей. Заместитель в 2' положении также может быть выбран из аллила, амино, азидо, тио, О-аллила, O-C110 алкила, OCF3, OCH2F, O(СН2)2SCH3, О(СН2)2-O-N(Rm)(Rn), О-СН2-C(=О)-N(Rm)(Rn) и O-СН2-C(=O)-N(R1)-(СН2)2-N(Rm)(Rn), где каждый R1, Rm и Rn независимо представляет собой Н или замещенный или незамещенный C1-C10 алкил.

В данном контексте «бициклические нуклеозиды» относятся к модифицированным нуклеозидам, содержащим бициклический фрагмент сахара. Примеры бициклических нуклеиновых кислот (БНК) включают, но не ограничиваясь ими, нуклеозиды, содержащие мостик между 4' и 2' атомами рибозильного кольца. В некоторых вариантах реализации изобретения антисмысловые соединения, представленные в данном документе, содержат один или более БНК нуклеозидов, при этом мостик содержит одну из формул: 4'-(СН2)-O-2' (ЗНК); 4'-(СН2)-S-2'; 4'-(СН2)2-O-2' (ЭНК); 4'-СН(СН3)-O-2' и 4'-СН(СН2ОСН3)-O-2' (и их аналоги, см. патент США 7399845, выданный 15 июля 2008 года); 4'-С(СН3)(СН3)-O-2' (и их аналоги, см. PCT/US2008/068922, опубликованную как WO 2009/006478 8 января 2009 года); 4'-СН2-N(OCH3)-2' (и их аналоги, см. PCT/US2008/064591, опубликованную как WO/2008/150729 11 декабря 2008 года); 4'-СН2-O-N(CH3)-2' (см. опубликованную заявку на патент США US 2004-0171570, опубликованную 2 сентября 2004 года); 4'-СН2-N(R)-O-2', где R представляет собой Н, С11 алкил или защитную группу (см. патент США 7427672, выданный 23 сентября 2008 года); 4'-СН2-С(Н)(СН3)-2' (см. Chattopadhyaya et al., J. Org. Chem., 2009, 74, 118-134); и 4'-СН2-C(=СН2)-2' (и их аналоги, см. PCT/US2008/066154, опубликованную как WO 2008/154401 8 декабря 2008 года).

Дополнительные бициклические нуклеозиды описаны в опубликованной литературе (см., например: Srivastava et al., J. Am. Chem. Soc., 2007, 129(26) 8362-8379; Frieden et al., Nucleic Acids Research, 2003, 21, 6365-6372; Elayadi et al., Curr. Opinion Invens. Drugs, 2001, 2, 558-561; Braasch et al., Chem. Biol, 2001, 8, 1-7; Oram et al., Curr. Opinion Mol. Ther., 2001, 3, 239-243; Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A., 2000, 97, 5633-5638; Singh et al., Chem. Commun., 1998, 4, 455-456; Koshkin et al., Tetrahedron, 1998, 54, 3607-3630; Kumar et al., Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222; Singh et al., J. Org. Chem., 1998, 63, 10035-10039; патенты США №: 7399845; 7053207; 7034133; 6794499; 6770748; 6670461; 6525191; 6268490; публикации патентов США №: US2008-0039618; US 2007-0287831; US 2004-0171570; заявки на патент США, серийные номера: 12/129154; 61/099844; 61/097787; 61/086231; 61/056564; 61/026998; 61/026995; 60/989574; международные заявки WO 2007/134181; WO 2005/021570; WO 2004/106356; и международные заявки РСТ №: PCT/US2008/068922; PCT/US2008/066154; и PCT/US2008/064591). Каждый из указанных бициклических нуклеозидов может быть получен с одной или более стереохимическими конфигурациями сахара, включая, например, α-L-рибофуранозу и β-D-рибофуранозу (см. международную заявку РСТ PCT/DK98/00393, опубликованную 25 марта 1999 года как WO 99/14226).

В данном контексте «моноциклические нуклеозиды» относятся к нуклеозидам, содержащим модифицированные фрагменты сахаров, которые не являются бициклическими фрагментами сахаров. В некоторых вариантах реализации изобретения фрагмент сахара или аналог фрагмента сахара нуклеозида может быть модифицирован или замещен в любом положении.

В данном контексте «4'-2' бициклический нуклеозид» или «4' к 2' бициклический нуклеозид» относится к бициклическому нуклеозиду, содержащему фуранозное кольцо, содержащее мостик, соединяющий два атома углерода фуранозного кольца, соединяющий 2' атом углерода и 4' атом углерода сахарного кольца.

В некоторых вариантах реализации изобретения бициклические фрагменты сахаров нуклеозидов БНК включают, но не ограничиваются ими, соединения, имеющие по меньшей мере один мостик между 4' и 2' атомами углерода пентофуранозильного фрагмента сахара, включая, без ограничения, мостики, содержащие 1 или от 1 до 4 связанных групп, независимо выбранных из-[C(Ra)(Rb)]n-, -C(Ra)=C(Rb)-, -C(Ra)=N-, -C(=NRa)-, -C(=О)-, -C(=S)-, -O-, -Si(Ra)2-, -S(=О)x- и -N(Ra)-; где: x равен 0, 1 или 2; n равен 1, 2, 3 или 4; каждый Ra и Rb независимо представляет собой Н, защитную группу, гидроксил, C1-C12 алкил, замещенный С11 алкил, С212 алкенил, замещенный С212 алкенил, С212 алкинил, замещенный С212 алкинил, С520 арил, замещенный С520 арил, гетероциклический радикал, замещенный гетероциклический радикал, гетероарил, замещенный гетероарил, С57 алициклический радикал, замещенный С57 алициклический радикал, галоген, OJ1, NJ1J2, SJ1, N3, COOJ1, ацил (С(=О)-Н), замещенный ацил, CN, сульфонил (S(=О)2-J1) или сульфоксил (S(=О)-J1); и

каждый J1 и J2 независимо представляет собой Н, С112 алкил, замещенный С112 алкил, С212 алкенил, замещенный С212 алкенил, С212 алкинил, замещенный С212 алкинил, С520 арил, замещенный С520 арил, ацил (С(=О)-Н), замещенный ацил, гетероциклический радикал, замещенный гетероциклический радикал, С112 аминоалкил, замещенный С112 аминоалкил или защитную группу.

В некоторых вариантах реализации изобретения мостик бициклического фрагмента сахара представляет собой -[C(Ra)(Rb)]n-, -[C(Ra)(Rb)]n-O-, -C(RaRb)-N(R)-O- или -C(RaRb)-O-N(R)-. В некоторых вариантах реализации изобретения мостик представляет собой 4'-СН2-2', 4'-(СН2)2-2', 4'-(СН2)3-2', 4'-СН2-O-2', 4'-(СН2)2-O-2', 4'-СН2-O-N(R)-2' и 4'-СН2-N(R)-O-2'-, где каждый R независимо представляет собой Н, защитную группу или С112 алкил.

В некоторых вариантах реализации изобретения бициклические нуклеозиды дополнительно определяют по изомерной конфигурации. Например, нуклеозид, содержащий мостик 4'-(СН2)-O-2', может быть в α-L конфигурации или в β-D конфигурации. Ранее α-L-метиленокси β'-СН2-O-2') БНК были внедрены в антисмысловые олигонуклеотиды, которые демонстрировали антисмысловую активность (Frieden et al., Nucleic Acids Research, 2003, 21, 6365-6372).

В некоторых вариантах реализации изобретения бициклические нуклеозиды включают нуклеозиды, имеющие 4'-2' мостик, где такие мостики включают, без ограничения, α-L-4'-(СН2)-O-2', β-D-4'-СН2-O-2', 4'-(СН2)2-O-2', 4'-СН2-O-N(R)-2', 4'-СН2-N(R)-O-2', 4'-СН(СН3)-O-2', 4'-СН2-S-2', 4'-СН2-N(R)-2', 4'-СН2-СН(СН3)-2' и 4'-(СН2)3-2', где R представляет собой Н, защитную группу или С112 алкил.

В некоторых вариантах реализации изобретения бициклические нуклеозиды имеют формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

-Qa-Qb-Qc- представляет собой -СН2-N(Rc)-СН2-, -C(=O)-N(Rc)-СН2-, -СН2-O-N(Rc)-, -СН2-N(Rc)-O- или -N(Rc)-O-СН2;

Rc представляет собой C1-C12 алкил или аминозащитную группу; и

Та и Tb, каждый независимо, представляют собой Н, гидрокси-защитную группу, группу конъюгата, реакционноспособную фосфорную группу, фосфорный фрагмент или ковалентное присоединение к среде подложки.

В некоторых вариантах реализации изобретения бициклические нуклеозиды имеют формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

Та и Tb, каждый независимо, представляют собой Н, гидрокси-защитную группу, группу конъюгата, реакционноспособную фосфорную группу, фосфорный фрагмент или ковал ентное присоединение к среде подложки;

Za представляет собой C16 алкил, С26 алкенил, С26 алкинил, замещенный C16 алкил, замещенный С26 алкенил, замещенный С26 алкинил, ацил, замещенный ацил, замещенный амид, тиол или замещенный тиол.

В одном варианте реализации изобретения каждая из замещенных групп независимо является моно или полизамещенной группами заместителей, выбранными из галогена, оксо, гидроксила, OJc, NJcJd, SJc, N3, OC(=X)Jc и NJeC(=X)NJcJd, где каждый Jc, Jd и Je независимо представляет собой Н, C16 алкил или замещенный C16 алкил, и X представляет собой О или NJc.

В некоторых вариантах реализации изобретения бициклические нуклеозиды имеют формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

Та и Tb, каждый независимо, представляют собой Н, гидрокси-защитную группу, группу конъюгата, реакционноспособную фосфорную группу, фосфорный фрагмент или ковал ентное присоединение к среде подложки;

Zb представляет собой C16 алкил, С26 алкенил, С26 алкинил, замещенный C16 алкил, замещенный С26 алкенил, замещенный С26 алкинил или замещенный ацил (С(=O)-).

В некоторых вариантах реализации изобретения бициклические нуклеозиды имеют формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

Та и Tb, каждый независимо, представляют собой Н, гидрокси-защитную группу, группу конъюгата, реакционноспособную фосфорную группу, фосфорный фрагмент или ковал ентное присоединение к среде подложки;

Rd представляет собой C16 алкил, замещенный C16 алкил, С26 алкенил, замещенный С26 алкенил, С26 алкинил или замещенный С26 алкинил;

каждый qa, qb, qc и qd независимо представляет собой Н, галоген, C16 алкил, замещенный C16 алкил, С26 алкенил, замещенный С26 алкенил, С26 алкинил или замещенный С26 алкинил, C16 алкоксил, замещенный C16 алкоксил, ацил, замещенный ацил, C16 аминоалкил или замещенный C16 аминоалкил;

В некоторых вариантах реализации изобретения бициклические нуклеозиды имеют формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

Та и Tb, каждый независимо, представляют собой Н, гидрокси-защитную группу, группу конъюгата, реакционноспособную фосфорную группу, фосфорный фрагмент или ковалентное присоединение к среде подложки;

qa, qb, qe и qf, каждый независимо, представляют собой водород, галоген, С1-C12 алкил, замещенный С112 алкил, С212 алкенил, замещенный С212 алкенил, С212 алкинил, замещенный С212 алкинил, С112 алкокси, замещенный С112 алкокси, OJj, SJj, SOJj, SO2Jj, NJjJk, N3, CN, C(=O)OJj, C(=O)NJjJk, C(=O)Jj, O-C(=O)NJjJk, N(H)C(=NH)NJjJk, N(H)C(=O)NJjJk или N(H)C(=S)NJjJk;

или qe и qf вместе представляют собой =C(qg)(qh);

qg и qh, каждый независимо, представляют собой Н, галоген, С112 алкил или замещенный С112 алкил.

Описаны синтез и получение бициклических нуклеозидов аденина, цитозина, гуанина, 5-метилцитозина, тимина и урацила, имеющих мостик 4'-СН2-O-2', а также их олигомеризация и свойства распознавания нуклеиновых кислот (Koshkin et al., Tetrahedron, 1998, 54, 3607-3630). Описан также синтез бициклических нуклеозидов в WO 98/39352 и WO 99/14226.

Были также получены аналоги различных бициклических нуклеозидов, которые имеют 4'-2' мостиковые группы, такие как 4'-СН2-O-2' и 4'-СН2-S-2' (Kumar et al, Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222). Описано также получение

олигодезоксирибонуклеотидных дуплексов, содержащих бициклические нуклеозиды, для применения в качестве субстратов для полимераз нуклеиновых кислот (Wengel et al., WO 99/14226). Кроме того, в данной области техники описан синтез 2'-амино-БНК, нового конформационно ограниченного высокоаффинного аналога олигонуклеотида (Singh et al., J. Org. Chem., 1998, 63, 10035-10039). Кроме того, ранее были получены 2'-амино- и 2'-метиленамино БНК, и была описана термостабильность их дуплексов с комплементарными нитями РНК и ДНК.

В некоторых вариантах реализации изобретения бициклические нуклеозиды имеют формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

Та и Tb, каждый независимо, представляют собой Н, гидрокси-защитную группу, группу конъюгата, реакционноспособную фосфорную группу, фосфорный фрагмент или ковалентное присоединение к среде подложки;

каждый qi, qj, qk и ql независимо представляет собой Н, галоген, С112 алкил, замещенный С112 алкил, С212 алкенил, замещенный С212 алкенил, С212 алкинил, замещенный С212 алкинил, С112 алкоксил, замещенный С112 алкоксил, OJj, SJj, SOJj, SO2Jj, NJjJk, N3, CN, C(=O)OJj, C(=O)NJjJk, C(=O)Jj, O-C(=O)NJjJk, N(H)C(=NH)NJjJk, N(H)C(=O)NJjJk или N(H)C(=S)NJjJk; и

qi и qj или ql и qk вместе представляют собой =C(qg)(qh), где qg и qh, каждый независимо, представляют собой Н, галоген, С112 алкил или замещенный С112 алкил.

Описан один карбоциклический бициклический нуклеозид, имеющий мостик 4'-(СН2)3-2', и мостик из аналога алкенила 4'-СН=СН-СН2-2' (Freier et al., Nucleic Acids Research, 1997, 25(22), 4429-4443 и Albaek et al., J. Org. Chem., 2006, 71, 7731-7740). Описан также синтез и получение карбоциклических бициклических нуклеозидов вместе с их олигомеризацией и биохимическими исследованиями (Srivastava et al, J. Am. Chem. Soc. 2007, 129(26), 8362-8379).

В некоторых вариантах реализации изобретения бициклические нуклеозиды включают, но не ограничиваются ими, (А) α-L-метиленокси (4'-СН2-O-2') БНК, (В) β-D-метиленокси (4'-СН2-O-2') БНК, (С) этиленокси (4'-(СН2)2-O-2') БНК, (D) аминоокси (4'-СН2-O-N(R)-2') БНК, (Е) оксиамино (4'-СН2-N(R)-O-2') БНК, (F) метил(метиленокси) (4'-СН(СН3)-O-2') БНК (также называемый стерически затрудненным этилом или cEt), (G) метилентио (4'-СН2-S-2') БНК, (Н) метиленамино (4'-СН2-N(R)-2') БНК, (I) метилкарбоциклическую (4'-СН2-СН(СН3)-2') БНК, (J) пропиленкарбоциклическую (4'-(СН2)3-2') БНК и (K) винил-БНК, как показано ниже.

где Вх представляет собой фрагмент основания, а R независимо представляет собой Н, защитную группу, C16 алкил или C16 алкокси.

В данном контексте термин «модифицированный тетрагидропирановый нуклеозид» или «модифицированный ТГП нуклеозид» означает нуклеозид, имеющий шестичленный тетрагидропирановый «сахар», заменивший пентофуранозильный остаток в обычных нуклеозидах, и он может быть упомянут как заменитель сахара. ТГП-модифицированные нуклеозиды включают, но не ограничиваются ими, те, которые в данной области техники называют гекситоловой нуклеиновой кислотой (ГНК), анитоловой нуклеиновой кислотой (АНК), манитоловой нуклеиновой кислотой (МНК) (см. Leumann, Bioorg. Med. Chem., 2002, 10, 841-854) или фтор-ГНК (F-ГНК), имеющие тетрагидропирановую кольцевую систему, как показано ниже.

В некоторых вариантах реализации выбраны заменители сахара, имеющие формулу:

где:

Вх представляет собой фрагмент гетероциклического основания;

Т3 и Т4, каждый независимо, представляют собой межнуклеозидную линкерную группу, связывающую аналог тетрагидропиранового нуклеозида с олигомерным соединением, или один из Т3 и Т4 представляет собой межнуклеозидную линкерную группу, связывающую аналог тетрагидропиранового нуклеозида с олигомерным соединением или олигонуклеотидом, а другой из Т3 и Т4 представляет собой Н, гидроксил-защитную группу, связанную группу конъюгата или 5' или 3'-концевую группу;

q1, q2, q3, q4, q5, q6 и q7, каждый независимо, представляют собой Н, C16 алкил, замещенный C16 алкил, С26 алкенил, замещенный С26 алкенил, С26 алкинил или замещенный С26 алкинил; и

один из R1 и R2 представляет собой водород, а другой выбран из галогена, замещенного или незамещенного алкокси, NJ1J2, SJ1, N3, OC(=X)J1, OC(=X)NJ1J2, NJ3C(=Х)NJ1J2 и CN, где X представляет собой О, S или NJ1, и каждый J1, J2 и J3 независимо представляет собой Н или C16 алкил.

В некоторых вариантах реализации изобретения каждый q1, q2, q3, q4, q5, q6 и q7 представляет собой H. В некоторых вариантах реализации изобретения по меньшей мере один из q1, q2, q3, q4, q5, q6 и q7 отличен от H. В некоторых вариантах реализации изобретения по меньшей мере один из q1, q2, q3, q4, q5, q6 и q7 представляет собой метил. В некоторых вариантах реализации изобретения предложены ТГП нуклеозиды, в которых один из R1 и R2 представляет собой F. В некоторых вариантах реализации изобретения R1 представляет собой фтор, a R2 представляет собой Н; R1 представляет собой метокси, a R2 представляет собой Н, и R1 представляет собой метоксиэтокси, a R2 представляет собой Н. В некоторых вариантах реализации изобретения заменители сахара содержат кольца, имеющие более 5 атомов и более одного гетероатома. Например, описаны нуклеозиды, содержащие морфолинофрагменты сахаров, и их применение в олигомерных соединениях (см., например: Braasch et al., Biochemistry, 2002, 41, 4503-4510; и патенты США 5698685; 5166315; 5185444; и 5034506). В данном контексте термин «морфолино» означает заменитель сахара, имеющий следующую формулу:

В некоторых вариантах реализации изобретения морфолиновые фрагменты могут быть модифицированными, например, введением или модификацией различных заместителей, по сравнению с упомянутой выше структурой морфолино. Такие заменители сахара в данном контексте называют «модифицированными морфолино».

Предложены также комбинации модификаций, без ограничения, такие как 2'-F-5'-метил-замещенные нуклеозиды (см. международную заявку РСТ WO 2008/101157, опубликованную 8/21/08, где описаны другие 5', 2'-бис-замещенные нуклеозиды) и замену рибозильного кольцевого атома кислорода на S с дополнительным замещением в 2'-положении (см. опубликованную заявку на патент США US 2005-0130923, опубликованную 16 июня 2005 года) или в альтернативном варианте с 5'-замещением бициклической нуклеиновой кислоты (см. международную заявку РСТ WO 2007/134181, опубликованную 11/22/07, где 4'-СН2-O-2' бициклический нуклеозид дополнительно замещен в 5' положении 5'-метальной или 5'-винильной группой). Описан также синтез и получение карбоциклических бициклических нуклеозидов вместе с их олигомеризацией и биохимическими исследованиями (см., например, Srivastava et al., J. Am. Chem. Soc. 2007, 129(26), 8362-8379).

В некоторых вариантах реализации изобретения антисмысловые соединения содержат один или более модифицированных циклогексенильных нуклеозидов, которые представляют собой нуклеозиды, имеющие шестичленный циклогексенил вместо пентофуранозильного остатка в природных нуклеозидах. Модифицированные циклогексенильные нуклеозиды включают, но не ограничиваются ими, нуклеозиды, описанные в данной области техники (см., например, параллельную опубликованную заявку РСТ WO 2010/036696, опубликованную 10 апреля, 2010, Robeyns et al., J. Am. Chem. Soc., 2008,130(6), 1979-1984; Horváth et al., Tetrahedron Letters, 2007, 48, 3621-3623; Nauwelaerts et al., J. Am. Chem. Soc., 2007, 129(30), 9340-9348; Gu et al., Nucleosides, Nucleotides & Nucleic Acids, 2005, 24(5-7), 993-998; Nauwelaerts et al., Nucleic Acids Research, 2005, 33(8), 2452-2463; Robeyns et al., Acta Crystallographica, Section F: Structural Biology and Crystallization Communications, 2005, F61(6), 585-586; Gu et al, Tetrahedron, 2004, 60(9), 2111-2123; Gu et al., Oligonucleotides, 2003, 13(6), 479-489; Wang et al., J. Org. Chem., 2003, 68, 4499-4505; Verbeure et al., Nucleic Acids Research, 2001, 29(24), 4941-4947; Wang et al., J. Org. Chem., 2001, 66, 8478-82; Wang et al., Nucleosides, Nucleotides & Nucleic Acids, 2001, 20(4-7), 785-788; Wang et al., J. Am. Chem., 2000, 122, 8595-8602; опубликованную заявку РСТ WO 06/047842; и опубликованную заявку РСТ WO 01/049687; полное содержание каждой из которых включено в данный документ посредством ссылки). Некоторые модифицированные циклогексенильные нуклеозиды имеют формулу X.

где независимо для каждого указанного по меньшей мере одного циклогексенильного нуклеозидного аналога формулы X:

Вх представляет собой фрагмент гетероциклического основания;

Т3 и Т4, каждый независимо, представляют собой межнуклеозидную линкерную группу, которая связывает циклогексенильный нуклеозидный аналог с антисмысловым соединением, или один из Т3 и Т4 представляет собой межнуклеозидную линкерную группу, которая связывает тетрагидропирановый нуклеозидный аналог с антисмысловым соединением, а другой из Т3 и Т4 представляет собой Н, гидроксил-защитную группу, связанную группу конъюгата или 5'-или 3'-концевую группу; и

q1, q2, q3, q4, q5, q6, q7, q8 и q9, каждый независимо, представляют собой Н, C16 алкил, замещенный C16 алкил, C26 алкенил, замещенный С26 алкенил, С26 алкинил, замещенный С26 алкинил или другие группы-заместители сахара.

В данной области техники известны также многие другие моноциклические, бициклические и трициклические кольцевые системы, и они подходят в качестве заменителей сахара, которые могут быть использованы для модификации нуклеозидов для внедрения в олигомерные соединения, предложенные в данном документе (см., например, обзорную статью: Leumann, Christian J. Bioorg. & Med. Chem., 2002,10, 841-854). Такие кольцевые системы могут быть подвергнуты различным дополнительным замещениям для дополнительного повышения их активности.

В данном контексте «2'-модифицированный сахар» означает фуранозильный сахар, модифицированный в 2' положении. В некоторых вариантах реализации изобретения такие модификации включают заместители, выбранные из: галогенидов, включая, но не ограничиваясь ими, замещенный и незамещенный алкокси, замещенный и незамещенный тиоалкил, замещенный и незамещенный аминоалкил, замещенный и незамещенный алкил, замещенный и незамещенный аллил и замещенный и незамещенный алкинил. В некоторых вариантах реализации изобретения 2' модификации выбраны из заместителей, включающих, но не ограничиваясь ими: O[(СН2)nO]mCH3, O(СН2)nNH2, O(СН2)nCH3, O(СН2)nF, 0(СН2)nONH2, OCH2C(=O)N(H)CH3 и О(СН2)nON(СН2)nCH3]2, где n и m равны от 1 до около 10. Другие 2' группы заместителей также могут быть выбраны из: С112 алкила, замещенного алкила, алкенила, алкинила, алкарила, аралкила, О-алкарила или О-аралкила, SH, SCH3, OCN, CI, Br, CN, F, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, гетероциклоалкила, гетероциклоалкарила, аминоалкиламино, полиалкиламино, замещенного силила, РНК расщепляющей группы, репортерной группы, интеркалятора, группы для улучшения фармакокинетических свойств или группы для улучшения фармакодинамических свойств антисмыслового соединения, и других заместителей с подобными свойствами. В некоторых вариантах реализации модифицированные нуклеозиды содержат 2'-МОЕ боковую цепь (Baker et al., J. Biol. Chem., 1997, 272, 11944-12000). Такие 2'-MOE замещения описаны как улучшающие аффинность связывания по сравнению с немодифицированными нуклеозидами и с другими модифицированными нуклеозидами, такими как 2'- O-метил, О-пропил и О-аминопропил. Было показано, что олигонуклеотиды, имеющие 2'-МОЕ заместитель, являются антисмысловыми ингибиторами экспрессии генов с перспективными возможностями для применения in vivo (Martin, Helv. Chim. Acta, 1995, 78, 486-504; Altmann et al., Chimia, 1996, 50, 168-176; Altmann et al., Biochem. Soc. Trans., 1996, 24, 630-637; и Altmann et al., Nucleosides Nucleotides, 1997, 16, 917-926).

В данном контексте «2'-модифицированный» или «2'-замещенный» относится к нуклеозиду, содержащему сахар, содержащий заместитель в 2' положении, отличный от Н или ОН. 2'-модифицированные нуклеозиды включают, но не ограничиваются ими, бициклические нуклеозиды, в которых мостик, соединяющий два атом углерода сахарного кольца, соединяет 2' атом углерода и другой атом углерода сахарного кольца; и

нуклеозиды с немостиковыми 2' заместителями, такими как аллил, амино, азидо, тио, О-аллил, O-C1-C10 алкил, -OCF3, О-(СН2)2-O-СН3, 2'-О(СН2)2SCH3, О-(СН2)2-O-N(Rm)(Rn), or О-СН2-C(=O)-N(Rm)(Rn), где каждый Rm и Rn независимо представляет собой Н или замещенный или незамещенный C110 алкил. 2'-модифицированные нуклеозиды могут также содержать другие модификации, например в других позициях сахара и/или нуклеинового основания.

В данном контексте «2'-F» относится к нуклеозиду, содержащему сахар, содержащий группу фтора в 2' положении сахарного кольца.

В данном контексте «2'-ОМе» или «2'-ОСН3», «2'-O-метил» или «2'-метокси» относятся к нуклеозиду, содержащему сахар, содержащий группу -ОСН3 в 2' положении сахарного кольца.

В данном контексте «МОЕ» или «2'-МОЕ», или «2'-OCH2CH2OCH3», или «2'-O-метоксиэтил» относится к нуклеозиду, содержащему сахар, содержащий группу -ОСН2СН2ОСН3 в 2' положении сахарного кольца.

Способы получения модифицированных сахаров хорошо известны специалистам в данной области техники. Некоторые иллюстративные патенты США, которые описывают получение таких модифицированных сахаров, включают, без ограничения, патенты США: 4981957; 5118800; 5319080; 5359044; 5393878; 5446137; 5466786; 5514785; 5519134; 5567811; 5576427; 5591722; 5597909; 5610300; 5627053; 5639873; 5646265; 5670633; 5700920; 5792847 и 6600032 и международную заявку PCT/US 2005/019219, поданную 2 июня 2005 года и опубликованную как WO 2005/121371 22 декабря 2005 года, полное содержание каждого из которых включено в данный документ посредством ссылки.

В данном контексте «олигонуклеотид» относится к соединению, содержащему множество связанных нуклеозидов. В некоторых вариантах реализации изобретения один или более из множества нуклеозидов являются модифицированными. В некоторых вариантах реализации изобретения олигонуклеотид содержит один или более рибонуклеозидов (РНК) и/или дезоксирибонуклеозидов (ДНК).

В нуклеотидах, имеющих модифицированные фрагменты сахаров, фрагменты нуклеиновых оснований (природные, модифицированные или их комбинации) сохраняются для гибридизации с соответствующей нуклеиновой кислотой-мишенью.

В некоторых вариантах реализации изобретения антисмысловые соединения содержат один или более нуклеозидов, имеющих модифицированные фрагменты сахаров. В некоторых вариантах реализации изобретения модифицированный фрагмент сахара представляет собой 2'-МОЕ. В некоторых вариантах реализации 2'-МОЕ модифицированные нуклеозиды расположены в гэпмерном мотиве. В некоторых вариантах реализации изобретения модифицированный фрагмент сахара представляет собой бициклический нуклеозид, имеющий мостиковую группу (4'-СН(СН3)-O-2'). В некоторых вариантах реализации изобретения (4'-СН(СН3)-O-2') модифицированные нуклеозиды расположены в крыльях гэпмерного мотива.

Композиции и способы составления фармацевтических композиций

Антисмысловые олигонуклеотиды могут быть смешаны с фармацевтически приемлемыми активными или инертными веществами для получения фармацевтических композиций или составов. Композиции и способы составления фармацевтических композиций зависят от множества критериев, включая, но не ограничиваясь ими, способ введения, тяжесть заболевания или дозу, подлежащую введению.

Антисмысловое соединение, к нуклеиновой кислоте C9ORF72, могут быть использованы в фармацевтических композициях путем объединения антисмыслового соединения с подходящим фармацевтически приемлемым разбавителем или носителем. Фармацевтически приемлемый разбавитель включает фосфатно-солевой буферный раствор (PBS). PBS представляет собой разбавитель, подходящий для применения в композициях, доставляемых парентерально. Соответственно, в одном из вариантов реализации в способах, описанных в настоящем документе, используют фармацевтическую композицию, содержащую антисмысловое соединение, направленное на нуклеиновую кислоту C9ORF72, и фармацевтически приемлемый разбавитель. В некоторых вариантах реализации фармацевтически приемлемый разбавитель представляет собой PBS. В некоторых вариантах реализации антисмысловое соединение представляет собой антисмысловой олигонуклеотид.

Фармацевтические композиции, содержащие антисмысловые соединения, включают любые фармацевтически приемлемые соли, сложные эфиры или соли таких сложных эфиров или любой другой олигонуклеотид, который, при введении животному, включая человека, способен обеспечить (прямо или косвенно) биологически активный метаболит или его остаток. Соответственно, например, настоящее описание относится также к фармацевтически приемлемым солям антисмысловых соединений, пролекарствам, фармацевтически приемлемым солям таких пролекарств и к другим биоэквивалентам. Пригодные фармацевтически приемлемые соли включают, но не ограничиваются ими, соли натрия и калия.

Пролекарство может включать внедрение дополнительных нуклеозидов с одного или обоих концов антисмыслового соединения, которые расщепляются в организме под действием эндогенных нуклеаз с образованием активного антисмыслового соединения.

Сопряженные антисмысловые соединения

Антисмысловые соединения могут быть ковалентно связаны с одним или более фрагментом или конъюгатом, которые усиливают активность, клеточное распределение или клеточное поглощение полученных антисмысловых олигонуклеотидов. Типичные сопряженные группы включают фрагменты холестерина и липидные фрагменты. Дополнительные сопряженные группы включают сахара, фосфолипиды, биотин, феназин, соль фолиевой кислоты, фенантридин, антрахинон, акридин, флуоресцеины, родамины, кумарины, и красители.

Антисмысловые соединения могут также быть модифицированными, чтобы иметь одну или более стабилизирующих групп, которые обычно присоединяются к одному или обоим концам антисмысловых соединений для улучшения свойств, таких как, например, устойчивость к нуклеазам. Стабилизирующие группы включают кэпирующие структуры. Такие концевые модификации защищают антисмысловое соединение с концевой нуклеиновой кислотой от разрушения под действием экзонуклеаз и могут способствовать доставке и/или локализации внутри клетки. Кэп может быть расположен на 5'-конце (5'-кэп) или на 3'-конце (3'-кэп), или может находиться на обоих концах. Кэпирующие структуры хорошо известны в данной области техники и включают, например, инвертированные дезокси кэпы с удаленными нуклеиновыми основаниями. Дополнительные 3' и 5'-стабилизирующие группы, которые могут быть использованы для кэпирования одного или обоих концов антисмыслового соединения для придания устойчивости к нуклеазам, включают группы, описанные в WO 03/004602 опубликованном 16 января 2003 года.

Клеточная культура и лечение антисмысловыми соединениями

Влияние антисмысловых соединений на уровень, активность или экспрессию нуклеиновых кислот C9ORF72 может быть испытано in vitro на различных типах клеток. Различные типы клеток, используемые для таких анализов, имеются в продаже у коммерческих поставщиков (например, Американская коллекция типов культур (АТСС), Manassus, VA; Zen-Bio, Inc., Research Triangle Park, штат Северная Каролина; Clonetics Corporation, Уолкерсвиль, штат Мэриленд) и культивируются согласно инструкциям производителей с применением коммерчески доступных реагентов (например, Invitrogen Life Technologies, Карлсбад, штат Калифорния). Иллюстративные клеточные типы включают, но не ограничиваются ими, клетки HepG2, клетки Нер3В, и первичные гепатоциты.

Тестирование антисмысловых олигонуклеотидов in vitro

В данном документе описаны способы обработки клеток антисмысловыми олигонуклеотидами, которые могут быть модифицированы соответствующим образом для обработки другими антисмысловыми соединениями.

В целом, клетки обрабатывают антисмысловыми олигонуклеотидами, когда клетки достигают приблизительно 60-80% конфлуентности в культуре.

Реагент, используемый для введения антисмысловых олигонуклеотидов в культивируемые клетки, включает катионный липидный трансфекционный реагент Липофектин (Invitrogen, Карлсбад, штат Калифорния). Антисмысловые олигонуклеотиды смешивают с LIPOFECTIN в OPTI-MEM 1 (Invitrogen, Карлсбад, штат Калифорния), чтобы достичь желаемой конечной концентрации антисмыслового олигонуклеотида и концентрации LIPOFECTIN, которая обычно варьирует в интервале 2-12 мкг/мл на 100 нМ антисмыслового олигонуклеотида.

Другой реагент, используемый для введения антисмысловых олигонуклеотидов в культивируемые клетки, включает Липофектамин (Invitrogen, Карлсбад, штат Калифорния). Антисмысловой олигонуклеотид смешивают с LIPOFECTAMINE в среде OPTI-MEM 1 со сниженным содержанием сыворотки (Invitrogen, Карлсбад, штат Калифорния), чтобы достичь желаемой концентрации антисмыслового олигонуклеотида и концентрации LIPOFECTAMINE, которая обычно варьирует в интервале 2-12 мкг/мл на 100 нМ антисмыслового олигонуклеотида.

Другая технология, используемая для введения антисмысловых олигонуклеотидов в культивируемые клетки, включает электропорацию.

Клетки обрабатывают антисмысловыми олигонуклеотидами стандартными способами. Клетки обычно собирают через 16-24 часов после обработки антисмысловым олигонуклеотидом, после чего уровни РНК или белков нуклеиновых кислот-мишеней измеряют методами, известными в данной области техники и описанными в настоящем документе. Как правило, если обработку проводят в нескольких повторениях, данные представляют как среднее значение для многократных обработок.

Концентрация используемого антисмыслового олигонуклеотида варьирует от одной линии клеток к другой. Способы определения оптимальной концентрации антисмыслового олигонуклеотида для конкретной клеточной линии хорошо известны в данной области техники. Антисмысловые олигонуклеотиды обычно используют в концентрациях от 1 нМ до 300 нМ, при трансфекции с использованием LIPOFECTAMINE. Антисмысловые олигонуклеотиды используют в более высоких концентрациях в диапазоне от 625 до 20000 нМ при трансфекции с использованием электропорации.

Выделение РНК

Анализ РНК может быть проведен на общей клеточной РНК или поли(А)+ мРНК. Способы выделения РНК хорошо известны в данной области техники. РНК получают с использованием способов, хорошо известных в данной области техники, например, с использованием реагента TRIZOL (Invitrogen, Карлсбад, штат Калифорния) по рекомендуемым протоколам производителя.

Анализ ингибирования целевых уровней или экспрессии

Ингибирование уровней или экспрессии нуклеиновой кислоты C9ORF72 может быть проанализировано различными способами, известными в данной области техники. Например, уровни нуклеиновой кислоты-мишени могут быть количественно определены, например, нозерн-блоттингом, конкурентной полимеразной цепной реакцией (ПНР) или количественной ПЦР в реальном времени. Анализ РНК может быть проведен на общей клеточной РНК или поли(А)+ мРНК. Способы выделения РНК хорошо известны в данной области техники. Нозерн-блоттинг также является общепринятым в данной области техники. Количественная ПЦР в реальном времени может быть удобно выполнена с помощью имеющихся в продаже систем обнаружения последовательностей ABI PRISM 7600, 7700, или 7900 производства компании PE-Applied Biosystems, Фостер-Сити, штат Калифорния, и используемых в соответствии с инструкциями производителя.

Анализ уровней РНК мишени методом количественной ПЦР в реальном времени

Количественное определение уровней целевой РНК может быть проведено путем количественной ПЦР в реальном времени с использованием систем обнаружения последовательностей ABI PRISM 7600, 7700 или 7900 (PE-Applied Biosystems, Фостер-Сити, штат Калифорния) в соответствии с инструкциями производителя. Способы количественной ПЦР в реальном времени хорошо известны в данной области техники.

Перед проведением ПЦР в реальном времени, выделенную РНК подвергают реакции с обратной транскриптазой (ОТ), которая производит комплементарную ДНК (кДНК), в дальнейшем используемую в качестве субстрата для ПЦР-амплификации в реальном времени. Реакции ОТ и ПЦР в реальном времени выполняются последовательно в одной и той же ячейке с образцом. Реагенты для ОТ и ПЦР в реальном времени приобретали у компании Invitrogen (Карлсбад, штат Калифорния). Реакции ОТ и ПЦР в реальном времени проводят способами, хорошо известными специалистам в данной области техники.

Количества гена-мишени (или РНК), полученные путем ПЦР в реальном времени, нормализуют с использованием либо уровня экспрессии гена, экспрессия которого постоянна, такого как циклофилин А, или на основе количественной оценки суммарной РНК с использованием реагента RIBOGREEN (Invitrogen, Inc. Карлсбад, штат Калифорния). Экспрессию циклофилина А определяют количественно с помощью ПЦР в реальном времени, проводя ее одновременно с мишенью, мультиплексно или отдельно. Общую РНК количественно определяют с помощью реагента для количественного определения РНК RIBOGREEN (Invetrogen, Inc. Юджин, штат Орегон). Способы количественного определения РНК с использованием RIBOGREEN изложены в in Jones, L.J., et al., (Analytical Biochemistry, 1998, 265, 368-374). Для измерения флуоресценции RIBOGREEN используют прибор CYTOFLUOR 4000 (РЕ Applied Biosystems).

Зонды и праймеры конструируют для гибридизации с нуклеиновой кислотой C9ORF72. Способы конструирования зондов и праймеров для ПЦР в реальном времени хорошо известны в данной области техники, и могут включать использование программного обеспечения, такого как PRIMER EXPRESS (Applied Biosystems, Фостер-Сити, штат Калифорния).

Анализ уровней белка

Антисмысловое ингибирование нуклеиновых кислот C9ORF72 может быть оценено путем измерения уровней белка C9ORF72. Уровни белка C9ORF72 могут быть оценены или количественно измерены различными способами, хорошо известными в данной области техники, такими как иммунопреципитация, вестерн-блоттинг (иммуноблоттинг), иммуноферментный анализ (ELISA), количественный анализ белка, анализ активности белка (например, анализ активности каспазы), иммуногистохимия, иммуноцитохимия или сортировка флуоресцентно-активированных клеток (FACS). Антитела, нацеленные на мишень, могут быть идентифицированы и получены из различных источников, таких как каталог антител MSRS (Aerie Corporation, Бирмингем, штат Мичиган) или могут быть получены традиционными способами получения моноклональных или поликлональных антител, хорошо известных в данной области техники. Антитела, пригодные для обнаружения C9ORF72 мышей, крыс, обезьян и человека, являются коммерчески доступными.

Тестирование антисмысловых соединений in vivo

Антисмысловые соединения, например, антисмысловые олигонуклеотиды, испытывали на животных с целью оценки их способности ингибировать экспрессию C9ORF72 и производить фенотипические изменения, такие как улучшение двигательной функции и дыхания. В некоторых вариантах реализации двигательную функцию измеряли посредством оценки способности удерживания на вращающемся барабане, прочности сжатия, залезания на шест, теста «открытое поле», балансировки на бревне, анализа отпечатков задних лап у животного. В некоторых вариантах реализации дыхание измеряли с помощью общего плетизмографа, измерений сопротивления инвазии и податливости у животного. Тестирование быть проведено на здоровых животных или в экспериментальных моделях заболеваний. Для введения животным антисмысловые олигонуклеотиды составляли в композицию с фармацевтически приемлемым разбавителем, таким как фосфатно-солевой буферный раствор (PBS) или искусственная спинномозговая жидкость (aCSF). Введение включает парентеральные способы введения, такие как интраперитонеальный, внутривенный и подкожный, а также центральные способы введения, такие как интрацеребровентрикулярный или интратекальный. Расчет дозы и частоты введения антисмыслового олигонуклеотида известен специалистам в данной области техники и зависит от таких факторов, как способ введения и масса тела животного. После периода лечения с помощью антисмысловых олигонуклеотидов, РНК выделяют из ткани ЦНС или СМЖ и измеряют изменения экспрессии нуклеиновой кислоты C9ORF72.

Направленное воздействие на C9ORF72

Антисмысловые олигонуклеотиды, описанные в настоящем документе, могут гибридизоваться с нуклеиновой кислотой C9ORF72 на любой стадии процессинга РНК. Например, в настоящем документе описаны антисмысловые олигонуклеотиды, которые комплементарны пре-мРНК или зрелой мРНК. Кроме того, антисмысловые олигонуклеотиды, описанные в настоящем документе, могут гибридизоваться с любым элементом нуклеиновой кислоты C9ORF72. Например, в настоящем документе описаны антисмысловые олигонуклеотиды, которые комплементарны экзону, интрону, 5' UTR, 3' UTR, области повтора, экспансии гексануклеотидного повтора, границе сплайсинга, экзон: экзонной границе сплайсинга, экзонному сайленсеру сплайсинга (ESS), экзонному энхансеру сплайсинга (ESE), экзону 1а, экзону 1b, экзону 1с, экзону 1d, экзону 1е, экзону 2, экзону 3, экзону 4, экзону 5, экзону 6, экзону 7, экзону 8, экзону 9, экзону 10, экзону 11, интрону 1, интрону 2, интрону 3, интрону 4, интрону 5, интрону 6, интрону 7, интрону 8, интрону 9 или интрону 10 нуклеиновой кислоты C9ORF72.

В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, гибридизуются со всеми вариантами C9ORF72. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, селективно гибридизуются с некоторыми вариантами C9ORF72. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, селективно гибридизуются с вариантами C9ORF72, содержащими экспансию гексануклеотидного повтора. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, селективно гибридизуются с вариантами пре-мРНК, содержащими гексануклеотидный повтор. В некоторых вариантах реализации варианты пре-мРНК C9ORF72, содержащие экспансию гексануклеотидного повтора, включают SEQ ID NO: 1-3 и 6-10. В некоторых вариантах реализации такая экспансия гексануклеотидного повтора содержит по меньшей мере 24 повтора любого из GGGGCC, GGGGGG, GGGGGC или GGGGCG.

В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, ингибируют экспрессию всех вариантов C9ORF72. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, ингибируют экспрессию всех вариантов C9ORF72 в равной степени. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, предпочтительно ингибируют экспрессию одного или более вариантов C9ORF72. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, предпочтительно ингибируют экспрессию вариантов C9ORF72, содержащих экспансию гексануклеотидного повтора. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, селективно ингибируют экспрессию вариантов пре-мРНК, содержащих гексануклеотидный повтор. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, селективно ингибируют экспрессию патоген-ассоциированных вариантов мРНК C9ORF72. В некоторых вариантах реализации варианты пре-мРНК C9ORF72, содержащие экспансию гексануклеотидного повтора, включают SEQ ID NO: 1-3 и 6-10. В некоторых вариантах реализации такая экспансия гексануклеотидного повтора содержит по меньшей мере 24 повтора любого из GGGGCC, GGGGGG, GGGGGC или GGGGCG. В некоторых вариантах реализации экспансия гексануклеотидного повтора образует ядерные очаги. В некоторых вариантах реализации антисмысловые олигонуклеотиды, описанные в настоящем документе, пригодны для сокращения ядерных очагов. Ядерные очаги могут быть сокращены в отношении процента клеток с такими очагами, а также в отношении количества очагов на одну клетку.

Селективное ингибирование некоторых патогенных ассоциированных вариантов.

В некоторых примерах, представленных в настоящем документе, набор праймеров и зондов RTS3905 обнаруживает вариант мРНК (например, NM_001256054.1), процессированный из варианта пре-мРНК, содержащего гексануклеотидный повтор. Вариант мРНК, процессированный из варианта пре-мРНК, содержит гексануклеотидный повтор (т.е. «патоген-ассоциированный вариант мРНК C9ORF72»). Пре-мРНК содержит гексануклеотидный повтор, если транскрипция пре-мРНК начинается в области от сайта инициации экзона 1А к сайту инициации экзона 1 В, например, с 1107 по 1520 нуклеотиды геномной последовательности (SEQ ID NO: 2, комплемент номера доступа GENBANKNT_008413.18, усеченной по нуклеозидам с 27535000 по 27565000). В указанной области были сконструированы олигонуклеотиды для селективного воздействия на вариант пре-мРНК, содержащий гексануклеотидный повтор. RTS3905 обеспечивает возможность измерения продукта мРНК (т.е. патоген-ассоциированного варианта мРНК C9ORF72) варианта пре-мРНК, содержащего гексануклеотидный повтор, и, следовательно, обеспечивает возможность измерения снижения варианта пре-мРНК, содержащего гексануклеотидный повтор.

Особенности C9ORF72

Антисмысловые олигонуклеотиды, описанные в настоящем документе, могут гибридизоваться с любым вариантом C9ORF72 в любом состоянии процессинга в любом элементе гена C9ORF72. Например, антисмысловые олигонуклеотиды, описанные в настоящем документе, могут гибридизоваться с экзоном, интроном 5' UTR, 3' UTR, областью повтора, экспансией гексануклеотидного повтора, границей сплайсинга, экзон: экзонной границей сплайсинга, экзонным сайленсером сплайсинга (ESS), экзонным энхансером сплайсинга (ESE), экзоном 1а, экзоном 1b, экзоном 1с, экзоном 1d, экзоном 1е, экзоном 2, экзоном 3, экзоном 4, экзоном 5, экзоном 6, экзоном 7, экзоном 8, экзоном 9, экзоном 10, экзоном 11, интроном 1, интроном 2, интроном 3, интроном 4, интроном 5, интроном 6, интроном 7, интроном 8, интроном 9 или интроном 10. Например, антисмысловые олигонуклеотиды могут быть направлены на любой из экзонов, описанных ниже в таблицах 1-5 для различных вариантов C9ORF72, описанных ниже. Антисмысловые олигонуклеотиды, описанные в настоящем документе, также могут быть направлены на варианты, не описанные ниже, и такие варианты описаны в GENBANK. Кроме того, антисмысловые олигонуклеотиды, описанные в настоящем документе, также могут быть направлены на элементы, отличные от экзонов, и такие элементы описаны в GENBANK.

Некоторые показания

В некоторых вариантах реализации настоящего изобретения предложены способы лечения индивидуума, включающие введение одной или более фармацевтических композиций, описанных в настоящем документе. В некоторых вариантах реализации индивидуум страдает нейродегенеративным заболеванием. В некоторых вариантах реализации индивидуум имеет риск развития нейродегенеративного заболевания, включая, но не ограничиваясь ими, ALS или FTD. В некоторых вариантах реализации у индивидуума идентифицировано C9ORF72-ассоциированное заболевание. В некоторых вариантах реализации в настоящем документе предложены способы профилактического снижения экспрессии C9ORF72 у индивидуума. Некоторые варианты реализации включают лечение индивидуума, нуждающегося в этом, путем введения индивидууму терапевтически эффективного количества антисмыслового соединения к нуклеиновой кислоте C9ORF72.

В некоторых вариантах реализации введение терапевтически эффективного количества антисмыслового соединения, направленного на нуклеиновую кислоту C9ORF72, сопровождается мониторингом уровней C9ORF72 у индивидуума для определения реакции индивидуума на введение антисмыслового соединения. Реакцию индивидуума на введение антисмыслового соединения врач может использовать для определения объема и продолжительности терапевтического вмешательства.

В некоторых вариантах реализации введение антисмыслового соединения, направленного на нуклеиновую кислоту C9ORF72, приводит к снижению экспрессии C9ORF72 на по меньшей мере 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 или 99%, или на значение в диапазоне между любыми двумя из указанных значений. В некоторых вариантах реализации введение антисмыслового соединения, направленного на нуклеиновую кислоту C9ORF72, приводит к улучшению двигательной функции и дыхания у животного. В некоторых вариантах реализации введение антисмыслового соединения к C9ORF72 обеспечивает улучшение двигательной функции и дыхания на по меньшей мере 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 или 99%, или на значение в диапазоне между любыми двумя из указанных значений.

В некоторых вариантах реализации фармацевтические композиции, содержащие антисмысловое соединение, направленное на C9ORF72, используют для получения лекарственного средства для лечения пациента, страдающего или предрасположенного к нейродегенеративному заболеванию, включая ALS и FTD.

Некоторые комбинированные терапии

В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, вводят совместно с одним или более другими фармацевтическими агентами. В некоторых вариантах реализации такой один или более других фармацевтических агентов предназначены для лечения того же заболевания, расстройства или патологического состояния, что и одна или более фармацевтических композиций, описанных в настоящем документе. В некоторых вариантах реализации такой один или более других фармацевтических агентов предназначены для лечения другого заболевания, расстройства или патологического состояния, чем одна или более фармацевтических композиций, описанных в настоящем документе. В некоторых вариантах реализации такой один или более других фармацевтических агентов предназначены для лечения нежелательного побочного эффекта одной или более фармацевтических композиций, описанных в настоящем документе. В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, вводят совместно с другим фармацевтическим агентом для лечения нежелательного побочного эффекта указанного другого фармацевтического агента. В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, вводят совместно с другим фармацевтическим агентом для обеспечения комбинированного эффекта. В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, вводят совместно с другим фармацевтическим агентом для обеспечения синергетического эффекта.

В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, и один или более других фармацевтических агентов вводят одновременно. В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, и один или более других фармацевтических агентов вводят в разное время. В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, и один или более других фармацевтических агентов получают вместе в составе одной лекарственной формы. В некоторых вариантах реализации одну или более фармацевтических композиций, описанных в настоящем документе, и один или более других фармацевтических агентов получают по отдельности.

В некоторых вариантах реализации фармацевтические агенты, которые могут быть совместно введены с фармацевтической композицией, описанной в настоящем документе, включают рилузол (рилутек), лиорезал (лиорезал) и декспрамипексол.

В некоторых вариантах реализации фармацевтические агенты, которые могут быть введены совместно со специфическим ингибитором C9ORF72, описанным в настоящем документе, включают, но не ограничиваются им, дополнительный ингибитор C9ORF72.

В некоторых вариантах реализации фармацевтические агенты, которые могут быть введены совместно со специфическим ингибитором C9ORF72, описанным в настоящем документе, включают, но не ограничиваются ими, специфический ингибитор антисмыслового транскрипта C9ORF72. В некоторых вариантах реализации специфический ингибитор антисмыслового транскрипта C9ORF72 представляет собой антисмысловое соединение. В некоторых вариантах реализации антисмысловое соединение представляет собой модифицированный олигонуклеотид. В некоторых вариантах реализации модифицированный олигонуклеотид является одноцепочечным.

В некоторых вариантах реализации совместно вводимый фармацевтический агент вводят до введения фармацевтической композиции, описанной в настоящем документе. В некоторых вариантах реализации совместно вводимый фармацевтический агент вводят после введения фармацевтической композиции, описанной в настоящем документе. В некоторых вариантах реализации совместно вводимый фармацевтический агент вводят одновременно с фармацевтической композицией, описанной в настоящем документе. В некоторых вариантах реализации доза совместно вводимого фармацевтического агента является такой же, как доза, которая была бы введена в случае отдельного введения совместно вводимого фармацевтического агента. В некоторых вариантах реализации доза совместно вводимого фармацевтического агента ниже, чем доза, которая была бы введена в случае отдельного введения совместно вводимого фармацевтического агента. В некоторых вариантах реализации доза совместно вводимого фармацевтического агента выше, чем доза, которая была бы введена в случае отдельного введения совместно вводимого фармацевтического агента.

В некоторых вариантах реализации совместное введение второго соединения усиливает эффект первого соединения, так что указанное совместное введение соединений приводит к получению более высокого эффекта, чем эффект от введения только первого соединения. В других вариантах реализации совместное введение приводит к получению эффектов, которые являются аддитивными для эффектов указанных соединений при введении по отдельности. В некоторых вариантах реализации совместное введение приводит к получению эффектов, которые являются сверхаддитивными для эффектов указанных соединений при введении по отдельности. В некоторых вариантах реализации первое соединение представляет собой антисмысловое соединение. В некоторых вариантах реализации второе соединение представляет собой антисмысловое соединение.

Некоторые композиции сравнения

В некоторых вариантах реализации соединения, описанные в настоящем документе, являются более переносимыми, чем ISIS 576816, ISIS 576974, ISIS 577061, ISIS 577065 и/или ISIS 577083. ISIS 576816, ISIS 576974, ISIS 577061, ISIS 577065 и ISIS 577083 были выбраны в качестве соединений сравнения, поскольку они демонстрируют высокие уровни дозозависимого снижения мРНК C9ORF72 в различных исследованиях, описанных в WO2014/062691. Таким образом, ISIS 576816, ISIS 576974, ISIS 577061, ISIS 577065 и ISIS 577083 предположительно являются высокоэффективными и сильнодействующими соединениями. Кроме того, ISIS 577065, ISIS 577056 и ISIS 576816, описанные в WO 2014/062691, являются структурно родственными соединениям, описанным в настоящем документе. Например, ISIS 577065 имеет 16 нуклеиновых оснований, перекрывающихся с ISIS 801287; ISIS 577056 имеет 16 нуклеиновых оснований, перекрывающихся с ISIS 806679; ISIS 576816 имеет 18 нуклеиновых оснований, перекрывающихся с ISIS 802473 (18-мер); и ISIS 576816 имеет 18 нуклеиновых оснований, перекрывающихся с ISIS 802459.

В некоторых вариантах реализации ISIS 576816, 5-10-5 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GCCTTACTCTAGGACCAAGA (включенную в настоящий документ как SEQ ID NO: 21), где каждая межнуклеозидная связь представляет собой тиофосфатную связь, каждый цитозин представляет собой 5-метилцитозин, и каждый из нуклеозидов 1-5 и 16-20 содержит 2'-O-метоксиэтильную группу, который ранее был описан в WO2014/062691, включенной в настоящий документ посредством ссылки, представляет собой соединение сравнения. ISIS 576816 обеспечивает среднюю оценку FOB 7,00 в испытании острой переносимости у мышей (см. пример 3, представленный ниже). Некоторые соединения, описанные в настоящем документе, обеспечивают более низкую оценку FOB в аналогичном испытании острой переносимости у мышей (см. пример 2, представленный ниже), включая ISIS 801287, ISIS 806679, ISIS 802473 и ISIS 802459. Таким образом, некоторые соединения, описанные в настоящем документе, являются более переносимыми, чем соединение сравнения ISIS 576816.

В некоторых вариантах реализации ISIS 576974, 5-10-5 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GGGACACTACAAGGTAGTAT (включенную в настоящий документ как SEQ ID NO: 56), где каждая межнуклеозидная связь представляет собой тиофосфатную связь, каждый цитозин представляет собой 5-метилцитозин, и каждый из нуклеозидов 1-5 и 16-20 содержит 2'-O-метоксиэтильную группу, который ранее был описан в WO 2014/062691, включенной в настоящий документ посредством ссылки, представляет собой соединение сравнения. ISIS 576974 обеспечивает среднюю оценку FOB 5,67 в испытании острой переносимости у мышей (см. пример 3, представленный ниже). Некоторые соединения, описанные в настоящем документе, обеспечивают более низкую оценку FOB в аналогичном испытании острой переносимости у мышей (см. пример 2, представленный ниже), включая ISIS 801287, ISIS 806679, ISIS 802473 и ISIS 802459. Таким образом, некоторые соединения, описанные в настоящем документе, являются более переносимыми, чем соединение сравнения ISIS 576974.

В некоторых вариантах реализации ISIS 577061, 5-10-5 МОЕ гэпмер, имеющий последовательность (от 5' к 3') TACAGGCTGCGGTTGTTTCC (включенную в настоящий документ как SEQ ID NO: 57), где каждая межнуклеозидная связь представляет собой тиофосфатную связь, каждый цитозин представляет собой 5-метилцитозин, и каждый из нуклеозидов 1-5 и 16-20 содержит 2'-O-метоксиэтильную группу, который ранее был описан в WO 2014/062691, включенной в настоящий документ посредством ссылки, представляет собой соединение сравнения. ISIS 577061 обеспечивает среднюю оценку FOB 7,00 в испытании острой переносимости у мышей (см. пример 3, представленный ниже). Некоторые соединения, описанные в настоящем документе, обеспечивают более низкую оценку FOB в аналогичном испытании острой переносимости у мышей (см. пример 2, представленный ниже), включая ISIS 801287, ISIS 806679, ISIS 802473 и ISIS 802459. Таким образом, некоторые соединения, описанные в настоящем документе, являются более переносимыми, чем соединение сравнения ISIS 577061.

В некоторых вариантах реализации ISIS 577065, 5-10-5 МОЕ гэпмер, имеющий последовательность (от 5' к 3') CCCGGCCCCTAGCGCGCGAC (включенную в настоящий документ как SEQ ID NO: 58), где каждая межнуклеозидная связь представляет собой тиофосфатную связь, каждый цитозин представляет собой 5-метилцитозин, и каждый из нуклеозидов 1-5 и 16-20 содержит 2'-O-метоксиэтильную группу, который ранее был описан в WO 2014/062691, включенной в настоящий документ посредством ссылки, представляет собой соединение сравнения. ISIS 577065 обеспечивает среднюю оценку FOB 6,00 в испытании острой переносимости у мышей (см. пример 3, представленный ниже). Некоторые соединения, описанные в настоящем документе, обеспечивают более низкую оценку FOB в аналогичном испытании острой переносимости у мышей (см. пример 2, представленный ниже), включая ISIS 801287, ISIS 806679, ISIS 802473 и ISIS 802459. Таким образом, некоторые соединения, описанные в настоящем документе, являются более переносимыми, чем соединение сравнения ISIS 577065.

В некоторых вариантах реализации ISIS 577083, 5-10-5 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GGTAACTTCAAACTCTTGGG (включенную в настоящий документ как SEQ ID NO: 59), где каждая межнуклеозидная связь представляет собой тиофосфатную связь, каждый цитозин представляет собой 5-метилцитозин, и каждый из нуклеозидов 1-5 и 16-20 содержит 2'-O-метоксиэтильную группу, который ранее был описан в WO 2014/062691, включенной в настоящий документ посредством ссылки, представляет собой соединение сравнения. ISIS 577083 обеспечивает среднюю оценку FOB 7,00 в испытании острой переносимости у мышей (см. пример 3, представленный ниже). Некоторые соединения, описанные в настоящем документе, обеспечивают более низкую оценку FOB в аналогичном испытании острой переносимости у мышей (см. пример 2, представленный ниже), включая ISIS 801287, ISIS 806679, ISIS 802473 и ISIS 802459. Таким образом, некоторые соединения, описанные в настоящем документе, являются более переносимыми, чем соединение сравнения ISIS 577083.

В некоторых вариантах реализации ISIS 577056, 5-10-5 МОЕ гэпмер, имеющий последовательность (от 5' к 3') AATCTTTATCAGGTCTTTTC (включенную в настоящий документ как SEQ ID NO: 60), где каждая межнуклеозидная связь представляет собой тиофосфатную связь, каждый цитозин представляет собой 5-метилцитозин, и каждый из нуклеозидов 1-5 и 16-20 содержит 2'-O-метоксиэтильную группу, который ранее был описан в WO 2014/062691, включенной в настоящий документ посредством ссылки, представляет собой соединение сравнения. ISIS 577056 обеспечивает среднюю оценку FOB 6,5 в испытании острой переносимости у мышей (см. пример 3, представленный ниже). Некоторые соединения, описанные в настоящем документе, обеспечивают более низкую оценку FOB в аналогичном испытании острой переносимости у мышей (см. пример 2, представленный ниже), включая ISIS 801287, ISIS 806679, ISIS 802473 и ISIS 802459. Таким образом, некоторые соединения, описанные в настоящем документе, являются более переносимыми, чем соединение сравнения ISIS 577056.

Некоторые терапевтические средства для лечения людей

Антисмысловые олигонуклеотиды к человеческому C9ORF72, описанные в настоящем документе, представляют собой терапевтические средства для лечения людей. Были изучены различные параметры активности, эффективности и/или переносимости. Такие параметры включают in vitro ингибирование экспрессии общей РНК C9ORF72, in vitro ингибирование экспрессии патоген-ассоциированного варианта РНК C9ORF72, in vitro эффект дозы (IC50), in vivo ингибирование общей или патогенной РНК и/или белка у трансгенных животных, несущих трансген человеческого C9ORF72 в релевантных тканях (например, головном мозге и/или спинном мозге), переносимость у мышей, переносимость у крыс и/или переносимость у приматов. Маркеры переносимости, которые могут быть измерены, включают химические параметры крови и плазмы, химические параметры СМЖ, массу тела и органов, общие наблюдения и/или поведенческие тесты, и/или биохимические маркеры, такие как GFAP и/или AIF1. Может быть измерена острая или долговременная переносимость.

Некоторые композиции

1. ISIS 801287

В некоторых вариантах реализации ISIS 801287 характеризуется как 4-8-6 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GCCCCTAGCGCGCGACTC (включенную в настоящий документ как SEQ ID NO: 33), где каждый из нуклеозидов 1-4 и 13-18 представляет собой 2'-O-метоксиэтилрибозный модифицированный нуклеозид, и каждый из нуклеозидов 5-12 представляет собой 2'-дезоксинуклеозид, где межнуклеозидные связи между нуклеозидами 2 и 3, 3 и 4, 13 и 14, 14 и 15, и 15 и 16 представляют собой фосфодиэфирные связи, и межнуклеозидные связи между нуклеозидами 1 и 2, 4 и 5, 5 и 6, 6 и 7, 7 и 8, 8 и 9, 9 и 10, 10 и 11, 11 и 12, 12 и 13, 16 и 17, и 17 и 18 представляют собой тиофосфатные связи, и где каждый цитозин представляет собой 5'-метилцитозин.

В некоторых вариантах реализации ISIS 801287 описан следующей химической записью: Ges mCeo mCeo mCes mCds Tds Ads Gds mCds Gds mCds Gds mCeo Geo Aeo mCes Tes mCe; где

A = аденин,

mC = 5'-метилцитозин

G = гуанин,

T = тимин,

e = 2'-O-метоксиэтилрибозный модифицированный сахар,

d = 2'-дезоксирибозный сахар.

s = тиофосфатная межнуклеозидная связь, и

о = фосфодиэфирная межнуклеозидная связь.

В некоторых вариантах реализации ISIS 801287 описан следующей химической структурой, или его соль:

В некоторых вариантах реализации натриевая соль ISIS 801287 описана следующей химической структурой:

2. ISIS 806679

В некоторых вариантах реализации ISIS 806679 характеризуется как 6-10-4 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GGTTAATCTTTATCAGGTCT (включенную в настоящий документ как SEQ ID NO: 49), где каждый из нуклеозидов 1-6 и 17-20 представляет собой 2'-O-метоксиэтилрибозный модифицированный нуклеозид, и каждый из нуклеозидов 7-16 представляет собой 2'-дезоксинуклеозид, где межнуклеозидные связи между нуклеозидами 2 и 3, 3 и 4, 4 и 5, 5 и 6, 6 и 7, и 17 и 18 представляют собой фосфодиэфирные связи, и межнуклеозидные связи между нуклеозидами 1 и 2, 7 и 8, 8 и 9, 9 и 10, 10 и 11, 11 и 12, 12 и 13, 13 и 14, 14 и 15, 15 и 16, 16 и 17, 18 и 19, и 19 и 20 представляют собой тиофосфатные связи, и где каждый цитозин представляет собой 5'-метилцитозин.

В некоторых вариантах реализации ISIS 806679 описан следующей химической записью: Ges Geo Тео Тео Aeo Aeo Tds mCds Tds Tds Tds Ads Tds mCds Ads Gds Geo Tes mCes Те; где

A = аденин,

mC = 5'-метилцитозин

G = гуанин,

T = тимин,

е = 2'-O-метоксиэтилрибозный модифицированный сахар,

d = 2'-дезоксирибозный сахар.

s = тиофосфатная межнуклеозидная связь, и

о = фосфодиэфирная межнуклеозидная связь.

В некоторых вариантах реализации ISIS 806679 описан следующей химической структурой, или его соль:

В некоторых вариантах реализации натриевая соль ISIS 806679 описана следующей химической структурой:

3. ISIS 802473

В некоторых вариантах реализации ISIS 802473 характеризуется как 4-8-6 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GCCTTACTCTAGGACCAA (включенную в настоящий документ как SEQ ID NO: 47), где каждый из нуклеозидов 1-4 и 13-18 представляет собой 2'-O-метоксиэтилрибозный модифицированный нуклеозид, и каждый из нуклеозидов 5-12 представляет собой 2'-дезоксинуклеозид, где межнуклеозидные связи между нуклеозидами 2 и 3, 3 и 4, 13 и 14, 14 и 15, и 15 и 16 представляют собой фосфодиэфирные связи, и межнуклеозидные связи между нуклеозидами 1 и 2, 4 и 5, 5 и 6, 6 и 7, 7 и 8, 8 и 9, 9 и 10, 10 и 11, 11 и 12, 12 и 13, 16 и 17, и 17 и 18 представляют собой тиофосфатные связи, и где каждый цитозин представляет собой 5'-метилцитозин.

В некоторых вариантах реализации ISIS 802473 описан следующей химической записью: Ges mCeo mCeo Tes Tds Ads mCds Tds mCds Tds Ads Gds Geo Aeo mCeo mCes Aes Ae; где

A = аденин,

mC = 5'-метилцитозин

G = гуанин,

T = тимин,

e = 2'-O-метоксиэтилрибозный модифицированный сахар,

d = 2'-дезоксирибозньш сахар.

s = тиофосфатная межнуклеозидная связь, и

о = фосфодиэфирная межнуклеозидная связь.

В некоторых вариантах реализации ISIS 802473 описан следующей химической структурой, или его соль:

В некоторых вариантах реализации натриевая соль ISIS 802473 описана следующей химической структурой:

4. ISIS 802459

В некоторых вариантах реализации ISIS 802459 характеризуется как 3-10-7 МОЕ гэпмер, имеющий последовательность (от 5' к 3') GCCTTACTCTAGGACCAAGA (включенную в настоящий документ как SEQ ID NO: 21), где каждый из нуклеозидов 1-3 и 14-20 представляет собой 2'-O-метоксиэтилрибозный модифицированный нуклеозид, и каждый из нуклеозидов 4-13 представляет собой 2'-дезоксинуклеозид, где межнуклеозидные связи между нуклеозидами 2 и 3, 3 и 4, 14 и 15, 15 и 16, 16 и 17, и 17 и 18 представляют собой фосфодиэфирные связи, и межнуклеозидные связи между нуклеозидами 1 и 2, 4 и 5, 5 и 6, 6 и 7, 7 и 8, 8 и 9, 9 и 10, 10 и 11, 11 и 12, 12 и 13, 13 и 14, 18 и 19, и 19 и 20 представляют собой тиофосфатные связи, и где каждый цитозин представляет собой 5'-метилцитозин.

В некоторых вариантах реализации ISIS 802459 описан следующей химической записью: Ges mCeo mCeo Tds Tds Ads mCds Tds mCds Tds Ads Gds Gds Aeo mCeo mCeo Aeo Aes Ges Ae; где

A = аденин,

mC = 5'-метилцитозин

G = гуанин,

T = тимин,

e = 2'-O-метоксиэтилрибозный модифицированный сахар,

d = 2'-дезоксирибозный сахар.

s = тиофосфатная межнуклеозидная связь, и

о = фосфодиэфирная межнуклеозидная связь.

В некоторых вариантах реализации ISIS 802459 описан следующей химической структурой, или его соль:

В некоторых вариантах реализации натриевая соль ISIS 802459 описана следующей химической структурой:

ПРИМЕРЫ

Неограничивающее описание и включение посредством ссылки

Хотя некоторые соединения, композиции и способы, описанные в данном документе, были описаны в соответствии с некоторыми вариантами реализации изобретения, следующие примеры служат только для иллюстрации соединений, описанных в настоящем документе, и не подразумевают его ограничения. Каждая ссылка, упоминаемая в настоящей заявке, включена в данный документ посредством ссылки в полном объеме.

Пример 1: Антисмысловые олигонуклеотиды, направленные на человеческий C9ORF72

Антисмысловые олигонуклеотиды в представленной ниже таблице были сконструированы как МОЕ гэпмеры. Центральный сегмент гэп каждого гэпмера содержит 2'-дезоксинуклеозиды и окружен сегментами крыльев с 5' конца и 3' конца, содержащими нуклеозиды, каждый из которых содержит группу 2'-МОЕ. Конкретный мотив каждого гэпмера указан в представленной ниже таблице, обозначенный тремя числами, разделенными дефисами. Числа означают количество нуклеозидов в 5'-крыле, гэп и 3'-крыле, соответственно. Все остатки цитозина в каждом олигонуклеотиде представляют собой 5-метилцитозины. Межнуклеозидные связи в гэпмерах представляют собой смешанные тиофосфатные и фосфодиэфирные связи. Межнуклеозидные связи для каждого гэпмера представлены в колонке «Связь», где «о» означает фосфодиэфирную связь, и «s» означает тиофосфатную связь.

Каждый антисмысловой олигонуклеотид, перечисленный в следующей таблице, нацелен на человеческую геномную последовательность C9ORF72, обозначенную в настоящем документе как SEQ ID NO: 2 (комплемент номера доступа GENBANKNT_008413.18, усеченной по нуклеозидам с 27535000 по 27565000). «Сайт инициации» обозначает самый крайний 5' нуклеозид, на который направлен гэпмер в геномной последовательности человека. «Сайт терминации» обозначает самый крайний 3' нуклеозид, на который направлен гэпмер в геномной последовательности человека.

Пример 2: Переносимость антисмысловых олигонуклеотидов, направленных на человеческий C9ORF72, у мышей

Антисмысловые олигонуклеотиды, описанные выше, испытывали на мышах для оценки переносимости олигонуклеотидов. Мышам С57/В16 дикого типа вводили однократную ICV дозу 700 мкг антисмыслового олигонуклеотида, указанного в следующей таблице. Каждая экспериментальная группа состояла из 4 мышей. Через 3 часа после инъекции каждую мышь оценивали по 7 различным критериям. 7 критериев представляют собой: (1) мышь была бодрой, бдительной и отзывчивой; (2) мышь стояла или сгибалась без раздражителя; (3) мышь выполняла любое движение без раздражителя; (4) мышь демонстрировала движение вперед после того, как ее подняли; (5) мышь демонстрировала любое движение после того, как ее подняли; (6) мышь реагировала на щипок за хвост; (7) ровное дыхание. Для каждого из 7 различных критериев, каждой мыши начисляли балл 0, если она отвечала критерию, или 1 если она не отвечала ему. После оценки всех 7 критериев суммировали промежуточные оценки для каждой мыши, а затем усредняли для каждой группы. Например, если мышь была бодрой, бдительной и отзывчивой через 3 часа после ICV введения дозы 700 мкг, и соответствовала всем остальным критериям, она получала суммарный балл 0. Если другая мышь не была бодрой, бдительной и отзывчивой через 3 часа после ICV введения дозы 700 мкг, но соответствовала всем остальным критериям, она получала суммарный балл 1. Результаты представлены в виде среднего балла по каждой экспериментальной группе.

Пример 3: Переносимость олигонуклеотидов из WO 2014/062691

Олигонуклеотиды, описанные в WO 2014/062691, испытывали в исследовании острой переносимости на мышах. Группы по 3 мыши С57/В16 дикого типа лечили и анализировали так, как описано в примере 2. Испытанные олигонуклеотиды включали те, которые перечислены в следующей таблице, которые представляют собой 5-10-5 МОЕ гэпмеры с полностью тиофосфатным скелетом, и каждый цитозин представляет собой 5-метилцитозин. Представлены сайты инициации и терминации SEQ ID NO: 2, на которую направлен каждый олигонуклеотид. В следующей таблице результаты представлены в виде среднего балла по каждой экспериментальной группе. Полученные результаты демонстрируют, что ISIS 576816, ISIS 576974, ISIS 577061, ISIS 577065, ISIS 577083 и ISIS 577056 переносятся неудовлетворительно.

Пример 4: Антисмысловое ингибирование варианта мРНК человеческого C9ORF72 в клетках HepG2

Антисмысловые олигонуклеотиды, описанные выше, испытывали на их влияние на мРНК C9ORF72 in vitro. Культивированные клетки HepG2 с плотностью 20000 клеток на лунку обрабатывали электропорацией с антисмысловым олигонуклеотидом. После периода обработки длительностью около 24 часов, РНК выделяли из клеток и уровни мРНК C9ORF72 измеряли методом количественной ПЦР в реальном времени. Использовали набор праймеров и зондов человека RTS3905 (прямая последовательность GGGTCTAGCAAGAGCAGGTG, обозначенная в настоящем документе как SEQ ID NO: 12; обратная последовательность GTCTTGGCAACAGCTGGAGAT, обозначенная в настоящем документе как SEQ ID NO: 13; последовательность зонда TGATGTCGACTCTTTGCCCACCGC, обозначенная в настоящем документе как SEQ ID NO: 14 - набор праймеров и зондов TAQ-man). RTS3905 обеспечивает обнаружение варианта мРНК (например, NH_001256054.1), процессированный из варианта пре-мРНК, содержащего гексануклеотидный повтор. Вариант мРНК, процессированный из варианта пре-мРНК, содержащий гексануклеотидный повтор, в настоящем документе представляет собой «патоген-ассоциированный вариант мРНК C9ORF72». Пре-мРНК содержит гексануклеотидный повтор, если транскрипция пре-мРНК начинается в области от сайта инициации экзона 1А к сайту инициации экзона 1 В (обычно с 1107 по 1520 нуклеотиды геномной последовательности: SEQ ID NO: 2, комплемент номера доступа GENBANKNT_008413.18, усеченной по нуклеозидам с 27535000 по 2756500. Следовательно, олигонуклеотиды, сконструированные в данной области, селективно направлены на вариант пре-мРНК, содержащий гексануклеотидный повтор. RTS3905 обеспечивает возможность измерения продукта мРНК (т.е. патоген-ассоциированного варианта мРНК C9ORF72) варианта пре-мРНК, содержащего гексануклеотидный повтор, и, следовательно, обеспечивает возможность измерения снижения варианта пре-мРНК, содержащего гексануклеотидный повтор. Уровни патоген-ассоциированного варианта мРНК C9ORF72 нормализовали к общему содержанию РНК в клетке по результатам измерения с помощью RIBOGREEN®, затем нормализованные уровни варианта мРНК сравнивали с аналогичным показателем в клетках, не обработанных антисмысловым олигонуклеотидом.

Пример 5: Дозозависимое антисмысловое ингибирование варианта мРНК человеческого C9ORF72

Антисмысловые олигонуклеотиды, описанные выше, испытывали в различных дозах на клетках HepG2. Клетки помещали на планшет с плотностью 20000 клеток на лунку и обрабатывали электропорацией с антисмысловым олигонуклеотидом. После периода обработки длительностью около 16 часов или 24 часов, РНК выделяли из клеток и уровни мРНК C9ORF72 измеряли методом количественной ПЦР в реальном времени. Для измерения патоген-ассоциированного варианта мРНК C9ORF72 использовали набор праймеров и зондов RTS3905 человеческого C9ORF72. Уровни патоген-ассоциированного варианта мРНК C9ORF72 корректировали в соответствии с общим содержанием РНК, измеренным с помощью RIBOGREEN®. Полумаксимальную ингибирующую концентрацию (IC50) каждого олигонуклеотида рассчитывали на основании ингибирования уровней мРНК варианта, наблюдаемого для каждой отдельной дозы антисмыслового олигонуклеотида.

Пример 6: Антисмысловое ингибирование C9ORF72 кросс-реактивными в отношении человека и резуса антисмысловыми олигонуклеотидами в клетках LLC-МK2

Антисмысловые олигонуклеотиды, описанные выше, которые являются полностью кросс-реактивными с нуклеиновой кислотой C9ORF72 резуса, испытывали на их влияние на мРНК C9ORF72 резуса in vitro. Культивированные клетки LLC-MK2 резуса с плотностью 20000 клеток на лунку обрабатывали электропорацией с антисмысловым олигонуклеотидом. После периода обработки длительностью около 24 часов, РНК выделяли из клеток и уровни мРНК C9ORF72 измеряли методом количественной ПЦР в реальном времени. Использовали набор праймеров и зондов RTS3750 (прямая последовательность TGTGACAGTTGGAATGCAGTGA, обозначенная в настоящем документе как SEQ ID NO: 15; обратная последовательность GCCACTTAAAGCAATCTCTGTCTTG, обозначенная в настоящем документе как SEQ ID NO: 16; последовательность зонда TCGACTCTTTGCCCACCGCCA, обозначенная в настоящем документе как SEQ ID NO: 17 - набор праймеров и зондов TAQ-man) для измерения уровней общей мРНК C9ORF72. RTS3750 нацелен на экзон 2 транскриптов мРНК и, следовательно, обеспечивает возможность измерения всех транскриптов мРНК. Уровни мРНК C9ORF72 корректировали в соответствии с общим содержанием РНК, измеренным с помощью RIBOGREEN®, затем нормализованные уровни варианта мРНК сравнивали с аналогичным показателем в клетках, не обработанных антисмысловым олигонуклеотидом.

Пример 7: Дозозависимое антисмысловое ингибирование мРНК человеческого C9ORF72 в LLC-MK2

Антисмысловые олигонуклеотиды, описанные выше, испытывали в различных дозах на клетках LLC-MK2. Клетки помещали на планшет с плотностью 20000 клеток на лунку и обрабатывали электропорацией с антисмысловым олигонуклеотидом. После периода обработки длительностью около 16 часов или 24 часов, РНК выделяли из клеток и уровни мРНК C9ORF72 измеряли методом количественной ПЦР в реальном времени. Использовали набор праймеров и зондов RTS3750 для измерения уровней общей мРНК C9ORF72. Уровни мРНК C9ORF72 корректировали в соответствии с общим содержанием РНК, измеренным с помощью RIBOGREEN®, затем нормализованные уровни варианта мРНК сравнивали с аналогичным показателем в клетках, не обработанных антисмысловым олигонуклеотидом.

Пример 8: Антисмысловое ингибирование мРНК человеческого C9ORF72 в модели трансгенных мышей

Антисмысловые олигонуклеотиды, описанные выше, испытывали в двух трансгенных линиях мышей ВАС, обозначенных в настоящем документе как С9В41 и С9В183, каждая из которых экспрессирует усеченный человеческий ген C9ORF72, содержащий экзоны 1-5. Усеченные гены C9ORF72 в мышиных линиях С9В41 и С9В183 содержат 110 и 450 гексануклеотидных повторов, соответственно. Каждой мыши в каждой экспериментальной группе вводили 350 мкг антисмыслового олигонуклеотида, затем анализировали уровни экспрессии РНК человеческого C9ORF72 с помощью ОТ-ПЦР. Определяли также реакцию на дозу.

Пример 9: Антисмысловое ингибирование мРНК C9ORF72 в фибробластах пациента

Антисмысловые олигонуклеотиды, описанные выше, испытывали на их влияние на мРНК C9ORF72 in vitro. Антисмысловые олигонуклеотиды, перечисленные в представленной ниже таблице, добавляли на планшет с последующим добавлением фибробластов пациента F09-152 с плотностью 20000 клеток на лунку. Конечные концентрации антисмысловых олигонуклеотидов после добавления клеток указаны в следующей таблице. Через 30 секунд встряхивания клетки обрабатывали электропорацией, затем переносили в культуральный планшет с покрытием Primaria. Через 16 часов выделяли РНК из клеток и измеряли уровни общей мРНК C9ORF72 (т.е. мРНК, начинающейся с экзона 1А, и мРНК, начинающейся с экзона 1В) и уровни патогенной ассоциированной мРНК (см. пример 4), с помощью ОТ-кПЦР. Использовали набор праймеров и зондов человека RTS 3750 (см. пример 6) и RTS3905 (см. пример 4) для определения общей мРНК C9ORF72 и патоген-ассоциированной мРНК C9ORF72, соответственно. Уровни общей мРНК C9ORF72 и патоген-ассоциированной мРНК C9ORF72 нормализовали к общему содержанию РНК в клетке, измеренному с помощью RIBOGREEN®, затем нормализованные уровни мРНК сравнивали с аналогичным показателем в клетках, не обработанных антисмысловым олигонуклеотидом. Результаты представлены в следующей таблице. Запись «н.о.« означает, что показатель не определяли. Значения IC50, указанные как «н. о.», не определяли, поскольку мишень не была в достаточной степени ингибирована для определения IC50. Результаты демонстрируют, что все олигонуклеотиды, перечисленные ниже, ингибируют патоген-ассоциированный вариант мРНК C9ORF72. Олигонуклеотиды, которые специфически не нацелены на повторяющийся вариант пре-мРНК, ингибировали патоген-ассоциированную мРНК C9ORF72 и общую мРНК C9ORF72. Олигонуклеотиды, которые специфически нацелены на повторяющийся вариант пре-мРНК, селективно ингибировали патоген-ассоциированную мРНК C9ORF72.

Пример 10: Антисмысловое ингибирование мРНК человеческого C9ORF72 в модели трансгенных мышей

Антисмысловые олигонуклеотиды, описанные выше, испытывали в трансгенной линии мышей ВАС С9В41 (см. пример 8), которая экспрессирует человеческий ген C9ORF72, содержащий область промотора в экзоне 5 и 110 гексануклеотидных повторов. Каждая экспериментальная группа состояла из 2-3 мышей. Каждой мыши вводили однократную ICVB дозу 350 мкг антисмыслового олигонуклеотида, указанного в следующей таблице, или PBS. Через две недели мышей усыпляли и анализировали уровни экспрессии человеческого патоген-ассоциированного варианта мРНК C9ORF72 и/или общей мРНК C9ORF72 человека с помощью ОТК-кПЦР, как описано в примере 9. Анализ уровней патоген-ассоциированного варианта мРНК C9ORF72 не проводили для олигонуклеотидов, которые специфически не нацелены на повторяющийся вариант пре-мРНК C9ORF72. Результаты в представленных ниже таблицах демонстрируют средние процентные нормализованные уровни мРНК C9ORF72 человека относительно нормализованного среднего значения для группы, обработанной PBS.

Пример 11: Дозозависимое антисмысловое ингибирование мРНК человеческого C9ORF72 в модели трансгенных мышей

Антисмысловые олигонуклеотиды, описанные выше, испытывали в двух трансгенных линиях мышей ВАС, С9В41 и С9В183, каждая из которых экспрессирует усеченный человеческий ген C9ORF72, содержащий экзоны 1-5. Усеченные гены C9ORF72 в мышиных линиях С9В41 и С9В183 содержат 110 и 450 гексануклеотидных повторов, соответственно (см. пример 8). Каждая экспериментальная группа состояла из 2-4 мышей. Каждой мыши вводили однократную ICVB дозу 30 мкг, 100 мкг, 300 мкг или 700 мкг антисмыслового олигонуклеотида, указанного в следующей таблице, или PBS. Через две недели мышей усыпляли и анализировали уровни экспрессии человеческого патоген-ассоциированного варианта мРНК C9ORF72 и/или общей мРНК C9ORF72 человека с помощью ОТК-кПЦР, как описано в примере 9. Результаты в представленных ниже таблицах демонстрируют средние процентные нормализованные уровни мРНК C9ORF72 человека относительно нормализованного среднего значения для группы, обработанной PBS. Значение 100 или более означает, что антисмысловой олигонуклеотид не снижает мРНК или увеличивает количество мРНК.

Пример 12: Переносимость антисмысловых олигонуклеотидов, направленных на человеческий C9Orf72, у мышей

Мышам С57/В16 дикого типа вводили однократную ICV дозу 700 мкг антисмыслового олигонуклеотида, указанного в следующей таблице, как описано в примере 2. Каждая экспериментальная группа состояла из 4 мышей. Через 8 недель после инъекции мышей оценивали по 7 различным критериям. Критерии представляют собой: (1) мышь была бодрой, бдительной и отзывчивой; (2) мышь стояла или сгибалась без раздражителя; (3) мышь выполняла любое движение без раздражителя; (4) мышь демонстрировала движение вперед после того, как ее подняли; (5) мышь демонстрировала любое движение после того, как ее подняли; (6) мышь реагировала на щипок за хвост; (7) ровное дыхание. Для каждого из 7 критериев, каждой мыши начисляли балл 0, если она отвечала критерию, и 1 если она не отвечала ему. После оценки всех 7 критериев суммировали промежуточные оценки для каждой мыши, а затем усредняли для каждой экспериментальной группы. Результаты представлены в следующей таблице.

Животных усыпляли спустя 8 недель. У каждого животного извлекали кору головного мозга и спинной мозг и проводили ОТ-ПЦР. Определяли уровни экспрессии аллогенного воспалительного фактора (AIF1) как меру воспаления. Определяли также уровни экспрессии глиофибриллярного кислого белка (GFAP) как меру активации глиальных клеток. Результаты, нормализованные Gpadh, представлены относительно контроля с PBS (1,0) в следующей таблице. «Н.о.» означает, что данные отсутствуют, поскольку эксперимент не проводили. Звездочка означает, что соответствующий результат является средним для 1-3 мышей.

Пример 13: Переносимость антисмысловых олигонуклеотидов, направленных на человеческий C9Orf72, у крыс

Крысы Спрага-Доули разделяли на группы по 4 или 6 крыс. Каждой крысе в каждой группе крыс вводили однократную интратекальную (IT) дозу 3 мг олигонуклеотида, указанного в следующей таблице. Через 3 часа и через 8 недель после IT дозы у каждой крысы оценивали движение 7 различных частей тела. 7 частей тела представляют собой (1) хвост крысы; (2) положение задней части тела крысы; (3) задние конечности крысы; (4) задние лапы крысы; (5) передние лапы крысы; (6) положение передней части тела крысы; (7) голова крысы. Для каждой из 7 различных частей тела крысы, каждой крысе начислялся балл 0, если часть тела двигалась, или 1, если она была парализована. После оценки всех 7 частей тела суммировали промежуточные оценки для каждой крысы, а затем усредняли для каждой группы. Например, если у крысы хвост, голова и все остальные оцениваемые части тела двигались через 3 часа после IT дозы 3 мг, она получала суммарный балл 0. Например, если у другой крысы хвост не двигался через 3 часа после IT дозы 3 мг, но все остальные оцениваемые части тела двигались, она получала суммарный балл 1. Крысы, которым вводили физраствор, как правило, получали 0 баллов. Баллы в верхней части диапазона свидетельствуют об острой токсичности. Результаты представлены в следующей таблице как средний балл для каждой экспериментальной группы.

Животных усыпляли спустя 8 недель. У каждого животного извлекали кору головного мозга и спинной мозг и проводили ОТ-ПЦР. Определяли уровни экспрессии AIF1 как меру воспаления. Определяли также уровни экспрессии GFAP как меру активации глиальных клеток. Звездочка означает, что соответствующий результат является средним для 2-3 мышей. Результаты, нормализованные по Gapdh, представлены относительно контроля с PBS (1,0) в следующей таблице.

Пример 14: Переносимость антисмысловых олигонуклеотидов, направленных на человеческий C9ORF72, у приматов, не являющихся человеком

Самкам яванских макак (2-6 кг) вводили 3 дозы по 35 мг антисмыслового олигонуклеотида на 1, 14 и 28 день посредством интратекальной болюсной инъекции (1 мл медленного болюса, затем 0,25 мл с усилием). Каждая экспериментальная группа содержала четыре обезьяны. Через две недели после последней дозы животных усыпляли и проводили ОТ-ПЦР на различных тканях ЦНС. Определяли уровни экспрессии AIF1 как меру воспаления и уровни экспрессии GFAP как меру активации глиальных клеток. В следующей таблице представлены результаты, нормализованные по GADPH, относительно контроля с PBS (1,0) для ISIS №801287, 802459 и 806679.

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> ИОНИС ФАРМАСЬЮТИКАЛЗ, ИНК.

<120> КОМПОЗИЦИИ ДЛЯ МОДУЛИРОВАНИЯ ЭКСПРЕССИИ C9ORF72

<130> BIOL0269WO

<150> 62/148,691

<151> 2015-04-16

<150> 62/232,941

<151> 2015-09-25

<150> 62/239,400

<151> 2015-10-09

<160> 60

<170> PatentIn version 3.5

<210> 1

<211> 3339

<212> DNA

<213> homo sapiens

<400> 1

acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60

cacgtaaaag atgacgcttg gtgtgtcagc cgtccctgct gcccggttgc ttctcttttg 120

ggggcggggt ctagcaagag caggtgtggg tttaggagat atctccggag catttggata 180

atgtgacagt tggaatgcag tgatgtcgac tctttgccca ccgccatctc cagctgttgc 240

caagacagag attgctttaa gtggcaaatc acctttatta gcagctactt ttgcttactg 300

ggacaatatt cttggtccta gagtaaggca catttgggct ccaaagacag aacaggtact 360

tctcagtgat ggagaaataa cttttcttgc caaccacact ctaaatggag aaatccttcg 420

aaatgcagag agtggtgcta tagatgtaaa gttttttgtc ttgtctgaaa agggagtgat 480

tattgtttca ttaatctttg atggaaactg gaatggggat cgcagcacat atggactatc 540

aattatactt ccacagacag aacttagttt ctacctccca cttcatagag tgtgtgttga 600

tagattaaca catataatcc ggaaaggaag aatatggatg cataaggaaa gacaagaaaa 660

tgtccagaag attatcttag aaggcacaga gagaatggaa gatcagggtc agagtattat 720

tccaatgctt actggagaag tgattcctgt aatggaactg ctttcatcta tgaaatcaca 780

cagtgttcct gaagaaatag atatagctga tacagtactc aatgatgatg atattggtga 840

cagctgtcat gaaggctttc ttctcaatgc catcagctca cacttgcaaa cctgtggctg 900

ttccgttgta gtaggtagca gtgcagagaa agtaaataag atagtcagaa cattatgcct 960

ttttctgact ccagcagaga gaaaatgctc caggttatgt gaagcagaat catcatttaa 1020

atatgagtca gggctctttg tacaaggcct gctaaaggat tcaactggaa gctttgtgct 1080

gcctttccgg caagtcatgt atgctccata tcccaccaca cacatagatg tggatgtcaa 1140

tactgtgaag cagatgccac cctgtcatga acatatttat aatcagcgta gatacatgag 1200

atccgagctg acagccttct ggagagccac ttcagaagaa gacatggctc aggatacgat 1260

catctacact gacgaaagct ttactcctga tttgaatatt tttcaagatg tcttacacag 1320

agacactcta gtgaaagcct tcctggatca ggtctttcag ctgaaacctg gcttatctct 1380

cagaagtact ttccttgcac agtttctact tgtccttcac agaaaagcct tgacactaat 1440

aaaatatata gaagacgata cgcagaaggg aaaaaagccc tttaaatctc ttcggaacct 1500

gaagatagac cttgatttaa cagcagaggg cgatcttaac ataataatgg ctctggctga 1560

gaaaattaaa ccaggcctac actcttttat ctttggaaga cctttctaca ctagtgtgca 1620

agaacgagat gttctaatga ctttttaaat gtgtaactta ataagcctat tccatcacaa 1680

tcatgatcgc tggtaaagta gctcagtggt gtggggaaac gttcccctgg atcatactcc 1740

agaattctgc tctcagcaat tgcagttaag taagttacac tacagttctc acaagagcct 1800

gtgaggggat gtcaggtgca tcattacatt gggtgtctct tttcctagat ttatgctttt 1860

gggatacaga cctatgttta caatataata aatattattg ctatctttta aagatataat 1920

aataggatgt aaacttgacc acaactactg tttttttgaa atacatgatt catggtttac 1980

atgtgtcaag gtgaaatctg agttggcttt tacagatagt tgactttcta tcttttggca 2040

ttctttggtg tgtagaatta ctgtaatact tctgcaatca actgaaaact agagccttta 2100

aatgatttca attccacaga aagaaagtga gcttgaacat aggatgagct ttagaaagaa 2160

aattgatcaa gcagatgttt aattggaatt gattattaga tcctactttg tggatttagt 2220

ccctgggatt cagtctgtag aaatgtctaa tagttctcta tagtccttgt tcctggtgaa 2280

ccacagttag ggtgttttgt ttattttatt gttcttgcta ttgttgatat tctatgtagt 2340

tgagctctgt aaaaggaaat tgtattttat gttttagtaa ttgttgccaa ctttttaaat 2400

taattttcat tatttttgag ccaaattgaa atgtgcacct cctgtgcctt ttttctcctt 2460

agaaaatcta attacttgga acaagttcag atttcactgg tcagtcattt tcatcttgtt 2520

ttcttcttgc taagtcttac catgtacctg ctttggcaat cattgcaact ctgagattat 2580

aaaatgcctt agagaatata ctaactaata agatcttttt ttcagaaaca gaaaatagtt 2640

ccttgagtac ttccttcttg catttctgcc tatgtttttg aagttgttgc tgtttgcctg 2700

caataggcta taaggaatag caggagaaat tttactgaag tgctgttttc ctaggtgcta 2760

ctttggcaga gctaagttat cttttgtttt cttaatgcgt ttggaccatt ttgctggcta 2820

taaaataact gattaatata attctaacac aatgttgaca ttgtagttac acaaacacaa 2880

ataaatattt tatttaaaat tctggaagta atataaaagg gaaaatatat ttataagaaa 2940

gggataaagg taatagagcc cttctgcccc ccacccacca aatttacaca acaaaatgac 3000

atgttcgaat gtgaaaggtc ataatagctt tcccatcatg aatcagaaag atgtggacag 3060

cttgatgttt tagacaacca ctgaactaga tgactgttgt actgtagctc agtcatttaa 3120

aaaatatata aatactacct tgtagtgtcc catactgtgt tttttacatg gtagattctt 3180

atttaagtgc taactggtta ttttctttgg ctggtttatt gtactgttat acagaatgta 3240

agttgtacag tgaaataagt tattaaagca tgtgtaaaca ttgttatata tcttttctcc 3300

taaatggaga attttgaata aaatatattt gaaattttg 3339

<210> 2

<211> 30001

<212> DNA

<213> homo sapiens

<400> 2

caaagaaaag ggggaggttt tgttaaaaaa gagaaatgtt acatagtgct ctttgagaaa 60

attcattggc actattaagg atctgaggag ctggtgagtt tcaactggtg agtgatggtg 120

gtagataaaa ttagagctgc agcaggtcat tttagcaact attagataaa actggtctca 180

ggtcacaacg ggcagttgca gcagctggac ttggagagaa ttacactgtg ggagcagtgt 240

catttgtcct aagtgctttt ctacccccta cccccactat tttagttggg tataaaaaga 300

atgacccaat ttgtatgatc aactttcaca aagcatagaa cagtaggaaa agggtctgtt 360

tctgcagaag gtgtagacgt tgagagccat tttgtgtatt tattcctccc tttcttcctc 420

ggtgaatgat taaaacgttc tgtgtgattt ttagtgatga aaaagattaa atgctactca 480

ctgtagtaag tgccatctca cacttgcaga tcaaaaggca cacagtttaa aaaacctttg 540

tttttttaca catctgagtg gtgtaaatgc tactcatctg tagtaagtgg aatctataca 600

cctgcagacc aaaagacgca aggtttcaaa aatctttgtg ttttttacac atcaaacaga 660

atggtacgtt tttcaaaagt taaaaaaaaa caactcatcc acatattgca actagcaaaa 720

atgacattcc ccagtgtgaa aatcatgctt gagagaattc ttacatgtaa aggcaaaatt 780

gcgatgactt tgcaggggac cgtgggattc ccgcccgcag tgccggagct gtcccctacc 840

agggtttgca gtggagtttt gaatgcactt aacagtgtct tacggtaaaa acaaaatttc 900

atccaccaat tatgtgttga gcgcccactg cctaccaagc acaaacaaaa ccattcaaaa 960

ccacgaaatc gtcttcactt tctccagatc cagcagcctc ccctattaag gttcgcacac 1020

gctattgcgc caacgctcct ccagagcggg tcttaagata aaagaacagg acaagttgcc 1080

ccgccccatt tcgctagcct cgtgagaaaa cgtcatcgca catagaaaac agacagacgt 1140

aacctacggt gtcccgctag gaaagagagg tgcgtcaaac agcgacaagt tccgcccacg 1200

taaaagatga cgcttggtgt gtcagccgtc cctgctgccc ggttgcttct cttttggggg 1260

cggggtctag caagagcagg tgtgggttta ggaggtgtgt gtttttgttt ttcccaccct 1320

ctctccccac tacttgctct cacagtactc gctgagggtg aacaagaaaa gacctgataa 1380

agattaacca gaagaaaaca aggagggaaa caaccgcagc ctgtagcaag ctctggaact 1440

caggagtcgc gcgctagggg ccggggccgg ggccggggcg tggtcggggc gggcccgggg 1500

gcgggcccgg ggcggggctg cggttgcggt gcctgcgccc gcggcggcgg aggcgcaggc 1560

ggtggcgagt gggtgagtga ggaggcggca tcctggcggg tggctgtttg gggttcggct 1620

gccgggaaga ggcgcgggta gaagcggggg ctctcctcag agctcgacgc atttttactt 1680

tccctctcat ttctctgacc gaagctgggt gtcgggcttt cgcctctagc gactggtgga 1740

attgcctgca tccgggcccc gggcttcccg gcggcggcgg cggcggcggc ggcgcaggga 1800

caagggatgg ggatctggcc tcttccttgc tttcccgccc tcagtacccg agctgtctcc 1860

ttcccgggga cccgctggga gcgctgccgc tgcgggctcg agaaaaggga gcctcgggta 1920

ctgagaggcc tcgcctgggg gaaggccgga gggtgggcgg cgcgcggctt ctgcggacca 1980

agtcggggtt cgctaggaac ccgagacggt ccctgccggc gaggagatca tgcgggatga 2040

gatgggggtg tggagacgcc tgcacaattt cagcccaagc ttctagagag tggtgatgac 2100

ttgcatatga gggcagcaat gcaagtcggt gtgctcccca ttctgtggga catgacctgg 2160

ttgcttcaca gctccgagat gacacagact tgcttaaagg aagtgactat tgtgacttgg 2220

gcatcacttg actgatggta atcagttgtc taaagaagtg cacagattac atgtccgtgt 2280

gctcattggg tctatctggc cgcgttgaac accaccaggc tttgtattca gaaacaggag 2340

ggaggtcctg cactttccca ggaggggtgg ccctttcaga tgcaatcgag attgttaggc 2400

tctgggagag tagttgcctg gttgtggcag ttggtaaatt tctattcaaa cagttgccat 2460

gcaccagttg ttcacaacaa gggtacgtaa tctgtctggc attacttcta cttttgtaca 2520

aaggatcaaa aaaaaaaaag atactgttaa gatatgattt ttctcagact ttgggaaact 2580

tttaacataa tctgtgaata tcacagaaac aagactatca tataggggat attaataacc 2640

tggagtcaga atacttgaaa tacggtgtca tttgacacgg gcattgttgt caccacctct 2700

gccaaggcct gccactttag gaaaaccctg aatcagttgg aaactgctac atgctgatag 2760

tacatctgaa acaagaacga gagtaattac cacattccag attgttcact aagccagcat 2820

ttacctgctc caggaaaaaa ttacaagcac cttatgaagt tgataaaata ttttgtttgg 2880

ctatgttggc actccacaat ttgctttcag agaaacaaag taaaccaagg aggacttctg 2940

tttttcaagt ctgccctcgg gttctattct acgttaatta gatagttccc aggaggacta 3000

ggttagccta cctattgtct gagaaacttg gaactgtgag aaatggccag atagtgatat 3060

gaacttcacc ttccagtctt ccctgatgtt gaagattgag aaagtgttgt gaactttctg 3120

gtactgtaaa cagttcactg tccttgaagt ggtcctgggc agctcctgtt gtggaaagtg 3180

gacggtttag gatcctgctt ctctttgggc tgggagaaaa taaacagcat ggttacaagt 3240

attgagagcc aggttggaga aggtggctta cacctgtaat gccagagctt tgggaggcgg 3300

aggcaagagg atcacttgaa gccaggagtt caagctcaac ctgggcaacg tagaccctgt 3360

ctctacaaaa aattaaaaac ttagccgggc gtggtgatgt gcacctgtag tcctagctac 3420

ttgggaggct gaggcaggag ggtcatttga gcccaagagt ttgaagttac cgagagctat 3480

gatcctgcca gtgcattcca gcctggatga caaaacgaga ccctgtctct aaaaaacaag 3540

aagtgagggc tttatgattg tagaattttc actacaatag cagtggacca accacctttc 3600

taaataccaa tcagggaaga gatggttgat tttttaacag acgtttaaag aaaaagcaaa 3660

acctcaaact tagcactcta ctaacagttt tagcagatgt taattaatgt aatcatgtct 3720

gcatgtatgg gattatttcc agaaagtgta ttgggaaacc tctcatgaac cctgtgagca 3780

agccaccgtc tcactcaatt tgaatcttgg cttccctcaa aagactggct aatgtttggt 3840

aactctctgg agtagacagc actacatgta cgtaagatag gtacataaac aactattggt 3900

tttgagctga tttttttcag ctgcatttgc atgtatggat ttttctcacc aaagacgatg 3960

acttcaagta ttagtaaaat aattgtacag ctctcctgat tatacttctc tgtgacattt 4020

catttcccag gctatttctt ttggtaggat ttaaaactaa gcaattcagt atgatctttg 4080

tccttcattt tctttcttat tctttttgtt tgtttgtttg tttgtttttt tcttgaggca 4140

gagtctctct ctgtcgccca ggctggagtg cagtggcgcc atctcagctc attgcaacct 4200

ctgccacctc cgggttcaag agattctcct gcctcagcct cccgagtagc tgggattaca 4260

ggtgtccacc accacacccg gctaattttt tgtattttta gtagaggtgg ggtttcacca 4320

tgttggccag gctggtcttg agctcctgac ctcaggtgat ccacctgcct cggcctacca 4380

aagagctggg ataacaggtg tgacccacca tgcccggccc attttttttt tcttattctg 4440

ttaggagtga gagtgtaact agcagtataa tagttcaatt ttcacaacgt ggtaaaagtt 4500

tccctataat tcaatcagat tttgctccag ggttcagttc tgttttagga aatactttta 4560

ttttcagttt aatgatgaaa tattagagtt gtaatattgc ctttatgatt atccaccttt 4620

ttaacctaaa agaatgaaag aaaaatatgt ttgcaatata attttatggt tgtatgttaa 4680

cttaattcat tatgttggcc tccagtttgc tgttgttagt tatgacagca gtagtgtcat 4740

taccatttca attcagatta cattcctata tttgatcatt gtaaactgac tgcttacatt 4800

gtattaaaaa cagtggatat tttaaagaag ctgtacggct tatatctagt gctgtctctt 4860

aagactatta aattgataca acatatttaa aagtaaatat tacctaaatg aatttttgaa 4920

attacaaata cacgtgttaa aactgtcgtt gtgttcaacc atttctgtac atacttagag 4980

ttaactgttt tgccaggctc tgtatgccta ctcataatat gataaaagca ctcatctaat 5040

gctctgtaaa tagaagtcag tgctttccat cagactgaac tctcttgaca agatgtggat 5100

gaaattcttt aagtaaaatt gtttactttg tcatacattt acagatcaaa tgttagctcc 5160

caaagcaatc atatggcaaa gataggtata tcatagtttg cctattagct gctttgtatt 5220

gctattatta taaatagact tcacagtttt agacttgctt aggtgaaatt gcaattcttt 5280

ttactttcag tcttagataa caagtcttca attatagtac aatcacacat tgcttaggaa 5340

tgcatcatta ggcgattttg tcattatgca aacatcatag agtgtactta cacaaaccta 5400

gatagtatag cctttatgta cctaggccgt atggtatagt ctgttgctcc taggccacaa 5460

acctgtacaa ctgttactgt actgaatact atagacagtt gtaacacagt ggtaaatatt 5520

tatctaaata tatgcaaaca gagaaaaggt acagtaaaag tatggtataa aagataatgg 5580

tatacctgtg taggccactt accacgaatg gagcttgcag gactagaagt tgctctgggt 5640

gagtcagtga gtgagtggtg aattaatgtg aaggcctaga acactgtaca ccactgtaga 5700

ctataaacac agtacgctga agctacacca aatttatctt aacagttttt cttcaataaa 5760

aaattataac tttttaactt tgtaaacttt ttaatttttt aacttttaaa atacttagct 5820

tgaaacacaa atacattgta tagctataca aaaatatttt ttctttgtat ccttattcta 5880

gaagcttttt tctattttct attttaaatt ttttttttta cttgttagtc gtttttgtta 5940

aaaactaaaa cacacacact ttcacctagg catagacagg attaggatca tcagtatcac 6000

tcccttccac ctcactgcct tccacctcca catcttgtcc cactggaagg tttttagggg 6060

caataacaca catgtagctg tcacctatga taacagtgct ttctgttgaa tacctcctga 6120

aggacttgcc tgaggctgtt ttacatttaa cttaaaaaaa aaaaaagtag aaggagtgca 6180

ctctaaaata acaataaaag gcatagtata gtgaatacat aaaccagcaa tgtagtagtt 6240

tattatcaag tgttgtacac tgtaataatt gtatgtgcta tactttaaat aacttgcaaa 6300

atagtactaa gaccttatga tggttacagt gtcactaagg caatagcata ttttcaggtc 6360

cattgtaatc taatgggact accatcatat atgcagtcta ccattgactg aaacgttaca 6420

tggcacataa ctgtatttgc aagaatgatt tgttttacat taatatcaca taggatgtac 6480

ctttttagag tggtatgttt atgtggatta agatgtacaa gttgagcaag gggaccaaga 6540

gccctgggtt ctgtcttgga tgtgagcgtt tatgttcttc tcctcatgtc tgttttctca 6600

ttaaattcaa aggcttgaac gggccctatt tagcccttct gttttctacg tgttctaaat 6660

aactaaagct tttaaattct agccatttag tgtagaactc tctttgcagt gatgaaatgc 6720

tgtattggtt tcttggctag catattaaat atttttatct ttgtcttgat acttcaatgt 6780

cgttttaaac atcaggatcg ggcttcagta ttctcataac cagagagttc actgaggata 6840

caggactgtt tgcccatttt ttgttatggc tccagacttg tggtatttcc atgtcttttt 6900

tttttttttt ttttttgacc ttttagcggc tttaaagtat ttctgttgtt aggtgttgta 6960

ttacttttct aagattactt aacaaagcac cacaaactga gtggctttaa acaacagcaa 7020

tttattctct cacaattcta gaagctagaa gtccgaaatc aaagtgttga caggggcatg 7080

atcttcaaga gagaagactc tttccttgcc tcttcctggc ttctggtggt taccagcaat 7140

cctgagtgtt cctttcttgc cttgtagttt caacaatcca gtatctgcct tttgtcttca 7200

catggctgtc taccatttgt ctctgtgtct ccaaatctct ctccttataa acacagcagt 7260

tattggatta ggccccactc taatccagta tgaccccatt ttaacatgat tacacttatt 7320

tctagataag gtcacattca cgtacaccaa gggttaggaa ttgaacatat ctttttgggg 7380

gacacaattc aacccacaag tgtcagtctc tagctgagcc tttcccttcc tgtttttctc 7440

ctttttagtt gctatgggtt aggggccaaa tctccagtca tactagaatt gcacatggac 7500

tggatatttg ggaatactgc gggtctattc tatgagcttt agtatgtaac atttaatatc 7560

agtgtaaaga agcccttttt taagttattt ctttgaattt ctaaatgtat gccctgaata 7620

taagtaacaa gttaccatgt cttgtaaaat gatcatatca acaaacattt aatgtgcacc 7680

tactgtgcta gttgaatgtc tttatcctga taggagataa caggattcca catctttgac 7740

ttaagaggac aaaccaaata tgtctaaatc atttggggtt ttgatggata tctttaaatt 7800

gctgaaccta atcattggtt tcatatgtca ttgtttagat atctccggag catttggata 7860

atgtgacagt tggaatgcag tgatgtcgac tctttgccca ccgccatctc cagctgttgc 7920

caagacagag attgctttaa gtggcaaatc acctttatta gcagctactt ttgcttactg 7980

ggacaatatt cttggtccta gagtaaggca catttgggct ccaaagacag aacaggtact 8040

tctcagtgat ggagaaataa cttttcttgc caaccacact ctaaatggag aaatccttcg 8100

aaatgcagag agtggtgcta tagatgtaaa gttttttgtc ttgtctgaaa agggagtgat 8160

tattgtttca ttaatctttg atggaaactg gaatggggat cgcagcacat atggactatc 8220

aattatactt ccacagacag aacttagttt ctacctccca cttcatagag tgtgtgttga 8280

tagattaaca catataatcc ggaaaggaag aatatggatg cataaggtaa gtgatttttc 8340

agcttattaa tcatgttaac ctatctgttg aaagcttatt ttctggtaca tataaatctt 8400

atttttttaa ttatatgcag tgaacatcaa acaataaatg ttatttattt tgcatttacc 8460

ctattagata caaatacatc tggtctgata cctgtcatct tcatattaac tgtggaaggt 8520

acgaaatggt agctccacat tatagatgaa aagctaaagc ttagacaaat aaagaaactt 8580

ttagaccctg gattcttctt gggagccttt gactctaata ccttttgttt ccctttcatt 8640

gcacaattct gtcttttgct tactactatg tgtaagtata acagttcaaa gtaatagttt 8700

cataagctgt tggtcatgta gcctttggtc tctttaacct ctttgccaag ttcccaggtt 8760

cataaaatga ggaggttgaa tggaatggtt cccaagagaa ttccttttaa tcttacagaa 8820

attattgttt tcctaaatcc tgtagttgaa tatataatgc tatttacatt tcagtatagt 8880

tttgatgtat ctaaagaaca cattgaattc tccttcctgt gttccagttt gatactaacc 8940

tgaaagtcca ttaagcatta ccagttttaa aaggcttttg cccaatagta aggaaaaata 9000

atatctttta aaagaataat tttttactat gtttgcaggc ttacttcctt ttttctcaca 9060

ttatgaaact cttaaaatca ggagaatctt ttaaacaaca tcataatgtt taatttgaaa 9120

agtgcaagtc attcttttcc tttttgaaac tatgcagatg ttacattgac tgttttctgt 9180

gaagttatct ttttttcact gcagaataaa ggttgttttg attttatttt gtattgttta 9240

tgagaacatg catttgttgg gttaatttcc tacccctgcc cccatttttt ccctaaagta 9300

gaaagtattt ttcttgtgaa ctaaattact acacaagaac atgtctattg aaaaataagc 9360

aagtatcaaa atgttgtggg ttgttttttt aaataaattt tctcttgctc aggaaagaca 9420

agaaaatgtc cagaagatta tcttagaagg cacagagaga atggaagatc aggtatatgc 9480

aaattgcata ctgtcaaatg tttttctcac agcatgtatc tgtataaggt tgatggctac 9540

atttgtcaag gccttggaga catacgaata agcctttaat ggagctttta tggaggtgta 9600

cagaataaac tggaggaaga tttccatatc ttaaacccaa agagttaaat cagtaaacaa 9660

aggaaaatag taattgcatc tacaaattaa tatttgctcc cttttttttt ctgtttgccc 9720

agaataaatt ttggataact tgttcatagt aaaaataaaa aaaattgtct ctgatatgtt 9780

ctttaaggta ctacttctcg aacctttccc tagaagtagc tgtaacagaa ggagagcata 9840

tgtacccctg aggtatctgt ctggggtgta ggcccaggtc cacacaatat ttcttctaag 9900

tcttatgttg tatcgttaag actcatgcaa tttacatttt attccataac tattttagta 9960

ttaaaatttg tcagtgatat ttcttaccct ctcctctagg aaaatgtgcc atgtttatcc 10020

cttggctttg aatgcccctc aggaacagac actaagagtt tgagaagcat ggttacaagg 10080

gtgtggcttc ccctgcggaa actaagtaca gactatttca ctgtaaagca gagaagttct 10140

tttgaaggag aatctccagt gaagaaagag ttcttcactt ttacttccat ttcctcttgt 10200

gggtgaccct caatgctcct tgtaaaactc caatatttta aacatggctg ttttgccttt 10260

ctttgcttct ttttagcatg aatgagacag atgatacttt aaaaaagtaa ttaaaaaaaa 10320

aaacttgtga aaatacatgg ccataataca gaacccaata caatgatctc ctttaccaaa 10380

ttgttatgtt tgtacttttg tagatagctt tccaattcag agacagttat tctgtgtaaa 10440

ggtctgactt aacaagaaaa gatttccctt tacccaaaga atcccagtcc ttatttgctg 10500

gtcaataagc agggtcccca ggaatggggt aactttcagc accctctaac ccactagtta 10560

ttagtagact aattaagtaa acttatcgca agttgaggaa acttagaacc aactaaaatt 10620

ctgcttttac tgggattttg ttttttcaaa ccagaaacct ttacttaagt tgactactat 10680

taatgaattt tggtctctct tttaagtgct cttcttaaaa atgttatctt actgctgaga 10740

agttcaagtt tgggaagtac aaggaggaat agaaacttaa gagattttct tttagagcct 10800

cttctgtatt tagccctgta ggattttttt tttttttttt ttttttggtg ttgttgagct 10860

tcagtgaggc tattcattca cttatactga taatgtctga gatactgtga atgaaatact 10920

atgtatgctt aaacctaaga ggaaatattt tcccaaaatt attcttcccg aaaaggagga 10980

gttgcctttt gattgagttc ttgcaaatct cacaacgact ttattttgaa caatactgtt 11040

tggggatgat gcattagttt gaaacaactt cagttgtagc tgtcatctga taaaattgct 11100

tcacagggaa ggaaatttaa cacggatcta gtcattattc ttgttagatt gaatgtgtga 11160

attgtaattg taaacaggca tgataattat tactttaaaa actaaaaaca gtgaatagtt 11220

agttgtggag gttactaaag gatggttttt ttttaaataa aactttcagc attatgcaaa 11280

tgggcatatg gcttaggata aaacttccag aagtagcatc acatttaaat tctcaagcaa 11340

cttaataata tggggctctg aaaaactggt taaggttact ccaaaaatgg ccctgggtct 11400

gacaaagatt ctaacttaaa gatgcttatg aagactttga gtaaaatcat ttcataaaat 11460

aagtgaggaa aaacaactag tattaaattc atcttaaata atgtatgatt taaaaaatat 11520

gtttagctaa aaatgcatag tcatttgaca atttcattta tatctcaaaa aatttactta 11580

accaagttgg tcacaaaact gatgagactg gtggtggtag tgaataaatg agggaccatc 11640

catatttgag acactttaca tttgtgatgt gttatactga attttcagtt tgattctata 11700

gactacaaat ttcaaaatta caatttcaag atgtaataag tagtaatatc ttgaaatagc 11760

tctaaaggga atttttctgt tttattgatt cttaaaatat atgtgctgat tttgatttgc 11820

atttgggtag attatacttt tatgagtatg gaggttaggt attgattcaa gttttcctta 11880

cctatttggt aaggatttca aagtcttttt gtgcttggtt ttcctcattt ttaaatatga 11940

aatatattga tgacctttaa caaatttttt ttatctcaaa ttttaaagga gatcttttct 12000

aaaagaggca tgatgactta atcattgcat gtaacagtaa acgataaacc aatgattcca 12060

tactctctaa agaataaaag tgagctttag ggccgggcat ggtcagaaat ttgacaccaa 12120

cctggccaac atggcgaaac cccgtctcta ctaaaaatac aaaaatcagc cgggcatggt 12180

ggcggcacct atagtcccag ctacttggga ggatgagaca ggagagtcac ttgaacctgg 12240

gaggagaggt tgcagtgagc tgagatcacg ccattgcact ccagcctgag caatgaaagc 12300

aaaactccat ctcaaaaaaa aaaaaagaaa agaaagaata aaagtgagct ttggattgca 12360

tataaatcct ttagacatgt agtagacttg tttgatactg tgtttgaaca aattacgaag 12420

tattttcatc aaagaatgtt attgtttgat gttattttta ttttttattg cccagcttct 12480

ctcatattac gtgattttct tcacttcatg tcactttatt gtgcagggtc agagtattat 12540

tccaatgctt actggagaag tgattcctgt aatggaactg ctttcatcta tgaaatcaca 12600

cagtgttcct gaagaaatag atgtaagttt aaatgagagc aattatacac tttatgagtt 12660

ttttggggtt atagtattat tatgtatatt attaatattc taattttaat agtaaggact 12720

ttgtcataca tactattcac atacagtatt agccacttta gcaaataagc acacacaaaa 12780

tcctggattt tatggcaaaa cagaggcatt tttgatcagt gatgacaaaa ttaaattcat 12840

tttgtttatt tcattacttt tataattcct aaaagtggga ggatcccagc tcttatagga 12900

gcaattaata tttaatgtag tgtcttttga aacaaaactg tgtgccaaag tagtaaccat 12960

taatggaagt ttacttgtag tcacaaattt agtttcctta atcatttgtt gaggacgttt 13020

tgaatcacac actatgagtg ttaagagata cctttaggaa actattcttg ttgttttctg 13080

attttgtcat ttaggttagt ctcctgattc tgacagctca gaagaggaag ttgttcttgt 13140

aaaaattgtt taacctgctt gaccagcttt cacatttgtt cttctgaagt ttatggtagt 13200

gcacagagat tgttttttgg ggagtcttga ttctcggaaa tgaaggcagt gtgttatatt 13260

gaatccagac ttccgaaaac ttgtatatta aaagtgttat ttcaacacta tgttacagcc 13320

agactaattt ttttattttt tgatgcattt tagatagctg atacagtact caatgatgat 13380

gatattggtg acagctgtca tgaaggcttt cttctcaagt aagaattttt cttttcataa 13440

aagctggatg aagcagatac catcttatgc tcacctatga caagatttgg aagaaagaaa 13500

ataacagact gtctacttag attgttctag ggacattacg tatttgaact gttgcttaaa 13560

tttgtgttat ttttcactca ttatatttct atatatattt ggtgttattc catttgctat 13620

ttaaagaaac cgagtttcca tcccagacaa gaaatcatgg ccccttgctt gattctggtt 13680

tcttgtttta cttctcatta aagctaacag aatcctttca tattaagttg tactgtagat 13740

gaacttaagt tatttaggcg tagaacaaaa ttattcatat ttatactgat ctttttccat 13800

ccagcagtgg agtttagtac ttaagagttt gtgcccttaa accagactcc ctggattaat 13860

gctgtgtacc cgtgggcaag gtgcctgaat tctctataca cctatttcct catctgtaaa 13920

atggcaataa tagtaatagt acctaatgtg tagggttgtt ataagcattg agtaagataa 13980

ataatataaa gcacttagaa cagtgcctgg aacataaaaa cacttaataa tagctcatag 14040

ctaacatttc ctatttacat ttcttctaga aatagccagt atttgttgag tgcctacatg 14100

ttagttcctt tactagttgc tttacatgta ttatcttata ttctgtttta aagtttcttc 14160

acagttacag attttcatga aattttactt ttaataaaag agaagtaaaa gtataaagta 14220

ttcactttta tgttcacagt cttttccttt aggctcatga tggagtatca gaggcatgag 14280

tgtgtttaac ctaagagcct taatggcttg aatcagaagc actttagtcc tgtatctgtt 14340

cagtgtcagc ctttcataca tcattttaaa tcccatttga ctttaagtaa gtcacttaat 14400

ctctctacat gtcaatttct tcagctataa aatgatggta tttcaataaa taaatacatt 14460

aattaaatga tattatactg actaattggg ctgttttaag gctcaataag aaaatttctg 14520

tgaaaggtct ctagaaaatg taggttccta tacaaataaa agataacatt gtgcttatag 14580

cttcggtgtt tatcatataa agctattctg agttatttga agagctcacc tacttttttt 14640

tgtttttagt ttgttaaatt gttttatagg caatgttttt aatctgtttt ctttaactta 14700

cagtgccatc agctcacact tgcaaacctg tggctgttcc gttgtagtag gtagcagtgc 14760

agagaaagta aataaggtag tttattttat aatctagcaa atgatttgac tctttaagac 14820

tgatgatata tcatggattg tcatttaaat ggtaggttgc aattaaaatg atctagtagt 14880

ataaggaggc aatgtaatct catcaaattg ctaagacacc ttgtggcaac agtgagtttg 14940

aaataaactg agtaagaatc atttatcagt ttattttgat agctcggaaa taccagtgtc 15000

agtagtgtat aaatggtttt gagaatatat taaaatcaga tatataaaaa aaattactct 15060

tctatttccc aatgttatct ttaacaaatc tgaagatagt catgtacttt tggtagtagt 15120

tccaaagaaa tgttatttgt ttattcatct tgatttcatt gtcttcgctt tccttctaaa 15180

tctgtccctt ctagggagct attgggatta agtggtcatt gattattata ctttattcag 15240

taatgtttct gaccctttcc ttcagtgcta cttgagttaa ttaaggatta atgaacagtt 15300

acatttccaa gcattagcta ataaactaaa ggattttgca cttttcttca ctgaccatta 15360

gttagaaaga gttcagagat aagtatgtgt atctttcaat ttcagcaaac ctaatttttt 15420

aaaaaaagtt ttacatagga aatatgttgg aaatgatact ttacaaagat attcataatt 15480

tttttttgta atcagctact ttgtatattt acatgagcct taatttatat ttctcatata 15540

accatttatg agagcttagt atacctgtgt cattatattg catctacgaa ctagtgacct 15600

tattccttct gttacctcaa acaggtggct ttccatctgt gatctccaaa gccttaggtt 15660

gcacagagtg actgccgagc tgctttatga agggagaaag gctccatagt tggagtgttt 15720

tttttttttt ttttaaacat ttttcccatc ctccatcctc ttgagggaga atagcttacc 15780

ttttatcttg ttttaatttg agaaagaagt tgccaccact ctaggttgaa aaccactcct 15840

ttaacataat aactgtggat atggtttgaa tttcaagata gttacatgcc tttttatttt 15900

tcctaataga gctgtaggtc aaatattatt agaatcagat ttctaaatcc cacccaatga 15960

cctgcttatt ttaaatcaaa ttcaataatt aattctcttc tttttggagg atctggacat 16020

tctttgatat ttcttacaac gaatttcatg tgtagaccca ctaaacagaa gctataaaag 16080

ttgcatggtc aaataagtct gagaaagtct gcagatgata taattcacct gaagagtcac 16140

agtatgtagc caaatgttaa aggttttgag atgccataca gtaaatttac caagcatttt 16200

ctaaatttat ttgaccacag aatccctatt ttaagcaaca actgttacat cccatggatt 16260

ccaggtgact aaagaatact tatttcttag gatatgtttt attgataata acaattaaaa 16320

tttcagatat ctttcataag caaatcagtg gtctttttac ttcatgtttt aatgctaaaa 16380

tattttcttt tatagatagt cagaacatta tgcctttttc tgactccagc agagagaaaa 16440

tgctccaggt tatgtgaagc agaatcatca tttaaatatg agtcagggct ctttgtacaa 16500

ggcctgctaa aggtatagtt tctagttatc acaagtgaaa ccacttttct aaaatcattt 16560

ttgagactct ttatagacaa atcttaaata ttagcattta atgtatctca tattgacatg 16620

cccagagact gacttccttt acacagttct gcacatagac tatatgtctt atggatttat 16680

agttagtatc atcagtgaaa caccatagaa taccctttgt gttccaggtg ggtccctgtt 16740

cctacatgtc tagcctcagg actttttttt ttttaacaca tgcttaaatc aggttgcaca 16800

tcaaaaataa gatcatttct ttttaactaa atagatttga attttattga aaaaaaattt 16860

taaacatctt taagaagctt ataggattta agcaattcct atgtatgtgt actaaaatat 16920

atatatttct atatataata tatattagaa aaaaattgta tttttctttt atttgagtct 16980

actgtcaagg agcaaaacag agaaatgtaa attagcaatt atttataata cttaaaggga 17040

agaaagttgt tcaccttgtt gaatctatta ttgttatttc aattatagtc ccaagacgtg 17100

aagaaatagc tttcctaatg gttatgtgat tgtctcatag tgactacttt cttgaggatg 17160

tagccacggc aaaatgaaat aaaaaaattt aaaaattgtt gcaaatacaa gttatattag 17220

gcttttgtgc attttcaata atgtgctgct atgaactcag aatgatagta tttaaatata 17280

gaaactagtt aaaggaaacg tagtttctat ttgagttata catatctgta aattagaact 17340

tctcctgtta aaggcataat aaagtgctta atacttttgt ttcctcagca ccctctcatt 17400

taattatata attttagttc tgaaagggac ctataccaga tgcctagagg aaatttcaaa 17460

actatgatct aatgaaaaaa tatttaatag ttctccatgc aaatacaaat catatagttt 17520

tccagaaaat acctttgaca ttatacaaag atgattatca cagcattata atagtaaaaa 17580

aatggaaata gcctctttct tctgttctgt tcatagcaca gtgcctcata cgcagtaggt 17640

tattattaca tggtaactgg ctaccccaac tgattaggaa agaagtaaat ttgttttata 17700

aaaatacata ctcattgagg tgcatagaat aattaagaaa ttaaaagaca cttgtaattt 17760

tgaatccagt gaatacccac tgttaatatt tggtatatct ctttctagtc tttttttccc 17820

ttttgcatgt attttcttta agactcccac ccccactgga tcatctctgc atgttctaat 17880

ctgctttttt cacagcagat tctaagcctc tttgaatatc aacacaaact tcaacaactt 17940

catctataga tgccaaataa taaattcatt tttatttact taaccacttc ctttggatgc 18000

ttaggtcatt ctgatgtttt gctattgaaa ccaatgctat actgaacact tctgtcacta 18060

aaactttgca cacactcatg aatagcttct taggataaat ttttagagat ggatttgcta 18120

aatcagagac cattttttaa aattaaaaaa caattattca tatcgtttgg catgtaagac 18180

agtaaatttt ccttttattt tgacaggatt caactggaag ctttgtgctg cctttccggc 18240

aagtcatgta tgctccatat cccaccacac acatagatgt ggatgtcaat actgtgaagc 18300

agatgccacc ctgtcatgaa catatttata atcagcgtag atacatgaga tccgagctga 18360

cagccttctg gagagccact tcagaagaag acatggctca ggatacgatc atctacactg 18420

acgaaagctt tactcctgat ttgtacgtaa tgctctgcct gctggtactg tagtcaagca 18480

atatgaaatt gtgtctttta cgaataaaaa caaaacagaa gttgcattta aaaagaaaga 18540

aatattacca gcagaattat gcttgaagaa acatttaatc aagcattttt ttcttaaatg 18600

ttcttctttt tccatacaat tgtgtttacc ctaaaatagg taagattaac ccttaaagta 18660

aatatttaac tatttgttta ataaatatat attgagctcc taggcactgt tctaggtacc 18720

gggcttaata gtggccaacc agacagcccc agccccagcc cctacattgt gtatagtcta 18780

ttatgtaaca gttattgaat ggacttatta acaaaaccaa agaagtaatt ctaagtcttt 18840

tttttcttga catatgaata taaaatacag caaaactgtt aaaatatatt aatggaacat 18900

ttttttactt tgcattttat attgttattc acttcttatt tttttttaaa aaaaaaagcc 18960

tgaacagtaa attcaaaagg aaaagtaatg ataattaatt gttgagcatg gacccaactt 19020

gaaaaaaaaa atgatgatga taaatctata atcctaaaac cctaagtaaa cacttaaaag 19080

atgttctgaa atcaggaaaa gaattatagt atacttttgt gtttctcttt tatcagttga 19140

aaaaaggcac agtagctcat gcctgtaaga acagagcttt gggagtgcaa ggcaggcgga 19200

tcacttgagg ccaggagttc cagaccagcc tgggcaacat agtgaaaccc catctctaca 19260

aaaaataaaa aagaattatt ggaatgtgtt tctgtgtgcc tgtaatccta gctattccga 19320

aagctgaggc aggaggatct tttgagccca ggagtttgag gttacaggga gttatgatgt 19380

gccagtgtac tccagcctgg ggaacaccga gactctgtct tatttaaaaa aaaaaaaaaa 19440

aaaatgcttg caataatgcc tggcacatag aaggtaacag taagtgttaa ctgtaataac 19500

ccaggtctaa gtgtgtaagg caatagaaaa attggggcaa ataagcctga cctatgtatc 19560

tacagaatca gtttgagctt aggtaacaga cctgtggagc accagtaatt acacagtaag 19620

tgttaaccaa aagcatagaa taggaatatc ttgttcaagg gacccccagc cttatacatc 19680

tcaaggtgca gaaagatgac ttaatatagg acccattttt tcctagttct ccagagtttt 19740

tattggttct tgagaaagta gtaggggaat gttttagaaa atgaattggt ccaactgaaa 19800

ttacatgtca gtaagttttt atatattggt aaattttagt agacatgtag aagttttcta 19860

attaatctgt gccttgaaac attttctttt ttcctaaagt gcttagtatt ttttccgttt 19920

tttgattggt tacttgggag cttttttgag gaaatttagt gaactgcaga atgggtttgc 19980

aaccatttgg tatttttgtt ttgtttttta gaggatgtat gtgtatttta acatttctta 20040

atcattttta gccagctatg tttgttttgc tgatttgaca aactacagtt agacagctat 20100

tctcattttg ctgatcatga caaaataata tcctgaattt ttaaattttg catccagctc 20160

taaattttct aaacataaaa ttgtccaaaa aatagtattt tcagccacta gattgtgtgt 20220

taagtctatt gtcacagagt cattttactt ttaagtatat gtttttacat gttaattatg 20280

tttgttattt ttaattttaa ctttttaaaa taattccagt cactgccaat acatgaaaaa 20340

ttggtcactg gaattttttt tttgactttt attttaggtt catgtgtaca tgtgcaggtg 20400

tgttatacag gtaaattgcg tgtcatgagg gtttggtgta caggtgattt cattacccag 20460

gtaataagca tagtacccaa taggtagttt tttgatcctc acccttctcc caccctcaag 20520

taggccctgg tgttgctgtt tccttctttg tgtccatgta tactcagtgt ttagctccca 20580

cttagaagtg agaacatgcg gtagttggtt ttctgttcct ggattagttc acttaggata 20640

atgacctcta gctccatctg gtttttatgg ctgcatagta ttccatggtg tatatgtatc 20700

acattttctt tatccagtct accattgata ggcatttagg ttgattccct gtctttgtta 20760

tcatgaatag tgctgtgatg aacatacaca tgcatgtgtc tttatggtag aaaaatttgt 20820

attcctttag gtacatatag aataatgggg ttgctagggt gaatggtagt tctattttca 20880

gttatttgag aaatcttcaa actgcttttc ataatagcta aactaattta cagtcccgcc 20940

agcagtgtat aagtgttccc ttttctccac aaccttgcca acatctgtga ttttttgact 21000

ttttaataat agccattcct agagaattga tttgcaattc tctattagtg atattaagca 21060

ttttttcata tgctttttag ctgtctgtat atattcttct gaaaaatttt catgtccttt 21120

gcccagtttg tagtggggtg ggttgttttt tgcttgttaa ttagttttaa gttccttcca 21180

gattctgcat atccctttgt tggatacatg gtttgcagat atttttctcc cattgtgtag 21240

gttgtctttt actctgttga tagtttcttt tgccatgcag gagctcgtta ggtcccattt 21300

gtgtttgttt ttgttgcagt tgcttttggc gtcttcatca taaaatctgt gccagggcct 21360

atgtccagaa tggtatttcc taggttgtct tccagggttt ttacaatttt agattttacg 21420

tttatgtctt taatccatct tgagttgatt tttgtatatg gcacaaggaa ggggtccagt 21480

ttcactccaa ttcctatggc tagcaattat cccagcacca tttattgaat acggagtcct 21540

ttccccattg cttgtttttt gtcaactttg ttgaagatca gatggttgta agtgtgtggc 21600

tttatttctt ggctctctat tctccattgg tctatgtgtc tgtttttata acagtaccct 21660

gctgttcagg ttcctatagc cttttagtat aaaatcggct aatgtgatgc ctccagcttt 21720

gttctttttg cttaggattg ctttggctat ttgggctcct ttttgggtcc atattaattt 21780

taaaacagtt ttttctggtt ttgtgaagga tatcattggt agtttatagg aatagcattg 21840

aatctgtaga ttgctttggg cagtatggcc attttaacaa tattaattct tcctatctat 21900

gaatatggaa tgtttttcca tgtgtttgtg tcatctcttt atacctgatg tataaagaaa 21960

agctggtatt attcctactc aatctgttcc aaaaaattga ggaggaggaa ctcttcccta 22020

atgaggccag catcattctg ataccaaaac ctggcagaga cacaacagaa aaaagaaaac 22080

ttcaggccaa tatccttgat gaatatagat gcaaaaatcc tcaacaaaat actagcaaac 22140

caaatccagc agcacatcaa aaagctgatc tactttgatc aagtaggctt tatccctggg 22200

atgcaaggtt ggttcaacat acacaaatca ataagtgtga ttcatcacat aaacagagct 22260

aaaaacaaaa accacaagat tatctcaata ggtagagaaa aggttgtcaa taaaatttaa 22320

catcctccat gttaaaaacc ttcagtaggt caggtgtagt gactcacacc tgtaatccca 22380

gcactttggg aggccaaggc gggcatatct cttaagccca ggagttcaag acgagcctag 22440

gcagcatggt gaaaccccat ctctacaaaa aaaaaaaaaa aaaaaaatta gcttggtatg 22500

gtgacatgca cctatagtcc cagctattca ggaggttgag gtgggaggat tgtttgagcc 22560

cgggaggcag aggttggcag cgagctgaga tcatgccacc gcactccagc ctgggcaacg 22620

gagtgagacc ctgtctcaaa aaagaaaaat cacaaacaat cctaaacaaa ctaggcattg 22680

aaggaacatg cctcaaaaaa ataagaacca tctatgacag acccatagcc aatatcttac 22740

caaatgggca aaagctggaa gtattctcct tgagaaccgt aacaagacaa ggatgtccac 22800

tctcaccact ccttttcagc atagttctgg aagtcctagc cagagcaatc aggaaagaga 22860

aagaaagaaa gacattcaga taggaagaga agaagtcaaa ctatttctgt ttgcaggcag 22920

tataattctg tacctagaaa atctcatagt ctctgcccag aaactcctaa atctgttaaa 22980

aatttcagca aagttttggc attctctata ctccaacacc ttccaaagtg agagcaaaat 23040

caagaacaca gtcccattca caatagccgc aaaacgaata aaatacctag gaatccagct 23100

aaccagggag gtgaaagatc tctatgagaa ttacaaaaca ctgctgaaag aaatcagaga 23160

tgacacaaac aaatggaaat gttctttttt aacaccttgc tttatctaat tcacttatga 23220

tgaagatact cattcagtgg aacaggtata ataagtccac tcgattaaat ataagcctta 23280

ttctctttcc agagcccaag aaggggcact atcagtgccc agtcaataat gacgaaatgc 23340

taatattttt cccctttacg gtttctttct tctgtagtgt ggtacactcg tttcttaaga 23400

taaggaaact tgaactacct tcctgtttgc ttctacacat acccattctc tttttttgcc 23460

actctggtca ggtataggat gatccctacc actttcagtt aaaaactcct cctcttacta 23520

aatgttctct taccctctgg cctgagtaga acctagggaa aatggaagag aaaaagatga 23580

aagggaggtg gggcctggga agggaataag tagtcctgtt tgtttgtgtg tttgctttag 23640

cacctgctat atcctaggtg ctgtgttagg cacacattat tttaagtggc cattatatta 23700

ctactactca ctctggtcgt tgccaaggta ggtagtactt tcttggatag ttggttcatg 23760

ttacttacag atggtgggct tgttgaggca aacccagtgg ataatcatcg gagtgtgttc 23820

tctaatctca ctcaaatttt tcttcacatt ttttggtttg ttttggtttt tgatggtagt 23880

ggcttatttt tgttgctggt ttgttttttg tttttttttg agatggcaag aattggtagt 23940

tttatttatt aattgcctaa gggtctctac tttttttaaa agatgagagt agtaaaatag 24000

attgatagat acatacatac ccttactggg gactgcttat attctttaga gaaaaaatta 24060

catattagcc tgacaaacac cagtaaaatg taaatatatc cttgagtaaa taaatgaatg 24120

tatattttgt gtctccaaat atatatatct atattcttac aaatgtgttt atatgtaata 24180

tcaatttata agaacttaaa atgttggctc aagtgaggga ttgtggaagg tagcattata 24240

tggccatttc aacatttgaa cttttttctt ttcttcattt tcttcttttc ttcaggaata 24300

tttttcaaga tgtcttacac agagacactc tagtgaaagc cttcctggat caggtaaatg 24360

ttgaacttga gattgtcaga gtgaatgata tgacatgttt tcttttttaa tatatcctac 24420

aatgcctgtt ctatatattt atattcccct ggatcatgcc ccagagttct gctcagcaat 24480

tgcagttaag ttagttacac tacagttctc agaagagtct gtgagggcat gtcaagtgca 24540

tcattacatt ggttgcctct tgtcctagat ttatgcttcg ggaattcaga cctttgttta 24600

caatataata aatattattg ctatctttta aagatataat aataagatat aaagttgacc 24660

acaactactg ttttttgaaa catagaattc ctggtttaca tgtatcaaag tgaaatctga 24720

cttagctttt acagatataa tatatacata tatatatcct gcaatgcttg tactatatat 24780

gtagtacaag tatatatata tgtttgtgtg tgtatatata tatagtacga gcatatatac 24840

atattaccag cattgtagga tatatatatg tttatatatt aaaaaaaagt tataaactta 24900

aaaccctatt atgttatgta gagtatatgt tatatatgat atgtaaaata tataacatat 24960

actctatgat agagtgtaat atatttttta tatatatttt aacatttata aaatgataga 25020

attaagaatt gagtcctaat ctgttttatt aggtgctttt tgtagtgtct ggtctttcta 25080

aagtgtctaa atgatttttc cttttgactt attaatgggg aagagcctgt atattaacaa 25140

ttaagagtgc agcattccat acgtcaaaca acaaacattt taattcaagc attaacctat 25200

aacaagtaag tttttttttt ttttttgaga aagggaggtt gtttatttgc ctgaaatgac 25260

tcaaaaatat ttttgaaaca tagtgtactt atttaaataa catctttatt gtttcattct 25320

tttaaaaaat atctacttaa ttacacagtt gaaggaaatc gtagattata tggaacttat 25380

ttcttaatat attacagttt gttataataa cattctgggg atcaggccag gaaactgtgt 25440

catagataaa gctttgaaat aatgagatcc ttatgtttac tagaaatttt ggattgagat 25500

ctatgaggtc tgtgacatat tgcgaagttc aaggaaaatt cgtaggcctg gaatttcatg 25560

cttctcaagc tgacataaaa tccctcccac tctccacctc atcatatgca cacattctac 25620

tcctacccac ccactccacc ccctgcaaaa gtacaggtat atgaatgtct caaaaccata 25680

ggctcatctt ctaggagctt caatgttatt tgaagatttg ggcagaaaaa attaagtaat 25740

acgaaataac ttatgtatga gttttaaaag tgaagtaaac atggatgtat tctgaagtag 25800

aatgcaaaat ttgaatgcat ttttaaagat aaattagaaa acttctaaaa actgtcagat 25860

tgtctgggcc tggtggctta tgcctgtaat cccagcactt tgggagtccg aggtgggtgg 25920

atcacaaggt caggagatcg agaccatcct gccaacatgg tgaaaccccg tctctactaa 25980

gtatacaaaa attagctggg cgtggcagcg tgtgcctgta atcccagcta cctgggaggc 26040

tgaggcagga gaatcgcttg aacccaggag gtgtaggttg cagtgagtca agatcgcgcc 26100

actgcacttt agcctggtga cagagctaga ctccgtctca aaaaaaaaaa aaaatatcag 26160

attgttccta cacctagtgc ttctatacca cactcctgtt agggggcatc agtggaaatg 26220

gttaaggaga tgtttagtgt gtattgtctg ccaagcactg tcaacactgt catagaaact 26280

tctgtacgag tagaatgtga gcaaattatg tgttgaaatg gttcctctcc ctgcaggtct 26340

ttcagctgaa acctggctta tctctcagaa gtactttcct tgcacagttt ctacttgtcc 26400

ttcacagaaa agccttgaca ctaataaaat atatagaaga cgatacgtga gtaaaactcc 26460

tacacggaag aaaaaccttt gtacattgtt tttttgtttt gtttcctttg tacattttct 26520

atatcataat ttttgcgctt cttttttttt tttttttttt tttttttcca ttatttttag 26580

gcagaaggga aaaaagccct ttaaatctct tcggaacctg aagatagacc ttgatttaac 26640

agcagagggc gatcttaaca taataatggc tctggctgag aaaattaaac caggcctaca 26700

ctcttttatc tttggaagac ctttctacac tagtgtgcaa gaacgagatg ttctaatgac 26760

tttttaaatg tgtaacttaa taagcctatt ccatcacaat catgatcgct ggtaaagtag 26820

ctcagtggtg tggggaaacg ttcccctgga tcatactcca gaattctgct ctcagcaatt 26880

gcagttaagt aagttacact acagttctca caagagcctg tgaggggatg tcaggtgcat 26940

cattacattg ggtgtctctt ttcctagatt tatgcttttg ggatacagac ctatgtttac 27000

aatataataa atattattgc tatcttttaa agatataata ataggatgta aacttgacca 27060

caactactgt ttttttgaaa tacatgattc atggtttaca tgtgtcaagg tgaaatctga 27120

gttggctttt acagatagtt gactttctat cttttggcat tctttggtgt gtagaattac 27180

tgtaatactt ctgcaatcaa ctgaaaacta gagcctttaa atgatttcaa ttccacagaa 27240

agaaagtgag cttgaacata ggatgagctt tagaaagaaa attgatcaag cagatgttta 27300

attggaattg attattagat cctactttgt ggatttagtc cctgggattc agtctgtaga 27360

aatgtctaat agttctctat agtccttgtt cctggtgaac cacagttagg gtgttttgtt 27420

tattttattg ttcttgctat tgttgatatt ctatgtagtt gagctctgta aaaggaaatt 27480

gtattttatg ttttagtaat tgttgccaac tttttaaatt aattttcatt atttttgagc 27540

caaattgaaa tgtgcacctc ctgtgccttt tttctcctta gaaaatctaa ttacttggaa 27600

caagttcaga tttcactggt cagtcatttt catcttgttt tcttcttgct aagtcttacc 27660

atgtacctgc tttggcaatc attgcaactc tgagattata aaatgcctta gagaatatac 27720

taactaataa gatctttttt tcagaaacag aaaatagttc cttgagtact tccttcttgc 27780

atttctgcct atgtttttga agttgttgct gtttgcctgc aataggctat aaggaatagc 27840

aggagaaatt ttactgaagt gctgttttcc taggtgctac tttggcagag ctaagttatc 27900

ttttgttttc ttaatgcgtt tggaccattt tgctggctat aaaataactg attaatataa 27960

ttctaacaca atgttgacat tgtagttaca caaacacaaa taaatatttt atttaaaatt 28020

ctggaagtaa tataaaaggg aaaatatatt tataagaaag ggataaaggt aatagagccc 28080

ttctgccccc cacccaccaa atttacacaa caaaatgaca tgttcgaatg tgaaaggtca 28140

taatagcttt cccatcatga atcagaaaga tgtggacagc ttgatgtttt agacaaccac 28200

tgaactagat gactgttgta ctgtagctca gtcatttaaa aaatatataa atactacctt 28260

gtagtgtccc atactgtgtt ttttacatgg tagattctta tttaagtgct aactggttat 28320

tttctttggc tggtttattg tactgttata cagaatgtaa gttgtacagt gaaataagtt 28380

attaaagcat gtgtaaacat tgttatatat cttttctcct aaatggagaa ttttgaataa 28440

aatatatttg aaattttgcc tctttcagtt gttcattcag aaaaaaatac tatgatattt 28500

gaagactgat cagcttctgt tcagctgaca gtcatgctgg atctaaactt tttttaaaat 28560

taattttgtc ttttcaaaga aaaaatattt aaagaagctt tataatataa tcttatgtta 28620

aaaaaacttt ctgcttaact ctctggattt cattttgatt tttcaaatta tatattaata 28680

tttcaaatgt aaaatactat ttagataaat tgtttttaaa cattcttatt attataatat 28740

taatataacc taaactgaag ttattcatcc caggtatcta atacatgtat ccaaagtaaa 28800

aatccaagga atctgaacac tttcatctgc aaagctagga ataggtttga cattttcact 28860

ccaagaaaaa gttttttttt gaaaatagaa tagttgggat gagaggtttc tttaaaagaa 28920

gactaactga tcacattact atgattctca aagaagaaac caaaacttca tataatacta 28980

taaagtaaat ataaaatagt tccttctata gtatatttct ataatgctac agtttaaaca 29040

gatcactctt atataatact attttgattt tgatgtagaa ttgcacaaat tgatatttct 29100

cctatgatct gcagggtata gcttaaagta acaaaaacag tcaaccacct ccatttaaca 29160

cacagtaaca ctatgggact agttttatta cttccatttt acaaatgagg aaactaaagc 29220

ttaaagatgt gtaatacacc gcccaaggtc acacagctgg taaaggtgga tttcatccca 29280

gacagttaca gtcattgcca tgggcacagc tcctaactta gtaactccat gtaactggta 29340

ctcagtgtag ctgaattgaa aggagagtaa ggaagcaggt tttacaggtc tacttgcact 29400

attcagagcc cgagtgtgaa tccctgctgt gctgcttgga gaagttactt aacctatgca 29460

aggttcattt tgtaaatatt ggaaatggag tgataatacg tacttcacca gaggatttaa 29520

tgagacctta tacgatcctt agttcagtac ctgactagtg cttcataaat gctttttcat 29580

ccaatctgac aatctccagc ttgtaattgg ggcatttaga acatttaata tgattattgg 29640

catggtaggt taaagctgtc atcttgctgt tttctatttg ttctttttgt tttctcctta 29700

cttttggatt tttttattct actatgtctt ttctattgtc ttattaacta tactctttga 29760

tttattttag tggttgtttt agggttatac ctctttctaa tttaccagtt tataaccagt 29820

ttatatacta cttgacatat agcttaagaa acttactgtt gttgtctttt tgctgttatg 29880

gtcttaacgt ttttatttct acaaacatta taaactccac actttattgt tttttaattt 29940

tacttataca gtcaattatc ttttaaagat atttaaatat aaacattcaa aacaccccaa 30000

t 30001

<210> 3

<211> 1031

<212> DNA

<213> homo sapiens

<400> 3

attcccggga tacgtaacct acggtgtccc gctaggaaag agaggtgcgt caaacagcga 60

caagttccgc ccacgtaaaa gatgacgctt ggtgtgtcag ccgtccctgc tgcccggttg 120

cttctctttt gggggcgggg tctagcaaga gcaggtgtgg gtttaggaga tatctccgga 180

gcatttggat aatgtgacag ttggaatgca gtgatgtcga ctctttgccc accgccatct 240

ccagctgttg ccaagacaga gattgcttta agtggcaaat cacctttatt agcagctact 300

tttgcttact gggacaatat tcttggtcct agagtaaggc acatttgggc tccaaagaca 360

gaacaggtac ttctcagtga tggagaaata acttttcttg ccaaccacac tctaaatgga 420

gaaatccttc gaaatgcaga gagtggtgct atagatgtaa agttttttgt cttgtctgaa 480

aagggagtga ttattgtttc attaatcttt gatggaaact ggaatgggga tcgcagcaca 540

tatggactat caattatact tccacagaca gaacttagtt tctacctccc acttcataga 600

gtgtgtgttg atagattaac acatataatc cggaaaggaa gaatatggat gcataaggaa 660

agacaagaaa aatgtccaga agattatctt agaaggcaca gagagaatgg aagatcaggg 720

tcagagtatt attccaatgc ttactggaga agtgattcct gtaatggaaa ctgctttcct 780

ctatgaaatt cccccgggtt cctggaggaa atagatatag gctgatacag ttacccaatg 840

atggatgaat attgggggac cgcctggtca ttgaaaggct ttcttttctc caggaaagaa 900

atttttttcc ttttccataa aaagcttggg aatggaagac aacaattccc attctttttt 960

tgcgttccac ccctatgtga caacagaaat ttttggggaa acaacaacga aaaaatttta 1020

tcccgcgcgc a 1031

<210> 4

<211> 3244

<212> DNA

<213> homo sapiens

<400> 4

gggcggggct gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag 60

tggatatctc cggagcattt ggataatgtg acagttggaa tgcagtgatg tcgactcttt 120

gcccaccgcc atctccagct gttgccaaga cagagattgc tttaagtggc aaatcacctt 180

tattagcagc tacttttgct tactgggaca atattcttgg tcctagagta aggcacattt 240

gggctccaaa gacagaacag gtacttctca gtgatggaga aataactttt cttgccaacc 300

acactctaaa tggagaaatc cttcgaaatg cagagagtgg tgctatagat gtaaagtttt 360

ttgtcttgtc tgaaaaggga gtgattattg tttcattaat ctttgatgga aactggaatg 420

gggatcgcag cacatatgga ctatcaatta tacttccaca gacagaactt agtttctacc 480

tcccacttca tagagtgtgt gttgatagat taacacatat aatccggaaa ggaagaatat 540

ggatgcataa ggaaagacaa gaaaatgtcc agaagattat cttagaaggc acagagagaa 600

tggaagatca gggtcagagt attattccaa tgcttactgg agaagtgatt cctgtaatgg 660

aactgctttc atctatgaaa tcacacagtg ttcctgaaga aatagatata gctgatacag 720

tactcaatga tgatgatatt ggtgacagct gtcatgaagg ctttcttctc aatgccatca 780

gctcacactt gcaaacctgt ggctgttccg ttgtagtagg tagcagtgca gagaaagtaa 840

ataagatagt cagaacatta tgcctttttc tgactccagc agagagaaaa tgctccaggt 900

tatgtgaagc agaatcatca tttaaatatg agtcagggct ctttgtacaa ggcctgctaa 960

aggattcaac tggaagcttt gtgctgcctt tccggcaagt catgtatgct ccatatccca 1020

ccacacacat agatgtggat gtcaatactg tgaagcagat gccaccctgt catgaacata 1080

tttataatca gcgtagatac atgagatccg agctgacagc cttctggaga gccacttcag 1140

aagaagacat ggctcaggat acgatcatct acactgacga aagctttact cctgatttga 1200

atatttttca agatgtctta cacagagaca ctctagtgaa agccttcctg gatcaggtct 1260

ttcagctgaa acctggctta tctctcagaa gtactttcct tgcacagttt ctacttgtcc 1320

ttcacagaaa agccttgaca ctaataaaat atatagaaga cgatacgcag aagggaaaaa 1380

agccctttaa atctcttcgg aacctgaaga tagaccttga tttaacagca gagggcgatc 1440

ttaacataat aatggctctg gctgagaaaa ttaaaccagg cctacactct tttatctttg 1500

gaagaccttt ctacactagt gtgcaagaac gagatgttct aatgactttt taaatgtgta 1560

acttaataag cctattccat cacaatcatg atcgctggta aagtagctca gtggtgtggg 1620

gaaacgttcc cctggatcat actccagaat tctgctctca gcaattgcag ttaagtaagt 1680

tacactacag ttctcacaag agcctgtgag gggatgtcag gtgcatcatt acattgggtg 1740

tctcttttcc tagatttatg cttttgggat acagacctat gtttacaata taataaatat 1800

tattgctatc ttttaaagat ataataatag gatgtaaact tgaccacaac tactgttttt 1860

ttgaaataca tgattcatgg tttacatgtg tcaaggtgaa atctgagttg gcttttacag 1920

atagttgact ttctatcttt tggcattctt tggtgtgtag aattactgta atacttctgc 1980

aatcaactga aaactagagc ctttaaatga tttcaattcc acagaaagaa agtgagcttg 2040

aacataggat gagctttaga aagaaaattg atcaagcaga tgtttaattg gaattgatta 2100

ttagatccta ctttgtggat ttagtccctg ggattcagtc tgtagaaatg tctaatagtt 2160

ctctatagtc cttgttcctg gtgaaccaca gttagggtgt tttgtttatt ttattgttct 2220

tgctattgtt gatattctat gtagttgagc tctgtaaaag gaaattgtat tttatgtttt 2280

agtaattgtt gccaactttt taaattaatt ttcattattt ttgagccaaa ttgaaatgtg 2340

cacctcctgt gccttttttc tccttagaaa atctaattac ttggaacaag ttcagatttc 2400

actggtcagt cattttcatc ttgttttctt cttgctaagt cttaccatgt acctgctttg 2460

gcaatcattg caactctgag attataaaat gccttagaga atatactaac taataagatc 2520

tttttttcag aaacagaaaa tagttccttg agtacttcct tcttgcattt ctgcctatgt 2580

ttttgaagtt gttgctgttt gcctgcaata ggctataagg aatagcagga gaaattttac 2640

tgaagtgctg ttttcctagg tgctactttg gcagagctaa gttatctttt gttttcttaa 2700

tgcgtttgga ccattttgct ggctataaaa taactgatta atataattct aacacaatgt 2760

tgacattgta gttacacaaa cacaaataaa tattttattt aaaattctgg aagtaatata 2820

aaagggaaaa tatatttata agaaagggat aaaggtaata gagcccttct gccccccacc 2880

caccaaattt acacaacaaa atgacatgtt cgaatgtgaa aggtcataat agctttccca 2940

tcatgaatca gaaagatgtg gacagcttga tgttttagac aaccactgaa ctagatgact 3000

gttgtactgt agctcagtca tttaaaaaat atataaatac taccttgtag tgtcccatac 3060

tgtgtttttt acatggtaga ttcttattta agtgctaact ggttattttc tttggctggt 3120

ttattgtact gttatacaga atgtaagttg tacagtgaaa taagttatta aagcatgtgt 3180

aaacattgtt atatatcttt tctcctaaat ggagaatttt gaataaaata tatttgaaat 3240

tttg 3244

<210> 5

<211> 761

<212> DNA

<213> homo sapiens

<220>

<221> misc_feature

<222> (693)..(693)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (722)..(722)

<223> n is a, c, g, or t

<400> 5

cacgaggctt tgatatttct tacaacgaat ttcatgtgta gacccactaa acagaagcta 60

taaaagttgc atggtcaaat aagtctgaga aagtctgcag atgatataat tcacctgaag 120

agtcacagta tgtagccaaa tgttaaaggt tttgagatgc catacagtaa atttaccaag 180

cattttctaa atttatttga ccacagaatc cctattttaa gcaacaactg ttacatccca 240

tggattccag gtgactaaag aatacttatt tcttaggata tgttttattg ataataacaa 300

ttaaaatttc agatatcttt cataagcaaa tcagtggtct ttttacttca tgttttaatg 360

ctaaaatatt ttcttttata gatagtcaga acattatgcc tttttctgac tccagcagag 420

agaaaatgct ccaggttatg tgaagcagaa tcatcattta aatatgagtc agggctcttt 480

gtacaaggcc tgctaaagga ttcaactgga agctttgtgc tgcctttccg gcaagtcatg 540

tatgctccat atcccaccac acacatagat gtggatgtca atactgtgaa gcagatgcca 600

ccctgtcatg aacatattta taatcagcgt agatacatga gatccgagct gacagccttc 660

tggagagcca cttcagaaga agacatggct cangatacga tcatctacac tgacgaaagc 720

tntactcctg atttgaatat ttttcaagat gtcttacaca g 761

<210> 6

<211> 1901

<212> DNA

<213> homo sapiens

<400> 6

acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60

cacgtaaaag atgacgcttg atatctccgg agcatttgga taatgtgaca gttggaatgc 120

agtgatgtcg actctttgcc caccgccatc tccagctgtt gccaagacag agattgcttt 180

aagtggcaaa tcacctttat tagcagctac ttttgcttac tgggacaata ttcttggtcc 240

tagagtaagg cacatttggg ctccaaagac agaacaggta cttctcagtg atggagaaat 300

aacttttctt gccaaccaca ctctaaatgg agaaatcctt cgaaatgcag agagtggtgc 360

tatagatgta aagttttttg tcttgtctga aaagggagtg attattgttt cattaatctt 420

tgatggaaac tggaatgggg atcgcagcac atatggacta tcaattatac ttccacagac 480

agaacttagt ttctacctcc cacttcatag agtgtgtgtt gatagattaa cacatataat 540

ccggaaagga agaatatgga tgcataagga aagacaagaa aatgtccaga agattatctt 600

agaaggcaca gagagaatgg aagatcaggg tcagagtatt attccaatgc ttactggaga 660

agtgattcct gtaatggaac tgctttcatc tatgaaatca cacagtgttc ctgaagaaat 720

agatatagct gatacagtac tcaatgatga tgatattggt gacagctgtc atgaaggctt 780

tcttctcaag taagaatttt tcttttcata aaagctggat gaagcagata ccatcttatg 840

ctcacctatg acaagatttg gaagaaagaa aataacagac tgtctactta gattgttcta 900

gggacattac gtatttgaac tgttgcttaa atttgtgtta tttttcactc attatatttc 960

tatatatatt tggtgttatt ccatttgcta tttaaagaaa ccgagtttcc atcccagaca 1020

agaaatcatg gccccttgct tgattctggt ttcttgtttt acttctcatt aaagctaaca 1080

gaatcctttc atattaagtt gtactgtaga tgaacttaag ttatttaggc gtagaacaaa 1140

attattcata tttatactga tctttttcca tccagcagtg gagtttagta cttaagagtt 1200

tgtgccctta aaccagactc cctggattaa tgctgtgtac ccgtgggcaa ggtgcctgaa 1260

ttctctatac acctatttcc tcatctgtaa aatggcaata atagtaatag tacctaatgt 1320

gtagggttgt tataagcatt gagtaagata aataatataa agcacttaga acagtgcctg 1380

gaacataaaa acacttaata atagctcata gctaacattt cctatttaca tttcttctag 1440

aaatagccag tatttgttga gtgcctacat gttagttcct ttactagttg ctttacatgt 1500

attatcttat attctgtttt aaagtttctt cacagttaca gattttcatg aaattttact 1560

tttaataaaa gagaagtaaa agtataaagt attcactttt atgttcacag tcttttcctt 1620

taggctcatg atggagtatc agaggcatga gtgtgtttaa cctaagagcc ttaatggctt 1680

gaatcagaag cactttagtc ctgtatctgt tcagtgtcag cctttcatac atcattttaa 1740

atcccatttg actttaagta agtcacttaa tctctctaca tgtcaatttc ttcagctata 1800

aaatgatggt atttcaataa ataaatacat taattaaatg atattatact gactaattgg 1860

gctgttttaa ggcaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1901

<210> 7

<211> 562

<212> DNA

<213> homo sapiens

<220>

<221> misc_feature

<222> (166)..(166)

<223> n is a, c, g, or t

<400> 7

agacgtaacc tacggtgtcc cgctaggaaa gagagatatc tccggagcat ttggataatg 60

tgacagttgg aatgcagtga tgtcgactct ttgcccaccg ccatctccag ctgttgccaa 120

gacagagatt gctttaagtg gcaaatcacc tttattagca gctacntttt gcttactggg 180

acaatattct tggtcctaga gtaaggcaca tttgggctcc aaagacagaa caggtacttc 240

tcagtgatgg agaaataact tttcttgcca accacactct aaatggagaa atccttcgaa 300

atgcagagag tggtgctata gatgtaaagt tttttgtctt gtctgaaaag ggagtgatta 360

ttgtttcatt aatctttgat ggaaactgga atggggatcg cagcacatat ggactatcaa 420

ttatacttcc acagacagaa cttagtttct acctcccact tcatagagtg tgtgttgata 480

gattaacaca tataatccgg aaaggaagaa tatggatgca taaggaaaga caagaaaatg 540

tccagaagat tatcttagaa gg 562

<210> 8

<211> 798

<212> DNA

<213> homo sapiens

<400> 8

gggctctctt ttgggggcgg ggtctagcaa gagcagatat ctccggagca tttggataat 60

gtgacagttg gaatgcagtg atgtcgactc tttgcccacc gccatctcca gctgttgcca 120

agacagagat tgctttaagt ggcaaatcac ctttattagc agctactttt gcttactggg 180

acaatattct tggtcctaga gtaaggcaca tttgggctcc aaagacagaa caggtacttc 240

tcagtgatgg agaaataact tttcttgcca accacactct aaatggagaa atccttcgaa 300

atgcagagag tggtgctata gatgtaaagt tttttgtctt gtctgaaaag ggagtgatta 360

ttgtttcatt aatctttgat ggaaactgga atggggatcg cagcacatat ggactatcaa 420

ttatacttcc acagacagaa cttagtttct acctcccact tcatagagtg tgtgttgata 480

gattaacaca tataatccgg aaaggaagaa tatggatgca taaggaaaga caagaaaatg 540

tccagaagat tatcttagaa ggcacagaga gaatggaaga tcagggtcag agtattattc 600

caatgcttac tggagaagtg attcctgtaa tgggactgct ttcatctatg aaatcacaca 660

gtgttcctga agaaatagat atagctgata cagtactcca tgatgatgat atttggtgac 720

agctgtcatg aaaggctttc ttctcaagta ggaatttttt cttttcataa aagctgggat 780

gaagccagat tcccatct 798

<210> 9

<211> 169

<212> DNA

<213> homo sapiens

<400> 9

aaacagcgac aagttccgcc cacgtaaaag atgatgcttg gtgtgtcagc cgtccctgct 60

gcccggttgc ttctcttttg ggggcggggt ctagcaagag cagatatctc cggagcattt 120

ggataatgtg acagttggaa tgcggtgatg tcgactcttt gcccaccgc 169

<210> 10

<211> 176

<212> DNA

<213> homo sapiens

<400> 10

aaaacgtcat cgcacataga aaacagacag acgtaaccta cggtgtcccg ctaggaaaga 60

gaggtgcgtc aaacagcgac aagttccgcc cacgtaaaag atgacgcttg atatctccgg 120

agcatttgga taatgtgaca gttggaatgc agtgatgtcg actctttgcc caccgc 176

<210> 11

<211> 30001

<212> DNA

<213> macaca mulatta

<220>

<221> misc_feature

<222> (26113)..(26155)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (28797)..(29186)

<223> n is a, c, g, or t

<400> 11

aatctctaag caattttttg gggaagaaag aattgcaatt agggcatacg tgtagatcag 60

atggtcttcg gtatatccaa cgacaaagaa aaggtgggag gtttcgttaa aaaagagaaa 120

tgttacatag tacttttaga gaaaattcac tggcactatt aagggtctga ggagctggta 180

agtttcaatt ggtgagtgat ggtggtagat aaaattagag ctgcagcagg tcatttcagc 240

aactatcaga taaaactggt ctcaggtcac aacgggcagt ttcagcagct agacttgaaa 300

gaattacact gcgggagcaa tgtcatttgt cctgcatgct tttctacccc ctacccccac 360

ttttttagtt gggtataaca agaacgaccc aaattgtatg atcaactttc acaaagcata 420

gaacagtagg aaaagggtct gtttctgcag aagatgtaga cgttgagagc cattttatgt 480

atttatttct ccctttcttc atcggtgaat gattaaaatg ttctgtatga tttttagtga 540

tgagaaaggt taaacgccac tcatctgtag taagtgtaat ctacacactt gcagaccaaa 600

aggcataagg tttaaaaaac ctttgttttt ttacacatca aacagagtgg tataaatgct 660

actcatctgt agtaagtgaa atctatacac ctgcagacca acgacgcaag gtttcaaaaa 720

tctttgtgtt ttttacacat caaacagaat ggtacatttt tcaaaagttt aaaaaaaaaa 780

aaaatccaca tatcacaact agcaaaaatg acattcccca gtgtgaaaat catgcttgag 840

agaattctta catgtaaagg caaaattgca gtgactttac aagggacctg gggattcccg 900

cccacagtgt ggagctgtcc cctaccaggg tttgcggcgg agttttgaat gtacttaaca 960

gtgtctcacg gtaaaaacaa aacttcatcc accaaatatt tgttgagcgc ccactgcctg 1020

ccaagcacaa acaaaaccat tcaaaaccac gaaatcgtct gcactttctc cggatccagc 1080

agcctctgcg attaaggttt gcacacgcta ttgcgccaac gctcctccag agcgcgtctt 1140

aagataaaag aatgggacaa gttgcccctc cccctttcac gggcctcgtg cgtcaacgtc 1200

atcgcatata gaaaacacac agacgtaacc tacggtgtcc cgctaggaaa gagaggcgcg 1260

tcaaacagcg acaagttccg cccacgtaaa agatgacgct tggtgcgtca gccgtccctg 1320

ctgcccggtt ccttctctct gggggcgggg cctggctaga gcaggtgtgg gtttaggagg 1380

tgtgtgtttt tgtttttcct accctctccc ctctacttgc tctcacagta ctcgctgagg 1440

gtgaacaaga aaagacctga taaagattaa ccagaagaaa acaaagaggg aaacaactgc 1500

agcctgtagc gggctctgga gcttaagaga ggcgcgctag gcgccgggcc gtgggcgtgg 1560

tcggggcggg gtcgggccag gggcggggct gcggttgcgg tccctgcgcc cgcggcggcg 1620

gcggcggcgg cagcggaggc gcaggcggtg gcgagtgggt gagtgaagag gcggcgtcct 1680

ggcgggtgtc tgtttggcgt ccggttgccg ggaagagacg cgggtagcag ccggggctct 1740

cctcagagct cgacacattt ttactttccc tctcgtttct ctgaccgaag tcgggtgtcc 1800

ggctttcgcc tctagcgact ggtggaattg cctgcatctg ggccccgggc ttcgcggcgg 1860

cgcagggacg agggatggga atctggcctc ttcctcgctt tcccgcccgc agtgcgctgc 1920

cccagctgtc tccttcccgg ggacctgctg ggagcgctgc cgctacagac tcgagagaaa 1980

ggagcctcgg gcactgagag gcctcgcccg ggggaaggcc ggagggcggg cggcgggcgg 2040

cgagcggctc ctgcggacca agtctgggtt ctctgggaac ccgagacggt ccctgatggc 2100

gaggagatca tgcggggtgc tatgggggtg tggagacgtc tgcagaattt tagcccaagc 2160

ttctaaggag tgctgatgac ttgcatatga gggcagcaat gccagtcggt gtactcccta 2220

ttctgtggga catgatgtgg ttgcttcaca gctccgagat gacacagact tgcttaaagg 2280

aagtgaccat tgtgacttgg gcatcacttg actgatggta atcagttgca gacagaagtg 2340

cacagattac atgtctgtgt ccacactgga tcagtctggc cacgaggaac accacaggct 2400

ttgtattgag aaacaggagg gaggtcctgc actttcccag gaggggtggc cctttcagat 2460

gcaatcgaga ttgttaggct ctggtagagt ggttgcctgg ttgtggcagt tggcaaattc 2520

ctattcaaac tgttgccgtg cgtcaccagt taacaacaag ggtacacgat ctgtctggca 2580

ttacttctac tttgtacaaa ggatcaaaaa tactgttaga tatgattttt ctcagacttt 2640

gggaaacttt taacgtaatc tgtgaatatc acagaagcaa gactgtcata tagaggatat 2700

taataacctg gagtcagaat acttgaaata tggtgtcatt tgacacgggc tctgttatca 2760

ccacctttgc caagcccttt cacttgagga aaaccctcaa tcagttggaa actgcctcat 2820

gctgacagta catctgaaac aaaaacgaga gtagttacca cattccagat tgttcactaa 2880

ggcagcattt atctgctcca ggaaaacatt acaagcaact tatgaagttg ataaaatatt 2940

ttgtttggct atgttggtac tccaaaagtt gctttcagag aaacaaagta aaccaaggag 3000

gacttctgtt gttcacgtct gcccttgggc tctattctac gttaattagg tagttcccag 3060

gaggactaga ttagcctacc tattgtctga gaaacttgga tctgtgagaa atggccagat 3120

agtgatacga acttcacctc ccagtctttc ctgatgttta agattgagaa agtgttgtga 3180

actttctggt gctgtaagca gttcactgtc cttaaagtgg tcctgggcag ctcctgttgt 3240

ggaaagtgga ccgatttagg attctgcttg gctttggact gggagaaaat aaactgcatg 3300

gttacaagta ttgagagcca agttggagaa ggtggcttac acctataatg ccagagcctt 3360

aggaggcagg ggcaagagga tcactggaag tcaggagttc aagcccaacc tgggcagcct 3420

agaccctgtc tctacaaaaa attaaaaact tagccgggcg cggtggtgtg cacctgtagt 3480

cctagctact tgggaggctg aggcaggagg gtcttttgag cccaggagtt tgaagttaca 3540

gggagctatg atcctgccag tgcactccag cctggatggc aaaacgagac cctgtctcta 3600

aaaaacaaga agtgagggct ttatgatcgt agaaattttg cttacaatag cagtggacca 3660

accacctttc taaataccaa tcagggaaga catagttgat ttttaacaaa catttaaaga 3720

aaaagcaaaa cctcaaactt agcactctac taacagtttt agccgatgct aattaaggta 3780

atcatgtctg catatatggg attactttca gaaagtgtat tgggaaacct ctcatgaacc 3840

ctgtgcaacc ctgagcaagc caccgtctca ctcagtttga atcttggctt ccctcaaaag 3900

actctgtggc taatgtttgg taactctctg gagtagccag cactgcatgt acataggata 3960

ggtacataaa acaattattg gttttgagct gatttttttc agctgcattt gcgtgtatgg 4020

atttttctca ccaaagacaa tgacttcaag tgttaataaa ataattgtac agctctccta 4080

attatacttc tctgtaacat ttcatttctc agactatttc ttttggtagg atttaaaact 4140

aaacaattca gtatgatctt tgttcttcat tttctttctt attctttttt ttttcgagac 4200

agagtctccc tctgttgtgc catctcagcc cattgcaacc tccgccacct gggttcaagt 4260

gattctcctg cctcagcctc ctgagtagct gggattacag gtgcccgcca ccacacctac 4320

ctaatttttt gtatttttag tagaggcggg gtttcaccat gttggctagg ctggtcttaa 4380

actcctgacc tcagatgatc cacctgcctc ggcctcccaa agagctggga tgataggcgt 4440

gacccaccat gcccgcccca ttttttttct tattctgtta ggagtgagag tgtaactagc 4500

agtctataat agttcaattt tcacaacgtg gtaaaaattt tccctgtaat tcaacgagat 4560

tttgcttcag ggctcagttc tgttttagga aatactttta ttttcagttt gatgatgaaa 4620

tattagagtt gtgatattgc ctttatgatt acctaccttt ttaacctaaa agaatgaaag 4680

aaaaatatgt ttacagtata attgtatggt tgcgtgttaa cttaattcat tatgttggcc 4740

tccagtttgc tgttgttcgt tatgacagca gtagtgtcat taccatttca attcagatta 4800

cattcctgta tttgatcatt gtaaactgat tgcttaaatt gtattaaaaa cagtggatat 4860

tttaaacaag ctgtactgct tatatccagt gctgtctcct aagactatta aattgatata 4920

acatatttaa aagtaaatat ttcctaaatg aatttttgaa attaaaaata cacgtgttaa 4980

aactgtcttt gtgttcaacc atttctgtac gtacttagag ttaactgttt tgccaggctc 5040

tgtatgccta ctcataatgt gataaaagca ctcatctaat gctctataaa tagaagtcag 5100

tgctttccat cagactgaac actcttggca agatgtggat aaaattattt aagtaaaatt 5160

gtttactttg tcatacattt acagatcaaa tgttagctcc caaagcaatc atatggcaaa 5220

gataggcata tcataatttg cctattagct gctttgtatt gctattatga tagatttcac 5280

agttttagat ctgcttagat gaaaatgtaa ttctttttac tgtcagtctt agatataagt 5340

cttcaattat agtacagtca cacattgctt aggaatgcat cattaggcga ttttgtcatt 5400

atgcaaacat catagagtat acttacataa acctatatag tacagccttt acgtacgtag 5460

gccatatggt atagtctatt gctcctaggc tacaaatctg tacagctgtt actgtactga 5520

atactataga cagttgtaac acagtggtat ttatttatct aaatatatcc aaacatagaa 5580

aaggtacagt taaagtatgg tataaaaaat aatgatatac ctatataggc cacttaccgt 5640

gaatggagct tgcaggacta gaagttgctc tgggtgagtc agtaagtaag tggtgaatga 5700

atgtgaaggc ctagaacatt actgtacaca ctgtagactt tataaacaca gtatgcttaa 5760

gctacaccaa atttatcttt acagtttttc ttcaataaaa aattaatgtg aacctactat 5820

aactttttaa ctttgtaaac tttttaattt tttaactttt aaaatactta gcttgaaaca 5880

caaacacgca tagctataca aaaatatttt ttctttatat ccttattcta gaagcttttt 5940

cctattttta actttttttt ttttacttgt tagtcgtttt tgttaaaaac taaaacacac 6000

acactttcac ctaagcatag acaggattag gatcatcagt ttcactccct tccacctcac 6060

tgccttccac ctccacatct tgtcccactg gaacgttttt agggggaata acacacatgt 6120

agctgtcacc tgctatgata acagtgcttt ctgttgaata cctcctgaag gacctgcctg 6180

aggctgtttt acatttaact taaaaaaaaa aataagtaga aggagtacac tctaaaataa 6240

caataaaagg tatagtctag tgaatacata aaccagcaac atagtagttt attatcaagt 6300

gttgtatact gtaataattg tatgtgctat actttaaatg acttgaaaaa ttgtactaag 6360

accttatgat ggttacagtg tcactaaggc gatagcatat tttcaggtcc attgtaatct 6420

aatgggacca ccatcatata tgcagtccac cattgactga aatgttacat ggtacgtaac 6480

tgtatttgca agaatgattt gttttacatt aatatcacat aggatgtacc tttttagagt 6540

gatatgttta tgtggattaa gatgtacaag tggagcaagg ggacaagagc ccttggttct 6600

gtcttggatg tgagctttta tgctcttctc atcatgtctg ttttcttatt aaattcaaag 6660

gcttggacag gccctattta gcccttgttt tctatgtgtt ctaaataact aaagctttta 6720

aattctagcc atttagtgga gaactctctt tgcaatggta aaatgctgta ttggtttctt 6780

gactagcata ttaaatatat ttatctttgt cttgatattt caatgtcatt ttaaacatca 6840

ggattgggct ttagtattct catacccaga gagttcactg aggatacagg actgtttgcc 6900

cattttttgt tatggctcca gacttgtggt atttcgatgt cttttttttt tttttttttt 6960

tttaaccttt tagcagcttt aaagtatttc tgttgttagg tgttgtatta cttttctaag 7020

attactgtaa caaagcacca caaactgagt ggctttaaac aacagcaatt tattctctca 7080

caattctaga agctagaagt ccgaaatgga agtgttgatg gggcatgatc ctcaaaagag 7140

agaagactct ttccttgcct cttcctggct tctggtggtt accagcaatc ctgagcgttc 7200

ctttcttgct tcgtagtttc agcagtccag tatctgcctt ttgtcttcac atggatgtct 7260

accccttgtc tctgtgtctc cagatctctc tccttataaa cacagaagtt actggattag 7320

gccccactct aatccagtat gaccccattt taacacgatt acacctattt ctaaataagg 7380

tcacattcac atataccaag ggttaggaat tgagcatatc ttttgcaggg acacaattca 7440

acccacaagt gtcagtctct agctgagcct ttcccttcct ggttttctcc tttttagttg 7500

ctgtgggtta ggggccaaat ctccagtcat actagacttg cacatggact ggagatttgg 7560

gaatactgcg ggtctattct atgagcttta gtatgtaaca tttaatatca gtgtaaagaa 7620

gccatttttt cagttcacta tttctttgaa tttcttaatg tatgccctga atataagtaa 7680

caagttacta tgtctcataa aatgatcata tcaacaaaca tttaatgtgc acctactgtg 7740

ctagttgaat gtctttatcc tgataggaga taacaggctt ccgcatcttt gacttaagag 7800

gacaaaccaa gtatgtctga atcatttggg gttttgatgg atatctttaa attgctgaac 7860

ctaatcattg gttttatatg tcattgttta gatatctcag gagcatttgg ataatgtgac 7920

agttggaatg cagtgatgtc gactctttgc ccaccgccat ctccagctgt tgccaagaca 7980

gagattgctt taagtggtga atcaccttta ttagcagcta cttttgctta ctgggacaat 8040

attcttggtc ctagagtaag gcacatttgg gctccaaaga cagaacaggt acttctcagt 8100

gatggagaaa taacttttct tgccaaccac actctaaatg gagaaatcct tcgaaatgca 8160

gagagtggtg ctatagatgt aaagtttttt gtcttgtctg aaaagggagt gattattgtt 8220

tcattaatct ttgatggaaa ctggaatggg gatcgcagca catacggact atcaattata 8280

cttccacaga cagaacttag tttctacctc ccacttcata gagtgtgtgt tgatagatta 8340

acacatataa tccggaaagg aagaatatgg atgcataagg taagtgattt ttcagcttat 8400

taatcatgtt aacctatctt ttgaaagctt attttctgat acatataaat cttattttta 8460

aattatatgc agtgaacatc aaacaataga tattatttat tttgcattta tcctgttaga 8520

tacaaataca tctggtctga tgcctgtcat cttcatatta actgtggaag gtaggaaatg 8580

gtagctccac attacagatg aaaagctaaa gcttaaacaa atgcagaaac ttttagatcc 8640

tggattcttc ttgggagcct ttgactctaa taccttttgt ttccctttca ttgcacaatc 8700

ctgtctttcg cttactacta tgtgtaagta taacagttca aaaaaatagt ttcataagct 8760

gttggttatg tagcctttgg tctctttaac ctctttgcca agttcccagg ttcataaaat 8820

gaggaggttg aaccgcatgg ttcccaagag aattcctttt aattttacag aaattattgt 8880

tttccccgaa gtcctatagt tcaatatata atgatattta catttcagta tagttttggc 8940

atatctaaag aacacattaa gttctccttc ctgtgttcca gtttgatact aacctggaag 9000

tccattaagc attaccaatt ttaaaaggct tttgcccaat agtaaggaaa aataatatct 9060

tttaaaagaa taatttttta ctatgtttgc aggcttactt ccttttttct cacattatga 9120

aactcttaaa atcaggagaa tcttttaaac atcataatgt ttaatttgaa aagtgcaagt 9180

cattcttttc ctttttgaaa ctatgcagat gttacattga ctattttctg tgaagttatc 9240

ttttttttcc ctgcagaata aagggtgttt tgattttatt ttgtgttgtt tataagaaca 9300

tacattcgtt gggttaattt cctgcccctg cccccgtttt ttccctaaag tagaaagtat 9360

ttttcttgtg aactaaatta ctacacaaga acatgtctat tgaaaaataa gtatcaaaat 9420

gttgtgggtt gtttttttaa ataaattctt tcttgctcag gaaagacaag aaaatgtcca 9480

gaagattatc ttagaaggca cagagagaat ggaagatcag gtatatgcag attgcatact 9540

gtcaaatatt attctcatgg catgtatctg tgtaaagttg atggctacat ttgtgaaggc 9600

cttggggaca tacagagtaa gccttaatgg agcttttatg gaggtgtaca gaataaacta 9660

gaggaagatt tccatatctt agacctgaag agttaaatca gtaaacaaag gaaaatagta 9720

attgcatcta caaattaata tttgctccct ttttttttct gtttgaacag aataaatttt 9780

ggataacttg ttactagtaa aaaatttaaa aattgtctgt gatatgttct ttaaggtact 9840

acttctcgaa ctttttccta gaagtagctg taacaggagg agagcatatg tacccctaag 9900

gtatctgggg tataggccca tgtccaaaca atatttcttt taagtcttgt gttgtatctt 9960

taagactcat gcaatttaca ttttattcca tgatataact attttaatat taaaatttgt 10020

cagtgatatt tcttaccctc tcctctagga aaatgtgcca tgtttatact ttggctttga 10080

gtgcccctga ggaacagaca ctagagtttg agaagcatgg ttacacaggc gtggcttccc 10140

ctgcagaaat taagtacaga ctatttcagt gtaaagcaga gaagttcttt tgaaggggaa 10200

tctccagtga agaaagggtt cttcactttt acttccattt cctcttgagg gtgaccctca 10260

ttgctccttg taaaactccg atattttaaa catggctgtt ttgctttcct ctggttcttt 10320

ttaacatgag tgagacagat gatactttaa aaagtaattt taaaaaaaag tgttaaaata 10380

tatggccata atgcagaacc ctatgctgtg atctccttta ccaaattgtt gtgtttgtac 10440

ttttgtagat agctttccag tccagagaca gttattctgt gtaaaggtct gactcaacaa 10500

gaaaagattt ccctttaccc aaagaatgcc agtctttatt tgctggtcaa taagcagggt 10560

ccccaggaaa ggggtaactt tcaccaccct ctaacccact ggttattagt aaactaatta 10620

agtagactta tctcaagatg aggaaactta aaaccaagta aaattctgct tttactggga 10680

ttttattttt tgaaaccaga aacgtttact taagttgact actattaatg aattttggtc 10740

tctcttttaa gtactcttct taaaaatgtt atcctactgc tgagaagttc aagtttgaga 10800

agtacaagga ggaatagaaa cttgagagat tttctttttc ttttagagcc tcttctgtat 10860

ttagccctgt aggaattttt tttttccccc aagattcttc ttcgtgaaaa ggaggagttg 10920

ccttttgatt gagttcttgc aaatctcaca acgactttat tttgaacaat actgtttggg 10980

gatgatgcat gagtctgaaa caacttcagt tgtagctgtc atctgataaa attgcttcac 11040

agggaaggaa atttagcacg gatctagtca ttattcttgt tagattgaat gtgttaatca 11100

taattgtaaa caggcatgat aattattact ttaaaaactg aaaacagtga atagttagtt 11160

gtggaggtta ctaaagcatg atttttttaa aataaaactt tcagcatttt gcaaatatgc 11220

atatggttta ggatagaact tccagaggta gcatcacatt taaattctca agcaacttag 11280

taatacgagg ctctgaaaaa ctggttaaag ttactccaga aatggccctg ggtctgacag 11340

acattctaac ttaaagatgc atatgaagac tttgaataaa atcatttcat atgaagacat 11400

tgaataaaat catttcataa aataagtgag gaaaaacaac tactattgaa ttcatcttaa 11460

tgtatgattt taaaaatatg tttagctaaa aattcataga catttgacaa tttcgtttat 11520

atctcaaaaa gttgacttac ccaagttgat cacaaaactg atgagactgg tggtggtagt 11580

gaataaatga gggaccaccc atatttgaga cactttacat ttgtgatgtg ttatactgaa 11640

ttttcagttt gattctataa actaccaatt tcaaaattac aatttcaagg tgtaataagt 11700

agtggtatta tcttgaaata ggtctaaagg gaacttttct gttttaaaat attcttaaac 11760

tatatgtgct gattttgatt tgcatttggg tagattatac tcttatgaat cggggggctg 11820

ggtattgatt caggttttcc ttacctattt ggtaaggatt tcaaagtctt tttgtgcttg 11880

attttcctcg tttttaaata tgaaacatat tgatgacttt taattaacaa atgtttttat 11940

ctcgaataaa ttttaaagga gatcttttct aaaagaggta tgatgactta attattgcat 12000

ataacaataa atgagaaacc agtgattcca tactctctaa agaataaaag tgagctttag 12060

gcccaggcat ggtggctcat gcctgtaatc ccagcacttt ggaaggccga ggcaggcgga 12120

tcacctgagg tcaggaattc gacaccagcc tggccaaatg gcaaaaccct gtctctacta 12180

caaatacaaa aattagctgg gcatggtggc agcccctata gtcccagcta cttggaagac 12240

tgagacagga gagtcactcg aacccgagag gcagaggttg cagtaagctg aaatcacacc 12300

attgcactcc agcctgggca acaagagcaa aactccgtct caaaaaaaaa aaaaaaaaaa 12360

aaaaagaata aaagtgagct ttggattgcg tataaatcct ttagacaagt agtagacttg 12420

tttgatactg tgtttgaaca aattacaaag tattttcatc aaagaatgtt attgtttgct 12480

gttattttta ttttttattg cccagcttct ctcatattca ttatgtgatt ttcttcactt 12540

catgttactt tattgtgcag ggtcagagta ttattccaat gcttactgga gaagtgattc 12600

ctgtaatgga actgctttca tctatgaaat cacacagtgt tcctgaagaa atagatgtaa 12660

gtttttatat ttttaaatga gagcaattat accctttatc agttttttgg ggttatatta 12720

ttattatgta tattattaat attctaattt taatactaag cacttcgtcg tacgtactat 12780

ccacatgcag tattagccac ttgaacagat aagcacacac aaaatcctgg attttatggc 12840

ataacagagg catttttgat cagtgatgac aaaactaaat ttattttgtt tatttcacta 12900

cttttataat tcctaaaagt gggaggatcc cagctcttat aggagcaatt aatatttaat 12960

gcagtacctt ttgaaacaaa actgtgtgcc aaagcagtaa ccattaatgg aagttgactt 13020

atagtcacaa atttagtttc cttaatcatt tgttgaggat gttttgaatc acacactatg 13080

agtgttaaga gatatcttta ggacactatt cttgttgttt tattgtcatt taggttagtc 13140

tcctgtctga cagctcagaa gaggaagttg ttcttgtaaa aattgtttac acaacctgat 13200

tgaccagctt tcacatttgt tcttctgaaa gctgatggta gtgcacagat tgttttatgg 13260

ggagtcttga ttctcagaaa tgaaggcagt gtgttatatt gaatccagac ttcagaaaac 13320

ttgtatatta aaagtgtttt ttcaacacta tgttatagcc agactaattt ttttattttt 13380

ttgatgcatt ttagatagct gatacagtac tcaatgatga tgatattggt gacagttgtc 13440

atgaaggctt tcttctcaag taagaatttt tcttttcata aaacctggat gaagcatatg 13500

ttcacctatg acaagatttg gaaggaagaa aataacagac tgtctactta gattgttcta 13560

gggacaacat tgcatatttg aattgttgct taaatttgtg ttatttttca ttcgttatat 13620

ttctataata tatttgatgt tattccattt gctatttaaa gaaactgagt ttccatattt 13680

cccagacaag aaatcatggc cccttgcttg attctggttt cttgttttac ttctcattaa 13740

agctaaaaga accctttcaa attaagttgt actgtagatg aacttaagtt atttaggcct 13800

agaaaaaaaa aattcatatt tatactgatc tttttccatc cagcagtgga gtttagtact 13860

taagagtttg tgcccttaaa ccagactccc tgggttaatg ctgtgtacct gtgggcaagg 13920

tccctgaatt ctctatacac ctatttcctc atctgtaaaa tggcaataat aataatagta 13980

cctaatgtat agagttgtta taagcattga gtaagataaa taatataaag cacttagaac 14040

agtgcctgga acataagaac acttaataat agctaacatt ttctatttac atttcttcta 14100

aggaaaaggt taacagaaat agccaatatt tgttcagtgc ctacatgtta gttcctatac 14160

taagtgcttt acatgtatta tcttatattc tattttaatg tttcttcaca gttgcagatt 14220

atcatgaaat tttatttttt aaaaaagaga agtaaaagga taaagtattc acttttatgt 14280

ccacagtctt ttcctttagg ctcatgatgg agtatcagag gcatgaatgt gtttaaccta 14340

agagccttaa tggcttgaat cagaagcact ttagtcctgt atctgttcag tgtcagcctt 14400

tcaaacatca ttttaaatcc catttgactt taagtaaatc acttaatctc tctacatgtc 14460

aatttcttca gctataaaat gatggtattt caataaataa atacattaat taaatgatat 14520

tttacaaact aattgggctg ttttaaggct caataagaaa atttctgtga aaggtctcta 14580

gcaaatgtag ggttctatac aaataaaaga taacattatg cttatatctt cggtgtttat 14640

catgcaaagc tcttctgagt tttttgaaga gctcacctac tattttttgt ttttagtttg 14700

ttaaattgtt ttataggcaa tgtttttaat ctgttttctt taacttacag tgccatcagc 14760

tcacacttgc aaacctgtgg ctgttccgtt gtagtaggta gcagtgcaga gaaagtaaat 14820

aaggtagttt attttataat ctagcaaatg atttgactct ttaagactga tgatatatca 14880

tggattgtca tttaaatggt aggttgcaat taaaatgatc taatagtata aggaggcaat 14940

gtaatctcat cgaattgctg agacaacttg tggcaacagt gagtttgaaa taaagtgaat 15000

aggagtcatt tatcagttta ttttgataac ttgtaaatac cagtgtcaga tgtgtataaa 15060

tggttttgag aatatattaa aatcaggtat ttaaaaaaac actattcttc tatttcccaa 15120

tgtaatcttt aacaaatctg aaggtagtca tgtactttcg gtactagttc tgaagaaatg 15180

ttatttgttt attcatcttg atttcattgt cttggctttc cttctaaatc tatcccttct 15240

tgggagctat tgggattaag tggtcattga tgattatact ttattcagta atgtttctga 15300

ccctttcctt cagtgctact tgagttaata aaggattaat gaacagttac atttccaagc 15360

attagctaat aaactaaagg attttgcact tttcttcact gaccattagt taaaaacagt 15420

tcagagataa gtacatgtat ctttcaattc tagcaaacct aattttttaa aagaagtttt 15480

acataggaaa tatgttggaa atgattattt actttacaaa gatattcata atttattttt 15540

tctgtaacta gctactttgt atatttacat gagccttaat ttatcaaaat tatatttctc 15600

atataaccat ttatgagagc ttagtattcc tctgtcatta tattgcgtct acggactagt 15660

gatcttacta cttctgttac ctcgaacaag tggcttcccg tctgtgacct ccaaagccgt 15720

aggttccaca gagtgactgc tgagctgctt tatgaaggga gaaaggctcc atagttgggt 15780

ttttggtttt gcttttgttt ttgtttttaa catttttcct atcctccatc ctcttgaggc 15840

agagtagctt accttttatc ttgttttaat ttgagaaaga agttgccact gctctagatt 15900

gaaaaccact gctttaacat aataactctg aatatggttt gaatttcaag atagtgacat 15960

gcctttttat ttttactaat agagctgtag gtcgaatatt attagatttc taaaccccac 16020

ccaatgacct ccttatttta aatcaaattt aataattaat tatcttctta ttggaggatc 16080

tggacattct ttgatgtttc ttacaatgaa tttcacatgt agacccacta aacagaagtt 16140

ataaaggttc catggtcaaa taagtctgag aaagtctgca tattatataa ttcacctaaa 16200

gagtcacagt atgtacccaa atgttaaagg ttttgagatg ccatacagta aatttaccaa 16260

gcattttcta aatttatttg accacagaat ccctatttta agcaacaact gttatatccc 16320

ataggttcca ggtgactaaa gaatacttat tgcttaggat atgttttatt gataataaca 16380

attaaaatgt cagatatctt tcataagcag atcagtggtc tttttaaaac tttgtatttt 16440

aatgctaaaa tcttttcttt tgtagatagt cagaacatta tgcctttttc tgactgcagc 16500

agagagaaaa tgctccaggt tatgtgaagc agaatcatca tttaaatatg agtcagggct 16560

ctttgtacag ggcctgctaa aggtatagtt tctacttatc acaagggaaa ccaattttct 16620

aaaatcattt ttgagactct ttgtagacaa atattaaata ttagcattta atgtatctca 16680

tattgacatg cccagtgact gacttccttt gcacagttct gcgcatagac tatatgtctt 16740

atggatttat agttagtatc atcagtgtaa caccatagaa taccctttgt tttccaggtg 16800

ggtccctgta cctacatgtc tagcatcagg tgttgttttt tttttttttt tttaaaacat 16860

atgcttaaat caggttgcac atctaaaata agatcatttc tttttaacta aatagatttg 16920

aattttattg aaaaaaattt taaaacatct ttaagaagca tataggattt aagcagttac 16980

tatgtatgtg tactaaaata tatatatatt cctaaatata tattcctata tataatatat 17040

gtatttctat atataatata tattagaaaa aacttagagt tttctttcat ttgagtctac 17100

tgttcaagga gcaaaacaga gaaatgtaaa ttagcaatta tttacaataa ttaaagggaa 17160

gaaagttgtt caccttgttg gatctattat tgttgtttta attatagtcc caagacgtga 17220

agaaatagct ttcctaatgg ttatgtgatt gtctcatagt gactactttc ttgaggatgt 17280

agccacagca aaatgaaatt taaaaaattt aaaaattgtt gcaaataaaa gttatattag 17340

gcttttgtgc aatttcaata atgtgctgct atgaactcag aatgatagta tttaaatata 17400

gaaactagtt aaaggaaaca cagtttctat ttgagttata caaatctgta aattagaact 17460

tctcctgtta aggcattata aagtgcttaa tacttttgtt tcctcagcac cctctcattt 17520

aattatataa ttttagctct gaaagggacc tataccagat gtgtagagga aatttcaaaa 17580

ctatgatcta atgaaaaaat atttaatagt tctccatgca aatacaaatt atatagtttt 17640

ctggaaaata cctttgacat tatacaaaga tgattatcac agcattataa tagtgaaaaa 17700

atggaaatag cctctttctt ctgttctgtt cacagcatat ggcacagtac ctcatatgca 17760

gtaggttatt atgacctggt aactggctcc cccaactgat taggaaagaa gtaaatttgt 17820

tatttataaa aatacgtgtt cattgagatg catagaataa ttaagaaatt aaaagacact 17880

tgtaatttca aatccagtga atacccactg ttaatatttg gcatatctct ttctagtctt 17940

tttttccctt ttgcatgtat tttctttaag actcccaccc ccactggatc atctctgcat 18000

attctaatct gcttttttca cagcagattc taagcctttt tgcatatcaa cacaaacttc 18060

aacaacttca tctttagatg ctaaataatg aattcatttt tatttactta accactttct 18120

ttggatgctc aggttattct gatgttttgc cattaaaacc aatgctatac tgaacacttc 18180

tgtcactaaa acttgaacac actcatgaat aatttcttag gataaatttt tagagatgga 18240

tttgctaaat caaagaccat tttttaaaaa ttgaaaaaca attatatcgt ttggcatgta 18300

agacagtaca ttttcctttt attttgacag gattcaactg gaagctttgt gctgcctttc 18360

cggcaagtca tgtatgctcc atatcccacc acacacatag atgtggatgt caatactgtg 18420

aagcagatgc caccctgtca tgaacatatt tataatcagc gtagatacat gagatccgag 18480

ctgacagcct tctggagagc cacttcagaa gaagacatgg ctcaggatac gatcatctac 18540

actgacgaaa gctttactcc tgatttgtac gtaatgctct gcgtgctggt actgtagtca 18600

agcaatatga aactgtgtct tttatgaata aaaacaaaac agaagttgca ttcaaaaaga 18660

aagaaatatt actagcagaa ttatgcttga agaaacattt aatcaagcat ttttttctta 18720

aatgttcttc tttttccata cgattgtgtt taccctaaaa taagtaagat taacccttaa 18780

agtgaatatt taactatttg tttaataaat atatattgag ctcctaagca ctgttctagg 18840

tactgggctt aatagtggct aaccacacag ctccagcccc tacattgcat atagtctatt 18900

gtataagtta ctgaatggac ttactaacaa aaccagagaa gtaattctaa gtcttttttt 18960

tcttgacata tgaatataaa atacaacaaa actggtaaaa tatattaata gagcattctt 19020

ttactttgca ttttatattg ttactcactt cgtatttaag aaaaacagtc tgatcaggaa 19080

attcaaaagg aaaagtaatg ataattaatt gagcatagac ccaacttgaa aagaaaaaaa 19140

aggatgatga taaatctata atcctaaaac cctaagtaaa cacttaaatg atgttctgaa 19200

atcaggaaaa gaattatagt atatttttgt ggttctcttt tattagttga aaaaaggcac 19260

agtagctcat gcctataaga acagagcttt gggattccaa ggcaggcaga tcacttgagg 19320

ccaggagttc cagaccagcc tgggcaacat agtgaaaccc catctctaca aaaataaaaa 19380

agaattagtt gaatgtgttt ctgtgtgcct ataatcctag ctattcagaa agctgaggca 19440

ggaggatctc ttgagcccag gagtttgagg ttacatggag ttatgatgtg ccagtgtact 19500

ccagcctgcg ggacaatgag actctgtctt gttaaaaaaa aaagtgcttg gaataatgtt 19560

tggcatatag aaggtaacaa cagtaaatgt taactgtaat aacccaggta taagtgtgta 19620

aggtgataga aaaattgggg caaacaaccc tgacctgtgt ctctacagaa taagtttgag 19680

ttgaggcaac agacatgtgg agcaccagta attacacact aaatgttaac caaaagcgtt 19740

gaatagtaac atcttattca agggaccccc agccttatat atctcaaggt gcagaaagat 19800

gacttaatat aggacccatt ttttccgagt tctccagagt ttttattggt tcttgagaaa 19860

gtagtggggg aattgtttta gaaaatgaat tggtcaaact gaaattccat gtcagtaagt 19920

ttttacatat tggtaaattt tgatagacat gtagaagttt tctaattaat ctgcgccttg 19980

aaacattttc ctttttccta aagtgcttag tattttttcc cttttttgat tggttgcttg 20040

ggagcttttt tgaggaaatt tagtgaactg cagaatgagt ttgcaaccat ttagtatttt 20100

tgttttgtgt tttagaggag gtatgtgtat tttaacattt cttaatcatt tttagccagc 20160

tatgtttgtt ttgctgattg acaaactata attaaacagc tattctcatt ttgctgatca 20220

tgacaaagta atatcctgaa tttttaaatt ttgcatccag ctctaaattt tctaaatttt 20280

ctaaacataa aattgttcaa aaaatagtat ttttagccac tagattgtgt gttgttaagt 20340

ctgttgtcac agactcattt tacttttcag tgtgtgtttt tacatgttaa ttatgtttgt 20400

catttttaat tttaactttt taaaataatt ccagtcactg ccaaaacatg aaaaattggt 20460

cactggaaat ttttttttta acttttattt taggttcatg tgtacatgtg caggtttgtt 20520

atacaggtaa attgcgtgtc gtgagggttt ggtgtaccca ggtaataagg gtagtaccca 20580

ataggtagtt ttttgatcct tacccttctc ccacccttct ttcaccctcg agtaggcctt 20640

ggtgttgctg tttccttctt tgtgtccatg tgtactcaat ggttagctcc tacttagaag 20700

tgagaacatg cggtatttgg ttttctgttc ctggattagt tcactcagga taatggcctc 20760

tagctccatc tgttttttat ggctgcatag tattccatgg tgtatatgta tcatgttttc 20820

tttatccagt ctaccattga tagacattta ggttgattct ctgtctttac tatcatgaat 20880

agcgctgtga tgaacatata cacatgcatg tgtccttatg gtggaacaat ttgtattcct 20940

ttaagtatat acagaataat ggggttgcta gggtgaatgg tagttctatt gtaagttatt 21000

tgtgaaatct tcaaactgct tttcacaata gctaaactaa tttacagtcc caccagcagt 21060

gtataagtgt tcccttttct ccacaacctt gccaacatgt tattttttta cttttcaata 21120

ataggcattc ctagagaatt gatttgcaat tctctaatga ttagtgatat tgagcatttt 21180

ttcgtatgct ttttagctgt gtgtatatat tcttttgaaa aatgttaatg tcctttgccc 21240

agtttgtaat ggggttgttt gtttttgctt gttaattaaa gttccttcca gattctggat 21300

atccctttgt cagatgcgtg gtttgcagat atttttctcc ccttgtgtag gttgtctttt 21360

tactctgttg atagtttctt ttgccgggca ggagctcatt aggtctcatt tgtgtttgtt 21420

tttgttgcag ttgcttttgg cgtcttcatc ataaaatctg tgccagggcc tatgtccaga 21480

atggtatttc ctagtttgtc ttccagggtt tttacaattt tagattttac gtttatgtct 21540

ttaatccgtc ttgagttgat taaggaaggg gtccagtttc actctaattc ctatggctaa 21600

caattatccc agcaccattt attgaatacg gagtcctttc cccattgctt gtttttgtca 21660

attttgttga agatctgatg gttgtaggtg ctatgtggct ttatttcttg gctctctatt 21720

ctccactggt ctgtctgttt ttataccagt accctgctgt taaggttcct atagcctttt 21780

agtataaggt cggctaatgt gatgcctcca gctttgttct ttttgcttag gattgctttg 21840

gctatttggg ctcctttttg gttccatatt aattttaaaa tagttttttc tagttttgtg 21900

aagaatgtca ttgatagttt agaggaatag cgttgaatct gtagattgct ttgggcaaat 21960

ggccatttta acaatattga ttcttcctat ctatgaacat ggaatgtttt tccatgtgtt 22020

tgtgtcatct ctttatacct gatgtataaa gaaaaaccag tattattgct actcaatctg 22080

ttccaaaaaa ttgaggagga ggaactcttc cctaatgaga ccggcttcct tctgatacca 22140

aaacctggca gagatacaac agaaaaaaga aaacttcagg ccaatatcct tgatgaatat 22200

agatgcaaaa atcctcaaca aaatactagc aaccaaatcc agcagtacgt caaaaagcta 22260

atctacttta agtaggcttt atccctggga tgcaaggttg gttcaacata cacaaatcaa 22320

taagtgtgat tcatcacata aacagagcta aaaacaaaaa ccacaagatt atctcaatag 22380

gtgcagaaaa ggctttcaat acaatttaac atccttcatg ttaaaaacct tcagtaggtc 22440

aggtgcagtg actcacacct gtaatcccag cactttggga ggccaaggcg gacgtatatc 22500

ttaagcccag gagttcaaga ccagcctagg cagcatggtg aaaccccatc tctacaggaa 22560

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agcttaatat ggcggcatgc acctatagtc 22620

ccagctactc aggaggttga ggtgggagga ttgcttgagc ccaggaggca gaggttgcag 22680

cgagctgaga tcgtgccact gcactccaac ctgggcaata aagtgagacc ctgtctcaaa 22740

aagaaaaaca aaaataatcc taaaccaact aggcattgaa ggaatatgcc tcaaaaaaat 22800

aagaaccatc tatgacagac ccacagccaa tatcttacca aatgggcaaa agctggaagt 22860

attctccttg agaaccgtaa caagacaagg atacacactc tcatccctcc ttttcagcat 22920

agttctggaa gtcctcgcca gagcagtcag gaaagagaaa gaaagaaaag gcattcagat 22980

aggaagagaa gaagtcaaac tatttctgtt tgcaggcagt ataattctat acctagaaaa 23040

tgccatagtt tctgcccaga agctcctaca tctgttaaaa atttcagcaa agttttagca 23100

ttgtctgtat tccaacagct tccagggtga gagtgaaatc aggaacacag tcccgttcac 23160

aatagccgca aaaagaataa aataccttgg aatccagcta accagggagg tgaaacatct 23220

ctacgagaat tacaaaacgc tgctgaaaga aatcagagat gacacaaaca aatggaaatg 23280

ttgtttttaa caccttgctt tatctaattc acttataact aagatattca ttcagtggaa 23340

caggtataat aagaccactc gacttaaata taagccttat tctctttcca gagcccaaga 23400

aggggcacta tcagtgccca gtcaataatg ataaaatgct gatatttttc ccctttactg 23460

tttctttctt ctgtagtgtg gtacactcat ttcttaagat tagaaaactt gacctacctt 23520

cctgtttgct tctacacacc cccattctct ttttttgcca ctccggtcag gtataggatg 23580

atccctacca cttttagtta aaacctcctt cccttattaa atgttctctt accactctgg 23640

cctgagtaga acctagggaa aatggaagag aaaagatgaa agggaggtgg gggctgggaa 23700

gggaatagtc ttgtttgtgt gtttgcttta gcacctacta tatcctaggt gctgtgttag 23760

gcacacatta ttttaagtgg ccattatatt gctacatctc actctggtca ttgccaaggt 23820

aggtagtact ttcttggata gttggttcat gttacttata ggtggtggac ttgttgaggc 23880

aaccccaatg gataatcatc tgagtgtgtt ctctaatctc agatttttct tcatattttt 23940

tggtttgttt tggtttttga tggtggtggt tgtgtgctta tttttgttgc tggcttgttt 24000

ttttgttttg tttttgatat ggcaagaatt ggtagtttta tttattaatt gcctaagggt 24060

ctctactttt tttaaaagat gagagtacta aaatagattg ataggtacat acataccttt 24120

atgggggact gcttatattc cttagagaaa aaaattactt attagcctga caaacaccag 24180

taaaatgtaa atatatccgt gagtaaataa atgaatgtat gctttgtatc tccaaatata 24240

tacatctata ttcttacaaa tatgttttta tgtaatacca atttataaga acttaaaatg 24300

ttggctcaag tgagggatgg tggaaagtag cattatatag ccatttcaac atttgaactt 24360

ttttcttcat tttcttcttt tcttcaggaa tatttttcaa gatgtcttac acagagacac 24420

tctagtgaaa gccttcctgg atcaggtaaa tgttgaactt gagattgtca gagtgaatga 24480

tatgacatgt tttctttttt aatatatctt acaatgcctg ttctctctct ctatatatat 24540

atatttatat atttccctgg atcatgcccc agagttctgc tgagcaattg cagttaagtt 24600

agttacacta cagttctcac aagagtctgt gaggggatgt caggtgcatc attacattgg 24660

atgcctcttg tcctagattt atgtttcggg aattcagacc tatgtttaca atataataaa 24720

tattgttgct gccttttaca gataaaataa taagatataa acttgaccac aactactgtt 24780

ttttgaaaca tagagttcat ggtttacatg tatcaaagtg aaatctgagt tagcttttac 24840

agatataata tatacatata tatatcctac aatgcttgta ctatatatgt agtacaagta 24900

tatatatgtg tgtgtgtgtg tgtatatata ttatggcact gtagtatata tatgtttata 24960

tgttaaaaaa tatataaata tatgttacat atttaacata aacatatata catatatgtt 25020

aaatatataa catatactct atatatgaca aatagagtat aatatatatt tttatttttt 25080

atatatatat aaaacatgat agaattaaga attaagtcct aatctgtttt attaggtgct 25140

ttttgtagtg ttcagtcttt ctaaagtgtc taaatgattt ttccttttga cttattaatg 25200

gggaagagcc tctatattaa caattaaggc tgcagcattg attacttcaa acaacaaaca 25260

ttttaattca agcattaacc tataactcaa gtaagttttt tttttttttt ttttgagaaa 25320

gggaggttgt ttatttgcct gaattgagtc aaaaatattt ttgaaacatc atgtactcat 25380

ttaaatgata acatctttat tgtttcattc ttttaaaaaa tatctactta attacacagt 25440

tgaaggaaat tgtagattat atggaactta tttcttaata tattacagtt ttgttataat 25500

aacattctgg ggatcaggcc aggaaactgt gtcatagata aagctttgaa ataatgagat 25560

ccttatgttt actagaaatt ttggattgag atctatgtgg tctgtgacat attgcaaagt 25620

tcaaggaaaa ttcgtaggca tggaatttct caaactgaaa atccctccca ctgtccacct 25680

catcacatgc acacattcta ctcttaccca cccactccac cccttgcaaa agtacagata 25740

tatgaatgtc tcaaaaccat gggctcatct tctagaagct tcaatgttat ttgaagattt 25800

gggcagagga agttaagaaa tatgaaatag cttacatatg agttttaata gtgaaacaaa 25860

catggatgta ttctgaagta gaatgcaaaa tttgagtgca tttttttttt tttgagactg 25920

agtctggctc tgtcgcccag gctggagtgc agtggccgga tctcagctca ctgcaagctc 25980

cacctcccgg gtttacgcca ttctcctgcc tcagcctccc gagtagctgg gaccacaggc 26040

gcccgccact tcgcccggct agtttgtttg tattttttag tagagatggg gtttcaccgt 26100

gttagccagg gannnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnccatt 26160

gagtgcattt ttaaagataa atcagaaaac ttcgaaaaac tatcagattg gccggacatg 26220

gtggcttatg cctgtaatcc tagcactttg ggaggctgag gtgggtggat cacgaggtca 26280

ggagatcgag accatcctgc caacatggtg aaaccccatc tctactaagt atacaaaaat 26340

tagctgggcg tgacagcacg tgcctgtaat cccagctact tgggaggctg aggcaggaga 26400

atcgcttgaa cccgggaggt ggaggttgca gtgagtcaag atcacaccac tgcacttcag 26460

cttggtgaca gagctagact ccatatcaaa aaaaaaaaaa aaaaaaagaa gtcagattgt 26520

tcctacaccc agtgcttcta taccacactc ctactagggg gcatcagtgg aaatggttaa 26580

ggagatgttt agtgtgtatt gtctgccaag cactgttaac actgtcctag aaacattgct 26640

gtacaagtag aatgtgagca aattatgtat tgaaatggtt cctctccctg caggtctttc 26700

agctgaaacc tggcttatct ctcaggagta ctttccttgc acagttttta cttgtccttc 26760

acagaaaagc cttgacacta ataaaatata tagaagatga tacgtgagta caactcctac 26820

atggaggaaa aaccttttgt acgttgtttt ttgttttatt tcctttgtac attttctgta 26880

tcataatttt tgcttttttt tttttttttt ttttctccat tactttcagg cagaagggaa 26940

aaaagccctt taaatctctt cggaacctga agatagacct tgatttaaca gcagagggcg 27000

atcttaacat aataatggct ctggctgaga aaattaaacc aggcctacac tcttttatct 27060

ttggaagacc tttctacact agtgtacaag aacgagatgt tctaatgact ttttaaatgt 27120

gtaacttaat aagcctattc catcacaatc gtgatcgctg ctaaagtagc tcggtggtgt 27180

ggggaaacat tcccctggat catactccag agctctgctc ggcagttgca gttaagttag 27240

ttacactaca gttctcacaa gagtctgtga ggggatgtca ggtgcatcat tacattggat 27300

gtctcttttc ctagatttat gcttttggga tacagaccta tgtttacaat ataataggta 27360

ttattgctgt cttttaaata tataataata ggatataaac ttgaccacaa ctgctgtttt 27420

tttgaaatat atgattcatg gtttacatgt attaaggtga aatccgagtt cgcttttaca 27480

gatattagtt gactttctat cttttggcat tctttggtgt gtggaattac tgtaatactt 27540

ctgcaatcaa ctgaaaatta gagcctttaa atgatttcag ttccacagaa agaaagtgag 27600

cttcaacata ggataagctt tagaaagaga attgatcaag cagatgttta attggaattg 27660

attattagat cctgctttgt ggatttagcc ctcgggattc agtctgtaga aatgtctgat 27720

agttctctat agtccctgct catggtgaac cacagttagg atgttttgtt tgttttattg 27780

ttgttgctat tgttgatgtt ctatatagtt gagctctata aaaggaaatt gtattttatg 27840

ttttagtagt tgttgccaac tttttaaatt aattttcatt atttttgagc caaattgaaa 27900

tgtgcacctc ctgtgccttt tttttccttg gaaaatcgaa ttacttggaa gaagttcaga 27960

tttcactggt cagtcgtttt catcttgttt tcttcttgca gagtcttacc atgtacctgc 28020

tttggcaatc attgtaactc tgagattata aaatgcatta gagaatatat taactaataa 28080

gatctttttt ttcaggaaca gaaaatagtt ccttgagtac ttccttctta catttctgcc 28140

catgtttttg aagttgttgc catttgcctg caataggcta taaggaatag caggagaaat 28200

tttactgaag tgctattttt ctaggtgcta ctttggcaga gctaagtggt ctgtttcttt 28260

tgtttcctta atgcgtttgg accattttgc tggctgtaaa ataactgatt aatataattc 28320

taacacaata ttgacattgt agtgtacaca aacacaaata ttttatttaa aactggaagt 28380

aacataaaag ggaaaatata tttataagaa aggaataaag gtaatagagc tcttctgtcc 28440

cccagccacc aaatttacac aacaaaatca tatgttctaa tgtgaaaggt cataatagct 28500

ttcccatcat taatcagaaa gatgtggcag cttgattttt tagacaaccc ctgaactaga 28560

tgactgttgt actgtagctc agtcatttaa aaaatatata aatactatct cgtagtgtcc 28620

catactatgt tttttacatg atagattctt atttaagtgc taactggtta ttttctttgg 28680

ctggtttatt gtactgttat atagaatgta agttgtacag tgaaataagt tattaaagca 28740

tgtgtaaaca ttgttatata tcttttctcc tagatggaga attttgaata aaatatnnnn 28800

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28860

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28920

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 28980

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 29040

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 29100

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 29160

nnnnnnnnnn nnnnnnnnnn nnnnnnagaa gactaattga tcatatcact atgattctca 29220

aagaagaacc aaaacttcat ataatactac aaatatgaga tagttacttc tgtagtatat 29280

ttctgtaatg ctacaggtta aacaggtcac tcttatataa cactattttg attttgatgt 29340

agaattgcac aaattgatat ttcttctatg atctgtaggg tatagcttaa agtagcaaaa 29400

acagtccacc acctccagtt aacacacagt aacactatgg gactagtatt attatttcca 29460

ttttacaaag gaggaaacta aagcttaaag atgtgtaata tacagcccaa ggtcacacag 29520

ctggtaaagg tagatttcat cccagacagt tacagtcatt gccgtgggca cagctcctaa 29580

cttattaact ccatgtaact ggtactcagt ttagttgaat tgaaaggaga gtagggaagc 29640

aggtctgttt gcactattca gagcccaagt gtgaatccct gctgtgctgc ttggagaagt 29700

tacttaacct atgcaaggtt cattttttaa atatttgaaa cggaatgata atacatactt 29760

caccagtggg tttaatgaga ccttataaga tcgttagttc agtacctgac cagtgcttca 29820

taaatgcttt ttcatccaat ctgacaatct ctagcttgta attggggcat ttagaacatt 29880

taatatgatt attggcatgg taggttaaag ttgtcatctt gctgttttct ctttgttctt 29940

ttttctcctt tcttttggat ttttttttaa ttttactgtg tcttctctgt tgtcttatta 30000

a 30001

<210> 12

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Primer

<400> 12

gggtctagca agagcaggtg 20

<210> 13

<211> 21

<212> DNA

<213> Artificial sequence

<220>

<223> Primer

<400> 13

gtcttggcaa cagctggaga t 21

<210> 14

<211> 24

<212> DNA

<213> Artificial sequence

<220>

<223> Probe

<400> 14

tgatgtcgac tctttgccca ccgc 24

<210> 15

<211> 22

<212> DNA

<213> Artificial sequence

<220>

<223> Primer

<400> 15

tgtgacagtt ggaatgcagt ga 22

<210> 16

<211> 25

<212> DNA

<213> Artificial sequence

<220>

<223> Primer

<400> 16

gccacttaaa gcaatctctg tcttg 25

<210> 17

<211> 21

<212> DNA

<213> Artificial sequence

<220>

<223> Probe

<400> 17

tcgactcttt gcccaccgcc a 21

<210> 18

<211> 783

<212> DNA

<213> Homo sapiens

<400> 18

gcctctcagt acccgaggct cccttttctc gagcccgcag cggcagcgct cccagcgggt 60

ccccgggaag gagacagctc gggtactgag ggcgggaaag caaggaagag gccagatccc 120

catcccttgt ccctgcgccg ccgccgccgc cgccgccgcc gggaagcccg gggcccggat 180

gcaggcaatt ccaccagtcg ctagaggcga aagcccgaca cccagcttcg gtcagagaaa 240

tgagagggaa agtaaaaatg cgtcgagctc tgaggagagc ccccgcttct acccgcgcct 300

cttcccggca gccgaacccc aaacagccac ccgccaggat gccgcctcct cactcaccca 360

ctcgccaccg cctgcgcctc cgccgccgcg ggcgcaggca ccgcaaccgc agccccgccc 420

cgggcccgcc cccgggcccg ccccgaccac gccccggccc cggccccggc cccggccccg 480

gcccctagcg cgcgactcct gagttccaga gcttgctaca ggctgcggtt gtttccctcc 540

ttgttttctt ctggttaatc tttatcaggt cttttcttgt tcaccctcag cgagtactgt 600

gagagcaagt agtggggaga gagggtggga aaaacaaaaa cacacacctc ctaaacccac 660

acctgctctt gctagacccc gcccccaaaa gagaagcaac cgggcagcag ggacggctga 720

cacaccaagc gtcatctttt acgtgggcgg aacttgtcgc tgtttgacgc acctctcttt 780

cct 783

<210> 19

<400> 19

000

<210> 20

<400> 20

000

<210> 21

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 21

gccttactct aggaccaaga 20

<210> 22

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 22

ccggccccta gcgcgcgact 20

<210> 23

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 23

cggcccctag cgcgcgact 19

<210> 24

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 24

ccggccccta gcgcgcgac 19

<210> 25

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 25

ccctagcgcg cgactcctga 20

<210> 26

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 26

cccctagcgc gcgactcctg 20

<210> 27

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 27

gcccctagcg cgcgactcct 20

<210> 28

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 28

ggcccctagc gcgcgactcc 20

<210> 29

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 29

cggcccctag cgcgcgactc 20

<210> 30

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 30

cctagcgcgc gactcctg 18

<210> 31

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 31

ccctagcgcg cgactcct 18

<210> 32

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 32

cccctagcgc gcgactcc 18

<210> 33

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 33

gcccctagcg cgcgactc 18

<210> 34

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 34

ggcccctagc gcgcgact 18

<210> 35

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 35

cggcccctag cgcgcgac 18

<210> 36

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 36

aggctgcggt tgtttccctc 20

<210> 37

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 37

caggctgcgg ttgtttccct 20

<210> 38

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 38

ggctgcggtt gtttccctc 19

<210> 39

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 39

aggctgcggt tgtttccct 19

<210> 40

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 40

caggctgcgg ttgtttccc 19

<210> 41

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 41

gctgcggttg tttccctc 18

<210> 42

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 42

ggctgcggtt gtttccct 18

<210> 43

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 43

aggctgcggt tgtttccc 18

<210> 44

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 44

caggctgcgg ttgtttcc 18

<210> 45

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 45

tctgtctttg gagcccaaat 20

<210> 46

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 46

ctgcgatccc cattccagtt 20

<210> 47

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 47

gccttactct aggaccaa 18

<210> 48

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 48

tctgtctttg gagcccaa 18

<210> 49

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 49

ggttaatctt tatcaggtct 20

<210> 50

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 50

tggttaatct ttatcaggtc 20

<210> 51

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 51

ctggttaatc tttatcaggt 20

<210> 52

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 52

gttaatcttt atcaggtc 18

<210> 53

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 53

ggttaatctt tatcaggt 18

<210> 54

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 54

tggttaatct ttatcagg 18

<210> 55

<211> 18

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 55

ctagcgcgcg actcctga 18

<210> 56

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 56

gggacactac aaggtagtat 20

<210> 57

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 57

tacaggctgc ggttgtttcc 20

<210> 58

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 58

cccggcccct agcgcgcgac 20

<210> 59

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 59

ggtaacttca aactcttggg 20

<210> 60

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic oligonucleotide

<400> 60

aatctttatc aggtcttttc 20

<---

1. Модифицированный олигонуклеотид согласно следующей химической структуре:

(SEQ ID NO: 33) или его соль.

2. Натриевая соль модифицированного олигонуклеотида согласно следующей химической структуре:

(SEQ ID NO: 33).

3. Модифицированный олигонуклеотид по п. 1, который представляет собой натриевую соль или калиевую соль.

4. Фармацевтическая композиция, содержащая терапевтически эффективное количество модифицированного олигонуклеотида по п. 1 и фармацевтически приемлемый носитель или разбавитель для лечения заболевания, ассоциированного с C9ORF72.

5. Фармацевтическая композиция по п. 4, содержащая фармацевтически приемлемый разбавитель, отличающаяся тем, что фармацевтически приемлемый разбавитель представляет собой фосфатно-солевой буферный раствор (PBS).

6. Фармацевтическая композиция по п. 4, отличающаяся тем, что фармацевтическая композиция состоит по существу из модифицированного олигонуклеотида и фосфатно-солевого буферного раствора (PBS).

7. Фармацевтическая композиция, содержащая терапевтически эффективное количество модифицированного олигонуклеотида по п. 3 и фармацевтически приемлемый носитель или разбавитель для лечения заболевания, ассоциированного с C9ORF72.

8. Фармацевтическая композиция по п. 7, содержащая фармацевтически приемлемый разбавитель, отличающаяся тем, что фармацевтически приемлемый разбавитель представляет собой фосфатно-солевой буферный раствор (PBS).

9. Фармацевтическая композиция по п. 7, отличающаяся тем, что фармацевтическая композиция состоит по существу из модифицированного олигонуклеотида и фосфатно-солевого буферного раствора (PBS).

10. Фармацевтическая композиция, содержащая терапевтически эффективное количество натриевой соли модифицированного олигонуклеотида по п. 2 и фармацевтически приемлемый носитель или разбавитель для лечения заболевания, ассоциированного с C9ORF72.

11. Фармацевтическая композиция по п. 10, содержащая фармацевтически приемлемый разбавитель, отличающаяся тем, что фармацевтически приемлемый разбавитель представляет собой фосфатно-солевой буферный раствор (PBS).

12. Фармацевтическая композиция по п. 10, отличающаяся тем, что фармацевтическая композиция состоит по существу из натриевой соли модифицированного олигонуклеотида и фосфатно-солевого буферного раствора (PBS).

13. Модифицированный олигонуклеотид, отличающийся тем, что модифицированный олигонуклеотид представляет собой гэпмер, состоящий из 5' сегмента крыла, центрального сегмента гэп и 3' сегмента крыла, где

5' сегмент крыла состоит из четырех 2'-O-метоксиэтил-нуклеозидов;

центральный сегмент гэп состоит из восьми β-D-дезоксирибонуклеозидов, и

3' сегмент крыла состоит из шести 2'-O-метоксиэтил-нуклеозидов;

причем модифицированный олигонуклеотид характеризуется последовательностью нуклеиновых оснований 5'-GCCCCTAGCGCGCGACTC-3' (SEQ ID NO: 33), где каждый цитозин представляет собой 5-метилцитозин; и где межнуклеозидные связи модифицированного олигонуклеотида, в направлении 5'-3', представляют собой soosssssssssoooss, где каждая s представляет собой тиофосфатную связь и каждая о представляет собой фосфодиэфирную связь.

14. Модифицированный олигонуклеотид по п. 13, где модифицированный олигонуклеотид ковалентно связан с группой конъюгата.

15. Фармацевтическая композиция, содержащая терапевтически эффективное количество модифицированного олигонуклеотида по п. 13 и фармацевтически приемлемый разбавитель или носитель для лечения заболевания, ассоциированного с C9ORF72.

16. Фармацевтическая композиция по п. 15, содержащая фармацевтически приемлемый разбавитель, отличающаяся тем, что фармацевтически приемлемый разбавитель представляет собой фосфатно-солевой буферный раствор (PBS).

17. Фармацевтическая композиция по п. 15, отличающаяся тем, что фармацевтическая композиция состоит по существу из модифицированного олигонуклеотида и фосфатно-солевого буферного раствора (PBS).

18. Фармацевтическая композиция, содержащая терапевтически эффективное количество модифицированного олигонуклеотида по п. 14 и фармацевтически приемлемый разбавитель или носитель для лечения заболевания, ассоциированного с C9ORF72.

19. Фармацевтическая композиция по п. 18, содержащая фармацевтически приемлемый разбавитель, отличающаяся тем, что фармацевтически приемлемый разбавитель представляет собой фосфатно-солевой буферный раствор (PBS).

20. Фармацевтическая композиция по п. 18, отличающаяся тем, что фармацевтическая композиция состоит по существу из модифицированного олигонуклеотида и фосфатно-солевого буферного раствора (PBS).



 

Похожие патенты:

Изобретение относится к области биотехнологии, конкретно к рекомбинантному получению человеческого лейкотриенового рецептора типа 1 (human cysteinyl leikotriene receptor 1, CysLTR1), и может быть использовано для экспрессии CysLT1 рецептора.

Изобретение относится к области биотехнологии, конкретно к способу лечения индивидуума, нуждающегося в удлинении теломер, посредством увеличения уровня экспрессии Zscan4, и может быть использовано в медицине.

Группа изобретений относится к соединениям и композициям, которые представляют собой специфический ингибитор ANGPTL3, а также к способу для снижения экспрессии мРНК и белка ANGPTL3 у животного.

Изобретение относится к биотехнологии. Предоставлены полинуклеотиды, содержащие модифицированный PRE с вариантом гена X, который содержит один или несколько стоп-кодонов, не присутствующих в немодифицированном гене X вируса гепатита, таком как ген X вируса гепатита дикого типа.

Изобретение относится к биотехнологии, в частности к способу получения афлиберцепта. Проводят культивирование клеток млекопитающего, экспрессирующих афлиберцепт, в диапазоне температур от 35,0 до 38,0°С.

Изобретение относится к области биотехнологии. Описана группа изобретений, включающая рекомбинантный инфекционный герпесвирус, нуклеиновую кислоту для получения вышеуказанного герпесвируса, нуклеиновую кислоту для получения зрелого гликопротеина H (gH) рекомбинантного инфекционного герпесвируса, вектор для получения рекомбинантного инфекционного герпесвируса, клетку для получения рекомбинантного инфекционного герпесвируса, способ уничтожения клетки с использованием рекомбинантного инфекционного герпесвируса и способ культивирования рекомбинантного инфекционного герпесвируса в клетках in vitro.

Изобретение относится к области биотехнологии, конкретно к композициям для улучшения характеристик культуры клеток-продуцентов антител. Добавление композиции, полученной в соответствии с настоящим изобретением, к бессывороточной базовой среде способно предотвращать образование агрегатов, а также способствует повышению однородности среды при культивировании клеточных линий СНО (клеток яичников китайского хомячка), продуцирующих мономерные и димерные формы рекомбинантных моноклональных антител класса IgG и IgA.

Изобретение относится к области биотехнологии. Описана группа изобретений, включающая антисмысловой олигомер для лечения мышечной дистрофии, и фармацевтическая композиция, содержащая вышеуказанный антисмысловой олигомер, для лечения пациента с мышечной дистрофией.

Группа изобретений относится к соединениям и способам снижения экспрессии мРНК и/или белка гена C9ORF72, содержащих экспансию гексануклеотидного повтора, у животных с помощью специфических ингибиторов C9ORF72.

Изобретение относится к области биотехнологии. Описана группа изобретений, включающая вакцинную композицию для индуцирования защитного иммунного ответа на вирус и способ предупреждения вирусной инфекции, предусматривающий введение вакцинной композиции, где вирус выбран из группы, состоящей из респираторно-синцитального вируса (RSV), вируса бешенства, вируса Эбола и вируса гриппа.

Настоящее изобретение относится к области иммунологии. Предложено анти-PD-L1-антитело или его антигенсвязывающий фрагмент, полинуклеотид, вектор экспрессии, клетка-хозяин.
Наверх