Направляемые нуклеиновыми кислотами нуклеазы



Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
Направляемые нуклеиновыми кислотами нуклеазы
C12N15/111 - Получение мутаций или генная инженерия; ДНК или РНК, связанные с генной инженерией, векторы, например плазмиды или их выделение, получение или очистка; использование их хозяев (мутанты или микроорганизмы, полученные генной инженерией C12N 1/00,C12N 5/00,C12N 7/00; новые виды растений A01H; разведение растений из тканевых культур A01H 4/00; новые виды животных A01K 67/00; использование лекарственных препаратов, содержащих генетический материал, который включен в клетки живого организма, для лечения генетических заболеваний, для генной терапии A61K 48/00 пептиды вообще C07K)

Владельцы патента RU 2769475:

ИНСКРИПТА, ИНК. (US)

Изобретение относится к области биотехнологии, в частности к системе направляемых нуклеиновой кислотой нуклеаз, содержащей направляемую нуклеиновой кислотой нуклеазу, сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, и редактирующую последовательность, имеющую изменение последовательности, по сравнению с последовательностью области-мишени в геноме клетки. Изобретение эффективно для геномного редактирования в области-мишени в геноме клетки, облегчаемого нуклеазой, сконструированной направляющей нуклеиновой кислотой и редактирующей последовательностью. 9 з.п. ф-лы, 41 ил., 12 табл., 19 пр.

 

[0001] По настоящей заявке испрашивается приоритет Патентной заявки США No. 15/631989, поданной 23 июня 2017 г., и Патентной заявки США No. 15/632001, поданной 23 июня 2017 г., полное содержание каждой из которых, таким образом, приведено в качестве ссылки.

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

[0002] Настоящая заявка содержит список последовательностей, который принят в электронной форме в формате ASCII, и полное содержание которого, таким образом, приведено в качестве ссылки. Указанная копия ASCII, созданная 25 мая 2018 г., названа 49022-717_601_SL.txt и имеет размер 1996118 байт.

УРОВЕНЬ ТЕХНИКИ ДЛЯ ИЗОБРЕТЕНИЯ

[0003] Направляемые нуклеиновыми кислотами нуклеазы стали важными инструментами для исследования и геномной инженерии. Применимость этих инструментов может быть ограничена требованиями специфичности последовательности, экспрессией или сложностями доставки.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0004] Настоящее изобретение относится к способу модификации области-мишени в геноме клетки, включающему: приведение клетки в контакт с: (a) направляемой нуклеиновой кислотой нуклеазой, содержащей аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2 или SEQ ID NO: 4; (b) сконструированной направляющей нуклеиновой кислотой, способной формировать комплекс с направляемой нуклеиновой кислотой нуклеазой; и (c) редактирующей последовательностью, кодирующей нуклеиновую кислоту, комплементарную указанной области-мишени, имеющей изменение в последовательности по сравнению с областью-мишенью; и обеспечение возможности для нуклеазы, направляющей нуклеиновой кислоты и редактирующей последовательности осуществлять геномное редактирование в области-мишени генома клетки. В некоторых аспектах сконструированная направляющая нуклеиновая кислота и редактирующая последовательность представлены в форме одиночной нуклеиновой кислоты. В некоторых аспектах одиночная нуклеиновая кислота дополнительно содержит мутацию в участке мотива, смежного с протоспейсером (PAM). В некоторых аспектах, направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 47, или 203-222. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 133, или 183-202. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 153, или 243-262. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 223-242. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 42, или 283-302. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 128, или 263-282. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 148, или 323-342. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 303-322. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 44, или 722-741. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 130, или 742-761. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 150, или 762-781. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 782-801. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU или UAGU.

[0005] Настоящее изобретение относится к системы направляемых нуклеиновой кислотой нуклеаз, содержащим: (a) направляемую нуклеиновой кислотой нуклеазу, содержащую аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2, или SEQ ID NO: 4; (b) сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, и (c) редактирующую последовательность, имеющую изменение последовательности, по сравнению с последовательностью области-мишени в геноме клетки; где система приводит к геномному редактированию в области-мишени в геноме клетки, облегчаемому нуклеазой, сконструированной направляющей нуклеиновой кислотой и редактирующей последовательностью. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 47, или 203-222. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 133, или 183-202. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 153, или 243-262. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 223-242. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 42, или 283-302. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 128, или 263-282. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 148 или 323-342. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 303-322. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 44 или 722-741. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 130, или 742-761. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 150 или 762-781. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 782-801. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза имеет оптимизированный кодонный состав для клетки, подлежащей редактированию. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU, или UAGU. В некоторых аспектах сконструированная направляющая нуклеиновая кислота и редактирующая последовательность представлены в форме одиночной нуклеиновой кислоты. В некоторых аспектах одиночная нуклеиновая кислота дополнительно содержит мутацию в участке мотива, смежного с протоспейсером (PAM).

[0006] Настоящее изобретение относится к композиции, содержащей (a) направляемую нуклеиновой кислотой нуклеазу, содержащую аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2 или SEQ ID NO: 4; и (b) сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, где сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU или UAGU. В некоторых аспектах сконструированная направляющая нуклеиновая кислота представляет собой гетерологичную сконструированную направляющую нуклеиновую кислоту. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах нуклеаза кодирована последовательностью нуклеиновой кислоты с оптимизированным кодонным составом для использования в клетках из конкретного организма. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для E. coli. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для S. cerevisiae. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток млекопитающих. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток человека. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток растений.

[0007] Настоящее изобретение относится к системы направляемых нуклеиновой кислотой нуклеаз, содержащим: (a) направляемую нуклеиновой кислотой нуклеазу, содержащую аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2, или SEQ ID NO: 4; и (b) гетерологичную сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой. В некоторых аспектах рассматривая система дополнительно содержит (c) редактирующую последовательность, имеющую изменение последовательности, по сравнению с последовательностью области-мишени. В некоторых аспектах, нацеливающая система приводит к редактированию в области-мишени, облегчаемому нуклеазой, гетерологичной сконструированной направляющей нуклеиновой кислотой и редактирующей последовательностью. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU или UAGU. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах нуклеаза кодирована последовательностью нуклеиновой кислоты с оптимизированным кодонным составом для использования в клетках из конкретного организма. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для E. coli. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для S. cerevisiae. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток млекопитающих. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток человека. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток растений.

ВКЛЮЧЕНИЕ В КАЧЕСТВЕ ССЫЛКИ

[0008] Содержание всех публикаций и патентных заявок, упомянутых в настоящем описании, приведено в настоящем описании в качестве ссылки в той же степени, как если бы было конкретно и индивидуально указано, что содержание каждой индивидуальной публикации или патентной заявки приведено в качестве ссылки.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0009] Файл этого патента или заявки содержит по меньшей мере один чертеж, выполненный в цвете. Копии публикации этого патента или патентной заявки с цветным чертежом(чертежами) будут предоставлены Патентным ведомством после запроса и оплаты необходимого взноса.

[0010] На фигуре 1A изображено выравнивание частичной последовательности MAD1-8 (SEQ ID NO: 1-8) и MAD10-12 (SEQ ID NO: 10-12). На фигуре 1A приведены SEQ ID NO: 721, остатки 703-707 из SEQ ID NO: 1, остатки 625-629 из SEQ ID NO: 2, остатки 587-591 из SEQ ID NO: 3, остатки 654-658 из SEQ ID NO: 4, остатки 581-585 из SEQ ID NO: 5, остатки 637-641 из SEQ ID NO: 6, остатки 590-594 из SEQ ID NO: 7, остатки 645-649 из SEQ ID NO: 8, SEQ ID NO: 395, остатки 619-623 из SEQ ID NO: 10 и остатки 603-607 из SEQ ID NO: 12, все соответственно, в порядке упоминания.

[0011] На фигуре 1B изображено филогенетическое древо нуклеаз, включая MAD1-8.

[0012] На фигуре 2 изображен пример конструкции для экспрессии белка. На фигуре 2 описана «6X-His», как SEQ ID NO: 376.

[0013] На фигуре 3 изображен пример редактирующей кассеты и кодонов-мишеней, представляющих редактирующие последовательности SEQ ID NO 396-398, соответственно, в порядке упоминания.

[0014] На фигуре 4 изображен пример технологического процесса эксперимента скрининга или отбора.

[0015] На фигуре 5A изображен пример конструкции для экспрессии белка.

[0016] На фигуре 5B изображен пример редактирующей кассеты.

[0017] На фигуре 5C изображен пример технологического процесса эксперимента скрининга или отбора.

[0018] На фигуре 6A изображен пример конструкции для экспрессии белка.

[0019] На фигуре 6B изображен пример редактирующей кассеты.

[0020] На фигуре 6C изображен пример технологического процесса эксперимента скрининга или отбора.

[0021] На фигуре 7 изображен пример данных эксперимента скрининга или отбора функционального комплекса нуклеазы.

[0022] На фигуре 8 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.

[0023] На фигуре 9 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.

[0024] На фигурах 10A и 10B изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.

[0025] На фигуре 11 изображен пример выравнивания последовательностей для выбранных последовательностей из эксперимента редактирования. На фигуре 11 описаны SEQ ID NO 399-401, 400, 400, 400, 400, 400, 402, 399-400 и 400, соответственно, в порядке упоминания.

[0026] На фигуре 12 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.

[0027] На фигуре 13 изображен пример выравнивания каркасных последовательностей. На фигуре 13 описаны SEQ ID NO 403-415, соответственно, в порядке упоминания.

[0028] На фигуре 14A-14B изображен пример данных эксперимента подтверждения праймеров.

[0029] На фигуре 15 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.

[0030] На фигуре 16 изображен пример подтверждения данных, сравнивающий результаты двух различных анализов.

[0031] На фигуре 17A-17C изображен пример отслеживаемого технологического процесса генной инженерии, включающего плазмиду, содержащую редактирующую кассету и записывающую кассету, и нижестоящее секвенирование штрих-кодов для идентификации включенных редактирования или мутации. На фигуре 17B описаны SEQ ID NO 416-417, соответственно, в порядке упоминания.

[0032] На фигуре 18 изображен пример отслеживаемого технологического процесса генной инженерии, включающего повторяющиеся циклы конструирования с использованием различных редактирующих кассет и записывающих кассет с уникальным штрих-кодом (BC) в каждом цикле, за которым может следовать отбор и отслеживание для подтверждения успешной стадии конструирования в каждом цикле.

[0033] На фигуре 19 изображен пример технологического процесса рекурсивной инженерии.

[0034] На фигуре 20 изображен пример рассматриваемой экспрессирующей кассеты, и на фигуре 20B изображен пример последовательности-мишени в гене-мишени.

[0035] На фигурах 21A и 21B изображен примеры данные измерений клеток и роста колоний.

[0036] На фигурах 22A и 22B показан пример данных, сравнивающих количественную оценку библиотеки во временных точках ввода и 15 час.

[0037] На фигурах 23A и 23B показаны данные показателя истощения из примера эксперимента.

[0038] На фигуре 23C показаны последовательности-мишени и эффективность редактирования из примера экспериментов. На фигуре 23C описаны SEQ ID NO 419-423, соответственно, в порядке упоминания.

[0039] На фигурах 24A, 24B и 24C показаны данные показателя истощения из примера эксперимента.

[0040] На фигуре 25 показано представление в виде рисунка рассматриваемых анализов, использованных для определения специфичности PAM и неспецифических эффектах рассматриваемых систем нуклеаз.

[0041] На фигурах 26A, 26B и 26C показаны данные показателя истощения из примеров экспериментов.

[0042] На фигурах 27A и 27B показаны данные показателя истощения из примеров экспериментов.

[0043] На фигурах 28A и 28B показаны данные показателя истощения из примеров экспериментов.

[0044] На фигурах 29A и 29B показаны данные показателя истощения из примеров экспериментов.

[0045] На фигурах 30A и 30B показаны данные показателя истощения из примеров экспериментов.

[0046] На фигурах 31A, 31B и 31C показаны данные показателя истощения из примеров экспериментов.

[0047] На фигурах 32A, 32B, 32C, 32D, 32E, 32F, 32G и 32H показаны данные показателя истощения (показатели отрицательного обогащения) из примеров экспериментов.

[0048] На фигурах 32I, 32J, 32K, 32L, 32M, 32N, 32O и 32P показаны данные показателя истощения из примеров экспериментов.

[0049] На фигуре 33 показан пример конструкции и дизайна эксперимента для определения специфичности PAM и характеризации и оптимизации направляющей каркасной последовательности рассматриваемых систем нуклеазы.

[0050] На фигурах 34A и 34B показаны выравнивания каркасных последовательностей направляющих нуклеиновых кислот, например, последовательностей crРНК MAD. На фигуре 34A показаны SEQ ID NO 639-666, соответственно, в порядке упоминания. На фигуре 34B показаны SEQ ID NO 667-675, соответственно, в порядке упоминания.

[0051] На фигурах 35A, 35B и 35C показан пример данных, характеризующих предпочтительные последовательности петли crРНК.

[0052] На фигурах 36A, 36B, 36C, 36D, 36E и 36F показан пример данных показателя истощения, характеризующих предпочтительные последовательности петли crРНК для MAD7, MAD2 и MAD4, соответственно.

[0053] На фигуре 37 показаны данные показателя истощения из примеров экспериментов, характеризующие предпочтительность последовательности стебля петли crРНК.

[0054] На фигуре 38A показан пример экспрессирующих конструкций для использования в клетках млекопитающих.

[0055] На фигуре 38B показан пример направляющих последовательностей нуклеиновой кислоты. На фигуре 38B показаны SEQ ID NO 677-678, соответственно, в порядке упоминания.

[0056] На фигурах 39A и 39B показан пример участков-мишеней, на которые нацелены указанные последовательности гРНК, внутри указанного гена-мишени.

[0057] На фигурах 39C и 39D обобщены PAM и последовательности-мишени указанных направляющих нуклеиновых кислот. На фигуре 38C показаны SEQ ID NO 679-688, соответственно, в порядке упоминания. На фигуре 39D показаны SEQ ID NO 689-698, соответственно, в порядке упоминания.

[0058] На фигуре 40 показана эффективность расщепления (разрезания) по анализу разрезания in vitro.

[0059] На фигуре 41 показано зависимое от MAD7 (для двух конструкций) формирование инделов в клетках HEK293T млекопитающих для двух генов, на которые нацелены три различные нуклеиновые кислоты с двумя различными длинами каркаса (42- или 56-мер).

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0060] Настоящее изобретение относится к направляемые нуклеиновыми кислотами нуклеазам и к способам их использования. Часто, рассматриваемые направляемые нуклеиновой кислотой нуклеазы являются частью системы поддающейся нацеливанию нуклеазы, содержащей направляемую нуклеиновой кислотой нуклеазу и направляющую нуклеиновую кислоту. Рассматриваемую систему поддающейся нацеливанию нуклеазы можно использовать для расщепления, модификации и/или редактирования полинуклеотидной последовательности-мишени, часто обозначаемой как последовательность-мишень. Рассматриваемая система поддающейся нацеливанию нуклеазы в совокупности относится к транскриптам и другим элементам, вовлеченным в экспрессию или управление активностью генов, которые могут включать последовательности, кодирующие белок рассматриваемой направляемой нуклеиновой кислотой нуклеазы, и направляющую нуклеиновую кислоту, как описано в настоящем описании.

[0061] Способы, системы, векторы, полинуклеотиды и композиции, описанные в настоящем описании, можно использовать в различных применениях, включая изменение или модификацию синтеза продукта гена, такого как белок, расщепление полинуклеотида, редактирование полинуклеотида, сплайсинг полинуклеотида; перенос полинуклеотида-мишени, отслеживание полинуклеотида-мишени, выделение полинуклеотида-мишени, визуализацию полинуклеотида-мишени и т.д. Аспекты изобретения также относятся к способам и применениям для композиций и систем, описанных в настоящем описании в геномной инженерии, например, для изменения или манипуляции экспрессии одного или нескольких генов или одного или нескольких продуктов генов, в клетках прокариот, архей или эукариот, in vitro, in vivo или ex vivo.

Направляемые нуклеиновыми кислотами нуклеазы

[0062] Системы поддающихся нацеливанию нуклеаз бактерий и архей возникли в качестве мощных инструментов для точного геномного редактирования. Однако природные нуклеазы имеют некоторые ограничения, включая проблемы с экспрессией и доставкой из-за размера последовательности нуклеиновой кислоты и белка. Поддающиеся нацеливанию нуклеазы, требующие узнавания PAM, являются также ограниченными по последовательностям, на которые они нацелены в генетической последовательности. Другие проблемы включают процессивность, специфичность и эффективность узнавания мишени, и эффективность нуклеазы в зависимости от кислотности, которые часто влияют на эффективность генетического редактирования.

[0063] Неприродные поддающиеся нацеливанию нуклеазы и неприродные системы поддающихся нацеливанию нуклеаз могут преодолевать многие из этих проблем и ограничений.

[0064] Настоящее изобретение относится к неприродным системам поддающихся нацеливанию нуклеаз. Такие системы поддающихся нацеливанию нуклеаз сконструированы для преодоления одной или нескольких проблем, описанных выше, и могут быть обозначены как сконструированные системы нуклеаз. Сконструированные системы нуклеаз могут содержать одно или несколько из сконструированных нуклеаз, таких как сконструированная направляемая нуклеиновой кислотой нуклеаза, сконструированной направляющей нуклеиновой кислоты, сконструированных полинуклеотидов, кодирующих указанную нуклеазу, или сконструированных полинуклеотидов, кодирующих указанную направляющую нуклеиновую кислоту. Сконструированные нуклеазы, сконструированные направляющие нуклеиновые кислоты и сконструированные полинуклеотиды, кодирующие сконструированную нуклеазу или сконструированную направляющую нуклеиновую кислоту, являются неприродными и не обнаружены в природе. Следовательно, сконструированные системы нуклеаз, включающие один или несколько из этих элементом, являются неприродными.

[0065] Неограничивающие примеры типов конструирования, которые можно выполнять для получения неприродной системы, являются следующими. Конструирование может включать оптимизацию кодонного состава для облегчения экспрессии или улучшения экспрессии в клетке-хозяине, такой как гетерологичная клетка-хозяин. Конструирование может уменьшать размер или молекулярную массу нуклеазы для облегчения экспрессии или доставки. Конструирование может изменять выбор PAM для изменения специфичности PAM или для расширения лежит диапазона узнаваемых PAM. Конструирование может изменять, увеличивать или уменьшать стабильность, процессивность, специфичность или эффективность системы поддающейся нацеливанию нуклеазы. Конструирование может изменять, увеличивать или уменьшать стабильность белка. Конструирование может изменять, увеличивать или уменьшать процессивность сканирования нуклеиновой кислоты. Конструирование может изменять, увеличивать или уменьшать специфичность последовательности-мишени. Конструирование может изменять, увеличивать или уменьшать активность нуклеазы. Конструирование может изменять, увеличивать или уменьшать эффективность редактирования. Конструирование может изменять, увеличивать или уменьшать эффективность трансформации. Конструирование может изменять, увеличивать или уменьшать экспрессию нуклеазы или направляющей нуклеиновой кислоты.

[0066] Примеры неприродных последовательностей нуклеиновых кислот, описанных в настоящем описании, включают последовательности с оптимизированным кодонным составом для экспрессии в бактериях, таких как E. coli (например, SEQ ID NO: 41-60), последовательности с оптимизированным кодонным составом для экспрессии в одноклеточных эукариотах, таких как дрожжи (например, SEQ ID NO: 127-146), последовательности с оптимизированным кодонным составом для экспрессии в многоклеточных эукариотах, таких как клетки человека (например, SEQ ID NO: 147-166), полинуклеотиды. используемые для клонирования или экспрессии любых последовательностей, описанных в настоящем описании (например, SEQ ID NO: 61-80), плазмиды, содержащие последовательности нуклеиновых кислот (например, SEQ ID NO: 21-40), функционально связанные с гетерологичным промотором или сигналом ядерной локализации или другим гетерологичным элементом, белки, полученные из сконструированных или имеющих оптимизированный кодонный состав последовательностей нуклеиновых кислот (например, SEQ ID NO: 1-20), или сконструированные направляющие нуклеиновые кислоты, содержащие любую из SEQ ID NO: 84-107. Такие неприродные последовательности нуклеиновых кислот можно амплифицировать, клонировать, собирать, синтезировать, получать из синтезированных олигонуклеотидов или dNTP, или иным образом получать с использованием способов, известных специалисту в данной области.

[0067] Настоящее изобретение относится к направляемым нуклеиновыми кислотами нуклеазам. Рассматриваемые нуклеазы являются функциональными in vitro, или в клетках прокариот, архей или эукариот для применений in vitro, in vivo, или ex vivo. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из рода, включающего, но без ограничения, Thiomicrospira, Succinivibrio, Candidatus, Porphyromonas, Acidaminococcus, Acidomonococcus, Prevotella, Smithella, Moraxella, Synergistes, Francisella, Leptospira, Catenibacterium, Kandleria, Clostridium, Dorea, Coprococcus, Enterococcus, Fructobacillus, Weissella, Pediococcus, Corynebacter, Sutterella, Legionella, Treponema, Roseburia, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, Alicyclobacillus, Brevibacilus, Bacillus, Bacteroidetes, Brevibacilus, Carnobacterium, Clostridiaridium, Clostridium, Desulfonatronum, Desulfovibrio, Helcococcus, Leptotrichia, Listeria, Methanomethyophilus, Methylobacterium, Opitutaceae, Paludibacter, Rhodobacter, Sphaerochaeta, Tuberibacillus, Oleiphilus, Omnitrophica, Parcubacteria и Campylobacter. Вид организма из такого рода может являться таким, как обсуждают иным образом в настоящем описании. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри царства, включающего, но без ограничения, Firmicute, Actinobacteria, Bacteroidetes, Proteobacteria, Spirochates и Tenericutes. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри филума, включающего, но без ограничения, Erysipelotrichia, Clostridia, Bacilli, Actinobacteria, Bacteroidetes, Flavobacteria, Alphaproteobacteria, Betaproteobacteria, Gammaproteobacteria, Deltaproteobacteria, Epsilonproteobacteria, Spirochaetes и Mollicutes. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри порядка, включающего, но без ограничения, Clostridiales, Lactobacillales, Actinomycetales, Bacteroidales, Flavobacteriales, Rhizobiales, Rhodospirillales, Burkholderiales, Neisseriales, Legionellales, Nautiliales, Campylobacterales, Spirochaetales, Mycoplasmatales и Thiotrichales. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри семейства, включающего, но без ограничения, Lachnospiraceae, Enterococcaceae, Leuconostocaceae, Lactobacillaceae, Streptococcaceae, Peptostreptococcaceae, Staphylococcaceae, Eubacteriaceae, Corynebacterineae, Bacteroidaceae, Flavobacterium, Cryomoorphaceae, Rhodobiaceae, Rhodospirillaceae, Acetobacteraceae, Sutterellaceae, Neisseriaceae, Legionellaceae, Nautiliaceae, Campylobacteraceae, Spirochaetaceae, Mycoplasmataceae, Pisciririckettsiaceae и Francisellaceae. Другие направляемые нуклеиновыми кислотами нуклеазы описаны в Публикации патентной заявки США No. US20160208243, поданной 18 декабря 2015 г., в Публикации патентной заявки США No. US20140068797, поданной 15 марта 2013 г., в Патенте США No. US8697359, поданном 15 октября 2013 г., и в Zetsche et al., Cell 2015 Oct 22; 163(3):759-71, полное содержание каждого из которых приведено в настоящем описании в качестве ссылки.

[0068] Некоторые направляемые нуклеиновыми кислотами нуклеазы, пригодные для использования в способах, системах и композициях по настоящему описанию, включают нуклеазы, происходящие из организма, такого как, но без ограничения, Thiomicrospira sp. XS5, Eubacterium rectale, Succinivibrio dextrinosolvens, Candidatus Methanoplasma termitum, Candidatus Methanomethylophilus alvus, Porphyromonas crevioricanis, Flavobacterium branchiophilum, Acidaminococcus Sp., Acidomonococcus sp., Lachnospiraceae bacterium COE1, Prevotella brevis ATCC 19188, Smithella sp. SCADC, Moraxella bovoculi, Synergistes jonesii, Bacteroidetes oral taxon 274, Francisella tularensis, Leptospira inadai serovar Lyme str. 10, Acidomonococcus sp. crystal structure (5B43) S. mutans, S. agalactiae, S. equisimilis, S. sanguinis, S. pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N. gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C. difficile, C. tetani, C. sordellii; Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Butyrivibrio proteoclasticus B316, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, Porphyromonas macacae, Catenibacterium sp. CAG:290, Kandleria vitulina, Clostridiales bacterium KA00274, Lachnospiraceae bacterium 3-2, Dorea longicatena, Coprococcus catus GD/7, Enterococcus columbae DSM 7374, Fructobacillus sp. EFB-N1, Weissella halotolerans, Pediococcus acidilactici, Lactobacillus curvatus, Streptococcus pyogenes, Lactobacillus versmoldensis, Filifactor alocis ATCC 35896, Alicyclobacillus acidoterrestris, Alicyclobacillus acidoterrestris ATCC 49025, Desulfovibrio inopinatus, Desulfovibrio inopinatus DSM 10711, Oleiphilus sp. Oleiphilus sp. HI0009, Candidtus kefeldibacteria, Parcubacteria CasY.4, Omnitrophica WOR 2 bacterium GWF2, Bacillus sp. NSP2.1 и Bacillus thermoamylovorans.

[0069] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, содержит аминокислотную последовательность, имеющую по меньшей мере 50% идентичность аминокислот с любой из SEQ ID NO: 1-20. В некоторых случаях, нуклеаза содержит аминокислотную последовательность, имеющую по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность аминокислот с любой из SEQ ID NO: 1-20. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с любой из SEQ ID NO: 1-20. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с любой из SEQ ID NO: 1-8 или 10-12. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с любой из SEQ ID NO: 1-8 или 10-11. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с SEQ ID NO: 2. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с SEQ ID NO: 7. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с SEQ ID NO: 4.

[0070] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит любую из SEQ ID NO: 1-20. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит любую из SEQ ID NO: 1-8 или 10-12. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит любую из SEQ ID NO: 1-8 или 10-11. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит SEQ ID NO: 2. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит SEQ ID NO: 7. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит SEQ ID NO: 4.

[0071] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, или 95% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 50% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 45% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 40% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 35% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 30% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110.

[0072] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-28 или 30-32. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-28 или 30-31. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с SEQ ID NO: 22. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с SEQ ID NO: 27. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с SEQ ID NO: 24.

[0073] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 21-40. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 21-28 или 30-32. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 21-28 или 30-31. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 22. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 27. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 24.

[0074] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании кодирована последовательностью нуклеиновой кислоты. Такая нуклеиновая кислота может иметь оптимизированный кодонный состав для экспрессии в желательной клетке-хозяине. Пригодные клетки-хозяева могут включать, в качестве неограничивающих примеров, клетки прокариот, таких как E. coli, P. aeruginosa, B. subtilus и V. natriegens, и клетки эукариот, таких как S. cerevisiae, клетки растений, такие как клетки растений Arabidopsis thaliana или табака, клетки насекомых, клетки нематод, клетки земноводных, клетки рыб или клетки млекопитающих, включая клетки человека.

[0075] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в грамположительных бактериях, например, Bacillus subtilis, или в грамотрицательных бактериях, например, E. coli. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 41-60, 203-222, 283-302, или 722-741. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 41-60, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 41-48, 50-51, 53-60, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 41-48, 50-52, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 41-48, 50-51, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 42 или 283-302. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 47 или 203-222. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 44 или 722-741.

[0076] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 41-60, 203-222, 283-302 или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 41-48, 50-52, 203-222, 283-302 или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 41-48, 50-51, 203-222, 283-302 или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 42 или 283-302. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 47 или 203-222. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 44 или 722-741.

[0077] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в видах дрожжей, например, S. cerevisiae. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282 или 742-761. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-134, 136-138, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-134, 136-137, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 128 или 263-282. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 133 или 183-202. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 130 или 742-761.

[0078] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 127-134, 136-138, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 127-134, 136-137, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 128 или 263-282. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 133 или 183-202. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 130 или 742-761.

[0079] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в клетках млекопитающих. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 147-166, 243-262, 323-342, или 762-781. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 147-166, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 147-166, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 147-154, 156-158, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 147-154, 156-157, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 148 или 323-342. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 153 или 243-262. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 150 или 762-781.

[0080] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 147-166, 243-262, 323-342 или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 147-154, 156-158, 243-262, 323-342 или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 147-154, 156-157, 243-262, 323-342 или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 148 или 323-342. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 153 или 243-262. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 150 или 762-781.

[0081] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в клетках растений. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 343-359, 223-242, 303-322, или 782-801. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 343-359, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 343-359, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 343-347, 349-351, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 343-347, 349-350, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 303-322. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 223-242. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 782-801.

[0082] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 343-359, 223-242, 303-322 или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 343-347, 349-351, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 343-347, 349-350, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 303-322. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 223-242. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 782-801.

[0083] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может являться функционально связанной с промотором. Такие последовательности нуклеиновых кислот могут являться линейными или кольцевыми. Последовательности нуклеиновых кислот могут содержаться в более крупных линейных или кольцевых последовательностях нуклеиновых кислот, содержащих дополнительные элементы, такие как точка начала репликации, селективный или позволяющий скрининг маркер, терминатор, другие компоненты системы поддающейся нацеливанию нуклеазы, такие как направляющая нуклеиновая кислота, или редактирующая или записывающая кассета, как описано в настоящем описании. Эти более крупные последовательности нуклеиновых кислот могут представлять собой рекомбинантные экспрессирующие векторы, как описано более подробно ниже.

Направляющая нуклеиновая кислота

[0084] Как правило, направляющая нуклеиновая кислота может формировать комплекс с совместимой направляемой нуклеиновой кислотой нуклеазой и может гибридизоваться с последовательностью-мишенью, таким образом, направляя нуклеазу на последовательность-мишень. Рассматриваемая направляемую нуклеиновой кислотой нуклеаза, способная формировать комплекс с направляющей нуклеиновой кислотой, может быть обозначена как направляемая нуклеиновой кислотой нуклеаза, совместимая с направляющей нуклеиновой кислотой. Подобным образом, направляющая нуклеиновая кислота, способная формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, может быть обозначена как направляющая нуклеиновая кислота, совместимая с направляемыми нуклеиновыми кислотами нуклеазами.

[0085] Направляющая нуклеиновая кислота может представлять собой ДНК. Направляющая нуклеиновая кислота может представлять собой РНК. Направляющая нуклеиновая кислота может содержать как ДНК, так и РНК. Направляющая нуклеиновая кислота может содержать модифицированные или неприродные нуклеотиды. В случаях, когда направляющая нуклеиновая кислота содержит РНК, направляющая нуклеиновая кислота - РНК может быть кодирована последовательностью ДНК в молекуле полинуклеотида, такого как плазмида, линейная конструкция или редактирующая кассета, как описано в настоящем описании.

[0086] Направляющая нуклеиновая кислота может содержать направляющую последовательность. Направляющая последовательность представляет собой полинуклеотидную последовательность, имеющую достаточную комплементарность с последовательностью полинуклеотида-мишени, чтобы гибридизоваться с последовательностью-мишенью и управлять специфическим для последовательности связыванием находящейся в комплексе направляемой нуклеиновой кислотой нуклеазы с последовательностью-мишенью. Степень комплементарности между направляющей последовательностью и соответствующей ей последовательностью-мишенью, после оптимального выравнивания с использованием пригодного алгоритма выравнивания, составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99%, или более. Оптимальное выравнивание можно определять с использованием любого пригодного алгоритма для выравнивания последовательностей. В некоторых вариантах осуществления, направляющая последовательность имеет длину приблизительно или более, чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления, направляющая последовательность имеет длину менее, чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20 нуклеотидов. Предпочтительно, направляющая последовательность имеет длину 10-30 нуклеотидов. Направляющая последовательность может иметь длину 15-20 нуклеотидов. Направляющая последовательность может иметь длину 15 нуклеотидов. Направляющая последовательность может иметь длину 16 нуклеотидов. Направляющая последовательность может иметь длину 17 нуклеотидов. Направляющая последовательность может иметь длину 18 нуклеотидов. Направляющая последовательность может иметь длину 19 нуклеотидов. Направляющая последовательность может иметь длину 20 нуклеотидов.

[0087] Направляющая нуклеиновая кислота может содержать каркасную последовательность. Как правило, «каркасная последовательность» включает любую последовательность имеющую достаточную последовательность, чтобы способствовать образованию комплекса способной к нацеливанию нуклеазы, где комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу и направляющую нуклеиновую кислоту, содержащую каркасную последовательность и направляющую последовательность. Достаточная последовательность внутри каркасной последовательности, чтобы способствовать образованию комплекса способной к нацеливанию нуклеазы, может иметь некоторую степень комплементарности на протяжении длины двух областей последовательности внутри каркасной последовательности, таких как одна или две области последовательности, вовлеченные в формирование вторичной структуры. В некоторых случаях, одна или две области последовательности заключены или кодированы в одном и том же полинуклеотиде. В некоторых случаях, одна или две области последовательности заключены или кодированы в разных полинуклеотидах. Оптимальное выравнивание можно определять посредством любого пригодного алгоритма выравнивания, и можно дополнительно учитывать вторичные структуры, например, самокомплементарность внутри одной или двух областей последовательности. В некоторых вариантах осуществления, степень комплементарности между одной или двумя областями последовательности н протяжении длины более короткой из двух после оптимального выравнивания составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99%, или выше. В некоторых вариантах осуществления, по меньшей мере одна из двух областей последовательности имеет длину приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов.

[0088] Каркасная последовательность рассматриваемой направляющей нуклеиновой кислоты может содержать вторичную структуру. Вторичная структура может содержать область псевдоузла. В некоторых случаях, кинетика связывания направляющей нуклеиновой кислоты с направляемой нуклеиновой кислотой нуклеазой частично определяется вторичными структурами внутри каркасной последовательности. В некоторых случаях, кинетика связывания направляющей нуклеиновой кислоты с направляемой нуклеиновой кислотой нуклеазой частично определяется последовательностью нуклеиновой кислоты с каркасной последовательностью. Пример области псевдоузла внутри каркасной последовательности показан на фигуре 49C.

[0089] Каркасная последовательность может содержать последовательность петли. Последовательность петли может содержать 1 или более нуклеотидов. В некоторых примерах, последовательность петли содержит 4 нуклеотида. В некоторых примерах, последовательность петли содержит 5 нуклеотидов. Последовательность петли может представлять собой область каркасной последовательности, которая не гибридизуется с другой последовательностью или не гибридизуется с другой последовательностью внутри каркасной последовательности. Пример последовательности петли внутри каркасной последовательности показан на фигуре 49C.

[0090] Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 84-107 или 172-182. Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 84-103. Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 84-91 или 93-95. Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 88, 93, 94, или 95. Каркасная последовательность может содержать последовательность из SEQ ID NO: 88. Каркасная последовательность может содержать последовательность из SEQ ID NO: 93. Каркасная последовательность может содержать последовательность из SEQ ID NO: 94. Каркасная последовательность может содержать последовательность из SEQ ID NO: 95. Каркасная последовательность может содержать последовательность или консенсусную последовательность, показанную на фигуре 49A, 49B или 49C.

[0091] В некоторых аспектах, настоящее изобретение относится к нуклеазе, связывающейся с направляющей нуклеиновой кислотой, содержащей консервативную каркасную последовательность. Например, направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с консервативной областью псевдоузла, как показано на фигуре 13. Конкретно, направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с направляющей нуклеиновой кислотой, содержащей консервативную область псевдоузла, как показано на фигуре 13. Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-1 (SEQ ID NO: 172). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-3 (SEQ ID NO: 173). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-4 (SEQ ID NO: 174). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-5 (SEQ ID NO: 175). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-6 (SEQ ID NO: 176). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-7 (SEQ ID NO: 177). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-8 (SEQ ID NO: 178). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-10 (SEQ ID NO: 179). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-11 (SEQ ID NO: 180). Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-12 (SEQ ID NO: 181). Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-25 (SEQ ID NO: 182).

[0092] Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с любой из SEQ ID NO: 84-107 или 172-182. Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с любой из последовательностей, показанных на фигурах 49A, 49B или 49C.

[0093] Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей последовательность петли, показанную на фигурах 49A, 49B или 49C. Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей последовательность петли UAUU, UUU, UGUU, UCUU, UCUUU или UAGU.

[0094] Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, содержащей РНК-вариант SEQ ID NO: 181, где T заменен на U. В некоторых случаях, каркасная последовательность содержит по меньшей мере одну мутацию, по сравнению с РНК-вариантом SEQ ID NO: 181. Например, каркасная последовательность может содержать измененную последовательность в последовательности петли из каркасной последовательности. Например, последовательность петли может содержать UAUU, UUU, UGUU, UCUU, UCUUU или UAGU.

[0095] Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 84-107. Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 84-103. Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 84-91 или 93-95. Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 88, 93, 94, или 95. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 88. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 93. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 94. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 95.

[0096] В аспектах изобретения, термин «направляющая нуклеиновая кислота» относится к одному или нескольким полинуклеотидам, содержащим 1) направляющую последовательность, способную гибридизоваться с последовательностью-мишенью, и 2) каркасную последовательность, способную взаимодействовать или формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, как описано в настоящем описании. Направляющая нуклеиновая кислота может быть представлена в форме одной или нескольких нуклеиновых кислот. В конкретных вариантах осуществления, направляющая последовательность и каркасная последовательность представлены в форме одного полинуклеотида.

[0097] Направляющая нуклеиновая кислота может являться совместимой с направляемой нуклеиновой кислотой нуклеазой, когда два элемента могут формировать функциональный комплекс способной к нацеливанию нуклеазы, способный расщеплять последовательность-мишень. Часто, совместимую каркасную последовательность для совместимой направляющей нуклеиновой кислоты можно обнаружить посредством сканирования последовательности, смежной с локусом природной направляемой нуклеиновой кислотой нуклеазы. Иными словами, природные направляемые нуклеиновыми кислотами нуклеазы могут быть кодированы в геноме поблизости от соответствующих совместимых последовательности направляющей нуклеиновой кислоты или каркасной последовательности.

[0098] Направляемые нуклеиновыми кислотами нуклеазы могут являться совместимыми с направляющими нуклеиновыми кислотами, не обнаруженными у эндогенного хозяина нуклеаз. Такие ортогональные направляющие нуклеиновые кислоты можно определять посредством эмпирического тестирования. Ортогональные направляющие нуклеиновые кислоты могут происходить из различных видов бактерий или являться синтетическими или иным образом сконструированными, чтобы являться неприродными.

[0099] Ортогональные направляющие нуклеиновые кислоты, которые являются совместимыми с общей направляемой нуклеиновой кислотой нуклеазой, могут иметь один или несколько общие признаки. Общие признаки могут включать последовательность вне области псевдоузла. Общие признаки могут включать область псевдоузла. Общие признаки могут включать первичную последовательность или вторичную структуру.

[00100] Направляющая нуклеиновая кислота может быть сконструирована для нацеливания на желательную последовательность-мишень посредством изменения направляющей последовательности таким образом, чтобы направляющая последовательность являлась комплементарной последовательности-мишени, таким образом, позволяя гибридизацию между направляющей последовательностью и последовательностью-мишенью. Направляющая нуклеиновая кислота с сконструированной направляющей последовательностью может быть обозначена как сконструированная направляющая нуклеиновая кислота. Сконструированные направляющие нуклеиновые кислоты часто являются неприродными и не обнаружены в природе.

[00101] Совместимые направляющие нуклеиновые кислоты или каркасные последовательности для рассматриваемой нуклеазы можно идентифицировать или тестировать с использованием анализа скрининга, как описано в настоящем описании. Как правило, библиотеку векторов можно получать, как описано в настоящем описании, где указанный вектор содержит последовательность-мишень смежную с последовательностью PAM. Указанный вектор может содержать селективный маркер или позволяющий скрининг маркер. Указанный вектор может содержать направляющую последовательность нуклеиновой кислоты, подлежащую тестированию. Указанный вектор может содержать штрих-код или другой уникальный идентификатор, позволяющий идентификацию направляющей нуклеиновой кислоты, подлежащей тестированию. Указанная направляющая нуклеиновая кислота может содержать нацеливающую последовательность, способную к нацеливанию на последовательность-мишень из вектора. Указанная направляющая нуклеиновая кислота может содержать каркасную последовательность. Как правило, в библиотеке таких векторов, каркасную последовательность можно изменять между различными векторами, таким образом, чтобы множество различных каркасных последовательностей можно было подвергать скринингу или тестированию в пределах одного эксперимента или высокопроизводительным способом. В некоторых случаях, последовательность стебля петли внутри каркасной последовательности изменяют между различными векторами, таким образом, чтобы множество различных каркасных последовательностей можно было подвергать скринингу или тестированию в пределах одного эксперимента или высокопроизводительным способом. В некоторых случаях, библиотека векторов содержит множество различных последовательностей PAM, смежных с последовательностью-мишенью. Библиотеку векторов можно затем вводить в клетки-хозяева, где указанные клетки-хозяева содержат рассматриваемую нуклеазу. Указанную рассматриваемую нуклеазу можно экспрессировать с того же или отличного вектора, который вводят в клетку одновременно, до или после вектора с направляющей нуклеиновой кислотой. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме транскрипта мРНК. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме белка. Без намерения быть связанными с теорией, внутри каждой клетки, направляющая нуклеиновая кислота может экспрессироваться. Если экспрессированная направляющая нуклеиновая кислота является совместимой с рассматриваемой нуклеазой, тогда направляющая нуклеиновая кислота может формировать комплекс с рассматриваемой нуклеазой и нацеливать нуклеазу на последовательность-мишень, и тогда нуклеаза может расщеплять последовательность-мишень. это событие расщепления может заставлять клетку-хозяина терять вектор, содержащий последовательность-мишень, или терять функцию селективного маркера или позволяющего скрининг маркера, и таким образом клетка-хозяин может погибать под действием отбора или может быть потеряна в ходе скрининга. С другой стороны, если направляющая нуклеиновая кислота является несовместимой с рассматриваемой нуклеазой, тогда последовательность-мишень не может подвергаться расщеплению, и таким образом, клетка-хозяин может сохранять селективный или позволяющий скрининг маркер. Посредством сравнения входных векторов с полученными в результате отбора или скрининга векторами из выживших или отобранных на выходе клеток-хозяев, можно идентифицировать векторы, подвергнутые истощению. Посредством секвенирования или анализа штрих-кода или уникального идентификатора входных векторов и выходных векторов, можно идентифицировать штрих-коды или уникальные идентификаторы, подвергнутые истощению, что может позволять идентификацию направляющих нуклеиновых кислот, подвергнутых истощению. Подвергнутые истощению направляющие нуклеиновые кислоты могут включать нуклеиновые кислоты, которые являются совместимыми с рассматриваемой нуклеазой.

[00102] В некоторых случаях, при проведении анализа скрининга или тестирования направляющей нуклеиновой кислоты, описанного в настоящем описании, этот анализ можно также использовать для идентификации или скрининга последовательностей PAM, которые являются совместимыми с рассматриваемой нуклеазой. В таких случаях, векторы в библиотеке векторов могут содержать штрих-код или уникальный идентификатор, смежный с PAM. Посредством сравнения входных векторов с выходными векторами, можно идентифицировать последовательности PAM, подвергнутые истощению. Подвергнутые истощению последовательности PAM могут включать последовательности, которые являются совместимыми с рассматриваемой нуклеазой. В некоторых случаях, с использованием анализов, описанных в настоящем описании, совместимые направляющие нуклеиновые кислоты и последовательности PAM для рассматриваемой нуклеазы можно идентифицировать или тестировать в пределах одного эксперимента или скрининга, или высокопроизводительным способом.

[00103] Истощение может относится к уменьшению количества рассматриваемой последовательности, по сравнению с исходной частотой или частотой эталонной последовательности. Истощение является обратным обогащению, и его, таким образом можно также выражать как показатель отрицательного обогащения. Истощение можно рассчитывать с использованием любого способа, известного в данной области. В некоторых случаях, показатели истощения можно рассчитывать посредством расчета частоты каждой последовательности или конструкции в пределах данных эксперимента и сравнения рассматриваемой частоты с контрольной, где истощение представляет собой уровень изменения рассматриваемой частоты от контрольной или эталонной частоты. В некоторых случаях, пороговую частоту используют для уменьшения шума, например, может присутствовать порог отсечения счета по меньшей мере 50, до того как данные можно использовать в расчете показателя истощения. Среднее и стандартное отклонение рассчитывают для последовательностей, для которых не показано изменения по сравнению с контрольной или эталонной частотой. Это среднее и стандартное отклонение можно использовать для выведения z-показателей, для которых можно получить значения p <0,05, для получения порога значимости. В некоторых случаях, для коррекции потенциальной завышенной оценки показателя истощения, используют порог отсечения и показатели истощения, удовлетворяющие этому порогу, считают подвергнутыми истощению. В некоторых случаях, порог может представлять собой log2 -1, log2 -2, log2 -3, log2 -4 или log2 -5.

[00104] В некоторых примерах, показатели истощения можно рассчитывать как log2 показателя истощения с использованием следующего уравнения: W=log2(Fx, f/Fx, i); где Fx, f представляет собой частоту кассеты X в конечной временной точке и Fx, i представляет собой исходную частоту кассеты X, и W представляет собой абсолютный показатель приспособленности каждого варианта. Частоты определяли посредством деления количества прочтений для каждого варианта на общее количество прочтений в эксперименте, включая прочтения, выпавшие из фильтрации. Средневзвешенное значение счета для множества повторов можно использовать для вывода среднего показателя приспособленности каждой мутации следующим образом: Wсредн.=(ΣNi=1 счетi * Wi)/(ΣNi=1 счетi). Рассчитанные показатели могут относиться к показателю истощения, когда рассчитанное значение является отрицательным, и могут также относиться к показателю обогащения, если рассчитанное значение является положительным.

Система поддающейся нацеливанию нуклеазы

[00105] Настоящее изобретение относится к системам поддающихся нацеливанию нуклеаз. Система поддающейся нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу и совместимую направляющую нуклеиновую кислоту. Система поддающейся нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу или полинуклеотидную последовательность, кодирующую направляемую нуклеиновой кислотой нуклеазу. Система поддающейся нацеливанию нуклеазы может содержать направляющую нуклеиновую кислоту или полинуклеотидную последовательность, кодирующую направляющую нуклеиновую кислоту.

[00106] Как правило, система поддающейся нацеливанию нуклеазы, как описано в настоящем описании, характеризуется элементами, способствующими формированию комплекса способной к нацеливанию нуклеазы в участке последовательности-мишени, где the комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу и направляющая нуклеиновая кислота.

[00107] Направляющая нуклеиновая кислота вместе с направляемой нуклеиновой кислотой нуклеазой формирует комплекс способной к нацеливанию нуклеазы, способный связываться с последовательностью-мишенью внутри полинуклеотида-мишени, как определено посредством направляющей последовательности направляющей нуклеиновой кислоты.

[00108] Как правило, для получения двухцепочечного разрыва, в большинстве случаев, комплекс способной к нацеливанию нуклеазы связывается с последовательностью-мишенью, как определено посредством направляющей нуклеиновой кислоты, и нуклеаза должна узнавать последовательность мотива, смежного с протоспейсером (PAM), смежную с последовательностью-мишенью.

[00109] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-20 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-12 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-11 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту. В любом из этих случаев, направляющая нуклеиновая кислота может содержать каркасную последовательность, совместимую с направляемой нуклеиновой кислотой нуклеазой. В любом из этих случаев, каркасная последовательность может представлять собой природную каркасную последовательность или гетерологичную каркасную последовательность. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.

[00110] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-20 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-20 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-12 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-12 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-11 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-91 или 93-95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-11 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 172-182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.

[00111] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107 или 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 88, 93, 94, или 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 88. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 93. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 94. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 172. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 173. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 174. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 175. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 176. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 177. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 178. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 179. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 180. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 181. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.

[00112] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107 или 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 88, 93, 94 или 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 88. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 93. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 94. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 172. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 173. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 174. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 175. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 176. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 177. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 178. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 179. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 180. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 181. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.

[00113] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107 или 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 88, 93, 94, или 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 88. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 93. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 94. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 172. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 173. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 174. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 175. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 176. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 177. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 178. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 179. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 180. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 181. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.

[00114] Комплекс способной к нацеливанию нуклеазы может содержать рассматриваемую поддающуюся нацеливанию нуклеазу и направляющую нуклеиновую кислоту. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании ее совместимости с рассматриваемой нуклеазой. Способы определения и выбора совместимых направляющих нуклеиновых кислот описаны в настоящем описании и более подробно описаны в другом месте. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании эффективности расщепления, которую она придает комплексу способной к нацеливанию нуклеазы. Эффективность расщепления может представлять собой частоту разрезания нуклеиновой кислоты-мишени. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании эффективности нацеливания которую она придает комплексу способной к нацеливанию нуклеазы. Эффективность нацеливания может представлять собой частоту нацеливания на целевую нуклеиновую кислоту-мишень. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании специфичности расщепления, которую она придает комплексу способной к нацеливанию нуклеазы. Специфичность расщепления может представлять собой частоту расщепления целевой последовательности-мишени, по сравнению с расщеплением нецелевых последовательности-мишени. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании специфичности нацеливания, которую она придает комплексу способной к нацеливанию нуклеазы. Специфичность нацеливания может представлять собой частоту нацеливания на целевую последовательность-мишень, по сравнению с нацеливанием на нецелевые последовательности-мишени.

[00115] Характеристики, такие как специфичность расщепления, эффективность расщепления, специфичность нацеливания или эффективность нацеливания, можно определять на основании характеристик направляющей нуклеиновой кислоты. Например, каркасная последовательность, область псевдоузла или последовательность петли могут, каждая или в комбинации, влиять на характеристики нацеливания или характеристики расщепления рассматриваемого комплекса нуклеазы. В некоторых примерах, части каркасной последовательности, взаимодействующие с нуклеазой, влияют на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых случаях, направляющая последовательность (иногда обозначенная как нацеливающая последовательность) направляющей нуклеиновой кислоты влияет на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых примерах, выбор последовательности-мишени влияет на специфичность или эффективность расщепления или нацеливания комплекса. Например, несовпадения между направляющей последовательностью и последовательностью-мишенью могут влиять на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых случаях, локализация несовпадения относительно PAM может влиять на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых случаях, количество несовпадений или расположение несовпадений в пространстве друг относительно друга может влиять на специфичность или эффективность расщепления или нацеливания комплекса. В любом из этих случаев, указанный параметр может либо увеличивать, либо уменьшать специфичность нацеливания, эффективность нацеливания, специфичность расщепления или эффективность расщепления рассматриваемого комплекса способной к нацеливанию нуклеазы.

[00116] Последовательность-мишень комплекса способной к нацеливанию нуклеазы может представлять собой любой полинуклеотид, эндогенный или экзогенный для клетки прокариот или эукариот, или in vitro. Например, последовательность-мишень может представлять собой полинуклеотид, находящийся в ядре эукариотической клетки. Последовательность-мишень может представлять собой последовательность, кодирующую продукт гена (например, белок), или некодирующую последовательность (например, регуляторный полинуклеотид или a избыточная ДНК). Без намерения быть связанными с теорией, считают, что последовательность-мишень должна являться ассоциированной с PAM; то есть, короткой последовательностью, узнаваемой комплексом способной к нацеливанию нуклеазы. Точные требования к последовательности и длине PAM отличаются, в зависимости от используемой направляемой нуклеиновой кислотой нуклеазы, однако, PAM, как правило, представляют собой последовательности 2-5 пар оснований, смежные с последовательностью-мишенью. Примеры последовательностей PAM приведены в разделе примеры ниже, и специалист в данной области способен идентифицировать дополнительные последовательности PAM для использования с данной направляемой нуклеиновой кислотой нуклеазой. Кроме того, конструирование домена взаимодействия с PAM (PI) может позволять программирование специфичности PAM, улучшать точность узнавания участка-мишени и увеличивать многофункциональность платформы геномной инженерии на основе направляемой нуклеиновой кислотой нуклеазы. Направляемые нуклеиновыми кислотами нуклеазы можно конструировать для изменения их специфичности PAM, например, как описано в Kleinstiver B P et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul. 23; 523 (7561): 481-5. doi: 10.1038/nature14592.

[00117] Участок PAM представляет собой нуклеотидную последовательность поблизости от последовательности-мишени. В большинстве случаев, направляемая нуклеиновой кислотой нуклеаза может расщеплять последовательность-мишень, только если присутствует подходящий PAM. PAM являются специфическими для направляемой нуклеиновой кислотой нуклеазы и могут отличаться между двумя различными направляемыми нуклеиновыми кислотами нуклеазами. PAM может находиться на 5’ или 3’ от последовательности-мишени. PAM может находиться выше или ниже последовательности-мишени. PAM может иметь длину 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более нуклеотидов. Часто, PAM имеет длину между 2-6 нуклеотидов.

[00118] Участки PAM, совместимые с рассматриваемой нуклеазой или комплексом способной к нацеливанию нуклеазы, можно идентифицировать с использованием способов, описанных в настоящем описании. Как правило, библиотеку векторов можно получать, как описано в настоящем описании, где указанный вектор содержит последовательность-мишень, смежную с последовательностью PAM. В библиотеке таких векторов, последовательность PAM можно изменять между различными векторами, таким образом, чтобы множество различных последовательностей PAM можно было подвергать скринингу или тестированию в пределах одного эксперимента или высокопроизводительным способом. Указанный вектор может содержать a штрих-код или другой уникальный идентификатор позволяющий идентификацию PAM, подлежащего тестированию. Указанный вектор может содержать селективный маркер или позволяющий скрининг маркер. Указанный вектор может содержать направляющую последовательность нуклеиновой кислоты. Указанная направляющая нуклеиновая кислота может содержать нацеливающую последовательность, способную к нацеливанию на последовательность-мишень вектора. Указанная направляющая нуклеиновая кислота может содержать каркасную последовательность. В некоторых случаях, библиотека векторов содержит множество различных направляющая последовательность нуклеиновой кислоты или каркасные последовательности. Библиотека векторов можно затем вводить в клетки-хозяева, где указанные клетки-хозяева содержат рассматриваемую нуклеазу. Указанную рассматриваемую нуклеазу можно экспрессировать с того же или отличного вектора, который вводят в клетку одновременно, до или после вектора с направляющей нуклеиновой кислотой. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме транскрипта мРНК. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме белка. Без намерения быть связанными с теорией, внутри каждой клетки, направляющая нуклеиновая кислота может экспрессироваться и может формировать комплекс с рассматриваемой нуклеазой. Тогда направляющая нуклеиновая кислота может нацеливать нуклеазу на последовательность-мишень. В некоторых случаях, если PAM, смежный с последовательностью-мишенью, является совместимым с рассматриваемой нуклеазой, тогда рассматриваемая нуклеаза может расщеплять последовательность-мишень. Это событие расщепления может заставлять клетку-хозяина терять вектор, содержащий последовательность-мишень, или терять функцию селективного маркера или позволяющего скрининг маркера, и таким образом, клетка-хозяин может погибать под действием отбора или может быть потеряна в ходе скрининга. С другой стороны, если PAM является несовместимым с рассматриваемой нуклеазой, тогда последовательность-мишень не может подвергаться расщеплению, и таким образом, клетка-хозяин может сохранять селективный или позволяющий скрининг маркер. Посредством сравнения входных векторов с полученными в результате отбора или скрининга векторами из выживших или отобранных на выходе клеток-хозяев, можно идентифицировать векторы, подвергнутые истощению. Посредством секвенирования или анализа штрих-кода или уникального идентификатора входных векторов и выходных векторов, можно идентифицировать штрих-коды или уникальные идентификаторы, подвергнутые истощению, что может позволять идентификацию последовательностей PAM, подвергнутых истощению. The подвергнутые истощению последовательности PAM могут включать those которые являются совместимыми с рассматриваемой нуклеазой.

[00119] В некоторых случаях, при проведении анализа скрининга или тестирования PAM, описанного в настоящем описании, этот анализ можно также использовать для идентификации или скрининга направляющих последовательностей нуклеиновых кислот, которые являются совместимыми с рассматриваемой нуклеазой. В таких случаях, векторы в библиотеке векторов могут содержать штрих-код или уникальный идентификатор, смежный с направляющей нуклеиновой кислотой. Посредством сравнения входных векторов с выходными векторами, можно идентифицировать направляющие последовательности нуклеиновых кислот, подвергнутые истощению. Подвергнутые истощению направляющие последовательности нуклеиновых кислот могут включать последовательности, которые являются совместимыми с рассматриваемой нуклеазой. В некоторых случаях, с использованием анализов, описанных в настоящем описании, совместимые направляющие нуклеиновые кислоты и последовательности PAM для рассматриваемой нуклеазы можно идентифицировать или тестировать в пределах одного эксперимента или скрининга, или высокопроизводительным способом. Способы расчета и оценки истощения, как описано ранее, являются применимыми для расчета и оценки истощения также в этих случаях.

[00120] В некоторых примерах, PAM может быть предоставлен на отдельном олигонуклеотиде. В таких случаях, предоставление PAM на олигонуклеотиде позволяет расщепление последовательности-мишени, которая в ином случае не способна подвергаться расщеплению, поскольку смежный PAM не присутствует на том же самом полинуклеотиде, что и последовательность-мишень.

[00121] Полинуклеотидные последовательности, кодирующие компонент системы поддающейся нацеливанию нуклеазы, могут включать один или несколько векторов. Как правило, термин «вектор» относится к молекуле нуклеиновой кислоты, способной транспортировать другую нуклеиновую кислоту, с которой она связана. Векторы включают, но без ограничения, молекулы нуклеиновой кислоты, которые являются одноцепочечными, двухцепочечными или частично двухцепочечными; молекулы нуклеиновой кислоты, содержащие один или несколько свободных концов, не содержащие свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, содержащие ДНК, РНК или обе; и другие варианты полинуклеотидов, известных в данной области. Одним типом вектора является «плазмида», которая является кольцевой двухцепочечной ДНК-петлей, в которую могут быть вставлены дополнительные фрагменты ДНК, например, посредством стандартных способов молекулярного клонирования. Другим типом вектора является вирусный вектор, где происходящие из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, дефектные по репликации ретровирусы, аденовирусы, дефектные по репликации аденовирусы, и аденоассоциированные вирусы). Вирусные векторы включают также полинуклеотиды, переносимые вирусом, для трансфекции клетки-хозяина. Конкретные векторы являются способными к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальную точку начала репликации и эписомные векторы млекопитающих). Другие векторы (например, неэписомные векторы млекопитающих) интегрируют в геном клетки-хозяина после введения в клетку-хозяина, и таким образом, реплицируются вместе с геномом хозяина. Кроме того, конкретные векторы являются способными управлять экспрессией генов, с которыми они функционально связаны. Такие векторы обозначены в настоящем описании как «экспрессирующие векторы». Общепринятые экспрессирующие векторы для использования в способах рекомбинантной ДНК часто находятся в форме плазмид. Дополнительное обсуждение векторов представлено в настоящем описании.

[00122] Рекомбинантные экспрессирующие векторы могут содержать нуклеиновую кислоту по изобретению в форме, пригодной для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные экспрессирующие векторы включают один или несколько регуляторных элементов, которые можно выбирать на основании клеток-хозяев, подлежащих использованию для экспрессии, которые являются функционально связанными с последовательностью нуклеиновой кислоты, подлежащей экспрессии. В рекомбинантном экспрессирующем векторе, «функционально связанный» предназначен для обозначения того, что представляющая интерес нуклеотидная последовательность связана с регуляторным элементом(элементами) таким образом, который позволяет экспрессию нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине, когда вектор введен в клетку-хозяина). Применительно к способам рекомбинации и клонирования, приведено упоминание Патентной заявки США сер. No. 10/815730, опубликованной. 2 сентября 2004 г. как US 2004-0171156 A1, полное содержание которых приведено в настоящем описании в качестве ссылки.

[00123] В некоторых вариантах осуществления, регуляторный элемент является функционально связанным с одним или несколькими элементами системы поддающейся нацеливанию нуклеазы, таким образом, чтобы управлять экспрессией одного или нескольких компонентов системы поддающейся нацеливанию нуклеазы.

[00124] В некоторых вариантах осуществления, вектор содержит регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей направляемую нуклеиновой кислотой нуклеазу. Полинуклеотидная последовательность, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в конкретных клетках, таких как прокариотические или эукариотические клетки. Эукариотические клетки могут представлять собой клетки дрожжей, грибов, водорослей, растений, животных или человека. Эукариотические клетки могут представлять собой клетки из или происходящие из конкретного организма, такого как млекопитающее, включая, но без ограничения, человека, мышь, крысу, кролика, собаку или не относящегося к человеку млекопитающего, включая не относящегося к человеку примата.

[00125] Как правило, оптимизация кодонного состава относится к способу модификации последовательности нуклеиновой кислоты для улучшения экспрессии в представляющих собой клетках-хозяевах посредством замены по меньшей мере одного кодона (например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) природной последовательности на кодоны, более часто или наиболее часто используемые в генах клетки-хозяина, в то же время сохраняя природную аминокислотную последовательность. Для различных видов показан определенный сдвиг предпочтения конкретных кодонов для конкретной аминокислоты. Сдвиг предпочтения кодонов (различие использования кодонов между организмов) часто коррелирует с эффективностью трансляции матричной РНК (мРНК), которая, как считают, зависит, среди прочего, от свойств кодонов, подвергаемых трансляции, и доступности конкретных молекул транспортной РНК (тРНК). Предпочтительность избранных тРНК в клетке, как правило, является отражением кодонов, наиболее часто используемых в синтезе пептидов. Соответственно, гены можно корректировать для оптимальной экспрессии гена в данном организме на основании оптимизации кодонного состава. Таблицы использования кодонов являются легко доступными, например, в «Codon Usage Database», доступной на www.kazusa.orjp/codon/ (просмотрено 9 июля 2002 г.), и эти таблицы можно адаптировать рядом способов. См. Nakamura, Y., et al. «Codon usage tabulated from the international DNA sequence databases: status for the year 2000» Nucl. Acids Res. 28:292 (2000). Доступны также алгоритмы для оптимизации кодонного состава конкретной последовательности для экспрессии в конкретной клетке-хозяине, такие как Gene Forge (Aptagen; Jacobus, Pa.). В некоторых вариантах осуществления, один или несколько кодонов (например, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более, или все кодоны) в последовательности, кодирующей сконструированную нуклеазу, соответствуют наиболее часто используемому кодону для конкретной аминокислоты.

[00126] В некоторых вариантах осуществления, вектор кодирует направляемую нуклеиновой кислотой нуклеазу, содержащую одну или несколько последовательностей ядерной локализации (NLS), например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. В некоторых вариантах осуществления, сконструированная нуклеаза содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS, на амино-конце или около него, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS, на карбокси-конце или около него, или их комбинацию (например, один или несколько NLS на амино-конце и один или несколько NLS на карбокси-конце). Когда присутствуют более одного NLS, каждый можно выбирать независимо от других, так что один NLS может присутствовать в более чем одной копии, и/или в комбинации с одним или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления изобретения, сконструированная нуклеаза содержит, самое большее, 6 NLS. В некоторых вариантах осуществления, NLS рассматривают как находящийся около N- или C-конца, когда ближайшая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот на протяжении полипептидной цепи от N- или C-конца. Неограничивающие примеры NLS включают последовательности NLS, происходящие из: NLS большого Т-антигена вируса SV40, имеющего аминокислотную последовательность PKKKRKV (SEQ ID NO: 111); NLS из нуклеоплазмина (например, двухчастного NLS нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK (SEQ ID NO:112)); NLS c-myc, имеющего аминокислотную последовательность PAAKRVKLD (SEQ ID NO:113) или RQRRNELKRSP (SEQ ID NO:114); NLS hRNPA1 M9, имеющего последовательность NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 115); последовательности RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO:1 116) домена IBB импортина-альфа; последовательностей VSRKRPRP (SEQ ID NO:117) и PPKKARED (SEQ ID NO:118) из Т-белка миомы; последовательности PQPKKKPL (SEQ ID NO:119) из p53 человека; последовательности SALIKKKKKMAP (SEQ ID NO:120) из c-abl IV мыши; последовательностей DRLRR (SEQ ID NO:121) и PKQKKRK (SEQ ID NO:122) из вируса гриппа NS1; последовательности RKLKKKIKKL (SEQ ID NO:123) из антигена вируса гепатита дельта; последовательности REKKKFLKRR (SEQ ID NO: 124) из белка Mxl мыши; последовательности KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 125) из полимеразы поли(АДФ-рибозы) человека; и последовательности RKCLQAGMNLEARKTKK (SEQ ID NO: 126) из глюкокортикоидных рецепторов стероидных гормонов (человека).

[00127] Как правило, один или несколько NLS имеют достаточную силу, чтобы приводить к накоплению направляемой нуклеиновой кислотой нуклеазы в поддающемся детекции количестве в ядре эукариотической клетки. Как правило, сила активности ядерной локализации может быть обусловлена количеством NLS, конкретными используемыми NLS(несколькими NLS) или комбинацией этих факторов. Детекцию накопления в ядре можно осуществлять любым пригодным способом. Например, поддающийся детекции маркер можно сливать с направляемой нуклеиновой кислотой нуклеазой, таким образом, чтобы можно было визуализировать локализацию внутри клетки, например, в комбинации со средствами для детекции локализации ядра (например, красителя, специфического для ядра, такого как DAPI). Можно также выделять из клеток ядра клеток, содержимое которых можно затем анализировать любым пригодным способом детекции белка, таким как иммуногистохимия, Вестерн-блоттинг или анализ активности фермента. Накопление в ядре можно также определять опосредованно, например, посредством анализа эффекта формирования комплекса направляемой нуклеиновой кислотой нуклеазы (например, анализа расщепления или мутации ДНК в последовательности-мишени, или анализа измененной активности экспрессии гена, подверженной влиянию формирования комплекса способной к нацеливанию нуклеазы и/или активности направляемой нуклеиновой кислотой нуклеазы), по сравнению с контролем, не подвергавшимся воздействию направляемой нуклеиновой кислотой нуклеазы или комплекса способной к нацеливанию нуклеазы, или подвергавшимся воздействию направляемой нуклеиновой кислотой нуклеазы, лишенной одного или нескольких NLS.

[00128] Направляемую нуклеиновой кислотой нуклеазу и одну или несколько направляющих нуклеиновых кислот можно доставлять в форме либо ДНК, либо РНК. Доставку как направляемой нуклеиновой кислотой нуклеазы, так и направляющей нуклеиновой кислоты в форме молекул РНК (немодифицированных или содержащих модификации оснований или остова) можно использовать для уменьшения времени, в течение которого направляемая нуклеиновой кислотой нуклеаза персистирует в клетке. Это может уменьшать уровень активности неспецифического расщепления в клетке-мишени. Поскольку доставка направляемой нуклеиновой кислотой нуклеазы в форме мРНК занимает время для трансляции в белок, может обеспечивать преимущество доставка направляющей нуклеиновой кислоты через несколько часов после доставки мРНК направляемой нуклеиновой кислотой нуклеазы, для максимизации уровня направляющей нуклеиновой кислоты, доступной для взаимодействия с белком направляемой нуклеиновой кислотой нуклеазы. В других случаях, мРНК направляемой нуклеиновой кислотой нуклеазы и направляющую нуклеиновую кислоту доставляют одновременно. В других примерах, направляющую нуклеиновую кислоту доставляют последовательно, например, через 0,5, 1, 2, 3, 4 или более часов после мРНК направляемой нуклеиновой кислотой нуклеазы.

[00129] В ситуациях, где количество направляющей нуклеиновой кислоты является ограничивающим, может являться желательным введение направляемой нуклеиновой кислотой нуклеазы в форме мРНК и направляющей нуклеиновой кислоты - в форме экспрессирующей кассеты ДНК с промотором, управляющим экспрессией направляющей нуклеиновой кислоты. Таким образом, количество доступной направляющей нуклеиновой кислоты может умножаться посредством транскрипции.

[00130] Направляющую нуклеиновую кислоту, в форме РНК или кодированную экспрессирующей кассетой ДНК, можно вводить в клетку-хозяина, содержащую направляемую нуклеиновой кислотой нуклеазу, кодированную в векторе или хромосоме. Направляющую нуклеиновую кислоту можно предоставлять в кассете из одного или нескольких полинуклеотидов, которые могут являться непрерывными или не непрерывными в кассете. В конкретных вариантах осуществления, направляющая нуклеиновая кислота предоставлена в кассете в форме одного непрерывного полинуклеотида.

[00131] Множество систем доставки можно использовать для введения направляемой нуклеиновой кислотой нуклеазы (ДНК или РНК) и направляющей нуклеиновой кислоты (ДНК или РНК) в клетку-хозяина. Они включают использование систем дрожжей, систем липофекции, систем микроинъекции, биолистических систем, виросом, липосом, иммунолипосом, поликатионов, конъюгатов липид:нуклеиновая кислота, вирионов, искусственных вирионов, вирусных векторов, электропорации, проникающих в клетку пептидов, наночастиц, нанопроволок (Shalek et al., Nano Letters, 2012), экзосом. Липосомы с использованием молекулярной технологии «троянского коня» (Pardridge et al., Cold Spring Harb Protoc; 2010; doi:10.1101/pdb.prot5407) можно использовать для доставки сконструированной нуклеазы и направляющей нуклеиновой кислоты через гематоэнцефалический барьер.

[00132] В некоторых вариантах осуществления, настоящее изобретение относится также к редактирующей матрице. Редактирующая матрица может являться компонентом вектора, как описано в настоящем описании, может содержаться в отдельном векторе или может быть предоставлена в форме отдельного полинуклеотида, такого как олигонуклеотид, линейный полинуклеотид или синтетический полинуклеотид. В некоторых случаях, редактирующая матрица находится в том же самом полинуклеотиде, что и направляющая нуклеиновая кислота. В некоторых вариантах осуществления, редактирующая матрица сконструирована, чтобы служить в качестве матрицы при гомологичной рекомбинация, например, внутри или около последовательности-мишени, подвергнутой внесению разрывов или расщеплению посредством направляемой нуклеиновой кислотой нуклеазы, в качестве части комплекса, как описано в настоящем описании. Полинуклеотид редактирующей матрицы может иметь любую подходящую длину, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 или более нуклеотидов. В некоторых вариантах осуществления, полинуклеотид редактирующей матрицы является комплементарным части полинуклеотида, содержащей последовательность-мишень. При оптимальном выравнивании, полинуклеотид редактирующей матрицы может перекрываться с одним или несколькими нуклеотидами из последовательностей-мишеней (например, приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40 или более нуклеотидами). В некоторых вариантах осуществления, когда последовательность редактирующей матрицы и полинуклеотид, содержащий последовательность-мишень, оптимально выровнены, ближайший нуклеотид из полинуклеотида матрицы находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от последовательности-мишени.

[00133] Во многих примерах, редактирующая матрица содержит по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью. Редактирующая матрица может содержать вставку, делецию, модификацию или любую их комбинацию, по сравнению с последовательностью-мишенью. Примеры некоторых редактирующих матриц описаны более подробно в более позднем разделе.

[00134] В некоторых аспектах, настоящее изобретение относится к способам, включающим доставку одного или нескольких полинуклеотидов, таких как или один или несколько векторов или линейных полинуклеотидов, как описано в настоящем описании, одного или нескольких их транскриптов, и/или одного или нескольких транскрибированных с них белков, в клетку-хозяина. В некоторых аспектах, изобретение, кроме того, относится к клеткам, полученным такими способами, и к организмам, содержащим такие клетки или полученным из таких клеток. В некоторых вариантах осуществления, сконструированную нуклеазу в комбинации с (и необязательно в комплексе с) направляющей нуклеиновой кислотой доставляют в клетку.

[00135] Общепринятые основанные на вирусах и невирусные способы переноса генов можно использовать для введения нуклеиновых кислот в клетки, такие как клетки прокариот, клетки эукариот, клетки млекопитающих или ткани-мишени. Такие способы можно использовать для введения кодирующих компонентов нуклеиновые кислоты сконструированной системы направляемой нуклеиновой кислотой нуклеазы в клетки в культуре или в организм хозяина. Системы доставки невирусных векторов включают ДНК-плазмиды, РНК (например, транскрипт вектора, описанного в настоящем описании), голую нуклеиновую кислоту и нуклеиновую кислоту в комплексе с носителем для доставки, таким как липосома. Системы доставки вирусных векторов включают ДНК- и РНК-вирусы, имеющие либо эписомные, либо интегрированные геномы после доставки в клетку. Обзор способов генотерапии см. в Anderson, Science 256:808-813 (1992); Nabel & Feigner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon. TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bohm (eds) (1995); и Yu et al., Gene Therapy 1:13-26 (1994).

[00136] Способы невирусной доставки нуклеиновых кислот включают липофекцию, микроинъекцию, баллистические способы, использование виросом, липосом, иммунолипосом, конъюгатов поликатион или липид:нуклеиновая кислота, голой ДНК, искусственных вирионов и усиленное агентом поглощение ДНК. Липофекция описана, например, в Патентах США No. 5049386, 4946787; и 4897355) и реагенты для липофекции продают на коммерческой основе (например, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, также пригодные для эффективной липофекции полинуклеотидов с узнаванием рецепторов, включают описанные в Felgner, WO 91/17424; WO 91/16024. Доставку можно осуществлять в клетки (например, введение in vitro или ex vivo) или в ткани-мишени (например, введение in vivo).

[00137] Получение комплексов липид:нуклеиновая кислота комплексы, включая нацеленные липосомы, такие как иммунолипидные комплексы, хорошо известно специалисту в данной области (см., например, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); Патенты США No. 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).

[00138] При применении систем на основе РНК- и ДНК-вирусов для доставки нуклеиновых кислот используют преимущества тщательно разработанных способов нацеливания вируса на специфические клетки в культуре или в организме хозяина и переноса вирусной нагрузки в ядро или геном клетки-хозяина. Вирусные векторы можно вводить напрямую в клетки в культуре, пациентам (in vivo), или их можно использовать для обработки клеток in vitro, и модифицированные клетки можно, необязательно вводить пациентам (ex vivo). Общепринятые системы на основе вирусов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса для переноса генов. Интеграция в геном хозяина возможна с использованием способов переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к долгосрочной экспрессии вставленного трансгена. Кроме того, высокую эффективность трансдукции наблюдали для многих различных типов клеток и тканей-мишеней.

[00139] Тропизм ретровируса можно изменять посредством включения чужеродных белков оболочки с расширением возможной целевой популяции клеток-мишеней. Лентивирусные векторы представляют собой ретровирусные векторы, которые способны трансдуцировать или инфицировать неделящиеся клетки и, как правило, образуют высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, может зависеть от ткани-мишени. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей емкостью до 6-10 т.п.о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в клетку-мишень с получением постоянной экспрессии трансгена. Широко применяемые ретровирусные векторы включают векторы на основе вируса лейкоза мышей (MuLV), вируса лейкоза гиббонов (GaLV), вируса иммунодефицита обезьян (SIV), вируса иммунодефицита человека (HIV) и их комбинаций (см., например, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700).

[00140] В применениях, в которых временная экспрессия является предпочтительной, можно использовать системы на основе аденовирусов. Векторы на основе аденовирусов способны обеспечивать очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С использованием таких векторов были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе.

[00141] Аденоассоциированные вирусные («AAV») векторы также можно использовать для трансдукции клеток целевыми нуклеиновыми кислотами, например, при получении in vitro нуклеиновых кислот и пептидов, и для способов генотерапии in vivo и ex vivo (см., например, West et al., Virology 160:38-47 (1987); Патент США No. 4797368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Конструирование рекомбинантных векторов AAV описано в ряде публикаций, включая Патент США No. 5173414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); и Samulski et al., J. Virol. 63:03822-3828 (1989).

[00142] В некоторых вариантах осуществления, клетку-хозяина временно или стабильно трансфицируют одним или несколькими векторами, линейными полинуклеотидами, полипептидами, комплексами нуклеиновая кислота-белок, или любой их комбинацией, как описано в настоящем описании. В некоторых вариантах осуществления, клетку трансфицируют in vitro, в культуре или ex vivo. В некоторых вариантах осуществления, клетку трансфицируют таким образом, как это в естественных условиях происходит у субъекта. В некоторых вариантах осуществления, клетка, которую трансфицируют, отобрана у субъекта. В некоторых вариантах осуществления, клетка происходит из клеток, отобранных у субъекта, таких как линия клеток.

[00143] В некоторых вариантах осуществления, клетку, трансфицированную одним или несколькими векторами, линейными полинуклеотидами, полипептидами, комплексами нуклеиновая кислота-белок, или любой их комбинацией, как описано в настоящем описании, используют для получения новой линии клеток, содержащей одну или несколько полученных при трансфекции последовательностей. В некоторых вариантах осуществления, клетку, временно трансфицированную компонентами сконструированной системы направляемой нуклеиновой кислотой нуклеазы, как описано в настоящем описании (например, посредством временной трансфекции одним или несколькими векторами, или трансфекции с использованием РНК), и модифицированную посредством активности комплекса сконструированной нуклеазы, используют для получения новой линии клеток, содержащей клетки, которые содержат модификацию, но у которых отсутствует любая другая экзогенная последовательность.

[00144] В некоторых вариантах осуществления, один или несколько векторов, описанных в настоящем описании, используют для получения не относящихся к человеку трансгенных клетки, организма, животного или растения. В некоторых вариантах осуществления, трансгенное животное представляет собой млекопитающее, такое как мышь, крыса или кролик. Способы получения трансгенных клеток, организмов, растений и животных известны в данной области, и как правило, начинаются со способа трансформации или трансфекции клетки, такого как описано в настоящем описании.

[00145] События неспецифического расщепления можно анализировать с использованием способов, описанных в настоящем описании. События неспецифического расщепления могут представлять собой события расщепления, которые происходят в локализации в последовательности нуклеиновой кислоты, отличной от целевой последовательности-мишени, таким образом, делая ее нецелевой последовательностью-мишенью. Как правило, можно получать библиотеку векторов, как описано в настоящем описании, где указанный вектор содержит последовательность-мишень или нецелевую последовательность-мишень, смежную с последовательностью PAM. В библиотеке таких векторов, последовательность-мишень или нецелевую последовательность-мишень можно изменять между различными векторами, таким образом, чтобы множество различных последовательностей-мишеней или нецелевых последовательностей-мишеней можно было подвергать скринингу или тестированию в пределах одного эксперимента, или высокопроизводительным способом. Указанный вектор может содержать штрих-код или другой уникальный идентификатор, позволяющий идентификацию последовательности-мишени или нецелевой последовательности-мишени, подлежащих тестированию. Указанный вектор может содержать селективный маркер или позволяющий скрининг маркер. Указанный вектор может содержать направляющую последовательность нуклеиновой кислоты. Указанная направляющая нуклеиновая кислота может содержать нацеливающую последовательность, способную к нацеливанию на совместимые последовательности-мишени внутри вектора. Указанная направляющая нуклеиновая кислота может содержать каркасную последовательность. Библиотеку векторов можно затем вводить в клетки-хозяева, где указанные клетки-хозяева содержат рассматриваемую нуклеазу. Указанную рассматриваемую нуклеазу можно экспрессировать с того же или отличного вектора, который вводят в клетку одновременно, до или после вектора с направляющей нуклеиновой кислотой. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме транскрипта мРНК. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме белка. Без намерения быть связанными с теорией, внутри каждой клетки, направляющая нуклеиновая кислота может экспрессироваться и может формировать комплекс с рассматриваемой нуклеазой. Тогда направляющая нуклеиновая кислота может нацеливать нуклеазу на совместимые последовательности-мишени. В некоторых случаях, если направляющая нуклеиновая кислота способна гибридизоваться с последовательностью-мишенью или нецелевой последовательностью-мишенью, тогда рассматриваемая нуклеаза может расщеплять последовательность-мишень или нецелевую последовательность-мишень. Это событие расщепления может заставлять клетку-хозяина терять вектор, содержащий последовательность-мишень, или терять функцию селективного маркера или позволяющего скрининг маркера, и таким образом, клетка-хозяин может погибать под действием отбора или может быть потеряна в ходе скрининга. С другой стороны, если направляющая нуклеиновая кислота не способна гибридизоваться с нецелевой последовательностью-мишенью, тогда нецелевая последовательность-мишень не может подвергаться расщеплению, и таким образом, клетка-хозяин может сохранять селективный или позволяющий скрининг маркер. Посредством сравнения входных векторов с полученными в результате отбора или скрининга векторами из выживших или отобранных на выходе клеток-хозяев, можно идентифицировать векторы, подвергнутые истощению. Посредством секвенирования или анализа штрих-кода или уникального идентификатора входных векторов и выходных векторов, можно идентифицировать штрих-коды или уникальные идентификаторы, подвергнутые истощению, что может позволять идентификацию последовательностей-мишеней или нецелевых последовательностей-мишеней, подвергнутых истощению. Подвергнутые истощению последовательности-мишени или нецелевые последовательности-мишени могут включать последовательности, которые являлись способными гибридизоваться с направляющей нуклеиновой кислотой, и таким образом, являлись способными подвергаться расщеплению посредством рассматриваемой нуклеазы. Подвергнутые истощению нецелевые последовательности-мишени могли содержать события неспецифического расщепления или неспецифические последовательности, которые являлись способными подвергаться расщеплению посредством рассматриваемой системы нуклеазы.

[00146] Нецелевые последовательности-мишени, подлежащие тестированию или скринингу в анализах неспецифического взаимодействия, описанных в настоящем описании, могут представлять собой варианты известной последовательности-мишени, способные подвергаться нацеливанию посредством рассматриваемой направляющей нуклеиновой кислоты. Например, с использованием известной представляющей интерес последовательности-мишени, можно конструировать нецелевые последовательности-мишени, чтобы они содержали вставки, делеции, реаранжировки или другие изменения последовательности, по сравнению с известной последовательностью-мишенью. Такие изменения последовательности могут включать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более нуклеотидов. Измененные нуклеотиды могут являться непрерывными или не непрерывными.

[00147] Способы расчета и оценки истощения, как описано ранее, являются применимыми также для расчета и оценки истощения в этих случаях.

[00148] Другие анализы для оценки неспецифического взаимодействия включают секвенирование генома организма-хозяина для идентификации событий неспецифического расщепления, которые часто поддаются идентификации посредством мутаций в последовательности, таких как вставка, делеция и мутация одного или нескольких нуклеотидов. Эти другие способы, таким образом, ограничены последовательностью генома клетки-хозяина при оценке неспецифических эффектов рассматриваемой системы нуклеазы. Рассматриваемые анализы, описанные в настоящем описании, обеспечивают намного более надежный и высокопроизводительный способ идентификации неспецифических эффектов фактически для любой последовательности и без ограничения последовательностью генома клетки-хозяина.

Способы применения

[00149] В контексте формирования комплекса сконструированной нуклеазы, «последовательность-мишень» относится к последовательности, для наличия комплементарности с которой сконструирована направляющая последовательность, где гибридизация между последовательностью-мишенью и направляющей последовательности способствует формированию комплекса сконструированной нуклеазы. Последовательность-мишень может включать любой полинуклеотид, такой как ДНК, РНК или гибрид ДНК-РНК. Последовательность-мишень может быть локализована в ядре или цитоплазме клетки. Последовательность-мишень может быть локализована in vitro или в бесклеточной среде.

[00150] Как правило, формирование комплекса сконструированной нуклеазы, содержащего направляющую нуклеиновую кислоту, гибридизованную с последовательностью-мишенью, и в комплексе с одной или несколькими сконструированными нуклеазами, как описано в настоящем описании, приводит к расщеплению одной или обеих цепей в или около (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований от) последовательности-мишени. Расщепление может происходить внутри последовательности-мишени, на 5’ от последовательности-мишени, выше последовательность-мишень, на 3’ от последовательности-мишени, или ниже последовательности-мишени.

[00151] В некоторых вариантах осуществления, один или несколько векторов, управляющих экспрессией одного или нескольких компонентов системы поддающейся нацеливанию нуклеазы, вводят в клетку-хозяина или in vitro, таким образом, формируя комплекс способной к нацеливанию нуклеазы на одном или нескольких участках-мишенях. Например, каждая из направляемой нуклеиновой кислотой нуклеазы и направляющей нуклеиновой кислоты может являться функционально связанной с отдельными регуляторными элементами в отдельных векторах. Альтернативно, два или более из элементов, экспрессированные с одинаковых или различных регуляторных элементов, можно объединять в одном векторе, где один или несколько дополнительных векторов предоставляют любые компоненты системы поддающейся нацеливанию нуклеазы, не включенные в первый вектор. Элементы системы поддающейся нацеливанию нуклеазы, объединенные в одном векторе, могут быть аранжированы в любой подходящей ориентации, например, один элемент локализован на 5' от («выше») или на 3' от («ниже») второго элемента. Кодирующая последовательность одного элемента может быть локализована на той же самой или противоположной цепи, по отношению к кодирующей последовательности второго элемента, и может быть ориентирована в том же самом или противоположном направлении. В некоторых вариантах осуществления, один промотор управляет экспрессией транскрипта, кодирующего направляемую нуклеиновой кислотой нуклеазу и одну или несколько направляющих нуклеиновых кислот. В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза и одна или несколько направляющих нуклеиновых кислот являются функционально связанными с одним и тем же промотором и экспрессируются с одного и того же промотора. В других вариантах осуществления, один или несколько направляющие нуклеиновые кислоты или полинуклеотиды, кодирующие одну или несколько направляющих нуклеиновых кислот, вводят в клетку или окружение in vitro, уже содержащие направляемую нуклеиновой кислотой нуклеазу или полинуклеотидную последовательность, кодирующую направляемую нуклеиновой кислотой нуклеазу.

[00152] При использовании множества различных направляющих последовательностей, одну экспрессирующую конструкцию можно использовать для нацеливания активности нуклеаза на множество различных, соответствующих последовательностей-мишеней в клетке или in vitro. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или более направляющих последовательностей. В некоторых вариантах осуществления, можно получать векторы, содержащие приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более таких направляющих последовательностей, и необязательно, доставлять в клетку или in vitro.

[00153] Способы и композиции, описанные в настоящем описании, могут включать более одной направляющей нуклеиновой кислоты, где каждая направляющая нуклеиновая кислота имеет отличную направляющая последовательность, таким образом, осуществляя нацеливание на отличную последовательность-мишень. В таких случаях, множество направляющих нуклеиновых кислот можно использовать в мультиплексном формате, где множество мишеней подвергают нацеливанию одновременно. Дополнительно или альтернативно, множество направляющих нуклеиновых кислот вводят в популяцию клеток, таким образом, что в каждую клетку в популяции вводят отличную или случайную направляющую нуклеиновую кислота, таким образом, осуществляя нацеливание на множество различных последовательностей-мишеней в популяции клеток. В таких случаях, коллекция измененных впоследствии клеток может быть обозначена как библиотека.

[00154] Способы и композиции, описанные в настоящем описании, могут включать множество различных направляемых нуклеиновыми кислотами нуклеаз, каждая с одной или несколькими различными соответствующими направляющими нуклеиновыми кислотами, таким образом, обеспечивая нацеливание на различные последовательности-мишени различных направляемых нуклеиновыми кислотами нуклеаз. В некоторых таких случаях, каждая направляемая нуклеиновой кислотой нуклеаза может соответствовать отдельному множеству направляющих нуклеиновых кислот, обеспечивая два или более неперекрывающихся, частично перекрывающихся или полностью перекрывающихся мультиплексных событий.

[00155] В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза имеет активность расщепления ДНК или активность расщепления РНК. В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза направлена на расщепление одной или обеих цепей в локализации последовательности-мишени, например, внутри последовательности-мишени и/или внутри последовательности, комплементарной последовательности-мишени. В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза направлена на расщепление одной или обеих цепей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида последовательности-мишени.

[00156] В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза может формировать компонент индуцируемой системы. Индуцируемый характер системы может обеспечивать пространственно-временной контроль редактирования гена или экспрессии гена с использованием некоторой формы энергии. Форма энергии может включать, но без ограничения электромагнитное излучение, звуковую энергию, химическую энергию, световую энергию, температуру и тепловую энергию. Примеры индуцируемой системы включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), низкомолекулярные двухгибридные системы активации транскрипции (FKBP, ABA и т.д.), или индуцируемые светом системы (фитохром, домены LOV или криптохром). В одном варианте осуществления, направляемая нуклеиновой кислотой нуклеаза может являться частью индуцируемого светом эффектора транскрипции (LITE) для управления изменениями активности транскрипции специфическим для последовательности образом. Компоненты индуцируемой светом системы могут включать направляемую нуклеиновой кислотой нуклеазу, светочувствительный гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых связывающих ДНК белков и способы их использования представлены в U.S. 61/736465 и U.S. 61/721283, полное содержание которых, таким образом, приведено в качестве ссылки. Индуцируемая система может являться индуцируемой температурой, таким образом, что система включается или выключается при увеличении или уменьшении температуры. В некоторых индуцируемых температурой системах, увеличение температуры включает систему. В некоторых индуцируемых температурой системах, увеличение температуры выключает систему.

[00157] В некоторых аспектах, настоящее изобретение относится к способам модификации последовательности-мишени in vitro, или в клетке прокариот или эукариот, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления, способ включает получение образцов клетки или популяции клеток таких как прокариотические клетки, или клетки человека или не относящегося к человеку животного или растения (включая микроводоросли), и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии in vitro или ex vivo. Клетку или клетки можно даже повторно вводить хозяину, такому как не относящееся к человеку животное или растение (включая микроводоросли). Для повторно введенных клеток, является особенно предпочтительным, чтобы клетки представляли собой стволовые клетки.

[00158] В некоторых вариантах осуществления, способ включает обеспечение связывания комплекса способной к нацеливанию нуклеазы с последовательностью-мишенью для осуществления расщепления указанной последовательности-мишени, таким образом, модификации последовательности-мишени, где комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу в комплексе с направляющей нуклеиновой кислотой где направляющая последовательность направляющей нуклеиновой кислоты гибридизуется с последовательностью-мишенью внутри полинуклеотида-мишени.

[00159] В некоторых аспектах, настоящее изобретение относится к способу модификации экспрессии полинуклеотида-мишени in vitro или в прокариотической или эукариотической клетке. В некоторых вариантах осуществления, способ включает обеспечение связывания комплекса способной к нацеливанию нуклеазы с последовательностью-мишенью внутри полинуклеотида-мишени, таким образом, что указанное связывание приводит к увеличению или уменьшению экспрессии указанного полинуклеотида-мишени; где комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу в комплексе с направляющая нуклеиновая кислота, и где направляющая последовательность направляющей нуклеиновой кислоты гибридизуется с последовательностью-мишенью внутри указанного полинуклеотида-мишени. Сходные соображения применимы, как выше, к способам модификации полинуклеотида-мишени. Фактически, эти варианты отбора образцов, культивирования и повторного введения применимы среди аспектов настоящего изобретения.

[00160] В некоторых аспектах, настоящее изобретение относится к наборам, содержащим любой один или несколько элементов, описанных в вышеуказанных способах и композициях. Элементы можно предоставлять индивидуально или в комбинациях, и можно предоставлять в любом пригодном контейнере, таком как a флакон, бутыль или пробирка. В некоторых вариантах осуществления, набор включает инструкции на одном или нескольких языках, например, на более, чем одном языке.

[00161] В некоторых вариантах осуществления, набор содержит один или несколько реагентов для использования в способе, в котором используют один или несколько элементов, описанных в настоящем описании. Реагенты могут быть предоставлены в любом пригодном контейнере. Например, набор может предоставлять один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, применимой в конкретном анализе, или в форме, требующей добавления одного или нескольких других компонентов перед использованием (например, в форме концентрата или в лиофилизированной форме). Буфер может представлять собой любой буфер, включая, но без ограничения, буфер карбонат натрия, буфер бикарбонат натрия, боратный буфер, буфер Трис, буфер MOPS, буфер HEPES буфер и их комбинации. В некоторых вариантах осуществления, буфер является щелочным. В некоторых вариантах осуществления, буфер имеет pH от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления, набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для вставки в вектор таким образом, чтобы функционально связывать направляющую последовательность и регуляторный элемент. В некоторых вариантах осуществления, набор содержит редактирующую матрицу.

[00162] В некоторых аспектах, настоящее изобретение относится к способам использования одного или нескольких элементов сконструированной системы поддающейся нацеливанию нуклеазы. Комплекс способной к нацеливанию нуклеазы по настоящему изобретению обеспечивает эффективные средства для модификации последовательности-мишени внутри полинуклеотида-мишени. Комплекс способной к нацеливанию нуклеазы по настоящему изобретению имеет широкое разнообразие применений, включая модификацию (например, делению, вставку, транслокацию, инактивацию, активацию) последовательности-мишени во множестве типов клеток. Комплекс способной к нацеливанию нуклеазы по изобретению как таковой имеет широкий спектр применений, например, в оптимизации биохимических путей, полногеномных исследованиях, геномной инженерии, генотерапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу, как описано в настоящем описании, в комплексе с направляющей нуклеиновой кислотой, где направляющая последовательность направляющей нуклеиновой кислоты может гибридизоваться с последовательностью-мишенью внутри полинуклеотида-мишени. Направляющая нуклеиновая кислота может содержать направляющую последовательность, соединенную с каркасной последовательностью. Каркасная последовательность может содержать одну или несколько областей последовательности с такой степенью комплементарности, что они совместно могут формировать вторичную структуру. В некоторых случаях, одна или несколько областей последовательности заключены или кодированы в одном и том же полинуклеотиде. В некоторых случаях, одна или несколько областей последовательности заключены или кодированы в разных полинуклеотидах.

[00163] Настоящее изобретение относится к способам расщепления полинуклеотида-мишени. Способ включает расщепление полинуклеотида-мишени с использованием комплекса способной к нацеливанию нуклеазы, который связывается с последовательностью-мишенью внутри полинуклеотида-мишени и осуществляет расщепление указанного полинуклеотида-мишени. Как правило, комплекс способной к нацеливанию нуклеазы по изобретению, при введении в клетку, образует разрыв (например, одно- или двухцепочечный разрыв) в последовательности-мишени. Например, способ можно использовать для расщепления гена-мишени в клетке, или для замены последовательности дикого типа на модифицированную последовательность.

[00164] Разрыв, образованный посредством комплекса способной к нацеливанию нуклеазы, может подвергаться репарации посредством процессов репарации, таких как имеющий пониженную точность путь соединения негомологичных концов (NHEJ), имеющая высокую точность направляемая гомологией репарация (HDR), или посредством путей рекомбинации. В ходе этих процессов репарации, редактирующую матрицу можно вводить в последовательность генома. В некоторых способах, процесс HDR или рекомбинации используют для модификации последовательности-мишени. Например, редактирующую матрицу, содержащую последовательность, подлежащую интеграции, фланкированную вышележащей последовательностью и нижележащей последовательностью, вводят в клетку. Вышележащие и нижележащие последовательности разделяют сходство последовательности с каждой стороны участка интеграции в хромосоме, целевом векторе или полинуклеотиде-мишени.

[00165] Редактирующая матрица может представлять собой ДНК или РНК, например, ДНК-плазмиду, искусственную хромосому бактерий (BAC), искусственную хромосому дрожжей (YAC), вирусный вектор, линейный фрагмент ДНК, фрагмент продукта ПЦР, олигонуклеотид, синтетический полинуклеотид, голую нуклеиновую кислоту или нуклеиновую кислоту в комплексе с носителем для доставки, таким как липосома или полоксамер.

[00166] Полинуклеотид редактирующей матрицы может содержать последовательность, подлежащую интеграции, (например, мутантный ген). Последовательность для интеграции может представлять собой последовательность, эндогенную или экзогенную для клетки. Примеры последовательности, подлежащей интеграции, включают полинуклеотиды, кодирующие белок, или некодирующую РНК (например, микроРНК). Таким образом, последовательность для интеграции могут являться функционально связанными с соответствующей контрольной последовательностью или последовательностями. Альтернативно, последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию. Последовательность, подлежащая интеграции может представлять собой мутант или вариант эндогенной последовательности дикого типа. Альтернативно, последовательность, подлежащая интеграции, может представлять собой вариант дикого типа эндогенной мутантной последовательности. Дополнительно или альтернативно последовательность, подлежащая интеграции, может представлять собой вариант или мутантную форму эндогенного мутанта или варианта последовательности.

[00167] Вышележащие и нижележащие последовательности в полинуклеотиде редактирующей матрицы можно выбирать, чтобы способствовать рекомбинации между представляющим собой интерес полинуклеотидом-мишенью и полинуклеотидом редактирующей матрицы. Вышележащая последовательность может представлять собой последовательность нуклеиновой кислоты, имеющую сходство последовательности с последовательностью выше целевого участка для интеграции. Подобным образом, нижележащая последовательность может представлять собой последовательность нуклеиновой кислоты, имеющую сходство последовательности с последовательностью ниже целевого участка для интеграции. Вышележащие и нижележащие последовательности в редактирующей матрице могут иметь 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с целевым полинуклеотидом. Предпочтительно, вышележащие и нижележащие последовательности в полинуклеотиде редактирующей матрицы имеют приблизительно 95%, 96%, 97%, 98%, 99% или 100% идентичность последовательности с целевым полинуклеотидом. В некоторых способах, вышележащие и нижележащие последовательности в полинуклеотиде редактирующей матрицы имеют приблизительно 99% или 100% идентичность последовательности с целевым полинуклеотидом.

[00168] Вышележащая или нижележащая последовательность может содержать от приблизительно 20 п.о. до приблизительно 2500 п.о., например, приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п.о. В некоторых способах, иллюстративная вышележащая или нижележащая последовательность содержит от приблизительно 15 п.о. до приблизительно 50 п.о., от приблизительно 30 п.о. до приблизительно 100 п.о., от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 600 п.о. до приблизительно 1000 п.о., или более конкретно, от приблизительно 700 п.о. до приблизительно 1000 п.о.

[00169] В некоторых способах, полинуклеотид редактирующей матрицы может дополнительно содержать маркер. Такой маркер может облегчать скрининг по направленной интеграции. Примеры пригодных маркеров включают участки рестрикции, флуоресцентные белки или селективные маркеры. Экзогенную полинуклеотидную матрицу по изобретению можно конструировать с использованием рекомбинантных способов (см., например, Green and Sambrook et al., 2014 и Ausubel et al., 2017).

[00170] В иллюстративном способе модификации полинуклеотида-мишени посредством интеграции полинуклеотида редактирующей матрицы, двухцепочечный разрыв вводят в последовательность генома посредством комплекса сконструированной нуклеазы, где разрыв может подвергаться репарации посредством гомологичной рекомбинации с использованием редактирующей матрицы, таким образом, что матрица интегрирует в полинуклеотид-мишень. Присутствие двухцепочечного разрыва может увеличивать эффективность интеграции редактирующей матрицы.

[00171] Настоящее изобретение относится к способам модификации экспрессии полинуклеотида в клетке. Некоторые способы включают увеличение или уменьшение экспрессии полинуклеотида-мишени с использованием комплекса способной к нацеливанию нуклеазы, который связывается с полинуклеотидом-мишенью.

[00172] В некоторых способах, полинуклеотид-мишень можно инактивировать, чтобы вызывать модификацию экспрессии в клетке. Например, при связывании комплекса способной к нацеливанию нуклеазы с последовательностью-мишенью в клетке, полинуклеотид-мишень инактивируется таким образом, что последовательность не транскрибируется, кодированный белок не продуцируется, или последовательность не функционирует, как функционирует последовательность дикого типа. Например, кодирующую белок или микроРНК последовательность можно инактивировать таким образом, чтобы белок не продуцировался.

[00173] В некоторых способах, контрольную последовательность можно инактивировать таким образом, чтобы она больше не функционировала в качестве регуляторной последовательностью. В рамках изобретения,, «регуляторная последовательность» может относиться к любой последовательности нуклеиновой кислоты, которая влияет на транскрипцию, трансляцию или доступность последовательности нуклеиновой кислоты. Примеры регуляторных последовательностей включают промотор, терминатор транскрипции и энхансер.

[00174] Инактивированная последовательность-мишень может включать мутацию делеции (т.е., делецию одного или нескольких нуклеотидов), мутацию вставки (т.е., вставку одного или нескольких нуклеотидов), или нонсенс-мутацию (т.е., замену одного нуклеотида на другой нуклеотид, таким образом, чтобы вводить стоп-кодон). В некоторых способах, инактивация последовательности-мишени приводит к «нокауту» последовательности-мишени.

[00175] Изменение экспрессии одного или нескольких полинуклеотидов-мишеней, ассоциированных с биохимическим путем передачи сигналов, можно определять посредством анализа различий уровней мРНК соответствующих генов между тестируемой модельной клеткой и контрольной клеткой, когда их приводят в контакт со средством-кандидатом. Альтернативно, дифференциальную экспрессию последовательностей, ассоциированных с биохимическим путем передачи сигналов, определяют посредством детекции различий уровня кодированного полипептида или продукта гена.

[00176] Для анализа индуцированного средством изменения уровня транскриптов мРНК или соответствующих полинуклеотидов, нуклеиновую кислоту, содержащуюся в образце, сначала выделяют в соответствии со стандартными в данной области способами. Например, мРНК можно выделять с использованием различных литических ферментов или химических растворов, в соответствии со способами, приведенными в Green and Sambrook (2014), или выделяют посредством смол, связывающих нуклеиновые кислоты, в соответствии с сопутствующими инструкциями, предоставленными производителями. Затем мРНК, содержащуюся в образце выделенной нуклеиновой кислоты, детектируют посредством способов амплификации или общепринятых анализов гибридизации (например, анализа Нозерн-блоттинга) в соответствии со способами, широко известными в данной области, или основанными на способах, проиллюстрированных в настоящем описании.

[00177] Для целей по этому изобретению, амплификация обозначает любой способ с использованием праймера и полимеразы, способный реплицировать последовательность-мишень с разумной точностью. Амплификацию можно проводить посредством природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli, и обратной транскриптазы. Предпочтительным способом амплификации является ПЦР. В частности, выделенную РНК можно подвергать анализу обратной транскрипции в сочетании с количественной полимеразной цепной реакцией (RT-ПЦР) для количественной оценки уровня экспрессии последовательности, ассоциированной с биохимическим путем передачи сигналов.

[00178] Детекцию уровня экспрессии гена можно проводить в реальном времени в анализе амплификации. В одном аспекте амплифицированные продукты можно визуализировать напрямую с использованием флуоресцентный связывающих ДНК средств, включая, но без ограничения, интеркалирующие в ДНК средства и связывающие бороздку ДНК средства. Поскольку количество интеркалирующих средств, включенных в молекулы двухцепочечной ДНК, как правило, является пропорциональным количеству амплифицированных продуктов ДНК, можно удобным образом определять количество амплифицированных продуктов посредством количественной оценки флуоресценции интеркалированного красителя с использованием общепринятых в данной области оптических систем. Связывающие ДНК красители, пригодные для этого применения, включают SYBR green, SYBR blue, DAPI, иодид пропидия, Hoeste, SYBR gold, бромид этидия, акридины, профлавин, акридин оранжевый, акрифлавин, фторкумарин, эллиптицин, дауномицин, хлороквин, дистамицин D, хромомицин, гомидий, митрамицин, комплексы полипиридил-рутения, антрамицин и т.п.

[00179] В другом аспекте, другие флуоресцентные метки, такие как специфические для последовательности зонды, можно использовать в реакции амплификации для облегчения детекции и количественной оценки амплифицированных продуктов. Количественная амплификация с использованием зондов основана на специфической для последовательности детекции желательного амплифицированного продукта. В ней используют флуоресцентные, специфические для мишени зонды (например, зонды TaqMan™), что приводит к увеличению специфичности и чувствительности. Способы проведения количественной амплификации с использованием зондов хорошо разработаны в данной области и объяснены в Патенте США No. 5210015.

[00180] В другом аспекте, можно проводить общепринятые анализы гибридизации с использованием зондов для гибридизации, разделяющих гомологию последовательности с последовательностями, ассоциированными с биохимическим путем передачи сигналов. Как правило, зондам позволяют формировать стабильные комплексы с последовательностями, ассоциированными с биохимическим путем передачи сигналов, содержащимися в биологическом образце, полученном от тестируемого субъекта в реакции гибридизации. Специалисту в данной области понятно, что когда антисмысловую последовательность используют в качестве нуклеиновой кислоты-зонда, полинуклеотиды-мишени, представленные в образце, выбирают таким образом, чтобы они являлись комплементарными последовательностям антисмысловых нуклеиновых кислот. И наоборот, когда нуклеотидный зонд представляет собой смысловую нуклеиновую кислоту, полинуклеотид-мишень выбирают таким образом, чтобы он являлся комплементарным последовательности смысловой нуклеиновой кислоты.

[00181] Гибридизацию можно проводить в условиях различной строгости, например, как описано в настоящем описании. Подходящие условия гибридизации для практического осуществления настоящего изобретения являются такими, что взаимодействие узнавания между зондом и последовательностями, ассоциированными с биохимическим путем передачи сигналов, является как достаточно специфическим, так и достаточно стабильным. Условия, увеличивающие строгость реакции гибридизации, являются широко известными и опубликованными в данной области. См., например, (Green and Sambrook, et al., (2014); Nonradioactive in Situ Hybridization Application Manual, Boehringer Mannheim, second edition). Анализ гибридизации можно разрабатывать с использованием зондов, иммобилизованных на любой твердой подложке, включая, но без ограничения, нитроцеллюлозу, стекло, силикон и различные массивы генов. Предпочтительный анализ гибридизации проводят на генных чипах высокой плотности, как описано в Патенте США No. 5445934.

[00182] Для удобной детекции комплексов зонд-мишень, сформированных в ходе анализа гибридизации, нуклеотидные зонды конъюгируют с поддающейся детекции меткой. Поддающиеся детекции метки, пригодные для использования по настоящему изобретению, включают любую композицию, поддающуюся детекции посредством фотохимических, биохимический, спектроскопических, иммунохимических, электрических, оптических или химических способов. В данной области известно широкое множество пригодных поддающихся детекции меток, включающих флуоресцентные или хемилюминесцентные метки, метки на основе радиоактивных изотопов, ферментных или других лигандов. В предпочтительных вариантах осуществления, вероятно, может являться желательной флуоресцентная метка или ферментная метка, такая как дигоксигенин, бета-галактозидаза, уреаза, щелочная фосфатаза или пероксидаза, комплекс авидин/биотин.

[00183] Способы детекции для детекции или количественной оценки интенсивности гибридизации могут, как правило, зависеть от метки, выбранной выше. Например, радиоактивные метки можно детектировать с использованием фотографической пленки или устройства для визуализации радиоактивного фосфора. Флуоресцентные маркеры можно детектировать и количественно оценивать с использованием фотодетектора для детекции излучаемого света. Ферментные метки, как правило, детектируют посредством предоставления субстрата для фермента и измерения продукта реакции, полученного посредством воздействия фермента на субстрат; и наконец, колориметрические метки детектируют посредством простой визуализации окрашенной метки.

[00184] Индуцированное средством изменение экспрессии последовательностей, ассоциированных с биохимическим путем передачи сигналов, можно также определять посредством исследования соответствующих продуктов генов. Определение уровня белка, как правило, включает a) приведение белка, содержащегося в биологическом образце, в контакт с средством, которое специфически связывается с белком, ассоциированным с биохимическим путем передачи сигналов; и (b) идентификацию любого комплекса средство:белок, сформированного таким образом. В одном аспекте этого варианта осуществления, средство, которое специфически связывается с белком, ассоциированным с биохимическим путем передачи сигналов, представляет собой антитело, предпочтительно, моноклональное антитело.

[00185] Реакцию можно проводить посредством приведения средства в контакт с образцом белков, ассоциированных с биохимическим путем передачи сигналов, происходящих из тестируемых образцов в условиях, позволяющих формирование комплекса между средством и белками, ассоциированными с биохимическим путем передачи сигналов. Формирование комплекса можно детектировать напрямую или опосредованно в соответствии со стандартными в данной области способами. В прямом способе детекции, средства предоставляют с поддающейся детекции меткой, и не вступившие в реакцию средства можно удалять от комплекса; количество оставшейся метки, таким образом, показывает количество сформированного комплекса. Для такого способа, является предпочтительным выбирать метки, которые остаются присоединенными к средствам даже в строгих условиях промывки. Является предпочтительным, чтобы метка не создавала помех для реакции связывания. В качестве альтернативы, в способе непрямой детекции можно использовать средство, содержащее метку, введенную либо химически, либо посредством ферментов. Желательная метка, как правило, не создает помех для связывания или стабильности полученного комплекса средство:полипептид. Однако, метка, как правило, сконструирована, чтобы являться доступной для антитела для эффективного связывания и таким образом, получения поддающегося детекции сигнала.

[00186] Широкое множество меток, пригодных для детекции уровня белков известны в данной области. Неограничивающие примеры включают радиоактивные изотопы, ферменты, коллоидные металлы, флуоресцентные соединения, биолюминесцентные соединения и хемилюминесцентный соединения.

[00187] Количество комплексов средство:полипептид, сформированных в ходе реакции связывания, можно количественно оценивать посредством стандартных количественных анализов. Как проиллюстрировано выше, формирование комплекса средство:полипептид можно измерять напрямую посредством количества метки, оставшейся в участке связывания. В качестве альтернативы, белок, ассоциированный с биохимическим путем передачи сигналов, тестируют по его способности к конкуренции с меченным аналогом за участки связывания на средстве. В этом конкурентном анализе, количество связанной метки является обратно пропорциональным количеству белковых последовательностей, ассоциированных с биохимическим путем передачи сигналов, присутствующих в тестированном образце.

[00188] Ряд способов анализа белка на основе общих принципов, описанных выше, доступны в данной области. Они включают, но без ограничения радиоиммунный анализ, ELISA (твердофазные иммуноферментные радиометрические анализы), «сэндвич» иммуноанализы, иммунорадиометрические анализы, иммуноанализы in situ (с использованием например, коллоидного золота, ферментной или радиоизотопной метки), анализа Вестерн-блоттигна, анализов иммунопреципитации, иммунофлуоресцентные анализы и SDS-PAGE.

[00189] Антитела, которые специфически узнают или связывают белки, ассоциированные с биохимическим путем передачи сигналов, являются предпочтительными для проведения вышеупомянутых анализов белка. Если желательно, можно использовать антитела, которые узнают специфический тип посттрансляционной модификации (например, индуцируемые биохимическим путем передачи сигналов модификации). Посттрансляционные модификации включают, но без ограничения, гликозилирование, липидизацию, ацетилирование и фосфорилирование. Эти антитела можно закупать у коммерческих производителей. Например, антитела против фосфотирозина, которые специфически узнают фосфорилированные по тирозину белки, доступны от ряда поставщиков, включая Invitrogen и Perkin Elmer. Антитела против фосфотирозина являются особенно полезными для детекции белков, которые подвергаются дифференциальному фосфорилированию по остаткам тирозина в ответ на стресс ER. Такие белки включают, но без ограничения эукариотический фактор инициации трансляции 2 альфа (eIF-2.альфа.). Альтернативно, эти антитела можно получать с использованием общепринятых способов поликлональных или моноклональных антител посредством иммунизации животного-хозяина или продуцирующей антитела клетки белком-мишенью, имеющим желательную посттрансляционную модификацию.

[00190] При практическом осуществлении рассматриваемого способа, может являться желательным различать паттерн экспрессии белка, ассоциированного с биохимическим путем передачи сигналов, в различных тканях организма, в различных типах клеток, и/или в различных субклеточных структурах. Эти исследования можно проводить с использованием специфических для тканей, специфических для клеток или специфических для субклеточных структур антител, способных связываться с белковыми маркерами, которые предпочтительно экспрессируются в конкретных тканях, типах клеток или субклеточных структурах.

[00191] Измененную экспрессия гена, ассоциированного с биохимическим путем передачи сигналов, можно также определять посредством исследования изменения активности продукта гена по сравнению с контрольной клеткой. Анализ индуцированного средством изменения активности белка, ассоциированного с биохимическим путем передачи сигналов, может зависеть от биологической активности и/или пути передачи сигнала, которые подвергают исследованию. Например, когда белок представляет собой киназу, изменение его способности фосфорилировать нижележащей субстрат(ы) можно определять посредством множества анализов, известных в данной области. Репрезентативные анализы включают, но без ограничения, иммуноблоттинг и иммунопреципитация с использованием антител, таких как антитела против фосфотирозина, которые узнают фосфорилированные белки. Кроме того, активность киназы можно детектировать посредством высокопроизводительных хемилюминесцентных анализов, таких как анализ AlphaScreen™ (доступный из Perkin Elmer) и eTag™ (Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174).

[00192] Когда белок, ассоциированный с биохимическим путем передачи сигналов, является частью каскада передачи сигналов, приводящего к колебанию условий внутриклеточного pH, чувствительные к pH молекулы, такие как флуоресцентные чувствительные к pH красители можно использовать в качестве репортерных молекул. В другом примере, где белок, ассоциированный с биохимическим путем передачи сигналов, представляет собой ионный канал, можно мониторировать колебания мембранного потенциала и/или внутриклеточной концентрации ионов. Ряд коммерческих наборов и высокопроизводительных устройств являются особенно подходящими для быстрого и надежного скрининга модуляторов ионных каналов. Репрезентативные устройства включают FLIPR™ (Molecular Devices, Inc.) и VIPR (Aurora Biosciences). Эти устройства могут детектировать реакции в более 1000 лунок микропланшета с образцами одновременно и обеспечивать измерение в реальном времени и функциональные данные в пределах секунды или даже ее доли.

[00193] В практическом осуществлении любого из способов, описанных в настоящем описании, пригодный вектор можно вводить в клетку, ткань, организм или эмбрион посредством одного или нескольких способов, известных в данной области, включая без ограничения, микроинъекцию, электропорацию, сонопорацию, биолистические способы, опосредованную фосфатом кальция трансфекцию, катионную трансфекцию, липосомную трансфекцию, дендримерную трансфекцию, трансфекцию посредством теплового шока, трансфекцию посредством нуклеофекции, магнитофекцию, липофекцию, импалефекцию, оптическую трансфекцию, усиленное запатентованным средством поглощение нуклеиновых кислот и доставку посредством липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах, вектор вводят в эмбрион посредством микроинъекции. Вектор или векторы можно микроинъецировать в ядро или цитоплазму эмбриона. В некоторых способах, вектор или векторы можно вводить в клетку посредством нуклеофекции.

Последовательность-мишень

[00194] Полинуклеотид-мишень из комплекса способной к нацеливанию нуклеазы может представлять собой любой полинуклеотид, эндогенный или экзогенный для клетки-хозяина. Например, полинуклеотид-мишень может представлять собой полинуклеотид, находящийся в ядре эукариотической клетки, в геноме прокариотической клетки или в внехромосомном векторе клетки-хозяина. Полинуклеотид-мишень может представлять собой последовательность, кодирующую продукт гена (например, белок) или некодирующую последовательность (например, регуляторный полинуклеотид или избыточную ДНК).

[00195] Примеры полинуклеотидов-мишеней включают последовательность, ассоциированную с биохимическим путем передачи сигналов, например, ассоциированный с биохимическим путем передачи сигналов ген или полинуклеотид. Примеры полинуклеотидов-мишеней включают ассоциированный с заболеванием ген или полинуклеотид. «Ассоциированный с заболеванием» ген или полинуклеотид относится к любому гену или полинуклеотиду, образующему продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, происходящих из пораженных заболеванием тканей, по сравнению с тканями или клетками из не пораженного заболеванием контроля. Он может представлять собой ген, начавший экспрессироваться на аномально высоком уровне; он может представлять собой ген, начавший экспрессироваться на аномально низком уровне, где измененная экспрессия коррелирует с возникновением и/или прогрессированием заболевания. Ассоциированный с заболеванием ген также относится к гену, имеющему мутацию(мутации) или генетическое изменение, которые являются напрямую ответственными, или находятся в неравновесии по сцеплению с геном(генами), ответственными за этиологию заболевания. Продукты транскрипции или трансляции могут являться известными или неизвестными, и могут присутствовать на нормальном или аномальном уровне.

[00196] Варианты осуществления изобретения относятся к способам и композициям, связанным с нокаутом генов, редактированием генов, изменением генов, амплификацией генов и репарацией конкретных мутаций. Изменение генов может также обозначать эпигенетические манипуляции с последовательностью-мишенью. Это может относиться к состоянию хроматина последовательности-мишени, например, к модификации состояния метилирования последовательности-мишени (т.е. добавлению или удалению метилирования или паттернов метилирования, или островков CpG), модификации гистонов, увеличению или уменьшению доступностьи последовательности-мишени, или облегчению 3D сворачивания. Понятно, что когда приведена ссылка на способ модификации клетки, организма или млекопитающего, включая человека или не относящегося к человеку млекопитающего или организма манипуляции с последовательностью-мишенью в представляющем интерес геномном локусе, это может быть применимо к организму (или млекопитающему) в целом или только к отдельной клетке или популяции клеток из организма (если организм является многоклеточным). В случае человека, например, авторы настоящего изобретения предусматривают, среди прочего, отдельную клетку или популяцию клеток и их можно, предпочтительно модифицировать ex vivo и затем вводить повторно. В этом случае, может являться необходимым биоптат или другой образец ткани или биологической жидкости. Стволовые клетки являются особенно предпочтительными в этом отношении. Однако, разумеется, предусматривают также варианты осуществления in vivo. И особенно предпочтительными по изобретению являются HSC.

[00197] Функциональность комплекса способной к нацеливанию нуклеазы можно оценивать посредством любого пригодного анализа. Например, компоненты системы поддающейся нацеливанию нуклеазы, достаточные для формирования комплекса способной к нацеливанию нуклеазы, включая направляющую нуклеиновую кислота и направляемая нуклеиновой кислотой нуклеаза, можно вводить в клетку-хозяина, имеющую соответствующую последовательность-мишень, например, посредством трансфекции с использованием векторов, кодирующих компоненты сконструированной системы нуклеазы, с последующей оценкой предпочтительного расщепления внутри последовательности-мишени. Подобным образом, расщепление последовательности-мишени можно оценивать в пробирке посредством предоставления последовательности-мишени и компонентов комплекса способной к нацеливанию нуклеазы. Другие анализы являются возможными и очевидными для специалиста в данной области. Направляющую последовательность можно выбирать для нацеливания на любую последовательность-мишень. В некоторых вариантах осуществления, последовательность-мишень представляет собой последовательность в геноме клетки. Иллюстративные последовательности-мишени включают те, которые являются уникальными в целевом геноме.

Редактирующая кассета

[00198] Настоящее изобретение относится к композициям и способам для редактирования последовательности полинуклеотида-мишени. Такие композиции включают полинуклеотиды, содержащие один или несколько компонентов системы поддающейся нацеливанию нуклеазы. Полинуклеотидные последовательности для использования в этих способах могут быть обозначены как редактирующие кассеты.

[00199] Редактирующая кассета может содержать один или несколько участков для праймеров. Участки для праймеров можно использовать для амплификации редактирующей кассеты с использованием олигонуклеотидных праймеров, содержащих обратно комплементарные последовательности, которые могут гибридизоваться с одним или несколькими участками для праймеров. Редактирующая кассета может содержать два или более участка для праймеров. Иногда, редактирующая кассета содержит участок для праймера на каждом конце редактирующей кассеты, где указанные участки для праймеров фланкируют один или несколько других компонентов редактирующей кассеты. Участки для праймеров могут иметь длину приблизительно 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 или более нуклеотидов.

[00200] Редактирующая кассета может содержать редактирующую матрицу, как описано в настоящем описании. Редактирующая кассета может содержать редактирующую последовательность. Редактирующая последовательность может являться гомологичной последовательности-мишени. Редактирующая последовательность может содержать по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью. Редактирующая последовательность часто содержит область гомологии (или плечи гомологии), фланкирующую по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью, таким образом, чтобы фланкирующие области гомологии облегчали гомологичную рекомбинацию редактирующей последовательности в последовательность-мишень. Редактирующая последовательность может содержать редактирующую матрицу, как описано в настоящем описании. Например, редактирующая последовательность может содержать по меньшей мере один мутацию, по сравнению с последовательностью-мишенью, включая одну или несколько мутаций PAM, приводящие к мутации или делеции участка PAM. Редактирующая последовательность может содержать одну или несколько мутаций в кодоне или некодирующей последовательности, по сравнению с нередактированным участком-мишенью.

[00201] Мутация PAM может представлять собой молчащую мутацию. Молчащая мутация может представлять собой изменение по меньшей мере одного нуклеотида кодона, по сравнению с исходным кодоном, которое не приводит к изменению аминокислоты, кодированной исходным кодоном. Молчащая мутация может представлять собой изменение нуклеотида в некодирующей области, такой как интрон, 5’-нетранслируемая область, 3’-нетранслируемая область или другая некодирующая область.

[00202] Мутация PAM может представлять собой немолчащую мутацию. Немолчащие мутации могут включать миссенс-мутацию. Миссенс-мутация может представлять собой изменение по меньшей мере одного нуклеотида кодона, по сравнению с исходным кодоном, которое приводит к изменению аминокислоты, кодированной исходным кодоном. Миссенс-мутации могут возникать в экзоне, открытой рамке считывания или другой кодирующей области.

[00203] Редактирующая последовательность может содержать по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью. мутация может представлять собой молчащую мутацию или немолчащую мутацию, такую как миссенс-мутация. Мутация может включать вставку одного или нескольких нуклеотидов или пар оснований. Мутация может включать делецию одного или нескольких нуклеотидов или пар оснований. Мутация может включать замену одного или нескольких нуклеотидов или пар оснований на другие один или несколько нуклеотидов или пар оснований. Вставленные или замененные последовательности могут включать экзогенные или гетерологичные последовательности.

[00204] Редактирующая кассета может содержать полинуклеотид, кодирующий направляющую последовательность нуклеиновой кислоты. В некоторых случаях, направляющая последовательность нуклеиновой кислоты является, необязательно, функционально связанной с промотором. Направляющая последовательность нуклеиновой кислоты может содержать каркасную последовательность и направляющую последовательность, как описано в настоящем описании.

[00205] Редактирующая кассета может содержать штрих-код. Штрих-код может представлять собой уникальную последовательность ДНК, которая соответствует редактирующей последовательности таким образом, что по штрих-коду можно идентифицировать одну или несколько мутаций соответствующей редактирующей последовательности. В некоторых примерах, штрих-код составляет 15 нуклеотидов. Штрих-код может содержать менее, чем 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 88, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, или более чем 200 нуклеотидов. Штрих-код может представлять собой неприродную последовательность. Редактирующая кассета, содержащая штрих-код, может представлять собой неприродную последовательность.

[00206] Редактирующая кассета может содержать одну или несколько редактирующих последовательностей и полинуклеотид, кодирующий направляющую нуклеиновую кислоту, необязательно, функционально связанную с промотором, где редактирующая кассета и направляющая последовательность нуклеиновой кислоты фланкированы участками для праймеров. Редактирующая кассета может дополнительно содержать штрих-код.

[00207] Пример редактирующей кассеты показан на фигуре 3. Каждая редактирующая кассета может быть сконструирована для редактирования участка в последовательности-мишени. Участки для нацеливания могут представлять собой кодирующие области, некодирующие области, функционально нейтральные участки, или могут представлять собой ген позволяющего скрининг или селективного маркера. Области гомологии внутри редактирующей последовательности фланкируют одну или несколько мутаций редактирующей кассеты и могут быть вставлены в последовательность-мишень посредством рекомбинации. Reкомбинация может включать расщепление ДНК, например, посредством направляемой нуклеиновой кислотой нуклеазы, и репарацию посредством гомологичной рекомбинации.

[00208] Редактирующие кассеты можно получать посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.

[00209] Отслеживаемые последовательности, такие как штрих-коды или записывающие последовательности, можно конструировать in silico посредством стандартного кода с вырожденными мутациями целевых кодонов. Вырожденные мутации могут содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, или более чем 30 остатков нуклеиновая кислоты. В некоторых примерах, вырожденные мутации могут содержать 15 остатков нуклеиновая кислоты (N15).

[00210] Плечи гомологии можно добавлять к редактирующей последовательности, чтобы обеспечивать вставку редактирующей последовательности в желательную локализацию посредством гомологичной рекомбинации или направляемой гомологией репарации. Плечи гомологии можно добавлять посредством синтеза, сборки in vitro, ПЦР или других известных в данной области способов, например, химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации. Плечи гомологии можно добавлять на обоих концах штрих-кода, записывающей последовательности и/или редактирующей последовательности, таким образом, фланкируя последовательность двумя различными плечами гомологии, например, 5’-плечом гомологии и 3’-плечом гомологии.

[00211] Плечо гомологии может содержать последовательность, гомологичную последовательности-мишени. Плечо гомологии может содержать последовательность, гомологичную последовательности, смежной с последовательностью-мишенью. Плечо гомологии может содержать последовательность, гомологичную последовательности, выше или ниже последовательности-мишени. Плечо гомологии может содержать последовательность, гомологичную последовательности внутри того же самого гена или открытой рамки считывания, что и последовательность-мишень. Плечо гомологии может содержать последовательность, гомологичную последовательности выше или ниже гена или открытой рамки считывания, в которой находится последовательность-мишень. Плечо гомологии может содержать последовательность, гомологичную 5’-UTR или 3’-UTR гена или открытой рамки считывания, в которой находится последовательность-мишень. Плечо гомологии может содержать последовательность, гомологичную гену, открытой рамке считывания, промотору, терминатору или последовательности нуклеиновой кислоты, отличным от тех, в которых находится последовательность-мишень.

[00212] Одинаковые 5’ и 3’ плечи гомологии можно добавлять к множеству различных редактирующих последовательностей, таким образом, получая библиотеку уникальных редактирующих последовательностей, каждая из которых имеет одинаковый участок целевой вставки. Одинаковые 5’ и 3’ плечи гомологии можно добавлять к множеству различных редактирующих матриц, таким образом, получая библиотеку уникальных редактирующих матриц, каждая из которых имеет одинаковый участок целевой вставки. В альтернативных примерах, различные 5’ или 3’ плечи гомологии можно добавлять к множеству редактирующих последовательностей или редактирующих матриц.

[00213] Библиотеку штрих-кодов или библиотеку записывающих последовательностей, содержащую фланкирующие плечи гомологии, можно клонировать в остов вектора. В некоторых примерах, содержащие штрих-код фланкирующие плечи гомологии клонируют в редактирующую кассету. Клонирование можно осуществлять посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.

[00214] Библиотеку редактирующих последовательностей, содержащих фланкирующие плечи гомологии, можно клонировать в остов вектора. В некоторых примерах, редактирующую последовательность и плечи гомологии клонируют в редактирующую кассету. Редактирующие кассеты могут, в некоторых случаях, дополнительно содержать последовательность нуклеиновой кислоты, кодирующую направляющую нуклеиновая кислота или гРНК, сконструированные для нацеливания на желательный участок вставки редактирующей последовательности, например, последовательность-мишень. Редактирующие кассеты могут, в некоторых случаях, дополнительно содержать штрих-код или записывающую последовательность. Клонирование можно осуществлять посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.

[00215] Полногеномные или полногеномные редактирующие библиотеки можно клонировать в остов вектора. Можно осуществлять вставку или сборку библиотеки штрих-кодов или записывающих последовательностей во втором участке для получения компетентных отслеживаемых плазмид, которые могут вводить записывающий штрих-код в фиксированный локус, в то же время интегрируя редактирующие библиотеки в широкое множество определенных пользователем участков. Клонирование можно осуществлять посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.

[00216] Можно сначала осуществлять сборку или вставку направляющей нуклеиновой кислоты или кодирующей ее последовательности в остове вектора, с последующей вставкой редактирующей последовательности и/или кассеты. В других случаях, можно сначала осуществлять сборку или вставку редактирующей последовательности и/или кассеты в остове вектора, с последующей вставкой направляющей нуклеиновой кислоты или кодирующей ее последовательности. В других случаях, одновременно осуществляют сборку или вставку в вектор направляющей нуклеиновой кислоты или кодирующей ее последовательности и редактирующей последовательности и/или кассеты. Записывающую последовательность или штрих-код можно вставлять до или после любой из этих стадий. Иными словами, следует понимать, что существует множество перестановок порядка, в котором осуществляют сборку элементов по настоящему изобретению. Вектор может являться линейным или кольцевым и может быть получен посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.

[00217] Можно синтезировать молекулу нуклеиновой кислоты, содержащую один или несколько элементов, описанных в настоящем описании. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету. Можно синтезировать молекулу нуклеиновой кислоты, содержащую направляющую нуклеиновую кислоту. Можно синтезировать молекулу нуклеиновой кислоты, содержащую записывающую кассету. Можно синтезировать молекулу нуклеиновой кислоты, содержащую штрих-код. Можно синтезировать молекулу нуклеиновой кислоты, содержащую плечо гомологии. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету и направляющую нуклеиновую кислоту. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету и штрих-код. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету, направляющую нуклеиновую кислоту и записывающую кассету. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету, записывающую кассету и две направляющие нуклеиновые кислоты. Можно синтезировать молекулу нуклеиновой кислоты, содержащую записывающую кассету и направляющую нуклеиновую кислоту. В любом из этих случаев, направляющая нуклеиновая кислота может, необязательно, являться функционально связанной с промотором. В любом из этих случаев, молекула нуклеиновой кислоты может дополнительно включать один или несколько штрих-кодов.

[00218] Синтез можно осуществлять посредством любого способа синтеза нуклеиновых кислот, известного в данной области. Синтез можно осуществлять посредством ферментного синтеза нуклеиновых кислот. Синтез можно осуществлять посредством химического синтеза. Синтез можно осуществлять посредством синтеза на основе массивов. Синтез можно осуществлять посредством способов твердофазного синтеза или фосфорамидитного синтеза. Синтез можно осуществлять посредством способов с использованием колонки или многолуночного планшета. Синтезированные молекулы нуклеиновой кислоты могут представлять собой неприродные молекулы нуклеиновой кислоты.

[00219] Способы программного обеспечения и автоматизации можно использовать для мультиплексного синтеза и получения. Например, программное обеспечение и автоматизацию можно использовать для получения 10, 102, 103, 104, 105, 106 или более синтезированных полинуклеотидов, кассет или плазмид. Автоматизированным способом можно быстро получать желательные последовательности и библиотеки, которые можно перерабатывать в технологическом процессе с минимальным количеством стадий для получения точно определенных библиотек, таких как полногеномные или полногеномные редактирующие библиотеки.

[00220] Можно получать полинуклеотиды или библиотеки, содержащие две или более молекулы нуклеиновой кислоты или плазмиды, содержащие любую комбинацию, описанную в настоящем описании, из записывающей последовательности, редактирующей последовательности, направляющей нуклеиновой кислоты, и необязательно, штрих-кода, включая комбинации одного или нескольких из любых из упомянутых ранее элементов. Например, такая библиотека может содержать по меньшей мере 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 104, 105, 106, 107, 108, 109, 1010 или более молекул нуклеиновой кислоты или плазмид по настоящему описанию. Следует понимать, что такая библиотека может включать любое количество молекул нуклеиновой кислоты или плазмид, даже если конкретное количество явно не указано выше.

[00221] Отслеживаемые библиотеки плазмид или библиотеки молекул нуклеиновой кислоты можно секвенировать для определения пары записывающей последовательности и редактирующей последовательности, содержащейся в каждой отслеживаемой плазмиде. В других случаях, пару известной записывающей последовательности с известной редактирующей последовательностью получают в процессе получения библиотеки. Предусмотрены другие способы определения ассоциации между записывающей последовательностью и редактирующей последовательностью, содержащимися в общей молекуле нуклеиновой кислоты или плазмиде, так что редактирующую последовательность можно идентифицировать посредством идентификации или секвенирования записывающей последовательности.

[00222] Способы и композиции для отслеживания редактирующих челночных эписомных библиотек, переносимых между E. coli и другими организмами/линиями клеток, представлены в настоящем описании. Библиотеки могут содержаться в плазмидах, искусственных хромосомах бактерий (BAC), искусственных хромосомах дрожжей (YAC), синтетических хромосомах, или вирусных или фаговых геномах. Эти способы и композиции можно использовать для получения переносимых снабженных штрих-кодами библиотек в организмах-хозяевах, таких как E. coli. Получение библиотек в таких организмах может обеспечивать преимущество разработанных способов осуществления гомологичной рекомбинации. Снабженные штрих-кодами библиотеки плазмид можно подвергать глубокому секвенированию в одном участке для отслеживания мутационного разнообразия, нацеленного на остальные части плазмиды, позволяющему очень сильное улучшение степени перекрывания библиотеки.

[00223] Любая молекула нуклеиновой кислоты, описанная в настоящем описании, может представлять собой выделенную нуклеиновую кислоту. Выделенные нуклеиновые кислоты можно получать любым способом, известны в данной области, например, с использованием стандартных рекомбинантных способов, способов сборки, способов синтеза или их комбинаций. В некоторых вариантах осуществления, нуклеиновые кислоты можно клонировать, амплифицировать, собирать или конструировать иным способом.

[00224] Выделенные нуклеиновые кислоты можно получать из клеточных, бактериальных или других источников, с использованием любого количества способов клонирования, известных в данной области. В некоторых вариантах осуществления, олигонуклеотидные зонды, которые избирательно гибридизуются, в строгих условиях, с другими олигонуклеотидами или с нуклеиновыми кислотами из организма или клетки, можно использовать для выделения или идентификации выделенной нуклеиновой кислоты.

[00225] Можно проводить скрининг клеточной геномной ДНК, РНК или кДНК по присутствию идентифицированного представляющего интерес генетического элемента с использованием зонда на основе одной или нескольких последовательностей. Различные степени строгости гибридизации можно использовать в анализе.

[00226] Условия высокой строгости для гибридизации нуклеиновых кислот хорошо известны в данной области. Например, условия могут включать условия низкой концентрации соли и/или высокой температуры, например, как обеспечивают посредством от приблизительно 0,02 M до приблизительно 0,15 M NaCl при температурах от приблизительно 50°C. до приблизительно 70°C. Понятно, что температура и ионная сила для желательной строгости частично определяются длиной конкретной нуклеиновой кислоты(кислот), длиной и нуклеотидным составом последовательности-мишени(последовательностей-мишеней), составом заряда нуклеиновой кислоты(кислот) и присутствием или концентрацией формамида, хлорида тетраметиламмония или другого растворителя(растворителей) в смеси для гибридизации. Нуклеиновые кислоты могут являться полностью комплементарными последовательности-мишени или могут иметь одно или несколько несовпадений.

[00227] Представляющие интерес нуклеиновые кислоты можно также амплифицировать с использованием множества известных способов амплификации. Например, технологию полимеразной цепной реакции (ПЦР) можно использовать для амплификации последовательностей-мишеней напрямую с ДНК, РНК или кДНК. ПЦР и другие способы амплификации in vitro можно также использовать, например, для клонирования последовательностей нуклеиновых кислот, для получения нуклеиновых кислот для использования в качестве зондов для детекции присутствия целевой нуклеиновой кислоты в образцах, для секвенирования нуклеиновой кислоты или для других целей.

[00228] Выделенные нуклеиновые кислоты можно получать посредством прямого химического синтеза посредством таких способов, как фосфотриэфирный способ, или с использованием автоматического синтезатора. Химическим синтезом, как правило, получают одноцепочечный олигонуклеотид. Его можно переводить в двухцепочечную ДНК посредством гибридизации с комплементарной последовательностью или посредством полимеризации с использованием ДНК-полимеразы с использованием одной цепи в качестве матрицы.

Записывающая кассета

[00229] В некоторых примерах, две редактирующие кассеты можно использовать совместно для отслеживания стадии генетического конструирования. Например, одна редактирующая кассета может содержать редактирующую матрицу и кодированную направляющую нуклеиновую кислоту, и вторая редактирующая кассета, обозначенная как записывающая кассета, может содержать редактирующую матрицу, содержащую записывающую последовательность и кодированную нуклеиновую кислоту, имеющую отличную направляющую последовательность, по сравнению с первой редактирующей кассетой. В таких случаях, редактирующую последовательность и записывающую последовательность можно вставлять в отдельные последовательности-мишени и определять посредством соответствующих им направляющих нуклеиновых кислот. Записывающая последовательность может содержать штрих-код, отслеживаемую или прослеживаемую последовательность и/или регуляторный элемент, функционально связанный с позволяющим скрининг или селективным маркером.

[00230] В способе мультиплексного клонирования, записывающую кассету можно ковалентно связывать по меньшей мере с одной редактирующей кассетой в плазмиде (например, фигура 17A) для получения плазмидных библиотек, имеющих уникальную комбинацию записывающей и редактирующей кассеты. Эту библиотеку можно секвенировать для получения картирования записи/редактирования и использовать для отслеживания редактирующих библиотек на протяжении больших фрагментов ДНК-мишени (например, фигура 17C). Записывающая и редактирующая последовательности могут содержаться в одной и той же кассете, в этом случае, их обе вводят в целевую последовательность нуклеиновой кислоты, например, в геном или плазмиду, посредством одного и того же события рекомбинации. В других примерах, записывающая и редактирующая последовательности могут содержаться в отдельных кассетах внутри одной и той же плазмиды, в этом случае, записывающую и редактирующую последовательности вводят в целевую последовательность нуклеиновой кислоты вводят в целевую последовательность посредством отдельных событий рекомбинации, либо одновременно, либо последовательно.

[00231] Настоящее изобретения относится к способам объединения мультиплексного синтеза олигонуклеотидов с рекомбинационной инженерией, для получения библиотек специфически сконструированных и отслеживаемых мутаций. Способы скрининга и/или отбора, за которыми следуют способы высокопроизводительного секвенирования и/или микромассива штрих-кодов, могут обеспечивать быстрое картирование мутаций, приводящих к представляющему интерес фенотипу.

[00232] Способы и композиции, описанные в настоящем описании, можно использовать для одновременного конструирования и отслеживания событий конструирования в целевой последовательности нуклеиновой кислоты.

[00233] Такие плазмиды можно получать с использованием способов сборки или клонирования in vitro. Например, плазмиды можно получать с использованием химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, других способов сборки олигонуклеотидов in vitro, традиционного клонирования на основе лигирования или любой их комбинации.

[00234] Такие плазмиды могут содержать по меньшей мере одну записывающую последовательность, такую как штрих-код, и по меньшей мере одну редактирующую последовательность. В большинстве случаев, записывающую последовательность используют для записи и отслеживания событий конструирования. Каждую редактирующую последовательность можно использовать для введения желательного редактирования в целевую последовательность нуклеиновой кислоты. Желательное редактирование может включать вставку, делецию, замену или изменение целевой последовательности нуклеиновой кислоты. В некоторых примерах, одна или несколько записывающих последовательностей и редактирующих последовательностей содержатся в одной и той же кассете, содержащейся внутри плазмиды, так что их вводят в целевую последовательность нуклеиновой кислоты посредством одного и того же события конструирования. В других примерах, записывающие и редактирующие последовательности содержатся в отдельных кассетах внутри плазмиды, так что каждую из них вводят в целевую нуклеиновую кислоту посредством отдельных событий конструирования. В некоторых примерах, плазмида содержит две или более редактирующих последовательности. Например, одну редактирующую последовательность можно использовать для изменения или выключения последовательности PAM, в то время как вторую редактирующую последовательность можно использовать для введения мутации в отдельную последовательность.

[00235] Записывающие последовательности можно вставлять в участок, отделенный от участка вставки редактирующей последовательности. Вставленная записывающая последовательность может быть отделена от редактирующей последовательности посредством от 1 п.о. до 1 млн.п.о. Например, дистанция разделения может составлять приблизительно 1 п.о., 10 п.о., 50 п.о., 100 п.о., 500 п.о., 1 т.п.о., 2 т.п.о., 5 т.п.о., 10 т.п.о. или более. Дистанция разделения может представлять собой любое дискретное целое число между 1 п.о. и 10 млн.п.о. В некоторых примерах, максимальная дистанция разделения зависит от размера целевых нуклеиновой кислоты или генома.

[00236] Записывающие последовательности можно вставлять как смежные с редактирующими последовательностями, или поблизости от редактирующей последовательности. Например, записывающую последовательность можно вставлять вне открытой рамки считывания, внутри которой вставляют редактирующую последовательность. Записывающую последовательность можно вставлять в нетранслируемую область, смежную с открытой рамкой считывания, внутри которой вставляют редактирующую последовательность. Записывающую последовательность можно вставлять в функционально нейтральный или нефункциональный участок. Записывающую последовательность можно вставлять в ген позволяющего скрининг или селективного маркера.

[00237] В некоторых примерах, целевая последовательность нуклеиновой кислоты содержится в геноме, искусственной хромосоме, синтетической хромосоме или эписомной плазмиде. В различных примерах, целевая последовательность нуклеиновой кислоты может присутствовать in vitro или in vivo. Когда целевая последовательность нуклеиновой кислоты присутствует in vivo, плазмиду можно вводить в организмы-хозяева посредством трансформации, трансфекции, конъюгации, биолистических способов, наночастиц, технологий увеличения проницаемости клетки или других известных способов доставки ДНК, или любой их комбинации. В таких примерах, организм-хозяин может представлять собой эукариоту, прокариоту, бактерию, архею, дрожжи или другие грибы.

[00238] Событие конструирования может включать рекомбинационную инженерию, соединение негомологичных концов, гомологичную рекомбинацию или направляемую гомологией репарацию. В некоторых примерах, событие конструирования происходит in vitro или in vivo.

[00239] Способы, описанные в настоящем описании, можно осуществлять в любом типе клеток, в которых система поддающейся нацеливанию нуклеазы может функционировать (например, осуществлять нацеливание и расщепление ДНК), включая прокариотические и эукариотические клетки. В некоторых вариантах осуществления клетка представляет собой клетку бактерии, такой как Escherichia spp. (например, E. coli). В других вариантах осуществления, клетка представляет собой клетку гриба, такую как клетка дрожжей, например, Saccharomyces spp. В других вариантах осуществления, клетка представляет собой клетку водоросли, клетку растения, клетку насекомого или клетку млекопитающего, включая клетку человека.

[00240] В некоторых примерах, клетка представляет собой рекомбинантный организм. Например, клетка может содержать неприродную систему поддающейся нацеливанию нуклеазы. Дополнительно или альтернативно, клетка может содержать аппарат системы рекомбинации. Такие системы рекомбинации могут включать систему рекомбинации лямбда red, Cre/Lox, attB/attP или другие системы интегразы. Когда это целесообразно, плазмида может иметь комплементарные компоненты или аппарат, необходимые, чтобы выбранная система рекомбинации действовала корректно и эффективно.

[00241] Способ геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету и по меньшей мере одну направляющую нуклеиновую кислоту, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК и введению редактирующей кассеты; (c) получение жизнеспособных клеток; и (d) секвенирование целевой молекулы ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.

[00242] Способ геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету, содержащую мутацию PAM, как описано в настоящем описании, и по меньшей мере одну направляющую нуклеиновую кислоту, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК, введению редактирующей кассеты и гибели клеток из второй популяции клеток, не содержащих мутации PAM, в то время как клетки из второй популяции клеток, содержащие мутацию PAM, являются жизнеспособными; (c) получение жизнеспособных клеток; и (d) секвенирование целевой ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.

[00243] Способ отслеживаемого геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету, по меньшей мере одну записывающую кассету и по меньшей мере две направляющие нуклеиновые кислоты, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК и введению редактирующей и записывающей кассет; (c) получение жизнеспособных клеток; и (d) секвенирование записывающей последовательности целевой молекулы ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.

[00244] В некоторых примерах, где плазмида содержит вторую редактирующую последовательность, сконструированную для выключения PAM, способ отслеживаемого геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету, записывающую кассету и по меньшей мере две направляющие нуклеиновые кислоты, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК, введению редактирующей и записывающей кассет, и гибели клеток из второй популяции клеток, не содержащих мутации PAM, в то время как клетки из второй популяции клеток, содержащие мутацию PAM, являются жизнеспособными; (c) получение жизнеспособных клеток; и (d) секвенирование записывающей последовательности целевой ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.

[00245] В некоторых примерах эффективность трансформации определяют с использованием ненацеливающей контрольной направляющей нуклеиновой кислоты, что позволяет подтверждение способа рекомбинантной инженерии и подсчет КОЕ/нг. В некоторых случаях, абсолютную эффективность получают посредством подсчета общего количества колоний на каждой чашке после трансформации, например, посредством подсчета красных и белых колоний для контроля galK. В некоторых примерах, относительную эффективность рассчитывают по общему количеству успешных трансформантов (например, белых колоний) от всех колоний в контроле (например, контроле galK).

[00246] Способы по настоящему изобретению могут обеспечивать, например, более чем 1000x улучшение эффективности, масштаба, стоимости получения комбинаторной библиотеки и/или точности получения такой библиотеки.

[00247] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее улучшение эффективности получения геномных или комбинаторных библиотек.

[00248] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее улучшение масштаба получения геномных или комбинаторных библиотек.

[00249] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее уменьшение стоимости получения геномных или комбинаторных библиотек.

[00250] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее улучшение точности получения геномных или комбинаторных библиотек.

Рекурсивное отслеживание для комбинаторной инженерии

[00251] Настоящее изобретение относится к способам и композициям для повторяющихся циклов конструирования. Настоящее изобретение относится к способам рекурсивной инженерии, позволяющим осуществление записи CREATE на уровне отдельной клетки посредством нескольких серийных циклов конструирования (например, фигура 18 и фигура 19). Эти описанные способы и композиции могут обеспечивать технологии на основе поиска, в которых можно эффективно конструировать и исследовать комплексное генотипическое пространство. Термины рекурсивный и повторяющийся можно использовать взаимозаменяемо.

[00252] Способы комбинаторной инженерии могут включать множество циклов конструирования. Способы, описанные в настоящем описании, могут включать 2 или более циклов конструирования. Например, способ может включать 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30 или более чем 30 циклов конструирования.

[00253] В некоторых примерах, в ходе каждого цикла конструирования, новую записывающую последовательность, такую как штрих-код, вводят в один и тот же локус в соседние участки (например, фигура 18, серые блоки, или Фигура 19, черные блоки), таким образом, что после множества циклов конструирования для конструирования комбинаторного разнообразия на протяжении генома (например, фигура 18, серые блоки или фигура 19, серые блоки), простую ПЦР записывающего локуса можно использовать для реконструкции каждого комбинаторного генотипа или для подтверждения того, что сконструированное редактирование из каждого цикла включено в участок-мишень.

[00254] Настоящее изобретение относится к способам отбора для последующих циклов конструирования. Отбор можно осуществлять посредством мутации PAM, введенной посредством редактирующей кассеты. Отбор можно осуществлять посредством мутации PAM, введенной посредством записывающей кассеты. Отбор можно осуществлять с использованием позволяющего скрининг, селективного или контрселективного маркера. Отбор можно осуществлять посредством нацеливания на участок для редактирования или записи, введенный посредством предшествующего цикла конструирования, таким образом, отбора вариантов, в которые успешно введены события редактирования и записывающие последовательности из обоих циклов или всех предшествующих циклов конструирования.

[00255] Количественную оценку этих генотипов можно использовать для понимания эффектов комбинаторных мутаций на большие популяции и исследования важных биологических феноменов, таких как эпистаз.

[00256] Серийное редактирование и комбинаторное отслеживание можно осуществлять с использованием рекурсивных векторных систем, как описано в настоящем описании. Эти рекурсивные векторные системы можно использовать для быстрого продвижения в способе трансформации. В некоторых примерах, эти системы состоят из двух или более плазмид, содержащих ортогональные точки начала репликации, маркеры устойчивости к антибиотику, и кодированные направляющие нуклеиновые кислоты. Кодированную направляющую нуклеиновую кислоту в каждом векторе можно конструировать для нацеливания на один из других маркеров устойчивости для повреждения посредством опосредованного направляемой нуклеиновой кислотой нуклеазой расщепления. Эти системы можно использовать, в некоторых примерах, для осуществления трансформаций, в которых селективное давление антибиотика переключают для удаления предшествующей плазмиды и управления обогащением сконструированными геномами из следующего цикла. Можно осуществлять два или более пассажей в ходе петли трансформации, или иными словами, можно проводить множество циклов конструирования. Введение необходимых записывающих кассет и редактирующих кассет в рекурсивные векторы, как описано в настоящем описании, можно использовать для одновременного геномного редактирования и удаления плазмиды на каждой стадии трансформации с высокой эффективностью.

[00257] В некоторых примерах, рекурсивная векторная система, описанная в настоящем описании, содержит 2, 3, 4, 5, 6, 7, 8, 9, 10 или более чем 10 уникальных плазмид. В некоторых примерах, в рекурсивной векторной системе можно использовать конкретную плазмиду более одного раза, при условии, что отличную плазмиду используют в предшествующем цикле и в последующем цикле.

[00258] Рекурсивные способы и композиции, описанные в настоящем описании, можно использовать для восстановления функции селективного или позволяющего скрининг элемента в целевом геноме или плазмиде. Селективный или позволяющий скрининг элемент может включать ген устойчивости к антибиотику, флуоресцентный ген, уникальную последовательность ДНК или водяной знак, или другой известный репортер, позволяющий скрининг, или селективный ген. В некоторых примерах, в каждом последующем цикле конструирования можно вводить фрагмент селективного или позволяющего скрининг элемента, таким образом, что, в конце циклов конструирования, полный селективный или позволяющий скрининг элемент включают в целевой геном или плазмида. В таких примерах, можно проводить отбор или скрининг только тех геномов или плазмид, в которые успешно введены все эти фрагменты, и таким образом, все из желательных соответствующих мутаций. Таким образом, полученные в результате отбора или скрининга клетки можно обогащать по клеткам, включающим события редактирования из всех без исключения повторяющихся циклов конструирования.

[00259] Рекурсивные способы можно использовать для переключения селективного или позволяющего скрининг маркера между положением включения и выключения, или между положением выключения и включения, в каждом последующем цикле конструирования. Использование такого способа позволяет сохранение доступных селективных или позволяющих скрининг маркеров посредством необходимости, например, использования только одного позволяющего скрининг или селективного маркера. Кроме того, короткую регуляторную последовательность или инициирующий кодон, или неинициирующие кодоны можно использовать для включения и выключения позволяющего скрининг или селективного маркера. Такие короткие последовательности можно легко вписывать в синтезированную кассету или полинуклеотид.

[00260] Один или несколько циклов конструирования можно проводить с использованием способов и композиций, описанных в настоящем описании. В некоторых примерах, каждый цикл конструирования используют для введения редактирования, уникального по сравнению с редактированием из предшествующих циклов. В каждом цикле конструирования можно вводить уникальную записывающую последовательность. Каждый цикл конструирования может приводить к удалению или выведению плазмиды, используемой в предшествующем цикле конструирования. В некоторых примерах, успешное введение записывающей последовательности из каждого цикла конструирования приводит к полной и функциональной комбинации позволяющих скрининг или селективных маркеров, или уникальных последовательностей.

[00261] Уникальные записывающие кассеты, содержащие записывающие последовательности, такие как штрих-коды или позволяющие скрининг или селективные маркеры, можно вставлять в каждом цикле конструирования, таким образом, получая записывающую последовательность, показательную для комбинации проведенных стадий редактирования или конструирования. Последующие записывающие последовательности можно вставлять смежными друг с другом. Последующие записывающие последовательности можно вставлять поблизости друг от друга. Последующие последовательности можно вставлять на расстоянии друг от друга.

[00262] Последующие последовательности можно вставлять на расстоянии друг от друга. Например, последующие записывающие последовательности можно вставлять и разделять 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 или более чем 100 п.о. В некоторых примерах, последующие записывающие последовательности разделяют приблизительно 10, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, или более чем 1500 п.о.

[00263] Последующие записывающие последовательности могут быть разделены любым желательным количеством пар оснований и могут быть зависимыми от и иметь ограничения количества последующих записывающих последовательностей, подлежащих вставке, размера целевой нуклеиновой кислоты или целевых геномов, и/или дизайна желательной конечной записывающей последовательности. Например, если составная записывающая последовательность представляет собой функциональный позволяющий скрининг или селективный маркер, тогда последующие записывающие последовательности можно вставлять поблизости и внутри одной и той же рамки считывания, по отношению друг к другу. Если составная записывающая последовательность представляет собой уникальный набор штрих-кодов, подлежащих идентификации посредством секвенирования, и не имеет кодирующих элементов последовательности, тогда последующие записывающие последовательности можно вставлять с любым желательным количеством пар оснований, разделяющих их. В этих случаях, разделяющее расстояние может зависеть от технологии секвенирования, подлежащей использованию, и предела длины прочтения.

[00264] В то время как предпочтительные варианты осуществления настоящего изобретения показаны и описаны в настоящем описании, специалисту в данной области понятно, что такие варианты осуществления представлены только в качестве примера. В настоящее время различные варианты, изменения и замены очевидны специалисту в данной области без отклонения от изобретения. Следует понимать что различные альтернативы вариантам осуществления изобретения, описанным в настоящем описании, можно использовать в практическом осуществлении изобретения. Подразумевают, что следующая ниже формула определяет объем изобретения, и что способы и структуры в пределах объема пунктов этой формулы изобретения, и их эквиваленты включены в него.

Некоторые определения

[00265] В рамках изобретения, термин «дикий тип» представляет собой термин в данной области, понятный специалисту в данной области, и обозначает типичную форму организма, штамма, гена или характеристики, как она встречается в природе, в отличие от форм мутанта или варианта.

[00266] В рамках изобретения, термин «вариант» следует понимать как обозначающий проявление качеств, имеющее паттерн, отличающийся от встречающегося в природе.

[00267] Термины «ортологичный» (также обозначенный как «ортолог» в настоящем описании) и «гомологичный» (также обозначенный как «гомолог» в настоящем описании) хорошо известны в данной области. В качестве дополнительного объяснения, «гомолог» белка, в рамках изобретения, представляет собой белок из того же вида, который осуществляет такую же или сходную функцию, что и белок, гомологом которого он является. Гомологичные белки могут являться, но не обязательно должны являться структурно родственными, или являются только частично структурно родственными. «Ортолог» белка, в рамках изобретения, представляет собой белок из другого вида, который осуществляет такую же или сходную функцию, что и белок, ортологом которого он является. Ортологичные белки могут являться, но не обязательно должны являться структурно родственными, или являются только частично структурно родственными. Гомологи и ортологи можно идентифицировать посредством моделирования гомологии (см., например, Greer, Science vol. 228 (1985) 1055, и Blundell et al. Eur J Biochem vol 172 (1988), 513) или «структурный BLAST» (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a «structural BLAST»: using structural relationships to infer function. Protein Sci. 2013 April; 22(4):359-66. doi: 10.1002/pro.2225.).

[00268] Термины «полинуклеотид», «нуклеотид», «нуклеотидная последовательность», «нуклеиновая кислота» и «олигонуклеотид» используют взаимозаменяемо. Они относятся к полимерной форме нуклеотидов любой длины, дезоксирибонуклеотидов или рибонуклеотидов, или их аналогов. Полинуклеотиды могут иметь любую трехмерную структуру и могут осуществлять любую функцию, известную или неизвестную. Ниже приведены неограничивающие примеры полинуклеотидов: кодирующие или некодирующие области гена или фрагмента гена, локусы (локус), определенные из анализа сцепления, экзоны, интроны, матричная РНК (мРНК), транспортная РНК, рибосомальная РНК, малая интерферирующая РНК (миРНК), короткошпилечная РНК (кшРНК), микро-РНК (мкРНК), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенная ДНК любой последовательности, выделенная РНК любой последовательности, зонды на основе нуклеиновой кислоты и праймеры. Термин включает также подобные нуклеиновым кислотам структуры с синтетическими остовами, см., например, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997; и Samstag, 1996. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, таких как метилированные нуклеотиды и аналоги нуклеотидов. Если они присутствуют, модификации нуклеотидной структуры можно вводить до или после сборки полимера. Последовательность нуклеотидов может прерываться ненуклеотидными компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, например, посредством конъюгации с метящим компонентом.

[00269] «Комплементарность» относится к способности нуклеиновой кислоты формировать водородную связь(связи) с другой последовательностью нуклеиновой кислоты посредством либо традиционного спаривания оснований по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процент остатков в молекуле нуклеиновой кислоты, которые могут формировать водородные связи (например, спаривание оснований по Уотсону-Крику) с второй последовательностью нуклеиновой кислоты (например, 5, 6, 7, 8, 9, 10 из 10, составляющие 50%, 60%, 70%, 80%, 90% и 100% комплементарность). «Полностью комплементарные» означает, что все непрерывные остатки последовательности нуклеиновой кислоты могут формировать водородные связи с таким же количеством непрерывных остатков во второй последовательности нуклеиновой кислоты. «В основном комплементарные», в рамках изобретения, относится к степени комплементарности, составляющей по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, или 100% over a region of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизуются в строгих условиях.

[00270] В рамках изобретения, «строгие условия» гибридизации относятся к условиям, в которых нуклеиновая кислота, имеющая комплементарность с последовательностью-мишенью, преимущественно гибридизуется с последовательностью-мишенью, и по существу не гибридизуется с нецелевыми последовательностями. Строгие условия, в основном, являются зависимыми от последовательности, и меняются в зависимости от ряда факторов. Как правило, чем длиннее последовательность, тем выше температура, при которой последовательность специфически гибридизуется со своей последовательностью-мишенью. Неограничивающие примеры строгих условий подробно описаны в Tijssen (1993). Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter «Overview of principles of hybridization and the strategy of nucleic acid probe assay», Elsevier, N.Y. Когда приведена ссылка на полинуклеотидую последовательность, тогда комплементарные или частично комплементарные последовательности также подразумевают. Они, предпочтительно, являются способными гибридизоваться с эталонной последовательностью в условиях высокой строгости. Как правило, для максимизации уровня гибридизации, выбирают условия гибридизации относительно низкой строгости: приблизительно на 20-25 градусов Цельсия ниже, чем температура плавления (Tm). Tm представляет собой температуру, при которой 50% специфической последовательности-мишени гибридизуется с полностью комплементарным зондом в растворе при определенной ионной силе и pH. Как правило, при необходимости по меньшей мере приблизительно 85% комплементарности нуклеотидов гибридизующихся последовательностей, выбирают условия промывки высокой строгости, составляющие приблизительно на 5-15 градусов Цельсия ниже, чем Tm. При необходимости по меньшей мере приблизительно 70% комплементарности нуклеотидов гибридизующихся последовательностей, выбирают условия промывки умеренной строгости, составляющие приблизительно на 15-30 градусов Цельсия ниже, чем Tm. Высоко пермиссивные условия промывки (очень низкой строгости) могут являться настолько низкими, как на 50 градусов Цельсия ниже Tm, позволяя высокий уровень несовпадений между гибридизующимися последовательности. Специалисту в данной области понятно, что другие физические и химические параметры на стадиях гибридизации и промывки также можно изменять для влияния на выход сигнала поддающейся детекции гибридизации при конкретном уровне гомологии между последовательностями мишени и зонда.

[00271] «Гибридизация» относится к реакции, в которой один или несколько полинуклеотидов вступают в реакцию с формированием комплекса, стабилизированного посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить посредством спаривания оснований по Уотсону-Крику, связывания по Хугстину или любым другим специфическим для последовательности образом. Комплекс может содержать две цепи, формирующие дуплексную структуру, три или более цепи, формирующих многоцепочечный комплекс, одну самогибридизующуюся цепь, или любую их комбинацию. Реакция гибридизации может составлять стадию более обширного процесса, такого как инициация ПЦР, или расщепления полинуклеотида посредством фермента. Последовательность, способную гибридизоваться с данной последовательностью, обозначают как «комплементарную» данной последовательности.

[00272] В рамках изобретения, термин «геномный локус» или «локус» (множество локусов) представляет собой специфическую локализацию гена или последовательности ДНК на хромосоме. «Ген» относится к фрагментам ДНК или РНК, кодирующим полипептид или цепь РНК, которые играют функциональную роль в организм и таким образом, представляют собой молекулярную единицу наследственности в живых организмах. Для целей по этому изобретению, можно считать, что гены включают области, регулирующие продукцию продукта гена, независимо от того, являются или нет такие регуляторные последовательности смежными с кодирующими и/или транскрибируемыми последовательностями. Соответственно, ген включает, но не обязательно ограничен ими, промоторные последовательности, терминаторы, регуляторные последовательности трансляции, такие как участки связывания рибосом и внутренние участки связывания рибосом, энхансеры, сайленсеры, инсуляторы, пограничные элементы, точки начала репликации, участки прикрепления к матриксу и контрольные области локуса.

[00273] В рамках изобретения, «экспрессия геномного локуса» или «экспрессия гена» представляет собой процесс, посредством которого информация из гена используется в синтезе функционального продукта гена. Продуктами экспрессии гена часто являются белки, но для не кодирующих белки генов, таких как гены рРНК или гены тРНК, продуктом является функциональная РНК. Процесс экспрессии генов используют все известные живые эукариоты (включая многоклеточные организмы), прокариоты (бактерии и археи) и вирусы для получения функциональных продуктов для выживания. В рамках изобретения, «экспрессия» гена или нуклеиновой кислоты включает не только клеточную экспрессию гена, но также транскрипцию и трансляцию нуклеиновой кислоты(кислот) в системах клонирования и в любом другом контексте. В рамках изобретения, «экспрессия» относится также к процессу, посредством которого полинуклеотид транскрибируется с ДНК-матрицы (например, в мРНК или другой транскрипт РНК) и/или к процессу, посредством которого транскрибированная мРНК впоследствии транслируется в пептиды, полипептиды или белки. Транскрипты и кодированные полипептиды можно совместно обозначать как «продукты гена». Если полинуклеотид происходит из геномной ДНК, экспрессия может включать сплайсинг мРНК в эукариотической клетке.

[00274] Термины «полипептид», «пептид» и «белок» используют в настоящем описании взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может являться линейным или разветвленным, он может содержать модифицированные аминокислоты, и может прерываться не аминокислотами. Термин включает также аминокислотный полимер, который был модифицирован; например, посредством образования дисульфидной связи, гликозилирования, липидизации, ацетилирования, фосфорилирования или любой другой манипуляции, такой как конъюгация с метящим компонентом. В рамках изобретения, термин «аминокислота» включает природные и/или неприродные, или синтетические аминокислоты, включая глицин и D или L оптические изомеры, и аналоги аминокислот, и пептидомиметики.

[00275] В рамках изобретения, термин «домен» или «домен белка» относится к части белковой последовательности, которая может существовать и функционировать независимо от остальной белковой цепи.

[00276] Как описано в аспектах изобретения, идентичность последовательности относится к гомологии последовательности. Сравнения гомологии можно проводить визуально, или более обычно, с помощью легко доступных программы для сравнения последовательностей. Эти коммерчески доступные компьютерные программы могут рассчитывать (%) гомологии между двумя или более последовательностями и могут также рассчитывать идентичность последовательности, разделяемую двумя или более аминокислотными последовательностями или последовательностями нуклеиновых кислот. Гомологию последовательностей можно получать посредством любой из ряда компьютерных программ, известных в данной области, например, BLAST или FASTA и т.д. Пригодной компьютерной программой для проведения такого выравнивания является пакет GCG Wisconsin Bestfit (University of Wisconsin. U.S.A; Devereux et al., 1984, Nucleic Acids Research 12:387). Примеры другого программного обеспечения, которое может проводить сравнение последовательностей, включают, но без ограничения, пакет BLAST package (см. Ausubel et al., 1999, там же - Раздел 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410) и набор инструментов сравнения GENEWORKS. Как BLAST, так и FASTA, являются доступными для поиска в режиме офлайн и онлайн (см. Ausubel et al., 1999, там же, страницы 7-58-7-60). Однако предпочтительным является использование программы GCG Bestfit.

[00277] Процент гомологии можно рассчитывать на протяжении непрерывных последовательностей, т.е., одну последовательность выравнивают с другой последовательностью, и каждую аминокислоту или нуклеотид в одной последовательности непосредственно сравнивают с соответствующей аминокислотой или нуклеотидом в другой последовательности, по одному остатку за один раз. Это называют выравниванием «без пропусков». Как правило, такое выравнивание без пропусков осуществляют только на протяжении относительно небольшого количества остатков.

[00278] Хотя это является очень простым и непротиворечивым способом, он не может принимать во внимание то, что, например, в идентичной в ином отношении паре последовательностей, одна вставка или делеция может заставлять последующие аминокислотные остатки выпадать из выравнивания, таким образом, потенциально приводя к большому уменьшению % гомологии при проведении глобального выравнивания. Следовательно, большинство способов сравнения последовательностей разработаны для получения оптимального выравнивания, принимающего во внимание возможные вставки и делеции, без излишних штрафов в общем показателе гомологии или идентичности. Этого достигают посредством вставки «пропусков» при выравнивании последовательностей в попытке максимизировать локальную гомологию или идентичность.

[00279] Однако, в этих более сложных способах приписывают «штрафы за пропуски» каждому пропуску, возникающему при выравнивании, таким образом, что, для одинакового количества идентичных аминокислот, при выравнивании последовательностей с настолько малым количеством пропусков, насколько возможно - что отражает более высокое родство между двумя сравниваемыми последовательностями - можно достигать более высокого показателя, чем с множеством пропусков. Как правило, используют «аффинную стоимость пропуска», которая запрашивает относительно высокую стоимость за открытие пропуска и меньший штраф за каждый последующий остаток в пропуске. Это является наиболее распространенной системой оценки пропусков. Высокие штрафы за пропуски могут, разумеется, приводить к оптимизированному выравниванию с меньшим количеством пропусков. Большинство программ для выравнивания позволяют модификацию штрафов за пропуски. Однако является предпочтительным использование значений по умолчанию при использовании такого программного обеспечения для сравнения последовательностей. Например, при использовании пакета GCG Wisconsin Bestfit, штраф за пропуск по умолчанию для аминокислотных последовательностей составляет -12 за открытие пропуска и -4 за каждое продление.

[00280] Расчет максимального % гомологии, таким образом сначала требует получение оптимального выравнивания, принимающего во внимание штрафы за пропуски. Пригодной компьютерной программой для проведения такого выравнивания является пакет GCG Wisconsin Bestfit (Devereux et al., 1984 Nuc. Acids Research 12 p387). Примеры другого программного обеспечения, которое может проводить сравнение последовательностей, включают, но без ограничения, пакет BLAST (см. Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed.--Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410) и набор инструментов сравнения GENEWORKS. Как BLAST, так и FASTA, являются доступными для поиска в режиме офлайн и онлайн (см. Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 to 7-60). Однако для некоторых применений, предпочтительным является использование программы GCG Bestfit. Новый инструмент, называемый BLAST 2 Sequences, также является доступным для сравнения белковых и нуклеотидных последовательности (см. FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 и вебсайт Национального центра биотехнологической информации на вебсайте Национального института здравоохранения).

[00281] Хотя конечный % гомологии можно измерять в отношении идентичности, сам способ выравнивания, как правило, не основан на попарном сравнении по принципу «все или ничего». Вместо этого, как правило, используют масштабированную матрицу баллов сходства, приписывающую баллы каждому попарному сравнению на основании химического сходства или эволюционного расстояния. Примером такой общепринятой матрицы является матрица BLOSUM62 матрица по умолчанию для пакета программ BLAST. В программе GCG Wisconsin, как правило, используют либо общедоступные значения по умолчанию, либо пользовательскую таблицу сравнения символов, если она входит в поставку (см. руководство пользователя применительно к дополнительным деталям). Для некоторых применений, предпочтительным является использование общедоступных значений по умолчанию для пакета GCG, или, в случае другого программного обеспечения, матрицы по умолчанию, такой как BLOSUM62.

[00282] Альтернативно, проценты гомологии можно рассчитывать с использованием функции множественного выравнивания в DNASIS™ (Hitachi Software), на основании алгоритма, аналогичного CLUSTAL (Higgins D G & Sharp P M (1988), Gene 73(1), 237-244). После получения оптимального выравнивания посредством программного обеспечения, можно рассчитывать % гомологии, предпочтительно, % идентичности последовательности. Программное обеспечение как правило, осуществляет это в качестве части сравнения последовательностей и получает числовой результат.

[00283] Последовательности могут иметь также делеции, вставки или замены аминокислотных остатков, образующие молчащую замену и приводящие к функционально эквивалентному веществу. Намеренные аминокислотные замены можно осуществлять на основе сходства свойств аминокислот (например, полярности, заряда, растворимости, гидрофобности, гидрофильности, и/или амфипатической природы остатков) и, таким образом, это можно использовать для группировки аминокислот в функциональные группы. Аминокислоты можно группировать на основании только свойств их боковых цепей. Однако, более полезно включать также данные о мутациях. Выведенные таким образом группы аминокислот, вероятно, являются консервативными по структурным признакам. Эти группы могут быть описаны в форме диаграммы Венна (Livingstone C. D. and Barton G. J. (1993) «Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation» Comput. Appl. Biosci. 9: 745-756) (Taylor W. R. (1986) «The classification of amino acid conservation» J. Theor. Biol. 119; 205-218). Консервативные замены можно осуществлять, например, в соответствии с таблицей ниже, описывающей общепринятую группировку аминокислот по диаграмме Венна.

[00284] Варианты осуществления изобретения включают последовательности (полинуклеотидные или полипептидные), которые могут содержать гомологичную замену (как замещение, так и замену используют в настоящем описании для обозначения замены существующего аминокислотного остатка или нуклеотида на альтернативный остаток или нуклеотид), которая может происходить, т.е., замену подобной на подобную в случае аминокислот, например, основной на основную, кислой на кислую, полярной на полярную и т.д. Может происходить также негомологичная замена т.е., одного класса остатка на другой, или, альтернативно, вовлекающая включение неприродных аминокислот, таких как орнитин (далее в настоящем описании обозначенный как Z), диаминомасляная кислота-орнитин (далее в настоящем описании обозначенная как B), норлейцин-орнитин (далее в настоящем описании обозначенный как O), пиридилаланин, тиенилаланин, нафтилаланин и фенилглицин.

[00285] Варианты аминокислотных последовательностей могут содержать подходящие спейсерные группы, которые можно вставлять между любыми двумя аминокислотными остатками в последовательности, включая алкильные группы, такие как метильные, этильные или пропильные группы в дополнение к аминокислотным спейсерам, таким как остатки глицина или бета-аланина остатки. Дополнительная форма варианта, включающая присутствие одного или нескольких аминокислотных остатков в пептоидной форме, хорошо известна специалисту в данной области. Чтобы избежать неопределенности, «пептоидную форму» используют для обозначения вариантов аминокислотных остатков, где замещающая группа альфа-углерода находится на атоме азота остатка, а не на атоме альфа-углерода. Способы получения пептидов в пептоидной форме известны в данной области, например, Simon R J et al., PNAS (1992) 89(20), 9367-9371 и Horwell D C, Trends Biotechnol. (1995) 13(4), 132-134.

[00286] В практическом осуществлении настоящего изобретения используют, если не указано иначе, общепринятые способы иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и рекомбинантной ДНК, находящиеся в компетенции специалиста в данной области. См. Green and Sambrook, (Molecular Cloning: A Laboratory Manual. 4th, ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2014); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (2017)); Short Protocols in Molecular Biology, (Ausubel et al., 1999)); серии METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M. J. MacPherson, B. D. Hames and G. R. Taylor eds. (1995)), ANTIBODIES, A LABORATORY MANUAL, SECOND EDITION (Harlow and Lane, eds. (2014) и Culture of Animal Cells: A Manual of Basic Technique, 7th EditioN (R. I. Freshney, ed. (2016)).

ПРИМЕРЫ

[00287] Следующие примеры приведены с целью иллюстрации различных вариантов осуществления изобретения и не предназначены для ограничения настоящего изобретения никаким образом. Настоящие примеры, вместе со способами, описанными в настоящем описании, являются в настоящее время репрезентативными для предпочтительных вариантов осуществления, являются иллюстративными, и не предназначены для ограничения объема изобретения. Их изменения и другие применения, включенные в объем изобретения, как определено объемом формулы изобретения, могут быть предложены специалистом в данной области.

Пример 1. Направляемые нуклеиновыми кислотами нуклеазы

[00288] Последовательности двадцати направляемых нуклеиновой кислотой нуклеаз, названных MAD1-MAD20 (SEQ ID NO 1-20), выравнивали и сравнивали с другими направляемыми нуклеиновыми кислотами нуклеазами. Частичное выравнивание специфических аминокислот нуклеаз и филогенетическое древо показаны на фигуре 1A и фигуре 1B, соответственно. Ключевые остатки, которые могут быть вовлечены в узнавание участка PAM, показаны на фигуре 1A. Они включают аминокислоты в положениях 167, 539, 548, 599, 603, 604, 605, 606, и 607.

[00289] Выравнивания последовательностей строили с использованием PSI-BLAST для поиска гомологов нуклеазы MAD в неизбыточных базах данных NCBI. Множественные выравнивания последовательностей дополнительно уточняли с использованием алгоритма выравнивания MUSCLE с установками по умолчанию, как воплощено в Geneious 10. Процент идентичности каждого гомолога с эталонными последовательностями SpCas9 и AsCpf1 рассчитывали на основании совпадения при попарном выравнивании из этих глобальных выравниваний.

[00290] Геномные источники последовательностей идентифицировали с использованием информации о сцеплении в Uniprot или поисков TBLASTN в NCBI с использованием параметров по умолчанию и поиска всех возможных рамок считывания для трансляционных совпадений.

[00291] Проценты идентичности of MAD1-8 и 10-12 с различными другими нуклеазами обобщены в таблице 1. Эти проценты идентичности представляют собой идентичность аминокислотной последовательности, разделяемую указанными белками.

Таблица 1

Идентификатор или номер доступа для белка MAD1 MAD2 MAD3 MAD4 MAD5 MAD6 MAD7 MAD8 MAD10 MAD11 MAD12
gi|1025734861|pdb|5B43|A 6,4 32,8 33,2 29,7 29,4 31,1 30,3 31,7 26,7 27,9 98,8
gi|1052245173|pdb|5KK5|A 6,4 32,7 33,1 29,7 29,3 31 30,3 31,7 26,7 27,8 98,7
gi|1086216683|emb|SDC16215.1| 6,1 33 34,4 29,6 30,1 33,5 32,3 32,1 26,2 27,2 46,8
gi|1120175333|ref|WP_073043853.1| 5,9 30,9 37,2 32,8 33,6 34,4 35,7 35,1 26,3 28,3 34,9
Cpf1.Sj |WP_081839471 6,6 33,6 41,7 37,2 33,4 37,6 40,1 37,7 29,1 30,3 34,1
Cpf1.Ss|KFO67989 6,9 32,3 35,7 43 33,7 45,9 34,8 48 33,2 33,4 33,8
MAD3 5,8 31 100 32,9 35,9 35 35,6 34,3 28 27,6 33,1
gi|1082474576|gb|OFY19591.1| 7 31,4 35,9 43,2 31,4 45 33,6 48,6 30,8 33,5 33
MAD2 6,1 100 31 30,7 30,2 31 31,2 31,2 25,8 27,7 32,6
Cpf1.Lb5|WP_016301126 7,8 32,8 36,5 38,2 34,2 45,5 35,8 43,6 30,7 35,7 32,5
gi|1088286736|gb|OHB41002.1| 6,7 30,6 35,3 42,4 33,2 44,7 32,1 46,8 30,7 32,6 32,4
gi|1094423310|emb|SER03894.1| 6,8 30,8 36,1 40,4 31,8 50,4 35,2 46,6 30,4 36,8 32,3
gi|493326531|ref|WP_006283774.1| 6,8 30,8 36,1 40,3 31,8 50,3 35,1 46,6 30,4 36,8 32,3
MAD8 7,6 31,2 34,3 40,4 32 41,6 32,8 100 30,1 32,1 31,7
Cpf1.Bot|WP_009217842 6,9 30,1 36,6 41,5 32,5 50,2 35,4 45,5 29,8 34,1 31,6
Cpf1.Li|WP_020988726 7,3 30,2 34,6 39,3 30,3 40,7 31,8 39,4 32,1 31,3 31,5
Cpf1.Pb|WP_044110123 6,3 31,4 31,8 36,1 30,8 45,7 30,4 39,4 27,7 33,5 31,5
gi|817911372|gb|AKG08867.1| 7,3 29,8 35 40,7 32,1 40,3 32,6 41,7 29,1 31 31,4
gi|1052838533|emb|SCH45297.1| 6,6 30,8 35,5 32 31,5 34,4 51,9 33,4 26,1 29 31,3
gi|1053713332|ref|WP_066040075.1| 7,2 29,6 33,2 39,6 29,8 49,1 32,2 41,4 30,1 32,4 31,3
gi|817909002|gb|AKG06878.1| 7,3 29,8 35 40,7 32 40,3 32,5 41,6 29,1 30,9 31,3
gi|1042201477|ref|WP_065256572.1| 7,2 29,5 35,2 40,6 31,9 40,1 32,7 41,6 29 30,8 31,2
MAD6 7,5 31 35 38,9 33,1 100 34,3 41,6 30,5 33,6 31
gi|490468773|ref|WP_004339290.1| 6,8 31,8 31,7 36,2 28,6 36,5 31,4 38,4 28,5 31,4 31
gi|565853704|ref|WP_023936172.1| 7,5 30,8 34,9 38,9 33,1 99,7 34,1 41,6 30,4 33,6 31
gi|739005707|ref|WP_036887416.1| 7,5 30,9 35 38,9 33 99,9 34,2 41,5 30,4 33,5 31
gi|739008549|ref|WP_036890108.1| 7,5 31 35 38,8 33 99,8 34,2 41,5 30,4 33,5 31
Cpf1.Ft|WP_014550095 7,1 31,9 33,8 40,3 29,7 39,4 34,1 41 29,8 32,5 30,8
gi|504362993|ref|WP_014550095.1| 7,2 32,4 33,8 40,3 29,6 39,4 33,8 40,9 30,1 32,5 30,8
gi|640557447|ref|WP_024988992.1| 6,6 31,4 34,8 40,7 31,2 48 34,1 45,1 28,8 35,2 30,8
gi|1098944113|ref|WP_071304624.1| 7,1 32,3 33,5 40,3 29,6 39,2 33,8 40,9 30,1 32,5 30,6
gi|489124848|ref|WP_003034647.1| 7,1 32,3 33,9 40,9 29,9 39,2 33,9 40,9 29,9 32,2 30,6
gi|738967776|ref|WP_036851563.1| 6,8 29,4 33,1 35,5 28,9 40,3 30,7 35,9 28,7 31,3 30,5
MAD7 5,9 31,2 35,6 30,8 33,9 34,3 100 32,8 24,2 28,9 30,5
Cpf1.Lb6|WP_044910713 6,7 29,8 33,7 36,6 30,9 43 34 39,8 29,1 32,1 30,4
gi|1052961977|emb|SCH47915.1| 5,5 30,5 35,8 32,3 34 35 53,8 33,4 26,2 27,4 30,4
gi|817918353|gb|AKG14689.1| 7 29,1 34,4 39,8 31,7 40 32,4 41,1 28,4 30,1 30,3
gi|917059416|ref|WP_051666128.1| 6,9 29,9 31,5 35,7 31,6 41,8 32,9 39,1 30,1 34 30,2
gi|1011649201|ref|WP_062499108.1| 6,8 29 34,7 40,3 31,4 40,1 33,1 41,6 28,5 30,4 30,1
Cpf1.Pm|WP_018359861 6,3 29,2 32,3 34,2 27,4 38,7 29,4 35 27,2 30,1 30
gi|817922537|gb|AKG18099.1| 6,8 29,1 34,5 39,6 31,5 39,9 32,7 40,7 28,3 29,8 30
gi|769142322|ref|WP_044919442.1| 6,7 31 34,6 37,8 31,5 41,4 33,3 39,2 28 31,9 29,9
gi|1023176441|pdb|5ID6|A 6,7 29,7 31,3 35,5 31,3 41 32,6 38,5 29,7 33,3 29,8
gi|491540987|ref|WP_005398606.1| 5,9 28,3 30,4 29,7 28,5 29 30,7 29,8 25,8 27,8 29,8
gi|652820612|ref|WP_027109509.1| 6,4 31,1 34 35,3 31,7 40,3 33,4 37,5 28,5 33,3 29,8
gi|502240446|ref|WP_012739647.1| 5,9 31,6 36,1 31,2 33 35,4 49,4 34 26,6 29,4 29,7
gi|524278046|emb|CDA41776.1| 5,8 31,6 36 31 33 35,4 50 34 26,6 29,5 29,7
gi|737831580|ref|WP_035798880.1| 6,2 31,3 34,8 38,1 31,5 42,1 33 39,6 28,4 32,4 29,7
gi|909652572|ref|WP_049895985.1| 6,9 30,7 34,2 37,2 30,8 41,5 34,2 38,7 28 32 29,7
MAD4 6,7 30,7 32,9 100 30,7 38,9 30,8 40,4 28,8 29,4 29,7
gi|942073049|ref|WP_055286279.1| 5,9 31,6 36,1 31,1 32,7 35 49,7 33,9 27,1 29,5 29,6
gi|654794505|ref|WP_028248456.1| 7,4 30,5 35,9 37,4 31,3 42,8 34,2 40,2 27,9 33,5 29,5
gi|933014786|emb|CUO47728.1| 5,6 31,3 34,9 31,2 31,5 32,4 46,7 30,6 25,4 27,7 29,4
gi|941887450|ref|WP_055224182.1| 5,6 31,4 35 31,3 31,6 32,5 46,6 30,7 25,3 27,8 29,4
gi|920071674|ref|WP_052943011.1| 6,3 31 31,8 38,8 31,8 41,3 33,8 42,6 29,8 34,7 29
MAD5 5,1 30,2 35,9 30,7 100 33,1 33,9 32 24,3 28,7 29
gi|1081462674|emb|SCZ76797.1| 6,9 30,4 33,5 34,7 29,7 40,1 30,5 37,4 27,3 32,5 28,9
gi|918722523|ref|WP_052585281.1| 7,4 27,5 30,5 35,7 28,3 35,2 28,5 36 26 27,1 28,8
gi|524816323|emb|CDF09621.1| 6,2 30 34,1 29,3 31,2 32,7 47,6 32,2 25,5 25,9 28,4
gi|941782328|ref|WP_055176369.1| 6,2 30,2 33,1 28,9 30,9 32 46,9 32,1 26 27,1 28,4
gi|942113296|ref|WP_055306762.1| 6,4 29,8 33,8 29,7 31,3 33,1 48 32,5 25,8 26,2 28,4
MAD11 6,4 27,7 27,6 29,4 28,7 33,6 28,9 32,1 26,2 100 27,8
gi|653158548|ref|WP_027407524.1| 5,9 26,4 28,1 33,5 27,4 32,5 27,8 32 27 26,8 27,6
gi|652963004|ref|WP_027216152.1| 6,6 30,3 32,5 33,2 30,4 38,2 29,6 34,6 25,9 30,5 27,2
gi|1083069650|gb|OGD68774.1| 6,2 25 24,3 26,6 23,1 28,1 23,2 26,4 45 24,9 27,1
gi|302483275|gb|EFL46285.1| 5,6 24,7 26,8 30,3 24,9 34,8 26 30,4 24,4 27,5 27,1
gi|915400855|ref|WP_050786240.1| 5,6 24,7 26,8 30,3 24,9 34,8 26 30,4 24,4 27,5 27,1
MAD10 5,6 25,8 28 28,8 24,3 30,5 24,2 30,1 100 26,2 26,6
gi|1101117967|gb|OIO75780.1| 6,1 26,8 26 27,3 24,3 28,1 24,4 28,2 44,1 25,4 26,1
gi|1088204458|gb|OHA63117.1| 6,5 25,2 23,5 25,8 22,9 27 22 26,1 36,5 24,2 24,7
gi|809198071|ref|WP_046328599.1| 4,9 25,6 26,5 22,2 23,9 23,8 25,8 23,9 20,3 25,1 24
gi|1088079929|gb|OGZ45678.1| 5,6 21,9 23,8 26,9 23,4 27,8 23,3 26,7 28,8 24,7 23,5
gi|1101053499|gb|OIO15737.1| 5,9 23,1 26,2 25,2 23 26,4 25,1 26,5 29,2 23,2 23,4
gi|1101058058|gb|OIO19978.1| 5,4 21,2 22,8 23,6 20,6 25 20,7 25 25,9 22,2 23
gi|1088000848|gb|OGY73485.1| 5,7 23,5 25,2 25,5 23,9 27 25,1 25,6 31,6 23,6 22,9
gi|407014433|gb|EKE28449.1| 5,2 23,5 25,9 26,7 24,3 25,8 23 27,8 29,9 25,3 22,9
gi|818249855|gb|KKP36646.1| 6 21 20,7 23,5 20 24,2 21 24 24,6 21,8 22,6
gi|818703647|gb|KKT48220.1| 5,8 23,3 25 25,1 23,5 26,5 24,7 25,3 31,2 23,3 22,6
gi|818705786|gb|KKT50231.1| 5,8 23,1 24,6 24,7 22,9 26,2 24,2 24,8 30,8 22,9 22,2
gi|1083950632|gb|OGJ66851.1| 4,5 20 22,1 23,5 20,6 24,6 20 24 23,5 20,7 22,1
gi|1083932199|gb|OGJ49885.1| 6 20,4 20,2 22,6 19,3 23,3 20,6 23,2 23,9 21 21,8
gi|1083410735|gb|OGF20863.1| 5 21,7 23,3 25,5 23 25 22,7 25,9 27,2 22,4 21,5
gi|1011480927|ref|WP_062376669.1| 4,7 20,1 20,1 21,4 19,3 23,3 21,4 22 20,2 19,7 20,9
gi|818539593|gb|KKR91555.1| 5,1 19,8 21,6 22,1 20,5 22,9 21,2 22,8 24 20,5 19,9
gi|503048015|ref|WP_013282991.1| 5,1 18,8 20,7 15,3 19,7 18,9 19,3 17,7 15,9 19 19,2
gi|1096232746|ref|WP_071177645.1| 5 19,1 20,5 17,4 20,1 19,7 20,4 20,4 17,5 18,5 18,9
gi|769130404|ref|WP_044910712.1| 4,6 19,4 18,2 16,1 18,1 17,1 18,7 17,9 14,5 16,8 17,5
gi|1085569500|gb|OGX23684.1| 2,6 11,6 12,1 12,7 10,2 12,1 12,7 11,6 10,9 11,1 10,5
gi|818357062|gb|KKQ38176.1| 3,3 10 11,1 10,6 11,1 11,8 12,1 11,5 12,2 10,8 9,8
gi|745626763|gb|KIE18642.1| 3,7 9,4 11,7 11,1 11,1 12,5 11,9 11,9 10,2 10,6 8,8
MAD1 100 6,1 5,8 6,7 5,1 7,5 5,9 7,6 5,6 6,4 6,4
SpCas9 4 6,3 6,5 8,3 5,6 8,1 6,9 7,7 6,9 6,3 6,3
MAD12 6,4 32,6 33,1 29,7 29 31 30,5 31,7 26,6 27,8 100

Пример 2: Экспрессия нуклеаз MAD

[00292] Последовательности нуклеиновых кислот дикого типа для MAD1-MAD20 включают SEQ ID NO 21-40, соответственно. Эти нуклеазы MAD подвергали оптимизации кодонного состава для экспрессии in E. coli, и последовательности с оптимизированным кодонным составом перечислены как SEQ ID NO: 41-60 (обобщены в таблице 2).

[00293] Эти MAD1-MAD20 с оптимизированным кодонным составом клонировали в экспрессирующую конструкцию, содержащую конститутивный или индуцируемый промотор (например, промотор proB, SEQ ID NO: 83, или промотор pBAD, SEQ ID NO: 81 или SEQ ID NO: 82) и, необязательно, метку 6X-His (SEQ ID NO: 376) (например, фигура 2). Полученные экспрессирующие конструкции MAD1-MAD20 представлены как SEQ ID NO: 61-80, соответственно. Экспрессирующие конструкции, как показано на фигуре 2, получали либо посредством клонирования на основе рестрикции/лигирования, либо посредством клонирования на основе гомологии.

Пример 3. Тестирование последовательностей направляющих нуклеиновых кислот, совместимых с нуклеазами MAD

[00294] Направляемая нуклеиновой кислотой нуклеаза и совместимая направляющая нуклеиновая кислота необходимы для получения функционального комплекса способной к нацеливанию нуклеазы. Множество способов принято для определения последовательности совместимой направляющей нуклеиновой кислоты, и конкретно, каркасной части последовательности направляющей нуклеиновой кислоты. Во-первых, эндогенные локусы каждой нуклеазы MAD сканировали по потенциальным каркасным последовательностям. В некоторых случаях, например, для MAD2, не обнаружили эндогенной каркасная последовательность. Таким образом, тестировали совместимость MAD2 с каркасными последовательностями, обнаруженными рядом с эндогенными локусами других нуклеаз MAD. Нуклеазы MAD и соответствующие эндогенные каркасные последовательности, которые тестировали, перечислены в таблице 2.

Таблица 2

Нуклеаза MAD Последовательность нуклеиновой кислоты WT Последовательность нуклеиновой кислоты с оптимизированным для E. Coli кодонным составом Аминокислотная последовательность Эндогенная каркасная последовательность для направляющей нуклеиновой кислоты
MAD1 SEQ ID NO: 21 SEQ ID NO: 41 SEQ ID NO: 1 SEQ ID NO: 84
MAD2 SEQ ID NO: 22 SEQ ID NO: 42 SEQ ID NO: 2 None identified
MAD3 SEQ ID NO: 23 SEQ ID NO: 43 SEQ ID NO: 3 SEQ ID NO: 86
MAD4 SEQ ID NO: 24 SEQ ID NO: 44 SEQ ID NO: 4 SEQ ID NO: 87
MAD5 SEQ ID NO: 25 SEQ ID NO: 45 SEQ ID NO: 5 SEQ ID NO: 88
MAD6 SEQ ID NO: 26 SEQ ID NO: 46 SEQ ID NO: 6 SEQ ID NO: 89
MAD7 SEQ ID NO: 27 SEQ ID NO: 47 SEQ ID NO: 7 SEQ ID NO: 90
MAD8 SEQ ID NO: 28 SEQ ID NO: 48 SEQ ID NO: 8 SEQ ID NO: 91
MAD9 SEQ ID NO: 29 SEQ ID NO: 49 SEQ ID NO: 9 SEQ ID NO: 92; SEQ ID NO: 103; SEQ ID NO: 106
MAD10 SEQ ID NO: 30 SEQ ID NO: 50 SEQ ID NO: 10 SEQ ID NO: 93
MAD11 SEQ ID NO: 31 SEQ ID NO: 51 SEQ ID NO: 11 SEQ ID NO: 94
MAD12 SEQ ID NO: 32 SEQ ID NO: 52 SEQ ID NO: 12 SEQ ID NO: 95
MAD13 SEQ ID NO: 33 SEQ ID NO: 53 SEQ ID NO: 13 SEQ ID NO: 96; SEQ ID NO: 105; SEQ ID NO: 107
MAD14 SEQ ID NO: 34 SEQ ID NO: 54 SEQ ID NO: 14 SEQ ID NO: 97
MAD15 SEQ ID NO: 35 SEQ ID NO: 55 SEQ ID NO: 15 SEQ ID NO: 98
MAD16 SEQ ID NO: 36 SEQ ID NO: 56 SEQ ID NO: 16 SEQ ID NO: 99
MAD17 SEQ ID NO: 37 SEQ ID NO: 57 SEQ ID NO: 17 SEQ ID NO: 100
MAD18 SEQ ID NO: 38 SEQ ID NO: 58 SEQ ID NO: 18 SEQ ID NO: 101
MAD19 SEQ ID NO: 39 SEQ ID NO: 59 SEQ ID NO: 19 SEQ ID NO: 102
MAD20 SEQ ID NO: 40 SEQ ID NO: 60 SEQ ID NO: 20 SEQ ID NO: 103

[00295] Редактирующие кассеты, как показано на фигуре 3, получали для оценки функциональности нуклеаз MAD и соответствующих направляющих нуклеиновых кислот. Каждая редактирующая кассета содержит редактирующую последовательность и промотор, функционально связанные с кодированной направляющей нуклеиновой кислотой. Редактирующие кассеты дополнительно содержат участки для праймеров (P1 и P2) на фланкирующих концах. Направляющие нуклеиновые кислоты содержали различные каркасные последовательности, подлежащие тестированию, так же как направляющую последовательность, чтобы направлять нуклеазу MAD на последовательность-мишень для редактирования. Редактирующие последовательности содержали мутацию PAM и/или мутацию кодона по сравнению с последовательностью-мишенью. Мутации были фланкированы областями гомологии (плечами гомологии или HA), которые могут позволять рекомбинацию в расщепленную последовательность-мишень.

[00296] На фигуре 4 изображен эксперимент, разработанный для тестирования различных комбинаций нуклеазы MAD и направляющей нуклеиновой кислоты. Экспрессирующую кассету, кодирующую нуклеазу MAD, добавляли к клеткам-хозяевам вместе с различными редактирующими кассетами, как описано выше. В этом примере, направляющие нуклеиновые кислоты разрабатывали для нацеливания на ген galK в клетке-хозяине, и редактирующую последовательность разрабатывали для мутагенеза гена galK после нацеливания, чтобы выключить ген, таким образом, позволяя скрининг успешно редактированных клеток. Этот дизайн использовали для идентификации функциональных или совместимых комбинаций нуклеазы MAD и направляющей нуклеиновой кислоты. Эффективность редактирования определяли посредством qПЦР для измерения редактирующей плазмиды в восстановившихся клетках высокопроизводительным способом. Подтверждение специфичности праймеров для MAD11 и Cas9 показано на фигурах 14A и 14B. Эти результаты показывают, что выбранные пары праймеров являются ортогональными и позволяют количественное измерение входной плазмидной ДНК.

[00297] Фигуры 5A-5B представляют собой изображение эксперимента со сходным дизайном эксперимента. В этом случае, редактирующая кассета (фигура 5B) дополнительно содержит селективный маркер, в этом случае, ген устойчивости к канамицину (kan), и экспрессирующий нуклеазу MAD вектор (фигура 5A) дополнительно содержит селективный маркер, в этом случае, ген устойчивости к хлорамфениколу (Cm), и систему рекомбинации лямбда RED для облегчения гомологичной рекомбинации (HR) редактирующей последовательности в последовательность-мишень. Совместимая комбинация нуклеазы MAD и направляющей нуклеиновой кислоты может вызывать двухцепочечный разрыв в последовательности-мишени, если присутствует последовательность PAM. Поскольку редактирующая последовательность (например, фигура 3) содержит мутацию PAM, не узнаваемую нуклеазой MAD, редактированные клетки, содержащие мутацию PAM, переживают расщепление нуклеазой MAD, в то время как нередактированные клетки дикого типа погибают (фигура 5C). Редактирующая последовательность дополнительно содержит мутацию в гене galK, позволяющую скрининг редактированных клеток, в то время как экспрессирующий нуклеазу MAD вектор и редактирующая кассета содержат селективные маркеры устойчивости к лекарственному средству, позволяющие отбор редактированных клеток.

[00298] С использованием этих способов, тестировали совместимых направляющие нуклеиновые кислоты для MAD1-MAD20. Тестировали двадцать каркасных последовательностей. Направляющие нуклеиновые кислоты, использованные в экспериментах, содержали одну из двадцати каркасных последовательностей, обозначенных как каркас-1, каркас-2 и т.д., и направляющую последовательность, нацеленную на ген galK. Последовательности для каркаса-1 - каркаса-20 перечислены как SEQ ID NO: 84-103, соответственно. Следует понимать, что направляющая последовательность направляющей нуклеиновой кислоты является изменчивой, и ее можно конструировать или разрабатывать для нацеливания на любую желательную последовательность-мишень, как будет очевидно специалисту в данной области после прочтения этого описания. Поскольку MAD2 не имеет эндогенной каркасной последовательности для тестирования, тестировали каркасную последовательность из нуклеазы с близкой гомологией (каркас-2, SEQ ID NO: 85), и обнаружили, что она является нефункциональной, что означает, что MAD2 и каркас-2 являются несовместимыми. Таким образом, MAD2 тестировали с девятнадцатью другими каркасными последовательностями, несмотря на низкую гомологию последовательности между MAD2 и другими нуклеазами MAD.

[00299] Этот технологический процесс использовали также для идентификации или тестирования последовательностей PAM, совместимых с данной нуклеазой MAD. Другой способ идентификации участка PAM описан в следующем примере.

[00300] Как правило, для описанных анализов, трансформации проводили следующим образом. Штаммы E. coli, экспрессирующие нуклеазы MAD с оптимизированным кодонным составом, выращивали в течение ночи. Насыщенные культуры разводили 1/100 и выращивали до OD600 0,6, и индуцировали посредством добавления арабинозы в документированной концентрации 0,4% и (если использовали термочувствительную плазмиду) переноса культуры в водяную баню с качанием при 42 градусах Цельсия. После индукции, клетки охлаждали на льду в течение 15 мин перед трехкратной промывкой с использованием 1/4 исходного объема культуры, с использованием 10% глицерина (например, промывка в 50 мл для 200 мл культуры). Клетки ресуспендировали в 1/100 исходного объема (например, 2 мл для 200 мл культуры) и хранили при -90 градусах Цельсия до готовности к использованию. Для проведения скринингов совместимости и эффективности редактирования, описанных в настоящем описании, с использованием 50 нг редактирующей кассеты трансформировали аликвоты клеток посредством электропорации. После электропорации, клетки восстанавливали в LB в течение 3 часов, и 100 мкл клеток рассевали на чашки МакКонки, содержащие 1% галактозу.

[00301] Эффективность редактирования определяли посредством деления количества белых колоний (редактированных клеток) на общее количество белых и красных колоний (редактированных и нередактированных клеток).

Пример 4. Анализ выбора PAM

[00302] Для получения двухцепочечного разрыва в последовательности-мишени, направляющая нуклеиновая кислота должна гибридизоваться с последовательностью-мишенью, и нуклеаза MAD должна узнавать последовательность PAM, смежную с последовательностью-мишенью. Если направляющая нуклеиновая кислота гибридизуется с последовательностью-мишенью, но нуклеаза MAD не узнает участок PAM, тогда расщепления не происходит.

[00303] PAM является специфическим для нуклеазы MAD, и не все нуклеазы обязательно MAD узнают одинаковый PAM. Для оценки требований участка PAM к нуклеазам MAD, проводили анализ, как показано на фигурах 6A-6C.

[00304] На фигуре 6A изображен экспрессирующий нуклеазу MAD вектор, как описано в другом месте, который содержит также ген устойчивости к хлорамфениколу и систему рекомбинации лямбда RED.

[00305] На фигуре 6B изображена самонацеленная редактирующая кассета. Направляющая нуклеиновая кислота разработана для нацеливания на последовательность-мишень, которая содержится в той же самой молекуле нуклеиновой кислоты. Последовательность-мишень фланкирована случайными нуклеотидами, показанными посредством N4, обозначающих четыре случайных нуклеотида на каждом конце последовательности-мишени. Следует понимать, что можно использовать также любое количество случайных нуклеотидов (например, 3, 5, 6, 7, 8 и т.д.). случайные нуклеотиды служат в качестве библиотеки потенциальных PAM.

[00306] На фигуре 6C изображен дизайн эксперимента. В сущности, экспрессирующим нуклеазу MAD вектором и редактирующей кассетой, содержащей случайные участки PAM, трансформировали клетку-хозяина. Если формировался функциональный комплекс способной к нацеливанию нуклеазы и нуклеаза MAD узнавала участок PAM, тогда вектор с редактирующей кассетой расщеплялся, и это приводило к гибели клетки. Если функциональный поддающийся нацеливанию комплекс не формировался или если нуклеаза MAD не узнавала PAM, тогда последовательность-мишень не расщеплялась, и клетка выживала. Способы детекции (например, секвенирование нового поколения (NGS)) использовали для последовательностей исходной и конечной популяций клеток для определения того, какие участки PAM являлись узнаваемыми данной нуклеазой MAD. Эти узнаваемые участки PAM затем использовали для определения консенсусного или неконсенсусного PAM для данной нуклеазы MAD.

[00307] Определили, что консенсусный PAM для MAD1-MAD8 и MAD10-MAD12 представляет собой TTTN. Определили, что консенсусный PAM для MAD9 представляет собой NNG. Определили, что консенсусный PAM для MAD13-MAD15 представляет собой TTN. Определили, что консенсусный PAM для MAD16-MAD18 представляет собой TA. Определили, что консенсусный PAM для MAD19-MAD20 представляет собой TTCN.

Пример 5: Тестирование гетерологичных направляющих нуклеиновых кислот

[00308] Эффективность редактирования тестирована для MAD1, MAD2 и MAD7, и показана на фигуре 7. Детали эксперимента и эффективность редактирования обобщены в таблице 3. Эффективность редактирования определяли посредством деления количества редактированных клеток на общее количество выделенных клеток. Различные редактирующие кассеты, нацеленные на ген galK, использовали для обеспечения скрининга редактируемых клеток. Направляющие нуклеиновые кислоты, кодировали в редактирующей кассете, содержащей направляющую последовательность, нацеленную на ген galK, и одну из различных каркасных последовательностей, для тестирования совместимости указанной нуклеазы MAD с указанной каркасной последовательностью, как обобщено в таблице 3.

[00309] Наблюдали, что эффективность редактирования для совместимых нуклеазы MAD и направляющих нуклеиновых кислот (содержащих указанные каркасные последовательности), составляла между 75-100% эффективность редактирования. MAD2 имела эффективность редактирования между 75-100%, и MAD7 имела эффективность редактирования между 97-100%.

[00310] Для MAD2 в комбинации с каркасом-1, каркасом-2, каркасом-4 или каркасом-13 в этих экспериментах получили эффективность редактирования 0%. Эти данные подразумевают, что MAD2 не формировала функциональный комплекс с этими тестированными направляющими нуклеиновыми кислотами, и что MAD2 является несовместимой с этими каркасными последовательностями. Для MAD7 в комбинации с каркасом-1, каркасом-2, каркасом-4 или каркасом-13 в этих экспериментах получили эффективность редактирования 0%. Эти данные подразумевают, что MAD7 не формировала функциональный комплекс с этими тестированными направляющими нуклеиновыми кислотами, и что MAD7 является несовместимой с этими каркасными последовательностями. Таким образом, направляющие нуклеиновые кислоты, которые можно использовать в системах и способах по настоящему описанию, можно идентифицировать с использованием эмпирических данных, и это может требовать от специалиста в данной области приемлемого экспериментирования с использованием способов, объясняемых в настоящем описании

[00311] Для MAD1, для всех тестированных комбинаций направляющих нуклеиновых кислот получили эффективность редактирования 0%, что подразумевает, что MAD1 не формировала функциональный комплекс ни с какой из тестированных направляющих нуклеиновых кислот. Эти данные также подразумевают, что MAD1 является несовместимой с тестированными каркасными последовательностями.

[00312] Совместно, эти данные подчеркивают непредсказуемость обнаружения совместимых пар нуклеаза MAD и каркасная последовательность для формирования функционального комплекса способной к нацеливанию нуклеазы. Некоторые тестированные нуклеазы MAD не функционировали ни с одной из тестированных каркасных последовательностей. Некоторые тестированные нуклеазы MAD функционировали только с некоторыми тестированными каркасными последовательностями, а не с другими.

Таблица 3

# Направляемая нуклеиновой кислотой нуклеаза Каркасная последовательность направляющей нуклеиновой кислоты Мутация редактирующей последовательности Ген-мишень Эффективность редактирования
1 MAD1 Каркас-1; SEQ ID NO: 84 L80** galK 0%
2 MAD1 Каркас-2; SEQ ID NO: 85 Y145** galK 0%
3 MAD1 Каркас-4; SEQ ID NO: 87 Y145** galK 0%
4 MAD1 Каркас-10; SEQ ID NO: 93 Y145** galK 0%
5 MAD1 Каркас-11; SEQ ID NO: 94 L80** galK 0%
6 MAD1 Каркас-12; SEQ ID NO: 95 L10KpnI galK 0%
7 MAD1 Каркас-13; SEQ ID NO: 96 Y145** galK 0%
8 MAD1 Каркас-12; SEQ ID NO: 95 L10KpnI galK 0%
9 MAD2 Каркас-10; SEQ ID NO: 93 L80** galK 0%
10 MAD2 Каркас-10; SEQ ID NO: 93 Y145** galK 100%
11 MAD2 Каркас-11; SEQ ID NO: 94 L80** galK 98%
12 MAD2 Каркас-11; SEQ ID NO: 94 Y145** galK 99%
13 MAD2 Каркас-12; SEQ ID NO: 95 Y145** galK 98%
14 MAD2 Каркас-12; SEQ ID NO: 95 Y145** galK 0%
15 MAD2 Каркас-13; SEQ ID NO: 96 Y145** galK 0%
16 MAD2 Каркас-1; SEQ ID NO: 84 L80** galK 0%
17 MAD2 Каркас-2; SEQ ID NO: 85 Y145** galK 0%
18 MAD2 Каркас-2; SEQ ID NO: 85 Y145** galK 0%
19 MAD2 Каркас-4; SEQ ID NO: 87 Y145** galK 0%
20 MAD2 Каркас-5; SEQ ID NO: 88 L80** galK 99%
21 MAD2 Каркас-12; SEQ ID NO: 95 89** galK 0%
22 MAD2 Каркас-12; SEQ ID NO: 95 70** galK 75%
23 MAD2 Каркас-12; SEQ ID NO: 95 L10KpnI galK 79%
32 MAD7 Каркас-1; SEQ ID NO: 84 L80** galK 0%
33 MAD7 Каркас-2; SEQ ID NO: 85 Y145** galK 0%
34 MAD7 Каркас-4; SEQ ID NO: 87 Y145** galK 0%
35 MAD7 Каркас-10; SEQ ID NO: 93 Y145** galK 100%
36 MAD7 Каркас-11; SEQ ID NO: 94 L80** galK 97%
37 MAD7 Каркас-12; SEQ ID NO: 95 L10KpnI galK 0%
38 MAD7 Каркас-13; SEQ ID NO: 96 Y145** galK 0%
39 MAD7 Каркас-12; SEQ ID NO: 95 L10KpnI galK 0%

Пример 6. Оценка MAD2 и MAD7

[00313] Способность MAD2 и MAD7 функционировать с гетерологичными направляющими нуклеиновыми кислотами тестировали с использованием сходного дизайна эксперимента, как описано выше. Тестировали совместимость MAD2 с другими каркасными последовательностями, и результаты эксперимента показаны на фигуре 8. Нуклеазы MAD, каркасные последовательности направляющей нуклеиновой кислоты и редактирующие последовательности, использованные в этом эксперименте, обобщены в таблице 4.

[00314] Тестировали совместимость MAD7 с другими каркасными последовательностями, и результаты эксперимента показаны на фигуре 9. Нуклеазы MAD, каркасные последовательности направляющей нуклеиновой кислоты и редактирующие последовательности, использованные в этом эксперименте, обобщены в таблице 5.

Таблица 4

# Направляемая нуклеиновой кислотой нуклеаза Каркасная последовательность направляющей нуклеиновой кислоты Мутация редактирующей последовательности Ген-мишень
1 MAD2 Каркас-12; SEQ ID NO: 95 N89KpnI galK
2 MAD2 Каркас-10; SEQ ID NO: 93 L80** galK
3 MAD2 Каркас-5; SEQ ID NO: 88 L80** galK
4 MAD2 Каркас-12; SEQ ID NO: 95 D70KpnI galK
5 MAD2 Каркас-12; SEQ ID NO: 95 Y145** galK
6 MAD2 Каркас-11; SEQ ID NO: 94 Y145** galK
7 MAD2 Каркас-10; SEQ ID NO: 93 Y145** galK
8 MAD2 Каркас-12; SEQ ID NO: 95 L10KpnI galK
9 MAD2 Каркас-11; SEQ ID NO: 94 L80** galK
10 SpCas9 S. pyogenese гРНК Y145** galK
11 MAD2 Каркас-2; SEQ ID NO: 85 Y145** galK
12 MAD2 Каркас-4; SEQ ID NO: 87 Y145** galK
13 MAD2 Каркас-1; SEQ ID NO: 84 L80** galK
14 MAD2 Каркас-13; SEQ ID NO: 96 Y145** galK

Таблица 5

# Направляемая нуклеиновой кислотой нуклеаза Каркасная последовательность направляющей нуклеиновой кислоты Мутация редактирующей последовательности Ген-мишень
1 MAD7 Каркас-1; SEQ ID NO: 84 L80** galK
2 MAD7 Каркас-2; SEQ ID NO: 85 Y145** galK
3 MAD7 Каркас-4; SEQ ID NO: 87 Y145** galK
4 MAD7 Каркас-10; SEQ ID NO: 93 Y145** galK
5 MAD7 Каркас-11; SEQ ID NO: 95 L80** galK

[00315] В другом эксперименте, эффективность редактирования (фигура 10A) определяли посредством расчета соотношения редактированных колоний (белых колоний, редактированный ген galK) и общего количества колоний. Эффективность трансформации (фигура 10B) определяли посредством расчета общего количества выделенных клеток, по сравнению с исходным количеством клеток.

[00316] В этом примере (фигура 10A-10B), клетки, экспрессирующие galK, трансформировали с использованием экспрессирующих конструкций, экспрессирующих либо MAD2, либо MAD7, и соответствующей редактирующей кассеты, содержащей направляющую нуклеиновую кислоту, нацеленную на ген galK. Направляющая нуклеиновая кислота состояла из направляющей последовательности, нацеленной на ген galK, и последовательности каркаса-12 (SEQ ID NO: 95).

[00317] В описанном примере, MAD2 и MAD7 имели более низкую эффективность трансформации, по сравнению с Cas9 S. pyogenes, хотя эффективность редактирования MAD2 и MAD7 была немного выше, чем у Cas9 S. pyogenes.

[00318] Колонии из экспериментов редактирования выделяли, и репрезентативное количество подвергали NGS для определения присутствия редактирования. На фигуре 11 изображены результаты секвенирования для этих выбранных колоний, выделенных из анализа, описанного выше. Последовательность-мишень представляла собой кодирующую последовательность (CDS) galK. PAM TTTN показан как обратно комплементарная последовательность (дикого типа NAAA, мутантная NGAA). Мутации, на которые нацелена редактирующая последовательность, отмечены как кодоны-мишени. Изменения, по сравнению с последовательностью дикого типа, выделены. В этих экспериментах, использовали последовательность каркаса-12 (SEQ ID NO: 95). Направляющая последовательность из направляющей нуклеиновой кислоты была нацелена на ген galK.

[00319] Шесть из семи показанных последовательностей из эксперимента с MAD2 содержали сконструированную мутацию PAM и сконструированные мутации в кодонах-мишенях galK, где последовательность из одной колонии сохраняла PAM дикого типа и кодоны-мишени дикого типа, в то же время содержала также непреднамеренную мутацию выше участка-мишени.

[00320] Две из четырех показанных последовательностей из эксперимента с MAD7 содержали сконструированную мутацию PAM и мутантные кодоны-мишени. Одна колония содержала последовательность дикого типа, в то время как другая содержала делецию восьми нуклеотидов выше последовательности-мишени.

[00321] На фигуре 12 изображены результаты двух экспериментов, тестирующих способность отбора облегчать выделение редактированных клеток. В этом эксперименте, использовали нуклеаза MAD2 с направляющей нуклеиновой кислотой, содержащей последовательность каркаса-11, и направляющей последовательностью, нацеленной на galK. Редактирующая кассета содержала редактирующую последовательность, сконструированную для включения мутации L80** в galK, таким образом, обеспечения возможности скрининга редактированных клеток. В эксперименте 1, использовали нуклеазу MAD2 с направляющей нуклеиновой кислотой, содержащей последовательность каркаса-12, и направляющей последовательностью, нацеленной на galK. Редактирующая кассета содержала редактирующую последовательность, сконструированную для включения мутации L10KpnI в galK. В обоих экспериментах, отрицательную контрольную плазмиду с использованием направляющей нуклеиновой кислоты, которая является несовместимой с MAD2, включали в трансформацию. После трансформации, измеряли соотношение совместимых редактирующих кассет (содержащих каркас-11 или каркас-12 направляющих нуклеиновых кислот) и несовместимой редактирующей кассеты (отрицательного контроля) was measure. Эксперименты проводили в присутствии или в отсутствие отбора. Результаты показали, что выделено большее количество клеток, содержащих совместимую редактирующую кассету, по сравнению с несовместимой редактирующей кассетой, и этот результат увеличивался при использовании отбора.

Пример 7. Характеризация направляющей нуклеиновой кислоты

[00322] Последовательности каркасов 1-8, и 10-12 (SEQ ID NO: 84-91 и 93-95) подвергнуты выравниванию и показаны на фигуре 13. Нуклеотиды, совпадающие с консенсусной последовательностью, обесцвечены, в то время как нуклеотиды, отличающиеся от консенсусной последовательности, являются видимыми. Указана прогнозируемая область псевдоузла. Без связи с теорией, область на 5’ псевдоузла может влиять на связывание и/или кинетику направляемой нуклеиновой кислотой нуклеазы. Как показано на фигуре 13, как правило, по-видимому существует меньшая изменчивость между каркасными последовательностями в области псевдоузла (например, SEQ ID NO: 172-181), по сравнению с последовательностью вне области псевдоузла.

Пример 8. Эффективность редактирования для двух нуклеаз MAD

[00323] Анализ эффективности редактирования на основе чашек и молекулярный анализ эффективности редактирования использовали для тестирования эффективности редактирования различных комбинаций нуклеазы MAD и направляющей нуклеиновой кислоты.

[00324] На фигуре 15 показана количественная оценка данных, полученных с использованием молекулярного анализа эффективности редактирования с использованием нуклеазы MAD2 с направляющей нуклеиновой кислотой, содержащей каркас-12, и направляющей последовательностью, нацеленной на galK. Указанные мутации вводили в galK с использованием соответствующих редактирующих кассет, содержащих мутации. На фигуре 16 показано сравнение эффективности редактирования, определенной посредством анализа на основе чашек с использованием белых и красных колоний, как описано ранее, и молекулярного анализа эффективности редактирования. Как показано на фигуре 16, эффективность редактирования, как определено посредством двух отдельных анализов, согласуется.

Пример 9. Отслеживаемое редактирование

[00325] Генетическое редактирование можно отслеживать с использованием штрих-кода. Штрих-код можно включать в участок или около участка редактирования, как описано в настоящем описании. Когда проводят множество циклов конструирования, с проведением отличного редактирования в каждом цикле, может обеспечивать преимущество вставка штрих-кода в общую область в ходе каждого цикла конструирования, таким образом, можно секвенировать один участок и получить последовательности всех штрих-кодов из каждого цикла без необходимости секвенирования какждого редактированного участка индивидуально. На фигурах 17A и 17C, 18 и 19 показаны примеры таких отслеживаемых технологических процессов генной инженерии.

[00326] Как показано на фигуре 17A, клетку, экспрессирующую нуклеазой MAD, трансформируют плазмидой, содержащей редактирующую кассету и записывающую кассету. Редактирующая кассета содержит мутацию PAM и последовательность для редактирования гена. Записывающая кассета содержит штрих-код, в этом случае тестируют 15-н. штрих-код, уникальный для последовательностей. Как редактирующая кассета, так и записывающая кассета, каждая содержит направляющую нуклеиновую кислоту для отдельной последовательности-мишени. В библиотеке таких плазмид, записывающая кассета для каждого цикла может содержать одинаковую направляющую нуклеиновую кислота, так что штрих-код из первого цикла вставляют в одну и ту же локализацию среди всех вариантов, независимо от того, какую редактирующую кассету и соответствующее редактирование гена используют. Тем не менее, корреляцию между штрих-кодом и редактирующей кассетой определяют предварительно, так что редактирование можно идентифицировать посредством секвенирования штрих-кода. На фигуре 17B показан пример записывающей кассеты, сконструированной для делеции участка PAM, с включением в то же время 15-н. штрих-кода. Делетированный PAM используют для обогащения по редактированным клеткам, поскольку клетки с мутантным PAM избегают гибели клеток, в то время как клетки, содержащие последовательность PAM дикого типа, уничтожаются.

[00327] Сходный способ показан на фигуре 18. В этом случае, записывающую кассету из каждого цикла конструируют для нацеливания на последовательность, смежную с последовательностью из предшествующего цикла, и каждый раз, новый участок PAM подвергается делеции посредством записывающей кассеты. Результатом является массив штрих-кодов, с штрих-кодами из каждого цикла, котрые можно секвенировать для подтверждения того, что каждый цикл конструирования имел место, и для определения того, какая комбинация мутаций содержится в клетке, и в каком порядке осуществлены мутации. Каждую последующую записывающую кассету можно конструировать, чтобы она являлась гомологичной на одном конце области, содержащей мутантный PAM из предшествующего цикла, что может увеличивать эффективность получения полностью редактированных клеток в конце эксперимента. В других примерах, записывающую кассету конструируют для нацеливания на уникальное место посадки, включенное в предшествующую записывающую кассету. Это увеличивает эффективность выделения клеток, содержащих все желательные мутации, поскольку последующая записывающая кассета и штрих-код могут нацеливаться только на клетку, успешно завершившую предшествующий цикл конструирования.

[00328] На фигуре 19 изображен другой способ, позволяющий повторное использование селективных маркеров или иным образом избавление клетки от плазмиды из предшествующего цикла конструирования. В этом случае, трансформирующую плазмиду, содержащую направляющую нуклеиновую кислоту, конструируют для нацеливания на селективный маркер или другую уникальную последовательность в плазмиде из предшествующего цикла конструирования.

Пример 10. Дизайн библиотеки PAM на основе плазмиды (pPAM)

[00329] Библиотеки мишеней pPAM конструировали посредством получения индивидуальной спейсерной последовательности, фланкированной вырожденными нуклеотидами на 5’-конце и 3’-конце последовательности-мишени. Использовали форматы аранжировки N4-СПЕЙСЕРN=20-N4 и N5-СПЕЙСЕРN=20-N3. Эти последовательности заказывали в форме одного олигонуклеотида с вырожденностью в обозначенных положениях (например, N3, N4, и N5). Олигонуклеотиды амплифицировали и клонировали в гРНК-вектор, содержащий спейсер, совпадающий с библиотекой мишеней, для получения самонацеленного гРНК-вектора, который может истощаться в ситуациях конкурентного роста (фигура 20). В одном эксперименте, всего восемь различных спейсерных последовательностей клонировали в векторы, содержащие гРНК, разработанную для совпадения с соответствующей мишенью.

Пример 11. Способы

Клонирование библиотек мишеней

[00330] Все библиотеки мишеней, использованные для анализа специфичности PAM и спейсерных мотивов, клонировали в желательный участок клонирования посредством амплификации пула одноцепочечных перекрывающихся олигонуклеотидов. Линеаризованные остовы для клонирования получали посредством амплификации ПЦР с перекрыванием совместимых со вставкой ампликонов и расщепляли dpnI для исключения загрязнения исходным вектором. Линеаризованный остов и пулы вставок клонировали посредством сборки способом Gibson (с использованием либо готовой реакционной смеси для сборки Gibson Assembly Master Mix, либо набора для сборки ДНК NEBuilder HiFi DNA assembly набор, в соответствии с протоколом производителя). Половину каждого продукта сборки Gibson подвергали обессоливанию в течение 30 мин с использованием диализной мембраны 0,025 мкм, плавающей в деионизированной воде в чашке Петри. Это использовали для трансформации компетентных клеток E. cloni 10G supreme и восстанавливали в течение 1 час в LB. 1% продукта трансформации после восстановления (10 мкл) использовали для рассева на основе разведения для оценки КОЕ на реакцию клонирования и перекрывания библиотеки. Клонирование повторяли, если количества КОЕ составляли <10X размера библиотеки, для обеспечения полного перекрывания желательной протяженности последовательностей. Остальной объем продукта после восстановления переносили для культивирования в течение ночи в 25 мл, содержащие 100 мкг/мл карбенициллина для поддержания селективного давления, для репликации клонированной библиотеки.

[00331] После восстановления в течение ночи, аликвоты 2×1 мл отбирали из каждой реакционной смеси для клонирования библиотеки и хранили в форме препаратов для хранения в глицерине. Остальные 23 мл культуры осаждали и использовали для выделения плазмидной ДНК с использованием набора Qiagen Plasmid Plus Midi набор. Эту ДНК использовали в последующих трансформациях для получения представленных данных.

Получение компетентных клеток для исследований истощения гРНК

[00332] Для получения компетентных клеток для истощения гРНК, редактирующую плазмиду вводили в E. coli MG1655. Редактирующая плазмида содержала представляющую интерес индуцируемую температурой направляемую РНК нуклеазу (RGEN), индуцируемый арабинозой оперон RED λ и маркер устойчивости к хлорамфениколу. После выращивания в течение ночи, содержащие насыщенную RGEN линии клеток затем вводили в разведении 1/100 в 250 мл LB+25 мкг/мл хлорамфеникола в 500 мл встряхиваемых колбах с отражателями. Инокулированные культуры выращивали до OD 0,5-0,8 и переносили в водяную баню с встряхиванием при 42°C для индукции экспрессии RGEN. После индукции при 42°C, клетки помещали на лед на 10 мин. Затем клетки промывали 3X с использованием 100 мл ddH2O или 10% глицерина. После последней стадии промывки клетки ресуспендировали в 2,5 мл (или 1/100-й общего объема культуры) 10% глицерина и аликвотрировали на части по 200 мкл для хранения при -80°C.

Способ истощения гРНК

[00333] Каждый эксперимент истощения гРНК проводили с использованием одной 200 мкл аликвоты компетентных клеток, содержащих RGEN. Эту аликвоту клеток помещали в охлажденную кювету с просветом 2 см и подвергали электропорации с использованием системы Nepagene. Электропорацию проводили с использованием импульса 2400 В для переноса и 20 импульсов 150 В для перемешивания. Каждую трансформацию проводили с использованием 50-500 нг желательной библиотеки, как описано в папках экспериментов. После 2 час восстановления, 1% реакционной смеси после трансформации рассевали пятнами для определения эффективности трансформации (т.е. общего количества КОЕ), и остальной объем смеси после трансформации использовали для инокуляции 100 мл выросших культур. Из культур отбирали образцы в различных временных точках посредством отбора аликвоты 1 мл и проведения выделения ДНК с использованием набора QiaPrep Miniprep набор от Qiagen для нижестоящего секвенирования.

Общая подготовка и анализ NGS

[00334] Минипрепараты плазмид амплифицировали с использованием индексированных по эксперименту праймеров. Ампликоны пулировали для нормализации по ожидаемому количеству прочтений и очищали из геля до загрузки в устройства MiSeq/NextSeq. Затем проводили картирование индексированных файлов прочтений fastq по отношению к ожидаемым вариантам со 100% из дизайна эксперимента, и подсчитывали количества для проведения сравнительных анализов для наблюдаемых данных. Все количества нормализовали по частоте посредством уравнения Vf=(количество V)/(общее количество), где Vf представляет собой частоту варианта для данного индекса, количество V представляет собой количество, наблюдаемое для варианта, и общее количество представляет собой общее количество, наблюдаемое среди всех индексов эксперимента.

Анализ данных и расчет истощения.

[00335] Показатели истощения (или абсолютные показатели приспособленности) рассчитывали как log2 показатель истощения с использованием следующего уравнения: W=log2(Fx, f/Fx, i); где Fx, f представляет собой частоту кассеты X в конечной временной точке и Fx, i представляет собой исходную частоту кассеты X, и W представляет собой абсолютный показатель приспособленности каждого варианта. Частоты определяли посредством деления количества прочтений для каждого варианта на общее количество прочтений в эксперименте, включая прочтения, выпавшие из фильтрации. Каждый отбор проводили в двух повторах, и средневзвешенное значение количества из двух измерений использовали для вывода среднего показателя приспособленности каждой мутации следующим образом: Wсредн.=(ΣNi=1 счетi * Wi)/(ΣNi=1 счетi). Следует отметить, что рассчитанные показатели относятся к показателю истощения, когда рассчитанное значение является отрицательным, хотя оно может также относиться к показателю обогащения, если рассчитанное значение является положительным.

[00336] Эти показатели использовали для ранжирования и оценки вклада в приспособленность каждой мутации при различных исследованных видах селективного давления. Для всех отборов, средние абсолютные показатели приспособленности для синонимических мутаций представлены в форме составного показателя средней скорости роста. Абсолютные показатели обогащения считали значимыми, если обогащение мутанта составляло по меньшей мере μ±2*σ (т.е., P=0,05, принимая нормальное распределение) от значения для дикого типа. Среднее и пороги значимости регистрировали для каждого отбора. Каждый отбор проводили по меньшей мере в двух повторах, и значение порога отсечения 10 среди повторяющихся экспериментов принимали для включения в каждый анализ.

[00337] В некоторых случаях, данные нормализовали по данным контрольной библиотеки PAM NRRN или по данным другой нецелевой контрольной библиотеки.

[00338] На фигуре 21A показано, что сопротивление отражает количество трансформантов на лунку для компетентных клеток SOP и фиксированного количества ДНК. На фигуре 21B изображено сравнение средневзвешенного значения показателя истощения с Ec110 (4 повтора), Ec83* (5 повторов) и Ec78* (два повтора). Эти ампликоны секвенировали, и 3’-PAM использовали в качестве штрих-кода образца. На фигуре 22A показано, что количества для входной контрольной плазмиды EC110 и контрольной плазмиды EC110 после 15 часов роста являются почти идентичными. На фигуре 22B показано, что количества для контрольной плазмиды EC110 после 15 часов и 20 часов избыточного роста в жидкой культуре являются почти идентичными, что показывает стабильное поддержание входной плазмиды.

Пример 12. Анализ анализ pPAM для идентификации PAM MAD7 и PAM MAD2

[00339] Предпочтительность PAM для MAD2 и MAD7 определяли с использованием анализа истощения плазмиды pPAM и способов анализа данных, описанных выше. Показатели истощения для различных PAM рассчитывали, как описано выше, через 20 часов, как для MAD7 (фигура 23A), так и для MAD2 (фигура 23B). PAM, количество которых подверглось истощению или уменьшению, представляют собой PAM, способные подвергаться узнаванию и таким образом, расщеплению нуклеазой и комплексом гРНК. Предпочтительные участки PAM для обоих ферментов показаны слева направо, соответственно. MAD2 и MAD7 оба имеют предпочтение для PAM NYYN, хотя некоторые PAM NYYN действуют лучше, чем другие (фигуры 23A и 23B). Эффективность редактирования по сравнению с эффективностью разрезания дополнительно характеризовали для выбора плазмид PAM MAD7 (фигура 23C).

Пример 13. Дизайн анализа неспецифической активности на основе синтетических плазмид (SPOT)

[00340] Библиотеки мишеней для анализа неспецифической активности на основе синтетических плазмид (SPOT) конструировали посредством получения индивидуальных спейсерных последовательностей длиной 20 нуклеотидов и добавления подгруппы последовательностей PAM с каждой стороны. В некоторых экспериментах, YTTN PAM добавляли с 5’-стороны каждой мишени, и PAM NGG добавляли с 3’-стороны, таким образом, получая формат YTTN-СПЕЙСЕРN=20-NGG (SEQ ID NO: 377). На основании официальной номенклатуры IUPAC, Y=C или T; и N=A, C, T или G. Восемь комбинаций пар 5’-PAM - 3’-PAM тестировали в исходном эксперименте для каждой мишени, по одному для каждого 5’-PAM с образцами каждого 3’-PAM, проанализированными дважды. Конкретно, получали и тестировали следующие комбинации 5’ PAM - 3’ PAM: TTTA-AGG (SEQ ID NO: 378); TTTC-CGG (SEQ ID NO: 379); TTTG-GGG (SEQ ID NO: 380); TTTT-TGG (SEQ ID NO: 381); CTTA-AGG (SEQ ID NO: 382); CTTC-CGG (SEQ ID NO: 383); CTTG-GGG (SEQ ID NO: 384); и CTTT-TGG (SEQ ID NO: 385), где 20-нуклеотидный спейсер находился между каждой комбинацией PAM. Хотя только репрезентативное количество комбинаций тестировали в этом эксперименте, следует понимать, что можно тестировать также каждую возможную комбинацию PAM 5’-YTTN-N=20-NGG-3’ (SEQ ID NO: 377). Затем набор спейсеров-мишеней с различными комбинациями PAM использовали в качестве матрицы для конструирования точечных мутаций на протяжении последовательности спейсера. Дизайн библиотек мутаций в спейсере-мишени состоял из четырех различных групп мутаций для каждой последовательности PAM-спейсер и внутреннего контроля.

[00341] Первая библиотека мутаций представляла собой сканирующую библиотеку несовпадений, состоящую из непрерывных несовпадений 1, 2, 3 или 4 п.о., где каждое несовпадение являлось комплементарным нуклеотиду последовательности дикого типа. Получена каждая возможная мутация 1, 2, 3 и 4 непрерывных п.о. на протяжении всей длины спейсерной последовательности.

[00342] Вторая библиотека мутаций представляла собой сканирующую библиотеку делеций, состоящую из непрерывных делеций 1, 2, 3 или 4 п.о. Получена каждая возможная делеция 1, 2, 3, и 4 непрерывных п.о. на протяжении всей длины спейсерной последовательности.

[00343] Третья библиотека мутаций представляла собой библиотеку одиночных вставок, где вставку одиночного основания выполняли в каждом положении в спейсере. В некоторых экспериментах, каждую вставку 1 п.о. выполняли посредством дублирования нуклеотида непосредственно на 5’ от участка вставки. Другой дизайн библиотеки вставок включает дублирование нуклеотида непосредственно на 3’ от участка вставки, или получение каждого возможного варианта вставки нуклеотида, например, индивидуального варианта с вставкой одного из A, T, C и G в каждом положении в области спейсера.

[00344] Четвертая библиотека мутаций представляла собой библиотеку случайного мутагенеза, где положения 2-5 п.о. случайным образом подвергали мутагенезу для получения разнообразной группы мутантных последовательности, аппроксимирующие большинство биологически значимых видов разнообразия. Эти мутации 2-5 п.о. не обязательно должны были являться непрерывными и таким образом, часто имели не подвергнутый мутагенезу нуклеотид или нуклеотид дикого типа между мутантными нуклеотидами. Обнаружено, что такие не являющиеся непрерывными случайные мутации являются распространенными в биологических системах.

[00345] Как в случае библиотек pPAM, последовательности SPOT клонировали в гРНК-векторы, содержащие спейсер, совпадающий с библиотекой мишеней, для получения самонацеленного гРНК-вектора. Пулы олигонуклеотидов амплифицировали и клонировали в гРНК-вектор, содержащие спейсер, совпадающий с библиотекой мишеней, для получения самонацеленного гРНК-вектора, который может истощаться в условиях конкурентного роста из-за вырезания и потери плазмиды при селективном давлении. Восемь выбранных комбинаций 5’-3’ PAM, фланкирующих каждую из 8 различных спейсерных последовательностей клонировали в векторы, содержащие гРНК, разработанные для совпадения с мишенью.

[00346] С использованием анализа SPOT, возможны анализы истощения in vivo, независимо от продукции рибонуклеопротеинового комплекса. Этот анализ также позволяет уникальный анализ неспецифического взаимодействия с использованием систематического неспецифического дизайна посредством различных вариантов дизайна библиотеки мутаций. Дополнительные преимущества анализа SPOT включают более контролируемое изменение неспецифических кандидатов, анализ можно использовать для сравнения различных видов архитектуры PAM, и анализ можно комбинировать или смешивать с анализом библиотеки pPAM, описанным выше.

[00347] Другие анализы неспецифического взаимодействия, такие как Site-Seq, BLISS, Digenome-Seq или Circle-Seq, проводят поиск участков расщепления из экспериментов на млекопитающих и регистрируют неспецифические последовательности с эффективностью репарации NHEJ из глубокого секвенирования. С использованием этих других анализов, в большинстве исследований показаны неспецифические эффекты случайных несовпадений более 3 п.о.

Пример 14. Характеризация неспецифического взаимодействия

[00348] Неспецифические эффекты MAD7 и MAD2 анализировали с использованием анализа неспецифического взаимодействия на основе синтетической плазмиды (SPOT), описанного выше. Сначала, восемь мишеней с различными фланкирующими участками PAM тестировали по активности расщепления с использованием эталонной нуклеазы, MAD7 или MAD2. Затем выбранные мишени из вышеуказанных использовали в качестве исходных точек для получения различных случайных мутаций внутри мишени. В этом примере анализа, ампликон 171 п.о. получали при амплификации мишени и фланкирующих областей PAM, позволяющий либо прочтения 87 п.о. с встраиваемым индексом, либо прочтения 46 п.о. с прочтениями индекса 12 п.о.

[00349] Данные из примера эксперимента показаны на фигурах 24A-C. Мишени содержали указанное количество случайных мутаций (r3=3 п.о.; r4=4 п.о.; r5=5 п.о.). Cas9 использовали для получения графика истощения на фигуре 24A, MAD7 использовали для получения графика истощения на фигуре 24B, и MAD2 использовали для получения графика истощения на фигуре 24C.

[00350] Как видно при сравнении графиков истощения эталонного белка с графиками истощения MAD7 и MAD2, эталонный белок имеет намного больше событий неспецифического разрезания в каждой из библиотек r3, r4 и r5. Как для MAD7, так и для MAD2, показано меньше событий неспецифического разрезания для случайных мутаций, и фактически не присутствовало событий неспецифического разрезания для 5 п.о. случайных несовпадения. Эти события неспецифического разрезания, или их отсутствие, являлись независимыми от PAM или последовательности-мишени.

Пример 15. Комбинированное определение PAM и анализ неспецифического взаимодействия

[00351] Возможность характеризации специфичности PAM и неспецифических эффектов в комбинированном эксперименте тестировали посредством комбинации анализа pPAM и анализа SPOT, описанных выше, что в комбинации обозначено в настоящем описании как анализ анализ Inscripta (например, фигура 25). В примере анализа Inscripta ампликон 171 п.о. получали при амплификации мишени и фланкирующих областей PAM, позволяющий прочтения 46 п.о. с прочтениями индекса 12 п.о. Нацеливающие последовательности выбирали для единообразного исследования широкого диапазона значений температуры плавления для спейсерной последовательности.

[00352] Анализ Inscripta использовали для быстрой характеризации специфичности PAM и частот неспецифического взаимодействия для 10 ферментов. Истощение MAD7 было в основном идентичным между 20 часами (MAD7) и 24 часами (MAD7,24) истощения. Входная плазмида являлась сходной с Ec110, представляющей собой штамм E. coli, содержащий контрольную плазмиду, сходную с остовом вектора-переносчика, описанного выше, но лишенного кодирующего нуклеазу гена. Истощение MAD2 оставалось одинаковым для конститутивного промотора Ec78* (MAD2) по сравнению с Ec113, представляющей собой штамм E. coli, содержащий остов вектора-переносчика, как описано выше, содержащий ген, кодирующий the нуклеазу MAD7 под контролем конститутивного промотора proA вместо индуцируемой промоторной системы pL. Сильное истощение наблюдали для MAD7 или MAD2 и библиотека множества мишеней, и сильное истощение в библиотеке множества мишеней наблюдали также для MAD4. Меньшее истощение наблюдали для MAD5 по сравнению с MAD2, MAD7 и MAD4.

[00353] На основании этих данных, MAD7, MAD2, MAD4 и MAD5 выбрали для дальнейшей характеризации. Специфичности PAM анализировали для каждой с использованием данных анализа pPAM. Графики истощения для тестированных PAM TTN и CTTN показаны на фигуре 26A и фигуре 26B, и PAM RTTN и YCCN показаны на фигуре 26C.

[00354] Показатели истощения MAD7 для различных PAM показаны также на фигуре 27A-27B, и эти данные показывают, что содержание GC последовательности-мишени может влиять на масштаб активности истощения, что позволяет предполагать, что расщепление и нацеливание можно настраивать на основании выбора PAM и последовательности-мишени.

[00355] Показатели истощения MAD2 для различных PAM показаны также на фигуре 28A-29B и эти данные показывают, что содержание GC последовательности-мишени может влиять на масштаб активности истощения, что позволяет предполагать, что расщепление и нацеливание можно настраивать на основании выбора PAM и последовательности-мишени. Например, для PAM TTTA, при содержании GC, эквивалентным мишени 8, показано очень сильное истощение.

[00356] Показатели истощения MAD4 для различных PAM показаны также на фигуре 29A-29B, и эти данные показывают, что содержание GC последовательности-мишени может влиять на масштаб активности истощения, что позволяет предполагать, что расщепление и нацеливание можно настраивать на основании выбора PAM и последовательности-мишени. Для MAD4 также показан высокий показатели истощения с использованием мишени 8, имеющей наивысшее содержание GC из всех тестированных мишеней.

[00357] Показатели истощения MAD5 для различных PAM показаны также на фигуре 30A-30B. Эти данные показывают, что для MAD5 не получено сильного истощения для тестированных комбинаций последовательностей-мишеней и последовательностей PAM.

[00358] Эффекты неспецифического разрезания MAD7, MAD2 и MAD4 характеризовали дополнительно. Данные из примера анализа SPOT с использованием библиотек мутантов различных тестированных мишеней показаны на фигурах 31A-31C. Для MAD4 показана даже меньшая неспецифическая активность, чем для MAD2 и MAD7, для многих из тестированных классов мишеней, как указано в примере данных, показанных на фигурах 32A-32H. Указаны библиотеки мутантов, показанные на каждом графике и включающие случайные мутации (фигуры 32A и 32E), мутации делеции (фигуры 32B и 32F), мутации несовпадения (фигуры 32C и 32G), или мутации вставки (фигуры 32D и 32H). На фигурах 32I-32P показаны показатели истощения из экспериментов с использованием MAD7 и указанных библиотек мутаций, содержащих мутации в указанном положении внутри каждой тестированной последовательности-мишени. Эти данные представляют собой комбинацию всех PAM YTTN, использованных в эксперименте с использованием MAD7. Для фигур 32I-32P, «без мишени» рассчитывали для PAM 5’-NGGN, и wt (дикого типа) представляет собой контроль без мутаций в мишени, и «положение» представляет собой положение мутации внутри последовательности-мишени. На фигурах 32I-32J показаны данные для сканирующей библиотеки мутаций 1 п.о. (m1). На фигурах 32K-32L показаны данные для сканирующей библиотеки мутаций 2 п.о. (m2), имеющей 2 последовательные мутации, начиная с указанного положения. На фигурах 32M-32N показаны данные для сканирующей библиотеки мутаций 3 п.о. (m3), имеющей три последовательные мутации, начиная с указанного положения. Совместно, эти данные показывают, что последовательность затравки из положений 1-7 являются важными, поскольку мутации в этой области имеют тенденцию нарушать активность расщепления MAD7, как показано по уменьшению показателя истощения для мутаций в этих положениях. На фигурах 32O-32P показаны данные для сканирующей библиотеки мутаций 2 п.о. (m2) и показаны данные для одной мишени, организованные по последовательности PAM. Совместно, эти данные показывают, что некоторые последовательности PAM являются менее специфическими, чем другие, что позволяет предполагать взаимосвязь между силой PAM и специфичностью мишени. Например, PAM TTTA, по-видимому, поддерживает расщепление мишеней с тандемными несовпадениями 2 п.о. с более высокой частотой, чем остальные из тестированных комбинаций, например, по сравнению с PAM CTTT. Эти наблюдения позволяют предполагать, что сила PAM должна быть фактором в выборе мишени.

Пример 16. Характеризация совместимой последовательности направляющей РНК

[00359] Различные направляющие РНК, содержащие различные каркасные последовательности, тестировали для характеризации того, какие каркасные последовательности являются совместимыми с тестированными нуклеазами MAD. Тестировали Каркасы из массива эндогенных CRISPR для рассматриваемых нуклеаз MAD, так же как гетерологичные каркасные последовательности, происходящие из гетерологичных или ортогональных систем нуклеазы MAD. На фигуре 33 показан пример схемы различных комбинаций нуклеазы MAD и каркаса направляющей РНК, которые тестировали, и конструкции, которую использовали для тестирования совместимости тестированной нуклеазы MAD (например, MAD#) и каркасной последовательности направляющей РНК (например, crMAD#). Конструкция содержала промотор, управляющий экспрессией направляющей РНК, содержащей каркасную последовательность (повтор cr) и нацеливающую последовательность (например, спейсер galT45). Конструкция содержала также последовательность-мишень (например, galT45, 24 п.о.), на которую была нацелена нацеливающая последовательность направляющей РНК. Области PAM 3-4 п.о. фланкировали последовательность-мишень. Каждая конструкция содержала также уникальный ID последовательности или штрих-код, который использовали для идентификации каркасной последовательности. Идентификация могла происходить, например, после амплификации области штрих-кода/уникального ID и последовательности-мишени с использованием праймеров, фланкирующих эту область, как указано на фигуре 33. В некоторых примерах, амплификация приводила к ампликону 176 п.о., позволяющему прочтения 50 п.о. с прочтениями индекса 12 п.о., с использованием набора V3 Высокопроизводительный 1×75 п.о.

[00360] В иллюстративном эксперименте, тестировали 12 различных ферментов MAD с 10 различными каркасными последовательностями, полученные ампликоны для которых затем секвенировали в одном анализе секвенирования нового поколения.

[00361] Это анализ использовали для тестирования совместимости конкретных ферменты MAD с различными каркасными последовательностями. Первичные и вторичные структуры некоторых из тестирванных каркасных последовательностей (crMAD#) показаны на фигурах 34A и 34B. На фигуре 34A показано выравнивание каркасных последовательностей crРНК из указанной системы MAD. На фигуре 34B показана часть области псевдоузла из указанных crРНК MAD. Эти выравнивания на фигурах 34A-34B показали сильную консервативность последовательности и структуры области псевдоузла для этих выровненных crРНК MAD. Выравнивания, кроме того, показали, что присутствие, хотя и необязательное, последовательности, на 5’-конце области повтора (как отмечено на фигуре 34A), может быть менее важным для активности расщепления. Указаны отклонения последовательности от консенсусной последовательности выбранных crРНК MAD; например, чаще всего указанным 5’-нуклеотидом является C в crРНК MAD3, в отличие от U в консенсусной последовательности. В качестве дополнительного примера, второй нуклеотид в структуре петли представляет собой A в консенсусной последовательности и вместо этого, представляет собой 1) U в crРНК MAD10, 2) G в crРНК MAD4, MAD7 и MAD11, 3) C в crРНК MAD25 и 4) CU в crРНК MAD3. В качестве дополнительного примера, третий нуклеотид в структуре петли консенсусной последовательности представляет собой U и вместо этого, представляет собой G в crРНК MAD5. Как показано, для некоторых crРНК MAD, последовательность петли имеет длину 4 нуклеотида, в то время как для других (например, crРНК MAD3) последовательность петли имеет длину 4 нуклеотида.

[00362] Примеры результатов этого анализа показаны на фигурах 35A-35C для MAD7, MAD2 и MAD4, соответственно. Некоторые наблюдения для каждого набора данных перечислены ниже.

[00363] Как показано на фигуре 35A, MAD7, по-видимому, является совместимой с большинством тестированных каркасных последовательностей с петлей 4 п.о. По-видимому, присутствует также немного меньшая активность расщепления для последовательности петли UAGU в сочетании с более слабыми последовательностями PAM. Активность MAD7 широко распространяется на ряд последовательностей PAM, как показано по соответствующим показателям истощения. Совместно, эти результаты позволяют предполагать, что активность MAD7 можно настраивать посредством конструирования каркасной последовательности. Дополнительные данные из этих экспериментов для MAD7 показаны на фигурах 36A-36B, показывающих сравнение совместимости MAD7 с ее природной каркасной последовательностью и гетерологичными каркасными последовательностями, содержащими различные последовательности стебля-петли. Дополнительные данные, показывающие совместимость MAD7 с различными каркасными последовательностями с различными последовательностями стебля-петли, показаны на фигуре 37. Как показывают эти данные, положение -1 последовательности выше PAM, по-видимому, является важным, и первый нуклеотид «C» в положении -1 неблагоприятно влияет на истощение. По-видимому, существует следующая предпочтительность в положении -1: G>T>A>C, за исключением ситуации PAM CTTT, в этом случае предпочтительность, по-видимому, представляет собой: A>G>T>C. Богатые пиримидинами (T/C) спейсерные последовательности, особенно в области затравки, по-видимому, являются немного менее предпочтительными как для MAD7, так и для MAD2, в то время как обогащение пуринами (A/G) немного увеличено. Наличие C выше PAM также по-видимому, является неблагоприятным.

[00364] Как показано на фигуре 35B, MAD2 , по-видимому, является совместимой с большинством тестированных каркасных последовательностей с петлей 4 п.о. Наблюдали также бимодальное узнавание PAM. Дополнительные данные из этих экспериментов показаны на фигурах 36C-37D, показывающих сравнение совместимости MAD2 с ее природной каркасной последовательностью и гетерологичными каркасными последовательностями, содержащими различные последовательности стебля-петли.

[00365] Как показано на фигуре 35C, MAD4, по-видимому, является совместимой с большинством тестированных каркасных последовательностей с петлей 4 п.о. По-видимому, присутствует также немного меньшая активность расщепления для последовательности петли UAGU последовательность петли в сочетании с более слабыми последовательностями PAM. Узнавание PAM, по-видимому, является несколько бимодальным. Дополнительные данные из этих экспериментов показаны на фигурах 36E-36F, показывающих сравнение совместимости MAD4 с ее природной каркасной последовательностью и гетерологичными каркасными последовательностями, содержащими различные последовательности стебля-петли.

Пример 17. Характеризация активности MAD7 в дрожжах

[00366] Анализ отбора с CAN1 использовали для тестирования ряда видов архитектуры кассеты MAD7 дрожжей. В некоторых примерах экспериментов, одиннадцать различных кассет с различной ориентацией плеч гомологии тестировали по эффективности редактирования последовательности-мишени. Как правило, клетки дрожжей трансформировали с использованием одной из рассматриваемых кассет и вектора, экспрессирующего фермент MAD7, имеющего оптимизированный кодонный состав для экспрессии в S. cerevisiae. Трансформированные клетки рассевали на канаванин для отбора. Только клетки с успешным редактированием могли выживать при отборе с канаванином, показывая, что комбинация MAD7 и кассеты являлась успешной для осуществления желательного редактирования. Затем ДНК выделяли из отобранных клеток, и желательное редактирование подтверждали посредством либо расщепления, либо секвенирования. Детали тестированных кассет представлены в таблице 6. В таблице 6, подчеркнутые нуклеотиды указывают потенциальные проблемные последовательности из-за мотивов пента-T, которые могут служить потенциальным сигналом терминации транскрипции у эукариот и могут, таким образом вызывать проблемы с экспрессией. Таким образом, эти потенциальные проблемные последовательности изменяли в различных тестируемых линкерных последовательностях посредством либо удаления, либо замены одного или нескольких нуклеотидов на нуклеотиды, показанные жирным курсивом. Данные из примера эксперимента обобщены в таблице 7. Эти данные показывают, что кассета 36 п.о. типа «T на C» - F имеет предпочтительную ориентацию и организацию.

Таблица 6

Кассета Длина (п.о.) Линкерная последовательность Каркасная последовательность
Кассета E и F (crРНК MAD12) 35 GTCAAAAGACCTTTTT
(SEQ ID NO: 386)
AATTTCTACTCTTGTAGAT
(SEQ ID NO: 387)
Кассета C и D (альтернативная crРНК) 36 GTCTGGCCCCAAATTTT (SEQ ID NO: 388) AATTTCTACTGTTGTAGAT
(SEQ ID NO: 389)
gg-мини 21 GG AATTTCTACTCTTGTAGAT
(SEQ ID NO: 387)
Кассета A и B мини 19 AATTTCTACTCTTGTAGAT
(SEQ ID NO: 387)
Тип E и F («T на G») 35 GTCAAAAGACCTGTGT
(SEQ ID NO: 390)
AATTTCTACTCTTGTAGAT
(SEQ ID NO: 387)
Тип E и F («T на C») 36 GTCTGGCCCCAAATTCT
(SEQ ID NO: 391)
AATTTCTACTGTTGTAGAT (SEQ ID NO: 389)

Таблица 7

crРНК Колоний, рассеянных на канаванин Колоний с ростом на канаванине Процент роста Успешный ПЦР из колоний на канаванине Случаев редактирования, наблюдаемых при расщеплении продукта ПЦР Процент редактирования по ПЦР
35 п.о., тип «T на G» - E 35 31 88,5% 11 11 100%
36 п.о. , тип «T на C» - E 35 34 97,1% 13 13 100%
35 п.о. , тип «T на G» - F 30 26 86,7% 17 15 88,2%
36 п.о., тип «T на C» - F 30 30 100% 9 9 100%
21 п.о., crРНК gg-мини 35 25 71,4% 17 10 58,8%
Кассета A 10 0 0% - - -
Кассета B 10 0 0% - - -
Кассета C 35 34 97,1% 25 25 100%
Кассета D 34 32 94,1% 22 21 95,4%
Кассета E 35 35 100% 26 23 88,5%
Кассета F 35 32 91,4% 18 14 77,8%

[00367] Тестировали также дополнительные аранжировки кассет, такие как показано в таблице 8. В этом цикле экспериментов, параметры кассеты фильтровали таким образом, чтобы не присутствовало TTTTT в спейсере (нацеливающей последовательности), и чтобы не присутствовало гомополимерных областей более 6 п.о. в плечах гомологии или спейсере (нацеливающей последовательности).

[00368] В таблице 9 обобщена эффективность редактирования выбранных кассет в дополнительных экспериментах, показывающих эффективность редактирования в диапазоне 25-100% на основании ожидаемых мутаций, и в таблице 10 обобщены последовательности, содержащиеся в указанных кассетах, и другие детали экспериментa, включая последовательности гена WT, подвергнутые нацеливанию, и мутантные последовательности, вставленные после расщепления DNS с использованием комплекса рассматриваемого фермент MAD и crРНК.

Таблица 8

Кассета Каркас crРНК Линкерная последовательность Частичная каркасная последовательность
Кассета G MAD12 GTCTGGCCCCAAATTCT
(SEQ ID NO: 391)
AATTTCTACTCTTGTAGAT
(SEQ ID NO: 387)
Кассета H MAD5 GTCTGGCCCCAAATTCT
(SEQ ID NO: 391)
AATTTCTACTAGTGTAGAT
(SEQ ID NO: 392)
Кассета I MAD10 GTCTGGCCCCAAATTCT
(SEQ ID NO: 391)
AATTTCTACTTTTGTAGAT
(SEQ ID NO: 393)
Кассета J MAD4, 7 и 11 GTCTGGCCCCAAATTCT
(SEQ ID NO: 391)
AATTTCTACTGTTGTAGAT
(SEQ ID NO: 389)
Кассета K MAD25 GTCTGGCCCCAAATTCT
(SEQ ID NO: 391)
AATTTCTACTATTGTAGAT
(SEQ ID NO: 394)

Таблица 9

Кассета L Кассета M Кассета N Кассета O
Штамм 1 1 1 2
% редактирования (технологический процесс) 8% 8% ND 9%
Ожидаемые мутации/прочтения 7 8 6 5
# Прочтения с редактированием/# общее количество прочтений 7/85 22/55 20/119 6/64

Таблица 10

Кассета L Кассета M Кассета N Кассета O
Нацеливающая последовательность crРНК SEQ ID NO: 360 SEQ ID NO: 361 SEQ ID NO: 362 SEQ ID NO: 363
Мутантная последовательность, вставленная в участок расщепления SEQ ID NO: 364 SEQ ID NO: 365 SEQ ID NO: 366 SEQ ID NO: 367
Последовательность гена WT до мутации SEQ ID NO: 368 SEQ ID NO: 369 SEQ ID NO: 370 SEQ ID NO: 371
Редактирующая кассета SEQ ID NO: 372 SEQ ID NO: 373 SEQ ID NO: 374 SEQ ID NO: 375

Пример 18. Расщепление последовательностей-мишеней млекопитающих in vitro и in vivo.

[00369] MAD7 использовали для нацеливания и расщепления мишеней в клетках млекопитающих. Получали экспрессирующие MAD7 конструкции с оптимизированным кодонным составом для E. coli или человека (например, фигура 38A). Кратко, конструкция I69 содержала промотор hCMV, функционально связанный с последовательностью MAD7 с оптимизированным кодонным составом E. coli, которая также содержала 5’ (N-концевой) эпитоп-метку V5 и сигнал ядерной локализации (NLS), и конструкция также содержала промотор EF1альфа, управляющий экспрессией репортера GFP, и ген устойчивости к бластицидину. Конструкция I19 является сходной с I69, за исключением того, что последовательности NLS и V5 находятся на 3’-конце (C-конце) последовательности MAD7. Конструкция I9 является сходной с последовательностью I69, с тем исключением, что последовательность MAD7 имеет оптимизированный кодонный состав для экспрессии в клетках человека вместо E. coli. Конструкция I18 является сходной с конструкцией I19, с тем исключением, что последовательность MAD7 имеет оптимизированный кодонный состав для экспрессии в клетках человека вместо E. coli. Использовали две последовательности направляющей РНК, как показано на фигуре 38B.

[00370] На фигурах 39A-39B показаны участки-мишени в двух генах-мишенях, PPIB (фигура 39A) и DNMT3B (фигура 39B). На фигурах 39C-39D обобщена последовательность PAM и последовательность-мишень, на которую нацелены указанные последовательности направляющей РНК, так же как процент содержания CG в последовательности-мишени и то, какая цепь ДНК подвергнута нацеливанию.

[00371] Каждым из экспрессирующих MAD7 векторов по отдельности трансфицировали клетки млекопитающих, и затем собирали лизаты клеток. Лизаты клеток оценивали посредством анализа Вестерн-блоттинга для подтверждения экспрессии MAD7. Лизаты клеток использовали также для анализа разрезания in vitro для оценки функции белка MAD7, которая может указывать на надлежащие экспрессию и сворачивание белка, экспрессированного в клетках млекопитающих. Этот анализ позволяет оценку экспрессии и способности к расщеплению MAD7 в отсутствие возможности для аппарата клетки корректировать событие расщепления или блокировать его из-за компактизации хроматина последовательности-мишени. После проведения анализа расщепления, лизат разделяли посредством электрофореза в геле и анализировали с использованием программного обеспечения ImageJ и денситометрии для определения % расщепления (% разрезания), который рассчитывали посредством деления интенсивности продукта расщепления на общую интенсивность полосы.

[00372] На фигуре 40 показана количественная оценка процента расщепления (эффективности разрезания) из примера эксперимента для указанных последовательностей-мишеней PPIB и DNMT3B, с использованием конструкции I18. Наблюдали небольшие различия расщепления in vitro между 42-мерными и 56-мерными последовательностями направляющей РНК, так что средние для них двух нанесены на график на фигуре 40. Для PPIB, восемь из десяти тестированных направляющих РНК приводили к направленному расщеплению, в то время как гРНК-14 и гРНК-25 приводили к не поддающемуся детекции расщеплению с использованием этого анализа. гРНК-15, нацеленная на PPIB, приводила к эффективному расщеплению, но его было сложно измерять из-за небольшого размера полученного продукта расщепления (с отличием приблизительно на 70 п.о. от неразрезанного), так что процент расщепления определили как составляющий > 90%. Для DNMT3B, девять из десяти тестированных направляющих РНК приводили к направленному расщеплению, в то время как гРНК-4 приводила к не поддающемуся детекции расщеплению с использованием этого анализа. гРНК-1, нацеленная на DNMT3B, приводила к эффективному расщеплению, но его было сложно измерять из-за небольшого размера полученного продукта расщепления (с отличием приблизительно на 70 п.о. от неразрезанного), так что процент расщепления определили как составляющий > 90%.

[00373] На фигуре 41 показана количественная оценка образования инделов (вставок или делеций) в клетках млекопитающих. Кратко, экспрессирующим нуклеазу MAD7 вектором (I9 или I18; см. фигуру 38A) и синтетической направляющей РНК совместно трансфицировали клетки HEK293T. После периода инкубации посредством 72 часа, расщепление in vivo оценивали посредством детекции образования инделов. Без намерения быть связанными теорией, после того, как происходит расщепление, в некоторых случаях, происходит репарация расщепленной ДНК посредством механизмов соединения негомологичных концов (NHEJ), которые часто приводят к вставке или делеции из участка расщепления одного или нескольких нуклеотидов. Эти события вставки и/или делеции обозначены как инделы. Инделы детектировали с использованием анализа детекции несовпадения ДНК с использованием анализа T7EI. Этот анализ несовпадения детектирует несовпадения между ожидаемыми неизмененными последовательностями и измененной последовательностью, содержащей инделы после расщепления и репарации NHEJ. В некоторых случаях, 56-мерная направляющая РНК приводила к более высокой частоте образования инделов, по сравнению с 42-мерной направляющей РНК. Для PPIB, две из трех направляющих РНК приводили к поддающемуся детекции расщеплению по этому способу, и три из трех для гена-мишени DNMT3B. для двух других конструкций, в которых использовали нуклеазу MAD7 с оптимизированным кодонным составом для E. coli, также показано формирование инделов с относительно сходной эффективностью, как для конструкций с оптимизированным кодонным составом для человека (данные не представлены). В общем, эти данные показывают успешную активность расщепления MAD7 в клетках млекопитающих in vivo.

[00374] Совместно, эти данные показывают, что MAD7 подвергается эффективной экспрессии и сворачиванию в клетках млекопитающих и эффективно функционирует in vitro и in vivo для последовательностей-мишеней млекопитающих. Данные in vitro показывают также, что более короткая 42-мерная гРНК осуществляет разрезание так эффективно, как более длинные 56-мерные гРНК, хотя это необязательно наблюдали при измерении эндогенного образования инделов в клетках млекопитающих.

Пример 19. Дополнительная характеризация нуклеаз MAD

[00375] Скрининг по редактированию проводили для дополнительной характеризации предпочтений PAM для выбранных нуклеаз MAD. Ген galK использовали в качестве мишени для этого скрининга. Некоторые примечательные наблюдения из этих данных включают то, что редактирование наблюдали для MAD7 с использованием PAM GTTG и TTTC, и редактирование наблюдали для MAD2 с использованием PAM TTTC. Некоторую клеточную токсичность наблюдали в этих экспериментах. В таблице 11 обобщены результаты этих экспериментов.

Таблица 11

Нуклеаза MAD Разрезанных участков Редактированных участков Количество КОЕ редактированных клеток
MAD2 4/7 2/7 >1e5
MAD4 5/7 0/7 0
MAD7 5/7 2/7 1e4

[00376] Анализ скрининга PAM повторяли с использованием MAD2, MAD4 и MAD7. В соответствии с дизайном эксперимента для этого анализа, белые колонии отражают вставки стоп-кодона из-за гомологичной рекомбинации редактирующей кассеты, содержащей мутацию, в то время как красные колонии показывают, что стоп-кодон не был вставлен. Для MAD2 показано редактирование, согласующееся с описанными ранее данными о специфичности PAM. Для MAD4 показана высокая клеточная токсичность и наличие меньшего количества поддающихся наблюдению колоний, по сравнению с трансформированными MAD2 и MAD7 клетками. Для MAD7 показаны результаты редактирования, согласующиеся с описанными ранее данными о специфичности PAM, и показана более широкая эффективность редактирования, чем для MAD2.

[00377] Эти данные показывают эффективность редактирования более 90%, несмотря на низкую частоту выживаемости клеток. В Таблице 12 обобщены результаты экспериментов. Эти данные показывают, что существует более низкая изменчивость между участками PAM для MAD4 (в ~2,3 раза) по сравнению с MAD2 (в 25 раз) или MAD7 (в 101 раз). Эту кратность изменения рассчитывали следующим образом: кратность изменения =макс.(КОЕ редактированных)/мин.(КОЕ редактированных).

Таблица 12

Нуклеаза MAD Разрезанных участков Редактированных разрезанных участков Количество КОЕ редактированных клеток Кратность изменения между макс. и мин. КОЕ редактированных
MAD2 5/10 2/5 1,7e5 25
MAD4 7/10 7/7 <1,5e3 2,3
MAD7 6/10 6/7 6,7e4 101

[00378] В то время как изобретение охвачено описанием вариантов осуществления во множестве различных форм, как подробно описано в связи с предпочтительными вариантами осуществления изобретения, понятно, что настоящее описание следует рассматривать как иллюстрирующее принципы изобретения и оно не является ограничивающим изобретение конкретными вариантами осуществления, проиллюстрированными и описанными в настоящем описании. Специалист в данной области может вносить многочисленные изменения без отклонения от содержания изобретения. Объем изобретения определяется пунктами прилагаемой формулы изобретения и их эквивалентами. Реферат и название не следует рассматривать как ограничивающие объем настоящего изобретения, поскольку их целью является обеспечение возможности для компетентных органов, так же как для широкой общественности, быстро определять общий характер изобретения.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> INSCRIPTA, INC.

<120> НАПРАВЛЯЕМЫЕ НУКЛЕИНОВЫМИ КИСЛОТАМИ НУКЛЕАЗЫ

<130> 49022-717.601

<140> PCT/US2018/034779

<141> 2018-05-25

<150> 15/631989

<151> 2017-06-23

<150> 15/632001

<151> 2017-06-23

<160> 801

<170> PatentIn версии 3.5

<210> 1

<211> 1358

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 1

Met Gly Lys Met Tyr Tyr Leu Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Tyr Ala Val Thr Asp Pro Ser Tyr His Leu Leu Lys Phe Lys Gly

20 25 30

Glu Pro Met Trp Gly Ala His Val Phe Ala Ala Gly Asn Gln Ser Ala

35 40 45

Glu Arg Arg Ser Phe Arg Thr Ser Arg Arg Arg Leu Asp Arg Arg Gln

50 55 60

Gln Arg Val Lys Leu Val Gln Glu Ile Phe Ala Pro Val Ile Ser Pro

65 70 75 80

Ile Asp Pro Arg Phe Phe Ile Arg Leu His Glu Ser Ala Leu Trp Arg

85 90 95

Asp Asp Val Ala Glu Thr Asp Lys His Ile Phe Phe Asn Asp Pro Thr

100 105 110

Tyr Thr Asp Lys Glu Tyr Tyr Ser Asp Tyr Pro Thr Ile His His Leu

115 120 125

Ile Val Asp Leu Met Glu Ser Ser Glu Lys His Asp Pro Arg Leu Val

130 135 140

Tyr Leu Ala Val Ala Trp Leu Val Ala His Arg Gly His Phe Leu Asn

145 150 155 160

Glu Val Asp Lys Asp Asn Ile Gly Asp Val Leu Ser Phe Asp Ala Phe

165 170 175

Tyr Pro Glu Phe Leu Ala Phe Leu Ser Asp Asn Gly Val Ser Pro Trp

180 185 190

Val Cys Glu Ser Lys Ala Leu Gln Ala Thr Leu Leu Ser Arg Asn Ser

195 200 205

Val Asn Asp Lys Tyr Lys Ala Leu Lys Ser Leu Ile Phe Gly Ser Gln

210 215 220

Lys Pro Glu Asp Asn Phe Asp Ala Asn Ile Ser Glu Asp Gly Leu Ile

225 230 235 240

Gln Leu Leu Ala Gly Lys Lys Val Lys Val Asn Lys Leu Phe Pro Gln

245 250 255

Glu Ser Asn Asp Ala Ser Phe Thr Leu Asn Asp Lys Glu Asp Ala Ile

260 265 270

Glu Glu Ile Leu Gly Thr Leu Thr Pro Asp Glu Cys Glu Trp Ile Ala

275 280 285

His Ile Arg Arg Leu Phe Asp Trp Ala Ile Met Lys His Ala Leu Lys

290 295 300

Asp Gly Arg Thr Ile Ser Glu Ser Lys Val Lys Leu Tyr Glu Gln His

305 310 315 320

His His Asp Leu Thr Gln Leu Lys Tyr Phe Val Lys Thr Tyr Leu Ala

325 330 335

Lys Glu Tyr Asp Asp Ile Phe Arg Asn Val Asp Ser Glu Thr Thr Lys

340 345 350

Asn Tyr Val Ala Tyr Ser Tyr His Val Lys Glu Val Lys Gly Thr Leu

355 360 365

Pro Lys Asn Lys Ala Thr Gln Glu Glu Phe Cys Lys Tyr Val Leu Gly

370 375 380

Lys Val Lys Asn Ile Glu Cys Ser Glu Ala Asp Lys Val Asp Phe Asp

385 390 395 400

Glu Met Ile Gln Arg Leu Thr Asp Asn Ser Phe Met Pro Lys Gln Val

405 410 415

Ser Gly Glu Asn Arg Val Ile Pro Tyr Gln Leu Tyr Tyr Tyr Glu Leu

420 425 430

Lys Thr Ile Leu Asn Lys Ala Ala Ser Tyr Leu Pro Phe Leu Thr Gln

435 440 445

Cys Gly Lys Asp Ala Ile Ser Asn Gln Asp Lys Leu Leu Ser Ile Met

450 455 460

Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Arg Lys Asp Asn Ser

465 470 475 480

Glu His Ala Trp Leu Glu Arg Lys Ala Gly Lys Ile Tyr Pro Trp Asn

485 490 495

Phe Asn Asp Lys Val Asp Leu Asp Lys Ser Glu Glu Ala Phe Ile Arg

500 505 510

Arg Met Thr Asn Thr Cys Thr Tyr Tyr Pro Gly Glu Asp Val Leu Pro

515 520 525

Leu Asp Ser Leu Ile Tyr Glu Lys Phe Met Ile Leu Asn Glu Ile Asn

530 535 540

Asn Ile Arg Ile Asp Gly Tyr Pro Ile Ser Val Asp Val Lys Gln Gln

545 550 555 560

Val Phe Gly Leu Phe Glu Lys Lys Arg Arg Val Thr Val Lys Asp Ile

565 570 575

Gln Asn Leu Leu Leu Ser Leu Gly Ala Leu Asp Lys His Gly Lys Leu

580 585 590

Thr Gly Ile Asp Thr Thr Ile His Ser Asn Tyr Asn Thr Tyr His His

595 600 605

Phe Lys Ser Leu Met Glu Arg Gly Val Leu Thr Arg Asp Asp Val Glu

610 615 620

Arg Ile Val Glu Arg Met Thr Tyr Ser Asp Asp Thr Lys Arg Val Arg

625 630 635 640

Leu Trp Leu Asn Asn Asn Tyr Gly Thr Leu Thr Ala Asp Asp Val Lys

645 650 655

His Ile Ser Arg Leu Arg Lys His Asp Phe Gly Arg Leu Ser Lys Met

660 665 670

Phe Leu Thr Gly Leu Lys Gly Val His Lys Glu Thr Gly Glu Arg Ala

675 680 685

Ser Ile Leu Asp Phe Met Trp Asn Thr Asn Asp Asn Leu Met Gln Leu

690 695 700

Leu Ser Glu Cys Tyr Thr Phe Ser Asp Glu Ile Thr Lys Leu Gln Glu

705 710 715 720

Ala Tyr Tyr Ala Lys Ala Gln Leu Ser Leu Asn Asp Phe Leu Asp Ser

725 730 735

Met Tyr Ile Ser Asn Ala Val Lys Arg Pro Ile Tyr Arg Thr Leu Ala

740 745 750

Val Val Asn Asp Ile Arg Lys Ala Cys Gly Thr Ala Pro Lys Arg Ile

755 760 765

Phe Ile Glu Met Ala Arg Asp Gly Glu Ser Lys Lys Lys Arg Ser Val

770 775 780

Thr Arg Arg Glu Gln Ile Lys Asn Leu Tyr Arg Ser Ile Arg Lys Asp

785 790 795 800

Phe Gln Gln Glu Val Asp Phe Leu Glu Lys Ile Leu Glu Asn Lys Ser

805 810 815

Asp Gly Gln Leu Gln Ser Asp Ala Leu Tyr Leu Tyr Phe Ala Gln Leu

820 825 830

Gly Arg Asp Met Tyr Thr Gly Asp Pro Ile Lys Leu Glu His Ile Lys

835 840 845

Asp Gln Ser Phe Tyr Asn Ile Asp His Ile Tyr Pro Gln Ser Met Val

850 855 860

Lys Asp Asp Ser Leu Asp Asn Lys Val Leu Val Gln Ser Glu Ile Asn

865 870 875 880

Gly Glu Lys Ser Ser Arg Tyr Pro Leu Asp Ala Ala Ile Arg Asn Lys

885 890 895

Met Lys Pro Leu Trp Asp Ala Tyr Tyr Asn His Gly Leu Ile Ser Leu

900 905 910

Lys Lys Tyr Gln Arg Leu Thr Arg Ser Thr Pro Phe Thr Asp Asp Glu

915 920 925

Lys Trp Asp Phe Ile Asn Arg Gln Leu Val Glu Thr Arg Gln Ser Thr

930 935 940

Lys Ala Leu Ala Ile Leu Leu Lys Arg Lys Phe Pro Asp Thr Glu Ile

945 950 955 960

Val Tyr Ser Lys Ala Gly Leu Ser Ser Asp Phe Arg His Glu Phe Gly

965 970 975

Leu Val Lys Ser Arg Asn Ile Asn Asp Leu His His Ala Lys Asp Ala

980 985 990

Phe Leu Ala Ile Val Thr Gly Asn Val Tyr His Glu Arg Phe Asn Arg

995 1000 1005

Arg Trp Phe Met Val Asn Gln Pro Tyr Ser Val Lys Thr Lys Thr

1010 1015 1020

Leu Phe Thr His Ser Ile Lys Asn Gly Asn Phe Val Ala Trp Asn

1025 1030 1035

Gly Glu Glu Asp Leu Gly Arg Ile Val Lys Met Leu Lys Gln Asn

1040 1045 1050

Lys Asn Thr Ile His Phe Thr Arg Phe Ser Phe Asp Arg Lys Glu

1055 1060 1065

Gly Leu Phe Asp Ile Gln Pro Leu Lys Ala Ser Thr Gly Leu Val

1070 1075 1080

Pro Arg Lys Ala Gly Leu Asp Val Val Lys Tyr Gly Gly Tyr Asp

1085 1090 1095

Lys Ser Thr Ala Ala Tyr Tyr Leu Leu Val Arg Phe Thr Leu Glu

1100 1105 1110

Asp Lys Lys Thr Gln His Lys Leu Met Met Ile Pro Val Glu Gly

1115 1120 1125

Leu Tyr Lys Ala Arg Ile Asp His Asp Lys Glu Phe Leu Thr Asp

1130 1135 1140

Tyr Ala Gln Thr Thr Ile Ser Glu Ile Leu Gln Lys Asp Lys Gln

1145 1150 1155

Lys Val Ile Asn Ile Met Phe Pro Met Gly Thr Arg His Ile Lys

1160 1165 1170

Leu Asn Ser Met Ile Ser Ile Asp Gly Phe Tyr Leu Ser Ile Gly

1175 1180 1185

Gly Lys Ser Ser Lys Gly Lys Ser Val Leu Cys His Ala Met Val

1190 1195 1200

Pro Leu Ile Val Pro His Lys Ile Glu Cys Tyr Ile Lys Ala Met

1205 1210 1215

Glu Ser Phe Ala Arg Lys Phe Lys Glu Asn Asn Lys Leu Arg Ile

1220 1225 1230

Val Glu Lys Phe Asp Lys Ile Thr Val Glu Asp Asn Leu Asn Leu

1235 1240 1245

Tyr Glu Leu Phe Leu Gln Lys Leu Gln His Asn Pro Tyr Asn Lys

1250 1255 1260

Phe Phe Ser Thr Gln Phe Asp Val Leu Thr Asn Gly Arg Ser Thr

1265 1270 1275

Phe Thr Lys Leu Ser Pro Glu Glu Gln Val Gln Thr Leu Leu Asn

1280 1285 1290

Ile Leu Ser Ile Phe Lys Thr Cys Arg Ser Ser Gly Cys Asp Leu

1295 1300 1305

Lys Ser Ile Asn Gly Ser Ala Gln Ala Ala Arg Ile Met Ile Ser

1310 1315 1320

Ala Asp Leu Thr Gly Leu Ser Lys Lys Tyr Ser Asp Ile Arg Leu

1325 1330 1335

Val Glu Gln Ser Ala Ser Gly Leu Phe Val Ser Lys Ser Gln Asn

1340 1345 1350

Leu Leu Glu Tyr Leu

1355

<210> 2

<211> 1334

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 2

Met Ser Ser Leu Thr Lys Phe Thr Asn Lys Tyr Ser Lys Gln Leu Thr

1 5 10 15

Ile Lys Asn Glu Leu Ile Pro Val Gly Lys Thr Leu Glu Asn Ile Lys

20 25 30

Glu Asn Gly Leu Ile Asp Gly Asp Glu Gln Leu Asn Glu Asn Tyr Gln

35 40 45

Lys Ala Lys Ile Ile Val Asp Asp Phe Leu Arg Asp Phe Ile Asn Lys

50 55 60

Ala Leu Asn Asn Thr Gln Ile Gly Asn Trp Arg Glu Leu Ala Asp Ala

65 70 75 80

Leu Asn Lys Glu Asp Glu Asp Asn Ile Glu Lys Leu Gln Asp Lys Ile

85 90 95

Arg Gly Ile Ile Val Ser Lys Phe Glu Thr Phe Asp Leu Phe Ser Ser

100 105 110

Tyr Ser Ile Lys Lys Asp Glu Lys Ile Ile Asp Asp Asp Asn Asp Val

115 120 125

Glu Glu Glu Glu Leu Asp Leu Gly Lys Lys Thr Ser Ser Phe Lys Tyr

130 135 140

Ile Phe Lys Lys Asn Leu Phe Lys Leu Val Leu Pro Ser Tyr Leu Lys

145 150 155 160

Thr Thr Asn Gln Asp Lys Leu Lys Ile Ile Ser Ser Phe Asp Asn Phe

165 170 175

Ser Thr Tyr Phe Arg Gly Phe Phe Glu Asn Arg Lys Asn Ile Phe Thr

180 185 190

Lys Lys Pro Ile Ser Thr Ser Ile Ala Tyr Arg Ile Val His Asp Asn

195 200 205

Phe Pro Lys Phe Leu Asp Asn Ile Arg Cys Phe Asn Val Trp Gln Thr

210 215 220

Glu Cys Pro Gln Leu Ile Val Lys Ala Asp Asn Tyr Leu Lys Ser Lys

225 230 235 240

Asn Val Ile Ala Lys Asp Lys Ser Leu Ala Asn Tyr Phe Thr Val Gly

245 250 255

Ala Tyr Asp Tyr Phe Leu Ser Gln Asn Gly Ile Asp Phe Tyr Asn Asn

260 265 270

Ile Ile Gly Gly Leu Pro Ala Phe Ala Gly His Glu Lys Ile Gln Gly

275 280 285

Leu Asn Glu Phe Ile Asn Gln Glu Cys Gln Lys Asp Ser Glu Leu Lys

290 295 300

Ser Lys Leu Lys Asn Arg His Ala Phe Lys Met Ala Val Leu Phe Lys

305 310 315 320

Gln Ile Leu Ser Asp Arg Glu Lys Ser Phe Val Ile Asp Glu Phe Glu

325 330 335

Ser Asp Ala Gln Val Ile Asp Ala Val Lys Asn Phe Tyr Ala Glu Gln

340 345 350

Cys Lys Asp Asn Asn Val Ile Phe Asn Leu Leu Asn Leu Ile Lys Asn

355 360 365

Ile Ala Phe Leu Ser Asp Asp Glu Leu Asp Gly Ile Phe Ile Glu Gly

370 375 380

Lys Tyr Leu Ser Ser Val Ser Gln Lys Leu Tyr Ser Asp Trp Ser Lys

385 390 395 400

Leu Arg Asn Asp Ile Glu Asp Ser Ala Asn Ser Lys Gln Gly Asn Lys

405 410 415

Glu Leu Ala Lys Lys Ile Lys Thr Asn Lys Gly Asp Val Glu Lys Ala

420 425 430

Ile Ser Lys Tyr Glu Phe Ser Leu Ser Glu Leu Asn Ser Ile Val His

435 440 445

Asp Asn Thr Lys Phe Ser Asp Leu Leu Ser Cys Thr Leu His Lys Val

450 455 460

Ala Ser Glu Lys Leu Val Lys Val Asn Glu Gly Asp Trp Pro Lys His

465 470 475 480

Leu Lys Asn Asn Glu Glu Lys Gln Lys Ile Lys Glu Pro Leu Asp Ala

485 490 495

Leu Leu Glu Ile Tyr Asn Thr Leu Leu Ile Phe Asn Cys Lys Ser Phe

500 505 510

Asn Lys Asn Gly Asn Phe Tyr Val Asp Tyr Asp Arg Cys Ile Asn Glu

515 520 525

Leu Ser Ser Val Val Tyr Leu Tyr Asn Lys Thr Arg Asn Tyr Cys Thr

530 535 540

Lys Lys Pro Tyr Asn Thr Asp Lys Phe Lys Leu Asn Phe Asn Ser Pro

545 550 555 560

Gln Leu Gly Glu Gly Phe Ser Lys Ser Lys Glu Asn Asp Cys Leu Thr

565 570 575

Leu Leu Phe Lys Lys Asp Asp Asn Tyr Tyr Val Gly Ile Ile Arg Lys

580 585 590

Gly Ala Lys Ile Asn Phe Asp Asp Thr Gln Ala Ile Ala Asp Asn Thr

595 600 605

Asp Asn Cys Ile Phe Lys Met Asn Tyr Phe Leu Leu Lys Asp Ala Lys

610 615 620

Lys Phe Ile Pro Lys Cys Ser Ile Gln Leu Lys Glu Val Lys Ala His

625 630 635 640

Phe Lys Lys Ser Glu Asp Asp Tyr Ile Leu Ser Asp Lys Glu Lys Phe

645 650 655

Ala Ser Pro Leu Val Ile Lys Lys Ser Thr Phe Leu Leu Ala Thr Ala

660 665 670

His Val Lys Gly Lys Lys Gly Asn Ile Lys Lys Phe Gln Lys Glu Tyr

675 680 685

Ser Lys Glu Asn Pro Thr Glu Tyr Arg Asn Ser Leu Asn Glu Trp Ile

690 695 700

Ala Phe Cys Lys Glu Phe Leu Lys Thr Tyr Lys Ala Ala Thr Ile Phe

705 710 715 720

Asp Ile Thr Thr Leu Lys Lys Ala Glu Glu Tyr Ala Asp Ile Val Glu

725 730 735

Phe Tyr Lys Asp Val Asp Asn Leu Cys Tyr Lys Leu Glu Phe Cys Pro

740 745 750

Ile Lys Thr Ser Phe Ile Glu Asn Leu Ile Asp Asn Gly Asp Leu Tyr

755 760 765

Leu Phe Arg Ile Asn Asn Lys Asp Phe Ser Ser Lys Ser Thr Gly Thr

770 775 780

Lys Asn Leu His Thr Leu Tyr Leu Gln Ala Ile Phe Asp Glu Arg Asn

785 790 795 800

Leu Asn Asn Pro Thr Ile Met Leu Asn Gly Gly Ala Glu Leu Phe Tyr

805 810 815

Arg Lys Glu Ser Ile Glu Gln Lys Asn Arg Ile Thr His Lys Ala Gly

820 825 830

Ser Ile Leu Val Asn Lys Val Cys Lys Asp Gly Thr Ser Leu Asp Asp

835 840 845

Lys Ile Arg Asn Glu Ile Tyr Gln Tyr Glu Asn Lys Phe Ile Asp Thr

850 855 860

Leu Ser Asp Glu Ala Lys Lys Val Leu Pro Asn Val Ile Lys Lys Glu

865 870 875 880

Ala Thr His Asp Ile Thr Lys Asp Lys Arg Phe Thr Ser Asp Lys Phe

885 890 895

Phe Phe His Cys Pro Leu Thr Ile Asn Tyr Lys Glu Gly Asp Thr Lys

900 905 910

Gln Phe Asn Asn Glu Val Leu Ser Phe Leu Arg Gly Asn Pro Asp Ile

915 920 925

Asn Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Val Thr

930 935 940

Val Ile Asn Gln Lys Gly Glu Ile Leu Asp Ser Val Ser Phe Asn Thr

945 950 955 960

Val Thr Asn Lys Ser Ser Lys Ile Glu Gln Thr Val Asp Tyr Glu Glu

965 970 975

Lys Leu Ala Val Arg Glu Lys Glu Arg Ile Glu Ala Lys Arg Ser Trp

980 985 990

Asp Ser Ile Ser Lys Ile Ala Thr Leu Lys Glu Gly Tyr Leu Ser Ala

995 1000 1005

Ile Val His Glu Ile Cys Leu Leu Met Ile Lys His Asn Ala Ile

1010 1015 1020

Val Val Leu Glu Asn Leu Asn Ala Gly Phe Lys Arg Ile Arg Gly

1025 1030 1035

Gly Leu Ser Glu Lys Ser Val Tyr Gln Lys Phe Glu Lys Met Leu

1040 1045 1050

Ile Asn Lys Leu Asn Tyr Phe Val Ser Lys Lys Glu Ser Asp Trp

1055 1060 1065

Asn Lys Pro Ser Gly Leu Leu Asn Gly Leu Gln Leu Ser Asp Gln

1070 1075 1080

Phe Glu Ser Phe Glu Lys Leu Gly Ile Gln Ser Gly Phe Ile Phe

1085 1090 1095

Tyr Val Pro Ala Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly

1100 1105 1110

Phe Ala Asn Val Leu Asn Leu Ser Lys Val Arg Asn Val Asp Ala

1115 1120 1125

Ile Lys Ser Phe Phe Ser Asn Phe Asn Glu Ile Ser Tyr Ser Lys

1130 1135 1140

Lys Glu Ala Leu Phe Lys Phe Ser Phe Asp Leu Asp Ser Leu Ser

1145 1150 1155

Lys Lys Gly Phe Ser Ser Phe Val Lys Phe Ser Lys Ser Lys Trp

1160 1165 1170

Asn Val Tyr Thr Phe Gly Glu Arg Ile Ile Lys Pro Lys Asn Lys

1175 1180 1185

Gln Gly Tyr Arg Glu Asp Lys Arg Ile Asn Leu Thr Phe Glu Met

1190 1195 1200

Lys Lys Leu Leu Asn Glu Tyr Lys Val Ser Phe Asp Leu Glu Asn

1205 1210 1215

Asn Leu Ile Pro Asn Leu Thr Ser Ala Asn Leu Lys Asp Thr Phe

1220 1225 1230

Trp Lys Glu Leu Phe Phe Ile Phe Lys Thr Thr Leu Gln Leu Arg

1235 1240 1245

Asn Ser Val Thr Asn Gly Lys Glu Asp Val Leu Ile Ser Pro Val

1250 1255 1260

Lys Asn Ala Lys Gly Glu Phe Phe Val Ser Gly Thr His Asn Lys

1265 1270 1275

Thr Leu Pro Gln Asp Cys Asp Ala Asn Gly Ala Tyr His Ile Ala

1280 1285 1290

Leu Lys Gly Leu Met Ile Leu Glu Arg Asn Asn Leu Val Arg Glu

1295 1300 1305

Glu Lys Asp Thr Lys Lys Ile Met Ala Ile Ser Asn Val Asp Trp

1310 1315 1320

Phe Glu Tyr Val Gln Lys Arg Arg Gly Val Leu

1325 1330

<210> 3

<211> 1238

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 3

Met Asn Asn Tyr Asp Glu Phe Thr Lys Leu Tyr Pro Ile Gln Lys Thr

1 5 10 15

Ile Arg Phe Glu Leu Lys Pro Gln Gly Arg Thr Met Glu His Leu Glu

20 25 30

Thr Phe Asn Phe Phe Glu Glu Asp Arg Asp Arg Ala Glu Lys Tyr Lys

35 40 45

Ile Leu Lys Glu Ala Ile Asp Glu Tyr His Lys Lys Phe Ile Asp Glu

50 55 60

His Leu Thr Asn Met Ser Leu Asp Trp Asn Ser Leu Lys Gln Ile Ser

65 70 75 80

Glu Lys Tyr Tyr Lys Ser Arg Glu Glu Lys Asp Lys Lys Val Phe Leu

85 90 95

Ser Glu Gln Lys Arg Met Arg Gln Glu Ile Val Ser Glu Phe Lys Lys

100 105 110

Asp Asp Arg Phe Lys Asp Leu Phe Ser Lys Lys Leu Phe Ser Glu Leu

115 120 125

Leu Lys Glu Glu Ile Tyr Lys Lys Gly Asn His Gln Glu Ile Asp Ala

130 135 140

Leu Lys Ser Phe Asp Lys Phe Ser Gly Tyr Phe Ile Gly Leu His Glu

145 150 155 160

Asn Arg Lys Asn Met Tyr Ser Asp Gly Asp Glu Ile Thr Ala Ile Ser

165 170 175

Asn Arg Ile Val Asn Glu Asn Phe Pro Lys Phe Leu Asp Asn Leu Gln

180 185 190

Lys Tyr Gln Glu Ala Arg Lys Lys Tyr Pro Glu Trp Ile Ile Lys Ala

195 200 205

Glu Ser Ala Leu Val Ala His Asn Ile Lys Met Asp Glu Val Phe Ser

210 215 220

Leu Glu Tyr Phe Asn Lys Val Leu Asn Gln Glu Gly Ile Gln Arg Tyr

225 230 235 240

Asn Leu Ala Leu Gly Gly Tyr Val Thr Lys Ser Gly Glu Lys Met Met

245 250 255

Gly Leu Asn Asp Ala Leu Asn Leu Ala His Gln Ser Glu Lys Ser Ser

260 265 270

Lys Gly Arg Ile His Met Thr Pro Leu Phe Lys Gln Ile Leu Ser Glu

275 280 285

Lys Glu Ser Phe Ser Tyr Ile Pro Asp Val Phe Thr Glu Asp Ser Gln

290 295 300

Leu Leu Pro Ser Ile Gly Gly Phe Phe Ala Gln Ile Glu Asn Asp Lys

305 310 315 320

Asp Gly Asn Ile Phe Asp Arg Ala Leu Glu Leu Ile Ser Ser Tyr Ala

325 330 335

Glu Tyr Asp Thr Glu Arg Ile Tyr Ile Arg Gln Ala Asp Ile Asn Arg

340 345 350

Val Ser Asn Val Ile Phe Gly Glu Trp Gly Thr Leu Gly Gly Leu Met

355 360 365

Arg Glu Tyr Lys Ala Asp Ser Ile Asn Asp Ile Asn Leu Glu Arg Thr

370 375 380

Cys Lys Lys Val Asp Lys Trp Leu Asp Ser Lys Glu Phe Ala Leu Ser

385 390 395 400

Asp Val Leu Glu Ala Ile Lys Arg Thr Gly Asn Asn Asp Ala Phe Asn

405 410 415

Glu Tyr Ile Ser Lys Met Arg Thr Ala Arg Glu Lys Ile Asp Ala Ala

420 425 430

Arg Lys Glu Met Lys Phe Ile Ser Glu Lys Ile Ser Gly Asp Glu Glu

435 440 445

Ser Ile His Ile Ile Lys Thr Leu Leu Asp Ser Val Gln Gln Phe Leu

450 455 460

His Phe Phe Asn Leu Phe Lys Ala Arg Gln Asp Ile Pro Leu Asp Gly

465 470 475 480

Ala Phe Tyr Ala Glu Phe Asp Glu Val His Ser Lys Leu Phe Ala Ile

485 490 495

Val Pro Leu Tyr Asn Lys Val Arg Asn Tyr Leu Thr Lys Asn Asn Leu

500 505 510

Asn Thr Lys Lys Ile Lys Leu Asn Phe Lys Asn Pro Thr Leu Ala Asn

515 520 525

Gly Trp Asp Gln Asn Lys Val Tyr Asp Tyr Ala Ser Leu Ile Phe Leu

530 535 540

Arg Asp Gly Asn Tyr Tyr Leu Gly Ile Ile Asn Pro Lys Arg Lys Lys

545 550 555 560

Asn Ile Lys Phe Glu Gln Gly Ser Gly Asn Gly Pro Phe Tyr Arg Lys

565 570 575

Met Val Tyr Lys Gln Ile Pro Gly Pro Asn Lys Asn Leu Pro Arg Val

580 585 590

Phe Leu Thr Ser Thr Lys Gly Lys Lys Glu Tyr Lys Pro Ser Lys Glu

595 600 605

Ile Ile Glu Gly Tyr Glu Ala Asp Lys His Ile Arg Gly Asp Lys Phe

610 615 620

Asp Leu Asp Phe Cys His Lys Leu Ile Asp Phe Phe Lys Glu Ser Ile

625 630 635 640

Glu Lys His Lys Asp Trp Ser Lys Phe Asn Phe Tyr Phe Ser Pro Thr

645 650 655

Glu Ser Tyr Gly Asp Ile Ser Glu Phe Tyr Leu Asp Val Glu Lys Gln

660 665 670

Gly Tyr Arg Met His Phe Glu Asn Ile Ser Ala Glu Thr Ile Asp Glu

675 680 685

Tyr Val Glu Lys Gly Asp Leu Phe Leu Phe Gln Ile Tyr Asn Lys Asp

690 695 700

Phe Val Lys Ala Ala Thr Gly Lys Lys Asp Met His Thr Ile Tyr Trp

705 710 715 720

Asn Ala Ala Phe Ser Pro Glu Asn Leu Gln Asp Val Val Val Lys Leu

725 730 735

Asn Gly Glu Ala Glu Leu Phe Tyr Arg Asp Lys Ser Asp Ile Lys Glu

740 745 750

Ile Val His Arg Glu Gly Glu Ile Leu Val Asn Arg Thr Tyr Asn Gly

755 760 765

Arg Thr Pro Val Pro Asp Lys Ile His Lys Lys Leu Thr Asp Tyr His

770 775 780

Asn Gly Arg Thr Lys Asp Leu Gly Glu Ala Lys Glu Tyr Leu Asp Lys

785 790 795 800

Val Arg Tyr Phe Lys Ala His Tyr Asp Ile Thr Lys Asp Arg Arg Tyr

805 810 815

Leu Asn Asp Lys Ile Tyr Phe His Val Pro Leu Thr Leu Asn Phe Lys

820 825 830

Ala Asn Gly Lys Lys Asn Leu Asn Lys Met Val Ile Glu Lys Phe Leu

835 840 845

Ser Asp Glu Lys Ala His Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn

850 855 860

Leu Leu Tyr Tyr Ser Ile Ile Asp Arg Ser Gly Lys Ile Ile Asp Gln

865 870 875 880

Gln Ser Leu Asn Val Ile Asp Gly Phe Asp Tyr Arg Glu Lys Leu Asn

885 890 895

Gln Arg Glu Ile Glu Met Lys Asp Ala Arg Gln Ser Trp Asn Ala Ile

900 905 910

Gly Lys Ile Lys Asp Leu Lys Glu Gly Tyr Leu Ser Lys Ala Val His

915 920 925

Glu Ile Thr Lys Met Ala Ile Gln Tyr Asn Ala Ile Val Val Met Glu

930 935 940

Glu Leu Asn Tyr Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln

945 950 955 960

Ile Tyr Gln Lys Phe Glu Asn Met Leu Ile Asp Lys Met Asn Tyr Leu

965 970 975

Val Phe Lys Asp Ala Pro Asp Glu Ser Pro Gly Gly Val Leu Asn Ala

980 985 990

Tyr Gln Leu Thr Asn Pro Leu Glu Ser Phe Ala Lys Leu Gly Lys Gln

995 1000 1005

Thr Gly Ile Leu Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys Ile

1010 1015 1020

Asp Pro Thr Thr Gly Phe Val Asn Leu Phe Asn Thr Ser Ser Lys

1025 1030 1035

Thr Asn Ala Gln Glu Arg Lys Glu Phe Leu Gln Lys Phe Glu Ser

1040 1045 1050

Ile Ser Tyr Ser Ala Lys Asp Gly Gly Ile Phe Ala Phe Ala Phe

1055 1060 1065

Asp Tyr Arg Lys Phe Gly Thr Ser Lys Thr Asp His Lys Asn Val

1070 1075 1080

Trp Thr Ala Tyr Thr Asn Gly Glu Arg Met Arg Tyr Ile Lys Glu

1085 1090 1095

Lys Lys Arg Asn Glu Leu Phe Asp Pro Ser Lys Glu Ile Lys Glu

1100 1105 1110

Ala Leu Thr Ser Ser Gly Ile Lys Tyr Asp Gly Gly Gln Asn Ile

1115 1120 1125

Leu Pro Asp Ile Leu Arg Ser Asn Asn Asn Gly Leu Ile Tyr Thr

1130 1135 1140

Met Tyr Ser Ser Phe Ile Ala Ala Ile Gln Met Arg Val Tyr Asp

1145 1150 1155

Gly Lys Glu Asp Tyr Ile Ile Ser Pro Ile Lys Asn Ser Lys Gly

1160 1165 1170

Glu Phe Phe Arg Thr Asp Pro Lys Arg Arg Glu Leu Pro Ile Asp

1175 1180 1185

Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Leu Arg Gly Glu Leu

1190 1195 1200

Thr Met Arg Ala Ile Ala Glu Lys Phe Asp Pro Asp Ser Glu Lys

1205 1210 1215

Met Ala Lys Leu Glu Leu Lys His Lys Asp Trp Phe Glu Phe Met

1220 1225 1230

Gln Thr Arg Gly Asp

1235

<210> 4

<211> 1298

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 4

Met Thr Lys Thr Phe Asp Ser Glu Phe Phe Asn Leu Tyr Ser Leu Gln

1 5 10 15

Lys Thr Val Arg Phe Glu Leu Lys Pro Val Gly Glu Thr Ala Ser Phe

20 25 30

Val Glu Asp Phe Lys Asn Glu Gly Leu Lys Arg Val Val Ser Glu Asp

35 40 45

Glu Arg Arg Ala Val Asp Tyr Gln Lys Val Lys Glu Ile Ile Asp Asp

50 55 60

Tyr His Arg Asp Phe Ile Glu Glu Ser Leu Asn Tyr Phe Pro Glu Gln

65 70 75 80

Val Ser Lys Asp Ala Leu Glu Gln Ala Phe His Leu Tyr Gln Lys Leu

85 90 95

Lys Ala Ala Lys Val Glu Glu Arg Glu Lys Ala Leu Lys Glu Trp Glu

100 105 110

Ala Leu Gln Lys Lys Leu Arg Glu Lys Val Val Lys Cys Phe Ser Asp

115 120 125

Ser Asn Lys Ala Arg Phe Ser Arg Ile Asp Lys Lys Glu Leu Ile Lys

130 135 140

Glu Asp Leu Ile Asn Trp Leu Val Ala Gln Asn Arg Glu Asp Asp Ile

145 150 155 160

Pro Thr Val Glu Thr Phe Asn Asn Phe Thr Thr Tyr Phe Thr Gly Phe

165 170 175

His Glu Asn Arg Lys Asn Ile Tyr Ser Lys Asp Asp His Ala Thr Ala

180 185 190

Ile Ser Phe Arg Leu Ile His Glu Asn Leu Pro Lys Phe Phe Asp Asn

195 200 205

Val Ile Ser Phe Asn Lys Leu Lys Glu Gly Phe Pro Glu Leu Lys Phe

210 215 220

Asp Lys Val Lys Glu Asp Leu Glu Val Asp Tyr Asp Leu Lys His Ala

225 230 235 240

Phe Glu Ile Glu Tyr Phe Val Asn Phe Val Thr Gln Ala Gly Ile Asp

245 250 255

Gln Tyr Asn Tyr Leu Leu Gly Gly Lys Thr Leu Glu Asp Gly Thr Lys

260 265 270

Lys Gln Gly Met Asn Glu Gln Ile Asn Leu Phe Lys Gln Gln Gln Thr

275 280 285

Arg Asp Lys Ala Arg Gln Ile Pro Lys Leu Ile Pro Leu Phe Lys Gln

290 295 300

Ile Leu Ser Glu Arg Thr Glu Ser Gln Ser Phe Ile Pro Lys Gln Phe

305 310 315 320

Glu Ser Asp Gln Glu Leu Phe Asp Ser Leu Gln Lys Leu His Asn Asn

325 330 335

Cys Gln Asp Lys Phe Thr Val Leu Gln Gln Ala Ile Leu Gly Leu Ala

340 345 350

Glu Ala Asp Leu Lys Lys Val Phe Ile Lys Thr Ser Asp Leu Asn Ala

355 360 365

Leu Ser Asn Thr Ile Phe Gly Asn Tyr Ser Val Phe Ser Asp Ala Leu

370 375 380

Asn Leu Tyr Lys Glu Ser Leu Lys Thr Lys Lys Ala Gln Glu Ala Phe

385 390 395 400

Glu Lys Leu Pro Ala His Ser Ile His Asp Leu Ile Gln Tyr Leu Glu

405 410 415

Gln Phe Asn Ser Ser Leu Asp Ala Glu Lys Gln Gln Ser Thr Asp Thr

420 425 430

Val Leu Asn Tyr Phe Ile Lys Thr Asp Glu Leu Tyr Ser Arg Phe Ile

435 440 445

Lys Ser Thr Ser Glu Ala Phe Thr Gln Val Gln Pro Leu Phe Glu Leu

450 455 460

Glu Ala Leu Ser Ser Lys Arg Arg Pro Pro Glu Ser Glu Asp Glu Gly

465 470 475 480

Ala Lys Gly Gln Glu Gly Phe Glu Gln Ile Lys Arg Ile Lys Ala Tyr

485 490 495

Leu Asp Thr Leu Met Glu Ala Val His Phe Ala Lys Pro Leu Tyr Leu

500 505 510

Val Lys Gly Arg Lys Met Ile Glu Gly Leu Asp Lys Asp Gln Ser Phe

515 520 525

Tyr Glu Ala Phe Glu Met Ala Tyr Gln Glu Leu Glu Ser Leu Ile Ile

530 535 540

Pro Ile Tyr Asn Lys Ala Arg Ser Tyr Leu Ser Arg Lys Pro Phe Lys

545 550 555 560

Ala Asp Lys Phe Lys Ile Asn Phe Asp Asn Asn Thr Leu Leu Ser Gly

565 570 575

Trp Asp Ala Asn Lys Glu Thr Ala Asn Ala Ser Ile Leu Phe Lys Lys

580 585 590

Asp Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gly Lys Thr Phe Leu

595 600 605

Phe Asp Tyr Phe Val Ser Ser Glu Asp Ser Glu Lys Leu Lys Gln Arg

610 615 620

Arg Gln Lys Thr Ala Glu Glu Ala Leu Ala Gln Asp Gly Glu Ser Tyr

625 630 635 640

Phe Glu Lys Ile Arg Tyr Lys Leu Leu Pro Gly Ala Ser Lys Met Leu

645 650 655

Pro Lys Val Phe Phe Ser Asn Lys Asn Ile Gly Phe Tyr Asn Pro Ser

660 665 670

Asp Asp Ile Leu Arg Ile Arg Asn Thr Ala Ser His Thr Lys Asn Gly

675 680 685

Thr Pro Gln Lys Gly His Ser Lys Val Glu Phe Asn Leu Asn Asp Cys

690 695 700

His Lys Met Ile Asp Phe Phe Lys Ser Ser Ile Gln Lys His Pro Glu

705 710 715 720

Trp Gly Ser Phe Gly Phe Thr Phe Ser Asp Thr Ser Asp Phe Glu Asp

725 730 735

Met Ser Ala Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Val Ile Ser

740 745 750

Phe Asp Lys Ile Lys Glu Thr Tyr Ile Gln Ser Gln Val Glu Gln Gly

755 760 765

Asn Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Tyr Ser

770 775 780

Lys Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Glu

785 790 795 800

Glu Ala Asn Leu Asn Asn Val Val Ala Lys Leu Asn Gly Glu Ala Glu

805 810 815

Ile Phe Phe Arg Arg His Ser Ile Lys Ala Ser Asp Lys Val Val His

820 825 830

Pro Ala Asn Gln Ala Ile Asp Asn Lys Asn Pro His Thr Glu Lys Thr

835 840 845

Gln Ser Thr Phe Glu Tyr Asp Leu Val Lys Asp Lys Arg Tyr Thr Gln

850 855 860

Asp Lys Phe Phe Phe His Val Pro Ile Ser Leu Asn Phe Lys Ala Gln

865 870 875 880

Gly Val Ser Lys Phe Asn Asp Lys Val Asn Gly Phe Leu Lys Gly Asn

885 890 895

Pro Asp Val Asn Ile Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu

900 905 910

Tyr Phe Thr Val Val Asn Gln Lys Gly Glu Ile Leu Val Gln Glu Ser

915 920 925

Leu Asn Thr Leu Met Ser Asp Lys Gly His Val Asn Asp Tyr Gln Gln

930 935 940

Lys Leu Asp Lys Lys Glu Gln Glu Arg Asp Ala Ala Arg Lys Ser Trp

945 950 955 960

Thr Thr Val Glu Asn Ile Lys Glu Leu Lys Glu Gly Tyr Leu Ser His

965 970 975

Val Val His Lys Leu Ala His Leu Ile Ile Lys Tyr Asn Ala Ile Val

980 985 990

Cys Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val

995 1000 1005

Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Ala Leu Ile Asp Lys

1010 1015 1020

Leu Asn Tyr Leu Val Phe Lys Glu Lys Glu Leu Gly Glu Val Gly

1025 1030 1035

His Tyr Leu Thr Ala Tyr Gln Leu Thr Ala Pro Phe Glu Ser Phe

1040 1045 1050

Lys Lys Leu Gly Lys Gln Ser Gly Ile Leu Phe Tyr Val Pro Ala

1055 1060 1065

Asp Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Phe

1070 1075 1080

Leu Asp Leu Arg Tyr Gln Ser Val Glu Lys Ala Lys Gln Leu Leu

1085 1090 1095

Ser Asp Phe Asn Ala Ile Arg Phe Asn Ser Val Gln Asn Tyr Phe

1100 1105 1110

Glu Phe Glu Ile Asp Tyr Lys Lys Leu Thr Pro Lys Arg Lys Val

1115 1120 1125

Gly Thr Gln Ser Lys Trp Val Ile Cys Thr Tyr Gly Asp Val Arg

1130 1135 1140

Tyr Gln Asn Arg Arg Asn Gln Lys Gly His Trp Glu Thr Glu Glu

1145 1150 1155

Val Asn Val Thr Glu Lys Leu Lys Ala Leu Phe Ala Ser Asp Ser

1160 1165 1170

Lys Thr Thr Thr Val Ile Asp Tyr Ala Asn Asp Asp Asn Leu Ile

1175 1180 1185

Asp Val Ile Leu Glu Gln Asp Lys Ala Ser Phe Phe Lys Glu Leu

1190 1195 1200

Leu Trp Leu Leu Lys Leu Thr Met Thr Leu Arg His Ser Lys Ile

1205 1210 1215

Lys Ser Glu Asp Asp Phe Ile Leu Ser Pro Val Lys Asn Glu Gln

1220 1225 1230

Gly Glu Phe Tyr Asp Ser Arg Lys Ala Gly Glu Val Trp Pro Lys

1235 1240 1245

Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Leu

1250 1255 1260

Trp Asn Leu Gln Gln Ile Asn Gln Trp Glu Lys Gly Lys Thr Leu

1265 1270 1275

Asn Leu Ala Ile Lys Asn Gln Asp Trp Phe Ser Phe Ile Gln Glu

1280 1285 1290

Lys Pro Tyr Gln Glu

1295

<210> 5

<211> 1235

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 5

Met His Thr Gly Gly Leu Leu Ser Met Asp Ala Lys Glu Phe Thr Gly

1 5 10 15

Gln Tyr Pro Leu Ser Lys Thr Leu Arg Phe Glu Leu Arg Pro Ile Gly

20 25 30

Arg Thr Trp Asp Asn Leu Glu Ala Ser Gly Tyr Leu Ala Glu Asp Arg

35 40 45

His Arg Ala Glu Cys Tyr Pro Arg Ala Lys Glu Leu Leu Asp Asp Asn

50 55 60

His Arg Ala Phe Leu Asn Arg Val Leu Pro Gln Ile Asp Met Asp Trp

65 70 75 80

His Pro Ile Ala Glu Ala Phe Cys Lys Val His Lys Asn Pro Gly Asn

85 90 95

Lys Glu Leu Ala Gln Asp Tyr Asn Leu Gln Leu Ser Lys Arg Arg Lys

100 105 110

Glu Ile Ser Ala Tyr Leu Gln Asp Ala Asp Gly Tyr Lys Gly Leu Phe

115 120 125

Ala Lys Pro Ala Leu Asp Glu Ala Met Lys Ile Ala Lys Glu Asn Gly

130 135 140

Asn Glu Ser Asp Ile Glu Val Leu Glu Ala Phe Asn Gly Phe Ser Val

145 150 155 160

Tyr Phe Thr Gly Tyr His Glu Ser Arg Glu Asn Ile Tyr Ser Asp Glu

165 170 175

Asp Met Val Ser Val Ala Tyr Arg Ile Thr Glu Asp Asn Phe Pro Arg

180 185 190

Phe Val Ser Asn Ala Leu Ile Phe Asp Lys Leu Asn Glu Ser His Pro

195 200 205

Asp Ile Ile Ser Glu Val Ser Gly Asn Leu Gly Val Asp Asp Ile Gly

210 215 220

Lys Tyr Phe Asp Val Ser Asn Tyr Asn Asn Phe Leu Ser Gln Ala Gly

225 230 235 240

Ile Asp Asp Tyr Asn His Ile Ile Gly Gly His Thr Thr Glu Asp Gly

245 250 255

Leu Ile Gln Ala Phe Asn Val Val Leu Asn Leu Arg His Gln Lys Asp

260 265 270

Pro Gly Phe Glu Lys Ile Gln Phe Lys Gln Leu Tyr Lys Gln Ile Leu

275 280 285

Ser Val Arg Thr Ser Lys Ser Tyr Ile Pro Lys Gln Phe Asp Asn Ser

290 295 300

Lys Glu Met Val Asp Cys Ile Cys Asp Tyr Val Ser Lys Ile Glu Lys

305 310 315 320

Ser Glu Thr Val Glu Arg Ala Leu Lys Leu Val Arg Asn Ile Ser Ser

325 330 335

Phe Asp Leu Arg Gly Ile Phe Val Asn Lys Lys Asn Leu Arg Ile Leu

340 345 350

Ser Asn Lys Leu Ile Gly Asp Trp Asp Ala Ile Glu Thr Ala Leu Met

355 360 365

His Ser Ser Ser Ser Glu Asn Asp Lys Lys Ser Val Tyr Asp Ser Ala

370 375 380

Glu Ala Phe Thr Leu Asp Asp Ile Phe Ser Ser Val Lys Lys Phe Ser

385 390 395 400

Asp Ala Ser Ala Glu Asp Ile Gly Asn Arg Ala Glu Asp Ile Cys Arg

405 410 415

Val Ile Ser Glu Thr Ala Pro Phe Ile Asn Asp Leu Arg Ala Val Asp

420 425 430

Leu Asp Ser Leu Asn Asp Asp Gly Tyr Glu Ala Ala Val Ser Lys Ile

435 440 445

Arg Glu Ser Leu Glu Pro Tyr Met Asp Leu Phe His Glu Leu Glu Ile

450 455 460

Phe Ser Val Gly Asp Glu Phe Pro Lys Cys Ala Ala Phe Tyr Ser Glu

465 470 475 480

Leu Glu Glu Val Ser Glu Gln Leu Ile Glu Ile Ile Pro Leu Phe Asn

485 490 495

Lys Ala Arg Ser Phe Cys Thr Arg Lys Arg Tyr Ser Thr Asp Lys Ile

500 505 510

Lys Val Asn Leu Lys Phe Pro Thr Leu Ala Asp Gly Trp Asp Leu Asn

515 520 525

Lys Glu Arg Asp Asn Lys Ala Ala Ile Leu Arg Lys Asp Gly Lys Tyr

530 535 540

Tyr Leu Ala Ile Leu Asp Met Lys Lys Asp Leu Ser Ser Ile Arg Thr

545 550 555 560

Ser Asp Glu Asp Glu Ser Ser Phe Glu Lys Met Glu Tyr Lys Leu Leu

565 570 575

Pro Ser Pro Val Lys Met Leu Pro Lys Ile Phe Val Lys Ser Lys Ala

580 585 590

Ala Lys Glu Lys Tyr Gly Leu Thr Asp Arg Met Leu Glu Cys Tyr Asp

595 600 605

Lys Gly Met His Lys Ser Gly Ser Ala Phe Asp Leu Gly Phe Cys His

610 615 620

Glu Leu Ile Asp Tyr Tyr Lys Arg Cys Ile Ala Glu Tyr Pro Gly Trp

625 630 635 640

Asp Val Phe Asp Phe Lys Phe Arg Glu Thr Ser Asp Tyr Gly Ser Met

645 650 655

Lys Glu Phe Asn Glu Asp Val Ala Gly Ala Gly Tyr Tyr Met Ser Leu

660 665 670

Arg Lys Ile Pro Cys Ser Glu Val Tyr Arg Leu Leu Asp Glu Lys Ser

675 680 685

Ile Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Tyr Ser Glu Asn Ala His

690 695 700

Gly Asn Lys Asn Met His Thr Met Tyr Trp Glu Gly Leu Phe Ser Pro

705 710 715 720

Gln Asn Leu Glu Ser Pro Val Phe Lys Leu Ser Gly Gly Ala Glu Leu

725 730 735

Phe Phe Arg Lys Ser Ser Ile Pro Asn Asp Ala Lys Thr Val His Pro

740 745 750

Lys Gly Ser Val Leu Val Pro Arg Asn Asp Val Asn Gly Arg Arg Ile

755 760 765

Pro Asp Ser Ile Tyr Arg Glu Leu Thr Arg Tyr Phe Asn Arg Gly Asp

770 775 780

Cys Arg Ile Ser Asp Glu Ala Lys Ser Tyr Leu Asp Lys Val Lys Thr

785 790 795 800

Lys Lys Ala Asp His Asp Ile Val Lys Asp Arg Arg Phe Thr Val Asp

805 810 815

Lys Met Met Phe His Val Pro Ile Ala Met Asn Phe Lys Ala Ile Ser

820 825 830

Lys Pro Asn Leu Asn Lys Lys Val Ile Asp Gly Ile Ile Asp Asp Gln

835 840 845

Asp Leu Lys Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr

850 855 860

Val Thr Met Val Asp Arg Lys Gly Asn Ile Leu Tyr Gln Asp Ser Leu

865 870 875 880

Asn Ile Leu Asn Gly Tyr Asp Tyr Arg Lys Ala Leu Asp Val Arg Glu

885 890 895

Tyr Asp Asn Lys Glu Ala Arg Arg Asn Trp Thr Lys Val Glu Gly Ile

900 905 910

Arg Lys Met Lys Glu Gly Tyr Leu Ser Leu Ala Val Ser Lys Leu Ala

915 920 925

Asp Met Ile Ile Glu Asn Asn Ala Ile Ile Val Met Glu Asp Leu Asn

930 935 940

His Gly Phe Lys Ala Gly Arg Ser Lys Ile Glu Lys Gln Val Tyr Gln

945 950 955 960

Lys Phe Glu Ser Met Leu Ile Asn Lys Leu Gly Tyr Met Val Leu Lys

965 970 975

Asp Lys Ser Ile Asp Gln Ser Gly Gly Ala Leu His Gly Tyr Gln Leu

980 985 990

Ala Asn His Val Thr Thr Leu Ala Ser Val Gly Lys Gln Cys Gly Val

995 1000 1005

Ile Phe Tyr Ile Pro Ala Ala Phe Thr Ser Lys Ile Asp Pro Thr

1010 1015 1020

Thr Gly Phe Ala Asp Leu Phe Ala Leu Ser Asn Val Lys Asn Val

1025 1030 1035

Ala Ser Met Arg Glu Phe Phe Ser Lys Met Lys Ser Val Ile Tyr

1040 1045 1050

Asp Lys Ala Glu Gly Lys Phe Ala Phe Thr Phe Asp Tyr Leu Asp

1055 1060 1065

Tyr Asn Val Lys Ser Glu Cys Gly Arg Thr Leu Trp Thr Val Tyr

1070 1075 1080

Thr Val Gly Glu Arg Phe Thr Tyr Ser Arg Val Asn Arg Glu Tyr

1085 1090 1095

Val Arg Lys Val Pro Thr Asp Ile Ile Tyr Asp Ala Leu Gln Lys

1100 1105 1110

Ala Gly Ile Ser Val Glu Gly Asp Leu Arg Asp Arg Ile Ala Glu

1115 1120 1125

Ser Asp Gly Asp Thr Leu Lys Ser Ile Phe Tyr Ala Phe Lys Tyr

1130 1135 1140

Ala Leu Asp Met Arg Val Glu Asn Arg Glu Glu Asp Tyr Ile Gln

1145 1150 1155

Ser Pro Val Lys Asn Ala Ser Gly Glu Phe Phe Cys Ser Lys Asn

1160 1165 1170

Ala Gly Lys Ser Leu Pro Gln Asp Ser Asp Ala Asn Gly Ala Tyr

1175 1180 1185

Asn Ile Ala Leu Lys Gly Ile Leu Gln Leu Arg Met Leu Ser Glu

1190 1195 1200

Gln Tyr Asp Pro Asn Ala Glu Ser Ile Arg Leu Pro Leu Ile Thr

1205 1210 1215

Asn Lys Ala Trp Leu Thr Phe Met Gln Ser Gly Met Lys Thr Trp

1220 1225 1230

Lys Asn

1235

<210> 6

<211> 1260

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 6

Met Asp Ser Leu Lys Asp Phe Thr Asn Leu Tyr Pro Val Ser Lys Thr

1 5 10 15

Leu Arg Phe Glu Leu Lys Pro Val Gly Lys Thr Leu Glu Asn Ile Glu

20 25 30

Lys Ala Gly Ile Leu Lys Glu Asp Glu His Arg Ala Glu Ser Tyr Arg

35 40 45

Arg Val Lys Lys Ile Ile Asp Thr Tyr His Lys Val Phe Ile Asp Ser

50 55 60

Ser Leu Glu Asn Met Ala Lys Met Gly Ile Glu Asn Glu Ile Lys Ala

65 70 75 80

Met Leu Gln Ser Phe Cys Glu Leu Tyr Lys Lys Asp His Arg Thr Glu

85 90 95

Gly Glu Asp Lys Ala Leu Asp Lys Ile Arg Ala Val Leu Arg Gly Leu

100 105 110

Ile Val Gly Ala Phe Thr Gly Val Cys Gly Arg Arg Glu Asn Thr Val

115 120 125

Gln Asn Glu Lys Tyr Glu Ser Leu Phe Lys Glu Lys Leu Ile Lys Glu

130 135 140

Ile Leu Pro Asp Phe Val Leu Ser Thr Glu Ala Glu Ser Leu Pro Phe

145 150 155 160

Ser Val Glu Glu Ala Thr Arg Ser Leu Lys Glu Phe Asp Ser Phe Thr

165 170 175

Ser Tyr Phe Ala Gly Phe Tyr Glu Asn Arg Lys Asn Ile Tyr Ser Thr

180 185 190

Lys Pro Gln Ser Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu

195 200 205

Pro Lys Phe Ile Asp Asn Ile Leu Val Phe Gln Lys Ile Lys Glu Pro

210 215 220

Ile Ala Lys Glu Leu Glu His Ile Arg Ala Asp Phe Ser Ala Gly Gly

225 230 235 240

Tyr Ile Lys Lys Asp Glu Arg Leu Glu Asp Ile Phe Ser Leu Asn Tyr

245 250 255

Tyr Ile His Val Leu Ser Gln Ala Gly Ile Glu Lys Tyr Asn Ala Leu

260 265 270

Ile Gly Lys Ile Val Thr Glu Gly Asp Gly Glu Met Lys Gly Leu Asn

275 280 285

Glu His Ile Asn Leu Tyr Asn Gln Gln Arg Gly Arg Glu Asp Arg Leu

290 295 300

Pro Leu Phe Arg Pro Leu Tyr Lys Gln Ile Leu Ser Asp Arg Glu Gln

305 310 315 320

Leu Ser Tyr Leu Pro Glu Ser Phe Glu Lys Asp Glu Glu Leu Leu Arg

325 330 335

Ala Leu Lys Glu Phe Tyr Asp His Ile Ala Glu Asp Ile Leu Gly Arg

340 345 350

Thr Gln Gln Leu Met Thr Ser Ile Ser Glu Tyr Asp Leu Ser Arg Ile

355 360 365

Tyr Val Arg Asn Asp Ser Gln Leu Thr Asp Ile Ser Lys Lys Met Leu

370 375 380

Gly Asp Trp Asn Ala Ile Tyr Met Ala Arg Glu Arg Ala Tyr Asp His

385 390 395 400

Glu Gln Ala Pro Lys Arg Ile Thr Ala Lys Tyr Glu Arg Asp Arg Ile

405 410 415

Lys Ala Leu Lys Gly Glu Glu Ser Ile Ser Leu Ala Asn Leu Asn Ser

420 425 430

Cys Ile Ala Phe Leu Asp Asn Val Arg Asp Cys Arg Val Asp Thr Tyr

435 440 445

Leu Ser Thr Leu Gly Gln Lys Glu Gly Pro His Gly Leu Ser Asn Leu

450 455 460

Val Glu Asn Val Phe Ala Ser Tyr His Glu Ala Glu Gln Leu Leu Ser

465 470 475 480

Phe Pro Tyr Pro Glu Glu Asn Asn Leu Ile Gln Asp Lys Asp Asn Val

485 490 495

Val Leu Ile Lys Asn Leu Leu Asp Asn Ile Ser Asp Leu Gln Arg Phe

500 505 510

Leu Lys Pro Leu Trp Gly Met Gly Asp Glu Pro Asp Lys Asp Glu Arg

515 520 525

Phe Tyr Gly Glu Tyr Asn Tyr Ile Arg Gly Ala Leu Asp Gln Val Ile

530 535 540

Pro Leu Tyr Asn Lys Val Arg Asn Tyr Leu Thr Arg Lys Pro Tyr Ser

545 550 555 560

Thr Arg Lys Val Lys Leu Asn Phe Gly Asn Ser Gln Leu Leu Ser Gly

565 570 575

Trp Asp Arg Asn Lys Glu Lys Asp Asn Ser Cys Val Ile Leu Arg Lys

580 585 590

Gly Gln Asn Phe Tyr Leu Ala Ile Met Asn Asn Arg His Lys Arg Ser

595 600 605

Phe Glu Asn Lys Val Leu Pro Glu Tyr Lys Glu Gly Glu Pro Tyr Phe

610 615 620

Glu Lys Met Asp Tyr Lys Phe Leu Pro Asp Pro Asn Lys Met Leu Pro

625 630 635 640

Lys Val Phe Leu Ser Lys Lys Gly Ile Glu Ile Tyr Lys Pro Ser Pro

645 650 655

Lys Leu Leu Glu Gln Tyr Gly His Gly Thr His Lys Lys Gly Asp Thr

660 665 670

Phe Ser Met Asp Asp Leu His Glu Leu Ile Asp Phe Phe Lys His Ser

675 680 685

Ile Glu Ala His Glu Asp Trp Lys Gln Phe Gly Phe Lys Phe Ser Asp

690 695 700

Thr Ala Thr Tyr Glu Asn Val Ser Ser Phe Tyr Arg Glu Val Glu Asp

705 710 715 720

Gln Gly Tyr Lys Leu Ser Phe Arg Lys Val Ser Glu Ser Tyr Val Tyr

725 730 735

Ser Leu Ile Asp Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys

740 745 750

Asp Phe Ser Pro Cys Ser Lys Gly Thr Pro Asn Leu His Thr Leu Tyr

755 760 765

Trp Arg Met Leu Phe Asp Glu Arg Asn Leu Ala Asp Val Ile Tyr Lys

770 775 780

Leu Asp Gly Lys Ala Glu Ile Phe Phe Arg Glu Lys Ser Leu Lys Asn

785 790 795 800

Asp His Pro Thr His Pro Ala Gly Lys Pro Ile Lys Lys Lys Ser Arg

805 810 815

Gln Lys Lys Gly Glu Glu Ser Leu Phe Glu Tyr Asp Leu Val Lys Asp

820 825 830

Arg His Tyr Thr Met Asp Lys Phe Gln Phe His Val Pro Ile Thr Met

835 840 845

Asn Phe Lys Cys Ser Ala Gly Ser Lys Val Asn Asp Met Val Asn Ala

850 855 860

His Ile Arg Glu Ala Lys Asp Met His Val Ile Gly Ile Asp Arg Gly

865 870 875 880

Glu Arg Asn Leu Leu Tyr Ile Cys Val Ile Asp Ser Arg Gly Thr Ile

885 890 895

Leu Asp Gln Ile Ser Leu Asn Thr Ile Asn Asp Ile Asp Tyr His Asp

900 905 910

Leu Leu Glu Ser Arg Asp Lys Asp Arg Gln Gln Glu Arg Arg Asn Trp

915 920 925

Gln Thr Ile Glu Gly Ile Lys Glu Leu Lys Gln Gly Tyr Leu Ser Gln

930 935 940

Ala Val His Arg Ile Ala Glu Leu Met Val Ala Tyr Lys Ala Val Val

945 950 955 960

Ala Leu Glu Asp Leu Asn Met Gly Phe Lys Arg Gly Arg Gln Lys Val

965 970 975

Glu Ser Ser Val Tyr Gln Gln Phe Glu Lys Gln Leu Ile Asp Lys Leu

980 985 990

Asn Tyr Leu Val Asp Lys Lys Lys Arg Pro Glu Asp Ile Gly Gly Leu

995 1000 1005

Leu Arg Ala Tyr Gln Phe Thr Ala Pro Phe Lys Ser Phe Lys Glu

1010 1015 1020

Met Gly Lys Gln Asn Gly Phe Leu Phe Tyr Ile Pro Ala Trp Asn

1025 1030 1035

Thr Ser Asn Ile Asp Pro Thr Thr Gly Phe Val Asn Leu Phe His

1040 1045 1050

Ala Gln Tyr Glu Asn Val Asp Lys Ala Lys Ser Phe Phe Gln Lys

1055 1060 1065

Phe Asp Ser Ile Ser Tyr Asn Pro Lys Lys Asp Trp Phe Glu Phe

1070 1075 1080

Ala Phe Asp Tyr Lys Asn Phe Thr Lys Lys Ala Glu Gly Ser Arg

1085 1090 1095

Ser Met Trp Ile Leu Cys Thr His Gly Ser Arg Ile Lys Asn Phe

1100 1105 1110

Arg Asn Ser Gln Lys Asn Gly Gln Trp Asp Ser Glu Glu Phe Ala

1115 1120 1125

Leu Thr Glu Ala Phe Lys Ser Leu Phe Val Arg Tyr Glu Ile Asp

1130 1135 1140

Tyr Thr Ala Asp Leu Lys Thr Ala Ile Val Asp Glu Lys Gln Lys

1145 1150 1155

Asp Phe Phe Val Asp Leu Leu Lys Leu Phe Lys Leu Thr Val Gln

1160 1165 1170

Met Arg Asn Ser Trp Lys Glu Lys Asp Leu Asp Tyr Leu Ile Ser

1175 1180 1185

Pro Val Ala Gly Ala Asp Gly Arg Phe Phe Asp Thr Arg Glu Gly

1190 1195 1200

Asn Lys Ser Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr Asn

1205 1210 1215

Ile Ala Leu Lys Gly Leu Trp Ala Leu Arg Gln Ile Arg Gln Thr

1220 1225 1230

Ser Glu Gly Gly Lys Leu Lys Leu Ala Ile Ser Asn Lys Glu Trp

1235 1240 1245

Leu Gln Phe Val Gln Glu Arg Ser Tyr Glu Lys Asp

1250 1255 1260

<210> 7

<211> 1263

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 7

Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser

1 5 10 15

Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln

20 25 30

Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly

35 40 45

Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly

50 55 60

Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser

65 70 75 80

Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp

85 90 95

Thr Leu Ile Lys Glu Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys

100 105 110

Phe Ala Asn Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile

115 120 125

Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala

130 135 140

Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe

145 150 155 160

Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser

165 170 175

Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn

180 185 190

Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys

195 200 205

Ser Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp

210 215 220

Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr

225 230 235 240

Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys

245 250 255

Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu

260 265 270

Asn Lys Asn Leu Tyr Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys

275 280 285

Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu

290 295 300

Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys

305 310 315 320

His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr

325 330 335

Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser

340 345 350

Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile

355 360 365

His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys

370 375 380

Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile

385 390 395 400

Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys

405 410 415

Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu

420 425 430

Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu

435 440 445

Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala

450 455 460

Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp

465 470 475 480

Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro

485 490 495

Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro

500 505 510

Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala

515 520 525

Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu

530 535 540

Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys

545 550 555 560

Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp

565 570 575

Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile

580 585 590

Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro

595 600 605

Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser

610 615 620

Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe

625 630 635 640

Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp

645 650 655

Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu

660 665 670

Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys

675 680 685

Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile

690 695 700

Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His

705 710 715 720

Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile

725 730 735

Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser

740 745 750

Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg

755 760 765

Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val

770 775 780

Arg Lys Asn Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe

785 790 795 800

Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys

805 810 815

Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr

820 825 830

Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn

835 840 845

Phe Lys Ala Asn Lys Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr

850 855 860

Ile Ala Lys Glu Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu

865 870 875 880

Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val

885 890 895

Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys

900 905 910

Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys

915 920 925

Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val

930 935 940

Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala

945 950 955 960

Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu

965 970 975

Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn

980 985 990

Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu

995 1000 1005

Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val

1010 1015 1020

Gly His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr

1025 1030 1035

Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe

1040 1045 1050

Lys Asp Leu Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe

1055 1060 1065

Asp Ser Ile Arg Tyr Asp Ser Glu Lys Asn Leu Phe Cys Phe Thr

1070 1075 1080

Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn Thr Val Met Ser Lys

1085 1090 1095

Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg Ile Lys Arg Arg

1100 1105 1110

Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr Ile Asp Ile

1115 1120 1125

Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile Asn Trp

1130 1135 1140

Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu Ile

1145 1150 1155

Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg

1160 1165 1170

Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile

1175 1180 1185

Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys

1190 1195 1200

Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr

1205 1210 1215

Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu

1220 1225 1230

Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile

1235 1240 1245

Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu

1250 1255 1260

<210> 8

<211> 1318

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 8

Met Thr Asn Lys Phe Thr Asn Gln Tyr Ser Leu Ser Lys Thr Leu Arg

1 5 10 15

Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Phe Ile Gln Glu Lys

20 25 30

Gly Leu Leu Ser Gln Asp Lys Gln Arg Ala Glu Ser Tyr Gln Glu Met

35 40 45

Lys Lys Thr Ile Asp Lys Phe His Lys Tyr Phe Ile Asp Leu Ala Leu

50 55 60

Ser Asn Ala Lys Leu Thr His Leu Glu Thr Tyr Leu Glu Leu Tyr Asn

65 70 75 80

Lys Ser Ala Glu Thr Lys Lys Glu Gln Lys Phe Lys Asp Asp Leu Lys

85 90 95

Lys Val Gln Asp Asn Leu Arg Lys Glu Ile Val Lys Ser Phe Ser Asp

100 105 110

Gly Asp Ala Lys Ser Ile Phe Ala Ile Leu Asp Lys Lys Glu Leu Ile

115 120 125

Thr Val Glu Leu Glu Lys Trp Phe Glu Asn Asn Glu Gln Lys Asp Ile

130 135 140

Tyr Phe Asp Glu Lys Phe Lys Thr Phe Thr Thr Tyr Phe Thr Gly Phe

145 150 155 160

His Gln Asn Arg Lys Asn Met Tyr Ser Val Glu Pro Asn Ser Thr Ala

165 170 175

Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Lys Phe Leu Glu Asn

180 185 190

Ala Lys Ala Phe Glu Lys Ile Lys Gln Val Glu Ser Leu Gln Val Asn

195 200 205

Phe Arg Glu Leu Met Gly Glu Phe Gly Asp Glu Gly Leu Ile Phe Val

210 215 220

Asn Glu Leu Glu Glu Met Phe Gln Ile Asn Tyr Tyr Asn Asp Val Leu

225 230 235 240

Ser Gln Asn Gly Ile Thr Ile Tyr Asn Ser Ile Ile Ser Gly Phe Thr

245 250 255

Lys Asn Asp Ile Lys Tyr Lys Gly Leu Asn Glu Tyr Ile Asn Asn Tyr

260 265 270

Asn Gln Thr Lys Asp Lys Lys Asp Arg Leu Pro Lys Leu Lys Gln Leu

275 280 285

Tyr Lys Gln Ile Leu Ser Asp Arg Ile Ser Leu Ser Phe Leu Pro Asp

290 295 300

Ala Phe Thr Asp Gly Lys Gln Val Leu Lys Ala Ile Phe Asp Phe Tyr

305 310 315 320

Lys Ile Asn Leu Leu Ser Tyr Thr Ile Glu Gly Gln Glu Glu Ser Gln

325 330 335

Asn Leu Leu Leu Leu Ile Arg Gln Thr Ile Glu Asn Leu Ser Ser Phe

340 345 350

Asp Thr Gln Lys Ile Tyr Leu Lys Asn Asp Thr His Leu Thr Thr Ile

355 360 365

Ser Gln Gln Val Phe Gly Asp Phe Ser Val Phe Ser Thr Ala Leu Asn

370 375 380

Tyr Trp Tyr Glu Thr Lys Val Asn Pro Lys Phe Glu Thr Glu Tyr Ser

385 390 395 400

Lys Ala Asn Glu Lys Lys Arg Glu Ile Leu Asp Lys Ala Lys Ala Val

405 410 415

Phe Thr Lys Gln Asp Tyr Phe Ser Ile Ala Phe Leu Gln Glu Val Leu

420 425 430

Ser Glu Tyr Ile Leu Thr Leu Asp His Thr Ser Asp Ile Val Lys Lys

435 440 445

His Ser Ser Asn Cys Ile Ala Asp Tyr Phe Lys Asn His Phe Val Ala

450 455 460

Lys Lys Glu Asn Glu Thr Asp Lys Thr Phe Asp Phe Ile Ala Asn Ile

465 470 475 480

Thr Ala Lys Tyr Gln Cys Ile Gln Gly Ile Leu Glu Asn Ala Asp Gln

485 490 495

Tyr Glu Asp Glu Leu Lys Gln Asp Gln Lys Leu Ile Asp Asn Leu Lys

500 505 510

Phe Phe Leu Asp Ala Ile Leu Glu Leu Leu His Phe Ile Lys Pro Leu

515 520 525

His Leu Lys Ser Glu Ser Ile Thr Glu Lys Asp Thr Ala Phe Tyr Asp

530 535 540

Val Phe Glu Asn Tyr Tyr Glu Ala Leu Ser Leu Leu Thr Pro Leu Tyr

545 550 555 560

Asn Met Val Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Thr Glu Lys

565 570 575

Ile Lys Leu Asn Phe Glu Asn Ala Gln Leu Leu Asn Gly Trp Asp Ala

580 585 590

Asn Lys Glu Gly Asp Tyr Leu Thr Thr Ile Leu Lys Lys Asp Gly Asn

595 600 605

Tyr Phe Leu Ala Ile Met Asp Lys Lys His Asn Lys Ala Phe Gln Lys

610 615 620

Phe Pro Glu Gly Lys Glu Asn Tyr Glu Lys Met Val Tyr Lys Leu Leu

625 630 635 640

Pro Gly Val Asn Lys Met Leu Pro Lys Val Phe Phe Ser Asn Lys Asn

645 650 655

Ile Ala Tyr Phe Asn Pro Ser Lys Glu Leu Leu Glu Asn Tyr Lys Lys

660 665 670

Glu Thr His Lys Lys Gly Asp Thr Phe Asn Leu Glu His Cys His Thr

675 680 685

Leu Ile Asp Phe Phe Lys Asp Ser Leu Asn Lys His Glu Asp Trp Lys

690 695 700

Tyr Phe Asp Phe Gln Phe Ser Glu Thr Lys Ser Tyr Gln Asp Leu Ser

705 710 715 720

Gly Phe Tyr Arg Glu Val Glu His Gln Gly Tyr Lys Ile Asn Phe Lys

725 730 735

Asn Ile Asp Ser Glu Tyr Ile Asp Gly Leu Val Asn Glu Gly Lys Leu

740 745 750

Phe Leu Phe Gln Ile Tyr Ser Lys Asp Phe Ser Pro Phe Ser Lys Gly

755 760 765

Lys Pro Asn Met His Thr Leu Tyr Trp Lys Ala Leu Phe Glu Glu Gln

770 775 780

Asn Leu Gln Asn Val Ile Tyr Lys Leu Asn Gly Gln Ala Glu Ile Phe

785 790 795 800

Phe Arg Lys Ala Ser Ile Lys Pro Lys Asn Ile Ile Leu His Lys Lys

805 810 815

Lys Ile Lys Ile Ala Lys Lys His Phe Ile Asp Lys Lys Thr Lys Thr

820 825 830

Ser Glu Ile Val Pro Val Gln Thr Ile Lys Asn Leu Asn Met Tyr Tyr

835 840 845

Gln Gly Lys Ile Ser Glu Lys Glu Leu Thr Gln Asp Asp Leu Arg Tyr

850 855 860

Ile Asp Asn Phe Ser Ile Phe Asn Glu Lys Asn Lys Thr Ile Asp Ile

865 870 875 880

Ile Lys Asp Lys Arg Phe Thr Val Asp Lys Phe Gln Phe His Val Pro

885 890 895

Ile Thr Met Asn Phe Lys Ala Thr Gly Gly Ser Tyr Ile Asn Gln Thr

900 905 910

Val Leu Glu Tyr Leu Gln Asn Asn Pro Glu Val Lys Ile Ile Gly Leu

915 920 925

Asp Arg Gly Glu Arg His Leu Val Tyr Leu Thr Leu Ile Asp Gln Gln

930 935 940

Gly Asn Ile Leu Lys Gln Glu Ser Leu Asn Thr Ile Thr Asp Ser Lys

945 950 955 960

Ile Ser Thr Pro Tyr His Lys Leu Leu Asp Asn Lys Glu Asn Glu Arg

965 970 975

Asp Leu Ala Arg Lys Asn Trp Gly Thr Val Glu Asn Ile Lys Glu Leu

980 985 990

Lys Glu Gly Tyr Ile Ser Gln Val Val His Lys Ile Ala Thr Leu Met

995 1000 1005

Leu Glu Glu Asn Ala Ile Val Val Met Glu Asp Leu Asn Phe Gly

1010 1015 1020

Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Lys

1025 1030 1035

Leu Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Leu Val Leu Lys

1040 1045 1050

Asp Lys Gln Pro Gln Glu Leu Gly Gly Leu Tyr Asn Ala Leu Gln

1055 1060 1065

Leu Thr Asn Lys Phe Glu Ser Phe Gln Lys Met Gly Lys Gln Ser

1070 1075 1080

Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp

1085 1090 1095

Pro Thr Thr Gly Phe Val Asn Tyr Phe Tyr Thr Lys Tyr Glu Asn

1100 1105 1110

Val Asp Lys Ala Lys Ala Phe Phe Glu Lys Phe Glu Ala Ile Arg

1115 1120 1125

Phe Asn Ala Glu Lys Lys Tyr Phe Glu Phe Glu Val Lys Lys Tyr

1130 1135 1140

Ser Asp Phe Asn Pro Lys Ala Glu Gly Thr Gln Gln Ala Trp Thr

1145 1150 1155

Ile Cys Thr Tyr Gly Glu Arg Ile Glu Thr Lys Arg Gln Lys Asp

1160 1165 1170

Gln Asn Asn Lys Phe Val Ser Thr Pro Ile Asn Leu Thr Glu Lys

1175 1180 1185

Ile Glu Asp Phe Leu Gly Lys Asn Gln Ile Val Tyr Gly Asp Gly

1190 1195 1200

Asn Cys Ile Lys Ser Gln Ile Ala Ser Lys Asp Asp Lys Ala Phe

1205 1210 1215

Phe Glu Thr Leu Leu Tyr Trp Phe Lys Met Thr Leu Gln Met Arg

1220 1225 1230

Asn Ser Glu Thr Arg Thr Asp Ile Asp Tyr Leu Ile Ser Pro Val

1235 1240 1245

Met Asn Asp Asn Gly Thr Phe Tyr Asn Ser Arg Asp Tyr Glu Lys

1250 1255 1260

Leu Glu Asn Pro Thr Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala

1265 1270 1275

Tyr His Ile Ala Lys Lys Gly Leu Met Leu Leu Asn Lys Ile Asp

1280 1285 1290

Gln Ala Asp Leu Thr Lys Lys Val Asp Leu Ser Ile Ser Asn Arg

1295 1300 1305

Asp Trp Leu Gln Phe Val Gln Lys Asn Lys

1310 1315

<210> 9

<211> 1339

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 9

Met Glu Gln Glu Tyr Tyr Leu Gly Leu Asp Met Gly Thr Gly Ser Val

1 5 10 15

Gly Trp Ala Val Thr Asp Ser Glu Tyr His Val Leu Arg Lys His Gly

20 25 30

Lys Ala Leu Trp Gly Val Arg Leu Phe Glu Ser Ala Ser Thr Ala Glu

35 40 45

Glu Arg Arg Met Phe Arg Thr Ser Arg Arg Arg Leu Asp Arg Arg Asn

50 55 60

Trp Arg Ile Glu Ile Leu Gln Glu Ile Phe Ala Glu Glu Ile Ser Lys

65 70 75 80

Lys Asp Pro Gly Phe Phe Leu Arg Met Lys Glu Ser Lys Tyr Tyr Pro

85 90 95

Glu Asp Lys Arg Asp Ile Asn Gly Asn Cys Pro Glu Leu Pro Tyr Ala

100 105 110

Leu Phe Val Asp Asp Asp Phe Thr Asp Lys Asp Tyr His Lys Lys Phe

115 120 125

Pro Thr Ile Tyr His Leu Arg Lys Met Leu Met Asn Thr Glu Glu Thr

130 135 140

Pro Asp Ile Arg Leu Val Tyr Leu Ala Ile His His Met Met Lys His

145 150 155 160

Arg Gly His Phe Leu Leu Ser Gly Asp Ile Asn Glu Ile Lys Glu Phe

165 170 175

Gly Thr Thr Phe Ser Lys Leu Leu Glu Asn Ile Lys Asn Glu Glu Leu

180 185 190

Asp Trp Asn Leu Glu Leu Gly Lys Glu Glu Tyr Ala Val Val Glu Ser

195 200 205

Ile Leu Lys Asp Asn Met Leu Asn Arg Ser Thr Lys Lys Thr Arg Leu

210 215 220

Ile Lys Ala Leu Lys Ala Lys Ser Ile Cys Glu Lys Ala Val Leu Asn

225 230 235 240

Leu Leu Ala Gly Gly Thr Val Lys Leu Ser Asp Ile Phe Gly Leu Glu

245 250 255

Glu Leu Asn Glu Thr Glu Arg Pro Lys Ile Ser Phe Ala Asp Asn Gly

260 265 270

Tyr Asp Asp Tyr Ile Gly Glu Val Glu Asn Glu Leu Gly Glu Gln Phe

275 280 285

Tyr Ile Ile Glu Thr Ala Lys Ala Val Tyr Asp Trp Ala Val Leu Val

290 295 300

Glu Ile Leu Gly Lys Tyr Thr Ser Ile Ser Glu Ala Lys Val Ala Thr

305 310 315 320

Tyr Glu Lys His Lys Ser Asp Leu Gln Phe Leu Lys Lys Ile Val Arg

325 330 335

Lys Tyr Leu Thr Lys Glu Glu Tyr Lys Asp Ile Phe Val Ser Thr Ser

340 345 350

Asp Lys Leu Lys Asn Tyr Ser Ala Tyr Ile Gly Met Thr Lys Ile Asn

355 360 365

Gly Lys Lys Val Asp Leu Gln Ser Lys Arg Cys Ser Lys Glu Glu Phe

370 375 380

Tyr Asp Phe Ile Lys Lys Asn Val Leu Lys Lys Leu Glu Gly Gln Pro

385 390 395 400

Glu Tyr Glu Tyr Leu Lys Glu Glu Leu Glu Arg Glu Thr Phe Leu Pro

405 410 415

Lys Gln Val Asn Arg Asp Asn Gly Val Ile Pro Tyr Gln Ile His Leu

420 425 430

Tyr Glu Leu Lys Lys Ile Leu Gly Asn Leu Arg Asp Lys Ile Asp Leu

435 440 445

Ile Lys Glu Asn Glu Asp Lys Leu Val Gln Leu Phe Glu Phe Arg Ile

450 455 460

Pro Tyr Tyr Val Gly Pro Leu Asn Lys Ile Asp Asp Gly Lys Glu Gly

465 470 475 480

Lys Phe Thr Trp Ala Val Arg Lys Ser Asn Glu Lys Ile Tyr Pro Trp

485 490 495

Asn Phe Glu Asn Val Val Asp Ile Glu Ala Ser Ala Glu Lys Phe Ile

500 505 510

Arg Arg Met Thr Asn Lys Cys Thr Tyr Leu Met Gly Glu Asp Val Leu

515 520 525

Pro Lys Asp Ser Leu Leu Tyr Ser Lys Tyr Met Val Leu Asn Glu Leu

530 535 540

Asn Asn Val Lys Leu Asp Gly Glu Lys Leu Ser Val Glu Leu Lys Gln

545 550 555 560

Arg Leu Tyr Thr Asp Val Phe Cys Lys Tyr Arg Lys Val Thr Val Lys

565 570 575

Lys Ile Lys Asn Tyr Leu Lys Cys Glu Gly Ile Ile Ser Gly Asn Val

580 585 590

Glu Ile Thr Gly Ile Asp Gly Asp Phe Lys Ala Ser Leu Thr Ala Tyr

595 600 605

His Asp Phe Lys Glu Ile Leu Thr Gly Thr Glu Leu Ala Lys Lys Asp

610 615 620

Lys Glu Asn Ile Ile Thr Asn Ile Val Leu Phe Gly Asp Asp Lys Lys

625 630 635 640

Leu Leu Lys Lys Arg Leu Asn Arg Leu Tyr Pro Gln Ile Thr Pro Asn

645 650 655

Gln Leu Lys Lys Ile Cys Ala Leu Ser Tyr Thr Gly Trp Gly Arg Phe

660 665 670

Ser Lys Lys Phe Leu Glu Glu Ile Thr Ala Pro Asp Pro Glu Thr Gly

675 680 685

Glu Val Trp Asn Ile Ile Thr Ala Leu Trp Glu Ser Asn Asn Asn Leu

690 695 700

Met Gln Leu Leu Ser Asn Glu Tyr Arg Phe Met Glu Glu Val Glu Thr

705 710 715 720

Tyr Asn Met Gly Lys Gln Thr Lys Thr Leu Ser Tyr Glu Thr Val Glu

725 730 735

Asn Met Tyr Val Ser Pro Ser Val Lys Arg Gln Ile Trp Gln Thr Leu

740 745 750

Lys Ile Val Lys Glu Leu Glu Lys Val Met Lys Glu Ser Pro Lys Arg

755 760 765

Val Phe Ile Glu Met Ala Arg Glu Lys Gln Glu Ser Lys Arg Thr Glu

770 775 780

Ser Arg Lys Lys Gln Leu Ile Asp Leu Tyr Lys Ala Cys Lys Asn Glu

785 790 795 800

Glu Lys Asp Trp Val Lys Glu Leu Gly Asp Gln Glu Glu Gln Lys Leu

805 810 815

Arg Ser Asp Lys Leu Tyr Leu Tyr Tyr Thr Gln Lys Gly Arg Cys Met

820 825 830

Tyr Ser Gly Glu Val Ile Glu Leu Lys Asp Leu Trp Asp Asn Thr Lys

835 840 845

Tyr Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Thr Met Asp Asp Ser

850 855 860

Leu Asn Asn Arg Val Leu Val Lys Lys Lys Tyr Asn Ala Thr Lys Ser

865 870 875 880

Asp Lys Tyr Pro Leu Asn Glu Asn Ile Arg His Glu Arg Lys Gly Phe

885 890 895

Trp Lys Ser Leu Leu Asp Gly Gly Phe Ile Ser Lys Glu Lys Tyr Glu

900 905 910

Arg Leu Ile Arg Asn Thr Glu Leu Ser Pro Glu Glu Leu Ala Gly Phe

915 920 925

Ile Glu Arg Gln Ile Val Glu Thr Arg Gln Ser Thr Lys Ala Val Ala

930 935 940

Glu Ile Leu Lys Gln Val Phe Pro Glu Ser Glu Ile Val Tyr Val Lys

945 950 955 960

Ala Gly Thr Val Ser Arg Phe Arg Lys Asp Phe Glu Leu Leu Lys Val

965 970 975

Arg Glu Val Asn Asp Leu His His Ala Lys Asp Ala Tyr Leu Asn Ile

980 985 990

Val Val Gly Asn Ser Tyr Tyr Val Lys Phe Thr Lys Asn Ala Ser Trp

995 1000 1005

Phe Ile Lys Glu Asn Pro Gly Arg Thr Tyr Asn Leu Lys Lys Met

1010 1015 1020

Phe Thr Ser Gly Trp Asn Ile Glu Arg Asn Gly Glu Val Ala Trp

1025 1030 1035

Glu Val Gly Lys Lys Gly Thr Ile Val Thr Val Lys Gln Ile Met

1040 1045 1050

Asn Lys Asn Asn Ile Leu Val Thr Arg Gln Val His Glu Ala Lys

1055 1060 1065

Gly Gly Leu Phe Asp Gln Gln Ile Met Lys Lys Gly Lys Gly Gln

1070 1075 1080

Ile Ala Ile Lys Glu Thr Asp Glu Arg Leu Ala Ser Ile Glu Lys

1085 1090 1095

Tyr Gly Gly Tyr Asn Lys Ala Ala Gly Ala Tyr Phe Met Leu Val

1100 1105 1110

Glu Ser Lys Asp Lys Lys Gly Lys Thr Ile Arg Thr Ile Glu Phe

1115 1120 1125

Ile Pro Leu Tyr Leu Lys Asn Lys Ile Glu Ser Asp Glu Ser Ile

1130 1135 1140

Ala Leu Asn Phe Leu Glu Lys Gly Arg Gly Leu Lys Glu Pro Lys

1145 1150 1155

Ile Leu Leu Lys Lys Ile Lys Ile Asp Thr Leu Phe Asp Val Asp

1160 1165 1170

Gly Phe Lys Met Trp Leu Ser Gly Arg Thr Gly Asp Arg Leu Leu

1175 1180 1185

Phe Lys Cys Ala Asn Gln Leu Ile Leu Asp Glu Lys Ile Ile Val

1190 1195 1200

Thr Met Lys Lys Ile Val Lys Phe Ile Gln Arg Arg Gln Glu Asn

1205 1210 1215

Arg Glu Leu Lys Leu Ser Asp Lys Asp Gly Ile Asp Asn Glu Val

1220 1225 1230

Leu Met Glu Ile Tyr Asn Thr Phe Val Asp Lys Leu Glu Asn Thr

1235 1240 1245

Val Tyr Arg Ile Arg Leu Ser Glu Gln Ala Lys Thr Leu Ile Asp

1250 1255 1260

Lys Gln Lys Glu Phe Glu Arg Leu Ser Leu Glu Asp Lys Ser Ser

1265 1270 1275

Thr Leu Phe Glu Ile Leu His Ile Phe Gln Cys Gln Ser Ser Ala

1280 1285 1290

Ala Asn Leu Lys Met Ile Gly Gly Pro Gly Lys Ala Gly Ile Leu

1295 1300 1305

Val Met Asn Asn Asn Ile Ser Lys Cys Asn Lys Ile Ser Ile Ile

1310 1315 1320

Asn Gln Ser Pro Thr Gly Ile Phe Glu Asn Glu Ile Asp Leu Leu

1325 1330 1335

Lys

<210> 10

<211> 1280

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 10

Met Asn Lys Phe Glu Asn Phe Thr Gly Leu Tyr Pro Ile Ser Lys Thr

1 5 10 15

Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Tyr Ile Glu

20 25 30

Lys Ser Glu Ile Leu Glu Asn Asp Asn Tyr Arg Ala Glu Lys Tyr Glu

35 40 45

Glu Val Lys Asp Ile Ile Asp Gly Tyr His Lys Trp Phe Ile Asn Glu

50 55 60

Thr Leu His Asp Leu His Ile Asn Trp Ser Glu Leu Lys Val Ala Leu

65 70 75 80

Glu Asn Asn Arg Ile Glu Lys Ser Asp Ala Ser Lys Lys Glu Leu Gln

85 90 95

Arg Val Gln Lys Ile Lys Arg Glu Glu Ile Tyr Asn Ala Phe Ile Glu

100 105 110

His Glu Ala Phe Gln Tyr Leu Phe Lys Glu Asn Leu Leu Ser Asp Leu

115 120 125

Leu Pro Ile Gln Ile Glu Gln Ser Glu Asp Leu Asp Ala Glu Lys Lys

130 135 140

Lys Gln Ala Val Glu Thr Phe Asn Arg Phe Ser Thr Tyr Phe Thr Gly

145 150 155 160

Phe His Glu Asn Arg Lys Asn Ile Tyr Ser Lys Glu Gly Ile Ser Thr

165 170 175

Ser Val Thr Tyr Arg Ile Val His Asp Asn Phe Pro Lys Phe Leu Glu

180 185 190

Asn Met Lys Val Phe Glu Ile Leu Arg Asn Glu Cys Pro Glu Val Ile

195 200 205

Ser Asp Thr Ala Asn Glu Leu Ala Pro Phe Ile Asp Gly Val Arg Ile

210 215 220

Glu Asp Ile Phe Leu Ile Asp Phe Phe Asn Ser Thr Phe Ser Gln Asn

225 230 235 240

Gly Ile Asp Tyr Tyr Asn Arg Ile Leu Gly Gly Val Thr Thr Glu Thr

245 250 255

Gly Glu Lys Tyr Arg Gly Ile Asn Glu Phe Thr Asn Leu Tyr Arg Gln

260 265 270

Gln His Pro Glu Phe Gly Lys Ser Lys Lys Ala Thr Lys Met Val Val

275 280 285

Leu Phe Lys Gln Ile Leu Ser Asp Arg Asp Thr Leu Ser Phe Ile Pro

290 295 300

Glu Met Phe Gly Asn Asp Lys Gln Val Gln Asn Ser Ile Gln Leu Phe

305 310 315 320

Tyr Asn Arg Glu Ile Ser Gln Phe Glu Asn Glu Gly Val Lys Thr Asp

325 330 335

Val Cys Thr Ala Leu Ala Thr Leu Thr Ser Lys Ile Ala Glu Phe Asp

340 345 350

Thr Glu Lys Ile Tyr Ile Gln Gln Pro Glu Leu Pro Asn Val Ser Gln

355 360 365

Arg Leu Phe Gly Ser Trp Asn Glu Leu Asn Ala Cys Leu Phe Lys Tyr

370 375 380

Ala Glu Leu Lys Phe Gly Thr Ala Glu Lys Val Ala Asn Arg Lys Lys

385 390 395 400

Ile Asp Lys Trp Leu Lys Ser Asp Leu Phe Ser Phe Thr Glu Leu Asn

405 410 415

Lys Ala Leu Glu Phe Ser Gly Lys Asp Glu Arg Ile Glu Asn Tyr Phe

420 425 430

Ser Glu Thr Gly Ile Phe Ala Gln Leu Val Lys Thr Gly Phe Asp Glu

435 440 445

Ala Gln Ser Ile Leu Glu Thr Glu Tyr Thr Ser Glu Val His Leu Lys

450 455 460

Asp Gln Gln Thr Asp Ile Glu Lys Ile Lys Thr Phe Leu Asp Ala Leu

465 470 475 480

Gln Asn Leu Met His Leu Leu Lys Ser Leu Cys Val Ser Glu Glu Ala

485 490 495

Asp Arg Asp Ala Ala Phe Tyr Asn Glu Phe Asp Met Leu Tyr Asn Gln

500 505 510

Leu Lys Leu Val Val Pro Leu Tyr Asn Lys Val Arg Asn Tyr Ile Thr

515 520 525

Gln Lys Leu Phe Arg Ser Asp Lys Ile Lys Ile Tyr Phe Glu Asn Lys

530 535 540

Gly Gln Phe Leu Gly Gly Trp Val Asp Ser Gln Thr Glu Asn Ser Asp

545 550 555 560

Asn Gly Thr Gln Ala Gly Gly Tyr Ile Phe Arg Lys Glu Asn Val Ile

565 570 575

Asn Glu Tyr Asp Tyr Tyr Leu Gly Ile Cys Ser Asp Pro Lys Leu Phe

580 585 590

Arg Arg Thr Thr Ile Val Ser Glu Asn Asp Arg Ser Ser Phe Glu Arg

595 600 605

Leu Asp Tyr Tyr Gln Leu Lys Thr Ala Ser Val Tyr Gly Asn Ser Tyr

610 615 620

Cys Gly Lys His Pro Tyr Thr Glu Asp Lys Asn Glu Leu Val Asn Ser

625 630 635 640

Ile Asp Arg Phe Val His Leu Ser Gly Asn Asn Ile Leu Ile Glu Lys

645 650 655

Ile Ala Lys Asp Lys Val Lys Ser Asn Pro Thr Thr Asn Thr Pro Ser

660 665 670

Gly Tyr Leu Asn Phe Ile His Arg Glu Ala Pro Asn Thr Tyr Glu Cys

675 680 685

Leu Leu Gln Asp Glu Asn Phe Val Ser Leu Asn Gln Arg Val Val Ser

690 695 700

Ala Leu Lys Ala Thr Leu Ala Thr Leu Val Arg Val Pro Lys Ala Leu

705 710 715 720

Val Tyr Ala Lys Lys Asp Tyr His Leu Phe Ser Glu Ile Ile Asn Asp

725 730 735

Ile Asp Glu Leu Ser Tyr Glu Lys Ala Phe Ser Tyr Phe Pro Val Ser

740 745 750

Gln Thr Glu Phe Glu Asn Ser Ser Asn Arg Thr Ile Lys Pro Leu Leu

755 760 765

Leu Phe Lys Ile Ser Asn Lys Asp Leu Ser Phe Ala Glu Asn Phe Glu

770 775 780

Lys Gly Asn Arg Gln Lys Ile Gly Lys Lys Asn Leu His Thr Leu Tyr

785 790 795 800

Phe Glu Ala Leu Met Lys Gly Asn Gln Asp Thr Ile Asp Ile Gly Thr

805 810 815

Gly Met Val Phe His Arg Val Lys Ser Leu Asn Tyr Asn Glu Lys Thr

820 825 830

Leu Lys Tyr Gly His His Ser Thr Gln Leu Asn Glu Lys Phe Ser Tyr

835 840 845

Pro Ile Ile Lys Asp Lys Arg Phe Ala Ser Asp Lys Phe Leu Phe His

850 855 860

Leu Ser Thr Glu Ile Asn Tyr Lys Glu Lys Arg Lys Pro Leu Asn Asn

865 870 875 880

Ser Ile Ile Glu Phe Leu Thr Asn Asn Pro Asp Ile Asn Ile Ile Gly

885 890 895

Leu Asp Arg Gly Glu Arg His Leu Ile Tyr Leu Thr Leu Ile Asn Gln

900 905 910

Lys Gly Glu Ile Leu Arg Gln Lys Thr Phe Asn Ile Val Gly Asn Thr

915 920 925

Asn Tyr His Glu Lys Leu Asn Gln Arg Glu Lys Glu Arg Asp Asn Ala

930 935 940

Arg Lys Ser Trp Ala Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly

945 950 955 960

Phe Leu Ser Leu Val Ile His Glu Ile Ala Lys Ile Met Val Glu Asn

965 970 975

Asn Ala Ile Val Val Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly

980 985 990

Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Lys Phe Glu Lys Met Leu

995 1000 1005

Ile Asp Lys Leu Asn Tyr Leu Val Phe Lys Asp Lys Lys Ala Asn

1010 1015 1020

Glu Ala Gly Gly Val Leu Lys Gly Tyr Gln Leu Ala Glu Lys Phe

1025 1030 1035

Glu Ser Phe Gln Lys Met Gly Lys Gln Ser Gly Phe Leu Phe Tyr

1040 1045 1050

Val Pro Ala Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe

1055 1060 1065

Val Asn Met Leu Asn Leu Asn Tyr Thr Asn Met Lys Asp Ala Gln

1070 1075 1080

Thr Leu Leu Ser Gly Met Asp Lys Ile Ser Phe Asn Ala Asp Ala

1085 1090 1095

Asn Tyr Phe Glu Phe Glu Leu Asp Tyr Glu Lys Phe Lys Thr Asn

1100 1105 1110

Gln Thr Asp His Thr Asn Lys Trp Thr Ile Cys Thr Val Gly Glu

1115 1120 1125

Lys Arg Phe Thr Tyr Asn Ser Ala Thr Lys Glu Thr Thr Thr Val

1130 1135 1140

Asn Val Thr Glu Asp Leu Lys Lys Leu Leu Asp Lys Phe Glu Val

1145 1150 1155

Lys Tyr Ser Asn Gly Asp Asn Ile Lys Asp Glu Ile Cys Arg Gln

1160 1165 1170

Thr Asp Ala Lys Phe Phe Glu Ile Ile Leu Trp Leu Leu Lys Leu

1175 1180 1185

Thr Met Gln Met Arg Asn Ser Asn Thr Lys Thr Glu Glu Asp Phe

1190 1195 1200

Ile Leu Ser Pro Val Lys Asn Ser Asn Gly Glu Phe Phe Arg Ser

1205 1210 1215

Asn Asp Asp Ala Asn Gly Ile Trp Pro Ala Asp Ala Asp Ala Asn

1220 1225 1230

Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Tyr Leu Val Lys Glu

1235 1240 1245

Cys Phe Asn Lys Asn Glu Lys Ser Leu Lys Ile Glu His Lys Asn

1250 1255 1260

Trp Phe Lys Phe Ala Gln Thr Arg Phe Asn Gly Ser Leu Thr Lys

1265 1270 1275

Asn Gly

1280

<210> 11

<211> 1154

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 11

Met Glu Asn Phe Lys Asn Leu Tyr Pro Ile Asn Lys Thr Leu Arg Phe

1 5 10 15

Glu Leu Arg Pro Tyr Gly Lys Thr Leu Glu Asn Phe Lys Lys Ser Gly

20 25 30

Leu Leu Glu Lys Asp Ala Phe Lys Ala Asn Ser Arg Arg Ser Met Gln

35 40 45

Ala Ile Ile Asp Glu Lys Phe Lys Glu Thr Ile Glu Glu Arg Leu Lys

50 55 60

Tyr Thr Glu Phe Ser Glu Cys Asp Leu Gly Asn Met Thr Ser Lys Asp

65 70 75 80

Lys Lys Ile Thr Asp Lys Ala Ala Thr Asn Leu Lys Lys Gln Val Ile

85 90 95

Leu Ser Phe Asp Asp Glu Ile Phe Asn Asn Tyr Leu Lys Pro Asp Lys

100 105 110

Asn Ile Asp Ala Leu Phe Lys Asn Asp Pro Ser Asn Pro Val Ile Ser

115 120 125

Thr Phe Lys Gly Phe Thr Thr Tyr Phe Val Asn Phe Phe Glu Ile Arg

130 135 140

Lys His Ile Phe Lys Gly Glu Ser Ser Gly Ser Met Ala Tyr Arg Ile

145 150 155 160

Ile Asp Glu Asn Leu Thr Thr Tyr Leu Asn Asn Ile Glu Lys Ile Lys

165 170 175

Lys Leu Pro Glu Glu Leu Lys Ser Gln Leu Glu Gly Ile Asp Gln Ile

180 185 190

Asp Lys Leu Asn Asn Tyr Asn Glu Phe Ile Thr Gln Ser Gly Ile Thr

195 200 205

His Tyr Asn Glu Ile Ile Gly Gly Ile Ser Lys Ser Glu Asn Val Lys

210 215 220

Ile Gln Gly Ile Asn Glu Gly Ile Asn Leu Tyr Cys Gln Lys Asn Lys

225 230 235 240

Val Lys Leu Pro Arg Leu Thr Pro Leu Tyr Lys Met Ile Leu Ser Asp

245 250 255

Arg Val Ser Asn Ser Phe Val Leu Asp Thr Ile Glu Asn Asp Thr Glu

260 265 270

Leu Ile Glu Met Ile Ser Asp Leu Ile Asn Lys Thr Glu Ile Ser Gln

275 280 285

Asp Val Ile Met Ser Asp Ile Gln Asn Ile Phe Ile Lys Tyr Lys Gln

290 295 300

Leu Gly Asn Leu Pro Gly Ile Ser Tyr Ser Ser Ile Val Asn Ala Ile

305 310 315 320

Cys Ser Asp Tyr Asp Asn Asn Phe Gly Asp Gly Lys Arg Lys Lys Ser

325 330 335

Tyr Glu Asn Asp Arg Lys Lys His Leu Glu Thr Asn Val Tyr Ser Ile

340 345 350

Asn Tyr Ile Ser Glu Leu Leu Thr Asp Thr Asp Val Ser Ser Asn Ile

355 360 365

Lys Met Arg Tyr Lys Glu Leu Glu Gln Asn Tyr Gln Val Cys Lys Glu

370 375 380

Asn Phe Asn Ala Thr Asn Trp Met Asn Ile Lys Asn Ile Lys Gln Ser

385 390 395 400

Glu Lys Thr Asn Leu Ile Lys Asp Leu Leu Asp Ile Leu Lys Ser Ile

405 410 415

Gln Arg Phe Tyr Asp Leu Phe Asp Ile Val Asp Glu Asp Lys Asn Pro

420 425 430

Ser Ala Glu Phe Tyr Thr Trp Leu Ser Lys Asn Ala Glu Lys Leu Asp

435 440 445

Phe Glu Phe Asn Ser Val Tyr Asn Lys Ser Arg Asn Tyr Leu Thr Arg

450 455 460

Lys Gln Tyr Ser Asp Lys Lys Ile Lys Leu Asn Phe Asp Ser Pro Thr

465 470 475 480

Leu Ala Lys Gly Trp Asp Ala Asn Lys Glu Ile Asp Asn Ser Thr Ile

485 490 495

Ile Met Arg Lys Phe Asn Asn Asp Arg Gly Asp Tyr Asp Tyr Phe Leu

500 505 510

Gly Ile Trp Asn Lys Ser Thr Pro Ala Asn Glu Lys Ile Ile Pro Leu

515 520 525

Glu Asp Asn Gly Leu Phe Glu Lys Met Gln Tyr Lys Leu Tyr Pro Asp

530 535 540

Pro Ser Lys Met Leu Pro Lys Gln Phe Leu Ser Lys Ile Trp Lys Ala

545 550 555 560

Lys His Pro Thr Thr Pro Glu Phe Asp Lys Lys Tyr Lys Glu Gly Arg

565 570 575

His Lys Lys Gly Pro Asp Phe Glu Lys Glu Phe Leu His Glu Leu Ile

580 585 590

Asp Cys Phe Lys His Gly Leu Val Asn His Asp Glu Lys Tyr Gln Asp

595 600 605

Val Phe Gly Phe Asn Leu Arg Asn Thr Glu Asp Tyr Asn Ser Tyr Thr

610 615 620

Glu Phe Leu Glu Asp Val Glu Arg Cys Asn Tyr Asn Leu Ser Phe Asn

625 630 635 640

Lys Ile Ala Asp Thr Ser Asn Leu Ile Asn Asp Gly Lys Leu Tyr Val

645 650 655

Phe Gln Ile Trp Ser Lys Asp Phe Ser Ile Asp Ser Lys Gly Thr Lys

660 665 670

Asn Leu Asn Thr Ile Tyr Phe Glu Ser Leu Phe Ser Glu Glu Asn Met

675 680 685

Ile Glu Lys Met Phe Lys Leu Ser Gly Glu Ala Glu Ile Phe Tyr Arg

690 695 700

Pro Ala Ser Leu Asn Tyr Cys Glu Asp Ile Ile Lys Lys Gly His His

705 710 715 720

His Ala Glu Leu Lys Asp Lys Phe Asp Tyr Pro Ile Ile Lys Asp Lys

725 730 735

Arg Tyr Ser Gln Asp Lys Phe Phe Phe His Val Pro Met Val Ile Asn

740 745 750

Tyr Lys Ser Glu Lys Leu Asn Ser Lys Ser Leu Asn Asn Arg Thr Asn

755 760 765

Glu Asn Leu Gly Gln Phe Thr His Ile Ile Gly Ile Asp Arg Gly Glu

770 775 780

Arg His Leu Ile Tyr Leu Thr Val Val Asp Val Ser Thr Gly Glu Ile

785 790 795 800

Val Glu Gln Lys His Leu Asp Glu Ile Ile Asn Thr Asp Thr Lys Gly

805 810 815

Val Glu His Lys Thr His Tyr Leu Asn Lys Leu Glu Glu Lys Ser Lys

820 825 830

Thr Arg Asp Asn Glu Arg Lys Ser Trp Glu Ala Ile Glu Thr Ile Lys

835 840 845

Glu Leu Lys Glu Gly Tyr Ile Ser His Val Ile Asn Glu Ile Gln Lys

850 855 860

Leu Gln Glu Lys Tyr Asn Ala Leu Ile Val Met Glu Asn Leu Asn Tyr

865 870 875 880

Gly Phe Lys Asn Ser Arg Ile Lys Val Glu Lys Gln Val Tyr Gln Lys

885 890 895

Phe Glu Thr Ala Leu Ile Lys Lys Phe Asn Tyr Ile Ile Asp Lys Lys

900 905 910

Asp Pro Glu Thr Tyr Ile His Gly Tyr Gln Leu Thr Asn Pro Ile Thr

915 920 925

Thr Leu Asp Lys Ile Gly Asn Gln Ser Gly Ile Val Leu Tyr Ile Pro

930 935 940

Ala Trp Asn Thr Ser Lys Ile Asp Pro Val Thr Gly Phe Val Asn Leu

945 950 955 960

Leu Tyr Ala Asp Asp Leu Lys Tyr Lys Asn Gln Glu Gln Ala Lys Ser

965 970 975

Phe Ile Gln Lys Ile Asp Asn Ile Tyr Phe Glu Asn Gly Glu Phe Lys

980 985 990

Phe Asp Ile Asp Phe Ser Lys Trp Asn Asn Arg Tyr Ser Ile Ser Lys

995 1000 1005

Thr Lys Trp Thr Leu Thr Ser Tyr Gly Thr Arg Ile Gln Thr Phe

1010 1015 1020

Arg Asn Pro Gln Lys Asn Asn Lys Trp Asp Ser Ala Glu Tyr Asp

1025 1030 1035

Leu Thr Glu Glu Phe Lys Leu Ile Leu Asn Ile Asp Gly Thr Leu

1040 1045 1050

Lys Ser Gln Asp Val Glu Thr Tyr Lys Lys Phe Met Ser Leu Phe

1055 1060 1065

Lys Leu Met Leu Gln Leu Arg Asn Ser Val Thr Gly Thr Asp Ile

1070 1075 1080

Asp Tyr Met Ile Ser Pro Val Thr Asp Lys Thr Gly Thr His Phe

1085 1090 1095

Asp Ser Arg Glu Asn Ile Lys Asn Leu Pro Ala Asp Ala Asp Ala

1100 1105 1110

Asn Gly Ala Tyr Asn Ile Ala Arg Lys Gly Ile Met Ala Ile Glu

1115 1120 1125

Asn Ile Met Asn Gly Ile Ser Asp Pro Leu Lys Ile Ser Asn Glu

1130 1135 1140

Asp Tyr Leu Lys Tyr Ile Gln Asn Gln Gln Glu

1145 1150

<210> 12

<211> 1307

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 12

Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr

1 5 10 15

Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln

20 25 30

Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys

35 40 45

Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln

50 55 60

Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile

65 70 75 80

Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile

85 90 95

Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly

100 105 110

Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile

115 120 125

Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys

130 135 140

Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg

145 150 155 160

Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg

165 170 175

Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg

180 185 190

Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe

195 200 205

Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn

210 215 220

Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val

225 230 235 240

Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp

245 250 255

Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu

260 265 270

Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn

275 280 285

Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro

290 295 300

Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu

305 310 315 320

Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr

325 330 335

Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu

340 345 350

Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His

355 360 365

Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr

370 375 380

Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys

385 390 395 400

Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu

405 410 415

Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser

420 425 430

Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala

435 440 445

Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys

450 455 460

Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu

465 470 475 480

Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe

485 490 495

Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser

500 505 510

Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val

515 520 525

Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp

530 535 540

Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn

545 550 555 560

Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys

565 570 575

Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys

580 585 590

Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys

595 600 605

Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr

610 615 620

Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys

625 630 635 640

Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln

645 650 655

Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala

660 665 670

Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr

675 680 685

Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr

690 695 700

Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His

705 710 715 720

Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu

725 730 735

Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys

740 745 750

Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu

755 760 765

Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln

770 775 780

Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His

785 790 795 800

Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr

805 810 815

Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His

820 825 830

Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn

835 840 845

Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe

850 855 860

Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln

865 870 875 880

Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu

885 890 895

Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg

900 905 910

Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu

915 920 925

Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu

930 935 940

Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val

945 950 955 960

Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile

965 970 975

His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu

980 985 990

Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu

995 1000 1005

Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu

1010 1015 1020

Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly

1025 1030 1035

Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala

1040 1045 1050

Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro

1055 1060 1065

Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe

1070 1075 1080

Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu

1085 1090 1095

Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe

1100 1105 1110

Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly

1115 1120 1125

Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn

1130 1135 1140

Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys

1145 1150 1155

Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr

1160 1165 1170

Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu

1175 1180 1185

Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu

1190 1195 1200

Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu

1205 1210 1215

Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly

1220 1225 1230

Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys

1235 1240 1245

Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp

1250 1255 1260

Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu

1265 1270 1275

Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile

1280 1285 1290

Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn

1295 1300 1305

<210> 13

<211> 1129

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 13

Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro

1 5 10 15

Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly

20 25 30

Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu

35 40 45

Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr

50 55 60

Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln

65 70 75 80

Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu

85 90 95

Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly

100 105 110

Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu

115 120 125

Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn

130 135 140

Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu

145 150 155 160

Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala

165 170 175

Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg

180 185 190

Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg

195 200 205

Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala

210 215 220

Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln

225 230 235 240

Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn

245 250 255

Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln

260 265 270

Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala

275 280 285

His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu

290 295 300

Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala

305 310 315 320

Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His

325 330 335

Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg

340 345 350

Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu

355 360 365

Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp

370 375 380

Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn

385 390 395 400

Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His

405 410 415

Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg

420 425 430

Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp

435 440 445

Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg

450 455 460

Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys

465 470 475 480

Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly

485 490 495

Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser

500 505 510

Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu

515 520 525

Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp

530 535 540

Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu

545 550 555 560

Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser

565 570 575

Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro

580 585 590

Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp

595 600 605

Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly

610 615 620

Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg

625 630 635 640

Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val

645 650 655

Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys

660 665 670

Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp

675 680 685

Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly

690 695 700

Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg

705 710 715 720

Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp

725 730 735

Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val

740 745 750

Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr

755 760 765

Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val

770 775 780

Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His

785 790 795 800

Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile

805 810 815

Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys

820 825 830

Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu

835 840 845

Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn

850 855 860

Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile

865 870 875 880

Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala

885 890 895

Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys

900 905 910

Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe

915 920 925

Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys

930 935 940

Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe

945 950 955 960

Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala

965 970 975

Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe

980 985 990

Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly

995 1000 1005

Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp

1010 1015 1020

Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr

1025 1030 1035

Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln

1040 1045 1050

Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp

1055 1060 1065

Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly

1070 1075 1080

Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser

1085 1090 1095

Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg

1100 1105 1110

Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp

1115 1120 1125

Ile

<210> 14

<211> 1108

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 14

Met Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val

1 5 10 15

Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala

20 25 30

Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu

35 40 45

His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu

50 55 60

Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn

65 70 75 80

Ser Phe Thr His Glu Val Asp Lys Asp Val Val Phe Asn Ile Leu Arg

85 90 95

Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu

100 105 110

Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn

115 120 125

Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp

130 135 140

Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys

145 150 155 160

Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly

165 170 175

Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Phe Thr Asp

180 185 190

Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg

195 200 205

Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu

210 215 220

Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu

225 230 235 240

Tyr Glu Lys Val Glu Lys Glu His Lys Thr Leu Glu Glu Arg Ile Lys

245 250 255

Glu Asp Ile Gln Ala Phe Lys Ser Leu Glu Gln Tyr Glu Lys Glu Arg

260 265 270

Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu

275 280 285

Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu

290 295 300

Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys

305 310 315 320

Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr

325 330 335

Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro

340 345 350

Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys

355 360 365

Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn

370 375 380

His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn

385 390 395 400

Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys

405 410 415

Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly

420 425 430

Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg

435 440 445

Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His

450 455 460

Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr

465 470 475 480

Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr

485 490 495

Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met

500 505 510

Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys

515 520 525

Ile His Arg Asp Asp Phe Pro Lys Phe Val Asn Phe Lys Pro Lys Glu

530 535 540

Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly

545 550 555 560

Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly

565 570 575

Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys

580 585 590

Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu

595 600 605

Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr

610 615 620

Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu

625 630 635 640

Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe

645 650 655

Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp

660 665 670

Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu

675 680 685

Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val

690 695 700

Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys

705 710 715 720

Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu

725 730 735

Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys

740 745 750

Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg

755 760 765

Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu

770 775 780

Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile

785 790 795 800

Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln

805 810 815

Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn

820 825 830

Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met

835 840 845

Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu

850 855 860

Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg

865 870 875 880

Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr

885 890 895

Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu

900 905 910

Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu

915 920 925

Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg

930 935 940

Lys Leu Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln

945 950 955 960

Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys

965 970 975

Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp

980 985 990

Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu

995 1000 1005

Lys Asp Gly Val Tyr Glu Trp Gly Asn Ala Gly Lys Leu Lys Ile

1010 1015 1020

Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser

1025 1030 1035

Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly

1040 1045 1050

Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro

1055 1060 1065

Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu

1070 1075 1080

Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr

1085 1090 1095

Ile Glu Asp Asp Ser Ser Lys Gln Ser Met

1100 1105

<210> 15

<211> 1149

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 15

Met Pro Thr Arg Thr Ile Asn Leu Lys Leu Val Leu Gly Lys Asn Pro

1 5 10 15

Glu Asn Ala Thr Leu Arg Arg Ala Leu Phe Ser Thr His Arg Leu Val

20 25 30

Asn Gln Ala Thr Lys Arg Ile Glu Glu Phe Leu Leu Leu Cys Arg Gly

35 40 45

Glu Ala Tyr Arg Thr Val Asp Asn Glu Gly Lys Glu Ala Glu Ile Pro

50 55 60

Arg His Ala Val Gln Glu Glu Ala Leu Ala Phe Ala Lys Ala Ala Gln

65 70 75 80

Arg His Asn Gly Cys Ile Ser Thr Tyr Glu Asp Gln Glu Ile Leu Asp

85 90 95

Val Leu Arg Gln Leu Tyr Glu Arg Leu Val Pro Ser Val Asn Glu Asn

100 105 110

Asn Glu Ala Gly Asp Ala Gln Ala Ala Asn Ala Trp Val Ser Pro Leu

115 120 125

Met Ser Ala Glu Ser Glu Gly Gly Leu Ser Val Tyr Asp Lys Val Leu

130 135 140

Asp Pro Pro Pro Val Trp Met Lys Leu Lys Glu Glu Lys Ala Pro Gly

145 150 155 160

Trp Glu Ala Ala Ser Gln Ile Trp Ile Gln Ser Asp Glu Gly Gln Ser

165 170 175

Leu Leu Asn Lys Pro Gly Ser Pro Pro Arg Trp Ile Arg Lys Leu Arg

180 185 190

Ser Gly Gln Pro Trp Gln Asp Asp Phe Val Ser Asp Gln Lys Lys Lys

195 200 205

Gln Asp Glu Leu Thr Lys Gly Asn Ala Pro Leu Ile Lys Gln Leu Lys

210 215 220

Glu Met Gly Leu Leu Pro Leu Val Asn Pro Phe Phe Arg His Leu Leu

225 230 235 240

Asp Pro Glu Gly Lys Gly Val Ser Pro Trp Asp Arg Leu Ala Val Arg

245 250 255

Ala Ala Val Ala His Phe Ile Ser Trp Glu Ser Trp Asn His Arg Thr

260 265 270

Arg Ala Glu Tyr Asn Ser Leu Lys Leu Arg Arg Asp Glu Phe Glu Ala

275 280 285

Ala Ser Asp Glu Phe Lys Asp Asp Phe Thr Leu Leu Arg Gln Tyr Glu

290 295 300

Ala Lys Arg His Ser Thr Leu Lys Ser Ile Ala Leu Ala Asp Asp Ser

305 310 315 320

Asn Pro Tyr Arg Ile Gly Val Arg Ser Leu Arg Ala Trp Asn Arg Val

325 330 335

Arg Glu Glu Trp Ile Asp Lys Gly Ala Thr Glu Glu Gln Arg Val Thr

340 345 350

Ile Leu Ser Lys Leu Gln Thr Gln Leu Arg Gly Lys Phe Gly Asp Pro

355 360 365

Asp Leu Phe Asn Trp Leu Ala Gln Asp Arg His Val His Leu Trp Ser

370 375 380

Pro Arg Asp Ser Val Thr Pro Leu Val Arg Ile Asn Ala Val Asp Lys

385 390 395 400

Val Leu Arg Arg Arg Lys Pro Tyr Ala Leu Met Thr Phe Ala His Pro

405 410 415

Arg Phe His Pro Arg Trp Ile Leu Tyr Glu Ala Pro Gly Gly Ser Asn

420 425 430

Leu Arg Gln Tyr Ala Leu Asp Cys Thr Glu Asn Ala Leu His Ile Thr

435 440 445

Leu Pro Leu Leu Val Asp Asp Ala His Gly Thr Trp Ile Glu Lys Lys

450 455 460

Ile Arg Val Pro Leu Ala Pro Ser Gly Gln Ile Gln Asp Leu Thr Leu

465 470 475 480

Glu Lys Leu Glu Lys Lys Lys Asn Arg Leu Tyr Tyr Arg Ser Gly Phe

485 490 495

Gln Gln Phe Ala Gly Leu Ala Gly Gly Ala Glu Val Leu Phe His Arg

500 505 510

Pro Tyr Met Glu His Asp Glu Arg Ser Glu Glu Ser Leu Leu Glu Arg

515 520 525

Pro Gly Ala Val Trp Phe Lys Leu Thr Leu Asp Val Ala Thr Gln Ala

530 535 540

Pro Pro Asn Trp Leu Asp Gly Lys Gly Arg Val Arg Thr Pro Pro Glu

545 550 555 560

Val His His Phe Lys Thr Ala Leu Ser Asn Lys Ser Lys His Thr Arg

565 570 575

Thr Leu Gln Pro Gly Leu Arg Val Leu Ser Val Asp Leu Gly Met Arg

580 585 590

Thr Phe Ala Ser Cys Ser Val Phe Glu Leu Ile Glu Gly Lys Pro Glu

595 600 605

Thr Gly Arg Ala Phe Pro Val Ala Asp Glu Arg Ser Met Asp Ser Pro

610 615 620

Asn Lys Leu Trp Ala Lys His Glu Arg Ser Phe Lys Leu Thr Leu Pro

625 630 635 640

Gly Glu Thr Pro Ser Arg Lys Glu Glu Glu Glu Arg Ser Ile Ala Arg

645 650 655

Ala Glu Ile Tyr Ala Leu Lys Arg Asp Ile Gln Arg Leu Lys Ser Leu

660 665 670

Leu Arg Leu Gly Glu Glu Asp Asn Asp Asn Arg Arg Asp Ala Leu Leu

675 680 685

Glu Gln Phe Phe Lys Gly Trp Gly Glu Glu Asp Val Val Pro Gly Gln

690 695 700

Ala Phe Pro Arg Ser Leu Phe Gln Gly Leu Gly Ala Ala Pro Phe Arg

705 710 715 720

Ser Thr Pro Glu Leu Trp Arg Gln His Cys Gln Thr Tyr Tyr Asp Lys

725 730 735

Ala Glu Ala Cys Leu Ala Lys His Ile Ser Asp Trp Arg Lys Arg Thr

740 745 750

Arg Pro Arg Pro Thr Ser Arg Glu Met Trp Tyr Lys Thr Arg Ser Tyr

755 760 765

His Gly Gly Lys Ser Ile Trp Met Leu Glu Tyr Leu Asp Ala Val Arg

770 775 780

Lys Leu Leu Leu Ser Trp Ser Leu Arg Gly Arg Thr Tyr Gly Ala Ile

785 790 795 800

Asn Arg Gln Asp Thr Ala Arg Phe Gly Ser Leu Ala Ser Arg Leu Leu

805 810 815

His His Ile Asn Ser Leu Lys Glu Asp Arg Ile Lys Thr Gly Ala Asp

820 825 830

Ser Ile Val Gln Ala Ala Arg Gly Tyr Ile Pro Leu Pro His Gly Lys

835 840 845

Gly Trp Glu Gln Arg Tyr Glu Pro Cys Gln Leu Ile Leu Phe Glu Asp

850 855 860

Leu Ala Arg Tyr Arg Phe Arg Val Asp Arg Pro Arg Arg Glu Asn Ser

865 870 875 880

Gln Leu Met Gln Trp Asn His Arg Ala Ile Val Ala Glu Thr Thr Met

885 890 895

Gln Ala Glu Leu Tyr Gly Gln Ile Val Glu Asn Thr Ala Ala Gly Phe

900 905 910

Ser Ser Arg Phe His Ala Ala Thr Gly Ala Pro Gly Val Arg Cys Arg

915 920 925

Phe Leu Leu Glu Arg Asp Phe Asp Asn Asp Leu Pro Lys Pro Tyr Leu

930 935 940

Leu Arg Glu Leu Ser Trp Met Leu Gly Asn Thr Lys Val Glu Ser Glu

945 950 955 960

Glu Glu Lys Leu Arg Leu Leu Ser Glu Lys Ile Arg Pro Gly Ser Leu

965 970 975

Val Pro Trp Asp Gly Gly Glu Gln Phe Ala Thr Leu His Pro Lys Arg

980 985 990

Gln Thr Leu Cys Val Ile His Ala Asp Met Asn Ala Ala Gln Asn Leu

995 1000 1005

Gln Arg Arg Phe Phe Gly Arg Cys Gly Glu Ala Phe Arg Leu Val

1010 1015 1020

Cys Gln Pro His Gly Asp Asp Val Leu Arg Leu Ala Ser Thr Pro

1025 1030 1035

Gly Ala Arg Leu Leu Gly Ala Leu Gln Gln Leu Glu Asn Gly Gln

1040 1045 1050

Gly Ala Phe Glu Leu Val Arg Asp Met Gly Ser Thr Ser Gln Met

1055 1060 1065

Asn Arg Phe Val Met Lys Ser Leu Gly Lys Lys Lys Ile Lys Pro

1070 1075 1080

Leu Gln Asp Asn Asn Gly Asp Asp Glu Leu Glu Asp Val Leu Ser

1085 1090 1095

Val Leu Pro Glu Glu Asp Asp Thr Gly Arg Ile Thr Val Phe Arg

1100 1105 1110

Asp Ser Ser Gly Ile Phe Phe Pro Cys Asn Val Trp Ile Pro Ala

1115 1120 1125

Lys Gln Phe Trp Pro Ala Val Arg Ala Met Ile Trp Lys Val Met

1130 1135 1140

Ala Ser His Ser Leu Gly

1145

<210> 16

<211> 1252

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 16

Met Thr Lys Leu Arg His Arg Gln Lys Lys Leu Thr His Asp Trp Ala

1 5 10 15

Gly Ser Lys Lys Arg Glu Val Leu Gly Ser Asn Gly Lys Leu Gln Asn

20 25 30

Pro Leu Leu Met Pro Val Lys Lys Gly Gln Val Thr Glu Phe Arg Lys

35 40 45

Ala Phe Ser Ala Tyr Ala Arg Ala Thr Lys Gly Glu Met Thr Asp Gly

50 55 60

Arg Lys Asn Met Phe Thr His Ser Phe Glu Pro Phe Lys Thr Lys Pro

65 70 75 80

Ser Leu His Gln Cys Glu Leu Ala Asp Lys Ala Tyr Gln Ser Leu His

85 90 95

Ser Tyr Leu Pro Gly Ser Leu Ala His Phe Leu Leu Ser Ala His Ala

100 105 110

Leu Gly Phe Arg Ile Phe Ser Lys Ser Gly Glu Ala Thr Ala Phe Gln

115 120 125

Ala Ser Ser Lys Ile Glu Ala Tyr Glu Ser Lys Leu Ala Ser Glu Leu

130 135 140

Ala Cys Val Asp Leu Ser Ile Gln Asn Leu Thr Ile Ser Thr Leu Phe

145 150 155 160

Asn Ala Leu Thr Thr Ser Val Arg Gly Lys Gly Glu Glu Thr Ser Ala

165 170 175

Asp Pro Leu Ile Ala Arg Phe Tyr Thr Leu Leu Thr Gly Lys Pro Leu

180 185 190

Ser Arg Asp Thr Gln Gly Pro Glu Arg Asp Leu Ala Glu Val Ile Ser

195 200 205

Arg Lys Ile Ala Ser Ser Phe Gly Thr Trp Lys Glu Met Thr Ala Asn

210 215 220

Pro Leu Gln Ser Leu Gln Phe Phe Glu Glu Glu Leu His Ala Leu Asp

225 230 235 240

Ala Asn Val Ser Leu Ser Pro Ala Phe Asp Val Leu Ile Lys Met Asn

245 250 255

Asp Leu Gln Gly Asp Leu Lys Asn Arg Thr Ile Val Phe Asp Pro Asp

260 265 270

Ala Pro Val Phe Glu Tyr Asn Ala Glu Asp Pro Ala Asp Ile Ile Ile

275 280 285

Lys Leu Thr Ala Arg Tyr Ala Lys Glu Ala Val Ile Lys Asn Gln Asn

290 295 300

Val Gly Asn Tyr Val Lys Asn Ala Ile Thr Thr Thr Asn Ala Asn Gly

305 310 315 320

Leu Gly Trp Leu Leu Asn Lys Gly Leu Ser Leu Leu Pro Val Ser Thr

325 330 335

Asp Asp Glu Leu Leu Glu Phe Ile Gly Val Glu Arg Ser His Pro Ser

340 345 350

Cys His Ala Leu Ile Glu Leu Ile Ala Gln Leu Glu Ala Pro Glu Leu

355 360 365

Phe Glu Lys Asn Val Phe Ser Asp Thr Arg Ser Glu Val Gln Gly Met

370 375 380

Ile Asp Ser Ala Val Ser Asn His Ile Ala Arg Leu Ser Ser Ser Arg

385 390 395 400

Asn Ser Leu Ser Met Asp Ser Glu Glu Leu Glu Arg Leu Ile Lys Ser

405 410 415

Phe Gln Ile His Thr Pro His Cys Ser Leu Phe Ile Gly Ala Gln Ser

420 425 430

Leu Ser Gln Gln Leu Glu Ser Leu Pro Glu Ala Leu Gln Ser Gly Val

435 440 445

Asn Ser Ala Asp Ile Leu Leu Gly Ser Thr Gln Tyr Met Leu Thr Asn

450 455 460

Ser Leu Val Glu Glu Ser Ile Ala Thr Tyr Gln Arg Thr Leu Asn Arg

465 470 475 480

Ile Asn Tyr Leu Ser Gly Val Ala Gly Gln Ile Asn Gly Ala Ile Lys

485 490 495

Arg Lys Ala Ile Asp Gly Glu Lys Ile His Leu Pro Ala Ala Trp Ser

500 505 510

Glu Leu Ile Ser Leu Pro Phe Ile Gly Gln Pro Val Ile Asp Val Glu

515 520 525

Ser Asp Leu Ala His Leu Lys Asn Gln Tyr Gln Thr Leu Ser Asn Glu

530 535 540

Phe Asp Thr Leu Ile Ser Ala Leu Gln Lys Asn Phe Asp Leu Asn Phe

545 550 555 560

Asn Lys Ala Leu Leu Asn Arg Thr Gln His Phe Glu Ala Met Cys Arg

565 570 575

Ser Thr Lys Lys Asn Ala Leu Ser Lys Pro Glu Ile Val Ser Tyr Arg

580 585 590

Asp Leu Leu Ala Arg Leu Thr Ser Cys Leu Tyr Arg Gly Ser Leu Val

595 600 605

Leu Arg Arg Ala Gly Ile Glu Val Leu Lys Lys His Lys Ile Phe Glu

610 615 620

Ser Asn Ser Glu Leu Arg Glu His Val His Glu Arg Lys His Phe Val

625 630 635 640

Phe Val Ser Pro Leu Asp Arg Lys Ala Lys Lys Leu Leu Arg Leu Thr

645 650 655

Asp Ser Arg Pro Asp Leu Leu His Val Ile Asp Glu Ile Leu Gln His

660 665 670

Asp Asn Leu Glu Asn Lys Asp Arg Glu Ser Leu Trp Leu Val Arg Ser

675 680 685

Gly Tyr Leu Leu Ala Gly Leu Pro Asp Gln Leu Ser Ser Ser Phe Ile

690 695 700

Asn Leu Pro Ile Ile Thr Gln Lys Gly Asp Arg Arg Leu Ile Asp Leu

705 710 715 720

Ile Gln Tyr Asp Gln Ile Asn Arg Asp Ala Phe Val Met Leu Val Thr

725 730 735

Ser Ala Phe Lys Ser Asn Leu Ser Gly Leu Gln Tyr Arg Ala Asn Lys

740 745 750

Gln Ser Phe Val Val Thr Arg Thr Leu Ser Pro Tyr Leu Gly Ser Lys

755 760 765

Leu Val Tyr Val Pro Lys Asp Lys Asp Trp Leu Val Pro Ser Gln Met

770 775 780

Phe Glu Gly Arg Phe Ala Asp Ile Leu Gln Ser Asp Tyr Met Val Trp

785 790 795 800

Lys Asp Ala Gly Arg Leu Cys Val Ile Asp Thr Ala Lys His Leu Ser

805 810 815

Asn Ile Lys Lys Ser Val Phe Ser Ser Glu Glu Val Leu Ala Phe Leu

820 825 830

Arg Glu Leu Pro His Arg Thr Phe Ile Gln Thr Glu Val Arg Gly Leu

835 840 845

Gly Val Asn Val Asp Gly Ile Ala Phe Asn Asn Gly Asp Ile Pro Ser

850 855 860

Leu Lys Thr Phe Ser Asn Cys Val Gln Val Lys Val Ser Arg Thr Asn

865 870 875 880

Thr Ser Leu Val Gln Thr Leu Asn Arg Trp Phe Glu Gly Gly Lys Val

885 890 895

Ser Pro Pro Ser Ile Gln Phe Glu Arg Ala Tyr Tyr Lys Lys Asp Asp

900 905 910

Gln Ile His Glu Asp Ala Ala Lys Arg Lys Ile Arg Phe Gln Met Pro

915 920 925

Ala Thr Glu Leu Val His Ala Ser Asp Asp Ala Gly Trp Thr Pro Ser

930 935 940

Tyr Leu Leu Gly Ile Asp Pro Gly Glu Tyr Gly Met Gly Leu Ser Leu

945 950 955 960

Val Ser Ile Asn Asn Gly Glu Val Leu Asp Ser Gly Phe Ile His Ile

965 970 975

Asn Ser Leu Ile Asn Phe Ala Ser Lys Lys Ser Asn His Gln Thr Lys

980 985 990

Val Val Pro Arg Gln Gln Tyr Lys Ser Pro Tyr Ala Asn Tyr Leu Glu

995 1000 1005

Gln Ser Lys Asp Ser Ala Ala Gly Asp Ile Ala His Ile Leu Asp

1010 1015 1020

Arg Leu Ile Tyr Lys Leu Asn Ala Leu Pro Val Phe Glu Ala Leu

1025 1030 1035

Ser Gly Asn Ser Gln Ser Ala Ala Asp Gln Val Trp Thr Lys Val

1040 1045 1050

Leu Ser Phe Tyr Thr Trp Gly Asp Asn Asp Ala Gln Asn Ser Ile

1055 1060 1065

Arg Lys Gln His Trp Phe Gly Ala Ser His Trp Asp Ile Lys Gly

1070 1075 1080

Met Leu Arg Gln Pro Pro Thr Glu Lys Lys Pro Lys Pro Tyr Ile

1085 1090 1095

Ala Phe Pro Gly Ser Gln Val Ser Ser Tyr Gly Asn Ser Gln Arg

1100 1105 1110

Cys Ser Cys Cys Gly Arg Asn Pro Ile Glu Gln Leu Arg Glu Met

1115 1120 1125

Ala Lys Asp Thr Ser Ile Lys Glu Leu Lys Ile Arg Asn Ser Glu

1130 1135 1140

Ile Gln Leu Phe Asp Gly Thr Ile Lys Leu Phe Asn Pro Asp Pro

1145 1150 1155

Ser Thr Val Ile Glu Arg Arg Arg His Asn Leu Gly Pro Ser Arg

1160 1165 1170

Ile Pro Val Ala Asp Arg Thr Phe Lys Asn Ile Ser Pro Ser Ser

1175 1180 1185

Leu Glu Phe Lys Glu Leu Ile Thr Ile Val Ser Arg Ser Ile Arg

1190 1195 1200

His Ser Pro Glu Phe Ile Ala Lys Lys Arg Gly Ile Gly Ser Glu

1205 1210 1215

Tyr Phe Cys Ala Tyr Ser Asp Cys Asn Ser Ser Leu Asn Ser Glu

1220 1225 1230

Ala Asn Ala Ala Ala Asn Val Ala Gln Lys Phe Gln Lys Gln Leu

1235 1240 1245

Phe Phe Glu Leu

1250

<210> 17

<211> 1287

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 17

Met Lys Arg Ile Leu Asn Ser Leu Lys Val Ala Ala Leu Arg Leu Leu

1 5 10 15

Phe Arg Gly Lys Gly Ser Glu Leu Val Lys Thr Val Lys Tyr Pro Leu

20 25 30

Val Ser Pro Val Gln Gly Ala Val Glu Glu Leu Ala Glu Ala Ile Arg

35 40 45

His Asp Asn Leu His Leu Phe Gly Gln Lys Glu Ile Val Asp Leu Met

50 55 60

Glu Lys Asp Glu Gly Thr Gln Val Tyr Ser Val Val Asp Phe Trp Leu

65 70 75 80

Asp Thr Leu Arg Leu Gly Met Phe Phe Ser Pro Ser Ala Asn Ala Leu

85 90 95

Lys Ile Thr Leu Gly Lys Phe Asn Ser Asp Gln Val Ser Pro Phe Arg

100 105 110

Lys Val Leu Glu Gln Ser Pro Phe Phe Leu Ala Gly Arg Leu Lys Val

115 120 125

Glu Pro Ala Glu Arg Ile Leu Ser Val Glu Ile Arg Lys Ile Gly Lys

130 135 140

Arg Glu Asn Arg Val Glu Asn Tyr Ala Ala Asp Val Glu Thr Cys Phe

145 150 155 160

Ile Gly Gln Leu Ser Ser Asp Glu Lys Gln Ser Ile Gln Lys Leu Ala

165 170 175

Asn Asp Ile Trp Asp Ser Lys Asp His Glu Glu Gln Arg Met Leu Lys

180 185 190

Ala Asp Phe Phe Ala Ile Pro Leu Ile Lys Asp Pro Lys Ala Val Thr

195 200 205

Glu Glu Asp Pro Glu Asn Glu Thr Ala Gly Lys Gln Lys Pro Leu Glu

210 215 220

Leu Cys Val Cys Leu Val Pro Glu Leu Tyr Thr Arg Gly Phe Gly Ser

225 230 235 240

Ile Ala Asp Phe Leu Val Gln Arg Leu Thr Leu Leu Arg Asp Lys Met

245 250 255

Ser Thr Asp Thr Ala Glu Asp Cys Leu Glu Tyr Val Gly Ile Glu Glu

260 265 270

Glu Lys Gly Asn Gly Met Asn Ser Leu Leu Gly Thr Phe Leu Lys Asn

275 280 285

Leu Gln Gly Asp Gly Phe Glu Gln Ile Phe Gln Phe Met Leu Gly Ser

290 295 300

Tyr Val Gly Trp Gln Gly Lys Glu Asp Val Leu Arg Glu Arg Leu Asp

305 310 315 320

Leu Leu Ala Glu Lys Val Lys Arg Leu Pro Lys Pro Lys Phe Ala Gly

325 330 335

Glu Trp Ser Gly His Arg Met Phe Leu His Gly Gln Leu Lys Ser Trp

340 345 350

Ser Ser Asn Phe Phe Arg Leu Phe Asn Glu Thr Arg Glu Leu Leu Glu

355 360 365

Ser Ile Lys Ser Asp Ile Gln His Ala Thr Met Leu Ile Ser Tyr Val

370 375 380

Glu Glu Lys Gly Gly Tyr His Pro Gln Leu Leu Ser Gln Tyr Arg Lys

385 390 395 400

Leu Met Glu Gln Leu Pro Ala Leu Arg Thr Lys Val Leu Asp Pro Glu

405 410 415

Ile Glu Met Thr His Met Ser Glu Ala Val Arg Ser Tyr Ile Met Ile

420 425 430

His Lys Ser Val Ala Gly Phe Leu Pro Asp Leu Leu Glu Ser Leu Asp

435 440 445

Arg Asp Lys Asp Arg Glu Phe Leu Leu Ser Ile Phe Pro Arg Ile Pro

450 455 460

Lys Ile Asp Lys Lys Thr Lys Glu Ile Val Ala Trp Glu Leu Pro Gly

465 470 475 480

Glu Pro Glu Glu Gly Tyr Leu Phe Thr Ala Asn Asn Leu Phe Arg Asn

485 490 495

Phe Leu Glu Asn Pro Lys His Val Pro Arg Phe Met Ala Glu Arg Ile

500 505 510

Pro Glu Asp Trp Thr Arg Leu Arg Ser Ala Pro Val Trp Phe Asp Gly

515 520 525

Met Val Lys Gln Trp Gln Lys Val Val Asn Gln Leu Val Glu Ser Pro

530 535 540

Gly Ala Leu Tyr Gln Phe Asn Glu Ser Phe Leu Arg Gln Arg Leu Gln

545 550 555 560

Ala Met Leu Thr Val Tyr Lys Arg Asp Leu Gln Thr Glu Lys Phe Leu

565 570 575

Lys Leu Leu Ala Asp Val Cys Arg Pro Leu Val Asp Phe Phe Gly Leu

580 585 590

Gly Gly Asn Asp Ile Ile Phe Lys Ser Cys Gln Asp Pro Arg Lys Gln

595 600 605

Trp Gln Thr Val Ile Pro Leu Ser Val Pro Ala Asp Val Tyr Thr Ala

610 615 620

Cys Glu Gly Leu Ala Ile Arg Leu Arg Glu Thr Leu Gly Phe Glu Trp

625 630 635 640

Lys Asn Leu Lys Gly His Glu Arg Glu Asp Phe Leu Arg Leu His Gln

645 650 655

Leu Leu Gly Asn Leu Leu Phe Trp Ile Arg Asp Ala Lys Leu Val Val

660 665 670

Lys Leu Glu Asp Trp Met Asn Asn Pro Cys Val Gln Glu Tyr Val Glu

675 680 685

Ala Arg Lys Ala Ile Asp Leu Pro Leu Glu Ile Phe Gly Phe Glu Val

690 695 700

Pro Ile Phe Leu Asn Gly Tyr Leu Phe Ser Glu Leu Arg Gln Leu Glu

705 710 715 720

Leu Leu Leu Arg Arg Lys Ser Val Met Thr Ser Tyr Ser Val Lys Thr

725 730 735

Thr Gly Ser Pro Asn Arg Leu Phe Gln Leu Val Tyr Leu Pro Leu Asn

740 745 750

Pro Ser Asp Pro Glu Lys Lys Asn Ser Asn Asn Phe Gln Glu Arg Leu

755 760 765

Asp Thr Pro Thr Gly Leu Ser Arg Arg Phe Leu Asp Leu Thr Leu Asp

770 775 780

Ala Phe Ala Gly Lys Leu Leu Thr Asp Pro Val Thr Gln Glu Leu Lys

785 790 795 800

Thr Met Ala Gly Phe Tyr Asp His Leu Phe Gly Phe Lys Leu Pro Cys

805 810 815

Lys Leu Ala Ala Met Ser Asn His Pro Gly Ser Ser Ser Lys Met Val

820 825 830

Val Leu Ala Lys Pro Lys Lys Gly Val Ala Ser Asn Ile Gly Phe Glu

835 840 845

Pro Ile Pro Asp Pro Ala His Pro Val Phe Arg Val Arg Ser Ser Trp

850 855 860

Pro Glu Leu Lys Tyr Leu Glu Gly Leu Leu Tyr Leu Pro Glu Asp Thr

865 870 875 880

Pro Leu Thr Ile Glu Leu Ala Glu Thr Ser Val Ser Cys Gln Ser Val

885 890 895

Ser Ser Val Ala Phe Asp Leu Lys Asn Leu Thr Thr Ile Leu Gly Arg

900 905 910

Val Gly Glu Phe Arg Val Thr Ala Asp Gln Pro Phe Lys Leu Thr Pro

915 920 925

Ile Ile Pro Glu Lys Glu Glu Ser Phe Ile Gly Lys Thr Tyr Leu Gly

930 935 940

Leu Asp Ala Gly Glu Arg Ser Gly Val Gly Phe Ala Ile Val Thr Val

945 950 955 960

Asp Gly Asp Gly Tyr Glu Val Gln Arg Leu Gly Val His Glu Asp Thr

965 970 975

Gln Leu Met Ala Leu Gln Gln Val Ala Ser Lys Ser Leu Lys Glu Pro

980 985 990

Val Phe Gln Pro Leu Arg Lys Gly Thr Phe Arg Gln Gln Glu Arg Ile

995 1000 1005

Arg Lys Ser Leu Arg Gly Cys Tyr Trp Asn Phe Tyr His Ala Leu

1010 1015 1020

Met Ile Lys Tyr Arg Ala Lys Val Val His Glu Glu Ser Val Gly

1025 1030 1035

Ser Ser Gly Leu Val Gly Gln Trp Leu Arg Ala Phe Gln Lys Asp

1040 1045 1050

Leu Lys Lys Ala Asp Val Leu Pro Lys Lys Gly Gly Lys Asn Gly

1055 1060 1065

Val Asp Lys Lys Lys Arg Glu Ser Ser Ala Gln Asp Thr Leu Trp

1070 1075 1080

Gly Gly Ala Phe Ser Lys Lys Glu Glu Gln Gln Ile Ala Phe Glu

1085 1090 1095

Val Gln Ala Ala Gly Ser Ser Gln Phe Cys Leu Lys Cys Gly Trp

1100 1105 1110

Trp Phe Gln Leu Gly Met Arg Glu Val Asn Arg Val Gln Glu Ser

1115 1120 1125

Gly Val Val Leu Asp Trp Asn Arg Ser Ile Val Thr Phe Leu Ile

1130 1135 1140

Glu Ser Ser Gly Glu Lys Val Tyr Gly Phe Ser Pro Gln Gln Leu

1145 1150 1155

Glu Lys Gly Phe Arg Pro Asp Ile Glu Thr Phe Lys Lys Met Val

1160 1165 1170

Arg Asp Phe Met Arg Pro Pro Met Phe Asp Arg Lys Gly Arg Pro

1175 1180 1185

Ala Ala Ala Tyr Glu Arg Phe Val Leu Gly Arg Arg His Arg Arg

1190 1195 1200

Tyr Arg Phe Asp Lys Val Phe Glu Glu Arg Phe Gly Arg Ser Ala

1205 1210 1215

Leu Phe Ile Cys Pro Arg Val Gly Cys Gly Asn Phe Asp His Ser

1220 1225 1230

Ser Glu Gln Ser Ala Val Val Leu Ala Leu Ile Gly Tyr Ile Ala

1235 1240 1245

Asp Lys Glu Gly Met Ser Gly Lys Lys Leu Val Tyr Val Arg Leu

1250 1255 1260

Ala Glu Leu Met Ala Glu Trp Lys Leu Lys Lys Leu Glu Arg Ser

1265 1270 1275

Arg Val Glu Glu Gln Ser Ser Ala Gln

1280 1285

<210> 18

<211> 1192

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 18

Met Ala Glu Ser Lys Gln Met Gln Cys Arg Lys Cys Gly Ala Ser Met

1 5 10 15

Lys Tyr Glu Val Ile Gly Leu Gly Lys Lys Ser Cys Arg Tyr Met Cys

20 25 30

Pro Asp Cys Gly Asn His Thr Ser Ala Arg Lys Ile Gln Asn Lys Lys

35 40 45

Lys Arg Asp Lys Lys Tyr Gly Ser Ala Ser Lys Ala Gln Ser Gln Arg

50 55 60

Ile Ala Val Ala Gly Ala Leu Tyr Pro Asp Lys Lys Val Gln Thr Ile

65 70 75 80

Lys Thr Tyr Lys Tyr Pro Ala Asp Leu Asn Gly Glu Val His Asp Ser

85 90 95

Gly Val Ala Glu Lys Ile Ala Gln Ala Ile Gln Glu Asp Glu Ile Gly

100 105 110

Leu Leu Gly Pro Ser Ser Glu Tyr Ala Cys Trp Ile Ala Ser Gln Lys

115 120 125

Gln Ser Glu Pro Tyr Ser Val Val Asp Phe Trp Phe Asp Ala Val Cys

130 135 140

Ala Gly Gly Val Phe Ala Tyr Ser Gly Ala Arg Leu Leu Ser Thr Val

145 150 155 160

Leu Gln Leu Ser Gly Glu Glu Ser Val Leu Arg Ala Ala Leu Ala Ser

165 170 175

Ser Pro Phe Val Asp Asp Ile Asn Leu Ala Gln Ala Glu Lys Phe Leu

180 185 190

Ala Val Ser Arg Arg Thr Gly Gln Asp Lys Leu Gly Lys Arg Ile Gly

195 200 205

Glu Cys Phe Ala Glu Gly Arg Leu Glu Ala Leu Gly Ile Lys Asp Arg

210 215 220

Met Arg Glu Phe Val Gln Ala Ile Asp Val Ala Gln Thr Ala Gly Gln

225 230 235 240

Arg Phe Ala Ala Lys Leu Lys Ile Phe Gly Ile Ser Gln Met Pro Glu

245 250 255

Ala Lys Gln Trp Asn Asn Asp Ser Gly Leu Thr Val Cys Ile Leu Pro

260 265 270

Asp Tyr Tyr Val Pro Glu Glu Asn Arg Ala Asp Gln Leu Val Val Leu

275 280 285

Leu Arg Arg Leu Arg Glu Ile Ala Tyr Cys Met Gly Ile Glu Asp Glu

290 295 300

Ala Gly Phe Glu His Leu Gly Ile Asp Pro Gly Ala Leu Ser Asn Phe

305 310 315 320

Ser Asn Gly Asn Pro Lys Arg Gly Phe Leu Gly Arg Leu Leu Asn Asn

325 330 335

Asp Ile Ile Ala Leu Ala Asn Asn Met Ser Ala Met Thr Pro Tyr Trp

340 345 350

Glu Gly Arg Lys Gly Glu Leu Ile Glu Arg Leu Ala Trp Leu Lys His

355 360 365

Arg Ala Glu Gly Leu Tyr Leu Lys Glu Pro His Phe Gly Asn Ser Trp

370 375 380

Ala Asp His Arg Ser Arg Ile Phe Ser Arg Ile Ala Gly Trp Leu Ser

385 390 395 400

Gly Cys Ala Gly Lys Leu Lys Ile Ala Lys Asp Gln Ile Ser Gly Val

405 410 415

Arg Thr Asp Leu Phe Leu Leu Lys Arg Leu Leu Asp Ala Val Pro Gln

420 425 430

Ser Ala Pro Ser Pro Asp Phe Ile Ala Ser Ile Ser Ala Leu Asp Arg

435 440 445

Phe Leu Glu Ala Ala Glu Ser Ser Gln Asp Pro Ala Glu Gln Val Arg

450 455 460

Ala Leu Tyr Ala Phe His Leu Asn Ala Pro Ala Val Arg Ser Ile Ala

465 470 475 480

Asn Lys Ala Val Gln Arg Ser Asp Ser Gln Glu Trp Leu Ile Lys Glu

485 490 495

Leu Asp Ala Val Asp His Leu Glu Phe Asn Lys Ala Phe Pro Phe Phe

500 505 510

Ser Asp Thr Gly Lys Lys Lys Lys Lys Gly Ala Asn Ser Asn Gly Ala

515 520 525

Pro Ser Glu Glu Glu Tyr Thr Glu Thr Glu Ser Ile Gln Gln Pro Glu

530 535 540

Asp Ala Glu Gln Glu Val Asn Gly Gln Glu Gly Asn Gly Ala Ser Lys

545 550 555 560

Asn Gln Lys Lys Phe Gln Arg Ile Pro Arg Phe Phe Gly Glu Gly Ser

565 570 575

Arg Ser Glu Tyr Arg Ile Leu Thr Glu Ala Pro Gln Tyr Phe Asp Met

580 585 590

Phe Cys Asn Asn Met Arg Ala Ile Phe Met Gln Leu Glu Ser Gln Pro

595 600 605

Arg Lys Ala Pro Arg Asp Phe Lys Cys Phe Leu Gln Asn Arg Leu Gln

610 615 620

Lys Leu Tyr Lys Gln Thr Phe Leu Asn Ala Arg Ser Asn Lys Cys Arg

625 630 635 640

Ala Leu Leu Glu Ser Val Leu Ile Ser Trp Gly Glu Phe Tyr Thr Tyr

645 650 655

Gly Ala Asn Glu Lys Lys Phe Arg Leu Arg His Glu Ala Ser Glu Arg

660 665 670

Ser Ser Asp Pro Asp Tyr Val Val Gln Gln Ala Leu Glu Ile Ala Arg

675 680 685

Arg Leu Phe Leu Phe Gly Phe Glu Trp Arg Asp Cys Ser Ala Gly Glu

690 695 700

Arg Val Asp Leu Val Glu Ile His Lys Lys Ala Ile Ser Phe Leu Leu

705 710 715 720

Ala Ile Thr Gln Ala Glu Val Ser Val Gly Ser Tyr Asn Trp Leu Gly

725 730 735

Asn Ser Thr Val Ser Arg Tyr Leu Ser Val Ala Gly Thr Asp Thr Leu

740 745 750

Tyr Gly Thr Gln Leu Glu Glu Phe Leu Asn Ala Thr Val Leu Ser Gln

755 760 765

Met Arg Gly Leu Ala Ile Arg Leu Ser Ser Gln Glu Leu Lys Asp Gly

770 775 780

Phe Asp Val Gln Leu Glu Ser Ser Cys Gln Asp Asn Leu Gln His Leu

785 790 795 800

Leu Val Tyr Arg Ala Ser Arg Asp Leu Ala Ala Cys Lys Arg Ala Thr

805 810 815

Cys Pro Ala Glu Leu Asp Pro Lys Ile Leu Val Leu Pro Val Gly Ala

820 825 830

Phe Ile Ala Ser Val Met Lys Met Ile Glu Arg Gly Asp Glu Pro Leu

835 840 845

Ala Gly Ala Tyr Leu Arg His Arg Pro His Ser Phe Gly Trp Gln Ile

850 855 860

Arg Val Arg Gly Val Ala Glu Val Gly Met Asp Gln Gly Thr Ala Leu

865 870 875 880

Ala Phe Gln Lys Pro Thr Glu Ser Glu Pro Phe Lys Ile Lys Pro Phe

885 890 895

Ser Ala Gln Tyr Gly Pro Val Leu Trp Leu Asn Ser Ser Ser Tyr Ser

900 905 910

Gln Ser Gln Tyr Leu Asp Gly Phe Leu Ser Gln Pro Lys Asn Trp Ser

915 920 925

Met Arg Val Leu Pro Gln Ala Gly Ser Val Arg Val Glu Gln Arg Val

930 935 940

Ala Leu Ile Trp Asn Leu Gln Ala Gly Lys Met Arg Leu Glu Arg Ser

945 950 955 960

Gly Ala Arg Ala Phe Phe Met Pro Val Pro Phe Ser Phe Arg Pro Ser

965 970 975

Gly Ser Gly Asp Glu Ala Val Leu Ala Pro Asn Arg Tyr Leu Gly Leu

980 985 990

Phe Pro His Ser Gly Gly Ile Glu Tyr Ala Val Val Asp Val Leu Asp

995 1000 1005

Ser Ala Gly Phe Lys Ile Leu Glu Arg Gly Thr Ile Ala Val Asn

1010 1015 1020

Gly Phe Ser Gln Lys Arg Gly Glu Arg Gln Glu Glu Ala His Arg

1025 1030 1035

Glu Lys Gln Arg Arg Gly Ile Ser Asp Ile Gly Arg Lys Lys Pro

1040 1045 1050

Val Gln Ala Glu Val Asp Ala Ala Asn Glu Leu His Arg Lys Tyr

1055 1060 1065

Thr Asp Val Ala Thr Arg Leu Gly Cys Arg Ile Val Val Gln Trp

1070 1075 1080

Ala Pro Gln Pro Lys Pro Gly Thr Ala Pro Thr Ala Gln Thr Val

1085 1090 1095

Tyr Ala Arg Ala Val Arg Thr Glu Ala Pro Arg Ser Gly Asn Gln

1100 1105 1110

Glu Asp His Ala Arg Met Lys Ser Ser Trp Gly Tyr Thr Trp Gly

1115 1120 1125

Thr Tyr Trp Glu Lys Arg Lys Pro Glu Asp Ile Leu Gly Ile Ser

1130 1135 1140

Thr Gln Val Tyr Trp Thr Gly Gly Ile Gly Glu Ser Cys Pro Ala

1145 1150 1155

Val Ala Val Ala Leu Leu Gly His Ile Arg Ala Thr Ser Thr Gln

1160 1165 1170

Thr Glu Trp Glu Lys Glu Glu Val Val Phe Gly Arg Leu Lys Lys

1175 1180 1185

Phe Phe Pro Ser

1190

<210> 19

<211> 986

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 19

Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn

1 5 10 15

Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val

20 25 30

Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys

35 40 45

Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn

50 55 60

Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu

65 70 75 80

Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys

85 90 95

Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys

100 105 110

Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys

115 120 125

Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser

130 135 140

Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala

145 150 155 160

Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp

165 170 175

Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala

180 185 190

Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val

195 200 205

Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val

210 215 220

Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu

225 230 235 240

Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly

245 250 255

Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn

260 265 270

Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu

275 280 285

Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val

290 295 300

Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys

305 310 315 320

Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg

325 330 335

Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys

340 345 350

Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val

355 360 365

Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro

370 375 380

Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys

385 390 395 400

Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys

405 410 415

Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg

420 425 430

Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu

435 440 445

Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp

450 455 460

Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp

465 470 475 480

Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly

485 490 495

Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val

500 505 510

Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr

515 520 525

Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe

530 535 540

Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp

545 550 555 560

Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly

565 570 575

Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu

580 585 590

Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu

595 600 605

Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu

610 615 620

Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly

625 630 635 640

Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu

645 650 655

Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp

660 665 670

Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly

675 680 685

Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile

690 695 700

Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala

705 710 715 720

Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe

725 730 735

Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala

740 745 750

Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe

755 760 765

Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met

770 775 780

Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu

785 790 795 800

Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala

805 810 815

Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Thr

820 825 830

Ala Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser Asp Gly

835 840 845

Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly Gln Ile

850 855 860

Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu Ser

865 870 875 880

Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile Ser

885 890 895

Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys Lys

900 905 910

Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp Cys

915 920 925

Gly His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg

930 935 940

Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys

945 950 955 960

Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg

965 970 975

Arg Leu Lys Glu Val Trp Lys Pro Asn Ala

980 985

<210> 20

<211> 973

<212> БЕЛОК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полипептид

<400> 20

Met Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn

1 5 10 15

Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg

20 25 30

Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys

35 40 45

Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu

50 55 60

Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His

65 70 75 80

Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg

85 90 95

Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro

100 105 110

Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser

115 120 125

Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp

130 135 140

Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu

145 150 155 160

His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp

165 170 175

Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp

180 185 190

Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro

195 200 205

Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys

210 215 220

Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys

225 230 235 240

Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu

245 250 255

Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala

260 265 270

Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile

275 280 285

Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu

290 295 300

Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu

305 310 315 320

Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala

325 330 335

Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile

340 345 350

Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly

355 360 365

Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser Glu Glu Asp

370 375 380

Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu

385 390 395 400

Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp

405 410 415

Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His

420 425 430

Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala

435 440 445

Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly

450 455 460

Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu

465 470 475 480

Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala

485 490 495

Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys

500 505 510

Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu

515 520 525

Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys

530 535 540

Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys

545 550 555 560

Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro

565 570 575

Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu

580 585 590

Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu

595 600 605

Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg

610 615 620

Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu

625 630 635 640

Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp

645 650 655

Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly

660 665 670

Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile

675 680 685

Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala

690 695 700

Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr

705 710 715 720

Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala

725 730 735

Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe

740 745 750

Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met

755 760 765

Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu

770 775 780

Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala

785 790 795 800

Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser

805 810 815

Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly

820 825 830

Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile

835 840 845

Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser

850 855 860

Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser

865 870 875 880

Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys

885 890 895

Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys

900 905 910

Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg

915 920 925

Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn

930 935 940

Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln

945 950 955 960

Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro

965 970

<210> 21

<211> 4077

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 21

atgggaaaaa tgtattatct tggtctggat ataggaacaa attctgttgg atatgccgta 60

accgacccat cgtaccattt gctcaaattt aaaggcgaac cgatgtgggg tgcccacgtg 120

tttgctgcgg ggaatcaatc agctgaacgg agaagctttc gtacgagccg cagacgcctt 180

gaccgcaggc aacagcgtgt caaactggtt caagaaatct ttgctcccgt gattagtccc 240

attgatccac gtttttttat cagacttcat gagagcgctt tatggcggga tgatgtggct 300

gaaacggata aacatatttt ctttaatgac ccgacctata cggataagga atattattct 360

gactatccaa ccatccatca tctcattgtg gaccttatgg aaagcagtga aaagcatgac 420

ccgcggcttg tttatttggc tgttgcctgg ctggttgctc atcgtggtca tttcctcaat 480

gaagtggata aggataatat tggggatgtc ctgagttttg acgcctttta tcctgagttt 540

ctggcatttc tttccgataa tggggtgtca ccttgggtat gtgagtcaaa agcactccaa 600

gcgaccctgc tttcacgaaa ctccgtcaac gataagtata aagccttgaa gtctctgatc 660

tttggcagcc aaaagccgga ggataatttt gatgccaata tcagtgaaga tggacttatc 720

caacttttag caggaaaaaa ggtcaaggtc aataaacttt ttcctcaaga aagtaatgat 780

gcttccttta cactcaatga taaggaagat gcaattgagg aaatcttagg aacgcttaca 840

ccggatgagt gtgaatggat tgcgcatatt aggaggctgt ttgattgggc catcatgaaa 900

catgctctca aagatggcag aacaatctcc gaatcgaaag taaagctcta tgaacagcat 960

caccatgact tgacacagct caagtatttt gtgaagacct atctagcaaa ggaatatgat 1020

gacatttttc gaaacgtaga tagtgaaaca accaaaaact atgtcgcata ttcctatcat 1080

gtaaaagaag tcaagggtac attgcccaaa aataaggcaa cccaagaaga attttgcaag 1140

tatgtccttg gaaaggtaaa gaacatcgaa tgcagtgaag ctgataaggt tgattttgat 1200

gaaatgattc agcgtcttac agacaattcc tttatgccga aacaagtatc aggtgaaaac 1260

agggttatcc cttaccagct ttactattat gaactaaaga ctattttgaa taaagccgct 1320

tcttatctgc cttttttgac ccaatgcgga aaagatgcca tctccaatca agataagctc 1380

ctttccatca tgacctttcg gattccgtat ttcgttgggc ccttgcgcaa ggacaattca 1440

gagcatgcct ggctggaacg aaaagcaggg aaaatctatc cgtggaattt taacgacaaa 1500

gttgaccttg ataaaagtga agaagcgttc attcggagaa tgacgaatac ctgcacttat 1560

tatcccggtg aagatgtttt gccacttgac tcccttattt atgaaaaatt catgatcctc 1620

aatgaaatca ataatatccg aattgatggt tatcctattt ctgtagatgt aaaacagcag 1680

gtttttggcc tctttgaaaa gaagagaaga gtgaccgtaa aggatatcca gaatctcctg 1740

ctttccttgg gtgccttgga taagcatggt aaattgacgg gaatcgatac taccatccat 1800

agcaattaca atacatacca tcattttaaa tcgctcatgg agcgtggcgt tcttactcgt 1860

gatgatgtgg aacgcattgt ggagcgtatg acctatagtg atgatacaaa acgcgtccgt 1920

ctttggctga acaataatta tggaacgctc actgctgacg acgtaaagca tatttcaagg 1980

ctccgaaagc atgattttgg ccggctttcc aaaatgttcc tcacaggcct aaagggagtt 2040

cataaggaaa cgggggaacg agcttccatt ttggatttta tgtggaatac caatgataac 2100

ttgatgcagc ttttatctga atgttatact ttttcggatg aaattaccaa gctgcaggaa 2160

gcatactatg ccaaggcgca gctttccctg aatgattttc tggactccat gtatatttca 2220

aatgctgtca aacgtcctat ctatcgaact cttgccgttg taaatgacat acgcaaagcc 2280

tgtgggacgg cgccaaaacg catttttatc gaaatggcaa gagatgggga aagcaaaaag 2340

aaaaggagcg taacaagaag agaacaaatc aagaatcttt ataggtccat ccgcaaggat 2400

tttcagcagg aggtagattt ccttgaaaaa atccttgaaa acaaaagcga tggacagctg 2460

caaagcgatg cgctctatct atactttgcg cagcttggaa gggatatgta taccggggac 2520

cctatcaagt tggagcatat caaggaccag tccttctata atattgatca tatctatccc 2580

caaagcatgg tcaaggacga tagtcttgat aacaaggtgt tggttcaatc ggaaattaat 2640

ggagagaaga gcagtcgata tcctcttgat gctgctatcc gtaataaaat gaagcctctt 2700

tgggatgctt attataacca tggcctgatt tccctcaaga agtatcagcg tttgacgcgg 2760

agcactccct ttacagatga tgaaaagtgg gatttcatca atcggcagct tgttgagaca 2820

agacaatcca cgaaggcctt ggcaatctta ctaaaaagga agttccctga tacggagatt 2880

gtctactcca aggcagggct ttcttctgat tttcggcatg agtttggtct cgtaaaatcg 2940

aggaatatca atgacctgca ccatgcaaag gacgcatttc ttgcgattgt aacaggaaat 3000

gtctatcatg aacgctttaa tcgccggtgg tttatggtga accagcccta ttccgtcaag 3060

accaagacgt tgtttacgca ttctattaaa aatggtaatt ttgtagcttg gaatggagaa 3120

gaggatcttg gccgcattgt taaaatgtta aagcaaaata agaacactat tcatttcacg 3180

cggttctctt ttgatcgaaa ggaaggcctg tttgatattc agccactaaa agcgtcaacc 3240

ggtcttgtac caagaaaagc cggactagac gtggtaaaat atggtggcta tgacaaatcg 3300

acagcagctt attatctcct tgttcgattt acactagaag ataaaaagac tcaacataaa 3360

ttgatgatga ttcctgtaga aggcttgtat aaagctcgaa ttgaccatga taaggaattc 3420

ttaacggact atgcacaaac tacaatcagt gaaatcctac aaaaagataa acaaaaggtg 3480

ataaatataa tgtttccaat gggaacaagg cacattaaac tgaattccat gatttcaatc 3540

gatggttttt atctttccat tggaggaaag tctagtaagg gaaaatcggt gttgtgtcat 3600

gctatggtac ctcttattgt acctcataag atagaatgtt atattaaggc gatggagtct 3660

tttgcacgta aatttaaaga aaataataaa ttaaggattg tggaaaagtt tgataagatt 3720

acggtggaag ataacttgaa cctatacgaa ctatttttac aaaaacttca acataaccca 3780

tataataagt tcttctccac acaatttgat gtgctgacta atggaagaag tacatttact 3840

aaattatctc cagaggaaca agttcaaacg ttattgaata tcttatcaat ttttaaaact 3900

tgtcggagct ctggctgcga tttaaaatcc attaacggtt ctgctcaagc tgccagaatt 3960

atgatcagcg cagatttaac tggactctca aaaaaatatt ccgatattcg gcttgttgag 4020

caatcagcat ctggactttt tgttagtaaa tcacaaaatc ttttggagta tttatga 4077

<210> 22

<211> 4005

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 22

atgtcttcat taacaaaatt tacaaataaa tacagtaagc agctaaccat aaaaaatgaa 60

ctcatcccag taggaaagac tctcgagaac attaaggaaa acggtctcat agatggagat 120

gaacagctaa acgagaatta tcaaaaagca aagataatcg ttgatgattt tctacgagat 180

ttcataaata aagctttaaa taatacccaa ataggaaatt ggagagaatt agcagatgct 240

ttaaataaag aagatgaaga taacatagaa aagctccaag acaaaatcag aggaataatt 300

gtaagtaaat tcgagacatt tgatttgttt tcttcttact cgataaagaa agacgaaaag 360

ataatagatg atgataatga tgttgaagaa gaggagctag atctaggaaa aaaaacttcc 420

tcatttaaat atatttttaa gaaaaacctt tttaaattag tacttccttc ttatttaaag 480

acaacaaatc aggataaact gaaaataatc tcttcttttg ataatttttc tacctatttc 540

agaggattct ttgagaacag aaaaaatatt ttcactaaga agcctatatc tacgtcaatt 600

gcctacagaa ttgtccatga taactttcca aagtttctag ataacatcag atgttttaat 660

gtgtggcaaa cagaatgccc acagttaatt gtaaaggctg ataattattt aaaatcaaag 720

aacgtcatag ctaaagataa atctttagca aactatttta ctgtaggagc atatgattac 780

ttcttatccc agaatggcat tgatttctac aacaacatta tcggcggtct accagcattt 840

gctggtcatg agaaaatcca aggacttaat gaatttataa atcaagaatg ccaaaaggac 900

agcgaactaa aatctaaact gaaaaacaga catgctttca aaatggctgt tctatttaag 960

caaattcttt cagatagaga aaaaagtttt gttatagacg agttcgaatc tgatgctcag 1020

gtcatagatg cggttaagaa cttctatgca gaacaatgta aggataataa tgttattttt 1080

aaccttctaa atcttatcaa gaatatagcg ttcttatctg atgatgaatt agatggaatt 1140

tttatagaag gcaagtattt aagctctgtt tcccaaaagc tatattcaga ttggtcgaag 1200

cttcgaaatg atattgaaga tagtgcaaac agtaaacaag gaaataaaga gttagcaaag 1260

aaaattaaaa caaataaagg cgatgttgaa aaggccataa gtaaatatga gttttcttta 1320

tcagaactta actcaattgt acatgataat acaaaattca gtgaccttct ttcttgtacg 1380

ttacataaag tggctagcga aaaactagtg aaagttaatg aaggggactg gccaaaacac 1440

ctgaaaaata atgaagaaaa acaaaagata aaagagcctt tagatgcatt gttagaaatt 1500

tataatacat tgctgatatt caactgcaag tcatttaata agaacggtaa tttctatgtt 1560

gattatgaca gatgcataaa tgagctttct agtgttgttt atttatataa caaaacaaga 1620

aattactgta caaagaaacc ttataacaca gacaaattca aattaaactt taacagtcct 1680

caattaggag agggctttag taagtcgaaa gaaaatgact gtctgacatt attatttaaa 1740

aaagacgaca attactatgt tggaattatc agaaaagggg caaaaattaa ctttgatgat 1800

acacaagcca ttgcagacaa tacagataac tgtatattta agatgaatta tttcctatta 1860

aaagatgcta aaaagtttat tcctaaatgt tcaattcagt taaaagaagt aaaagcacat 1920

tttaaaaaat cagaggatga ttatatcctg agtgacaaag aaaaatttgc ctctcccctt 1980

gttattaaga aatcaacatt tttattagca acagcacatg taaaaggaaa gaaaggaaac 2040

ataaaaaaat tccaaaagga atattctaag gaaaatccaa cagaatatag aaattctctg 2100

aatgaatgga ttgcattttg taaagaattt ctaaaaacat ataaggcggc aacaatcttt 2160

gacattacaa cgttaaaaaa agctgaagaa tatgctgata ttgttgagtt ttataaggat 2220

gtagataatc tttgttataa actagagttt tgccctatta aaacatcttt cattgagaat 2280

cttattgata atggggactt atatttattc agaatcaata ataaagattt cagttcaaaa 2340

tctactggta caaagaatct tcatacgctc tatcttcagg caatctttga tgaaagaaac 2400

ctcaataatc ctactattat gttaaatggc ggagcagagt tattttatcg aaaagaaagc 2460

attgaacaga aaaataggat aactcataag gcaggatcaa ttcttgtaaa caaggtttgt 2520

aaggatggaa caagtctaga tgacaaaatc agaaacgaaa tatatcaata tgaaaacaag 2580

tttattgata cattgtctga tgaagctaaa aaagttttac ctaatgtaat aaaaaaagaa 2640

gcaactcacg acataacaaa agataagcga tttacatcag ataagttctt tttccattgc 2700

ccattaacaa ttaactataa ggaaggagat acaaaacaat ttaacaatga ggttttatct 2760

ttccttagag gtaatccaga cattaatatc atcggaattg acagaggaga aagaaacctt 2820

atatacgtaa ctgttattaa tcagaaaggc gaaatacttg acagcgtttc gtttaacaca 2880

gtaacaaaca agtcgagcaa aattgaacaa actgttgatt atgaggaaaa gcttgctgtt 2940

agggaaaaag aaagaataga agcaaaaaga tcctgggatt caatatcaaa gatagcaacc 3000

ttaaaagaag gttatctatc agctattgtt catgagatat gcctactgat gatcaaacac 3060

aacgcaatcg ttgtacttga gaatctaaat gcaggattta agagaattag aggaggatta 3120

tcagaaaagt ctgtttatca gaaattcgag aagatgctta ttaacaaact aaattacttt 3180

gtatctaaaa aagaatcaga ctggaataaa cctagtggac ttttaaatgg tttacaactt 3240

tcagaccagt tcgagtcatt tgagaaatta ggaattcaat ctgggttcat cttctatgtt 3300

cctgcagcat atacatctaa gattgatcct acaacaggat ttgcaaatgt tcttaactta 3360

tccaaggtaa gaaatgttga tgcaataaag agttttttca gtaatttcaa tgaaatttca 3420

tatagcaaaa aagaagctct ctttaaattc tcttttgatt tagattcctt atcaaagaag 3480

ggcttcagct catttgtaaa attcagtaaa tctaaatgga atgtatatac atttggagag 3540

agaataataa aaccaaagaa taagcaaggg tatcgtgaag ataagagaat taatttaaca 3600

tttgaaatga aaaaacttct gaatgaatat aaagtaagtt ttgatcttga aaacaactta 3660

attccaaatc taacctctgc aaatctgaaa gataccttct ggaaagaact attctttatt 3720

tttaaaacaa ctctgcagct tagaaacagt gtaacaaatg gcaaagaaga tgtactgatt 3780

tctccagtaa agaacgctaa aggagagttc tttgtatcag gaactcataa caagacatta 3840

cctcaagact gtgatgcaaa tggagcatat catatcgccc taaaaggtct gatgattctt 3900

gaacgtaaca atcttgttag agaagaaaaa gacacaaaga agataatggc aatttctaat 3960

gttgactggt ttgagtatgt tcaaaaaagg agaggtgtcc tgtaa 4005

<210> 23

<211> 3717

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 23

atgaacaact atgatgagtt taccaaactg tacccaatac agaaaacgat aaggttcgaa 60

ttgaagccgc agggaagaac gatggaacac ctcgaaacat tcaacttttt cgaagaggac 120

agggatagag cggagaaata taagatttta aaggaagcaa tcgacgagta tcataagaag 180

tttatagacg aacatctaac aaatatgtct cttgactgga attctttaaa acagatttca 240

gagaaatact ataagagtag agaggaaaaa gacaagaaag tttttctgtc agaacagaaa 300

cgcatgaggc aagagatagt ttctgagttc aaaaaagacg atcggtttaa agatcttttt 360

tcaaaaaaat tgttttctga acttctcaag gaagagattt acaaaaaagg aaaccatcag 420

gaaattgacg cattgaaaag ttttgataaa ttctcaggct attttattgg gttgcatgag 480

aaccgaaaaa atatgtattc tgacggagac gagatcacgg ctatctctaa ccgtattgta 540

aatgagaatt tcccgaagtt cctcgacaac cttcagaaat atcaggaagc tcgtaaaaaa 600

tatccagagt ggatcattaa ggcagaatct gctttagttg cacataatat caagatggat 660

gaagtctttt ccttagagta tttcaacaaa gtcctgaatc aagaaggaat acagagatac 720

aatctcgccc taggtggcta tgtgaccaaa agtggtgaga aaatgatggg gcttaatgat 780

gcacttaatc ttgcccatca aagtgaaaaa agcagcaagg gaaggataca catgactcca 840

ctcttcaaac agattctgag tgaaaaagag tccttttctt atataccaga tgtttttaca 900

gaagactctc aacttttacc atccattggt gggttctttg cacaaataga aaatgataag 960

gacgggaata tttttgacag agcattagaa ttgatatctt cttatgcaga atacgataca 1020

gaaaggatat atatcaggca agcggacata aacagagttt ctaatgttat tttcggggag 1080

tggggaacac tgggggggtt aatgagggaa tacaaagcag actctatcaa cgacatcaat 1140

ttggagagaa catgcaagaa ggtagacaag tggctcgact caaaggagtt tgcgttatca 1200

gatgtattag aggcaataaa aagaaccggc aataatgatg cttttaatga atatatctca 1260

aagatgcgca ctgccaggga aaagattgac gctgcaagaa aggaaatgaa attcatttcg 1320

gaaaaaatat ctggagacga agaatcgatc catattatca aaaccttatt ggactcggtg 1380

caacagtttt tacatttttt caatttattc aaagcgcgtc aggacattcc tcttgatgga 1440

gcattctatg cggagttcga tgaagtccat agcaaactgt ttgctattgt tccgttgtat 1500

aataaggtta ggaactatct tacgaaaaat aaccttaaca cgaaaaagat aaagctaaac 1560

ttcaagaatc caactctggc aaacggatgg gatcaaaaca aggtatatga ctacgcctcc 1620

ttaatctttc tccgcgatgg taattattat ctcggaataa taaatccaaa aaggaaaaag 1680

aatattaaat tcgaacaagg gtctggaaat ggcccattct accggaagat ggtgtacaaa 1740

caaattccag ggccgaacaa gaacttacca agagtcttcc tcacatctac gaaaggcaaa 1800

aaagagtaca agccgtcaaa ggagataata gaaggatatg aagcggacaa acacataaga 1860

ggagataaat tcgatctgga tttctgtcat aagctgatag acttcttcaa ggaatccatc 1920

gagaagcaca aggactggag taagttcaac ttctatttct ctccaactga atcatatgga 1980

gacatcagcg aattctatct ggatgtagaa aaacagggat accggatgca ttttgagaat 2040

atttctgccg agacgattga tgagtatgtc gaaaaggggg acttattcct cttccagata 2100

tacaacaaag actttgtgaa agcggcaacc ggaaaaaaag atatgcacac catttattgg 2160

aacgcggcat tctcgcccga gaaccttcag gatgtggtag tgaaactgaa cggtgaagca 2220

gaacttttct acagagacaa gagcgacatc aaggagatag ttcacaggga gggagagata 2280

ctggtcaatc gtacctacaa cggcaggaca cctgtgcctg acaagatcca caaaaaatta 2340

acagattatc ataatggccg taccaaagat ctcggagaag caaaagaata cctcgataag 2400

gtcagatatt tcaaagcgca ctacgacatc acaaaggatc gcagatacct gaatgataaa 2460

atatacttcc atgtgcctct gacattgaat ttcaaagcaa acgggaagaa gaatctcaat 2520

aagatggtaa ttgaaaagtt cctctcggac gaaaaagcgc atattattgg gattgatcgc 2580

ggggaaagga atcttcttta ctattctatc attgacaggt caggtaaaat aatcgatcaa 2640

cagagcctca acgtcatcga tggattcgat taccgagaga aactgaatca gagggagatc 2700

gagatgaagg atgccagaca aagctggaat gctatcggga agataaagga cctcaaggaa 2760

gggtatcttt caaaagcggt ccacgaaatt accaagatgg cgatacaata caatgccatt 2820

gttgtcatgg aggaactcaa ttatgggttc aaacgcggac gtttcaaagt tgagaagcag 2880

atatatcaga aattcgagaa tatgctgatt gacaagatga attatctggt attcaaggat 2940

gctccggatg aaagtccggg aggagtcctc aatgcatatc agcttactaa tccgcttgaa 3000

agtttcgcta aacttgggaa acagacagga attcttttct atgttccggc agcctatact 3060

tcgaagatag atccgacgac cgggtttgtc aatcttttca atacttcaag taaaacgaac 3120

gcacaggaaa gaaaagaatt cttgcaaaaa ttcgagtcga tctcctattc cgctaaagac 3180

ggaggaatat tcgcattcgc gttcgattat cggaagttcg gaacgtcaaa aacagaccac 3240

aaaaatgtat ggaccgcata cacgaacggg gaaaggatga ggtacataaa agagaaaaaa 3300

cgcaacgaac tgttcgaccc ctcgaaggag atcaaagagg ctctcacttc atcaggaatc 3360

aaatatgacg gcggacagaa catattgcca gatatcctga ggagcaacaa taacggtctg 3420

atctacacaa tgtattcctc tttcatagcg gccattcaaa tgagggtcta tgacgggaaa 3480

gaagactata tcatctcgcc gataaagaac agcaagggag agttcttcag gaccgatccg 3540

aaaagaaggg aacttccgat agacgcggat gcgaacggcg cgtataacat tgctctcagg 3600

ggcgaattga cgatgcgtgc gatagcggag aagttcgatc cggactcgga aaagatggcg 3660

aagctagaac tgaaacataa ggactggttc gaattcatgc agacaagggg ggattga 3717

<210> 24

<211> 3897

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 24

atgacaaaaa catttgattc agaatttttt aatttatatt ctcttcaaaa aacagttcgt 60

tttgaactca agccggttgg tgaaacagcc tcgtttgttg aagattttaa aaacgaaggt 120

ttgaaacgag ttgtttcaga ggatgaacgg cgtgcggttg attaccaaaa agtgaaagaa 180

attattgatg actaccaccg agattttatt gaagaatcgc tgaactattt tcctgagcag 240

gtctcaaaag acgctttgga acaagctttt cacctttatc aaaaactaaa agccgctaag 300

gttgaagagc gtgaaaaagc attgaaagaa tgggaagccc ttcagaaaaa actgcgcgaa 360

aaagttgtta aatgtttttc agattcaaac aaagcacgct tttcccgcat tgataaaaaa 420

gaactgatta aagaagattt aattaactgg ttggttgcac aaaatcgcga agatgacatt 480

ccaaccgttg aaacctttaa caactttacg acttatttta cggggtttca tgaaaaccga 540

aaaaacattt attcaaaaga cgatcatgcc acagccattt catttcgact cattcatgaa 600

aacctgccta agttttttga taatgtgatc agctttaata aattgaagga aggatttcca 660

gagctgaaat ttgataaggt taaggaagat ttagaagttg attatgactt gaaacatgcc 720

tttgaaatcg aatactttgt caattttgtt acccaagccg gaattgacca atataactat 780

cttttggggg gtaaaacctt agaagacggc accaaaaagc aaggcatgaa tgaacaaatc 840

aatctgttca agcaacagca aacccgagac aaagcccgac aaattcccaa actcatacca 900

ttgtttaaac aaattctaag cgaacgaacg gaaagccaat cgtttattcc aaaacaattt 960

gaatcagacc aagagctatt tgactcactg caaaaactgc ataacaactg ccaagataaa 1020

tttaccgtac tgcaacaagc cattttaggc ttagccgaag cagatctgaa aaaagtattc 1080

attaaaacat ctgatcttaa tgcgctatca aataccattt ttggaaatta cagtgtgttt 1140

tcggatgcgt tgaatttata caaagaatcg ctcaaaacaa aaaaggcgca agaagcgttt 1200

gaaaaactac ccgctcacag cattcatgac ttgattcaat atttggagca atttaatagc 1260

tctttggatg cagaaaaaca gcaatcaact gacaccgtac tgaattactt tattaaaaca 1320

gacgagctgt attctcggtt cataaaatca acgagcgaag ccttcacaca agtacaacca 1380

ctctttgaat tggaagcatt aagctcaaaa cgtcgtccac cggaaagtga agacgaaggc 1440

gcaaaaggtc aggaagggtt tgagcaaatt aaacgcataa aagcctattt ggataccttg 1500

atggaggcgg tgcattttgc aaaaccactt tatctggtga aggggcgcaa aatgattgaa 1560

ggtctggaca aagaccaaag tttctatgaa gcctttgaaa tggcttacca agaactagaa 1620

agtctgatta ttccaatcta caacaaagct cgtagttatt taagtcgtaa accgtttaaa 1680

gcggacaaat tcaaaattaa ttttgataat aatacattgc tttccggttg ggatgctaat 1740

aaagaaacgg ctaacgcttc aattttgttt aagaaggatg gtttgtatta tttaggaatc 1800

atgcctaaag gaaaaacgtt tttgttcgat tacttcgttt catcggaaga ttctgaaaag 1860

ttaaaacaaa gaagacaaaa aaccgccgaa gaagcgcttg cgcaagatgg cgaaagctac 1920

tttgaaaaaa ttcgttacaa gctgttacct ggcgccagca aaatgttgcc gaaagtattt 1980

ttttccaaca aaaacatagg gttttacaac ccaagtgatg acatacttcg tatcaggaat 2040

acagcctctc acactaaaaa cggaacaccg caaaaagggc actctaaagt agagtttaat 2100

ttgaatgatt gtcataagat gattgatttc tttaaatcaa gcattcaaaa gcatccagag 2160

tggggaagtt ttggattcac cttttcagat acatcagatt ttgaagatat gagcgccttt 2220

tatcgagaag tcgaaaacca aggttatgtc attagtttcg ataaaataaa agaaacttac 2280

attcagagtc aagttgaaca ggggaaccta tatttattcc aaatctacaa taaagacttc 2340

tcgccctaca gcaaaggcaa accaaattta cacacgcttt actggaaagc gttgtttgag 2400

gaagccaacc taaataatgt ggtggcaaaa ctcaatggtg aagctgaaat tttctttagg 2460

cgacactcaa tcaaagcatc tgataaagtg gtgcacccag cgaatcaagc cattgacaat 2520

aaaaacccgc ataccgaaaa aacgcaaagc acctttgaat atgatcttgt aaaagacaag 2580

cgctataccc aagacaaatt cttcttccat gtaccgattt cattgaactt taaggcacaa 2640

ggtgtttcaa aatttaacga taaagtgaat ggatttttaa agggtaaccc agatgtcaat 2700

attattggca ttgaccgagg cgaacgacac cttctgtatt tcactgtggt gaatcagaaa 2760

ggtgaaattt tggttcaaga gtcgcttaat accctaatga gtgataaagg gcatgtgaat 2820

gactaccagc aaaaactcga caaaaaagaa caagaacgcg atgccgctcg caaaagctgg 2880

acgacggttg aaaatatcaa agaattaaaa gaaggctatt tatctcatgt tgttcataag 2940

ttggcacacc tgattattaa atacaatgcc attgtttgct tggaagacct gaattttggt 3000

ttcaaacgcg ggcgttttaa agtggaaaaa caagtttatc agaaatttga aaaagcgctt 3060

attgataagc ttaactactt ggtatttaaa gaaaaagagt taggcgaggt gggccattat 3120

ctaaccgcct atcagttgac cgcaccgttt gaaagtttca agaagttagg caagcaaagt 3180

ggcatattgt tttatgttcc ggcggattac acctccaaaa ttgacccaac caccgggttt 3240

gtcaactttc ttgatctgcg ttatcagagt gtcgaaaaag ccaaacagct cttaagcgac 3300

tttaatgcca ttcgttttaa ttcagtacaa aactattttg agttcgaaat agattacaaa 3360

aaactcacac ccaaacgtaa agttggtact cagagtaaat gggtgatttg tacctatgga 3420

gatgtccgct atcaaaatcg gcgtaatcaa aaaggtcact gggaaacgga agaagtcaat 3480

gtgactgaaa aactaaaagc ccttttcgcc agtgattcca aaactacaac cgtaatcgat 3540

tacgccaatg acgacaacct aattgacgtc attctggaac aggacaaagc cagcttcttc 3600

aaagaactgt tatggttatt aaaactcacc atgacgctcc gccacagcaa aatcaaaagt 3660

gaagacgact ttattctttc acccgttaaa aacgaacaag gcgagtttta cgatagtcga 3720

aaagcgggcg aggtgtggcc taaagatgca gacgccaatg gcgcttatca catagcgttg 3780

aaaggcttgt ggaatctgca acagatcaat cagtgggaaa agggtaaaac acttaatctg 3840

gcgattaaaa accaggattg gttcagtttt attcaagaaa agccctatca agaataa 3897

<210> 25

<211> 3708

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 25

atgcacacag gcggattact tagcatggat gccaaggagt ttaccggaca gtaccccctt 60

tcgaagactc tgcgttttga actgagaccg ataggcagaa cgtgggacaa tctcgaagca 120

tcggggtatc ttgcggagga cagacaccgt gcagaatgct atcccagggc aaaagagctc 180

ttggacgaca accatcgtgc attcctcaac cgtgtcctgc ctcagatcga tatggattgg 240

cacccgatcg cagaggcatt ctgcaaagtc cacaagaatc cgggaaacaa ggaattggct 300

caggattaca atcttcagct gtccaaacgc agaaaggaga tttcggccta tctgcaggat 360

gcggacggct ataaaggtct gtttgccaaa cctgcattgg atgaagcaat gaagatcgcg 420

aaagaaaacg gaaatgaatc ggacatagag gttcttgagg cattcaacgg tttctccgta 480

tacttcaccg gatatcatga gagcagggag aacatctatt cggacgagga tatggtgtcg 540

gtagcttatc gcatcaccga agacaatttc ccgagattcg tttccaatgc gcttatattc 600

gataagctga atgagtcgca ccccgatata atctcggaag tatccggaaa tctgggcgta 660

gacgacatcg gaaaatattt tgatgtgtct aactacaata atttcctgtc gcaggccggt 720

atagatgact acaatcacat catcggcggc catacgacgg aggacggtct gatccaggca 780

ttcaatgttg ttctgaatct caggcatcag aaagaccccg gattcgaaaa aatccaattc 840

aaacagctgt acaaacagat actcagcgtc cgtacatcca aatcctatat cccgaaacag 900

ttcgataatt cgaaggagat ggtggactgc atctgcgact atgtgtccaa gatcgaaaaa 960

tccgaaacgg tcgagagagc attgaagctg gtaaggaaca tatcttcttt tgatttgcgc 1020

ggaatattcg taaacaagaa gaatctccgc attctttcca acaaactgat tggtgattgg 1080

gacgcgatcg aaaccgcgct gatgcactcc tcctcttcgg aaaatgataa gaaatccgtc 1140

tacgacagcg ccgaggcatt tacgctggat gatatctttt cgtccgttaa aaaattctca 1200

gatgcatctg cagaggatat cggaaaccgg gcggaggaca tatgcagagt catatctgag 1260

accgctccgt tcataaacga tctgagggct gtcgatttgg acagtttgaa tgacgacggt 1320

tacgaggcgg cggtttccaa gataagggaa tctctggaac catatatgga tctgtttcat 1380

gaactggaga tattctccgt aggcgatgaa ttcccgaaat gtgcagcttt ctacagtgaa 1440

cttgaagaag tctccgaaca gctaatcgag attataccgt tattcaacaa ggcccgttcg 1500

ttctgtacgc gcaagagata cagtacggac aagataaagg tcaatttgaa attcccgaca 1560

ctcgccgacg gatgggatct caacaaagaa cgcgacaaca aagccgcaat actcaggaaa 1620

gacggaaagt actacctggc catactggat atgaagaaag atctttcttc gatcagaact 1680

tcggatgaag acgaatccag ttttgagaaa atggagtaca agcttcttcc gagtccggta 1740

aagatgctgc caaagatctt cgtaaaatcg aaggcggcca aggagaagta cggtctgacc 1800

gaccgtatgc tggagtgcta cgataaaggg atgcacaaga gcggcagtgc attcgatctc 1860

ggattttgtc acgaattgat cgattactac aagaggtgca tcgcagaata tcccggctgg 1920

gacgtcttcg atttcaagtt cagggaaaca tcggattatg gcagcatgaa ggagttcaat 1980

gaggatgttg caggggccgg atactatatg tccctcagaa agatcccttg ttcggaggtc 2040

tacaggcttc ttgatgagaa atcgatatat cttttccaga tctacaacaa agattattcg 2100

gaaaacgctc atgggaataa gaacatgcat accatgtatt gggaagggct cttttccccc 2160

cagaatctgg aatcccctgt gtttaaactc agcggcggtg cggagctttt cttccgtaaa 2220

tcctccatac ccaatgacgc caaaacggtc catccgaagg gaagcgtcct ggttccgcgc 2280

aatgatgtaa acggccgcag gatacctgac agcatatatc gggagctcac cagatatttc 2340

aaccgcggag attgccgcat aagcgacgag gcaaagagtt atctggacaa ggtgaaaacc 2400

aagaaagctg accacgatat cgtgaaagac aggaggttca cggtggacaa gatgatgttc 2460

cacgtcccta tcgccatgaa tttcaaagcg atttcgaagc cgaatctcaa taaaaaggtg 2520

attgacggca taatcgacga ccaagatctg aagatcatcg gcatagaccg cggagagcgc 2580

aacctcatct acgtaaccat ggtggatcgc aaagggaaca tcctctatca ggatagcctc 2640

aatattctga acggatacga ttaccgtaag gccctcgacg tccgcgaata tgacaataaa 2700

gaggctcgga ggaactggac gaaggtcgaa ggcatccgta agatgaaaga ggggtatctg 2760

tcgcttgcag tcagcaaatt ggcagatatg atcatagaga acaatgcgat tatcgtcatg 2820

gaggatctca atcacggatt caaggcaggg cgttcgaaga tagagaaaca ggtctatcag 2880

aagttcgaat ccatgctcat aaacaaactc ggttacatgg tcctcaagga taagtctatc 2940

gatcagagcg gcggagctct ccacggatac cagcttgcca accatgtgac aacattggca 3000

tctgtaggta aacaatgtgg agtgatattc tacatccctg ctgcatttac atccaagata 3060

gatccgacaa caggatttgc agatctgttc gccctcagca atgttaaaaa cgtggcatct 3120

atgagagaat ttttctccaa gatgaagtct gtaatctatg ataaggcgga gggaaaattc 3180

gcatttacct tcgactatct tgattataat gtgaaatccg agtgcggaag gaccctttgg 3240

accgtgtata cggtcggaga gagattcaca tacagcaggg tcaatagaga atatgtcaga 3300

aaagttccga cagacataat ctacgacgca ttgcaaaagg caggaatatc tgttgaaggg 3360

gatctcaggg acaggattgc tgaatcggat ggcgacactc tgaagagcat attctatgca 3420

ttcaagtatg cattggatat gagagtagag aaccgcgaag aggattacat acagtctcct 3480

gtcaaaaatg cctccggaga attcttctgt tccaagaacg caggcaaatc gctccctcag 3540

gattccgatg cgaacggtgc atacaatatc gcactcaagg ggatcctgca gctacgtatg 3600

ctttccgagc agtatgatcc gaatgcagag agcatacggt tgccactgat aaccaacaag 3660

gcctggctga cctttatgca gtccggtatg aagacatgga agaactga 3708

<210> 26

<211> 3783

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 26

atggatagtt tgaaagattt caccaatctg taccctgtca gtaagacatt gagatttgaa 60

ttaaagcccg ttggaaagac tttagaaaat atcgagaaag caggtatttt gaaagaggat 120

gagcatcgtg cagaaagtta tcggagggtg aagaaaataa ttgatactta tcataaggta 180

tttatcgatt cttctcttga aaatatggct aaaatgggta ttgagaatga aataaaagca 240

atgctccaaa gtttctgcga attgtataaa aaagatcatc gcactgaggg tgaagacaag 300

gcattagata aaattcgagc agtacttcgt ggcctgattg ttggggcttt cactggtgtt 360

tgcggaagac gggaaaatac agtccaaaac gagaagtacg agagtttgtt caaagaaaag 420

ttgataaaag aaattttacc tgattttgtg ctctctactg aggctgaaag cttgcctttc 480

tctgttgaag aagctacgag gtcactgaag gagtttgata gctttacatc ctactttgct 540

ggtttttacg agaatagaaa gaatatatac tcgacgaaac ctcaatccac tgccattgct 600

tatcgtctta ttcatgagaa cttgccgaag ttcattgata atattcttgt ttttcagaag 660

atcaaagagc ctatagccaa agagctggaa catattcgtg cggacttttc tgccgggggg 720

tacataaaaa aggatgagag attggaggat attttttcgt tgaactatta tatccacgtg 780

ttatctcagg ctgggatcga aaaatataac gcattgattg ggaagattgt gacagaagga 840

gatggagaga tgaaagggct caatgaacac atcaaccttt acaaccaaca aagaggcaga 900

gaggatcggc tccctctttt taggcctctt tataaacaga tattgagtga cagagagcaa 960

ttatcatact tgcctgagag ttttgaaaaa gatgaggagc tcctcagggc tctaaaagag 1020

ttctatgatc atatcgcaga agacattctc ggacgtactc aacagttgat gacttctatt 1080

tcagaatatg atttatctcg gatatacgta aggaacgata gccaattgac tgatatatca 1140

aaaaaaatgt tgggagattg gaatgctatc tacatggcta gagaacgagc atatgaccac 1200

gagcaggctc ccaaaagaat cacggcgaaa tacgagaggg acaggattaa agctcttaaa 1260

ggagaagaga gtataagtct ggcaaatctt aatagttgta ttgcctttct ggacaatgtt 1320

agagattgcc gtgtagatac ttatctttcc acactgggcc agaaggaagg accacatggt 1380

ctatctaatc tcgttgagaa cgtttttgcc tcataccatg aagcagagca attgttgagc 1440

tttccatacc ccgaagagaa taatctgatt caggacaagg acaatgtggt gttaattaag 1500

aatcttctcg acaatatcag tgatctgcag aggttcttga aacctctttg gggtatggga 1560

gacgaacccg ataaagatga aagattttat ggagagtata attatatccg aggagctcta 1620

gatcaggtga tccctctgta caataaggta aggaactacc tcactcggaa gccttattcg 1680

accagaaaag taaaactcaa ttttgggaat tctcaattgc ttagtggttg ggatagaaat 1740

aaggaaaagg ataatagctg tgtgattttg cgtaaggggc agaacttcta tttggctatt 1800

atgaacaata ggcacaaaag aagtttcgaa aacaaggtgt tgcccgagta taaggaggga 1860

gaaccttact tcgaaaagat ggattataaa tttttgcctg atcctaataa aatgcttcct 1920

aaggtttttc tttcgaaaaa aggaatagag atatacaaac caagtccgaa gcttttagaa 1980

caatatggac atggaactca caaaaaggga gataccttta gtatggatga tttgcacgaa 2040

ctgatcgatt tcttcaaaca ctcaatcgag gctcatgaag attggaagca attcggattc 2100

aaattttctg atacggctac ttatgagaat gtatctagtt tctatagaga agttgaggat 2160

caggggtata agctctcttt ccgaaaagtt tcggaatctt atgtctattc attaatagat 2220

caaggcaagt tgtatttatt tcagatatac aacaaggact tttctccctg cagcaaaggg 2280

acacctaatc tgcatacctt gtattggaga atgctttttg acgagcgcaa tttggcagat 2340

gtcatataca aactggatgg gaaggctgaa atctttttcc gagagaagag tttgaaaaat 2400

gatcatccca cgcatccggc tggtaagcct atcaaaaaga aaagtcgaca aaaaaaagga 2460

gaggagagtc tgtttgagta tgatttagtc aaggataggc actatacgat ggataagttc 2520

cagtttcatg tgcctattac tatgaatttt aaatgttctg caggaagcaa agtcaatgat 2580

atggttaatg ctcatattcg agaggcaaag gatatgcatg tcattggaat tgatcgtgga 2640

gaacgcaatc tgctgtatat atgcgtgata gatagtcgag ggacgatttt ggatcaaatt 2700

tctctgaata cgattaacga tatagactat catgatttat tggagagtcg agacaaagac 2760

cgtcagcagg agcgccgaaa ctggcaaact atcgaaggga tcaaggagct aaaacaaggc 2820

taccttagtc aggcggttca tcggatagcc gaactgatgg tggcttataa ggctgtagtt 2880

gctttggagg atttgaatat ggggttcaaa cgtgggcggc agaaagtaga aagttctgtt 2940

tatcagcagt ttgagaaaca gctgatagat aagctcaact atcttgtgga caagaagaaa 3000

aggcctgaag atattggagg attgttgaga gcctatcaat ttacggcccc atttaagagt 3060

tttaaggaaa tgggaaagca aaacggcttc ttgttttata tcccggcttg gaacacgagc 3120

aacatagatc cgactactgg atttgttaat ttatttcatg cccagtatga aaatgtagat 3180

aaagcgaaga gcttctttca aaagtttgat tcaattagtt acaacccgaa gaaagactgg 3240

tttgagtttg cattcgatta taaaaacttt actaaaaagg ctgaaggaag tcgttctatg 3300

tggatattat gcacacatgg ttcccgaata aagaatttta gaaattccca gaagaatggt 3360

caatgggatt ccgaagaatt cgccttgacg gaggctttta agtctctttt tgtgcgatat 3420

gagatagatt ataccgctga tttgaaaaca gctattgtgg acgaaaagca aaaagacttc 3480

ttcgtggatc ttctgaagct attcaaattg acagtacaga tgcgcaacag ctggaaagag 3540

aaggatttgg attatctaat ctctcctgta gcaggggctg atggccgttt cttcgataca 3600

agagagggaa ataaaagtct gcctaaggat gcagatgcca atggagctta taatattgcc 3660

ctaaaaggac tttgggctct acgccagatt cggcaaactt cagaaggcgg taaactcaaa 3720

ttggcgattt ccaataagga atggctacag tttgtgcaag agagatctta cgagaaagac 3780

tga 3783

<210> 27

<211> 3792

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 27

atgaataatg gaacaaataa ctttcagaat tttatcggaa tttcttcttt gcagaagact 60

cttaggaatg ctctcattcc aaccgaaaca acacagcaat ttattgttaa aaacggaata 120

attaaagaag atgagctaag aggagaaaat cgtcagatac ttaaagatat catggatgat 180

tattacagag gtttcatttc agaaacttta tcgtcaattg atgatattga ctggacttct 240

ttatttgaga aaatggaaat tcagttaaaa aatggagata acaaagacac tcttataaaa 300

gaacagactg aataccgtaa ggcaattcat aaaaaatttg caaatgatga tagatttaaa 360

aatatgttca gtgcaaaatt aatctcagat attcttcctg aatttgtcat tcataacaat 420

aattattctg catcagaaaa ggaagaaaaa acacaggtaa ttaaattatt ttccagattt 480

gcaacgtcat tcaaggacta ttttaaaaac agggctaatt gtttttcggc tgatgatata 540

tcttcatctt cttgtcatag aatagttaat gataatgcag agatattttt tagtaatgca 600

ttggtgtata ggagaattgt aaaaagtctt tcaaatgatg atataaataa aatatccgga 660

gatatgaagg attcattaaa ggaaatgtct ctggaagaaa tttattctta tgaaaaatat 720

ggggaattta ttacacagga aggtatatct ttttataatg atatatgtgg taaagtaaat 780

tcatttatga atttatattg ccagaaaaat aaagaaaaca aaaatctcta taagctgcaa 840

aagcttcata aacagatact gtgcatagca gatacttctt atgaggtgcc gtataaattt 900

gaatcagatg aagaggttta tcaatcagtg aatggatttt tggacaatat tagttcgaaa 960

catatcgttg aaagattgcg taagattgga gacaactata acggctacaa tcttgataag 1020

atttatattg ttagtaaatt ctatgaatca gtttcacaaa agacatatag agattgggaa 1080

acaataaata ctgcattaga aattcattac aacaatatat tacccggaaa tggtaaatct 1140

aaagctgaca aggtaaaaaa agcggtaaag aatgatctgc aaaaaagcat tactgaaatc 1200

aatgagcttg ttagcaatta taaattatgt tcggatgata atattaaagc tgagacatat 1260

atacatgaaa tatcacatat tttgaataat tttgaagcac aggagcttaa gtataatcct 1320

gaaattcatc tggtggaaag tgaattgaaa gcatctgaat taaaaaatgt tctcgatgta 1380

ataatgaatg cttttcattg gtgttcggtt ttcatgacag aggagctggt agataaagat 1440

aataattttt atgccgagtt agaagagata tatgacgaaa tatatccggt aatttcattg 1500

tataatcttg tgcgtaatta tgtaacgcag aagccatata gtacaaaaaa aattaaattg 1560

aattttggta ttcctacact agcggatgga tggagtaaaa gtaaagaata tagtaataat 1620

gcaattattc tcatgcgtga taatttgtac tatttaggaa tatttaatgc aaaaaataag 1680

cctgacaaaa agataattga aggtaataca tcagaaaata aaggggatta taagaagatg 1740

atttataatc ttctgccagg accaaataaa atgatcccca aggtattcct ctcttcaaaa 1800

accggagtgg aaacatataa gccgtctgcc tatatattgg agggctataa acaaaacaag 1860

catattaaat cctctaagga ttttgatata acattttgtc acgatttgat tgattatttt 1920

aagaactgta tagcaataca tcctgaatgg aagaattttg gctttgattt ttctgacacc 1980

tccacatatg aagatatcag cggattttac agagaagtcg aattacaagg ttataaaatc 2040

gactggacat atatcagcga aaaggatatt gatttgttgc aggaaaaagg acagttatat 2100

ttattccaaa tatataacaa agatttttcc aagaaaagta ccggaaatga taatcttcat 2160

actatgtatt tgaagaattt gtttagtgaa gagaatttaa aggatattgt actgaaatta 2220

aacggtgagg cggaaatctt ctttagaaaa tcaagcataa agaatccaat aattcataaa 2280

aaaggctcta ttcttgttaa tagaacatat gaagcagagg aaaaagatca atttggaaat 2340

atccagatag tcagaaaaaa cataccggaa aatatatatc aggagcttta taaatatttc 2400

aatgataaaa gtgataaaga actttcggat gaagcagcta agcttaagaa tgtagtaggt 2460

catcatgagg ctgctacaaa catagtaaaa gattatagat atacatatga taaatatttt 2520

cttcatatgc ctattacaat caattttaaa gccaataaga caggctttat taatgacaga 2580

atattacaat atattgctaa agaaaaggat ttgcatgtaa taggcattga tcgtggtgaa 2640

agaaacctga tatatgtttc agtaattgat acttgtggaa atattgttga acaaaaatcg 2700

tttaacattg ttaatggata tgattatcag attaagctca agcagcagga gggggcgcga 2760

caaatcgcac gaaaagaatg gaaagaaatc ggcaaaataa aagaaattaa agaaggctat 2820

ttatctcttg taattcatga aatttcaaag atggttatta aatataatgc cataattgca 2880

atggaggatt taagctacgg atttaaaaaa ggtcgtttca aggttgagcg acaggtttac 2940

cagaagtttg agacaatgct tatcaacaaa ctcaactatc tggtatttaa agatatatcc 3000

ataacggaaa acggtggtct tctaaaggga taccagctta catatattcc agataaactg 3060

aaaaatgtgg gtcatcaatg tggctgtata ttttatgtac ctgctgccta tacatcaaaa 3120

atagatccta caaccggatt tgtaaatata ttcaaattta aagatttaac agttgatgcg 3180

aagagagaat ttataaaaaa atttgacagt atcagatatg attcagaaaa aaatctgttt 3240

tgttttacat tcgattataa taactttatt acgcaaaata ctgttatgtc aaagtcaagc 3300

tggagtgtat atacgtacgg agttaggata aaaagaagat ttgtcaatgg caggttctca 3360

aatgaatcgg atacaattga tataacaaaa gatatggaaa aaacactcga aatgacagat 3420

ataaattgga gagatggtca tgatctgagg caggatatta ttgattatga aatcgtacaa 3480

cacatatttg agatttttag attgactgta caaatgagaa acagtttaag tgaattagaa 3540

gacagggatt atgaccgttt gatttctccg gtgctcaatg aaaataatat attttatgat 3600

tcagctaaag caggagatgc gttacctaaa gacgcagatg ctaatggtgc atattgtata 3660

gctctaaaag gcttgtatga aatcaaacaa attacagaga attggaaaga agacggtaag 3720

ttttcaagag ataaacttaa aatttccaat aaggactggt ttgactttat tcaaaataaa 3780

aggtatttat aa 3792

<210> 28

<211> 3957

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 28

atgacaaaca aatttacaaa ccagtactcg ctttccaaaa cacttcgatt tgagttgatt 60

ccacaaggaa aaacattgga atttattcaa gaaaaaggat tgctctctca agataaacaa 120

cgagcggaga gttatcaaga aatgaaaaaa actattgata aatttcataa atactttatc 180

gatttagctt taagcaatgc taaactaact catttagaaa cttacttgga attatacaat 240

aaaagtgctg aaacaaaaaa agaacaaaaa tttaaagacg atttaaagaa agtacaagac 300

aatttacgaa aagaaatcgt taaatctttt tcagatggtg atgcaaaatc aatttttgca 360

attttggata aaaaagaact gattaccgta gaacttgaaa aatggtttga aaacaacgaa 420

caaaaagaca tttattttga cgaaaaattc aaaacgttta ctacttattt tactggtttt 480

catcaaaaca gaaaaaacat gtattcggtt gaacccaatt ctacagcaat tgcttatcga 540

ttgattcatg aaaatttacc taaattttta gaaaatgcta aagcatttga aaaaataaaa 600

caagtagaaa gtttgcaagt taattttaga gaattaatgg gggaatttgg agatgaaggg 660

ctaattttcg taaatgaatt agaagaaatg tttcaaatca attattataa tgatgtgctt 720

tcacaaaatg gaattacaat ttataatagt ataatttcag gatttaccaa aaatgatata 780

aaatataaag gtctaaatga atacataaat aattacaatc aaaccaaaga caaaaaagac 840

cgtttgccaa aattaaaaca attgtataaa cagattttga gtgataggat ttcactttcg 900

tttttgcccg atgcttttac ggatgggaaa caagttttga aagccatatt tgacttttat 960

aaaatcaact tactttctta taccattgaa ggacaggaag aaagccaaaa tcttttacta 1020

ttaattcgtc agacaattga aaacctttct agttttgata cccaaaaaat ttatctaaaa 1080

aatgataccc atttaaccac tatttcacaa caagtatttg gcgatttttc ggtgttttca 1140

actgctttaa attattggta tgaaactaaa gtaaatccaa aatttgaaac ggaatatagc 1200

aaagccaacg aaaaaaaacg agaaatttta gataaagcca aagcggtatt tacaaaacaa 1260

gattattttt caattgcttt tttacaagaa gtactttcgg aatacattct taccttagat 1320

cacacttctg atattgtaaa aaagcattcc tccaactgta ttgcggatta ttttaaaaat 1380

cattttgtag ccaaaaaaga aaatgaaacc gacaaaacct ttgattttat tgctaatatt 1440

actgcaaaat accaatgtat tcaaggtatt ttagaaaatg cagaccaata cgaagacgaa 1500

ctcaaacaag accaaaaatt aattgataat ttgaaattct ttttagatgc tattttagaa 1560

ttgttgcatt ttattaaacc tttgcattta aaatcagaaa gcattaccga aaaagacact 1620

gctttttatg atgtgtttga aaattattac gaagcattga gtttgttgac cccattatat 1680

aatatggtgc gaaactatgt aacgcaaaag ccgtacagca ccgaaaaaat aaaattaaat 1740

tttgaaaatg cacaattatt gaatggttgg gatgccaata aagaaggtga ttacctaact 1800

accattttga aaaaagacgg taattatttt ttagccataa tggataaaaa gcataacaaa 1860

gcgtttcaaa agtttccaga aggaaaagaa aattatgaaa aaatggtgta taaactattg 1920

cctggagtaa ataagatgtt gccaaaagta tttttttcca ataaaaatat tgcttacttc 1980

aacccatcaa aagagttatt agaaaactat aaaaaagaga cgcacaaaaa aggagacaca 2040

ttcaatttag aacattgtca tacgttgatc gattttttca aggactcttt aaacaaacat 2100

gaagactgga aatactttga ttttcaattt tctgaaacaa aatcgtatca agatttgagt 2160

ggtttttata gagaagtaga acatcaaggc tacaaaatca attttaaaaa tatcgattca 2220

gaatatattg atggtttggt gaacgaaggt aaattgtttc tatttcaaat ttacagcaaa 2280

gatttttcgc ctttttccaa agggaaaccg aacatgcaca ctttgtattg gaaagcctta 2340

tttgaagaac aaaatttgca aaatgtaatc tataaattga atggacaagc cgaaatattt 2400

tttagaaaag cctctataaa acctaaaaat ataatattgc acaaaaagaa aattaaaatt 2460

gccaaaaagc attttattga taaaaaaaca aaaacatctg aaattgttcc tgttcaaaca 2520

ataaaaaacc tcaatatgta ctaccaagga aaaataagtg aaaaagaatt aacacaagat 2580

gatttaaggt atattgataa ttttagcatt ttcaatgaaa aaaataaaac aattgatatt 2640

ataaaagaca aacgatttac ggttgataaa tttcagtttc atgtgccgat taccatgaac 2700

tttaaagcaa cgggcggaag ttatatcaat caaaccgtat tagaatattt gcaaaacaat 2760

cccgaagtta agattattgg attggataga ggcgaacgcc atttggtata tctgacactg 2820

atagaccagc aaggaaacat cttgaaacaa gaaagtttga atacaatcac cgattctaaa 2880

atctcgacac cttatcataa gttgttggat aacaaggaaa acgagcgtga cttggctcga 2940

aaaaattggg gaacggtgga aaacatcaaa gaactcaaag aaggctacat cagtcaagtg 3000

gtgcataaaa ttgctacgtt gatgctggaa gaaaatgcca ttgtggtaat ggaagatttg 3060

aattttggat ttaaacgtgg acgttttaaa gtggaaaaac aaatttatca aaagctggaa 3120

aaaatgttga ttgacaaatt gaattatttg gttttaaaag acaaacaacc tcaggaatta 3180

ggcggattgt acaacgcatt acaactcacc aataaatttg aaagtttcca aaaaatgggt 3240

aaacaatcgg gctttttgtt ttatgtaccc gcttggaaca cctccaaaat agacccaacc 3300

acagggtttg tcaattattt ttataccaaa tatgaaaatg ttgacaaagc caaagccttt 3360

tttgaaaaat ttgaggcgat tcgtttcaat gcagaaaaga agtattttga atttgaagta 3420

aaaaaatata gcgattttaa cccaaaagcc gaaggcactc aacaagcctg gaccatttgc 3480

acgtatggcg aacgaataga aaccaaacga caaaaagacc aaaacaacaa atttgtaagc 3540

actccaatta atctaaccga aaagatagaa gactttttgg gtaaaaacca aattgtttat 3600

ggtgatggta attgcatcaa atctcaaatt gctagcaaag acgacaaggc tttttttgaa 3660

accttattgt attggttcaa aatgacttta caaatgcgaa acagcgaaac aagaacagat 3720

atagattatc taatttcgcc cgtgatgaat gacaacggaa cattttacaa cagccgagat 3780

tatgaaaaat tagaaaatcc aactttgccc aaagatgccg atgccaacgg agcgtatcat 3840

attgccaaaa aaggattgat gcttttgaat aaaatagacc aagccgactt gacaaaaaaa 3900

gtggatttat ctattagtaa cagagattgg ttgcaatttg tacaaaaaaa taaataa 3957

<210> 29

<211> 4019

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 29

atggaacagg agtactattt aggactggat atgggaaccg gatctgtagg atgggctgtt 60

acagattcgg aatatcatgt cttgcgtaaa catggaaaag cactatgggg agtccgatta 120

tttgaaagtg catcgacagc agaagaacga agaatgttcc gaacatcaag aagaagacta 180

gatcgaagaa actggagaat tgaaatttta caggaaattt ttgcagagga aataagtaag 240

aaagatccag gatttttctt gcgaatgaaa gaaagcaaat attatccaga agataagcga 300

gatatcaatg gaaattgtcc ggaactgcca tatgcattat ttgttgatga cgattttaca 360

gataaagatt atcataaaaa atttccgaca atttatcatc tcaggaaaat gttgatgaat 420

acagaggaga caccggatat ccggttggtg tatctggcaa ttcatcatat gatgaagcat 480

aggggccatt tcttgttatc tggtgacatt aatgagatta aggagttcgg aacgacattt 540

tcaaaattgt tggagaatat caaaaatgag gaattggatt ggaatcttga actgggaaaa 600

gaagaatatg ctgttgtaga aagtatttta aaagataaca tgttaaaccg atccacaaag 660

aaaaccagat taataaaagc attaaaagca aaatcaatat gtgaaaaggc tgtactgaat 720

ttattggctg gtggaacggt gaaattgagt gatatatttg gtcttgaaga attaaatgag 780

acagaaagac cgaagatttc ctttgctgat aatggatacg atgattatat cggagaagtt 840

gaaaatgagc tgggagaaca attctatatt atagagacgg caaaagcagt gtatgactgg 900

gcggtattag ttgaaatatt gggaaaatat acgtcaattt cagaagcgaa agtagcaacg 960

tatgaaaaac ataaatcgga tttacaattt ttgaaaaaga tagttcggaa atatctgaca 1020

aaggaggaat ataaagatat ttttgtaagt acgagtgaca aattgaaaaa ttactctgct 1080

tatataggaa tgacgaaaat aaatggaaaa aaggttgatt tgcagagcaa acggtgcagt 1140

aaagaagaat tctatgattt tattaagaaa aacgtactta aaaagctaga aggacaacct 1200

gaatatgaat atttgaaaga agagctagaa agagaaacat ttctaccaaa acaggtgaac 1260

agggataatg gtgtaatacc gtatcagatt catttgtacg agttgaaaaa gatattagga 1320

aatttacggg ataaaataga cctcattaaa gagaacgaag ataaactggt tcaattattt 1380

gaattcagaa ttccgtatta tgttggtccg ctgaataaga tagatgacgg aaaagaggga 1440

aaatttacat gggctgtacg gaaaagtaat gaaaagatat atccatggaa ttttgaaaat 1500

gtagttgata tagaagcaag tgcagaaaaa tttatccgga gaatgacaaa taagtgtaca 1560

tatctgatgg gcgaagatgt attgccgaag gattcattgc tttacagtaa atatatggtt 1620

ttaaatgaat taaataatgt aaagttggat ggcgaaaaat tatctgtaga attgaaacaa 1680

cggttgtata cagatgtatt ttgtaagtat cggaaagtaa ctgtaaagaa gataaaaaat 1740

tacttgaaat gtgaaggtat catatccggc aatgtcgaaa taactggaat tgatggtgat 1800

tttaaggcat cgttaacggc atatcatgat tttaaagaaa tcttgacagg aacagaattg 1860

gctaaaaagg acaaagaaaa tattattacc aatatagtat tgtttggaga tgataaaaag 1920

ctgctgaaaa agagactgaa tcgattatat cctcagatta cgccgaatca gttgaagaaa 1980

atatgtgcgc tatcctatac aggctgggga agattttcta aaaagttctt agaagaaata 2040

acagctccag atccggaaac gggagaggta tggaatatca ttacggcatt gtgggaatcg 2100

aataataatc tgatgcaatt attaagtaat gaatatcggt ttatggaaga agtcgaaaca 2160

tacaatatgg gaaaacagac taaaacattg tcgtacgaaa cagtagagaa tatgtatgtt 2220

tctccatctg tgaaaagaca gatatggcag acgctgaaaa tcgtgaaaga attagaaaaa 2280

gtaatgaaag aatctccgaa acgtgtattt attgagatgg cgagagaaaa gcaagaaagt 2340

aagagaaccg aatcgcgtaa aaaacaacta atagatttgt ataaggcttg taaaaatgaa 2400

gaaaaagatt gggtaaaaga actgggagat caggaagaac agaaattacg aagcgataag 2460

ttgtacctat attatacgca aaagggtcgt tgtatgtatt ctggcgaggt aatagaactg 2520

aaagacttat gggataatac aaaatatgat attgatcata tatatccaca atctaaaacg 2580

atggatgaca gtcttaataa tcgcgtattg gtaaaaaaga aatataatgc aacaaaatca 2640

gataagtatc cattaaatga aaatatacga catgagagaa aaggcttttg gaagtcactg 2700

ttagatggag ggtttataag taaagaaaaa tatgaacgct taataagaaa tacagaattg 2760

agtccggaag aattagcagg atttattgaa aggcagattg ttgaaacgag gcagagtaca 2820

aaagctgtag cggaaatatt aaagcaagtg tttccggaaa gtgaaattgt atatgtcaaa 2880

gcaggtacgg tttcaagatt cagaaaagat tttgaattac tgaaagttcg agaagtgaat 2940

gatttgcatc acgcaaagga tgcgtattta aatattgtag ttggtaatag ttattatgtg 3000

aaatttacta agaatgcatc atggtttata aaagaaaatc cgggacgtac ttacaactta 3060

aaaaagatgt ttacatcagg ttggaatatt gaacgaaatg gagaagttgc atgggaagtc 3120

gggaaaaaag gaacaattgt aacggtaaaa caaataatga ataaaaataa tatattggtg 3180

acaagacagg ttcatgaagc gaaaggtggg ctgtttgatc agcagattat gaaaaaagga 3240

aaaggtcaga ttgctataaa ggaaactgat gaacgtcttg catcaataga aaagtatgga 3300

ggctataata aagctgccgg ggcatatttt atgctggtag aatctaaaga taaaaaagga 3360

aaaacaattc gaacgataga atttatacca ttatatttaa agaataaaat cgagtcggat 3420

gaatcaatag cattgaactt tttagaaaaa ggcagaggtt tgaaagaacc aaagatacta 3480

ttgaaaaaaa ttaagattga tacattattt gatgtggacg gattcaaaat gtggttgtct 3540

ggaagaacag gggacagact actatttaaa tgtgcaaatc aattgatttt ggatgagaaa 3600

ataattgtaa caatgaaaaa aattgtaaag tttattcaaa ggagacaaga aaatagagaa 3660

ttaaaattat ctgataaaga tggaattgat aatgaagtac ttatggaaat atataacact 3720

tttgtggata agttagaaaa cacagtgtat agaatacgat tatccgaaca ggcaaaaacg 3780

cttatagata aacaaaaaga atttgaaagg ttatcactag aggataaaag tagtactttg 3840

tttgaaattt tacatatttt tcagtgtcaa agtagtgcgg ccaatttaaa aatgataggc 3900

ggacctggaa aagcaggaat attagttatg aataataata taagtaagtg taacaaaatt 3960

tctattataa atcagtctcc aacaggaatt ttcgaaaatg agattgattt gttaaagat 4019

<210> 30

<211> 3858

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 30

atgaaatctt tcgattcatt cacaaatctt tattctcttt caaaaacctt gaaatttgag 60

atgagacctg tcggaaatac ccaaaaaatg ctcgacaatg caggagtatt tgaaaaagac 120

aaactaattc aaaaaaagta cggaaaaaca aagccgtatt tcgacagact ccacagagaa 180

tttatagaag aagcgctcac gggggtagag ctaataggac tagatgagaa ctttaggaca 240

cttgttgact ggcaaaaaga taagaaaaat aatgtcgcaa tgaaagcgta tgaaaatagt 300

ttgcagcggc tgagaacgga aataggtaaa atatttaacc taaaggctga ggattgggta 360

aagaacaaat atccaatatt agggctgaaa aataaaaata ccgatatttt attcgaagag 420

gctgtattcg ggatattgaa agcccgatat ggagaagaaa aagatacttt tatagaagta 480

gaggaaatag ataaaaccgg caaatcaaag atcaatcaaa tatcaatttt cgatagttgg 540

aaaggattta caggatattt caaaaaattt tttgaaacca gaaagaattt ttacaaaaac 600

gacggaactt ctacagcaat tgctacaagg atcattgatc aaaatctgaa aagattcata 660

gataatctgt caatagttga aagtgtgaga caaaaggttg atctcgccga gacagaaaaa 720

tctttcagca tatctctatc gcaattcttc tcaatagact tttataacaa gtgtctcctt 780

caagatggta ttgattacta caacaagata atcggtggag aaactctcaa aaatggcgaa 840

aaactaatag gtctcaatga actaataaat caatataggc agaataataa ggatcagaaa 900

atcccatttt tcaaacttct tgataaacaa attttgagtg aaaagatatt atttttggat 960

gaaataaaaa atgacacaga actgatcgag gcgctgagtc agttcgcaaa aacagccgaa 1020

gaaaaaacaa aaattgtcaa aaagcttttt gccgattttg tagaaaataa ttccaaatac 1080

gatcttgcac agatttatat ttcccaagaa gcattcaata ctatatcaaa caagtggaca 1140

agcgaaactg agacgttcgc taaatatcta ttcgaagcaa tgaagagtgg aaaacttgca 1200

aagtatgaga aaaaagataa tagctataaa tttcctgatt ttattgccct ttcacagatg 1260

aagagtgctt tattaagtat cagccttgag ggacattttt ggaaagagaa atactacaaa 1320

atttcaaaat tccaagagaa gaccaattgg gagcagtttc ttgcaatttt tctatacgag 1380

tttaactctc ttttcagcga caaaataaat acaaaagatg gagaaacaaa gcaagttgga 1440

tactatctat ttgccaaaga cctgcataat cttatcttaa gtgagcagat tgatattcca 1500

aaagattcaa aagtcacaat aaaagatttt gccgattctg tactcacaat ctaccaaatg 1560

gcaaaatatt ttgcggtaga aaaaaaacga gcgtggcttg ccgagtatga actagattca 1620

ttttataccc agccagacac aggctattta cagttttatg ataacgccta cgaggatatt 1680

gtgcaggtat acaacaagct tcgaaactat ctgaccaaaa agccatatag cgaggagaaa 1740

tggaagttga attttgaaaa ttctacgctg gcaaatggat gggataagaa caaagaatct 1800

gataattcag cagttattct acaaaaaggt ggaaaatatt atttgggact gattactaaa 1860

ggacacaaca aaatttttga tgaccgtttt caagaaaaat ttattgtggg aattgaaggt 1920

ggaaaatatg aaaaaatagt ctataaattt ttccccgacc aggcaaaaat gtttcccaaa 1980

gtgtgctttt ctgcaaaagg actcgaattt tttagaccgt ctgaagaaat tttaagaatt 2040

tataacaatg cagagtttaa aaaaggagaa acttattcaa tagatagtat gcagaagttg 2100

attgattttt ataaagattg cttgactaaa tatgaaggct gggcatgtta tacctttcgg 2160

catctaaaac ccacagaaga ataccaaaac aatattggag agttttttcg agatgttgca 2220

gaggacggat acaggattga ttttcaaggc atttcagatc aatatattca tgaaaaaaac 2280

gagaaaggcg aacttcacct ttttgaaatc cacaataaag attggaattt ggataaggca 2340

cgagacggaa agtcaaaaac aacacaaaaa aaccttcata cactctattt cgaatcgctc 2400

ttttcaaacg ataatgttgt tcaaaacttt ccaataaaac tcaatggtca agctgaaatt 2460

ttttatagac cgaaaacgga aaaagacaaa ttagaatcaa aaaaagataa gaaagggaat 2520

aaagtgattg accataaacg ctatagtgag aataagattt tttttcatgt tcctctcaca 2580

ctaaaccgca ctaaaaatga ctcatatcgc tttaatgctc aaatcaacaa ctttctcgca 2640

aataataaag atatcaacat catcggtgta gataggggag aaaagcattt agtctattat 2700

tcggtgatta cacaagctag tgacatctta gaaagtggct cactaaatga gctaaatggc 2760

gtgaattatg ctgaaaaact gggaaaaaag gcagaaaatc gagaacaagc acgcagagac 2820

tggcaagacg tacaagggat caaagacctc aagaaaggat atatttcaca ggtggtgcga 2880

aagcttgctg atttagcaat taaacacaat gccattatca ttcttgaaga tttgaatatg 2940

agatttaaac aagttcgggg cggtatcgaa aaatccattt atcaacagtt agaaaaagca 3000

ctgatagata aattaagctt tcttgtagac aaaggtgaaa aaaatcccga gcaagcagga 3060

catcttctga aagcatatca gctttcggcc ccatttgaga catttcaaaa aatgggcaaa 3120

cagacgggta taatctttta tacacaagct tcgtatacct caaaaagtga ccctgtaaca 3180

ggttggcgac cacacctgta tctcaaatat ttcagtgcca aaaaagcaaa agacgatatt 3240

gcaaagttta caaaaataga atttgtaaac gataggtttg agcttaccta tgatataaag 3300

gactttcagc aagcaaaaga atatccaaat aaaactgttt ggaaagtttg ctcaaatgta 3360

gagagattca ggtgggacaa aaacctcaat caaaacaaag gcggatatac tcactacaca 3420

aatataactg agaatatcca agagcttttt acaaaatatg gaattgatat cacaaaagat 3480

ttgctcacac agatttctac aattgatgaa aaacaaaata cctcattttt tagagatttt 3540

attttttatt tcaaccttat ttgccaaatc agaaataccg atgattctga gattgctaaa 3600

aagaatggga aagatgattt tatactgtca cctgttgagc cgtttttcga tagccgaaaa 3660

gacaatggaa ataaacttcc tgagaatgga gatgataacg gcgcgtataa catagcaaga 3720

aaagggattg tcatactcaa caaaatctca caatattcag agaaaaacga aaattgcgag 3780

aaaatgaaat ggggggattt gtatgtatca aacattgact gggacaattt tgtaacccaa 3840

gctaatgcac ggcattaa 3858

<210> 31

<211> 3516

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 31

atgattatct tatatattag tacctcgaat atgaacatgg aaggagtatt tatggaaaat 60

tttaaaaact tgtatccaat aaacaaaaca cttcgatttg aattaagacc ctatggaaaa 120

acattggaaa attttaaaaa atccggactt ttagaaaaag atgcctttaa ggcaaatagt 180

agacgaagta tgcaagctat aatcgatgaa aaattcaaag agactatcga agaacgctta 240

aagtacactg aattcagtga atgtgatctt ggaaacatga catcaaaaga taaaaaaata 300

actgataaag cagctacaaa tttaaaaaag caagttatct tatcttttga cgatgaaata 360

tttaataatt acctaaaacc tgataaaaat attgacgcat tatttaaaaa tgatccttca 420

aatcctgtaa tctctacatt taaaggtttt acgacatatt ttgtgaattt ttttgaaatt 480

cgaaaacata ttttcaaggg agaatcatca ggctcaatgg cataccgaat tatagatgaa 540

aacctgacaa catacttgaa taatattgaa aaaataaaaa aactgccaga agaattaaaa 600

tcacagctag aaggcattga tcagattgat aaacttaata attataatga gttcattaca 660

cagtcaggta taacacacta taatgaaatc atcggcggta tatcaaaatc agagaatgtc 720

aaaatacagg gaattaatga aggaattaat ctatactgtc agaagaacaa agttaaactt 780

cctcgactga ctccgctata caaaatgata ttatcagaca gagtttccaa ctcttttgta 840

ttagacacta ttgaaaatga cacagaatta attgaaatga taagtgattt gattaataag 900

actgagattt cgcaagatgt tataatgtca gatattcaaa atattttcat aaaatacaaa 960

caacttggta atttgccggg tatctcatat tcttcaatag ttaatgctat ttgctcggat 1020

tatgacaaca atttcggaga tgggaagcga aaaaaatctt acgaaaatga tcgcaaaaag 1080

catttggaga ctaatgtata ctccataaat tatatttctg aattgcttac agataccgat 1140

gtttcatcaa atatcaagat gagatataaa gagcttgagc aaaattatca ggtttgcaaa 1200

gaaaatttta atgccacaaa ctggatgaat attaaaaata taaaacaatc tgaaaaaaca 1260

aaccttatta aagatttgtt agatatactt aaatcgattc aacgtttcta tgatttgttt 1320

gatattgttg acgaagataa aaatccaagt gctgaatttt atacctggtt atcaaaaaat 1380

gctgaaaagc ttgactttga attcaattct gtatataaca agtcacgaaa ctatctcacc 1440

aggaaacaat actctgataa aaaaatcaag ctgaattttg attctccaac attggccaaa 1500

gggtgggatg ctaacaaaga aatagataac tccacgatta taatgcgtaa atttaataat 1560

gacagaggcg attatgatta cttccttggc atatggaata aatccacacc tgcaaatgaa 1620

aaaataatcc cactggagga taatggatta ttcgaaaaaa tgcaatataa gctgtatcca 1680

gatcctagta agatgttacc gaaacaattt ctatcaaaaa tatggaaggc aaagcatcct 1740

acgacacctg aatttgataa aaaatataaa gagggaagac ataaaaaagg tcctgatttc 1800

gaaaaagaat tcctgcatga attgattgat tgcttcaaac atggtcttgt taatcacgat 1860

gaaaaatatc aggatgtttt tggcttcaat ctccgtaaca ctgaagatta taattcatat 1920

acagagtttc tcgaagatgt ggaaagatgc aattacaatc tttcatttaa caaaattgct 1980

gatacttcaa accttattaa tgatgggaaa ttgtatgtat ttcagatatg gtcaaaagac 2040

ttttctattg attcaaaagg tactaaaaac ttgaatacaa tctattttga atcactattt 2100

tcagaagaaa acatgataga aaaaatgttc aagctttctg gagaggctga gatattctat 2160

cgaccagcat cgttgaatta ttgtgaagat atcataaaaa aaggtcatca ccatgcagaa 2220

ttaaaagata agtttgacta tcctataata aaagataagc gatattcaca agataagttt 2280

ttctttcatg tgccaatggt tataaattat aaatctgaga aactgaattc caaaagcctt 2340

aacaaccgaa caaatgaaaa cctgggacag tttacacata ttataggtat agacaggggc 2400

gagcggcact tgatttattt aactgttgtt gatgtttcca ctggtgaaat cgttgaacag 2460

aaacatctgg acgaaattat caatactgat accaagggag ttgaacacaa aacccattat 2520

ttgaataaat tggaagaaaa atctaaaaca agagataacg agcgtaaatc atgggaagct 2580

attgaaacta tcaaagaatt aaaagaaggc tatatttctc atgtaattaa tgaaatacaa 2640

aagctgcaag aaaaatataa tgccttaatc gtaatggaaa atcttaacta tgggttcaaa 2700

aactcacgaa tcaaagttga aaaacaggtt tatcaaaaat tcgagacagc attgattaaa 2760

aagttcaatt atattattga taaaaaagat ccagaaacct atatacatgg ttaccagctt 2820

acaaatccta ttaccactct ggataagatt ggaaatcaat ctggaatagt gctgtatatt 2880

cctgcgtgga atacttctaa gatagatccc gtcacaggat ttgtaaacct tctgtacgca 2940

gatgatttga agtataaaaa tcaggagcag gccaaatcat tcattcagaa aatagacaac 3000

atatattttg aaaatggaga gtttaaattt gatattgatt tttccaaatg gaataatcgc 3060

tactcaataa gtaaaactaa atggacgtta acaagttatg ggactcgcat ccagacattt 3120

agaaatcccc agaaaaacaa taagtgggat tctgctgaat atgatttgac agaagagttt 3180

aaattaattt taaatataga cggaacgtta aagtcacagg acgtagaaac atacaaaaaa 3240

ttcatgtctt tatttaaact aatgctacag cttcgaaact ctgttacagg aaccgacatt 3300

gattatatga tctctcctgt cactgataaa acaggaacac atttcgattc aagagaaaat 3360

attaaaaatc ttcctgccga tgcagatgcc aatggtgcct acaacattgc gcgcaaagga 3420

ataatggcta ttgaaaatat aatgaacggt ataagcgatc cactaaaaat aagcaacgaa 3480

gactatttaa agtatattca gaatcaacag gaataa 3516

<210> 32

<211> 3924

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 32

atgacccaat ttgaaggttt taccaattta taccaagttt cgaagaccct tcgttttgaa 60

ctgattcccc aaggaaaaac actcaaacat atccaggagc aagggttcat tgaggaggat 120

aaagctcgca atgaccatta caaagagtta aaaccaatca ttgaccgcat ctataagact 180

tatgctgatc aatgtctcca actggtacag cttgactggg agaatctatc tgcagccata 240

gactcctatc gtaaggaaaa aaccgaagaa acacgaaatg cgctgattga ggagcaagca 300

acatatagaa atgcgattca tgactacttt ataggtcgga cggataatct gacagatgcc 360

ataaataagc gccatgctga aatctataaa ggacttttta aagctgaact tttcaatgga 420

aaagttttaa agcaattagg gaccgtaacc acgacagaac atgaaaatgc tctactccgt 480

tcgtttgaca aatttacgac ctatttttcc ggcttttatg aaaaccgaaa aaatgtcttt 540

agcgctgaag atatcagcac ggcaattccc catcgaatcg tccaggacaa tttccctaaa 600

tttaaggaaa actgccatat ttttacaaga ttgataaccg cagttccttc tttgcgggag 660

cattttgaaa atgtcaaaaa ggccattgga atctttgtta gtacgtctat tgaagaagtc 720

ttttcctttc ccttttataa tcaacttcta acccaaacgc aaattgatct ttataatcaa 780

cttctcggcg gcatatctag ggaagcaggc acagaaaaaa tcaagggact taatgaagtt 840

ctcaatctgg ctatccaaaa aaatgatgaa acagcccata taatcgcgtc cctgccgcat 900

cgttttattc ctctttttaa acaaattctt tccgatcgaa atacgttatc ctttattttg 960

gaagaattca aaagcgatga ggaagtcatc caatccttct gcaaatataa aaccctcttg 1020

agaaacgaaa atgtactgga gactgcagaa gcccttttca atgaattaaa ttccattgat 1080

ttgactcata tctttatttc ccataaaaag ttagaaacca tctcttcagc gctttgtgac 1140

cattgggata ccttgcgcaa tgcactttac gaaagacgga tttctgaact cactggcaaa 1200

ataacaaaaa gtgccaaaga aaaagttcaa aggtcattaa aacatgagga tataaatctc 1260

caagaaatta tttctgctgc aggaaaagaa ctatcagaag cattcaaaca aaaaacaagt 1320

gaaattcttt cccatgccca tgctgcactt gaccagcctc ttcccacaac attaaaaaaa 1380

caggaagaaa aagaaatcct caaatcacag ctcgattcgc ttttaggcct ttatcatctt 1440

cttgattggt ttgctgtcga tgaaagcaat gaagtcgacc cagaattctc agcacggctg 1500

acaggcatta aactagaaat ggaaccaagc ctttcgtttt ataataaagc aagaaattat 1560

gcgacaaaaa agccctattc ggtggaaaaa tttaaattga attttcaaat gccaaccctt 1620

gcctctggtt gggatgtcaa taaagaaaaa aataatggag ctattttatt cgtaaaaaat 1680

ggtctctatt accttggtat catgcctaaa cagaaggggc gctataaagc cctgtctttt 1740

gagccgacag aaaaaacatc agaaggattc gataagatgt actatgacta cttcccagat 1800

gccgcaaaaa tgattcctaa gtgttccact cagctaaagg ctgtaaccgc tcattttcaa 1860

actcatacca cccccattct tctctcaaat aatttcattg aacctcttga aatcacaaaa 1920

gaaatttatg acctgaacaa tcctgaaaag gagcctaaaa agtttcaaac ggcttatgca 1980

aagaagacag gcgatcaaaa aggctataga gaagcgcttt gcaaatggat tgactttacg 2040

cgggattttc tctctaaata tacgaaaaca acttcaatcg atttatcttc actccgccct 2100

tcttcgcaat ataaagattt aggggaatat tacgccgaac tgaatccgct tctctatcat 2160

atctccttcc aacgaattgc tgaaaaggaa atcatggatg ctgtagaaac gggaaaattg 2220

tatctgttcc aaatctacaa taaggatttt gcgaagggcc atcacgggaa accaaatctc 2280

cacaccctgt attggacagg tctcttcagt cctgaaaacc ttgcgaaaac cagcatcaaa 2340

cttaatggtc aagcagaatt gttctatcga cctaaaagcc gcatgaagcg gatggcccat 2400

cgtcttgggg aaaaaatgct gaacaaaaaa ctaaaggacc agaagacacc gattccagat 2460

accctctacc aagaactgta cgattatgtc aaccaccggc taagccatga tctttccgat 2520

gaagcaaggg ccctgcttcc aaatgttatc accaaagaag tctcccatga aattataaag 2580

gatcggcggt ttacttccga taaatttttc ttccatgttc ccattacact gaattatcaa 2640

gcagccaata gtcccagtaa attcaaccag cgtgtcaatg cctaccttaa ggagcatccg 2700

gaaacgccca tcattggtat cgatcgtgga gaacgcaatc taatctatat taccgtcatt 2760

gacagtactg ggaaaatttt ggagcagcgt tccctgaata ccatccagca atttgactac 2820

caaaaaaaat tggacaacag ggaaaaagag cgtgttgccg cccgtcaagc ctggtccgtc 2880

gtcggaacga tcaaagacct taaacaaggc tacttgtcac aggtcatcca tgaaattgta 2940

gacctgatga ttcattacca agctgttgtc gtccttgaaa acctcaactt cggatttaaa 3000

tcaaaacgga caggcattgc cgaaaaagca gtctaccaac aatttgaaaa gatgctaata 3060

gataaactca actgtttggt tctcaaagat tatcctgctg agaaagtggg aggcgtctta 3120

aacccgtatc aacttacaga tcagttcacg agctttgcaa aaatgggcac gcaaagcggc 3180

ttccttttct atgtaccggc cccttatacc tcaaagattg atcccctgac tggttttgtc 3240

gatccctttg tatggaagac cattaaaaat catgaaagtc ggaagcattt cctagaagga 3300

tttgatttcc tgcattatga tgtcaaaaca ggtgatttta tcctccattt taaaatgaat 3360

cggaatctct ctttccagag agggcttcct ggcttcatgc cagcttggga tattgttttc 3420

gaaaagaatg aaacccaatt tgatgcaaaa gggacgccct tcattgcagg aaaacgaatt 3480

gttcctgtaa tcgaaaatca tcgttttacg ggtcgttaca gagacctcta tcccgctaat 3540

gaactcattg cccttctgga agaaaaaggc attgtcttta gagacggaag taatatatta 3600

cccaaacttt tagaaaatga tgattctcat gcaattgata cgatggtcgc cttgattcgc 3660

agtgtactcc aaatgagaaa cagcaatgcc gcaacggggg aagactacat caactctccc 3720

gttagggatc tgaacggggt gtgtttcgac agtcgattcc aaaatccaga atggccaatg 3780

gatgcggatg ccaacggagc ttatcatatt gccttaaaag ggcagcttct tctgaaccac 3840

ctcaaagaaa gcaaagatct gaaattacaa aacggcatca gcaaccaaga ttggctggcc 3900

tacattcagg aactgagaaa ctga 3924

<210> 33

<211> 3390

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 33

atggccgtca aatccatcaa agtgaaactt cgtctcgacg atatgccgga gattcgggcc 60

ggtctatgga aacttcataa ggaagtcaat gcgggggttc gatattacac ggaatggctc 120

agtcttctcc gtcaagagaa cttgtatcga agaagtccga atggggacgg agagcaagaa 180

tgtgataaga ctgcagaaga atgcaaagcc gaattgttgg agcggctgcg cgcgcgtcaa 240

gtggagaatg gacaccgtgg tccggcggga tcggacgatg aattgctgca gttggcgcgt 300

caactctatg agttgttggt tccgcaggcg ataggtgcga aaggcgacgc gcagcaaatt 360

gcccgcaaat ttttgagccc cttggccgac aaggacgcag ttggtgggct tggaatcgcg 420

aaggcgggga acaaaccgcg gtgggttcgc atgcgcgaag cgggggaacc aggctgggaa 480

gaggagaagg agaaggctga gacgaggaaa tctgcggatc ggactgcgga tgttttgcgc 540

gcgctcgcgg attttgggtt aaagccactg atgcgcgtat acaccgattc tgagatgtca 600

tcggtggagt ggaaaccgct tcggaaggga caagccgttc ggacgtggga tagggacatg 660

ttccaacaag ctatcgaacg gatgatgtcg tgggagtcgt ggaatcagcg cgttgggcaa 720

gagtacgcga aactcgtaga acaaaaaaat cgatttgagc agaagaattt cgtcggccag 780

gaacatctgg tccatctcgt caatcagttg caacaagata tgaaagaagc atcgcccgga 840

ctcgaatcga aagagcaaac cgcgcactat gtgacgggac gggcattgcg cggatcggac 900

aaggtatttg agaagtgggg gaaactcgcc cccgatgcac ctttcgattt gtacgacgcc 960

gaaatcaaga atgtgcagag acgtaacacg agacgattcg gatcacatga cttgttcgca 1020

aaattggcag agccagagta tcaggccctg tggcgcgaag atgcttcgtt tctcacgcgt 1080

tacgcggtgt acaacagcat ccttcgcaaa ctgaatcacg ccaaaatgtt cgcgacgttt 1140

actttgccgg atgcaacggc gcacccgatt tggactcgct tcgataaatt gggtgggaat 1200

ttgcaccagt acaccttttt gttcaacgaa tttggagaac gcaggcacgc gattcgtttt 1260

cacaagctat tgaaagtcga gaatggtgtc gcaagagaag ttgatgatgt caccgtgccc 1320

atttcaatgt cagagcaatt ggataatctg cttcccagag atcccaatga accgattgcg 1380

ctatattttc gagattacgg agccgaacag catttcacag gtgaatttgg tggcgcgaag 1440

atccagtgcc gccgggatca gctggctcat atgcaccgac gcagaggggc gagggatgtt 1500

tatctcaatg tcagcgtacg tgtgcagagt cagtctgagg cgcggggaga acgtcgcccg 1560

ccgtatgcgg cagtatttcg tctggtcggg gacaaccatc gcgcgtttgt ccatttcgat 1620

aaactatcgg attatcttgc ggaacatccg gatgatggga agctcgggtc ggaggggttg 1680

ctttccgggc tgcgggtgat gagtgtcgat ctcggccttc gcacatctgc atcgatttcc 1740

gtttttcgcg ttgcccggaa ggacgagttg aagccgaact caaaaggtcg tgtaccgttt 1800

ttctttccga taaaagggaa tgacaatctc gtcgcggttc atgagcgatc acaactcttg 1860

aagctgcctg gcgaaacgga gtcgaaggac ctgcgtgcta tccgagaaga acgccaacgg 1920

acattgcggc agttgcggac gcaactggcg tatttgcggc tgctcgtgcg gtgtgggtcg 1980

gaagatgtgg ggcggcgtga acggagttgg gcaaagctta tcgagcagcc ggtggatgcg 2040

gccaatcaca tgacaccgga ttggcgcgag gcttttgaaa acgaacttca gaagcttaag 2100

tcactccatg gtatctgtag cgacaaggaa tggatggatg ctgtctacga gagcgttcgc 2160

cgcgtgtggc gtcacatggg caaacaggtt cgcgattggc gaaaggacgt acgaagcgga 2220

gagcggccca agattcgcgg ctatgcgaaa gacgtggtcg gtggaaactc gattgagcaa 2280

atcgagtatc tggaacgtca gtacaagttc ctcaagagtt ggagcttctt tggtaaggtg 2340

tcgggacaag tgattcgtgc ggagaaggga tctcgttttg cgatcacgct gcgcgaacac 2400

attgatcacg cgaaggaaga tcggctgaag aaattggcgg atcgcatcat tatggaggct 2460

ctcggctatg tgtacgcgtt ggatgagcgc ggcaaaggaa agtgggttgc gaagtatccg 2520

ccgtgccagc tcatcctgct ggaggaattg agcgagtacc agttcaataa cgacaggcct 2580

ccgagcgaaa acaaccagtt gatgcaatgg agtcatcgcg gcgtgttcca ggagttgata 2640

aatcaggccc aagtccatga tttactcgtt gggacgatgt atgcagcgtt ctcgtcgcga 2700

ttcgacgcgc gaactggggc accgggtatc cgctgtcgcc gggttccggc gcgttgcacc 2760

caggagcaca atccagaacc atttccttgg tggctgaaca agtttgtggt ggaacatacg 2820

ttggatgctt gtcccctacg cgcagacgac ctcatcccaa cgggtgaagg agagattttt 2880

gtctcgccgt tcagcgcgga ggagggggac tttcatcaga ttcacgccga cctgaatgcg 2940

gcgcaaaatc tgcagcagcg actctggtct gattttgata tcagtcaaat tcggttgcgg 3000

tgtgattggg gtgaagtgga cggtgaactc gttctgatcc caaggcttac aggaaaacga 3060

acggcggatt catatagcaa caaggtgttt tataccaata caggtgtcac ctattatgag 3120

cgagagcggg ggaagaagcg gagaaaggtt ttcgcgcaag agaaattgtc ggaggaagag 3180

gcggagttgc tcgtggaagc agacgaggcg agggagaaat cggtcgtttt gatgcgtgat 3240

ccgtctggca tcatcaatcg gggaaattgg accaggcaaa aggaattttg gtcgatggtg 3300

aaccagcgga tcgaaggata cttggtcaag cagattcgct cgcgcgttcc attacaagat 3360

agtgcgtgtg aaaacacggg ggatatttaa 3390

<210> 34

<211> 3327

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 34

atggcgacac gcagttttat tttaaaaatt gaaccaaatg aagaagttaa aaagggatta 60

tggaagacgc atgaggtatt gaatcatgga attgcctact acatgaatat tctgaaacta 120

attagacagg aagctattta tgaacatcat gaacaagatc ctaaaaatcc gaaaaaagtt 180

tcaaaagcag aaatacaagc cgagttatgg gattttgttt taaaaatgca aaaatgtaat 240

agttttacac atgaagttga caaagatgtt gtttttaaca tcctgcgtga actatatgaa 300

gagttggtcc ctagttcagt cgagaaaaag ggtgaagcca atcaattatc gaataagttt 360

ctgtacccgc tagttgatcc gaacagtcaa agtgggaaag ggacggcatc atccggacgt 420

aaacctcggt ggtataattt aaaaatagca ggcgacccat cgtgggagga agaaaagaaa 480

aaatgggaag aggataaaaa gaaagatccc cttgctaaaa tcttaggtaa gttagcagaa 540

tatgggctta ttccgctatt tattccattt actgacagca acgaaccaat tgtaaaagaa 600

attaaatgga tggaaaaaag tcgtaatcaa agtgtccggc gacttgataa ggatatgttt 660

atccaagcat tagagcgttt tctttcatgg gaaagctgga accttaaagt aaaggaagag 720

tatgaaaaag ttgaaaagga acacaaaaca ctagaggaaa ggataaaaga ggacattcaa 780

gcatttaaat cccttgaaca atatgaaaaa gaacggcagg agcaacttct tagagataca 840

ttgaatacaa atgaataccg attaagcaaa agaggattac gtggttggcg tgaaattatc 900

caaaaatggc taaagatgga tgaaaatgaa ccatcagaaa aatatttaga agtatttaaa 960

gattatcaac ggaaacatcc acgagaagcc ggggactatt ctgtctatga atttttaagc 1020

aagaaagaaa atcattttat ttggcgaaat catcctgaat atccttattt gtatgctaca 1080

ttttgtgaaa ttgacaaaaa aaagaaagac gctaagcaac aggcaacttt tactttggct 1140

gacccgatta accatccgtt atgggtacga tttgaagaaa gaagcggttc gaacttaaac 1200

aaatatcgaa ttttaacaga gcaattacac actgaaaagt taaaaaagaa attaacagtt 1260

caacttgatc gtttaattta tccaactgaa tccggcggtt gggaggaaaa aggtaaagta 1320

gatatcgttt tgttgccgtc aagacaattt tataatcaaa tcttccttga tatagaagaa 1380

aaggggaaac atgcttttac ttataaggat gaaagtatta aattccccct taaaggtaca 1440

cttggtggtg caagagtgca gtttgaccgt gaccatttgc ggagatatcc gcataaagta 1500

gaatcaggaa atgttggacg gatttatttt aacatgacag taaatattga accaactgag 1560

agccctgtta gtaagtcttt gaaaatacat agggacgatt tccccaagtt cgttaatttt 1620

aaaccgaaag agctcaccga atggataaaa gatagtaaag ggaaaaaatt aaaaagtggt 1680

atagaatccc ttgaaattgg tctacgggtg atgagtatcg acttaggtca acgtcaagcg 1740

gctgctgcat cgatttttga agtagttgat cagaaaccgg atattgaagg gaagttattt 1800

tttccaatca aaggaactga gctttatgct gttcaccggg caagttttaa cattaaatta 1860

ccgggtgaaa cattagtaaa atcacgggaa gtattgcgga aagctcggga ggacaactta 1920

aaattaatga atcaaaagtt aaactttcta agaaatgttc tacatttcca acagtttgaa 1980

gatatcacag aaagagagaa gcgtgtaact aaatggattt ctagacaaga aaatagtgat 2040

gttcctcttg tatatcaaga tgagctaatt caaattcgtg aattaatgta taaaccctat 2100

aaagattggg ttgccttttt aaaacaactc cataaacggc tagaagtcga gattggcaaa 2160

gaggttaagc attggcgaaa atcattaagt gacgggagaa aaggtcttta cggaatctcc 2220

ctaaaaaata ttgatgaaat tgatcgaaca aggaaattcc ttttaagatg gagcttacgt 2280

ccaacagaac ctggggaagt aagacgcttg gaaccaggac agcgttttgc gattgatcaa 2340

ttaaaccacc taaatgcatt aaaagaagat cgattaaaaa agatggcaaa tacgattatc 2400

atgcatgcct taggttactg ttatgatgta agaaagaaaa agtggcaggc aaaaaatcca 2460

gcatgtcaaa ttattttatt tgaagattta tctaactaca atccttacga ggaaaggtcc 2520

cgttttgaaa actcaaaact gatgaagtgg tcacggagag aaattccacg acaagtcgcc 2580

ttacaaggtg aaatttacgg attacaagtt ggggaagtag gtgcccaatt cagttcaaga 2640

ttccatgcga aaaccgggtc gccgggaatt cgttgcagtg ttgtaacgaa agaaaaattg 2700

caggataatc gcttttttaa aaatttacaa agagaaggac gacttactct tgataaaatc 2760

gcagttttaa aagaaggaga cttatatcca gataaaggtg gagaaaagtt tatttcttta 2820

tcaaaggatc gaaagttggt aactacgcat gctgatatta acgcggccca aaatttacag 2880

aagcgttttt ggacaagaac acatggattt tataaagttt actgcaaagc ctatcaggtt 2940

gatggacaaa ctgtttatat tccggagagc aaggaccaaa aacaaaaaat aattgaagaa 3000

tttggggaag gctattttat tttaaaagat ggtgtatatg aatggggtaa tgcggggaaa 3060

ctaaaaatta aaaaaggttc ctctaaacaa tcatcgagtg aattagtaga ttcggacata 3120

ctgaaagatt catttgattt agcaagtgaa cttaagggag agaaactcat gttatatcga 3180

gatccgagtg gaaacgtatt tccttccgac aagtggatgg cagcaggagt attttttggc 3240

aaattagaaa gaatattgat ttctaagtta acaaatcaat actcaatatc aacaatagaa 3300

gatgattctt caaaacaatc aatgtaa 3327

<210> 35

<211> 3450

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 35

atgcccaccc gcaccatcaa tctgaaactt gttcttggga aaaatcctga aaacgcaaca 60

ttgcgacgcg ccctattttc gacacaccgt ttggttaacc aagcgacgaa acgtattgag 120

gaattcttgt tgctgtgtcg tggagaagcc tacagaacag tggataatga ggggaaggaa 180

gccgagattc cacgtcatgc agtccaagaa gaagctcttg cctttgccaa agctgctcaa 240

cgccacaacg gctgtatatc cacctatgaa gaccaagaga ttcttgatgt actgcggcaa 300

ctgtacgaac gtcttgttcc ttcggtcaac gaaaacaacg aggcaggcga tgctcaagct 360

gctaacgcct gggtcagtcc gctcatgtcg gcagaaagcg aaggaggctt gtcggtctac 420

gacaaggtgc ttgatccacc gccggtttgg atgaagctta aagaagaaaa ggctccagga 480

tgggaagccg cttctcaaat ttggattcag agtgatgagg gacagtcgtt acttaataag 540

ccaggtagcc ctccccgctg gattcgaaaa ctgcgatctg ggcaaccgtg gcaagatgat 600

ttcgtcagtg accaaaagaa aaagcaagat gagctgacca aagggaacgc accacttata 660

aaacaactca aagaaatggg gttgttgcct cttgttaacc cattttttag acatcttctt 720

gaccctgaag gtaaaggcgt gagtccatgg gaccgtcttg ctgtacgcgc tgcagtggct 780

cactttatct cctgggaaag ttggaatcat agaacacgtg cagaatacaa ttccttgaaa 840

ctacggcgag acgagtttga ggcagcatcc gacgaattca aagacgattt tactttgctc 900

cgacaatatg aagccaaacg ccatagtaca ttgaaaagca tcgcgctggc cgacgattcg 960

aacccttacc ggattggagt acgttctctg cgtgcctgga accgcgttcg tgaagaatgg 1020

atagacaagg gtgcaacaga agaacaacgc gtgaccatat tgtcaaagct tcaaacacaa 1080

cttcggggaa aattcggcga tcccgatctg ttcaactggc tagctcagga taggcatgtc 1140

catttgtggt ctcctcggga cagcgtgaca ccattggttc gcatcaatgc ggtagataaa 1200

gttctgcgtc gacgaaaacc gtatgcattg atgacctttg cccatccccg cttccaccct 1260

cgatggatac tgtacgaggc tccaggagga agcaatctcc gtcaatatgc attggattgt 1320

acagaaaacg ctctacacat cacgttgcct ttgcttgtcg acgatgcgca cggaacctgg 1380

attgaaaaaa agatcagggt gccgctggca ccatccggac aaattcaaga tttaactctg 1440

gaaaaacttg agaagaaaaa aaatcgttta tactaccgtt ccggttttca gcagtttgcc 1500

ggcttggctg gcggagctga ggttcttttc cacagaccct atatggaaca cgacgaacgc 1560

agcgaggagt ctcttttgga acgtccggga gccgtttggt tcaaattgac cctggatgtg 1620

gcaacacagg ctcccccgaa ctggcttgat ggtaagggcc gtgtccgtac accgccggag 1680

gtacatcatt ttaaaaccgc attgtcgaat aaaagcaaac atacacgtac gctgcagccg 1740

ggtctccgtg tcttgtcagt agacttgggc atgcgaacat tcgcctcctg ctcagtattt 1800

gaactcatcg agggaaagcc tgagacaggc cgtgccttcc ctgttgccga tgagagatca 1860

atggacagcc cgaataaact gtgggccaag catgaacgta gttttaaact gacgctcccc 1920

ggcgaaaccc cttctcgaaa ggaagaggaa gagcgtagca tagcaagagc ggaaatttat 1980

gcactgaaac gcgacataca acgcctcaaa agcctactcc gcttaggtga agaagataac 2040

gataaccgtc gtgatgcatt gcttgaacag ttctttaaag gatggggaga agaagacgtt 2100

gtgcctggac aagcgtttcc acgctctctt ttccaagggt tgggagctgc cccgtttcgc 2160

tcaactccag agttatggcg tcagcattgc caaacatatt atgacaaagc ggaagcctgt 2220

ctggctaaac atatcagtga ttggcgcaag cgaactcgtc cccgtccgac atcgcgggag 2280

atgtggtaca aaacacgttc ctatcatggc ggcaagtcca tttggatgtt ggaatatctt 2340

gatgccgttc gaaaactgct tctcagttgg agcttacgtg gtcgtactta cggtgccatt 2400

aatcgccagg atacagcccg gtttggttct ttggcatcac ggctgctcca ccatatcaat 2460

tccctaaagg aagaccgcat caaaacagga gccgactcta tcgttcaggc tgctcgcggg 2520

tatattcctc tccctcatgg caagggttgg gaacaaagat atgagccttg tcagctcata 2580

ttatttgaag acctcgcacg atatcgcttt cgcgtggatc gacctcgtcg agagaacagc 2640

caactcatgc agtggaacca tcgagccatc gtggcagaaa caacgatgca agccgaactc 2700

tacggacaaa ttgtcgaaaa tactgcagcg gggttcagca gtcgttttca cgcggcgaca 2760

ggtgcccccg gtgtacgttg tcgttttctt ctagaaagag actttgataa cgatttgccc 2820

aaaccgtacc ttctcaggga actttcttgg atgctcggca atacaaaagt cgagtctgaa 2880

gaagaaaagc ttcgattgct gtctgaaaaa atcaggccag gcagtcttgt tccttgggat 2940

ggaggcgaac agttcgctac cctgcatccc aaaagacaaa cactttgcgt cattcatgcc 3000

gatatgaatg ctgcccaaaa tttacaacgc cggtttttcg gtcgatgcgg cgaggccttt 3060

cggcttgttt gtcaacccca cggtgacgac gtgttacgac tcgcatccac cccaggagct 3120

cgtcttcttg gagccctgca gcagcttgaa aatggacaag gagctttcga gttggttcga 3180

gacatggggt caacaagtca aatgaaccgg ttcgtcatga agtctttggg aaaaaagaaa 3240

ataaaacccc ttcaggacaa caatggagac gacgagcttg aagacgtgtt gtccgtactc 3300

ccggaggaag acgacacagg acgtatcaca gtcttccgcg attcatcagg aatctttttt 3360

ccttgcaacg tctggatacc ggccaaacag ttttggccag cagtacgcgc catgatttgg 3420

aaggtcatgg cttcccattc tttggggtga 3450

<210> 36

<211> 3759

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Описание искусственной последовательности: синтетический

полинуклеотид

<400> 36

atgacaaagt taagacaccg acagaaaaaa ttaacacacg actgggctgg ctccaaaaag 60

agggaagtat taggctcaaa tggcaagctt cagaatccgt tgttaatgcc ggttaaaaaa 120

ggtcaggtta ctgagttccg gaaagcgttt tctgcgtatg ctcgcgcaac gaaaggagaa 180

atgactgacg gccgaaagaa tatgtttacg catagtttcg agccatttaa gacaaagccc 240

tcgcttcatc agtgtgaatt ggcagataaa gcatatcaat ctttacattc gtatctgcct 300

ggttctcttg ctcattttct attatctgct cacgcattag gttttcgtat tttttcaaaa 360

tctggtgaag caactgcatt ccaggcatcc tctaaaattg aagcttacga atcaaaattg 420

gcaagcgaat tagcttgtgt agatttatct attcaaaact tgactatttc aacgcttttt 480

aatgcgctta caacgtctgt aagagggaag ggcgaagaaa ctagcgctga ccccttaatt 540

gcacgatttt acaccttact tactggcaag cctctgtctc gagacactca agggcctgaa 600

cgtgatttag cagaagttat ctcgcgtaag atagctagtt cttttggcac atggaaagaa 660

atgacggcaa accctcttca gtcattacaa ttttttgaag aggaactcca tgcgctggat 720

gccaatgtct cgctctcacc cgccttcgac gttttaatta aaatgaatga tttgcagggc 780

gatttaaaaa atcgaaccat tgtttttgat cctgacgccc ctgtttttga atataacgca 840

gaagaccctg ccgacataat tattaaactt acagctcgtt acgctaaaga agctgtcatc 900

aaaaatcaaa acgtaggaaa ttacgttaaa aacgctatta ctaccacaaa tgccaatggt 960

cttggttggc ttttgaacaa aggtttgtcg ttactccctg tctcgaccga tgacgaattg 1020

ctagagttta ttggcgttga acgatctcat ccctcatgcc atgccttaat tgaattgatt 1080

gcacaattag aagcccccga gctctttgag aagaacgtat tttcagatac tcgttctgaa 1140

gttcaaggta tgattgattc agctgtttct aatcatattg ctcgtctttc cagctctaga 1200

aatagcttgt caatggatag tgaagaatta gaacgtttaa tcaaaagctt tcagatacac 1260

acacctcatt gctcactttt tattggcgcc caatcacttt cacagcagtt agaatctttg 1320

cctgaagccc ttcaatcggg cgttaattca gccgatattt tactaggctc tactcaatat 1380

atgctcacca attctttggt tgaagagtca attgcaactt atcaaagaac acttaatcgc 1440

atcaattact tgtcaggtgt tgcaggtcag attaacggcg caataaagcg aaaagcgata 1500

gatggagaaa aaattcactt gcctgcagct tggtcagagt tgatatcttt accatttata 1560

ggccagcctg ttatagatgt tgaaagcgat ttagctcatc taaaaaatca ataccaaaca 1620

ctttcaaatg agtttgatac tcttatatct gctttgcaaa agaattttga tttgaacttt 1680

aataaagcgc tccttaatcg tactcagcat tttgaagcca tgtgtagaag cactaagaaa 1740

aacgctttat ccaaaccaga gatcgtttcc tatcgcgacc tgcttgctcg attaacttct 1800

tgtttgtatc gaggctcttt agttttgcgt cgtgccggca ttgaagtgtt aaaaaaacat 1860

aaaatatttg agtcaaacag cgaacttcgt gaacatgttc atgaaagaaa gcatttcgtg 1920

tttgttagtc ctctagatcg caaagccaag aaactccttc gattaactga ttcgcgtcca 1980

gacttgttac atgttattga tgaaatattg cagcacgata atcttgaaaa caaagaccgc 2040

gagtcacttt ggctagttcg ctctggttat ttgcttgcag gacttccaga tcaactttct 2100

tcatctttta ttaacttgcc tatcattact caaaaaggag atagacgcct tatagacctg 2160

attcagtatg atcaaattaa tcgtgatgct tttgttatgt tagtgacctc tgcattcaag 2220

tctaatttgt ctggtctgca gtatcgtgcc aataagcaat cgttcgttgt tactcgcacg 2280

ctaagccctt atctcggctc aaaacttgtc tacgtaccca aggataaaga ttggttagtt 2340

ccttctcaaa tgtttgaagg acgatttgct gacattcttc aatcagatta tatggtctgg 2400

aaagatgccg gtcgtctttg tgttattgat actgcaaaac acctttctaa tataaagaag 2460

tctgtatttt catccgaaga agttctcgct tttttaagag aactccctca ccgcacattt 2520

atccagaccg aagttcgcgg ccttggcgtt aatgtcgatg gaattgcatt taataatggt 2580

gatattccgt cattaaaaac cttttcaaat tgcgttcagg taaaagtttc tcggactaat 2640

acatccctag ttcaaacact taatcgttgg tttgaaggag gaaaagtttc tcctccgagc 2700

attcaatttg aacgggcgta ttataaaaaa gacgatcaaa ttcatgaaga cgcagcgaaa 2760

agaaagatac gattccagat gcccgcaact gagttggttc atgcttctga cgatgcgggg 2820</