Направляемые нуклеиновыми кислотами нуклеазы
Изобретение относится к области биотехнологии, в частности к системе направляемых нуклеиновой кислотой нуклеаз, содержащей направляемую нуклеиновой кислотой нуклеазу, сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, и редактирующую последовательность, имеющую изменение последовательности, по сравнению с последовательностью области-мишени в геноме клетки. Изобретение эффективно для геномного редактирования в области-мишени в геноме клетки, облегчаемого нуклеазой, сконструированной направляющей нуклеиновой кислотой и редактирующей последовательностью. 9 з.п. ф-лы, 41 ил., 12 табл., 19 пр.
[0001] По настоящей заявке испрашивается приоритет Патентной заявки США No. 15/631989, поданной 23 июня 2017 г., и Патентной заявки США No. 15/632001, поданной 23 июня 2017 г., полное содержание каждой из которых, таким образом, приведено в качестве ссылки.
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[0002] Настоящая заявка содержит список последовательностей, который принят в электронной форме в формате ASCII, и полное содержание которого, таким образом, приведено в качестве ссылки. Указанная копия ASCII, созданная 25 мая 2018 г., названа 49022-717_601_SL.txt и имеет размер 1996118 байт.
УРОВЕНЬ ТЕХНИКИ ДЛЯ ИЗОБРЕТЕНИЯ
[0003] Направляемые нуклеиновыми кислотами нуклеазы стали важными инструментами для исследования и геномной инженерии. Применимость этих инструментов может быть ограничена требованиями специфичности последовательности, экспрессией или сложностями доставки.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0004] Настоящее изобретение относится к способу модификации области-мишени в геноме клетки, включающему: приведение клетки в контакт с: (a) направляемой нуклеиновой кислотой нуклеазой, содержащей аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2 или SEQ ID NO: 4; (b) сконструированной направляющей нуклеиновой кислотой, способной формировать комплекс с направляемой нуклеиновой кислотой нуклеазой; и (c) редактирующей последовательностью, кодирующей нуклеиновую кислоту, комплементарную указанной области-мишени, имеющей изменение в последовательности по сравнению с областью-мишенью; и обеспечение возможности для нуклеазы, направляющей нуклеиновой кислоты и редактирующей последовательности осуществлять геномное редактирование в области-мишени генома клетки. В некоторых аспектах сконструированная направляющая нуклеиновая кислота и редактирующая последовательность представлены в форме одиночной нуклеиновой кислоты. В некоторых аспектах одиночная нуклеиновая кислота дополнительно содержит мутацию в участке мотива, смежного с протоспейсером (PAM). В некоторых аспектах, направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 47, или 203-222. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 133, или 183-202. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 153, или 243-262. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 223-242. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 42, или 283-302. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 128, или 263-282. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 148, или 323-342. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 303-322. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 44, или 722-741. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 130, или 742-761. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 150, или 762-781. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 782-801. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU или UAGU.
[0005] Настоящее изобретение относится к системы направляемых нуклеиновой кислотой нуклеаз, содержащим: (a) направляемую нуклеиновой кислотой нуклеазу, содержащую аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2, или SEQ ID NO: 4; (b) сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, и (c) редактирующую последовательность, имеющую изменение последовательности, по сравнению с последовательностью области-мишени в геноме клетки; где система приводит к геномному редактированию в области-мишени в геноме клетки, облегчаемому нуклеазой, сконструированной направляющей нуклеиновой кислотой и редактирующей последовательностью. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 47, или 203-222. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 133, или 183-202. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 153, или 243-262. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 223-242. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 42, или 283-302. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 128, или 263-282. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 148 или 323-342. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 303-322. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 44 или 722-741. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 130, или 742-761. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 150 или 762-781. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза кодирована нуклеиновой кислотой с по меньшей мере 85% идентичностью с SEQ ID NO: 782-801. В некоторых аспектах направляемая нуклеиновой кислотой нуклеаза имеет оптимизированный кодонный состав для клетки, подлежащей редактированию. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU, или UAGU. В некоторых аспектах сконструированная направляющая нуклеиновая кислота и редактирующая последовательность представлены в форме одиночной нуклеиновой кислоты. В некоторых аспектах одиночная нуклеиновая кислота дополнительно содержит мутацию в участке мотива, смежного с протоспейсером (PAM).
[0006] Настоящее изобретение относится к композиции, содержащей (a) направляемую нуклеиновой кислотой нуклеазу, содержащую аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2 или SEQ ID NO: 4; и (b) сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, где сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU или UAGU. В некоторых аспектах сконструированная направляющая нуклеиновая кислота представляет собой гетерологичную сконструированную направляющую нуклеиновую кислоту. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах нуклеаза кодирована последовательностью нуклеиновой кислоты с оптимизированным кодонным составом для использования в клетках из конкретного организма. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для E. coli. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для S. cerevisiae. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток млекопитающих. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток человека. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток растений.
[0007] Настоящее изобретение относится к системы направляемых нуклеиновой кислотой нуклеаз, содержащим: (a) направляемую нуклеиновой кислотой нуклеазу, содержащую аминокислотную последовательность из SEQ ID NO: 7, SEQ ID NO: 2, или SEQ ID NO: 4; и (b) гетерологичную сконструированную направляющую нуклеиновую кислоту, способную формировать комплекс с направляемой нуклеиновой кислотой нуклеазой. В некоторых аспектах рассматривая система дополнительно содержит (c) редактирующую последовательность, имеющую изменение последовательности, по сравнению с последовательностью области-мишени. В некоторых аспектах, нацеливающая система приводит к редактированию в области-мишени, облегчаемому нуклеазой, гетерологичной сконструированной направляющей нуклеиновой кислотой и редактирующей последовательностью. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит последовательность петли, содержащую последовательность из UAUU, UUUU, UGUU, UCUU, UCUUU или UAGU. В некоторых аспектах сконструированная направляющая нуклеиновая кислота содержит любую из SEQ ID NO: 172-182. В некоторых аспектах нуклеаза кодирована последовательностью нуклеиновой кислоты с оптимизированным кодонным составом для использования в клетках из конкретного организма. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для E. coli. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для S. cerevisiae. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток млекопитающих. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток человека. В некоторых аспектах последовательность нуклеиновой кислоты имеет оптимизированный кодонный состав для клеток растений.
ВКЛЮЧЕНИЕ В КАЧЕСТВЕ ССЫЛКИ
[0008] Содержание всех публикаций и патентных заявок, упомянутых в настоящем описании, приведено в настоящем описании в качестве ссылки в той же степени, как если бы было конкретно и индивидуально указано, что содержание каждой индивидуальной публикации или патентной заявки приведено в качестве ссылки.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0009] Файл этого патента или заявки содержит по меньшей мере один чертеж, выполненный в цвете. Копии публикации этого патента или патентной заявки с цветным чертежом(чертежами) будут предоставлены Патентным ведомством после запроса и оплаты необходимого взноса.
[0010] На фигуре 1A изображено выравнивание частичной последовательности MAD1-8 (SEQ ID NO: 1-8) и MAD10-12 (SEQ ID NO: 10-12). На фигуре 1A приведены SEQ ID NO: 721, остатки 703-707 из SEQ ID NO: 1, остатки 625-629 из SEQ ID NO: 2, остатки 587-591 из SEQ ID NO: 3, остатки 654-658 из SEQ ID NO: 4, остатки 581-585 из SEQ ID NO: 5, остатки 637-641 из SEQ ID NO: 6, остатки 590-594 из SEQ ID NO: 7, остатки 645-649 из SEQ ID NO: 8, SEQ ID NO: 395, остатки 619-623 из SEQ ID NO: 10 и остатки 603-607 из SEQ ID NO: 12, все соответственно, в порядке упоминания.
[0011] На фигуре 1B изображено филогенетическое древо нуклеаз, включая MAD1-8.
[0012] На фигуре 2 изображен пример конструкции для экспрессии белка. На фигуре 2 описана «6X-His», как SEQ ID NO: 376.
[0013] На фигуре 3 изображен пример редактирующей кассеты и кодонов-мишеней, представляющих редактирующие последовательности SEQ ID NO 396-398, соответственно, в порядке упоминания.
[0014] На фигуре 4 изображен пример технологического процесса эксперимента скрининга или отбора.
[0015] На фигуре 5A изображен пример конструкции для экспрессии белка.
[0016] На фигуре 5B изображен пример редактирующей кассеты.
[0017] На фигуре 5C изображен пример технологического процесса эксперимента скрининга или отбора.
[0018] На фигуре 6A изображен пример конструкции для экспрессии белка.
[0019] На фигуре 6B изображен пример редактирующей кассеты.
[0020] На фигуре 6C изображен пример технологического процесса эксперимента скрининга или отбора.
[0021] На фигуре 7 изображен пример данных эксперимента скрининга или отбора функционального комплекса нуклеазы.
[0022] На фигуре 8 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.
[0023] На фигуре 9 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.
[0024] На фигурах 10A и 10B изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.
[0025] На фигуре 11 изображен пример выравнивания последовательностей для выбранных последовательностей из эксперимента редактирования. На фигуре 11 описаны SEQ ID NO 399-401, 400, 400, 400, 400, 400, 402, 399-400 и 400, соответственно, в порядке упоминания.
[0026] На фигуре 12 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.
[0027] На фигуре 13 изображен пример выравнивания каркасных последовательностей. На фигуре 13 описаны SEQ ID NO 403-415, соответственно, в порядке упоминания.
[0028] На фигуре 14A-14B изображен пример данных эксперимента подтверждения праймеров.
[0029] На фигуре 15 изображен пример данных эксперимента редактирования на основе комплекса способной к нацеливанию нуклеазы.
[0030] На фигуре 16 изображен пример подтверждения данных, сравнивающий результаты двух различных анализов.
[0031] На фигуре 17A-17C изображен пример отслеживаемого технологического процесса генной инженерии, включающего плазмиду, содержащую редактирующую кассету и записывающую кассету, и нижестоящее секвенирование штрих-кодов для идентификации включенных редактирования или мутации. На фигуре 17B описаны SEQ ID NO 416-417, соответственно, в порядке упоминания.
[0032] На фигуре 18 изображен пример отслеживаемого технологического процесса генной инженерии, включающего повторяющиеся циклы конструирования с использованием различных редактирующих кассет и записывающих кассет с уникальным штрих-кодом (BC) в каждом цикле, за которым может следовать отбор и отслеживание для подтверждения успешной стадии конструирования в каждом цикле.
[0033] На фигуре 19 изображен пример технологического процесса рекурсивной инженерии.
[0034] На фигуре 20 изображен пример рассматриваемой экспрессирующей кассеты, и на фигуре 20B изображен пример последовательности-мишени в гене-мишени.
[0035] На фигурах 21A и 21B изображен примеры данные измерений клеток и роста колоний.
[0036] На фигурах 22A и 22B показан пример данных, сравнивающих количественную оценку библиотеки во временных точках ввода и 15 час.
[0037] На фигурах 23A и 23B показаны данные показателя истощения из примера эксперимента.
[0038] На фигуре 23C показаны последовательности-мишени и эффективность редактирования из примера экспериментов. На фигуре 23C описаны SEQ ID NO 419-423, соответственно, в порядке упоминания.
[0039] На фигурах 24A, 24B и 24C показаны данные показателя истощения из примера эксперимента.
[0040] На фигуре 25 показано представление в виде рисунка рассматриваемых анализов, использованных для определения специфичности PAM и неспецифических эффектах рассматриваемых систем нуклеаз.
[0041] На фигурах 26A, 26B и 26C показаны данные показателя истощения из примеров экспериментов.
[0042] На фигурах 27A и 27B показаны данные показателя истощения из примеров экспериментов.
[0043] На фигурах 28A и 28B показаны данные показателя истощения из примеров экспериментов.
[0044] На фигурах 29A и 29B показаны данные показателя истощения из примеров экспериментов.
[0045] На фигурах 30A и 30B показаны данные показателя истощения из примеров экспериментов.
[0046] На фигурах 31A, 31B и 31C показаны данные показателя истощения из примеров экспериментов.
[0047] На фигурах 32A, 32B, 32C, 32D, 32E, 32F, 32G и 32H показаны данные показателя истощения (показатели отрицательного обогащения) из примеров экспериментов.
[0048] На фигурах 32I, 32J, 32K, 32L, 32M, 32N, 32O и 32P показаны данные показателя истощения из примеров экспериментов.
[0049] На фигуре 33 показан пример конструкции и дизайна эксперимента для определения специфичности PAM и характеризации и оптимизации направляющей каркасной последовательности рассматриваемых систем нуклеазы.
[0050] На фигурах 34A и 34B показаны выравнивания каркасных последовательностей направляющих нуклеиновых кислот, например, последовательностей crРНК MAD. На фигуре 34A показаны SEQ ID NO 639-666, соответственно, в порядке упоминания. На фигуре 34B показаны SEQ ID NO 667-675, соответственно, в порядке упоминания.
[0051] На фигурах 35A, 35B и 35C показан пример данных, характеризующих предпочтительные последовательности петли crРНК.
[0052] На фигурах 36A, 36B, 36C, 36D, 36E и 36F показан пример данных показателя истощения, характеризующих предпочтительные последовательности петли crРНК для MAD7, MAD2 и MAD4, соответственно.
[0053] На фигуре 37 показаны данные показателя истощения из примеров экспериментов, характеризующие предпочтительность последовательности стебля петли crРНК.
[0054] На фигуре 38A показан пример экспрессирующих конструкций для использования в клетках млекопитающих.
[0055] На фигуре 38B показан пример направляющих последовательностей нуклеиновой кислоты. На фигуре 38B показаны SEQ ID NO 677-678, соответственно, в порядке упоминания.
[0056] На фигурах 39A и 39B показан пример участков-мишеней, на которые нацелены указанные последовательности гРНК, внутри указанного гена-мишени.
[0057] На фигурах 39C и 39D обобщены PAM и последовательности-мишени указанных направляющих нуклеиновых кислот. На фигуре 38C показаны SEQ ID NO 679-688, соответственно, в порядке упоминания. На фигуре 39D показаны SEQ ID NO 689-698, соответственно, в порядке упоминания.
[0058] На фигуре 40 показана эффективность расщепления (разрезания) по анализу разрезания in vitro.
[0059] На фигуре 41 показано зависимое от MAD7 (для двух конструкций) формирование инделов в клетках HEK293T млекопитающих для двух генов, на которые нацелены три различные нуклеиновые кислоты с двумя различными длинами каркаса (42- или 56-мер).
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0060] Настоящее изобретение относится к направляемые нуклеиновыми кислотами нуклеазам и к способам их использования. Часто, рассматриваемые направляемые нуклеиновой кислотой нуклеазы являются частью системы поддающейся нацеливанию нуклеазы, содержащей направляемую нуклеиновой кислотой нуклеазу и направляющую нуклеиновую кислоту. Рассматриваемую систему поддающейся нацеливанию нуклеазы можно использовать для расщепления, модификации и/или редактирования полинуклеотидной последовательности-мишени, часто обозначаемой как последовательность-мишень. Рассматриваемая система поддающейся нацеливанию нуклеазы в совокупности относится к транскриптам и другим элементам, вовлеченным в экспрессию или управление активностью генов, которые могут включать последовательности, кодирующие белок рассматриваемой направляемой нуклеиновой кислотой нуклеазы, и направляющую нуклеиновую кислоту, как описано в настоящем описании.
[0061] Способы, системы, векторы, полинуклеотиды и композиции, описанные в настоящем описании, можно использовать в различных применениях, включая изменение или модификацию синтеза продукта гена, такого как белок, расщепление полинуклеотида, редактирование полинуклеотида, сплайсинг полинуклеотида; перенос полинуклеотида-мишени, отслеживание полинуклеотида-мишени, выделение полинуклеотида-мишени, визуализацию полинуклеотида-мишени и т.д. Аспекты изобретения также относятся к способам и применениям для композиций и систем, описанных в настоящем описании в геномной инженерии, например, для изменения или манипуляции экспрессии одного или нескольких генов или одного или нескольких продуктов генов, в клетках прокариот, архей или эукариот, in vitro, in vivo или ex vivo.
Направляемые нуклеиновыми кислотами нуклеазы
[0062] Системы поддающихся нацеливанию нуклеаз бактерий и архей возникли в качестве мощных инструментов для точного геномного редактирования. Однако природные нуклеазы имеют некоторые ограничения, включая проблемы с экспрессией и доставкой из-за размера последовательности нуклеиновой кислоты и белка. Поддающиеся нацеливанию нуклеазы, требующие узнавания PAM, являются также ограниченными по последовательностям, на которые они нацелены в генетической последовательности. Другие проблемы включают процессивность, специфичность и эффективность узнавания мишени, и эффективность нуклеазы в зависимости от кислотности, которые часто влияют на эффективность генетического редактирования.
[0063] Неприродные поддающиеся нацеливанию нуклеазы и неприродные системы поддающихся нацеливанию нуклеаз могут преодолевать многие из этих проблем и ограничений.
[0064] Настоящее изобретение относится к неприродным системам поддающихся нацеливанию нуклеаз. Такие системы поддающихся нацеливанию нуклеаз сконструированы для преодоления одной или нескольких проблем, описанных выше, и могут быть обозначены как сконструированные системы нуклеаз. Сконструированные системы нуклеаз могут содержать одно или несколько из сконструированных нуклеаз, таких как сконструированная направляемая нуклеиновой кислотой нуклеаза, сконструированной направляющей нуклеиновой кислоты, сконструированных полинуклеотидов, кодирующих указанную нуклеазу, или сконструированных полинуклеотидов, кодирующих указанную направляющую нуклеиновую кислоту. Сконструированные нуклеазы, сконструированные направляющие нуклеиновые кислоты и сконструированные полинуклеотиды, кодирующие сконструированную нуклеазу или сконструированную направляющую нуклеиновую кислоту, являются неприродными и не обнаружены в природе. Следовательно, сконструированные системы нуклеаз, включающие один или несколько из этих элементом, являются неприродными.
[0065] Неограничивающие примеры типов конструирования, которые можно выполнять для получения неприродной системы, являются следующими. Конструирование может включать оптимизацию кодонного состава для облегчения экспрессии или улучшения экспрессии в клетке-хозяине, такой как гетерологичная клетка-хозяин. Конструирование может уменьшать размер или молекулярную массу нуклеазы для облегчения экспрессии или доставки. Конструирование может изменять выбор PAM для изменения специфичности PAM или для расширения лежит диапазона узнаваемых PAM. Конструирование может изменять, увеличивать или уменьшать стабильность, процессивность, специфичность или эффективность системы поддающейся нацеливанию нуклеазы. Конструирование может изменять, увеличивать или уменьшать стабильность белка. Конструирование может изменять, увеличивать или уменьшать процессивность сканирования нуклеиновой кислоты. Конструирование может изменять, увеличивать или уменьшать специфичность последовательности-мишени. Конструирование может изменять, увеличивать или уменьшать активность нуклеазы. Конструирование может изменять, увеличивать или уменьшать эффективность редактирования. Конструирование может изменять, увеличивать или уменьшать эффективность трансформации. Конструирование может изменять, увеличивать или уменьшать экспрессию нуклеазы или направляющей нуклеиновой кислоты.
[0066] Примеры неприродных последовательностей нуклеиновых кислот, описанных в настоящем описании, включают последовательности с оптимизированным кодонным составом для экспрессии в бактериях, таких как E. coli (например, SEQ ID NO: 41-60), последовательности с оптимизированным кодонным составом для экспрессии в одноклеточных эукариотах, таких как дрожжи (например, SEQ ID NO: 127-146), последовательности с оптимизированным кодонным составом для экспрессии в многоклеточных эукариотах, таких как клетки человека (например, SEQ ID NO: 147-166), полинуклеотиды. используемые для клонирования или экспрессии любых последовательностей, описанных в настоящем описании (например, SEQ ID NO: 61-80), плазмиды, содержащие последовательности нуклеиновых кислот (например, SEQ ID NO: 21-40), функционально связанные с гетерологичным промотором или сигналом ядерной локализации или другим гетерологичным элементом, белки, полученные из сконструированных или имеющих оптимизированный кодонный состав последовательностей нуклеиновых кислот (например, SEQ ID NO: 1-20), или сконструированные направляющие нуклеиновые кислоты, содержащие любую из SEQ ID NO: 84-107. Такие неприродные последовательности нуклеиновых кислот можно амплифицировать, клонировать, собирать, синтезировать, получать из синтезированных олигонуклеотидов или dNTP, или иным образом получать с использованием способов, известных специалисту в данной области.
[0067] Настоящее изобретение относится к направляемым нуклеиновыми кислотами нуклеазам. Рассматриваемые нуклеазы являются функциональными in vitro, или в клетках прокариот, архей или эукариот для применений in vitro, in vivo, или ex vivo. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из рода, включающего, но без ограничения, Thiomicrospira, Succinivibrio, Candidatus, Porphyromonas, Acidaminococcus, Acidomonococcus, Prevotella, Smithella, Moraxella, Synergistes, Francisella, Leptospira, Catenibacterium, Kandleria, Clostridium, Dorea, Coprococcus, Enterococcus, Fructobacillus, Weissella, Pediococcus, Corynebacter, Sutterella, Legionella, Treponema, Roseburia, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, Alicyclobacillus, Brevibacilus, Bacillus, Bacteroidetes, Brevibacilus, Carnobacterium, Clostridiaridium, Clostridium, Desulfonatronum, Desulfovibrio, Helcococcus, Leptotrichia, Listeria, Methanomethyophilus, Methylobacterium, Opitutaceae, Paludibacter, Rhodobacter, Sphaerochaeta, Tuberibacillus, Oleiphilus, Omnitrophica, Parcubacteria и Campylobacter. Вид организма из такого рода может являться таким, как обсуждают иным образом в настоящем описании. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри царства, включающего, но без ограничения, Firmicute, Actinobacteria, Bacteroidetes, Proteobacteria, Spirochates и Tenericutes. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри филума, включающего, но без ограничения, Erysipelotrichia, Clostridia, Bacilli, Actinobacteria, Bacteroidetes, Flavobacteria, Alphaproteobacteria, Betaproteobacteria, Gammaproteobacteria, Deltaproteobacteria, Epsilonproteobacteria, Spirochaetes и Mollicutes. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри порядка, включающего, но без ограничения, Clostridiales, Lactobacillales, Actinomycetales, Bacteroidales, Flavobacteriales, Rhizobiales, Rhodospirillales, Burkholderiales, Neisseriales, Legionellales, Nautiliales, Campylobacterales, Spirochaetales, Mycoplasmatales и Thiotrichales. Пригодные направляемые нуклеиновыми кислотами нуклеазы могут происходить из организма из рода или неклассифицированного рода внутри семейства, включающего, но без ограничения, Lachnospiraceae, Enterococcaceae, Leuconostocaceae, Lactobacillaceae, Streptococcaceae, Peptostreptococcaceae, Staphylococcaceae, Eubacteriaceae, Corynebacterineae, Bacteroidaceae, Flavobacterium, Cryomoorphaceae, Rhodobiaceae, Rhodospirillaceae, Acetobacteraceae, Sutterellaceae, Neisseriaceae, Legionellaceae, Nautiliaceae, Campylobacteraceae, Spirochaetaceae, Mycoplasmataceae, Pisciririckettsiaceae и Francisellaceae. Другие направляемые нуклеиновыми кислотами нуклеазы описаны в Публикации патентной заявки США No. US20160208243, поданной 18 декабря 2015 г., в Публикации патентной заявки США No. US20140068797, поданной 15 марта 2013 г., в Патенте США No. US8697359, поданном 15 октября 2013 г., и в Zetsche et al., Cell 2015 Oct 22; 163(3):759-71, полное содержание каждого из которых приведено в настоящем описании в качестве ссылки.
[0068] Некоторые направляемые нуклеиновыми кислотами нуклеазы, пригодные для использования в способах, системах и композициях по настоящему описанию, включают нуклеазы, происходящие из организма, такого как, но без ограничения, Thiomicrospira sp. XS5, Eubacterium rectale, Succinivibrio dextrinosolvens, Candidatus Methanoplasma termitum, Candidatus Methanomethylophilus alvus, Porphyromonas crevioricanis, Flavobacterium branchiophilum, Acidaminococcus Sp., Acidomonococcus sp., Lachnospiraceae bacterium COE1, Prevotella brevis ATCC 19188, Smithella sp. SCADC, Moraxella bovoculi, Synergistes jonesii, Bacteroidetes oral taxon 274, Francisella tularensis, Leptospira inadai serovar Lyme str. 10, Acidomonococcus sp. crystal structure (5B43) S. mutans, S. agalactiae, S. equisimilis, S. sanguinis, S. pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N. gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C. difficile, C. tetani, C. sordellii; Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Butyrivibrio proteoclasticus B316, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, Porphyromonas macacae, Catenibacterium sp. CAG:290, Kandleria vitulina, Clostridiales bacterium KA00274, Lachnospiraceae bacterium 3-2, Dorea longicatena, Coprococcus catus GD/7, Enterococcus columbae DSM 7374, Fructobacillus sp. EFB-N1, Weissella halotolerans, Pediococcus acidilactici, Lactobacillus curvatus, Streptococcus pyogenes, Lactobacillus versmoldensis, Filifactor alocis ATCC 35896, Alicyclobacillus acidoterrestris, Alicyclobacillus acidoterrestris ATCC 49025, Desulfovibrio inopinatus, Desulfovibrio inopinatus DSM 10711, Oleiphilus sp. Oleiphilus sp. HI0009, Candidtus kefeldibacteria, Parcubacteria CasY.4, Omnitrophica WOR 2 bacterium GWF2, Bacillus sp. NSP2.1 и Bacillus thermoamylovorans.
[0069] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, содержит аминокислотную последовательность, имеющую по меньшей мере 50% идентичность аминокислот с любой из SEQ ID NO: 1-20. В некоторых случаях, нуклеаза содержит аминокислотную последовательность, имеющую по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность аминокислот с любой из SEQ ID NO: 1-20. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с любой из SEQ ID NO: 1-20. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с любой из SEQ ID NO: 1-8 или 10-12. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с любой из SEQ ID NO: 1-8 или 10-11. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с SEQ ID NO: 2. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с SEQ ID NO: 7. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза имеет по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность аминокислот с SEQ ID NO: 4.
[0070] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит любую из SEQ ID NO: 1-20. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит любую из SEQ ID NO: 1-8 или 10-12. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит любую из SEQ ID NO: 1-8 или 10-11. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит SEQ ID NO: 2. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит SEQ ID NO: 7. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит SEQ ID NO: 4.
[0071] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, или 95% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 50% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 45% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 40% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 35% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза содержит аминокислотную последовательность, имеющую, самое большее, 30% идентичность аминокислот с любой из SEQ ID NO: 12 или SEQ ID NO: 108-110.
[0072] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-40. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-28 или 30-32. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с любой из SEQ ID NO: 21-28 или 30-31. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с SEQ ID NO: 22. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с SEQ ID NO: 27. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, идентичность последовательности с SEQ ID NO: 24.
[0073] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 21-40. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 21-28 или 30-32. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 21-28 или 30-31. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 22. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 27. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 24.
[0074] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании кодирована последовательностью нуклеиновой кислоты. Такая нуклеиновая кислота может иметь оптимизированный кодонный состав для экспрессии в желательной клетке-хозяине. Пригодные клетки-хозяева могут включать, в качестве неограничивающих примеров, клетки прокариот, таких как E. coli, P. aeruginosa, B. subtilus и V. natriegens, и клетки эукариот, таких как S. cerevisiae, клетки растений, такие как клетки растений Arabidopsis thaliana или табака, клетки насекомых, клетки нематод, клетки земноводных, клетки рыб или клетки млекопитающих, включая клетки человека.
[0075] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в грамположительных бактериях, например, Bacillus subtilis, или в грамотрицательных бактериях, например, E. coli. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 41-60, 203-222, 283-302, или 722-741. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 41-60, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 41-48, 50-51, 53-60, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 41-48, 50-52, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 41-48, 50-51, 203-222, 283-302, или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 42 или 283-302. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 47 или 203-222. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 44 или 722-741.
[0076] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 41-60, 203-222, 283-302 или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 41-48, 50-52, 203-222, 283-302 или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 41-48, 50-51, 203-222, 283-302 или 722-741. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 42 или 283-302. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 47 или 203-222. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 44 или 722-741.
[0077] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в видах дрожжей, например, S. cerevisiae. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282 или 742-761. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-134, 136-138, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 127-134, 136-137, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 128 или 263-282. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 133 или 183-202. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 130 или 742-761.
[0078] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 127-146, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 127-134, 136-138, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 127-134, 136-137, 183-202, 263-282, или 742-761. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 128 или 263-282. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 133 или 183-202. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 130 или 742-761.
[0079] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в клетках млекопитающих. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 147-166, 243-262, 323-342, или 762-781. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 147-166, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 147-166, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 147-154, 156-158, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 147-154, 156-157, 243-262, 323-342, или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 148 или 323-342. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 153 или 243-262. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 150 или 762-781.
[0080] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 147-166, 243-262, 323-342 или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 147-154, 156-158, 243-262, 323-342 или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 147-154, 156-157, 243-262, 323-342 или 762-781. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 148 или 323-342. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 153 или 243-262. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 150 или 762-781.
[0081] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в клетках растений. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза, описанная в настоящем описании, кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере 50% идентичность последовательности с любой из SEQ ID NO: 343-359, 223-242, 303-322, или 782-801. В некоторых случаях, нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 10%, 20%, 30%, 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95%, или 100% идентичность последовательности с любой из SEQ ID NO: 343-359, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 343-359, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 343-347, 349-351, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с любой из SEQ ID NO: 343-347, 349-350, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 303-322. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 223-242. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты, имеющей по меньшей мере приблизительно 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, более чем 95% идентичность последовательности с SEQ ID NO: 782-801.
[0082] В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 343-359, 223-242, 303-322 или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 343-347, 349-351, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из любой из SEQ ID NO: 343-347, 349-350, 223-242, 303-322, или 782-801. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 303-322. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 223-242. В некоторых случаях, направляемая нуклеиновой кислотой нуклеаза кодирована последовательностью нуклеиновой кислоты из SEQ ID NO: 782-801.
[0083] Последовательность нуклеиновой кислоты, кодирующая направляемую нуклеиновой кислотой нуклеазу, может являться функционально связанной с промотором. Такие последовательности нуклеиновых кислот могут являться линейными или кольцевыми. Последовательности нуклеиновых кислот могут содержаться в более крупных линейных или кольцевых последовательностях нуклеиновых кислот, содержащих дополнительные элементы, такие как точка начала репликации, селективный или позволяющий скрининг маркер, терминатор, другие компоненты системы поддающейся нацеливанию нуклеазы, такие как направляющая нуклеиновая кислота, или редактирующая или записывающая кассета, как описано в настоящем описании. Эти более крупные последовательности нуклеиновых кислот могут представлять собой рекомбинантные экспрессирующие векторы, как описано более подробно ниже.
Направляющая нуклеиновая кислота
[0084] Как правило, направляющая нуклеиновая кислота может формировать комплекс с совместимой направляемой нуклеиновой кислотой нуклеазой и может гибридизоваться с последовательностью-мишенью, таким образом, направляя нуклеазу на последовательность-мишень. Рассматриваемая направляемую нуклеиновой кислотой нуклеаза, способная формировать комплекс с направляющей нуклеиновой кислотой, может быть обозначена как направляемая нуклеиновой кислотой нуклеаза, совместимая с направляющей нуклеиновой кислотой. Подобным образом, направляющая нуклеиновая кислота, способная формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, может быть обозначена как направляющая нуклеиновая кислота, совместимая с направляемыми нуклеиновыми кислотами нуклеазами.
[0085] Направляющая нуклеиновая кислота может представлять собой ДНК. Направляющая нуклеиновая кислота может представлять собой РНК. Направляющая нуклеиновая кислота может содержать как ДНК, так и РНК. Направляющая нуклеиновая кислота может содержать модифицированные или неприродные нуклеотиды. В случаях, когда направляющая нуклеиновая кислота содержит РНК, направляющая нуклеиновая кислота - РНК может быть кодирована последовательностью ДНК в молекуле полинуклеотида, такого как плазмида, линейная конструкция или редактирующая кассета, как описано в настоящем описании.
[0086] Направляющая нуклеиновая кислота может содержать направляющую последовательность. Направляющая последовательность представляет собой полинуклеотидную последовательность, имеющую достаточную комплементарность с последовательностью полинуклеотида-мишени, чтобы гибридизоваться с последовательностью-мишенью и управлять специфическим для последовательности связыванием находящейся в комплексе направляемой нуклеиновой кислотой нуклеазы с последовательностью-мишенью. Степень комплементарности между направляющей последовательностью и соответствующей ей последовательностью-мишенью, после оптимального выравнивания с использованием пригодного алгоритма выравнивания, составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99%, или более. Оптимальное выравнивание можно определять с использованием любого пригодного алгоритма для выравнивания последовательностей. В некоторых вариантах осуществления, направляющая последовательность имеет длину приблизительно или более, чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления, направляющая последовательность имеет длину менее, чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20 нуклеотидов. Предпочтительно, направляющая последовательность имеет длину 10-30 нуклеотидов. Направляющая последовательность может иметь длину 15-20 нуклеотидов. Направляющая последовательность может иметь длину 15 нуклеотидов. Направляющая последовательность может иметь длину 16 нуклеотидов. Направляющая последовательность может иметь длину 17 нуклеотидов. Направляющая последовательность может иметь длину 18 нуклеотидов. Направляющая последовательность может иметь длину 19 нуклеотидов. Направляющая последовательность может иметь длину 20 нуклеотидов.
[0087] Направляющая нуклеиновая кислота может содержать каркасную последовательность. Как правило, «каркасная последовательность» включает любую последовательность имеющую достаточную последовательность, чтобы способствовать образованию комплекса способной к нацеливанию нуклеазы, где комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу и направляющую нуклеиновую кислоту, содержащую каркасную последовательность и направляющую последовательность. Достаточная последовательность внутри каркасной последовательности, чтобы способствовать образованию комплекса способной к нацеливанию нуклеазы, может иметь некоторую степень комплементарности на протяжении длины двух областей последовательности внутри каркасной последовательности, таких как одна или две области последовательности, вовлеченные в формирование вторичной структуры. В некоторых случаях, одна или две области последовательности заключены или кодированы в одном и том же полинуклеотиде. В некоторых случаях, одна или две области последовательности заключены или кодированы в разных полинуклеотидах. Оптимальное выравнивание можно определять посредством любого пригодного алгоритма выравнивания, и можно дополнительно учитывать вторичные структуры, например, самокомплементарность внутри одной или двух областей последовательности. В некоторых вариантах осуществления, степень комплементарности между одной или двумя областями последовательности н протяжении длины более короткой из двух после оптимального выравнивания составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99%, или выше. В некоторых вариантах осуществления, по меньшей мере одна из двух областей последовательности имеет длину приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов.
[0088] Каркасная последовательность рассматриваемой направляющей нуклеиновой кислоты может содержать вторичную структуру. Вторичная структура может содержать область псевдоузла. В некоторых случаях, кинетика связывания направляющей нуклеиновой кислоты с направляемой нуклеиновой кислотой нуклеазой частично определяется вторичными структурами внутри каркасной последовательности. В некоторых случаях, кинетика связывания направляющей нуклеиновой кислоты с направляемой нуклеиновой кислотой нуклеазой частично определяется последовательностью нуклеиновой кислоты с каркасной последовательностью. Пример области псевдоузла внутри каркасной последовательности показан на фигуре 49C.
[0089] Каркасная последовательность может содержать последовательность петли. Последовательность петли может содержать 1 или более нуклеотидов. В некоторых примерах, последовательность петли содержит 4 нуклеотида. В некоторых примерах, последовательность петли содержит 5 нуклеотидов. Последовательность петли может представлять собой область каркасной последовательности, которая не гибридизуется с другой последовательностью или не гибридизуется с другой последовательностью внутри каркасной последовательности. Пример последовательности петли внутри каркасной последовательности показан на фигуре 49C.
[0090] Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 84-107 или 172-182. Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 84-103. Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 84-91 или 93-95. Каркасная последовательность может содержать последовательность из любой из SEQ ID NO: 88, 93, 94, или 95. Каркасная последовательность может содержать последовательность из SEQ ID NO: 88. Каркасная последовательность может содержать последовательность из SEQ ID NO: 93. Каркасная последовательность может содержать последовательность из SEQ ID NO: 94. Каркасная последовательность может содержать последовательность из SEQ ID NO: 95. Каркасная последовательность может содержать последовательность или консенсусную последовательность, показанную на фигуре 49A, 49B или 49C.
[0091] В некоторых аспектах, настоящее изобретение относится к нуклеазе, связывающейся с направляющей нуклеиновой кислотой, содержащей консервативную каркасную последовательность. Например, направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с консервативной областью псевдоузла, как показано на фигуре 13. Конкретно, направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с направляющей нуклеиновой кислотой, содержащей консервативную область псевдоузла, как показано на фигуре 13. Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-1 (SEQ ID NO: 172). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-3 (SEQ ID NO: 173). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-4 (SEQ ID NO: 174). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-5 (SEQ ID NO: 175). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-6 (SEQ ID NO: 176). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-7 (SEQ ID NO: 177). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-8 (SEQ ID NO: 178). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-10 (SEQ ID NO: 179). Другие направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-11 (SEQ ID NO: 180). Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-12 (SEQ ID NO: 181). Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с областью псевдоузла, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с областью псевдоузла из каркаса-25 (SEQ ID NO: 182).
[0092] Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с любой из SEQ ID NO: 84-107 или 172-182. Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей по меньшей мере 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с любой из последовательностей, показанных на фигурах 49A, 49B или 49C.
[0093] Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей последовательность петли, показанную на фигурах 49A, 49B или 49C. Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, имеющей последовательность петли UAUU, UUU, UGUU, UCUU, UCUUU или UAGU.
[0094] Конкретные направляемые нуклеиновыми кислотами нуклеазы для использования по настоящему описанию могут связываться с каркасной последовательностью, содержащей РНК-вариант SEQ ID NO: 181, где T заменен на U. В некоторых случаях, каркасная последовательность содержит по меньшей мере одну мутацию, по сравнению с РНК-вариантом SEQ ID NO: 181. Например, каркасная последовательность может содержать измененную последовательность в последовательности петли из каркасной последовательности. Например, последовательность петли может содержать UAUU, UUU, UGUU, UCUU, UCUUU или UAGU.
[0095] Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 84-107. Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 84-103. Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 84-91 или 93-95. Направляющая нуклеиновая кислота может содержать последовательность из любой из SEQ ID NO: 88, 93, 94, или 95. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 88. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 93. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 94. Направляющая нуклеиновая кислота может содержать последовательность из SEQ ID NO: 95.
[0096] В аспектах изобретения, термин «направляющая нуклеиновая кислота» относится к одному или нескольким полинуклеотидам, содержащим 1) направляющую последовательность, способную гибридизоваться с последовательностью-мишенью, и 2) каркасную последовательность, способную взаимодействовать или формировать комплекс с направляемой нуклеиновой кислотой нуклеазой, как описано в настоящем описании. Направляющая нуклеиновая кислота может быть представлена в форме одной или нескольких нуклеиновых кислот. В конкретных вариантах осуществления, направляющая последовательность и каркасная последовательность представлены в форме одного полинуклеотида.
[0097] Направляющая нуклеиновая кислота может являться совместимой с направляемой нуклеиновой кислотой нуклеазой, когда два элемента могут формировать функциональный комплекс способной к нацеливанию нуклеазы, способный расщеплять последовательность-мишень. Часто, совместимую каркасную последовательность для совместимой направляющей нуклеиновой кислоты можно обнаружить посредством сканирования последовательности, смежной с локусом природной направляемой нуклеиновой кислотой нуклеазы. Иными словами, природные направляемые нуклеиновыми кислотами нуклеазы могут быть кодированы в геноме поблизости от соответствующих совместимых последовательности направляющей нуклеиновой кислоты или каркасной последовательности.
[0098] Направляемые нуклеиновыми кислотами нуклеазы могут являться совместимыми с направляющими нуклеиновыми кислотами, не обнаруженными у эндогенного хозяина нуклеаз. Такие ортогональные направляющие нуклеиновые кислоты можно определять посредством эмпирического тестирования. Ортогональные направляющие нуклеиновые кислоты могут происходить из различных видов бактерий или являться синтетическими или иным образом сконструированными, чтобы являться неприродными.
[0099] Ортогональные направляющие нуклеиновые кислоты, которые являются совместимыми с общей направляемой нуклеиновой кислотой нуклеазой, могут иметь один или несколько общие признаки. Общие признаки могут включать последовательность вне области псевдоузла. Общие признаки могут включать область псевдоузла. Общие признаки могут включать первичную последовательность или вторичную структуру.
[00100] Направляющая нуклеиновая кислота может быть сконструирована для нацеливания на желательную последовательность-мишень посредством изменения направляющей последовательности таким образом, чтобы направляющая последовательность являлась комплементарной последовательности-мишени, таким образом, позволяя гибридизацию между направляющей последовательностью и последовательностью-мишенью. Направляющая нуклеиновая кислота с сконструированной направляющей последовательностью может быть обозначена как сконструированная направляющая нуклеиновая кислота. Сконструированные направляющие нуклеиновые кислоты часто являются неприродными и не обнаружены в природе.
[00101] Совместимые направляющие нуклеиновые кислоты или каркасные последовательности для рассматриваемой нуклеазы можно идентифицировать или тестировать с использованием анализа скрининга, как описано в настоящем описании. Как правило, библиотеку векторов можно получать, как описано в настоящем описании, где указанный вектор содержит последовательность-мишень смежную с последовательностью PAM. Указанный вектор может содержать селективный маркер или позволяющий скрининг маркер. Указанный вектор может содержать направляющую последовательность нуклеиновой кислоты, подлежащую тестированию. Указанный вектор может содержать штрих-код или другой уникальный идентификатор, позволяющий идентификацию направляющей нуклеиновой кислоты, подлежащей тестированию. Указанная направляющая нуклеиновая кислота может содержать нацеливающую последовательность, способную к нацеливанию на последовательность-мишень из вектора. Указанная направляющая нуклеиновая кислота может содержать каркасную последовательность. Как правило, в библиотеке таких векторов, каркасную последовательность можно изменять между различными векторами, таким образом, чтобы множество различных каркасных последовательностей можно было подвергать скринингу или тестированию в пределах одного эксперимента или высокопроизводительным способом. В некоторых случаях, последовательность стебля петли внутри каркасной последовательности изменяют между различными векторами, таким образом, чтобы множество различных каркасных последовательностей можно было подвергать скринингу или тестированию в пределах одного эксперимента или высокопроизводительным способом. В некоторых случаях, библиотека векторов содержит множество различных последовательностей PAM, смежных с последовательностью-мишенью. Библиотеку векторов можно затем вводить в клетки-хозяева, где указанные клетки-хозяева содержат рассматриваемую нуклеазу. Указанную рассматриваемую нуклеазу можно экспрессировать с того же или отличного вектора, который вводят в клетку одновременно, до или после вектора с направляющей нуклеиновой кислотой. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме транскрипта мРНК. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме белка. Без намерения быть связанными с теорией, внутри каждой клетки, направляющая нуклеиновая кислота может экспрессироваться. Если экспрессированная направляющая нуклеиновая кислота является совместимой с рассматриваемой нуклеазой, тогда направляющая нуклеиновая кислота может формировать комплекс с рассматриваемой нуклеазой и нацеливать нуклеазу на последовательность-мишень, и тогда нуклеаза может расщеплять последовательность-мишень. это событие расщепления может заставлять клетку-хозяина терять вектор, содержащий последовательность-мишень, или терять функцию селективного маркера или позволяющего скрининг маркера, и таким образом клетка-хозяин может погибать под действием отбора или может быть потеряна в ходе скрининга. С другой стороны, если направляющая нуклеиновая кислота является несовместимой с рассматриваемой нуклеазой, тогда последовательность-мишень не может подвергаться расщеплению, и таким образом, клетка-хозяин может сохранять селективный или позволяющий скрининг маркер. Посредством сравнения входных векторов с полученными в результате отбора или скрининга векторами из выживших или отобранных на выходе клеток-хозяев, можно идентифицировать векторы, подвергнутые истощению. Посредством секвенирования или анализа штрих-кода или уникального идентификатора входных векторов и выходных векторов, можно идентифицировать штрих-коды или уникальные идентификаторы, подвергнутые истощению, что может позволять идентификацию направляющих нуклеиновых кислот, подвергнутых истощению. Подвергнутые истощению направляющие нуклеиновые кислоты могут включать нуклеиновые кислоты, которые являются совместимыми с рассматриваемой нуклеазой.
[00102] В некоторых случаях, при проведении анализа скрининга или тестирования направляющей нуклеиновой кислоты, описанного в настоящем описании, этот анализ можно также использовать для идентификации или скрининга последовательностей PAM, которые являются совместимыми с рассматриваемой нуклеазой. В таких случаях, векторы в библиотеке векторов могут содержать штрих-код или уникальный идентификатор, смежный с PAM. Посредством сравнения входных векторов с выходными векторами, можно идентифицировать последовательности PAM, подвергнутые истощению. Подвергнутые истощению последовательности PAM могут включать последовательности, которые являются совместимыми с рассматриваемой нуклеазой. В некоторых случаях, с использованием анализов, описанных в настоящем описании, совместимые направляющие нуклеиновые кислоты и последовательности PAM для рассматриваемой нуклеазы можно идентифицировать или тестировать в пределах одного эксперимента или скрининга, или высокопроизводительным способом.
[00103] Истощение может относится к уменьшению количества рассматриваемой последовательности, по сравнению с исходной частотой или частотой эталонной последовательности. Истощение является обратным обогащению, и его, таким образом можно также выражать как показатель отрицательного обогащения. Истощение можно рассчитывать с использованием любого способа, известного в данной области. В некоторых случаях, показатели истощения можно рассчитывать посредством расчета частоты каждой последовательности или конструкции в пределах данных эксперимента и сравнения рассматриваемой частоты с контрольной, где истощение представляет собой уровень изменения рассматриваемой частоты от контрольной или эталонной частоты. В некоторых случаях, пороговую частоту используют для уменьшения шума, например, может присутствовать порог отсечения счета по меньшей мере 50, до того как данные можно использовать в расчете показателя истощения. Среднее и стандартное отклонение рассчитывают для последовательностей, для которых не показано изменения по сравнению с контрольной или эталонной частотой. Это среднее и стандартное отклонение можно использовать для выведения z-показателей, для которых можно получить значения p <0,05, для получения порога значимости. В некоторых случаях, для коррекции потенциальной завышенной оценки показателя истощения, используют порог отсечения и показатели истощения, удовлетворяющие этому порогу, считают подвергнутыми истощению. В некоторых случаях, порог может представлять собой log2 -1, log2 -2, log2 -3, log2 -4 или log2 -5.
[00104] В некоторых примерах, показатели истощения можно рассчитывать как log2 показателя истощения с использованием следующего уравнения: W=log2(Fx, f/Fx, i); где Fx, f представляет собой частоту кассеты X в конечной временной точке и Fx, i представляет собой исходную частоту кассеты X, и W представляет собой абсолютный показатель приспособленности каждого варианта. Частоты определяли посредством деления количества прочтений для каждого варианта на общее количество прочтений в эксперименте, включая прочтения, выпавшие из фильтрации. Средневзвешенное значение счета для множества повторов можно использовать для вывода среднего показателя приспособленности каждой мутации следующим образом: Wсредн.=(ΣNi=1 счетi * Wi)/(ΣNi=1 счетi). Рассчитанные показатели могут относиться к показателю истощения, когда рассчитанное значение является отрицательным, и могут также относиться к показателю обогащения, если рассчитанное значение является положительным.
Система поддающейся нацеливанию нуклеазы
[00105] Настоящее изобретение относится к системам поддающихся нацеливанию нуклеаз. Система поддающейся нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу и совместимую направляющую нуклеиновую кислоту. Система поддающейся нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу или полинуклеотидную последовательность, кодирующую направляемую нуклеиновой кислотой нуклеазу. Система поддающейся нацеливанию нуклеазы может содержать направляющую нуклеиновую кислоту или полинуклеотидную последовательность, кодирующую направляющую нуклеиновую кислоту.
[00106] Как правило, система поддающейся нацеливанию нуклеазы, как описано в настоящем описании, характеризуется элементами, способствующими формированию комплекса способной к нацеливанию нуклеазы в участке последовательности-мишени, где the комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу и направляющая нуклеиновая кислота.
[00107] Направляющая нуклеиновая кислота вместе с направляемой нуклеиновой кислотой нуклеазой формирует комплекс способной к нацеливанию нуклеазы, способный связываться с последовательностью-мишенью внутри полинуклеотида-мишени, как определено посредством направляющей последовательности направляющей нуклеиновой кислоты.
[00108] Как правило, для получения двухцепочечного разрыва, в большинстве случаев, комплекс способной к нацеливанию нуклеазы связывается с последовательностью-мишенью, как определено посредством направляющей нуклеиновой кислоты, и нуклеаза должна узнавать последовательность мотива, смежного с протоспейсером (PAM), смежную с последовательностью-мишенью.
[00109] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-20 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-12 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-11 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту. В любом из этих случаев, направляющая нуклеиновая кислота может содержать каркасную последовательность, совместимую с направляемой нуклеиновой кислотой нуклеазой. В любом из этих случаев, каркасная последовательность может представлять собой природную каркасную последовательность или гетерологичную каркасную последовательность. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.
[00110] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-20 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-20 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-12 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-12 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-11 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-91 или 93-95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из любой из SEQ ID NO: 1-8 или 10-11 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 172-182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.
[00111] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107 или 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 88, 93, 94, или 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 88. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 93. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 94. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 172. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 173. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 174. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 175. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 176. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 177. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 178. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 179. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 180. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 181. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 2 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.
[00112] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107 или 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 88, 93, 94 или 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 88. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 93. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 94. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 172. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 173. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 174. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 175. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 176. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 177. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 178. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 179. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 180. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 181. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу SEQ ID NO: 7 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.
[00113] Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 84-107 или 172-182. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую любую из SEQ ID NO: 88, 93, 94, или 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 88. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 93. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 94. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 95. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 172. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 173. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 174. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 175. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 176. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 177. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 178. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 179. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 180. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 181. Комплекс способной к нацеливанию нуклеазы может содержать направляемую нуклеиновой кислотой нуклеазу из SEQ ID NO: 4 и совместимую направляющую нуклеиновую кислоту, содержащую SEQ ID NO: 182. В любом из этих случаев, направляющая нуклеиновая кислота может дополнительно содержать направляющую последовательность. Направляющая последовательность может быть сконструирована для нацеливания на любую желательную последовательность-мишень. Направляющая последовательность может быть сконструирована, чтобы являться комплементарной любой желательной последовательности-мишени. Направляющая последовательность может быть сконструирована для гибридизации с любой желательной последовательностью-мишенью.
[00114] Комплекс способной к нацеливанию нуклеазы может содержать рассматриваемую поддающуюся нацеливанию нуклеазу и направляющую нуклеиновую кислоту. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании ее совместимости с рассматриваемой нуклеазой. Способы определения и выбора совместимых направляющих нуклеиновых кислот описаны в настоящем описании и более подробно описаны в другом месте. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании эффективности расщепления, которую она придает комплексу способной к нацеливанию нуклеазы. Эффективность расщепления может представлять собой частоту разрезания нуклеиновой кислоты-мишени. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании эффективности нацеливания которую она придает комплексу способной к нацеливанию нуклеазы. Эффективность нацеливания может представлять собой частоту нацеливания на целевую нуклеиновую кислоту-мишень. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании специфичности расщепления, которую она придает комплексу способной к нацеливанию нуклеазы. Специфичность расщепления может представлять собой частоту расщепления целевой последовательности-мишени, по сравнению с расщеплением нецелевых последовательности-мишени. В некоторых случаях, направляющую нуклеиновую кислоту выбирают на основании специфичности нацеливания, которую она придает комплексу способной к нацеливанию нуклеазы. Специфичность нацеливания может представлять собой частоту нацеливания на целевую последовательность-мишень, по сравнению с нацеливанием на нецелевые последовательности-мишени.
[00115] Характеристики, такие как специфичность расщепления, эффективность расщепления, специфичность нацеливания или эффективность нацеливания, можно определять на основании характеристик направляющей нуклеиновой кислоты. Например, каркасная последовательность, область псевдоузла или последовательность петли могут, каждая или в комбинации, влиять на характеристики нацеливания или характеристики расщепления рассматриваемого комплекса нуклеазы. В некоторых примерах, части каркасной последовательности, взаимодействующие с нуклеазой, влияют на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых случаях, направляющая последовательность (иногда обозначенная как нацеливающая последовательность) направляющей нуклеиновой кислоты влияет на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых примерах, выбор последовательности-мишени влияет на специфичность или эффективность расщепления или нацеливания комплекса. Например, несовпадения между направляющей последовательностью и последовательностью-мишенью могут влиять на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых случаях, локализация несовпадения относительно PAM может влиять на специфичность или эффективность расщепления или нацеливания комплекса. В некоторых случаях, количество несовпадений или расположение несовпадений в пространстве друг относительно друга может влиять на специфичность или эффективность расщепления или нацеливания комплекса. В любом из этих случаев, указанный параметр может либо увеличивать, либо уменьшать специфичность нацеливания, эффективность нацеливания, специфичность расщепления или эффективность расщепления рассматриваемого комплекса способной к нацеливанию нуклеазы.
[00116] Последовательность-мишень комплекса способной к нацеливанию нуклеазы может представлять собой любой полинуклеотид, эндогенный или экзогенный для клетки прокариот или эукариот, или in vitro. Например, последовательность-мишень может представлять собой полинуклеотид, находящийся в ядре эукариотической клетки. Последовательность-мишень может представлять собой последовательность, кодирующую продукт гена (например, белок), или некодирующую последовательность (например, регуляторный полинуклеотид или a избыточная ДНК). Без намерения быть связанными с теорией, считают, что последовательность-мишень должна являться ассоциированной с PAM; то есть, короткой последовательностью, узнаваемой комплексом способной к нацеливанию нуклеазы. Точные требования к последовательности и длине PAM отличаются, в зависимости от используемой направляемой нуклеиновой кислотой нуклеазы, однако, PAM, как правило, представляют собой последовательности 2-5 пар оснований, смежные с последовательностью-мишенью. Примеры последовательностей PAM приведены в разделе примеры ниже, и специалист в данной области способен идентифицировать дополнительные последовательности PAM для использования с данной направляемой нуклеиновой кислотой нуклеазой. Кроме того, конструирование домена взаимодействия с PAM (PI) может позволять программирование специфичности PAM, улучшать точность узнавания участка-мишени и увеличивать многофункциональность платформы геномной инженерии на основе направляемой нуклеиновой кислотой нуклеазы. Направляемые нуклеиновыми кислотами нуклеазы можно конструировать для изменения их специфичности PAM, например, как описано в Kleinstiver B P et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul. 23; 523 (7561): 481-5. doi: 10.1038/nature14592.
[00117] Участок PAM представляет собой нуклеотидную последовательность поблизости от последовательности-мишени. В большинстве случаев, направляемая нуклеиновой кислотой нуклеаза может расщеплять последовательность-мишень, только если присутствует подходящий PAM. PAM являются специфическими для направляемой нуклеиновой кислотой нуклеазы и могут отличаться между двумя различными направляемыми нуклеиновыми кислотами нуклеазами. PAM может находиться на 5’ или 3’ от последовательности-мишени. PAM может находиться выше или ниже последовательности-мишени. PAM может иметь длину 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более нуклеотидов. Часто, PAM имеет длину между 2-6 нуклеотидов.
[00118] Участки PAM, совместимые с рассматриваемой нуклеазой или комплексом способной к нацеливанию нуклеазы, можно идентифицировать с использованием способов, описанных в настоящем описании. Как правило, библиотеку векторов можно получать, как описано в настоящем описании, где указанный вектор содержит последовательность-мишень, смежную с последовательностью PAM. В библиотеке таких векторов, последовательность PAM можно изменять между различными векторами, таким образом, чтобы множество различных последовательностей PAM можно было подвергать скринингу или тестированию в пределах одного эксперимента или высокопроизводительным способом. Указанный вектор может содержать a штрих-код или другой уникальный идентификатор позволяющий идентификацию PAM, подлежащего тестированию. Указанный вектор может содержать селективный маркер или позволяющий скрининг маркер. Указанный вектор может содержать направляющую последовательность нуклеиновой кислоты. Указанная направляющая нуклеиновая кислота может содержать нацеливающую последовательность, способную к нацеливанию на последовательность-мишень вектора. Указанная направляющая нуклеиновая кислота может содержать каркасную последовательность. В некоторых случаях, библиотека векторов содержит множество различных направляющая последовательность нуклеиновой кислоты или каркасные последовательности. Библиотека векторов можно затем вводить в клетки-хозяева, где указанные клетки-хозяева содержат рассматриваемую нуклеазу. Указанную рассматриваемую нуклеазу можно экспрессировать с того же или отличного вектора, который вводят в клетку одновременно, до или после вектора с направляющей нуклеиновой кислотой. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме транскрипта мРНК. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме белка. Без намерения быть связанными с теорией, внутри каждой клетки, направляющая нуклеиновая кислота может экспрессироваться и может формировать комплекс с рассматриваемой нуклеазой. Тогда направляющая нуклеиновая кислота может нацеливать нуклеазу на последовательность-мишень. В некоторых случаях, если PAM, смежный с последовательностью-мишенью, является совместимым с рассматриваемой нуклеазой, тогда рассматриваемая нуклеаза может расщеплять последовательность-мишень. Это событие расщепления может заставлять клетку-хозяина терять вектор, содержащий последовательность-мишень, или терять функцию селективного маркера или позволяющего скрининг маркера, и таким образом, клетка-хозяин может погибать под действием отбора или может быть потеряна в ходе скрининга. С другой стороны, если PAM является несовместимым с рассматриваемой нуклеазой, тогда последовательность-мишень не может подвергаться расщеплению, и таким образом, клетка-хозяин может сохранять селективный или позволяющий скрининг маркер. Посредством сравнения входных векторов с полученными в результате отбора или скрининга векторами из выживших или отобранных на выходе клеток-хозяев, можно идентифицировать векторы, подвергнутые истощению. Посредством секвенирования или анализа штрих-кода или уникального идентификатора входных векторов и выходных векторов, можно идентифицировать штрих-коды или уникальные идентификаторы, подвергнутые истощению, что может позволять идентификацию последовательностей PAM, подвергнутых истощению. The подвергнутые истощению последовательности PAM могут включать those которые являются совместимыми с рассматриваемой нуклеазой.
[00119] В некоторых случаях, при проведении анализа скрининга или тестирования PAM, описанного в настоящем описании, этот анализ можно также использовать для идентификации или скрининга направляющих последовательностей нуклеиновых кислот, которые являются совместимыми с рассматриваемой нуклеазой. В таких случаях, векторы в библиотеке векторов могут содержать штрих-код или уникальный идентификатор, смежный с направляющей нуклеиновой кислотой. Посредством сравнения входных векторов с выходными векторами, можно идентифицировать направляющие последовательности нуклеиновых кислот, подвергнутые истощению. Подвергнутые истощению направляющие последовательности нуклеиновых кислот могут включать последовательности, которые являются совместимыми с рассматриваемой нуклеазой. В некоторых случаях, с использованием анализов, описанных в настоящем описании, совместимые направляющие нуклеиновые кислоты и последовательности PAM для рассматриваемой нуклеазы можно идентифицировать или тестировать в пределах одного эксперимента или скрининга, или высокопроизводительным способом. Способы расчета и оценки истощения, как описано ранее, являются применимыми для расчета и оценки истощения также в этих случаях.
[00120] В некоторых примерах, PAM может быть предоставлен на отдельном олигонуклеотиде. В таких случаях, предоставление PAM на олигонуклеотиде позволяет расщепление последовательности-мишени, которая в ином случае не способна подвергаться расщеплению, поскольку смежный PAM не присутствует на том же самом полинуклеотиде, что и последовательность-мишень.
[00121] Полинуклеотидные последовательности, кодирующие компонент системы поддающейся нацеливанию нуклеазы, могут включать один или несколько векторов. Как правило, термин «вектор» относится к молекуле нуклеиновой кислоты, способной транспортировать другую нуклеиновую кислоту, с которой она связана. Векторы включают, но без ограничения, молекулы нуклеиновой кислоты, которые являются одноцепочечными, двухцепочечными или частично двухцепочечными; молекулы нуклеиновой кислоты, содержащие один или несколько свободных концов, не содержащие свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, содержащие ДНК, РНК или обе; и другие варианты полинуклеотидов, известных в данной области. Одним типом вектора является «плазмида», которая является кольцевой двухцепочечной ДНК-петлей, в которую могут быть вставлены дополнительные фрагменты ДНК, например, посредством стандартных способов молекулярного клонирования. Другим типом вектора является вирусный вектор, где происходящие из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, дефектные по репликации ретровирусы, аденовирусы, дефектные по репликации аденовирусы, и аденоассоциированные вирусы). Вирусные векторы включают также полинуклеотиды, переносимые вирусом, для трансфекции клетки-хозяина. Конкретные векторы являются способными к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальную точку начала репликации и эписомные векторы млекопитающих). Другие векторы (например, неэписомные векторы млекопитающих) интегрируют в геном клетки-хозяина после введения в клетку-хозяина, и таким образом, реплицируются вместе с геномом хозяина. Кроме того, конкретные векторы являются способными управлять экспрессией генов, с которыми они функционально связаны. Такие векторы обозначены в настоящем описании как «экспрессирующие векторы». Общепринятые экспрессирующие векторы для использования в способах рекомбинантной ДНК часто находятся в форме плазмид. Дополнительное обсуждение векторов представлено в настоящем описании.
[00122] Рекомбинантные экспрессирующие векторы могут содержать нуклеиновую кислоту по изобретению в форме, пригодной для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные экспрессирующие векторы включают один или несколько регуляторных элементов, которые можно выбирать на основании клеток-хозяев, подлежащих использованию для экспрессии, которые являются функционально связанными с последовательностью нуклеиновой кислоты, подлежащей экспрессии. В рекомбинантном экспрессирующем векторе, «функционально связанный» предназначен для обозначения того, что представляющая интерес нуклеотидная последовательность связана с регуляторным элементом(элементами) таким образом, который позволяет экспрессию нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине, когда вектор введен в клетку-хозяина). Применительно к способам рекомбинации и клонирования, приведено упоминание Патентной заявки США сер. No. 10/815730, опубликованной. 2 сентября 2004 г. как US 2004-0171156 A1, полное содержание которых приведено в настоящем описании в качестве ссылки.
[00123] В некоторых вариантах осуществления, регуляторный элемент является функционально связанным с одним или несколькими элементами системы поддающейся нацеливанию нуклеазы, таким образом, чтобы управлять экспрессией одного или нескольких компонентов системы поддающейся нацеливанию нуклеазы.
[00124] В некоторых вариантах осуществления, вектор содержит регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей направляемую нуклеиновой кислотой нуклеазу. Полинуклеотидная последовательность, кодирующая направляемую нуклеиновой кислотой нуклеазу, может иметь оптимизированный кодонный состав для экспрессии в конкретных клетках, таких как прокариотические или эукариотические клетки. Эукариотические клетки могут представлять собой клетки дрожжей, грибов, водорослей, растений, животных или человека. Эукариотические клетки могут представлять собой клетки из или происходящие из конкретного организма, такого как млекопитающее, включая, но без ограничения, человека, мышь, крысу, кролика, собаку или не относящегося к человеку млекопитающего, включая не относящегося к человеку примата.
[00125] Как правило, оптимизация кодонного состава относится к способу модификации последовательности нуклеиновой кислоты для улучшения экспрессии в представляющих собой клетках-хозяевах посредством замены по меньшей мере одного кодона (например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) природной последовательности на кодоны, более часто или наиболее часто используемые в генах клетки-хозяина, в то же время сохраняя природную аминокислотную последовательность. Для различных видов показан определенный сдвиг предпочтения конкретных кодонов для конкретной аминокислоты. Сдвиг предпочтения кодонов (различие использования кодонов между организмов) часто коррелирует с эффективностью трансляции матричной РНК (мРНК), которая, как считают, зависит, среди прочего, от свойств кодонов, подвергаемых трансляции, и доступности конкретных молекул транспортной РНК (тРНК). Предпочтительность избранных тРНК в клетке, как правило, является отражением кодонов, наиболее часто используемых в синтезе пептидов. Соответственно, гены можно корректировать для оптимальной экспрессии гена в данном организме на основании оптимизации кодонного состава. Таблицы использования кодонов являются легко доступными, например, в «Codon Usage Database», доступной на www.kazusa.orjp/codon/ (просмотрено 9 июля 2002 г.), и эти таблицы можно адаптировать рядом способов. См. Nakamura, Y., et al. «Codon usage tabulated from the international DNA sequence databases: status for the year 2000» Nucl. Acids Res. 28:292 (2000). Доступны также алгоритмы для оптимизации кодонного состава конкретной последовательности для экспрессии в конкретной клетке-хозяине, такие как Gene Forge (Aptagen; Jacobus, Pa.). В некоторых вариантах осуществления, один или несколько кодонов (например, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более, или все кодоны) в последовательности, кодирующей сконструированную нуклеазу, соответствуют наиболее часто используемому кодону для конкретной аминокислоты.
[00126] В некоторых вариантах осуществления, вектор кодирует направляемую нуклеиновой кислотой нуклеазу, содержащую одну или несколько последовательностей ядерной локализации (NLS), например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. В некоторых вариантах осуществления, сконструированная нуклеаза содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS, на амино-конце или около него, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS, на карбокси-конце или около него, или их комбинацию (например, один или несколько NLS на амино-конце и один или несколько NLS на карбокси-конце). Когда присутствуют более одного NLS, каждый можно выбирать независимо от других, так что один NLS может присутствовать в более чем одной копии, и/или в комбинации с одним или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления изобретения, сконструированная нуклеаза содержит, самое большее, 6 NLS. В некоторых вариантах осуществления, NLS рассматривают как находящийся около N- или C-конца, когда ближайшая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот на протяжении полипептидной цепи от N- или C-конца. Неограничивающие примеры NLS включают последовательности NLS, происходящие из: NLS большого Т-антигена вируса SV40, имеющего аминокислотную последовательность PKKKRKV (SEQ ID NO: 111); NLS из нуклеоплазмина (например, двухчастного NLS нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK (SEQ ID NO:112)); NLS c-myc, имеющего аминокислотную последовательность PAAKRVKLD (SEQ ID NO:113) или RQRRNELKRSP (SEQ ID NO:114); NLS hRNPA1 M9, имеющего последовательность NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 115); последовательности RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO:1 116) домена IBB импортина-альфа; последовательностей VSRKRPRP (SEQ ID NO:117) и PPKKARED (SEQ ID NO:118) из Т-белка миомы; последовательности PQPKKKPL (SEQ ID NO:119) из p53 человека; последовательности SALIKKKKKMAP (SEQ ID NO:120) из c-abl IV мыши; последовательностей DRLRR (SEQ ID NO:121) и PKQKKRK (SEQ ID NO:122) из вируса гриппа NS1; последовательности RKLKKKIKKL (SEQ ID NO:123) из антигена вируса гепатита дельта; последовательности REKKKFLKRR (SEQ ID NO: 124) из белка Mxl мыши; последовательности KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 125) из полимеразы поли(АДФ-рибозы) человека; и последовательности RKCLQAGMNLEARKTKK (SEQ ID NO: 126) из глюкокортикоидных рецепторов стероидных гормонов (человека).
[00127] Как правило, один или несколько NLS имеют достаточную силу, чтобы приводить к накоплению направляемой нуклеиновой кислотой нуклеазы в поддающемся детекции количестве в ядре эукариотической клетки. Как правило, сила активности ядерной локализации может быть обусловлена количеством NLS, конкретными используемыми NLS(несколькими NLS) или комбинацией этих факторов. Детекцию накопления в ядре можно осуществлять любым пригодным способом. Например, поддающийся детекции маркер можно сливать с направляемой нуклеиновой кислотой нуклеазой, таким образом, чтобы можно было визуализировать локализацию внутри клетки, например, в комбинации со средствами для детекции локализации ядра (например, красителя, специфического для ядра, такого как DAPI). Можно также выделять из клеток ядра клеток, содержимое которых можно затем анализировать любым пригодным способом детекции белка, таким как иммуногистохимия, Вестерн-блоттинг или анализ активности фермента. Накопление в ядре можно также определять опосредованно, например, посредством анализа эффекта формирования комплекса направляемой нуклеиновой кислотой нуклеазы (например, анализа расщепления или мутации ДНК в последовательности-мишени, или анализа измененной активности экспрессии гена, подверженной влиянию формирования комплекса способной к нацеливанию нуклеазы и/или активности направляемой нуклеиновой кислотой нуклеазы), по сравнению с контролем, не подвергавшимся воздействию направляемой нуклеиновой кислотой нуклеазы или комплекса способной к нацеливанию нуклеазы, или подвергавшимся воздействию направляемой нуклеиновой кислотой нуклеазы, лишенной одного или нескольких NLS.
[00128] Направляемую нуклеиновой кислотой нуклеазу и одну или несколько направляющих нуклеиновых кислот можно доставлять в форме либо ДНК, либо РНК. Доставку как направляемой нуклеиновой кислотой нуклеазы, так и направляющей нуклеиновой кислоты в форме молекул РНК (немодифицированных или содержащих модификации оснований или остова) можно использовать для уменьшения времени, в течение которого направляемая нуклеиновой кислотой нуклеаза персистирует в клетке. Это может уменьшать уровень активности неспецифического расщепления в клетке-мишени. Поскольку доставка направляемой нуклеиновой кислотой нуклеазы в форме мРНК занимает время для трансляции в белок, может обеспечивать преимущество доставка направляющей нуклеиновой кислоты через несколько часов после доставки мРНК направляемой нуклеиновой кислотой нуклеазы, для максимизации уровня направляющей нуклеиновой кислоты, доступной для взаимодействия с белком направляемой нуклеиновой кислотой нуклеазы. В других случаях, мРНК направляемой нуклеиновой кислотой нуклеазы и направляющую нуклеиновую кислоту доставляют одновременно. В других примерах, направляющую нуклеиновую кислоту доставляют последовательно, например, через 0,5, 1, 2, 3, 4 или более часов после мРНК направляемой нуклеиновой кислотой нуклеазы.
[00129] В ситуациях, где количество направляющей нуклеиновой кислоты является ограничивающим, может являться желательным введение направляемой нуклеиновой кислотой нуклеазы в форме мРНК и направляющей нуклеиновой кислоты - в форме экспрессирующей кассеты ДНК с промотором, управляющим экспрессией направляющей нуклеиновой кислоты. Таким образом, количество доступной направляющей нуклеиновой кислоты может умножаться посредством транскрипции.
[00130] Направляющую нуклеиновую кислоту, в форме РНК или кодированную экспрессирующей кассетой ДНК, можно вводить в клетку-хозяина, содержащую направляемую нуклеиновой кислотой нуклеазу, кодированную в векторе или хромосоме. Направляющую нуклеиновую кислоту можно предоставлять в кассете из одного или нескольких полинуклеотидов, которые могут являться непрерывными или не непрерывными в кассете. В конкретных вариантах осуществления, направляющая нуклеиновая кислота предоставлена в кассете в форме одного непрерывного полинуклеотида.
[00131] Множество систем доставки можно использовать для введения направляемой нуклеиновой кислотой нуклеазы (ДНК или РНК) и направляющей нуклеиновой кислоты (ДНК или РНК) в клетку-хозяина. Они включают использование систем дрожжей, систем липофекции, систем микроинъекции, биолистических систем, виросом, липосом, иммунолипосом, поликатионов, конъюгатов липид:нуклеиновая кислота, вирионов, искусственных вирионов, вирусных векторов, электропорации, проникающих в клетку пептидов, наночастиц, нанопроволок (Shalek et al., Nano Letters, 2012), экзосом. Липосомы с использованием молекулярной технологии «троянского коня» (Pardridge et al., Cold Spring Harb Protoc; 2010; doi:10.1101/pdb.prot5407) можно использовать для доставки сконструированной нуклеазы и направляющей нуклеиновой кислоты через гематоэнцефалический барьер.
[00132] В некоторых вариантах осуществления, настоящее изобретение относится также к редактирующей матрице. Редактирующая матрица может являться компонентом вектора, как описано в настоящем описании, может содержаться в отдельном векторе или может быть предоставлена в форме отдельного полинуклеотида, такого как олигонуклеотид, линейный полинуклеотид или синтетический полинуклеотид. В некоторых случаях, редактирующая матрица находится в том же самом полинуклеотиде, что и направляющая нуклеиновая кислота. В некоторых вариантах осуществления, редактирующая матрица сконструирована, чтобы служить в качестве матрицы при гомологичной рекомбинация, например, внутри или около последовательности-мишени, подвергнутой внесению разрывов или расщеплению посредством направляемой нуклеиновой кислотой нуклеазы, в качестве части комплекса, как описано в настоящем описании. Полинуклеотид редактирующей матрицы может иметь любую подходящую длину, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 или более нуклеотидов. В некоторых вариантах осуществления, полинуклеотид редактирующей матрицы является комплементарным части полинуклеотида, содержащей последовательность-мишень. При оптимальном выравнивании, полинуклеотид редактирующей матрицы может перекрываться с одним или несколькими нуклеотидами из последовательностей-мишеней (например, приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40 или более нуклеотидами). В некоторых вариантах осуществления, когда последовательность редактирующей матрицы и полинуклеотид, содержащий последовательность-мишень, оптимально выровнены, ближайший нуклеотид из полинуклеотида матрицы находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от последовательности-мишени.
[00133] Во многих примерах, редактирующая матрица содержит по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью. Редактирующая матрица может содержать вставку, делецию, модификацию или любую их комбинацию, по сравнению с последовательностью-мишенью. Примеры некоторых редактирующих матриц описаны более подробно в более позднем разделе.
[00134] В некоторых аспектах, настоящее изобретение относится к способам, включающим доставку одного или нескольких полинуклеотидов, таких как или один или несколько векторов или линейных полинуклеотидов, как описано в настоящем описании, одного или нескольких их транскриптов, и/или одного или нескольких транскрибированных с них белков, в клетку-хозяина. В некоторых аспектах, изобретение, кроме того, относится к клеткам, полученным такими способами, и к организмам, содержащим такие клетки или полученным из таких клеток. В некоторых вариантах осуществления, сконструированную нуклеазу в комбинации с (и необязательно в комплексе с) направляющей нуклеиновой кислотой доставляют в клетку.
[00135] Общепринятые основанные на вирусах и невирусные способы переноса генов можно использовать для введения нуклеиновых кислот в клетки, такие как клетки прокариот, клетки эукариот, клетки млекопитающих или ткани-мишени. Такие способы можно использовать для введения кодирующих компонентов нуклеиновые кислоты сконструированной системы направляемой нуклеиновой кислотой нуклеазы в клетки в культуре или в организм хозяина. Системы доставки невирусных векторов включают ДНК-плазмиды, РНК (например, транскрипт вектора, описанного в настоящем описании), голую нуклеиновую кислоту и нуклеиновую кислоту в комплексе с носителем для доставки, таким как липосома. Системы доставки вирусных векторов включают ДНК- и РНК-вирусы, имеющие либо эписомные, либо интегрированные геномы после доставки в клетку. Обзор способов генотерапии см. в Anderson, Science 256:808-813 (1992); Nabel & Feigner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon. TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bohm (eds) (1995); и Yu et al., Gene Therapy 1:13-26 (1994).
[00136] Способы невирусной доставки нуклеиновых кислот включают липофекцию, микроинъекцию, баллистические способы, использование виросом, липосом, иммунолипосом, конъюгатов поликатион или липид:нуклеиновая кислота, голой ДНК, искусственных вирионов и усиленное агентом поглощение ДНК. Липофекция описана, например, в Патентах США No. 5049386, 4946787; и 4897355) и реагенты для липофекции продают на коммерческой основе (например, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, также пригодные для эффективной липофекции полинуклеотидов с узнаванием рецепторов, включают описанные в Felgner, WO 91/17424; WO 91/16024. Доставку можно осуществлять в клетки (например, введение in vitro или ex vivo) или в ткани-мишени (например, введение in vivo).
[00137] Получение комплексов липид:нуклеиновая кислота комплексы, включая нацеленные липосомы, такие как иммунолипидные комплексы, хорошо известно специалисту в данной области (см., например, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); Патенты США No. 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).
[00138] При применении систем на основе РНК- и ДНК-вирусов для доставки нуклеиновых кислот используют преимущества тщательно разработанных способов нацеливания вируса на специфические клетки в культуре или в организме хозяина и переноса вирусной нагрузки в ядро или геном клетки-хозяина. Вирусные векторы можно вводить напрямую в клетки в культуре, пациентам (in vivo), или их можно использовать для обработки клеток in vitro, и модифицированные клетки можно, необязательно вводить пациентам (ex vivo). Общепринятые системы на основе вирусов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса для переноса генов. Интеграция в геном хозяина возможна с использованием способов переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к долгосрочной экспрессии вставленного трансгена. Кроме того, высокую эффективность трансдукции наблюдали для многих различных типов клеток и тканей-мишеней.
[00139] Тропизм ретровируса можно изменять посредством включения чужеродных белков оболочки с расширением возможной целевой популяции клеток-мишеней. Лентивирусные векторы представляют собой ретровирусные векторы, которые способны трансдуцировать или инфицировать неделящиеся клетки и, как правило, образуют высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, может зависеть от ткани-мишени. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей емкостью до 6-10 т.п.о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в клетку-мишень с получением постоянной экспрессии трансгена. Широко применяемые ретровирусные векторы включают векторы на основе вируса лейкоза мышей (MuLV), вируса лейкоза гиббонов (GaLV), вируса иммунодефицита обезьян (SIV), вируса иммунодефицита человека (HIV) и их комбинаций (см., например, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700).
[00140] В применениях, в которых временная экспрессия является предпочтительной, можно использовать системы на основе аденовирусов. Векторы на основе аденовирусов способны обеспечивать очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С использованием таких векторов были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе.
[00141] Аденоассоциированные вирусные («AAV») векторы также можно использовать для трансдукции клеток целевыми нуклеиновыми кислотами, например, при получении in vitro нуклеиновых кислот и пептидов, и для способов генотерапии in vivo и ex vivo (см., например, West et al., Virology 160:38-47 (1987); Патент США No. 4797368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Конструирование рекомбинантных векторов AAV описано в ряде публикаций, включая Патент США No. 5173414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); и Samulski et al., J. Virol. 63:03822-3828 (1989).
[00142] В некоторых вариантах осуществления, клетку-хозяина временно или стабильно трансфицируют одним или несколькими векторами, линейными полинуклеотидами, полипептидами, комплексами нуклеиновая кислота-белок, или любой их комбинацией, как описано в настоящем описании. В некоторых вариантах осуществления, клетку трансфицируют in vitro, в культуре или ex vivo. В некоторых вариантах осуществления, клетку трансфицируют таким образом, как это в естественных условиях происходит у субъекта. В некоторых вариантах осуществления, клетка, которую трансфицируют, отобрана у субъекта. В некоторых вариантах осуществления, клетка происходит из клеток, отобранных у субъекта, таких как линия клеток.
[00143] В некоторых вариантах осуществления, клетку, трансфицированную одним или несколькими векторами, линейными полинуклеотидами, полипептидами, комплексами нуклеиновая кислота-белок, или любой их комбинацией, как описано в настоящем описании, используют для получения новой линии клеток, содержащей одну или несколько полученных при трансфекции последовательностей. В некоторых вариантах осуществления, клетку, временно трансфицированную компонентами сконструированной системы направляемой нуклеиновой кислотой нуклеазы, как описано в настоящем описании (например, посредством временной трансфекции одним или несколькими векторами, или трансфекции с использованием РНК), и модифицированную посредством активности комплекса сконструированной нуклеазы, используют для получения новой линии клеток, содержащей клетки, которые содержат модификацию, но у которых отсутствует любая другая экзогенная последовательность.
[00144] В некоторых вариантах осуществления, один или несколько векторов, описанных в настоящем описании, используют для получения не относящихся к человеку трансгенных клетки, организма, животного или растения. В некоторых вариантах осуществления, трансгенное животное представляет собой млекопитающее, такое как мышь, крыса или кролик. Способы получения трансгенных клеток, организмов, растений и животных известны в данной области, и как правило, начинаются со способа трансформации или трансфекции клетки, такого как описано в настоящем описании.
[00145] События неспецифического расщепления можно анализировать с использованием способов, описанных в настоящем описании. События неспецифического расщепления могут представлять собой события расщепления, которые происходят в локализации в последовательности нуклеиновой кислоты, отличной от целевой последовательности-мишени, таким образом, делая ее нецелевой последовательностью-мишенью. Как правило, можно получать библиотеку векторов, как описано в настоящем описании, где указанный вектор содержит последовательность-мишень или нецелевую последовательность-мишень, смежную с последовательностью PAM. В библиотеке таких векторов, последовательность-мишень или нецелевую последовательность-мишень можно изменять между различными векторами, таким образом, чтобы множество различных последовательностей-мишеней или нецелевых последовательностей-мишеней можно было подвергать скринингу или тестированию в пределах одного эксперимента, или высокопроизводительным способом. Указанный вектор может содержать штрих-код или другой уникальный идентификатор, позволяющий идентификацию последовательности-мишени или нецелевой последовательности-мишени, подлежащих тестированию. Указанный вектор может содержать селективный маркер или позволяющий скрининг маркер. Указанный вектор может содержать направляющую последовательность нуклеиновой кислоты. Указанная направляющая нуклеиновая кислота может содержать нацеливающую последовательность, способную к нацеливанию на совместимые последовательности-мишени внутри вектора. Указанная направляющая нуклеиновая кислота может содержать каркасную последовательность. Библиотеку векторов можно затем вводить в клетки-хозяева, где указанные клетки-хозяева содержат рассматриваемую нуклеазу. Указанную рассматриваемую нуклеазу можно экспрессировать с того же или отличного вектора, который вводят в клетку одновременно, до или после вектора с направляющей нуклеиновой кислотой. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме транскрипта мРНК. В других случаях, рассматриваемую нуклеазу можно вводить в клетку в форме белка. Без намерения быть связанными с теорией, внутри каждой клетки, направляющая нуклеиновая кислота может экспрессироваться и может формировать комплекс с рассматриваемой нуклеазой. Тогда направляющая нуклеиновая кислота может нацеливать нуклеазу на совместимые последовательности-мишени. В некоторых случаях, если направляющая нуклеиновая кислота способна гибридизоваться с последовательностью-мишенью или нецелевой последовательностью-мишенью, тогда рассматриваемая нуклеаза может расщеплять последовательность-мишень или нецелевую последовательность-мишень. Это событие расщепления может заставлять клетку-хозяина терять вектор, содержащий последовательность-мишень, или терять функцию селективного маркера или позволяющего скрининг маркера, и таким образом, клетка-хозяин может погибать под действием отбора или может быть потеряна в ходе скрининга. С другой стороны, если направляющая нуклеиновая кислота не способна гибридизоваться с нецелевой последовательностью-мишенью, тогда нецелевая последовательность-мишень не может подвергаться расщеплению, и таким образом, клетка-хозяин может сохранять селективный или позволяющий скрининг маркер. Посредством сравнения входных векторов с полученными в результате отбора или скрининга векторами из выживших или отобранных на выходе клеток-хозяев, можно идентифицировать векторы, подвергнутые истощению. Посредством секвенирования или анализа штрих-кода или уникального идентификатора входных векторов и выходных векторов, можно идентифицировать штрих-коды или уникальные идентификаторы, подвергнутые истощению, что может позволять идентификацию последовательностей-мишеней или нецелевых последовательностей-мишеней, подвергнутых истощению. Подвергнутые истощению последовательности-мишени или нецелевые последовательности-мишени могут включать последовательности, которые являлись способными гибридизоваться с направляющей нуклеиновой кислотой, и таким образом, являлись способными подвергаться расщеплению посредством рассматриваемой нуклеазы. Подвергнутые истощению нецелевые последовательности-мишени могли содержать события неспецифического расщепления или неспецифические последовательности, которые являлись способными подвергаться расщеплению посредством рассматриваемой системы нуклеазы.
[00146] Нецелевые последовательности-мишени, подлежащие тестированию или скринингу в анализах неспецифического взаимодействия, описанных в настоящем описании, могут представлять собой варианты известной последовательности-мишени, способные подвергаться нацеливанию посредством рассматриваемой направляющей нуклеиновой кислоты. Например, с использованием известной представляющей интерес последовательности-мишени, можно конструировать нецелевые последовательности-мишени, чтобы они содержали вставки, делеции, реаранжировки или другие изменения последовательности, по сравнению с известной последовательностью-мишенью. Такие изменения последовательности могут включать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более нуклеотидов. Измененные нуклеотиды могут являться непрерывными или не непрерывными.
[00147] Способы расчета и оценки истощения, как описано ранее, являются применимыми также для расчета и оценки истощения в этих случаях.
[00148] Другие анализы для оценки неспецифического взаимодействия включают секвенирование генома организма-хозяина для идентификации событий неспецифического расщепления, которые часто поддаются идентификации посредством мутаций в последовательности, таких как вставка, делеция и мутация одного или нескольких нуклеотидов. Эти другие способы, таким образом, ограничены последовательностью генома клетки-хозяина при оценке неспецифических эффектов рассматриваемой системы нуклеазы. Рассматриваемые анализы, описанные в настоящем описании, обеспечивают намного более надежный и высокопроизводительный способ идентификации неспецифических эффектов фактически для любой последовательности и без ограничения последовательностью генома клетки-хозяина.
Способы применения
[00149] В контексте формирования комплекса сконструированной нуклеазы, «последовательность-мишень» относится к последовательности, для наличия комплементарности с которой сконструирована направляющая последовательность, где гибридизация между последовательностью-мишенью и направляющей последовательности способствует формированию комплекса сконструированной нуклеазы. Последовательность-мишень может включать любой полинуклеотид, такой как ДНК, РНК или гибрид ДНК-РНК. Последовательность-мишень может быть локализована в ядре или цитоплазме клетки. Последовательность-мишень может быть локализована in vitro или в бесклеточной среде.
[00150] Как правило, формирование комплекса сконструированной нуклеазы, содержащего направляющую нуклеиновую кислоту, гибридизованную с последовательностью-мишенью, и в комплексе с одной или несколькими сконструированными нуклеазами, как описано в настоящем описании, приводит к расщеплению одной или обеих цепей в или около (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований от) последовательности-мишени. Расщепление может происходить внутри последовательности-мишени, на 5’ от последовательности-мишени, выше последовательность-мишень, на 3’ от последовательности-мишени, или ниже последовательности-мишени.
[00151] В некоторых вариантах осуществления, один или несколько векторов, управляющих экспрессией одного или нескольких компонентов системы поддающейся нацеливанию нуклеазы, вводят в клетку-хозяина или in vitro, таким образом, формируя комплекс способной к нацеливанию нуклеазы на одном или нескольких участках-мишенях. Например, каждая из направляемой нуклеиновой кислотой нуклеазы и направляющей нуклеиновой кислоты может являться функционально связанной с отдельными регуляторными элементами в отдельных векторах. Альтернативно, два или более из элементов, экспрессированные с одинаковых или различных регуляторных элементов, можно объединять в одном векторе, где один или несколько дополнительных векторов предоставляют любые компоненты системы поддающейся нацеливанию нуклеазы, не включенные в первый вектор. Элементы системы поддающейся нацеливанию нуклеазы, объединенные в одном векторе, могут быть аранжированы в любой подходящей ориентации, например, один элемент локализован на 5' от («выше») или на 3' от («ниже») второго элемента. Кодирующая последовательность одного элемента может быть локализована на той же самой или противоположной цепи, по отношению к кодирующей последовательности второго элемента, и может быть ориентирована в том же самом или противоположном направлении. В некоторых вариантах осуществления, один промотор управляет экспрессией транскрипта, кодирующего направляемую нуклеиновой кислотой нуклеазу и одну или несколько направляющих нуклеиновых кислот. В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза и одна или несколько направляющих нуклеиновых кислот являются функционально связанными с одним и тем же промотором и экспрессируются с одного и того же промотора. В других вариантах осуществления, один или несколько направляющие нуклеиновые кислоты или полинуклеотиды, кодирующие одну или несколько направляющих нуклеиновых кислот, вводят в клетку или окружение in vitro, уже содержащие направляемую нуклеиновой кислотой нуклеазу или полинуклеотидную последовательность, кодирующую направляемую нуклеиновой кислотой нуклеазу.
[00152] При использовании множества различных направляющих последовательностей, одну экспрессирующую конструкцию можно использовать для нацеливания активности нуклеаза на множество различных, соответствующих последовательностей-мишеней в клетке или in vitro. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или более направляющих последовательностей. В некоторых вариантах осуществления, можно получать векторы, содержащие приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более таких направляющих последовательностей, и необязательно, доставлять в клетку или in vitro.
[00153] Способы и композиции, описанные в настоящем описании, могут включать более одной направляющей нуклеиновой кислоты, где каждая направляющая нуклеиновая кислота имеет отличную направляющая последовательность, таким образом, осуществляя нацеливание на отличную последовательность-мишень. В таких случаях, множество направляющих нуклеиновых кислот можно использовать в мультиплексном формате, где множество мишеней подвергают нацеливанию одновременно. Дополнительно или альтернативно, множество направляющих нуклеиновых кислот вводят в популяцию клеток, таким образом, что в каждую клетку в популяции вводят отличную или случайную направляющую нуклеиновую кислота, таким образом, осуществляя нацеливание на множество различных последовательностей-мишеней в популяции клеток. В таких случаях, коллекция измененных впоследствии клеток может быть обозначена как библиотека.
[00154] Способы и композиции, описанные в настоящем описании, могут включать множество различных направляемых нуклеиновыми кислотами нуклеаз, каждая с одной или несколькими различными соответствующими направляющими нуклеиновыми кислотами, таким образом, обеспечивая нацеливание на различные последовательности-мишени различных направляемых нуклеиновыми кислотами нуклеаз. В некоторых таких случаях, каждая направляемая нуклеиновой кислотой нуклеаза может соответствовать отдельному множеству направляющих нуклеиновых кислот, обеспечивая два или более неперекрывающихся, частично перекрывающихся или полностью перекрывающихся мультиплексных событий.
[00155] В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза имеет активность расщепления ДНК или активность расщепления РНК. В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза направлена на расщепление одной или обеих цепей в локализации последовательности-мишени, например, внутри последовательности-мишени и/или внутри последовательности, комплементарной последовательности-мишени. В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза направлена на расщепление одной или обеих цепей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида последовательности-мишени.
[00156] В некоторых вариантах осуществления, направляемая нуклеиновой кислотой нуклеаза может формировать компонент индуцируемой системы. Индуцируемый характер системы может обеспечивать пространственно-временной контроль редактирования гена или экспрессии гена с использованием некоторой формы энергии. Форма энергии может включать, но без ограничения электромагнитное излучение, звуковую энергию, химическую энергию, световую энергию, температуру и тепловую энергию. Примеры индуцируемой системы включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), низкомолекулярные двухгибридные системы активации транскрипции (FKBP, ABA и т.д.), или индуцируемые светом системы (фитохром, домены LOV или криптохром). В одном варианте осуществления, направляемая нуклеиновой кислотой нуклеаза может являться частью индуцируемого светом эффектора транскрипции (LITE) для управления изменениями активности транскрипции специфическим для последовательности образом. Компоненты индуцируемой светом системы могут включать направляемую нуклеиновой кислотой нуклеазу, светочувствительный гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых связывающих ДНК белков и способы их использования представлены в U.S. 61/736465 и U.S. 61/721283, полное содержание которых, таким образом, приведено в качестве ссылки. Индуцируемая система может являться индуцируемой температурой, таким образом, что система включается или выключается при увеличении или уменьшении температуры. В некоторых индуцируемых температурой системах, увеличение температуры включает систему. В некоторых индуцируемых температурой системах, увеличение температуры выключает систему.
[00157] В некоторых аспектах, настоящее изобретение относится к способам модификации последовательности-мишени in vitro, или в клетке прокариот или эукариот, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления, способ включает получение образцов клетки или популяции клеток таких как прокариотические клетки, или клетки человека или не относящегося к человеку животного или растения (включая микроводоросли), и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии in vitro или ex vivo. Клетку или клетки можно даже повторно вводить хозяину, такому как не относящееся к человеку животное или растение (включая микроводоросли). Для повторно введенных клеток, является особенно предпочтительным, чтобы клетки представляли собой стволовые клетки.
[00158] В некоторых вариантах осуществления, способ включает обеспечение связывания комплекса способной к нацеливанию нуклеазы с последовательностью-мишенью для осуществления расщепления указанной последовательности-мишени, таким образом, модификации последовательности-мишени, где комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу в комплексе с направляющей нуклеиновой кислотой где направляющая последовательность направляющей нуклеиновой кислоты гибридизуется с последовательностью-мишенью внутри полинуклеотида-мишени.
[00159] В некоторых аспектах, настоящее изобретение относится к способу модификации экспрессии полинуклеотида-мишени in vitro или в прокариотической или эукариотической клетке. В некоторых вариантах осуществления, способ включает обеспечение связывания комплекса способной к нацеливанию нуклеазы с последовательностью-мишенью внутри полинуклеотида-мишени, таким образом, что указанное связывание приводит к увеличению или уменьшению экспрессии указанного полинуклеотида-мишени; где комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу в комплексе с направляющая нуклеиновая кислота, и где направляющая последовательность направляющей нуклеиновой кислоты гибридизуется с последовательностью-мишенью внутри указанного полинуклеотида-мишени. Сходные соображения применимы, как выше, к способам модификации полинуклеотида-мишени. Фактически, эти варианты отбора образцов, культивирования и повторного введения применимы среди аспектов настоящего изобретения.
[00160] В некоторых аспектах, настоящее изобретение относится к наборам, содержащим любой один или несколько элементов, описанных в вышеуказанных способах и композициях. Элементы можно предоставлять индивидуально или в комбинациях, и можно предоставлять в любом пригодном контейнере, таком как a флакон, бутыль или пробирка. В некоторых вариантах осуществления, набор включает инструкции на одном или нескольких языках, например, на более, чем одном языке.
[00161] В некоторых вариантах осуществления, набор содержит один или несколько реагентов для использования в способе, в котором используют один или несколько элементов, описанных в настоящем описании. Реагенты могут быть предоставлены в любом пригодном контейнере. Например, набор может предоставлять один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, применимой в конкретном анализе, или в форме, требующей добавления одного или нескольких других компонентов перед использованием (например, в форме концентрата или в лиофилизированной форме). Буфер может представлять собой любой буфер, включая, но без ограничения, буфер карбонат натрия, буфер бикарбонат натрия, боратный буфер, буфер Трис, буфер MOPS, буфер HEPES буфер и их комбинации. В некоторых вариантах осуществления, буфер является щелочным. В некоторых вариантах осуществления, буфер имеет pH от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления, набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для вставки в вектор таким образом, чтобы функционально связывать направляющую последовательность и регуляторный элемент. В некоторых вариантах осуществления, набор содержит редактирующую матрицу.
[00162] В некоторых аспектах, настоящее изобретение относится к способам использования одного или нескольких элементов сконструированной системы поддающейся нацеливанию нуклеазы. Комплекс способной к нацеливанию нуклеазы по настоящему изобретению обеспечивает эффективные средства для модификации последовательности-мишени внутри полинуклеотида-мишени. Комплекс способной к нацеливанию нуклеазы по настоящему изобретению имеет широкое разнообразие применений, включая модификацию (например, делению, вставку, транслокацию, инактивацию, активацию) последовательности-мишени во множестве типов клеток. Комплекс способной к нацеливанию нуклеазы по изобретению как таковой имеет широкий спектр применений, например, в оптимизации биохимических путей, полногеномных исследованиях, геномной инженерии, генотерапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс способной к нацеливанию нуклеазы содержит направляемую нуклеиновой кислотой нуклеазу, как описано в настоящем описании, в комплексе с направляющей нуклеиновой кислотой, где направляющая последовательность направляющей нуклеиновой кислоты может гибридизоваться с последовательностью-мишенью внутри полинуклеотида-мишени. Направляющая нуклеиновая кислота может содержать направляющую последовательность, соединенную с каркасной последовательностью. Каркасная последовательность может содержать одну или несколько областей последовательности с такой степенью комплементарности, что они совместно могут формировать вторичную структуру. В некоторых случаях, одна или несколько областей последовательности заключены или кодированы в одном и том же полинуклеотиде. В некоторых случаях, одна или несколько областей последовательности заключены или кодированы в разных полинуклеотидах.
[00163] Настоящее изобретение относится к способам расщепления полинуклеотида-мишени. Способ включает расщепление полинуклеотида-мишени с использованием комплекса способной к нацеливанию нуклеазы, который связывается с последовательностью-мишенью внутри полинуклеотида-мишени и осуществляет расщепление указанного полинуклеотида-мишени. Как правило, комплекс способной к нацеливанию нуклеазы по изобретению, при введении в клетку, образует разрыв (например, одно- или двухцепочечный разрыв) в последовательности-мишени. Например, способ можно использовать для расщепления гена-мишени в клетке, или для замены последовательности дикого типа на модифицированную последовательность.
[00164] Разрыв, образованный посредством комплекса способной к нацеливанию нуклеазы, может подвергаться репарации посредством процессов репарации, таких как имеющий пониженную точность путь соединения негомологичных концов (NHEJ), имеющая высокую точность направляемая гомологией репарация (HDR), или посредством путей рекомбинации. В ходе этих процессов репарации, редактирующую матрицу можно вводить в последовательность генома. В некоторых способах, процесс HDR или рекомбинации используют для модификации последовательности-мишени. Например, редактирующую матрицу, содержащую последовательность, подлежащую интеграции, фланкированную вышележащей последовательностью и нижележащей последовательностью, вводят в клетку. Вышележащие и нижележащие последовательности разделяют сходство последовательности с каждой стороны участка интеграции в хромосоме, целевом векторе или полинуклеотиде-мишени.
[00165] Редактирующая матрица может представлять собой ДНК или РНК, например, ДНК-плазмиду, искусственную хромосому бактерий (BAC), искусственную хромосому дрожжей (YAC), вирусный вектор, линейный фрагмент ДНК, фрагмент продукта ПЦР, олигонуклеотид, синтетический полинуклеотид, голую нуклеиновую кислоту или нуклеиновую кислоту в комплексе с носителем для доставки, таким как липосома или полоксамер.
[00166] Полинуклеотид редактирующей матрицы может содержать последовательность, подлежащую интеграции, (например, мутантный ген). Последовательность для интеграции может представлять собой последовательность, эндогенную или экзогенную для клетки. Примеры последовательности, подлежащей интеграции, включают полинуклеотиды, кодирующие белок, или некодирующую РНК (например, микроРНК). Таким образом, последовательность для интеграции могут являться функционально связанными с соответствующей контрольной последовательностью или последовательностями. Альтернативно, последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию. Последовательность, подлежащая интеграции может представлять собой мутант или вариант эндогенной последовательности дикого типа. Альтернативно, последовательность, подлежащая интеграции, может представлять собой вариант дикого типа эндогенной мутантной последовательности. Дополнительно или альтернативно последовательность, подлежащая интеграции, может представлять собой вариант или мутантную форму эндогенного мутанта или варианта последовательности.
[00167] Вышележащие и нижележащие последовательности в полинуклеотиде редактирующей матрицы можно выбирать, чтобы способствовать рекомбинации между представляющим собой интерес полинуклеотидом-мишенью и полинуклеотидом редактирующей матрицы. Вышележащая последовательность может представлять собой последовательность нуклеиновой кислоты, имеющую сходство последовательности с последовательностью выше целевого участка для интеграции. Подобным образом, нижележащая последовательность может представлять собой последовательность нуклеиновой кислоты, имеющую сходство последовательности с последовательностью ниже целевого участка для интеграции. Вышележащие и нижележащие последовательности в редактирующей матрице могут иметь 75%, 80%, 85%, 90%, 95% или 100% идентичность последовательности с целевым полинуклеотидом. Предпочтительно, вышележащие и нижележащие последовательности в полинуклеотиде редактирующей матрицы имеют приблизительно 95%, 96%, 97%, 98%, 99% или 100% идентичность последовательности с целевым полинуклеотидом. В некоторых способах, вышележащие и нижележащие последовательности в полинуклеотиде редактирующей матрицы имеют приблизительно 99% или 100% идентичность последовательности с целевым полинуклеотидом.
[00168] Вышележащая или нижележащая последовательность может содержать от приблизительно 20 п.о. до приблизительно 2500 п.о., например, приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п.о. В некоторых способах, иллюстративная вышележащая или нижележащая последовательность содержит от приблизительно 15 п.о. до приблизительно 50 п.о., от приблизительно 30 п.о. до приблизительно 100 п.о., от приблизительно 200 п.о. до приблизительно 2000 п.о., от приблизительно 600 п.о. до приблизительно 1000 п.о., или более конкретно, от приблизительно 700 п.о. до приблизительно 1000 п.о.
[00169] В некоторых способах, полинуклеотид редактирующей матрицы может дополнительно содержать маркер. Такой маркер может облегчать скрининг по направленной интеграции. Примеры пригодных маркеров включают участки рестрикции, флуоресцентные белки или селективные маркеры. Экзогенную полинуклеотидную матрицу по изобретению можно конструировать с использованием рекомбинантных способов (см., например, Green and Sambrook et al., 2014 и Ausubel et al., 2017).
[00170] В иллюстративном способе модификации полинуклеотида-мишени посредством интеграции полинуклеотида редактирующей матрицы, двухцепочечный разрыв вводят в последовательность генома посредством комплекса сконструированной нуклеазы, где разрыв может подвергаться репарации посредством гомологичной рекомбинации с использованием редактирующей матрицы, таким образом, что матрица интегрирует в полинуклеотид-мишень. Присутствие двухцепочечного разрыва может увеличивать эффективность интеграции редактирующей матрицы.
[00171] Настоящее изобретение относится к способам модификации экспрессии полинуклеотида в клетке. Некоторые способы включают увеличение или уменьшение экспрессии полинуклеотида-мишени с использованием комплекса способной к нацеливанию нуклеазы, который связывается с полинуклеотидом-мишенью.
[00172] В некоторых способах, полинуклеотид-мишень можно инактивировать, чтобы вызывать модификацию экспрессии в клетке. Например, при связывании комплекса способной к нацеливанию нуклеазы с последовательностью-мишенью в клетке, полинуклеотид-мишень инактивируется таким образом, что последовательность не транскрибируется, кодированный белок не продуцируется, или последовательность не функционирует, как функционирует последовательность дикого типа. Например, кодирующую белок или микроРНК последовательность можно инактивировать таким образом, чтобы белок не продуцировался.
[00173] В некоторых способах, контрольную последовательность можно инактивировать таким образом, чтобы она больше не функционировала в качестве регуляторной последовательностью. В рамках изобретения,, «регуляторная последовательность» может относиться к любой последовательности нуклеиновой кислоты, которая влияет на транскрипцию, трансляцию или доступность последовательности нуклеиновой кислоты. Примеры регуляторных последовательностей включают промотор, терминатор транскрипции и энхансер.
[00174] Инактивированная последовательность-мишень может включать мутацию делеции (т.е., делецию одного или нескольких нуклеотидов), мутацию вставки (т.е., вставку одного или нескольких нуклеотидов), или нонсенс-мутацию (т.е., замену одного нуклеотида на другой нуклеотид, таким образом, чтобы вводить стоп-кодон). В некоторых способах, инактивация последовательности-мишени приводит к «нокауту» последовательности-мишени.
[00175] Изменение экспрессии одного или нескольких полинуклеотидов-мишеней, ассоциированных с биохимическим путем передачи сигналов, можно определять посредством анализа различий уровней мРНК соответствующих генов между тестируемой модельной клеткой и контрольной клеткой, когда их приводят в контакт со средством-кандидатом. Альтернативно, дифференциальную экспрессию последовательностей, ассоциированных с биохимическим путем передачи сигналов, определяют посредством детекции различий уровня кодированного полипептида или продукта гена.
[00176] Для анализа индуцированного средством изменения уровня транскриптов мРНК или соответствующих полинуклеотидов, нуклеиновую кислоту, содержащуюся в образце, сначала выделяют в соответствии со стандартными в данной области способами. Например, мРНК можно выделять с использованием различных литических ферментов или химических растворов, в соответствии со способами, приведенными в Green and Sambrook (2014), или выделяют посредством смол, связывающих нуклеиновые кислоты, в соответствии с сопутствующими инструкциями, предоставленными производителями. Затем мРНК, содержащуюся в образце выделенной нуклеиновой кислоты, детектируют посредством способов амплификации или общепринятых анализов гибридизации (например, анализа Нозерн-блоттинга) в соответствии со способами, широко известными в данной области, или основанными на способах, проиллюстрированных в настоящем описании.
[00177] Для целей по этому изобретению, амплификация обозначает любой способ с использованием праймера и полимеразы, способный реплицировать последовательность-мишень с разумной точностью. Амплификацию можно проводить посредством природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli, и обратной транскриптазы. Предпочтительным способом амплификации является ПЦР. В частности, выделенную РНК можно подвергать анализу обратной транскрипции в сочетании с количественной полимеразной цепной реакцией (RT-ПЦР) для количественной оценки уровня экспрессии последовательности, ассоциированной с биохимическим путем передачи сигналов.
[00178] Детекцию уровня экспрессии гена можно проводить в реальном времени в анализе амплификации. В одном аспекте амплифицированные продукты можно визуализировать напрямую с использованием флуоресцентный связывающих ДНК средств, включая, но без ограничения, интеркалирующие в ДНК средства и связывающие бороздку ДНК средства. Поскольку количество интеркалирующих средств, включенных в молекулы двухцепочечной ДНК, как правило, является пропорциональным количеству амплифицированных продуктов ДНК, можно удобным образом определять количество амплифицированных продуктов посредством количественной оценки флуоресценции интеркалированного красителя с использованием общепринятых в данной области оптических систем. Связывающие ДНК красители, пригодные для этого применения, включают SYBR green, SYBR blue, DAPI, иодид пропидия, Hoeste, SYBR gold, бромид этидия, акридины, профлавин, акридин оранжевый, акрифлавин, фторкумарин, эллиптицин, дауномицин, хлороквин, дистамицин D, хромомицин, гомидий, митрамицин, комплексы полипиридил-рутения, антрамицин и т.п.
[00179] В другом аспекте, другие флуоресцентные метки, такие как специфические для последовательности зонды, можно использовать в реакции амплификации для облегчения детекции и количественной оценки амплифицированных продуктов. Количественная амплификация с использованием зондов основана на специфической для последовательности детекции желательного амплифицированного продукта. В ней используют флуоресцентные, специфические для мишени зонды (например, зонды TaqMan™), что приводит к увеличению специфичности и чувствительности. Способы проведения количественной амплификации с использованием зондов хорошо разработаны в данной области и объяснены в Патенте США No. 5210015.
[00180] В другом аспекте, можно проводить общепринятые анализы гибридизации с использованием зондов для гибридизации, разделяющих гомологию последовательности с последовательностями, ассоциированными с биохимическим путем передачи сигналов. Как правило, зондам позволяют формировать стабильные комплексы с последовательностями, ассоциированными с биохимическим путем передачи сигналов, содержащимися в биологическом образце, полученном от тестируемого субъекта в реакции гибридизации. Специалисту в данной области понятно, что когда антисмысловую последовательность используют в качестве нуклеиновой кислоты-зонда, полинуклеотиды-мишени, представленные в образце, выбирают таким образом, чтобы они являлись комплементарными последовательностям антисмысловых нуклеиновых кислот. И наоборот, когда нуклеотидный зонд представляет собой смысловую нуклеиновую кислоту, полинуклеотид-мишень выбирают таким образом, чтобы он являлся комплементарным последовательности смысловой нуклеиновой кислоты.
[00181] Гибридизацию можно проводить в условиях различной строгости, например, как описано в настоящем описании. Подходящие условия гибридизации для практического осуществления настоящего изобретения являются такими, что взаимодействие узнавания между зондом и последовательностями, ассоциированными с биохимическим путем передачи сигналов, является как достаточно специфическим, так и достаточно стабильным. Условия, увеличивающие строгость реакции гибридизации, являются широко известными и опубликованными в данной области. См., например, (Green and Sambrook, et al., (2014); Nonradioactive in Situ Hybridization Application Manual, Boehringer Mannheim, second edition). Анализ гибридизации можно разрабатывать с использованием зондов, иммобилизованных на любой твердой подложке, включая, но без ограничения, нитроцеллюлозу, стекло, силикон и различные массивы генов. Предпочтительный анализ гибридизации проводят на генных чипах высокой плотности, как описано в Патенте США No. 5445934.
[00182] Для удобной детекции комплексов зонд-мишень, сформированных в ходе анализа гибридизации, нуклеотидные зонды конъюгируют с поддающейся детекции меткой. Поддающиеся детекции метки, пригодные для использования по настоящему изобретению, включают любую композицию, поддающуюся детекции посредством фотохимических, биохимический, спектроскопических, иммунохимических, электрических, оптических или химических способов. В данной области известно широкое множество пригодных поддающихся детекции меток, включающих флуоресцентные или хемилюминесцентные метки, метки на основе радиоактивных изотопов, ферментных или других лигандов. В предпочтительных вариантах осуществления, вероятно, может являться желательной флуоресцентная метка или ферментная метка, такая как дигоксигенин, бета-галактозидаза, уреаза, щелочная фосфатаза или пероксидаза, комплекс авидин/биотин.
[00183] Способы детекции для детекции или количественной оценки интенсивности гибридизации могут, как правило, зависеть от метки, выбранной выше. Например, радиоактивные метки можно детектировать с использованием фотографической пленки или устройства для визуализации радиоактивного фосфора. Флуоресцентные маркеры можно детектировать и количественно оценивать с использованием фотодетектора для детекции излучаемого света. Ферментные метки, как правило, детектируют посредством предоставления субстрата для фермента и измерения продукта реакции, полученного посредством воздействия фермента на субстрат; и наконец, колориметрические метки детектируют посредством простой визуализации окрашенной метки.
[00184] Индуцированное средством изменение экспрессии последовательностей, ассоциированных с биохимическим путем передачи сигналов, можно также определять посредством исследования соответствующих продуктов генов. Определение уровня белка, как правило, включает a) приведение белка, содержащегося в биологическом образце, в контакт с средством, которое специфически связывается с белком, ассоциированным с биохимическим путем передачи сигналов; и (b) идентификацию любого комплекса средство:белок, сформированного таким образом. В одном аспекте этого варианта осуществления, средство, которое специфически связывается с белком, ассоциированным с биохимическим путем передачи сигналов, представляет собой антитело, предпочтительно, моноклональное антитело.
[00185] Реакцию можно проводить посредством приведения средства в контакт с образцом белков, ассоциированных с биохимическим путем передачи сигналов, происходящих из тестируемых образцов в условиях, позволяющих формирование комплекса между средством и белками, ассоциированными с биохимическим путем передачи сигналов. Формирование комплекса можно детектировать напрямую или опосредованно в соответствии со стандартными в данной области способами. В прямом способе детекции, средства предоставляют с поддающейся детекции меткой, и не вступившие в реакцию средства можно удалять от комплекса; количество оставшейся метки, таким образом, показывает количество сформированного комплекса. Для такого способа, является предпочтительным выбирать метки, которые остаются присоединенными к средствам даже в строгих условиях промывки. Является предпочтительным, чтобы метка не создавала помех для реакции связывания. В качестве альтернативы, в способе непрямой детекции можно использовать средство, содержащее метку, введенную либо химически, либо посредством ферментов. Желательная метка, как правило, не создает помех для связывания или стабильности полученного комплекса средство:полипептид. Однако, метка, как правило, сконструирована, чтобы являться доступной для антитела для эффективного связывания и таким образом, получения поддающегося детекции сигнала.
[00186] Широкое множество меток, пригодных для детекции уровня белков известны в данной области. Неограничивающие примеры включают радиоактивные изотопы, ферменты, коллоидные металлы, флуоресцентные соединения, биолюминесцентные соединения и хемилюминесцентный соединения.
[00187] Количество комплексов средство:полипептид, сформированных в ходе реакции связывания, можно количественно оценивать посредством стандартных количественных анализов. Как проиллюстрировано выше, формирование комплекса средство:полипептид можно измерять напрямую посредством количества метки, оставшейся в участке связывания. В качестве альтернативы, белок, ассоциированный с биохимическим путем передачи сигналов, тестируют по его способности к конкуренции с меченным аналогом за участки связывания на средстве. В этом конкурентном анализе, количество связанной метки является обратно пропорциональным количеству белковых последовательностей, ассоциированных с биохимическим путем передачи сигналов, присутствующих в тестированном образце.
[00188] Ряд способов анализа белка на основе общих принципов, описанных выше, доступны в данной области. Они включают, но без ограничения радиоиммунный анализ, ELISA (твердофазные иммуноферментные радиометрические анализы), «сэндвич» иммуноанализы, иммунорадиометрические анализы, иммуноанализы in situ (с использованием например, коллоидного золота, ферментной или радиоизотопной метки), анализа Вестерн-блоттигна, анализов иммунопреципитации, иммунофлуоресцентные анализы и SDS-PAGE.
[00189] Антитела, которые специфически узнают или связывают белки, ассоциированные с биохимическим путем передачи сигналов, являются предпочтительными для проведения вышеупомянутых анализов белка. Если желательно, можно использовать антитела, которые узнают специфический тип посттрансляционной модификации (например, индуцируемые биохимическим путем передачи сигналов модификации). Посттрансляционные модификации включают, но без ограничения, гликозилирование, липидизацию, ацетилирование и фосфорилирование. Эти антитела можно закупать у коммерческих производителей. Например, антитела против фосфотирозина, которые специфически узнают фосфорилированные по тирозину белки, доступны от ряда поставщиков, включая Invitrogen и Perkin Elmer. Антитела против фосфотирозина являются особенно полезными для детекции белков, которые подвергаются дифференциальному фосфорилированию по остаткам тирозина в ответ на стресс ER. Такие белки включают, но без ограничения эукариотический фактор инициации трансляции 2 альфа (eIF-2.альфа.). Альтернативно, эти антитела можно получать с использованием общепринятых способов поликлональных или моноклональных антител посредством иммунизации животного-хозяина или продуцирующей антитела клетки белком-мишенью, имеющим желательную посттрансляционную модификацию.
[00190] При практическом осуществлении рассматриваемого способа, может являться желательным различать паттерн экспрессии белка, ассоциированного с биохимическим путем передачи сигналов, в различных тканях организма, в различных типах клеток, и/или в различных субклеточных структурах. Эти исследования можно проводить с использованием специфических для тканей, специфических для клеток или специфических для субклеточных структур антител, способных связываться с белковыми маркерами, которые предпочтительно экспрессируются в конкретных тканях, типах клеток или субклеточных структурах.
[00191] Измененную экспрессия гена, ассоциированного с биохимическим путем передачи сигналов, можно также определять посредством исследования изменения активности продукта гена по сравнению с контрольной клеткой. Анализ индуцированного средством изменения активности белка, ассоциированного с биохимическим путем передачи сигналов, может зависеть от биологической активности и/или пути передачи сигнала, которые подвергают исследованию. Например, когда белок представляет собой киназу, изменение его способности фосфорилировать нижележащей субстрат(ы) можно определять посредством множества анализов, известных в данной области. Репрезентативные анализы включают, но без ограничения, иммуноблоттинг и иммунопреципитация с использованием антител, таких как антитела против фосфотирозина, которые узнают фосфорилированные белки. Кроме того, активность киназы можно детектировать посредством высокопроизводительных хемилюминесцентных анализов, таких как анализ AlphaScreen™ (доступный из Perkin Elmer) и eTag™ (Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174).
[00192] Когда белок, ассоциированный с биохимическим путем передачи сигналов, является частью каскада передачи сигналов, приводящего к колебанию условий внутриклеточного pH, чувствительные к pH молекулы, такие как флуоресцентные чувствительные к pH красители можно использовать в качестве репортерных молекул. В другом примере, где белок, ассоциированный с биохимическим путем передачи сигналов, представляет собой ионный канал, можно мониторировать колебания мембранного потенциала и/или внутриклеточной концентрации ионов. Ряд коммерческих наборов и высокопроизводительных устройств являются особенно подходящими для быстрого и надежного скрининга модуляторов ионных каналов. Репрезентативные устройства включают FLIPR™ (Molecular Devices, Inc.) и VIPR (Aurora Biosciences). Эти устройства могут детектировать реакции в более 1000 лунок микропланшета с образцами одновременно и обеспечивать измерение в реальном времени и функциональные данные в пределах секунды или даже ее доли.
[00193] В практическом осуществлении любого из способов, описанных в настоящем описании, пригодный вектор можно вводить в клетку, ткань, организм или эмбрион посредством одного или нескольких способов, известных в данной области, включая без ограничения, микроинъекцию, электропорацию, сонопорацию, биолистические способы, опосредованную фосфатом кальция трансфекцию, катионную трансфекцию, липосомную трансфекцию, дендримерную трансфекцию, трансфекцию посредством теплового шока, трансфекцию посредством нуклеофекции, магнитофекцию, липофекцию, импалефекцию, оптическую трансфекцию, усиленное запатентованным средством поглощение нуклеиновых кислот и доставку посредством липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах, вектор вводят в эмбрион посредством микроинъекции. Вектор или векторы можно микроинъецировать в ядро или цитоплазму эмбриона. В некоторых способах, вектор или векторы можно вводить в клетку посредством нуклеофекции.
Последовательность-мишень
[00194] Полинуклеотид-мишень из комплекса способной к нацеливанию нуклеазы может представлять собой любой полинуклеотид, эндогенный или экзогенный для клетки-хозяина. Например, полинуклеотид-мишень может представлять собой полинуклеотид, находящийся в ядре эукариотической клетки, в геноме прокариотической клетки или в внехромосомном векторе клетки-хозяина. Полинуклеотид-мишень может представлять собой последовательность, кодирующую продукт гена (например, белок) или некодирующую последовательность (например, регуляторный полинуклеотид или избыточную ДНК).
[00195] Примеры полинуклеотидов-мишеней включают последовательность, ассоциированную с биохимическим путем передачи сигналов, например, ассоциированный с биохимическим путем передачи сигналов ген или полинуклеотид. Примеры полинуклеотидов-мишеней включают ассоциированный с заболеванием ген или полинуклеотид. «Ассоциированный с заболеванием» ген или полинуклеотид относится к любому гену или полинуклеотиду, образующему продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, происходящих из пораженных заболеванием тканей, по сравнению с тканями или клетками из не пораженного заболеванием контроля. Он может представлять собой ген, начавший экспрессироваться на аномально высоком уровне; он может представлять собой ген, начавший экспрессироваться на аномально низком уровне, где измененная экспрессия коррелирует с возникновением и/или прогрессированием заболевания. Ассоциированный с заболеванием ген также относится к гену, имеющему мутацию(мутации) или генетическое изменение, которые являются напрямую ответственными, или находятся в неравновесии по сцеплению с геном(генами), ответственными за этиологию заболевания. Продукты транскрипции или трансляции могут являться известными или неизвестными, и могут присутствовать на нормальном или аномальном уровне.
[00196] Варианты осуществления изобретения относятся к способам и композициям, связанным с нокаутом генов, редактированием генов, изменением генов, амплификацией генов и репарацией конкретных мутаций. Изменение генов может также обозначать эпигенетические манипуляции с последовательностью-мишенью. Это может относиться к состоянию хроматина последовательности-мишени, например, к модификации состояния метилирования последовательности-мишени (т.е. добавлению или удалению метилирования или паттернов метилирования, или островков CpG), модификации гистонов, увеличению или уменьшению доступностьи последовательности-мишени, или облегчению 3D сворачивания. Понятно, что когда приведена ссылка на способ модификации клетки, организма или млекопитающего, включая человека или не относящегося к человеку млекопитающего или организма манипуляции с последовательностью-мишенью в представляющем интерес геномном локусе, это может быть применимо к организму (или млекопитающему) в целом или только к отдельной клетке или популяции клеток из организма (если организм является многоклеточным). В случае человека, например, авторы настоящего изобретения предусматривают, среди прочего, отдельную клетку или популяцию клеток и их можно, предпочтительно модифицировать ex vivo и затем вводить повторно. В этом случае, может являться необходимым биоптат или другой образец ткани или биологической жидкости. Стволовые клетки являются особенно предпочтительными в этом отношении. Однако, разумеется, предусматривают также варианты осуществления in vivo. И особенно предпочтительными по изобретению являются HSC.
[00197] Функциональность комплекса способной к нацеливанию нуклеазы можно оценивать посредством любого пригодного анализа. Например, компоненты системы поддающейся нацеливанию нуклеазы, достаточные для формирования комплекса способной к нацеливанию нуклеазы, включая направляющую нуклеиновую кислота и направляемая нуклеиновой кислотой нуклеаза, можно вводить в клетку-хозяина, имеющую соответствующую последовательность-мишень, например, посредством трансфекции с использованием векторов, кодирующих компоненты сконструированной системы нуклеазы, с последующей оценкой предпочтительного расщепления внутри последовательности-мишени. Подобным образом, расщепление последовательности-мишени можно оценивать в пробирке посредством предоставления последовательности-мишени и компонентов комплекса способной к нацеливанию нуклеазы. Другие анализы являются возможными и очевидными для специалиста в данной области. Направляющую последовательность можно выбирать для нацеливания на любую последовательность-мишень. В некоторых вариантах осуществления, последовательность-мишень представляет собой последовательность в геноме клетки. Иллюстративные последовательности-мишени включают те, которые являются уникальными в целевом геноме.
Редактирующая кассета
[00198] Настоящее изобретение относится к композициям и способам для редактирования последовательности полинуклеотида-мишени. Такие композиции включают полинуклеотиды, содержащие один или несколько компонентов системы поддающейся нацеливанию нуклеазы. Полинуклеотидные последовательности для использования в этих способах могут быть обозначены как редактирующие кассеты.
[00199] Редактирующая кассета может содержать один или несколько участков для праймеров. Участки для праймеров можно использовать для амплификации редактирующей кассеты с использованием олигонуклеотидных праймеров, содержащих обратно комплементарные последовательности, которые могут гибридизоваться с одним или несколькими участками для праймеров. Редактирующая кассета может содержать два или более участка для праймеров. Иногда, редактирующая кассета содержит участок для праймера на каждом конце редактирующей кассеты, где указанные участки для праймеров фланкируют один или несколько других компонентов редактирующей кассеты. Участки для праймеров могут иметь длину приблизительно 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 или более нуклеотидов.
[00200] Редактирующая кассета может содержать редактирующую матрицу, как описано в настоящем описании. Редактирующая кассета может содержать редактирующую последовательность. Редактирующая последовательность может являться гомологичной последовательности-мишени. Редактирующая последовательность может содержать по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью. Редактирующая последовательность часто содержит область гомологии (или плечи гомологии), фланкирующую по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью, таким образом, чтобы фланкирующие области гомологии облегчали гомологичную рекомбинацию редактирующей последовательности в последовательность-мишень. Редактирующая последовательность может содержать редактирующую матрицу, как описано в настоящем описании. Например, редактирующая последовательность может содержать по меньшей мере один мутацию, по сравнению с последовательностью-мишенью, включая одну или несколько мутаций PAM, приводящие к мутации или делеции участка PAM. Редактирующая последовательность может содержать одну или несколько мутаций в кодоне или некодирующей последовательности, по сравнению с нередактированным участком-мишенью.
[00201] Мутация PAM может представлять собой молчащую мутацию. Молчащая мутация может представлять собой изменение по меньшей мере одного нуклеотида кодона, по сравнению с исходным кодоном, которое не приводит к изменению аминокислоты, кодированной исходным кодоном. Молчащая мутация может представлять собой изменение нуклеотида в некодирующей области, такой как интрон, 5’-нетранслируемая область, 3’-нетранслируемая область или другая некодирующая область.
[00202] Мутация PAM может представлять собой немолчащую мутацию. Немолчащие мутации могут включать миссенс-мутацию. Миссенс-мутация может представлять собой изменение по меньшей мере одного нуклеотида кодона, по сравнению с исходным кодоном, которое приводит к изменению аминокислоты, кодированной исходным кодоном. Миссенс-мутации могут возникать в экзоне, открытой рамке считывания или другой кодирующей области.
[00203] Редактирующая последовательность может содержать по меньшей мере одну мутацию, по сравнению с последовательностью-мишенью. мутация может представлять собой молчащую мутацию или немолчащую мутацию, такую как миссенс-мутация. Мутация может включать вставку одного или нескольких нуклеотидов или пар оснований. Мутация может включать делецию одного или нескольких нуклеотидов или пар оснований. Мутация может включать замену одного или нескольких нуклеотидов или пар оснований на другие один или несколько нуклеотидов или пар оснований. Вставленные или замененные последовательности могут включать экзогенные или гетерологичные последовательности.
[00204] Редактирующая кассета может содержать полинуклеотид, кодирующий направляющую последовательность нуклеиновой кислоты. В некоторых случаях, направляющая последовательность нуклеиновой кислоты является, необязательно, функционально связанной с промотором. Направляющая последовательность нуклеиновой кислоты может содержать каркасную последовательность и направляющую последовательность, как описано в настоящем описании.
[00205] Редактирующая кассета может содержать штрих-код. Штрих-код может представлять собой уникальную последовательность ДНК, которая соответствует редактирующей последовательности таким образом, что по штрих-коду можно идентифицировать одну или несколько мутаций соответствующей редактирующей последовательности. В некоторых примерах, штрих-код составляет 15 нуклеотидов. Штрих-код может содержать менее, чем 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 88, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, или более чем 200 нуклеотидов. Штрих-код может представлять собой неприродную последовательность. Редактирующая кассета, содержащая штрих-код, может представлять собой неприродную последовательность.
[00206] Редактирующая кассета может содержать одну или несколько редактирующих последовательностей и полинуклеотид, кодирующий направляющую нуклеиновую кислоту, необязательно, функционально связанную с промотором, где редактирующая кассета и направляющая последовательность нуклеиновой кислоты фланкированы участками для праймеров. Редактирующая кассета может дополнительно содержать штрих-код.
[00207] Пример редактирующей кассеты показан на фигуре 3. Каждая редактирующая кассета может быть сконструирована для редактирования участка в последовательности-мишени. Участки для нацеливания могут представлять собой кодирующие области, некодирующие области, функционально нейтральные участки, или могут представлять собой ген позволяющего скрининг или селективного маркера. Области гомологии внутри редактирующей последовательности фланкируют одну или несколько мутаций редактирующей кассеты и могут быть вставлены в последовательность-мишень посредством рекомбинации. Reкомбинация может включать расщепление ДНК, например, посредством направляемой нуклеиновой кислотой нуклеазы, и репарацию посредством гомологичной рекомбинации.
[00208] Редактирующие кассеты можно получать посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.
[00209] Отслеживаемые последовательности, такие как штрих-коды или записывающие последовательности, можно конструировать in silico посредством стандартного кода с вырожденными мутациями целевых кодонов. Вырожденные мутации могут содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, или более чем 30 остатков нуклеиновая кислоты. В некоторых примерах, вырожденные мутации могут содержать 15 остатков нуклеиновая кислоты (N15).
[00210] Плечи гомологии можно добавлять к редактирующей последовательности, чтобы обеспечивать вставку редактирующей последовательности в желательную локализацию посредством гомологичной рекомбинации или направляемой гомологией репарации. Плечи гомологии можно добавлять посредством синтеза, сборки in vitro, ПЦР или других известных в данной области способов, например, химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации. Плечи гомологии можно добавлять на обоих концах штрих-кода, записывающей последовательности и/или редактирующей последовательности, таким образом, фланкируя последовательность двумя различными плечами гомологии, например, 5’-плечом гомологии и 3’-плечом гомологии.
[00211] Плечо гомологии может содержать последовательность, гомологичную последовательности-мишени. Плечо гомологии может содержать последовательность, гомологичную последовательности, смежной с последовательностью-мишенью. Плечо гомологии может содержать последовательность, гомологичную последовательности, выше или ниже последовательности-мишени. Плечо гомологии может содержать последовательность, гомологичную последовательности внутри того же самого гена или открытой рамки считывания, что и последовательность-мишень. Плечо гомологии может содержать последовательность, гомологичную последовательности выше или ниже гена или открытой рамки считывания, в которой находится последовательность-мишень. Плечо гомологии может содержать последовательность, гомологичную 5’-UTR или 3’-UTR гена или открытой рамки считывания, в которой находится последовательность-мишень. Плечо гомологии может содержать последовательность, гомологичную гену, открытой рамке считывания, промотору, терминатору или последовательности нуклеиновой кислоты, отличным от тех, в которых находится последовательность-мишень.
[00212] Одинаковые 5’ и 3’ плечи гомологии можно добавлять к множеству различных редактирующих последовательностей, таким образом, получая библиотеку уникальных редактирующих последовательностей, каждая из которых имеет одинаковый участок целевой вставки. Одинаковые 5’ и 3’ плечи гомологии можно добавлять к множеству различных редактирующих матриц, таким образом, получая библиотеку уникальных редактирующих матриц, каждая из которых имеет одинаковый участок целевой вставки. В альтернативных примерах, различные 5’ или 3’ плечи гомологии можно добавлять к множеству редактирующих последовательностей или редактирующих матриц.
[00213] Библиотеку штрих-кодов или библиотеку записывающих последовательностей, содержащую фланкирующие плечи гомологии, можно клонировать в остов вектора. В некоторых примерах, содержащие штрих-код фланкирующие плечи гомологии клонируют в редактирующую кассету. Клонирование можно осуществлять посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.
[00214] Библиотеку редактирующих последовательностей, содержащих фланкирующие плечи гомологии, можно клонировать в остов вектора. В некоторых примерах, редактирующую последовательность и плечи гомологии клонируют в редактирующую кассету. Редактирующие кассеты могут, в некоторых случаях, дополнительно содержать последовательность нуклеиновой кислоты, кодирующую направляющую нуклеиновая кислота или гРНК, сконструированные для нацеливания на желательный участок вставки редактирующей последовательности, например, последовательность-мишень. Редактирующие кассеты могут, в некоторых случаях, дополнительно содержать штрих-код или записывающую последовательность. Клонирование можно осуществлять посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.
[00215] Полногеномные или полногеномные редактирующие библиотеки можно клонировать в остов вектора. Можно осуществлять вставку или сборку библиотеки штрих-кодов или записывающих последовательностей во втором участке для получения компетентных отслеживаемых плазмид, которые могут вводить записывающий штрих-код в фиксированный локус, в то же время интегрируя редактирующие библиотеки в широкое множество определенных пользователем участков. Клонирование можно осуществлять посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.
[00216] Можно сначала осуществлять сборку или вставку направляющей нуклеиновой кислоты или кодирующей ее последовательности в остове вектора, с последующей вставкой редактирующей последовательности и/или кассеты. В других случаях, можно сначала осуществлять сборку или вставку редактирующей последовательности и/или кассеты в остове вектора, с последующей вставкой направляющей нуклеиновой кислоты или кодирующей ее последовательности. В других случаях, одновременно осуществляют сборку или вставку в вектор направляющей нуклеиновой кислоты или кодирующей ее последовательности и редактирующей последовательности и/или кассеты. Записывающую последовательность или штрих-код можно вставлять до или после любой из этих стадий. Иными словами, следует понимать, что существует множество перестановок порядка, в котором осуществляют сборку элементов по настоящему изобретению. Вектор может являться линейным или кольцевым и может быть получен посредством химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, удлинения перекрывающихся олигонуклеотидов, сборки in vitro, сборки олигонуклеотидов in vitro, ПЦР, традиционного клонирования на основе лигирования, других известных в данной области способов, или любой их комбинации.
[00217] Можно синтезировать молекулу нуклеиновой кислоты, содержащую один или несколько элементов, описанных в настоящем описании. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету. Можно синтезировать молекулу нуклеиновой кислоты, содержащую направляющую нуклеиновую кислоту. Можно синтезировать молекулу нуклеиновой кислоты, содержащую записывающую кассету. Можно синтезировать молекулу нуклеиновой кислоты, содержащую штрих-код. Можно синтезировать молекулу нуклеиновой кислоты, содержащую плечо гомологии. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету и направляющую нуклеиновую кислоту. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету и штрих-код. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету, направляющую нуклеиновую кислоту и записывающую кассету. Можно синтезировать молекулу нуклеиновой кислоты, содержащую редактирующую кассету, записывающую кассету и две направляющие нуклеиновые кислоты. Можно синтезировать молекулу нуклеиновой кислоты, содержащую записывающую кассету и направляющую нуклеиновую кислоту. В любом из этих случаев, направляющая нуклеиновая кислота может, необязательно, являться функционально связанной с промотором. В любом из этих случаев, молекула нуклеиновой кислоты может дополнительно включать один или несколько штрих-кодов.
[00218] Синтез можно осуществлять посредством любого способа синтеза нуклеиновых кислот, известного в данной области. Синтез можно осуществлять посредством ферментного синтеза нуклеиновых кислот. Синтез можно осуществлять посредством химического синтеза. Синтез можно осуществлять посредством синтеза на основе массивов. Синтез можно осуществлять посредством способов твердофазного синтеза или фосфорамидитного синтеза. Синтез можно осуществлять посредством способов с использованием колонки или многолуночного планшета. Синтезированные молекулы нуклеиновой кислоты могут представлять собой неприродные молекулы нуклеиновой кислоты.
[00219] Способы программного обеспечения и автоматизации можно использовать для мультиплексного синтеза и получения. Например, программное обеспечение и автоматизацию можно использовать для получения 10, 102, 103, 104, 105, 106 или более синтезированных полинуклеотидов, кассет или плазмид. Автоматизированным способом можно быстро получать желательные последовательности и библиотеки, которые можно перерабатывать в технологическом процессе с минимальным количеством стадий для получения точно определенных библиотек, таких как полногеномные или полногеномные редактирующие библиотеки.
[00220] Можно получать полинуклеотиды или библиотеки, содержащие две или более молекулы нуклеиновой кислоты или плазмиды, содержащие любую комбинацию, описанную в настоящем описании, из записывающей последовательности, редактирующей последовательности, направляющей нуклеиновой кислоты, и необязательно, штрих-кода, включая комбинации одного или нескольких из любых из упомянутых ранее элементов. Например, такая библиотека может содержать по меньшей мере 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 104, 105, 106, 107, 108, 109, 1010 или более молекул нуклеиновой кислоты или плазмид по настоящему описанию. Следует понимать, что такая библиотека может включать любое количество молекул нуклеиновой кислоты или плазмид, даже если конкретное количество явно не указано выше.
[00221] Отслеживаемые библиотеки плазмид или библиотеки молекул нуклеиновой кислоты можно секвенировать для определения пары записывающей последовательности и редактирующей последовательности, содержащейся в каждой отслеживаемой плазмиде. В других случаях, пару известной записывающей последовательности с известной редактирующей последовательностью получают в процессе получения библиотеки. Предусмотрены другие способы определения ассоциации между записывающей последовательностью и редактирующей последовательностью, содержащимися в общей молекуле нуклеиновой кислоты или плазмиде, так что редактирующую последовательность можно идентифицировать посредством идентификации или секвенирования записывающей последовательности.
[00222] Способы и композиции для отслеживания редактирующих челночных эписомных библиотек, переносимых между E. coli и другими организмами/линиями клеток, представлены в настоящем описании. Библиотеки могут содержаться в плазмидах, искусственных хромосомах бактерий (BAC), искусственных хромосомах дрожжей (YAC), синтетических хромосомах, или вирусных или фаговых геномах. Эти способы и композиции можно использовать для получения переносимых снабженных штрих-кодами библиотек в организмах-хозяевах, таких как E. coli. Получение библиотек в таких организмах может обеспечивать преимущество разработанных способов осуществления гомологичной рекомбинации. Снабженные штрих-кодами библиотеки плазмид можно подвергать глубокому секвенированию в одном участке для отслеживания мутационного разнообразия, нацеленного на остальные части плазмиды, позволяющему очень сильное улучшение степени перекрывания библиотеки.
[00223] Любая молекула нуклеиновой кислоты, описанная в настоящем описании, может представлять собой выделенную нуклеиновую кислоту. Выделенные нуклеиновые кислоты можно получать любым способом, известны в данной области, например, с использованием стандартных рекомбинантных способов, способов сборки, способов синтеза или их комбинаций. В некоторых вариантах осуществления, нуклеиновые кислоты можно клонировать, амплифицировать, собирать или конструировать иным способом.
[00224] Выделенные нуклеиновые кислоты можно получать из клеточных, бактериальных или других источников, с использованием любого количества способов клонирования, известных в данной области. В некоторых вариантах осуществления, олигонуклеотидные зонды, которые избирательно гибридизуются, в строгих условиях, с другими олигонуклеотидами или с нуклеиновыми кислотами из организма или клетки, можно использовать для выделения или идентификации выделенной нуклеиновой кислоты.
[00225] Можно проводить скрининг клеточной геномной ДНК, РНК или кДНК по присутствию идентифицированного представляющего интерес генетического элемента с использованием зонда на основе одной или нескольких последовательностей. Различные степени строгости гибридизации можно использовать в анализе.
[00226] Условия высокой строгости для гибридизации нуклеиновых кислот хорошо известны в данной области. Например, условия могут включать условия низкой концентрации соли и/или высокой температуры, например, как обеспечивают посредством от приблизительно 0,02 M до приблизительно 0,15 M NaCl при температурах от приблизительно 50°C. до приблизительно 70°C. Понятно, что температура и ионная сила для желательной строгости частично определяются длиной конкретной нуклеиновой кислоты(кислот), длиной и нуклеотидным составом последовательности-мишени(последовательностей-мишеней), составом заряда нуклеиновой кислоты(кислот) и присутствием или концентрацией формамида, хлорида тетраметиламмония или другого растворителя(растворителей) в смеси для гибридизации. Нуклеиновые кислоты могут являться полностью комплементарными последовательности-мишени или могут иметь одно или несколько несовпадений.
[00227] Представляющие интерес нуклеиновые кислоты можно также амплифицировать с использованием множества известных способов амплификации. Например, технологию полимеразной цепной реакции (ПЦР) можно использовать для амплификации последовательностей-мишеней напрямую с ДНК, РНК или кДНК. ПЦР и другие способы амплификации in vitro можно также использовать, например, для клонирования последовательностей нуклеиновых кислот, для получения нуклеиновых кислот для использования в качестве зондов для детекции присутствия целевой нуклеиновой кислоты в образцах, для секвенирования нуклеиновой кислоты или для других целей.
[00228] Выделенные нуклеиновые кислоты можно получать посредством прямого химического синтеза посредством таких способов, как фосфотриэфирный способ, или с использованием автоматического синтезатора. Химическим синтезом, как правило, получают одноцепочечный олигонуклеотид. Его можно переводить в двухцепочечную ДНК посредством гибридизации с комплементарной последовательностью или посредством полимеризации с использованием ДНК-полимеразы с использованием одной цепи в качестве матрицы.
Записывающая кассета
[00229] В некоторых примерах, две редактирующие кассеты можно использовать совместно для отслеживания стадии генетического конструирования. Например, одна редактирующая кассета может содержать редактирующую матрицу и кодированную направляющую нуклеиновую кислоту, и вторая редактирующая кассета, обозначенная как записывающая кассета, может содержать редактирующую матрицу, содержащую записывающую последовательность и кодированную нуклеиновую кислоту, имеющую отличную направляющую последовательность, по сравнению с первой редактирующей кассетой. В таких случаях, редактирующую последовательность и записывающую последовательность можно вставлять в отдельные последовательности-мишени и определять посредством соответствующих им направляющих нуклеиновых кислот. Записывающая последовательность может содержать штрих-код, отслеживаемую или прослеживаемую последовательность и/или регуляторный элемент, функционально связанный с позволяющим скрининг или селективным маркером.
[00230] В способе мультиплексного клонирования, записывающую кассету можно ковалентно связывать по меньшей мере с одной редактирующей кассетой в плазмиде (например, фигура 17A) для получения плазмидных библиотек, имеющих уникальную комбинацию записывающей и редактирующей кассеты. Эту библиотеку можно секвенировать для получения картирования записи/редактирования и использовать для отслеживания редактирующих библиотек на протяжении больших фрагментов ДНК-мишени (например, фигура 17C). Записывающая и редактирующая последовательности могут содержаться в одной и той же кассете, в этом случае, их обе вводят в целевую последовательность нуклеиновой кислоты, например, в геном или плазмиду, посредством одного и того же события рекомбинации. В других примерах, записывающая и редактирующая последовательности могут содержаться в отдельных кассетах внутри одной и той же плазмиды, в этом случае, записывающую и редактирующую последовательности вводят в целевую последовательность нуклеиновой кислоты вводят в целевую последовательность посредством отдельных событий рекомбинации, либо одновременно, либо последовательно.
[00231] Настоящее изобретения относится к способам объединения мультиплексного синтеза олигонуклеотидов с рекомбинационной инженерией, для получения библиотек специфически сконструированных и отслеживаемых мутаций. Способы скрининга и/или отбора, за которыми следуют способы высокопроизводительного секвенирования и/или микромассива штрих-кодов, могут обеспечивать быстрое картирование мутаций, приводящих к представляющему интерес фенотипу.
[00232] Способы и композиции, описанные в настоящем описании, можно использовать для одновременного конструирования и отслеживания событий конструирования в целевой последовательности нуклеиновой кислоты.
[00233] Такие плазмиды можно получать с использованием способов сборки или клонирования in vitro. Например, плазмиды можно получать с использованием химического синтеза, сборки способом Gibson, SLIC, CPEC, PCA, безлигазного клонирования, других способов сборки олигонуклеотидов in vitro, традиционного клонирования на основе лигирования или любой их комбинации.
[00234] Такие плазмиды могут содержать по меньшей мере одну записывающую последовательность, такую как штрих-код, и по меньшей мере одну редактирующую последовательность. В большинстве случаев, записывающую последовательность используют для записи и отслеживания событий конструирования. Каждую редактирующую последовательность можно использовать для введения желательного редактирования в целевую последовательность нуклеиновой кислоты. Желательное редактирование может включать вставку, делецию, замену или изменение целевой последовательности нуклеиновой кислоты. В некоторых примерах, одна или несколько записывающих последовательностей и редактирующих последовательностей содержатся в одной и той же кассете, содержащейся внутри плазмиды, так что их вводят в целевую последовательность нуклеиновой кислоты посредством одного и того же события конструирования. В других примерах, записывающие и редактирующие последовательности содержатся в отдельных кассетах внутри плазмиды, так что каждую из них вводят в целевую нуклеиновую кислоту посредством отдельных событий конструирования. В некоторых примерах, плазмида содержит две или более редактирующих последовательности. Например, одну редактирующую последовательность можно использовать для изменения или выключения последовательности PAM, в то время как вторую редактирующую последовательность можно использовать для введения мутации в отдельную последовательность.
[00235] Записывающие последовательности можно вставлять в участок, отделенный от участка вставки редактирующей последовательности. Вставленная записывающая последовательность может быть отделена от редактирующей последовательности посредством от 1 п.о. до 1 млн.п.о. Например, дистанция разделения может составлять приблизительно 1 п.о., 10 п.о., 50 п.о., 100 п.о., 500 п.о., 1 т.п.о., 2 т.п.о., 5 т.п.о., 10 т.п.о. или более. Дистанция разделения может представлять собой любое дискретное целое число между 1 п.о. и 10 млн.п.о. В некоторых примерах, максимальная дистанция разделения зависит от размера целевых нуклеиновой кислоты или генома.
[00236] Записывающие последовательности можно вставлять как смежные с редактирующими последовательностями, или поблизости от редактирующей последовательности. Например, записывающую последовательность можно вставлять вне открытой рамки считывания, внутри которой вставляют редактирующую последовательность. Записывающую последовательность можно вставлять в нетранслируемую область, смежную с открытой рамкой считывания, внутри которой вставляют редактирующую последовательность. Записывающую последовательность можно вставлять в функционально нейтральный или нефункциональный участок. Записывающую последовательность можно вставлять в ген позволяющего скрининг или селективного маркера.
[00237] В некоторых примерах, целевая последовательность нуклеиновой кислоты содержится в геноме, искусственной хромосоме, синтетической хромосоме или эписомной плазмиде. В различных примерах, целевая последовательность нуклеиновой кислоты может присутствовать in vitro или in vivo. Когда целевая последовательность нуклеиновой кислоты присутствует in vivo, плазмиду можно вводить в организмы-хозяева посредством трансформации, трансфекции, конъюгации, биолистических способов, наночастиц, технологий увеличения проницаемости клетки или других известных способов доставки ДНК, или любой их комбинации. В таких примерах, организм-хозяин может представлять собой эукариоту, прокариоту, бактерию, архею, дрожжи или другие грибы.
[00238] Событие конструирования может включать рекомбинационную инженерию, соединение негомологичных концов, гомологичную рекомбинацию или направляемую гомологией репарацию. В некоторых примерах, событие конструирования происходит in vitro или in vivo.
[00239] Способы, описанные в настоящем описании, можно осуществлять в любом типе клеток, в которых система поддающейся нацеливанию нуклеазы может функционировать (например, осуществлять нацеливание и расщепление ДНК), включая прокариотические и эукариотические клетки. В некоторых вариантах осуществления клетка представляет собой клетку бактерии, такой как Escherichia spp. (например, E. coli). В других вариантах осуществления, клетка представляет собой клетку гриба, такую как клетка дрожжей, например, Saccharomyces spp. В других вариантах осуществления, клетка представляет собой клетку водоросли, клетку растения, клетку насекомого или клетку млекопитающего, включая клетку человека.
[00240] В некоторых примерах, клетка представляет собой рекомбинантный организм. Например, клетка может содержать неприродную систему поддающейся нацеливанию нуклеазы. Дополнительно или альтернативно, клетка может содержать аппарат системы рекомбинации. Такие системы рекомбинации могут включать систему рекомбинации лямбда red, Cre/Lox, attB/attP или другие системы интегразы. Когда это целесообразно, плазмида может иметь комплементарные компоненты или аппарат, необходимые, чтобы выбранная система рекомбинации действовала корректно и эффективно.
[00241] Способ геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету и по меньшей мере одну направляющую нуклеиновую кислоту, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК и введению редактирующей кассеты; (c) получение жизнеспособных клеток; и (d) секвенирование целевой молекулы ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.
[00242] Способ геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету, содержащую мутацию PAM, как описано в настоящем описании, и по меньшей мере одну направляющую нуклеиновую кислоту, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК, введению редактирующей кассеты и гибели клеток из второй популяции клеток, не содержащих мутации PAM, в то время как клетки из второй популяции клеток, содержащие мутацию PAM, являются жизнеспособными; (c) получение жизнеспособных клеток; и (d) секвенирование целевой ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.
[00243] Способ отслеживаемого геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету, по меньшей мере одну записывающую кассету и по меньшей мере две направляющие нуклеиновые кислоты, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК и введению редактирующей и записывающей кассет; (c) получение жизнеспособных клеток; и (d) секвенирование записывающей последовательности целевой молекулы ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.
[00244] В некоторых примерах, где плазмида содержит вторую редактирующую последовательность, сконструированную для выключения PAM, способ отслеживаемого геномного редактирования может включать: (a) введение вектора, кодирующего по меньшей мере одну редактирующую кассету, записывающую кассету и по меньшей мере две направляющие нуклеиновые кислоты, в первую популяцию клеток, таким образом, получая вторую популяцию клеток, содержащую вектор; (b) поддержание второй популяции клеток в условиях, в которых направляемая нуклеиновой кислотой нуклеаза экспрессируется или сохраняется, где направляемая нуклеиновой кислотой нуклеаза кодирована в векторе, втором векторе, в геноме клеток из второй популяции клеток, или иным образом введена в клетку, что приводит к расщеплению ДНК, введению редактирующей и записывающей кассет, и гибели клеток из второй популяции клеток, не содержащих мутации PAM, в то время как клетки из второй популяции клеток, содержащие мутацию PAM, являются жизнеспособными; (c) получение жизнеспособных клеток; и (d) секвенирование записывающей последовательности целевой ДНК по меньшей мере в одной клетке из второй популяции клеток для идентификации мутации по меньшей мере одного кодона.
[00245] В некоторых примерах эффективность трансформации определяют с использованием ненацеливающей контрольной направляющей нуклеиновой кислоты, что позволяет подтверждение способа рекомбинантной инженерии и подсчет КОЕ/нг. В некоторых случаях, абсолютную эффективность получают посредством подсчета общего количества колоний на каждой чашке после трансформации, например, посредством подсчета красных и белых колоний для контроля galK. В некоторых примерах, относительную эффективность рассчитывают по общему количеству успешных трансформантов (например, белых колоний) от всех колоний в контроле (например, контроле galK).
[00246] Способы по настоящему изобретению могут обеспечивать, например, более чем 1000x улучшение эффективности, масштаба, стоимости получения комбинаторной библиотеки и/или точности получения такой библиотеки.
[00247] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее улучшение эффективности получения геномных или комбинаторных библиотек.
[00248] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее улучшение масштаба получения геномных или комбинаторных библиотек.
[00249] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее уменьшение стоимости получения геномных или комбинаторных библиотек.
[00250] Способы по настоящему изобретению могут обеспечивать, например, более чем: 10x, 50x, 100x, 200x, 300x, 400x, 500x, 600x, 700x, 800x, 900x, 1000x, 1100x, 1200x, 1300x, 1400x, 1500x, 1600x, 1700x, 1800x, 1900x, 2000x или большее улучшение точности получения геномных или комбинаторных библиотек.
Рекурсивное отслеживание для комбинаторной инженерии
[00251] Настоящее изобретение относится к способам и композициям для повторяющихся циклов конструирования. Настоящее изобретение относится к способам рекурсивной инженерии, позволяющим осуществление записи CREATE на уровне отдельной клетки посредством нескольких серийных циклов конструирования (например, фигура 18 и фигура 19). Эти описанные способы и композиции могут обеспечивать технологии на основе поиска, в которых можно эффективно конструировать и исследовать комплексное генотипическое пространство. Термины рекурсивный и повторяющийся можно использовать взаимозаменяемо.
[00252] Способы комбинаторной инженерии могут включать множество циклов конструирования. Способы, описанные в настоящем описании, могут включать 2 или более циклов конструирования. Например, способ может включать 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30 или более чем 30 циклов конструирования.
[00253] В некоторых примерах, в ходе каждого цикла конструирования, новую записывающую последовательность, такую как штрих-код, вводят в один и тот же локус в соседние участки (например, фигура 18, серые блоки, или Фигура 19, черные блоки), таким образом, что после множества циклов конструирования для конструирования комбинаторного разнообразия на протяжении генома (например, фигура 18, серые блоки или фигура 19, серые блоки), простую ПЦР записывающего локуса можно использовать для реконструкции каждого комбинаторного генотипа или для подтверждения того, что сконструированное редактирование из каждого цикла включено в участок-мишень.
[00254] Настоящее изобретение относится к способам отбора для последующих циклов конструирования. Отбор можно осуществлять посредством мутации PAM, введенной посредством редактирующей кассеты. Отбор можно осуществлять посредством мутации PAM, введенной посредством записывающей кассеты. Отбор можно осуществлять с использованием позволяющего скрининг, селективного или контрселективного маркера. Отбор можно осуществлять посредством нацеливания на участок для редактирования или записи, введенный посредством предшествующего цикла конструирования, таким образом, отбора вариантов, в которые успешно введены события редактирования и записывающие последовательности из обоих циклов или всех предшествующих циклов конструирования.
[00255] Количественную оценку этих генотипов можно использовать для понимания эффектов комбинаторных мутаций на большие популяции и исследования важных биологических феноменов, таких как эпистаз.
[00256] Серийное редактирование и комбинаторное отслеживание можно осуществлять с использованием рекурсивных векторных систем, как описано в настоящем описании. Эти рекурсивные векторные системы можно использовать для быстрого продвижения в способе трансформации. В некоторых примерах, эти системы состоят из двух или более плазмид, содержащих ортогональные точки начала репликации, маркеры устойчивости к антибиотику, и кодированные направляющие нуклеиновые кислоты. Кодированную направляющую нуклеиновую кислоту в каждом векторе можно конструировать для нацеливания на один из других маркеров устойчивости для повреждения посредством опосредованного направляемой нуклеиновой кислотой нуклеазой расщепления. Эти системы можно использовать, в некоторых примерах, для осуществления трансформаций, в которых селективное давление антибиотика переключают для удаления предшествующей плазмиды и управления обогащением сконструированными геномами из следующего цикла. Можно осуществлять два или более пассажей в ходе петли трансформации, или иными словами, можно проводить множество циклов конструирования. Введение необходимых записывающих кассет и редактирующих кассет в рекурсивные векторы, как описано в настоящем описании, можно использовать для одновременного геномного редактирования и удаления плазмиды на каждой стадии трансформации с высокой эффективностью.
[00257] В некоторых примерах, рекурсивная векторная система, описанная в настоящем описании, содержит 2, 3, 4, 5, 6, 7, 8, 9, 10 или более чем 10 уникальных плазмид. В некоторых примерах, в рекурсивной векторной системе можно использовать конкретную плазмиду более одного раза, при условии, что отличную плазмиду используют в предшествующем цикле и в последующем цикле.
[00258] Рекурсивные способы и композиции, описанные в настоящем описании, можно использовать для восстановления функции селективного или позволяющего скрининг элемента в целевом геноме или плазмиде. Селективный или позволяющий скрининг элемент может включать ген устойчивости к антибиотику, флуоресцентный ген, уникальную последовательность ДНК или водяной знак, или другой известный репортер, позволяющий скрининг, или селективный ген. В некоторых примерах, в каждом последующем цикле конструирования можно вводить фрагмент селективного или позволяющего скрининг элемента, таким образом, что, в конце циклов конструирования, полный селективный или позволяющий скрининг элемент включают в целевой геном или плазмида. В таких примерах, можно проводить отбор или скрининг только тех геномов или плазмид, в которые успешно введены все эти фрагменты, и таким образом, все из желательных соответствующих мутаций. Таким образом, полученные в результате отбора или скрининга клетки можно обогащать по клеткам, включающим события редактирования из всех без исключения повторяющихся циклов конструирования.
[00259] Рекурсивные способы можно использовать для переключения селективного или позволяющего скрининг маркера между положением включения и выключения, или между положением выключения и включения, в каждом последующем цикле конструирования. Использование такого способа позволяет сохранение доступных селективных или позволяющих скрининг маркеров посредством необходимости, например, использования только одного позволяющего скрининг или селективного маркера. Кроме того, короткую регуляторную последовательность или инициирующий кодон, или неинициирующие кодоны можно использовать для включения и выключения позволяющего скрининг или селективного маркера. Такие короткие последовательности можно легко вписывать в синтезированную кассету или полинуклеотид.
[00260] Один или несколько циклов конструирования можно проводить с использованием способов и композиций, описанных в настоящем описании. В некоторых примерах, каждый цикл конструирования используют для введения редактирования, уникального по сравнению с редактированием из предшествующих циклов. В каждом цикле конструирования можно вводить уникальную записывающую последовательность. Каждый цикл конструирования может приводить к удалению или выведению плазмиды, используемой в предшествующем цикле конструирования. В некоторых примерах, успешное введение записывающей последовательности из каждого цикла конструирования приводит к полной и функциональной комбинации позволяющих скрининг или селективных маркеров, или уникальных последовательностей.
[00261] Уникальные записывающие кассеты, содержащие записывающие последовательности, такие как штрих-коды или позволяющие скрининг или селективные маркеры, можно вставлять в каждом цикле конструирования, таким образом, получая записывающую последовательность, показательную для комбинации проведенных стадий редактирования или конструирования. Последующие записывающие последовательности можно вставлять смежными друг с другом. Последующие записывающие последовательности можно вставлять поблизости друг от друга. Последующие последовательности можно вставлять на расстоянии друг от друга.
[00262] Последующие последовательности можно вставлять на расстоянии друг от друга. Например, последующие записывающие последовательности можно вставлять и разделять 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 или более чем 100 п.о. В некоторых примерах, последующие записывающие последовательности разделяют приблизительно 10, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, или более чем 1500 п.о.
[00263] Последующие записывающие последовательности могут быть разделены любым желательным количеством пар оснований и могут быть зависимыми от и иметь ограничения количества последующих записывающих последовательностей, подлежащих вставке, размера целевой нуклеиновой кислоты или целевых геномов, и/или дизайна желательной конечной записывающей последовательности. Например, если составная записывающая последовательность представляет собой функциональный позволяющий скрининг или селективный маркер, тогда последующие записывающие последовательности можно вставлять поблизости и внутри одной и той же рамки считывания, по отношению друг к другу. Если составная записывающая последовательность представляет собой уникальный набор штрих-кодов, подлежащих идентификации посредством секвенирования, и не имеет кодирующих элементов последовательности, тогда последующие записывающие последовательности можно вставлять с любым желательным количеством пар оснований, разделяющих их. В этих случаях, разделяющее расстояние может зависеть от технологии секвенирования, подлежащей использованию, и предела длины прочтения.
[00264] В то время как предпочтительные варианты осуществления настоящего изобретения показаны и описаны в настоящем описании, специалисту в данной области понятно, что такие варианты осуществления представлены только в качестве примера. В настоящее время различные варианты, изменения и замены очевидны специалисту в данной области без отклонения от изобретения. Следует понимать что различные альтернативы вариантам осуществления изобретения, описанным в настоящем описании, можно использовать в практическом осуществлении изобретения. Подразумевают, что следующая ниже формула определяет объем изобретения, и что способы и структуры в пределах объема пунктов этой формулы изобретения, и их эквиваленты включены в него.
Некоторые определения
[00265] В рамках изобретения, термин «дикий тип» представляет собой термин в данной области, понятный специалисту в данной области, и обозначает типичную форму организма, штамма, гена или характеристики, как она встречается в природе, в отличие от форм мутанта или варианта.
[00266] В рамках изобретения, термин «вариант» следует понимать как обозначающий проявление качеств, имеющее паттерн, отличающийся от встречающегося в природе.
[00267] Термины «ортологичный» (также обозначенный как «ортолог» в настоящем описании) и «гомологичный» (также обозначенный как «гомолог» в настоящем описании) хорошо известны в данной области. В качестве дополнительного объяснения, «гомолог» белка, в рамках изобретения, представляет собой белок из того же вида, который осуществляет такую же или сходную функцию, что и белок, гомологом которого он является. Гомологичные белки могут являться, но не обязательно должны являться структурно родственными, или являются только частично структурно родственными. «Ортолог» белка, в рамках изобретения, представляет собой белок из другого вида, который осуществляет такую же или сходную функцию, что и белок, ортологом которого он является. Ортологичные белки могут являться, но не обязательно должны являться структурно родственными, или являются только частично структурно родственными. Гомологи и ортологи можно идентифицировать посредством моделирования гомологии (см., например, Greer, Science vol. 228 (1985) 1055, и Blundell et al. Eur J Biochem vol 172 (1988), 513) или «структурный BLAST» (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a «structural BLAST»: using structural relationships to infer function. Protein Sci. 2013 April; 22(4):359-66. doi: 10.1002/pro.2225.).
[00268] Термины «полинуклеотид», «нуклеотид», «нуклеотидная последовательность», «нуклеиновая кислота» и «олигонуклеотид» используют взаимозаменяемо. Они относятся к полимерной форме нуклеотидов любой длины, дезоксирибонуклеотидов или рибонуклеотидов, или их аналогов. Полинуклеотиды могут иметь любую трехмерную структуру и могут осуществлять любую функцию, известную или неизвестную. Ниже приведены неограничивающие примеры полинуклеотидов: кодирующие или некодирующие области гена или фрагмента гена, локусы (локус), определенные из анализа сцепления, экзоны, интроны, матричная РНК (мРНК), транспортная РНК, рибосомальная РНК, малая интерферирующая РНК (миРНК), короткошпилечная РНК (кшРНК), микро-РНК (мкРНК), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенная ДНК любой последовательности, выделенная РНК любой последовательности, зонды на основе нуклеиновой кислоты и праймеры. Термин включает также подобные нуклеиновым кислотам структуры с синтетическими остовами, см., например, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997; и Samstag, 1996. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, таких как метилированные нуклеотиды и аналоги нуклеотидов. Если они присутствуют, модификации нуклеотидной структуры можно вводить до или после сборки полимера. Последовательность нуклеотидов может прерываться ненуклеотидными компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, например, посредством конъюгации с метящим компонентом.
[00269] «Комплементарность» относится к способности нуклеиновой кислоты формировать водородную связь(связи) с другой последовательностью нуклеиновой кислоты посредством либо традиционного спаривания оснований по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процент остатков в молекуле нуклеиновой кислоты, которые могут формировать водородные связи (например, спаривание оснований по Уотсону-Крику) с второй последовательностью нуклеиновой кислоты (например, 5, 6, 7, 8, 9, 10 из 10, составляющие 50%, 60%, 70%, 80%, 90% и 100% комплементарность). «Полностью комплементарные» означает, что все непрерывные остатки последовательности нуклеиновой кислоты могут формировать водородные связи с таким же количеством непрерывных остатков во второй последовательности нуклеиновой кислоты. «В основном комплементарные», в рамках изобретения, относится к степени комплементарности, составляющей по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, или 100% over a region of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизуются в строгих условиях.
[00270] В рамках изобретения, «строгие условия» гибридизации относятся к условиям, в которых нуклеиновая кислота, имеющая комплементарность с последовательностью-мишенью, преимущественно гибридизуется с последовательностью-мишенью, и по существу не гибридизуется с нецелевыми последовательностями. Строгие условия, в основном, являются зависимыми от последовательности, и меняются в зависимости от ряда факторов. Как правило, чем длиннее последовательность, тем выше температура, при которой последовательность специфически гибридизуется со своей последовательностью-мишенью. Неограничивающие примеры строгих условий подробно описаны в Tijssen (1993). Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter «Overview of principles of hybridization and the strategy of nucleic acid probe assay», Elsevier, N.Y. Когда приведена ссылка на полинуклеотидую последовательность, тогда комплементарные или частично комплементарные последовательности также подразумевают. Они, предпочтительно, являются способными гибридизоваться с эталонной последовательностью в условиях высокой строгости. Как правило, для максимизации уровня гибридизации, выбирают условия гибридизации относительно низкой строгости: приблизительно на 20-25 градусов Цельсия ниже, чем температура плавления (Tm). Tm представляет собой температуру, при которой 50% специфической последовательности-мишени гибридизуется с полностью комплементарным зондом в растворе при определенной ионной силе и pH. Как правило, при необходимости по меньшей мере приблизительно 85% комплементарности нуклеотидов гибридизующихся последовательностей, выбирают условия промывки высокой строгости, составляющие приблизительно на 5-15 градусов Цельсия ниже, чем Tm. При необходимости по меньшей мере приблизительно 70% комплементарности нуклеотидов гибридизующихся последовательностей, выбирают условия промывки умеренной строгости, составляющие приблизительно на 15-30 градусов Цельсия ниже, чем Tm. Высоко пермиссивные условия промывки (очень низкой строгости) могут являться настолько низкими, как на 50 градусов Цельсия ниже Tm, позволяя высокий уровень несовпадений между гибридизующимися последовательности. Специалисту в данной области понятно, что другие физические и химические параметры на стадиях гибридизации и промывки также можно изменять для влияния на выход сигнала поддающейся детекции гибридизации при конкретном уровне гомологии между последовательностями мишени и зонда.
[00271] «Гибридизация» относится к реакции, в которой один или несколько полинуклеотидов вступают в реакцию с формированием комплекса, стабилизированного посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить посредством спаривания оснований по Уотсону-Крику, связывания по Хугстину или любым другим специфическим для последовательности образом. Комплекс может содержать две цепи, формирующие дуплексную структуру, три или более цепи, формирующих многоцепочечный комплекс, одну самогибридизующуюся цепь, или любую их комбинацию. Реакция гибридизации может составлять стадию более обширного процесса, такого как инициация ПЦР, или расщепления полинуклеотида посредством фермента. Последовательность, способную гибридизоваться с данной последовательностью, обозначают как «комплементарную» данной последовательности.
[00272] В рамках изобретения, термин «геномный локус» или «локус» (множество локусов) представляет собой специфическую локализацию гена или последовательности ДНК на хромосоме. «Ген» относится к фрагментам ДНК или РНК, кодирующим полипептид или цепь РНК, которые играют функциональную роль в организм и таким образом, представляют собой молекулярную единицу наследственности в живых организмах. Для целей по этому изобретению, можно считать, что гены включают области, регулирующие продукцию продукта гена, независимо от того, являются или нет такие регуляторные последовательности смежными с кодирующими и/или транскрибируемыми последовательностями. Соответственно, ген включает, но не обязательно ограничен ими, промоторные последовательности, терминаторы, регуляторные последовательности трансляции, такие как участки связывания рибосом и внутренние участки связывания рибосом, энхансеры, сайленсеры, инсуляторы, пограничные элементы, точки начала репликации, участки прикрепления к матриксу и контрольные области локуса.
[00273] В рамках изобретения, «экспрессия геномного локуса» или «экспрессия гена» представляет собой процесс, посредством которого информация из гена используется в синтезе функционального продукта гена. Продуктами экспрессии гена часто являются белки, но для не кодирующих белки генов, таких как гены рРНК или гены тРНК, продуктом является функциональная РНК. Процесс экспрессии генов используют все известные живые эукариоты (включая многоклеточные организмы), прокариоты (бактерии и археи) и вирусы для получения функциональных продуктов для выживания. В рамках изобретения, «экспрессия» гена или нуклеиновой кислоты включает не только клеточную экспрессию гена, но также транскрипцию и трансляцию нуклеиновой кислоты(кислот) в системах клонирования и в любом другом контексте. В рамках изобретения, «экспрессия» относится также к процессу, посредством которого полинуклеотид транскрибируется с ДНК-матрицы (например, в мРНК или другой транскрипт РНК) и/или к процессу, посредством которого транскрибированная мРНК впоследствии транслируется в пептиды, полипептиды или белки. Транскрипты и кодированные полипептиды можно совместно обозначать как «продукты гена». Если полинуклеотид происходит из геномной ДНК, экспрессия может включать сплайсинг мРНК в эукариотической клетке.
[00274] Термины «полипептид», «пептид» и «белок» используют в настоящем описании взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может являться линейным или разветвленным, он может содержать модифицированные аминокислоты, и может прерываться не аминокислотами. Термин включает также аминокислотный полимер, который был модифицирован; например, посредством образования дисульфидной связи, гликозилирования, липидизации, ацетилирования, фосфорилирования или любой другой манипуляции, такой как конъюгация с метящим компонентом. В рамках изобретения, термин «аминокислота» включает природные и/или неприродные, или синтетические аминокислоты, включая глицин и D или L оптические изомеры, и аналоги аминокислот, и пептидомиметики.
[00275] В рамках изобретения, термин «домен» или «домен белка» относится к части белковой последовательности, которая может существовать и функционировать независимо от остальной белковой цепи.
[00276] Как описано в аспектах изобретения, идентичность последовательности относится к гомологии последовательности. Сравнения гомологии можно проводить визуально, или более обычно, с помощью легко доступных программы для сравнения последовательностей. Эти коммерчески доступные компьютерные программы могут рассчитывать (%) гомологии между двумя или более последовательностями и могут также рассчитывать идентичность последовательности, разделяемую двумя или более аминокислотными последовательностями или последовательностями нуклеиновых кислот. Гомологию последовательностей можно получать посредством любой из ряда компьютерных программ, известных в данной области, например, BLAST или FASTA и т.д. Пригодной компьютерной программой для проведения такого выравнивания является пакет GCG Wisconsin Bestfit (University of Wisconsin. U.S.A; Devereux et al., 1984, Nucleic Acids Research 12:387). Примеры другого программного обеспечения, которое может проводить сравнение последовательностей, включают, но без ограничения, пакет BLAST package (см. Ausubel et al., 1999, там же - Раздел 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410) и набор инструментов сравнения GENEWORKS. Как BLAST, так и FASTA, являются доступными для поиска в режиме офлайн и онлайн (см. Ausubel et al., 1999, там же, страницы 7-58-7-60). Однако предпочтительным является использование программы GCG Bestfit.
[00277] Процент гомологии можно рассчитывать на протяжении непрерывных последовательностей, т.е., одну последовательность выравнивают с другой последовательностью, и каждую аминокислоту или нуклеотид в одной последовательности непосредственно сравнивают с соответствующей аминокислотой или нуклеотидом в другой последовательности, по одному остатку за один раз. Это называют выравниванием «без пропусков». Как правило, такое выравнивание без пропусков осуществляют только на протяжении относительно небольшого количества остатков.
[00278] Хотя это является очень простым и непротиворечивым способом, он не может принимать во внимание то, что, например, в идентичной в ином отношении паре последовательностей, одна вставка или делеция может заставлять последующие аминокислотные остатки выпадать из выравнивания, таким образом, потенциально приводя к большому уменьшению % гомологии при проведении глобального выравнивания. Следовательно, большинство способов сравнения последовательностей разработаны для получения оптимального выравнивания, принимающего во внимание возможные вставки и делеции, без излишних штрафов в общем показателе гомологии или идентичности. Этого достигают посредством вставки «пропусков» при выравнивании последовательностей в попытке максимизировать локальную гомологию или идентичность.
[00279] Однако, в этих более сложных способах приписывают «штрафы за пропуски» каждому пропуску, возникающему при выравнивании, таким образом, что, для одинакового количества идентичных аминокислот, при выравнивании последовательностей с настолько малым количеством пропусков, насколько возможно - что отражает более высокое родство между двумя сравниваемыми последовательностями - можно достигать более высокого показателя, чем с множеством пропусков. Как правило, используют «аффинную стоимость пропуска», которая запрашивает относительно высокую стоимость за открытие пропуска и меньший штраф за каждый последующий остаток в пропуске. Это является наиболее распространенной системой оценки пропусков. Высокие штрафы за пропуски могут, разумеется, приводить к оптимизированному выравниванию с меньшим количеством пропусков. Большинство программ для выравнивания позволяют модификацию штрафов за пропуски. Однако является предпочтительным использование значений по умолчанию при использовании такого программного обеспечения для сравнения последовательностей. Например, при использовании пакета GCG Wisconsin Bestfit, штраф за пропуск по умолчанию для аминокислотных последовательностей составляет -12 за открытие пропуска и -4 за каждое продление.
[00280] Расчет максимального % гомологии, таким образом сначала требует получение оптимального выравнивания, принимающего во внимание штрафы за пропуски. Пригодной компьютерной программой для проведения такого выравнивания является пакет GCG Wisconsin Bestfit (Devereux et al., 1984 Nuc. Acids Research 12 p387). Примеры другого программного обеспечения, которое может проводить сравнение последовательностей, включают, но без ограничения, пакет BLAST (см. Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed.--Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410) и набор инструментов сравнения GENEWORKS. Как BLAST, так и FASTA, являются доступными для поиска в режиме офлайн и онлайн (см. Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 to 7-60). Однако для некоторых применений, предпочтительным является использование программы GCG Bestfit. Новый инструмент, называемый BLAST 2 Sequences, также является доступным для сравнения белковых и нуклеотидных последовательности (см. FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 и вебсайт Национального центра биотехнологической информации на вебсайте Национального института здравоохранения).
[00281] Хотя конечный % гомологии можно измерять в отношении идентичности, сам способ выравнивания, как правило, не основан на попарном сравнении по принципу «все или ничего». Вместо этого, как правило, используют масштабированную матрицу баллов сходства, приписывающую баллы каждому попарному сравнению на основании химического сходства или эволюционного расстояния. Примером такой общепринятой матрицы является матрица BLOSUM62 матрица по умолчанию для пакета программ BLAST. В программе GCG Wisconsin, как правило, используют либо общедоступные значения по умолчанию, либо пользовательскую таблицу сравнения символов, если она входит в поставку (см. руководство пользователя применительно к дополнительным деталям). Для некоторых применений, предпочтительным является использование общедоступных значений по умолчанию для пакета GCG, или, в случае другого программного обеспечения, матрицы по умолчанию, такой как BLOSUM62.
[00282] Альтернативно, проценты гомологии можно рассчитывать с использованием функции множественного выравнивания в DNASIS™ (Hitachi Software), на основании алгоритма, аналогичного CLUSTAL (Higgins D G & Sharp P M (1988), Gene 73(1), 237-244). После получения оптимального выравнивания посредством программного обеспечения, можно рассчитывать % гомологии, предпочтительно, % идентичности последовательности. Программное обеспечение как правило, осуществляет это в качестве части сравнения последовательностей и получает числовой результат.
[00283] Последовательности могут иметь также делеции, вставки или замены аминокислотных остатков, образующие молчащую замену и приводящие к функционально эквивалентному веществу. Намеренные аминокислотные замены можно осуществлять на основе сходства свойств аминокислот (например, полярности, заряда, растворимости, гидрофобности, гидрофильности, и/или амфипатической природы остатков) и, таким образом, это можно использовать для группировки аминокислот в функциональные группы. Аминокислоты можно группировать на основании только свойств их боковых цепей. Однако, более полезно включать также данные о мутациях. Выведенные таким образом группы аминокислот, вероятно, являются консервативными по структурным признакам. Эти группы могут быть описаны в форме диаграммы Венна (Livingstone C. D. and Barton G. J. (1993) «Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation» Comput. Appl. Biosci. 9: 745-756) (Taylor W. R. (1986) «The classification of amino acid conservation» J. Theor. Biol. 119; 205-218). Консервативные замены можно осуществлять, например, в соответствии с таблицей ниже, описывающей общепринятую группировку аминокислот по диаграмме Венна.
[00284] Варианты осуществления изобретения включают последовательности (полинуклеотидные или полипептидные), которые могут содержать гомологичную замену (как замещение, так и замену используют в настоящем описании для обозначения замены существующего аминокислотного остатка или нуклеотида на альтернативный остаток или нуклеотид), которая может происходить, т.е., замену подобной на подобную в случае аминокислот, например, основной на основную, кислой на кислую, полярной на полярную и т.д. Может происходить также негомологичная замена т.е., одного класса остатка на другой, или, альтернативно, вовлекающая включение неприродных аминокислот, таких как орнитин (далее в настоящем описании обозначенный как Z), диаминомасляная кислота-орнитин (далее в настоящем описании обозначенная как B), норлейцин-орнитин (далее в настоящем описании обозначенный как O), пиридилаланин, тиенилаланин, нафтилаланин и фенилглицин.
[00285] Варианты аминокислотных последовательностей могут содержать подходящие спейсерные группы, которые можно вставлять между любыми двумя аминокислотными остатками в последовательности, включая алкильные группы, такие как метильные, этильные или пропильные группы в дополнение к аминокислотным спейсерам, таким как остатки глицина или бета-аланина остатки. Дополнительная форма варианта, включающая присутствие одного или нескольких аминокислотных остатков в пептоидной форме, хорошо известна специалисту в данной области. Чтобы избежать неопределенности, «пептоидную форму» используют для обозначения вариантов аминокислотных остатков, где замещающая группа альфа-углерода находится на атоме азота остатка, а не на атоме альфа-углерода. Способы получения пептидов в пептоидной форме известны в данной области, например, Simon R J et al., PNAS (1992) 89(20), 9367-9371 и Horwell D C, Trends Biotechnol. (1995) 13(4), 132-134.
[00286] В практическом осуществлении настоящего изобретения используют, если не указано иначе, общепринятые способы иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и рекомбинантной ДНК, находящиеся в компетенции специалиста в данной области. См. Green and Sambrook, (Molecular Cloning: A Laboratory Manual. 4th, ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2014); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (2017)); Short Protocols in Molecular Biology, (Ausubel et al., 1999)); серии METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M. J. MacPherson, B. D. Hames and G. R. Taylor eds. (1995)), ANTIBODIES, A LABORATORY MANUAL, SECOND EDITION (Harlow and Lane, eds. (2014) и Culture of Animal Cells: A Manual of Basic Technique, 7th EditioN (R. I. Freshney, ed. (2016)).
ПРИМЕРЫ
[00287] Следующие примеры приведены с целью иллюстрации различных вариантов осуществления изобретения и не предназначены для ограничения настоящего изобретения никаким образом. Настоящие примеры, вместе со способами, описанными в настоящем описании, являются в настоящее время репрезентативными для предпочтительных вариантов осуществления, являются иллюстративными, и не предназначены для ограничения объема изобретения. Их изменения и другие применения, включенные в объем изобретения, как определено объемом формулы изобретения, могут быть предложены специалистом в данной области.
Пример 1. Направляемые нуклеиновыми кислотами нуклеазы
[00288] Последовательности двадцати направляемых нуклеиновой кислотой нуклеаз, названных MAD1-MAD20 (SEQ ID NO 1-20), выравнивали и сравнивали с другими направляемыми нуклеиновыми кислотами нуклеазами. Частичное выравнивание специфических аминокислот нуклеаз и филогенетическое древо показаны на фигуре 1A и фигуре 1B, соответственно. Ключевые остатки, которые могут быть вовлечены в узнавание участка PAM, показаны на фигуре 1A. Они включают аминокислоты в положениях 167, 539, 548, 599, 603, 604, 605, 606, и 607.
[00289] Выравнивания последовательностей строили с использованием PSI-BLAST для поиска гомологов нуклеазы MAD в неизбыточных базах данных NCBI. Множественные выравнивания последовательностей дополнительно уточняли с использованием алгоритма выравнивания MUSCLE с установками по умолчанию, как воплощено в Geneious 10. Процент идентичности каждого гомолога с эталонными последовательностями SpCas9 и AsCpf1 рассчитывали на основании совпадения при попарном выравнивании из этих глобальных выравниваний.
[00290] Геномные источники последовательностей идентифицировали с использованием информации о сцеплении в Uniprot или поисков TBLASTN в NCBI с использованием параметров по умолчанию и поиска всех возможных рамок считывания для трансляционных совпадений.
[00291] Проценты идентичности of MAD1-8 и 10-12 с различными другими нуклеазами обобщены в таблице 1. Эти проценты идентичности представляют собой идентичность аминокислотной последовательности, разделяемую указанными белками.
Таблица 1
Идентификатор или номер доступа для белка | MAD1 | MAD2 | MAD3 | MAD4 | MAD5 | MAD6 | MAD7 | MAD8 | MAD10 | MAD11 | MAD12 |
gi|1025734861|pdb|5B43|A | 6,4 | 32,8 | 33,2 | 29,7 | 29,4 | 31,1 | 30,3 | 31,7 | 26,7 | 27,9 | 98,8 |
gi|1052245173|pdb|5KK5|A | 6,4 | 32,7 | 33,1 | 29,7 | 29,3 | 31 | 30,3 | 31,7 | 26,7 | 27,8 | 98,7 |
gi|1086216683|emb|SDC16215.1| | 6,1 | 33 | 34,4 | 29,6 | 30,1 | 33,5 | 32,3 | 32,1 | 26,2 | 27,2 | 46,8 |
gi|1120175333|ref|WP_073043853.1| | 5,9 | 30,9 | 37,2 | 32,8 | 33,6 | 34,4 | 35,7 | 35,1 | 26,3 | 28,3 | 34,9 |
Cpf1.Sj |WP_081839471 | 6,6 | 33,6 | 41,7 | 37,2 | 33,4 | 37,6 | 40,1 | 37,7 | 29,1 | 30,3 | 34,1 |
Cpf1.Ss|KFO67989 | 6,9 | 32,3 | 35,7 | 43 | 33,7 | 45,9 | 34,8 | 48 | 33,2 | 33,4 | 33,8 |
MAD3 | 5,8 | 31 | 100 | 32,9 | 35,9 | 35 | 35,6 | 34,3 | 28 | 27,6 | 33,1 |
gi|1082474576|gb|OFY19591.1| | 7 | 31,4 | 35,9 | 43,2 | 31,4 | 45 | 33,6 | 48,6 | 30,8 | 33,5 | 33 |
MAD2 | 6,1 | 100 | 31 | 30,7 | 30,2 | 31 | 31,2 | 31,2 | 25,8 | 27,7 | 32,6 |
Cpf1.Lb5|WP_016301126 | 7,8 | 32,8 | 36,5 | 38,2 | 34,2 | 45,5 | 35,8 | 43,6 | 30,7 | 35,7 | 32,5 |
gi|1088286736|gb|OHB41002.1| | 6,7 | 30,6 | 35,3 | 42,4 | 33,2 | 44,7 | 32,1 | 46,8 | 30,7 | 32,6 | 32,4 |
gi|1094423310|emb|SER03894.1| | 6,8 | 30,8 | 36,1 | 40,4 | 31,8 | 50,4 | 35,2 | 46,6 | 30,4 | 36,8 | 32,3 |
gi|493326531|ref|WP_006283774.1| | 6,8 | 30,8 | 36,1 | 40,3 | 31,8 | 50,3 | 35,1 | 46,6 | 30,4 | 36,8 | 32,3 |
MAD8 | 7,6 | 31,2 | 34,3 | 40,4 | 32 | 41,6 | 32,8 | 100 | 30,1 | 32,1 | 31,7 |
Cpf1.Bot|WP_009217842 | 6,9 | 30,1 | 36,6 | 41,5 | 32,5 | 50,2 | 35,4 | 45,5 | 29,8 | 34,1 | 31,6 |
Cpf1.Li|WP_020988726 | 7,3 | 30,2 | 34,6 | 39,3 | 30,3 | 40,7 | 31,8 | 39,4 | 32,1 | 31,3 | 31,5 |
Cpf1.Pb|WP_044110123 | 6,3 | 31,4 | 31,8 | 36,1 | 30,8 | 45,7 | 30,4 | 39,4 | 27,7 | 33,5 | 31,5 |
gi|817911372|gb|AKG08867.1| | 7,3 | 29,8 | 35 | 40,7 | 32,1 | 40,3 | 32,6 | 41,7 | 29,1 | 31 | 31,4 |
gi|1052838533|emb|SCH45297.1| | 6,6 | 30,8 | 35,5 | 32 | 31,5 | 34,4 | 51,9 | 33,4 | 26,1 | 29 | 31,3 |
gi|1053713332|ref|WP_066040075.1| | 7,2 | 29,6 | 33,2 | 39,6 | 29,8 | 49,1 | 32,2 | 41,4 | 30,1 | 32,4 | 31,3 |
gi|817909002|gb|AKG06878.1| | 7,3 | 29,8 | 35 | 40,7 | 32 | 40,3 | 32,5 | 41,6 | 29,1 | 30,9 | 31,3 |
gi|1042201477|ref|WP_065256572.1| | 7,2 | 29,5 | 35,2 | 40,6 | 31,9 | 40,1 | 32,7 | 41,6 | 29 | 30,8 | 31,2 |
MAD6 | 7,5 | 31 | 35 | 38,9 | 33,1 | 100 | 34,3 | 41,6 | 30,5 | 33,6 | 31 |
gi|490468773|ref|WP_004339290.1| | 6,8 | 31,8 | 31,7 | 36,2 | 28,6 | 36,5 | 31,4 | 38,4 | 28,5 | 31,4 | 31 |
gi|565853704|ref|WP_023936172.1| | 7,5 | 30,8 | 34,9 | 38,9 | 33,1 | 99,7 | 34,1 | 41,6 | 30,4 | 33,6 | 31 |
gi|739005707|ref|WP_036887416.1| | 7,5 | 30,9 | 35 | 38,9 | 33 | 99,9 | 34,2 | 41,5 | 30,4 | 33,5 | 31 |
gi|739008549|ref|WP_036890108.1| | 7,5 | 31 | 35 | 38,8 | 33 | 99,8 | 34,2 | 41,5 | 30,4 | 33,5 | 31 |
Cpf1.Ft|WP_014550095 | 7,1 | 31,9 | 33,8 | 40,3 | 29,7 | 39,4 | 34,1 | 41 | 29,8 | 32,5 | 30,8 |
gi|504362993|ref|WP_014550095.1| | 7,2 | 32,4 | 33,8 | 40,3 | 29,6 | 39,4 | 33,8 | 40,9 | 30,1 | 32,5 | 30,8 |
gi|640557447|ref|WP_024988992.1| | 6,6 | 31,4 | 34,8 | 40,7 | 31,2 | 48 | 34,1 | 45,1 | 28,8 | 35,2 | 30,8 |
gi|1098944113|ref|WP_071304624.1| | 7,1 | 32,3 | 33,5 | 40,3 | 29,6 | 39,2 | 33,8 | 40,9 | 30,1 | 32,5 | 30,6 |
gi|489124848|ref|WP_003034647.1| | 7,1 | 32,3 | 33,9 | 40,9 | 29,9 | 39,2 | 33,9 | 40,9 | 29,9 | 32,2 | 30,6 |
gi|738967776|ref|WP_036851563.1| | 6,8 | 29,4 | 33,1 | 35,5 | 28,9 | 40,3 | 30,7 | 35,9 | 28,7 | 31,3 | 30,5 |
MAD7 | 5,9 | 31,2 | 35,6 | 30,8 | 33,9 | 34,3 | 100 | 32,8 | 24,2 | 28,9 | 30,5 |
Cpf1.Lb6|WP_044910713 | 6,7 | 29,8 | 33,7 | 36,6 | 30,9 | 43 | 34 | 39,8 | 29,1 | 32,1 | 30,4 |
gi|1052961977|emb|SCH47915.1| | 5,5 | 30,5 | 35,8 | 32,3 | 34 | 35 | 53,8 | 33,4 | 26,2 | 27,4 | 30,4 |
gi|817918353|gb|AKG14689.1| | 7 | 29,1 | 34,4 | 39,8 | 31,7 | 40 | 32,4 | 41,1 | 28,4 | 30,1 | 30,3 |
gi|917059416|ref|WP_051666128.1| | 6,9 | 29,9 | 31,5 | 35,7 | 31,6 | 41,8 | 32,9 | 39,1 | 30,1 | 34 | 30,2 |
gi|1011649201|ref|WP_062499108.1| | 6,8 | 29 | 34,7 | 40,3 | 31,4 | 40,1 | 33,1 | 41,6 | 28,5 | 30,4 | 30,1 |
Cpf1.Pm|WP_018359861 | 6,3 | 29,2 | 32,3 | 34,2 | 27,4 | 38,7 | 29,4 | 35 | 27,2 | 30,1 | 30 |
gi|817922537|gb|AKG18099.1| | 6,8 | 29,1 | 34,5 | 39,6 | 31,5 | 39,9 | 32,7 | 40,7 | 28,3 | 29,8 | 30 |
gi|769142322|ref|WP_044919442.1| | 6,7 | 31 | 34,6 | 37,8 | 31,5 | 41,4 | 33,3 | 39,2 | 28 | 31,9 | 29,9 |
gi|1023176441|pdb|5ID6|A | 6,7 | 29,7 | 31,3 | 35,5 | 31,3 | 41 | 32,6 | 38,5 | 29,7 | 33,3 | 29,8 |
gi|491540987|ref|WP_005398606.1| | 5,9 | 28,3 | 30,4 | 29,7 | 28,5 | 29 | 30,7 | 29,8 | 25,8 | 27,8 | 29,8 |
gi|652820612|ref|WP_027109509.1| | 6,4 | 31,1 | 34 | 35,3 | 31,7 | 40,3 | 33,4 | 37,5 | 28,5 | 33,3 | 29,8 |
gi|502240446|ref|WP_012739647.1| | 5,9 | 31,6 | 36,1 | 31,2 | 33 | 35,4 | 49,4 | 34 | 26,6 | 29,4 | 29,7 |
gi|524278046|emb|CDA41776.1| | 5,8 | 31,6 | 36 | 31 | 33 | 35,4 | 50 | 34 | 26,6 | 29,5 | 29,7 |
gi|737831580|ref|WP_035798880.1| | 6,2 | 31,3 | 34,8 | 38,1 | 31,5 | 42,1 | 33 | 39,6 | 28,4 | 32,4 | 29,7 |
gi|909652572|ref|WP_049895985.1| | 6,9 | 30,7 | 34,2 | 37,2 | 30,8 | 41,5 | 34,2 | 38,7 | 28 | 32 | 29,7 |
MAD4 | 6,7 | 30,7 | 32,9 | 100 | 30,7 | 38,9 | 30,8 | 40,4 | 28,8 | 29,4 | 29,7 |
gi|942073049|ref|WP_055286279.1| | 5,9 | 31,6 | 36,1 | 31,1 | 32,7 | 35 | 49,7 | 33,9 | 27,1 | 29,5 | 29,6 |
gi|654794505|ref|WP_028248456.1| | 7,4 | 30,5 | 35,9 | 37,4 | 31,3 | 42,8 | 34,2 | 40,2 | 27,9 | 33,5 | 29,5 |
gi|933014786|emb|CUO47728.1| | 5,6 | 31,3 | 34,9 | 31,2 | 31,5 | 32,4 | 46,7 | 30,6 | 25,4 | 27,7 | 29,4 |
gi|941887450|ref|WP_055224182.1| | 5,6 | 31,4 | 35 | 31,3 | 31,6 | 32,5 | 46,6 | 30,7 | 25,3 | 27,8 | 29,4 |
gi|920071674|ref|WP_052943011.1| | 6,3 | 31 | 31,8 | 38,8 | 31,8 | 41,3 | 33,8 | 42,6 | 29,8 | 34,7 | 29 |
MAD5 | 5,1 | 30,2 | 35,9 | 30,7 | 100 | 33,1 | 33,9 | 32 | 24,3 | 28,7 | 29 |
gi|1081462674|emb|SCZ76797.1| | 6,9 | 30,4 | 33,5 | 34,7 | 29,7 | 40,1 | 30,5 | 37,4 | 27,3 | 32,5 | 28,9 |
gi|918722523|ref|WP_052585281.1| | 7,4 | 27,5 | 30,5 | 35,7 | 28,3 | 35,2 | 28,5 | 36 | 26 | 27,1 | 28,8 |
gi|524816323|emb|CDF09621.1| | 6,2 | 30 | 34,1 | 29,3 | 31,2 | 32,7 | 47,6 | 32,2 | 25,5 | 25,9 | 28,4 |
gi|941782328|ref|WP_055176369.1| | 6,2 | 30,2 | 33,1 | 28,9 | 30,9 | 32 | 46,9 | 32,1 | 26 | 27,1 | 28,4 |
gi|942113296|ref|WP_055306762.1| | 6,4 | 29,8 | 33,8 | 29,7 | 31,3 | 33,1 | 48 | 32,5 | 25,8 | 26,2 | 28,4 |
MAD11 | 6,4 | 27,7 | 27,6 | 29,4 | 28,7 | 33,6 | 28,9 | 32,1 | 26,2 | 100 | 27,8 |
gi|653158548|ref|WP_027407524.1| | 5,9 | 26,4 | 28,1 | 33,5 | 27,4 | 32,5 | 27,8 | 32 | 27 | 26,8 | 27,6 |
gi|652963004|ref|WP_027216152.1| | 6,6 | 30,3 | 32,5 | 33,2 | 30,4 | 38,2 | 29,6 | 34,6 | 25,9 | 30,5 | 27,2 |
gi|1083069650|gb|OGD68774.1| | 6,2 | 25 | 24,3 | 26,6 | 23,1 | 28,1 | 23,2 | 26,4 | 45 | 24,9 | 27,1 |
gi|302483275|gb|EFL46285.1| | 5,6 | 24,7 | 26,8 | 30,3 | 24,9 | 34,8 | 26 | 30,4 | 24,4 | 27,5 | 27,1 |
gi|915400855|ref|WP_050786240.1| | 5,6 | 24,7 | 26,8 | 30,3 | 24,9 | 34,8 | 26 | 30,4 | 24,4 | 27,5 | 27,1 |
MAD10 | 5,6 | 25,8 | 28 | 28,8 | 24,3 | 30,5 | 24,2 | 30,1 | 100 | 26,2 | 26,6 |
gi|1101117967|gb|OIO75780.1| | 6,1 | 26,8 | 26 | 27,3 | 24,3 | 28,1 | 24,4 | 28,2 | 44,1 | 25,4 | 26,1 |
gi|1088204458|gb|OHA63117.1| | 6,5 | 25,2 | 23,5 | 25,8 | 22,9 | 27 | 22 | 26,1 | 36,5 | 24,2 | 24,7 |
gi|809198071|ref|WP_046328599.1| | 4,9 | 25,6 | 26,5 | 22,2 | 23,9 | 23,8 | 25,8 | 23,9 | 20,3 | 25,1 | 24 |
gi|1088079929|gb|OGZ45678.1| | 5,6 | 21,9 | 23,8 | 26,9 | 23,4 | 27,8 | 23,3 | 26,7 | 28,8 | 24,7 | 23,5 |
gi|1101053499|gb|OIO15737.1| | 5,9 | 23,1 | 26,2 | 25,2 | 23 | 26,4 | 25,1 | 26,5 | 29,2 | 23,2 | 23,4 |
gi|1101058058|gb|OIO19978.1| | 5,4 | 21,2 | 22,8 | 23,6 | 20,6 | 25 | 20,7 | 25 | 25,9 | 22,2 | 23 |
gi|1088000848|gb|OGY73485.1| | 5,7 | 23,5 | 25,2 | 25,5 | 23,9 | 27 | 25,1 | 25,6 | 31,6 | 23,6 | 22,9 |
gi|407014433|gb|EKE28449.1| | 5,2 | 23,5 | 25,9 | 26,7 | 24,3 | 25,8 | 23 | 27,8 | 29,9 | 25,3 | 22,9 |
gi|818249855|gb|KKP36646.1| | 6 | 21 | 20,7 | 23,5 | 20 | 24,2 | 21 | 24 | 24,6 | 21,8 | 22,6 |
gi|818703647|gb|KKT48220.1| | 5,8 | 23,3 | 25 | 25,1 | 23,5 | 26,5 | 24,7 | 25,3 | 31,2 | 23,3 | 22,6 |
gi|818705786|gb|KKT50231.1| | 5,8 | 23,1 | 24,6 | 24,7 | 22,9 | 26,2 | 24,2 | 24,8 | 30,8 | 22,9 | 22,2 |
gi|1083950632|gb|OGJ66851.1| | 4,5 | 20 | 22,1 | 23,5 | 20,6 | 24,6 | 20 | 24 | 23,5 | 20,7 | 22,1 |
gi|1083932199|gb|OGJ49885.1| | 6 | 20,4 | 20,2 | 22,6 | 19,3 | 23,3 | 20,6 | 23,2 | 23,9 | 21 | 21,8 |
gi|1083410735|gb|OGF20863.1| | 5 | 21,7 | 23,3 | 25,5 | 23 | 25 | 22,7 | 25,9 | 27,2 | 22,4 | 21,5 |
gi|1011480927|ref|WP_062376669.1| | 4,7 | 20,1 | 20,1 | 21,4 | 19,3 | 23,3 | 21,4 | 22 | 20,2 | 19,7 | 20,9 |
gi|818539593|gb|KKR91555.1| | 5,1 | 19,8 | 21,6 | 22,1 | 20,5 | 22,9 | 21,2 | 22,8 | 24 | 20,5 | 19,9 |
gi|503048015|ref|WP_013282991.1| | 5,1 | 18,8 | 20,7 | 15,3 | 19,7 | 18,9 | 19,3 | 17,7 | 15,9 | 19 | 19,2 |
gi|1096232746|ref|WP_071177645.1| | 5 | 19,1 | 20,5 | 17,4 | 20,1 | 19,7 | 20,4 | 20,4 | 17,5 | 18,5 | 18,9 |
gi|769130404|ref|WP_044910712.1| | 4,6 | 19,4 | 18,2 | 16,1 | 18,1 | 17,1 | 18,7 | 17,9 | 14,5 | 16,8 | 17,5 |
gi|1085569500|gb|OGX23684.1| | 2,6 | 11,6 | 12,1 | 12,7 | 10,2 | 12,1 | 12,7 | 11,6 | 10,9 | 11,1 | 10,5 |
gi|818357062|gb|KKQ38176.1| | 3,3 | 10 | 11,1 | 10,6 | 11,1 | 11,8 | 12,1 | 11,5 | 12,2 | 10,8 | 9,8 |
gi|745626763|gb|KIE18642.1| | 3,7 | 9,4 | 11,7 | 11,1 | 11,1 | 12,5 | 11,9 | 11,9 | 10,2 | 10,6 | 8,8 |
MAD1 | 100 | 6,1 | 5,8 | 6,7 | 5,1 | 7,5 | 5,9 | 7,6 | 5,6 | 6,4 | 6,4 |
SpCas9 | 4 | 6,3 | 6,5 | 8,3 | 5,6 | 8,1 | 6,9 | 7,7 | 6,9 | 6,3 | 6,3 |
MAD12 | 6,4 | 32,6 | 33,1 | 29,7 | 29 | 31 | 30,5 | 31,7 | 26,6 | 27,8 | 100 |
Пример 2: Экспрессия нуклеаз MAD
[00292] Последовательности нуклеиновых кислот дикого типа для MAD1-MAD20 включают SEQ ID NO 21-40, соответственно. Эти нуклеазы MAD подвергали оптимизации кодонного состава для экспрессии in E. coli, и последовательности с оптимизированным кодонным составом перечислены как SEQ ID NO: 41-60 (обобщены в таблице 2).
[00293] Эти MAD1-MAD20 с оптимизированным кодонным составом клонировали в экспрессирующую конструкцию, содержащую конститутивный или индуцируемый промотор (например, промотор proB, SEQ ID NO: 83, или промотор pBAD, SEQ ID NO: 81 или SEQ ID NO: 82) и, необязательно, метку 6X-His (SEQ ID NO: 376) (например, фигура 2). Полученные экспрессирующие конструкции MAD1-MAD20 представлены как SEQ ID NO: 61-80, соответственно. Экспрессирующие конструкции, как показано на фигуре 2, получали либо посредством клонирования на основе рестрикции/лигирования, либо посредством клонирования на основе гомологии.
Пример 3. Тестирование последовательностей направляющих нуклеиновых кислот, совместимых с нуклеазами MAD
[00294] Направляемая нуклеиновой кислотой нуклеаза и совместимая направляющая нуклеиновая кислота необходимы для получения функционального комплекса способной к нацеливанию нуклеазы. Множество способов принято для определения последовательности совместимой направляющей нуклеиновой кислоты, и конкретно, каркасной части последовательности направляющей нуклеиновой кислоты. Во-первых, эндогенные локусы каждой нуклеазы MAD сканировали по потенциальным каркасным последовательностям. В некоторых случаях, например, для MAD2, не обнаружили эндогенной каркасная последовательность. Таким образом, тестировали совместимость MAD2 с каркасными последовательностями, обнаруженными рядом с эндогенными локусами других нуклеаз MAD. Нуклеазы MAD и соответствующие эндогенные каркасные последовательности, которые тестировали, перечислены в таблице 2.
Таблица 2
Нуклеаза MAD | Последовательность нуклеиновой кислоты WT | Последовательность нуклеиновой кислоты с оптимизированным для E. Coli кодонным составом | Аминокислотная последовательность | Эндогенная каркасная последовательность для направляющей нуклеиновой кислоты |
MAD1 | SEQ ID NO: 21 | SEQ ID NO: 41 | SEQ ID NO: 1 | SEQ ID NO: 84 |
MAD2 | SEQ ID NO: 22 | SEQ ID NO: 42 | SEQ ID NO: 2 | None identified |
MAD3 | SEQ ID NO: 23 | SEQ ID NO: 43 | SEQ ID NO: 3 | SEQ ID NO: 86 |
MAD4 | SEQ ID NO: 24 | SEQ ID NO: 44 | SEQ ID NO: 4 | SEQ ID NO: 87 |
MAD5 | SEQ ID NO: 25 | SEQ ID NO: 45 | SEQ ID NO: 5 | SEQ ID NO: 88 |
MAD6 | SEQ ID NO: 26 | SEQ ID NO: 46 | SEQ ID NO: 6 | SEQ ID NO: 89 |
MAD7 | SEQ ID NO: 27 | SEQ ID NO: 47 | SEQ ID NO: 7 | SEQ ID NO: 90 |
MAD8 | SEQ ID NO: 28 | SEQ ID NO: 48 | SEQ ID NO: 8 | SEQ ID NO: 91 |
MAD9 | SEQ ID NO: 29 | SEQ ID NO: 49 | SEQ ID NO: 9 | SEQ ID NO: 92; SEQ ID NO: 103; SEQ ID NO: 106 |
MAD10 | SEQ ID NO: 30 | SEQ ID NO: 50 | SEQ ID NO: 10 | SEQ ID NO: 93 |
MAD11 | SEQ ID NO: 31 | SEQ ID NO: 51 | SEQ ID NO: 11 | SEQ ID NO: 94 |
MAD12 | SEQ ID NO: 32 | SEQ ID NO: 52 | SEQ ID NO: 12 | SEQ ID NO: 95 |
MAD13 | SEQ ID NO: 33 | SEQ ID NO: 53 | SEQ ID NO: 13 | SEQ ID NO: 96; SEQ ID NO: 105; SEQ ID NO: 107 |
MAD14 | SEQ ID NO: 34 | SEQ ID NO: 54 | SEQ ID NO: 14 | SEQ ID NO: 97 |
MAD15 | SEQ ID NO: 35 | SEQ ID NO: 55 | SEQ ID NO: 15 | SEQ ID NO: 98 |
MAD16 | SEQ ID NO: 36 | SEQ ID NO: 56 | SEQ ID NO: 16 | SEQ ID NO: 99 |
MAD17 | SEQ ID NO: 37 | SEQ ID NO: 57 | SEQ ID NO: 17 | SEQ ID NO: 100 |
MAD18 | SEQ ID NO: 38 | SEQ ID NO: 58 | SEQ ID NO: 18 | SEQ ID NO: 101 |
MAD19 | SEQ ID NO: 39 | SEQ ID NO: 59 | SEQ ID NO: 19 | SEQ ID NO: 102 |
MAD20 | SEQ ID NO: 40 | SEQ ID NO: 60 | SEQ ID NO: 20 | SEQ ID NO: 103 |
[00295] Редактирующие кассеты, как показано на фигуре 3, получали для оценки функциональности нуклеаз MAD и соответствующих направляющих нуклеиновых кислот. Каждая редактирующая кассета содержит редактирующую последовательность и промотор, функционально связанные с кодированной направляющей нуклеиновой кислотой. Редактирующие кассеты дополнительно содержат участки для праймеров (P1 и P2) на фланкирующих концах. Направляющие нуклеиновые кислоты содержали различные каркасные последовательности, подлежащие тестированию, так же как направляющую последовательность, чтобы направлять нуклеазу MAD на последовательность-мишень для редактирования. Редактирующие последовательности содержали мутацию PAM и/или мутацию кодона по сравнению с последовательностью-мишенью. Мутации были фланкированы областями гомологии (плечами гомологии или HA), которые могут позволять рекомбинацию в расщепленную последовательность-мишень.
[00296] На фигуре 4 изображен эксперимент, разработанный для тестирования различных комбинаций нуклеазы MAD и направляющей нуклеиновой кислоты. Экспрессирующую кассету, кодирующую нуклеазу MAD, добавляли к клеткам-хозяевам вместе с различными редактирующими кассетами, как описано выше. В этом примере, направляющие нуклеиновые кислоты разрабатывали для нацеливания на ген galK в клетке-хозяине, и редактирующую последовательность разрабатывали для мутагенеза гена galK после нацеливания, чтобы выключить ген, таким образом, позволяя скрининг успешно редактированных клеток. Этот дизайн использовали для идентификации функциональных или совместимых комбинаций нуклеазы MAD и направляющей нуклеиновой кислоты. Эффективность редактирования определяли посредством qПЦР для измерения редактирующей плазмиды в восстановившихся клетках высокопроизводительным способом. Подтверждение специфичности праймеров для MAD11 и Cas9 показано на фигурах 14A и 14B. Эти результаты показывают, что выбранные пары праймеров являются ортогональными и позволяют количественное измерение входной плазмидной ДНК.
[00297] Фигуры 5A-5B представляют собой изображение эксперимента со сходным дизайном эксперимента. В этом случае, редактирующая кассета (фигура 5B) дополнительно содержит селективный маркер, в этом случае, ген устойчивости к канамицину (kan), и экспрессирующий нуклеазу MAD вектор (фигура 5A) дополнительно содержит селективный маркер, в этом случае, ген устойчивости к хлорамфениколу (Cm), и систему рекомбинации лямбда RED для облегчения гомологичной рекомбинации (HR) редактирующей последовательности в последовательность-мишень. Совместимая комбинация нуклеазы MAD и направляющей нуклеиновой кислоты может вызывать двухцепочечный разрыв в последовательности-мишени, если присутствует последовательность PAM. Поскольку редактирующая последовательность (например, фигура 3) содержит мутацию PAM, не узнаваемую нуклеазой MAD, редактированные клетки, содержащие мутацию PAM, переживают расщепление нуклеазой MAD, в то время как нередактированные клетки дикого типа погибают (фигура 5C). Редактирующая последовательность дополнительно содержит мутацию в гене galK, позволяющую скрининг редактированных клеток, в то время как экспрессирующий нуклеазу MAD вектор и редактирующая кассета содержат селективные маркеры устойчивости к лекарственному средству, позволяющие отбор редактированных клеток.
[00298] С использованием этих способов, тестировали совместимых направляющие нуклеиновые кислоты для MAD1-MAD20. Тестировали двадцать каркасных последовательностей. Направляющие нуклеиновые кислоты, использованные в экспериментах, содержали одну из двадцати каркасных последовательностей, обозначенных как каркас-1, каркас-2 и т.д., и направляющую последовательность, нацеленную на ген galK. Последовательности для каркаса-1 - каркаса-20 перечислены как SEQ ID NO: 84-103, соответственно. Следует понимать, что направляющая последовательность направляющей нуклеиновой кислоты является изменчивой, и ее можно конструировать или разрабатывать для нацеливания на любую желательную последовательность-мишень, как будет очевидно специалисту в данной области после прочтения этого описания. Поскольку MAD2 не имеет эндогенной каркасной последовательности для тестирования, тестировали каркасную последовательность из нуклеазы с близкой гомологией (каркас-2, SEQ ID NO: 85), и обнаружили, что она является нефункциональной, что означает, что MAD2 и каркас-2 являются несовместимыми. Таким образом, MAD2 тестировали с девятнадцатью другими каркасными последовательностями, несмотря на низкую гомологию последовательности между MAD2 и другими нуклеазами MAD.
[00299] Этот технологический процесс использовали также для идентификации или тестирования последовательностей PAM, совместимых с данной нуклеазой MAD. Другой способ идентификации участка PAM описан в следующем примере.
[00300] Как правило, для описанных анализов, трансформации проводили следующим образом. Штаммы E. coli, экспрессирующие нуклеазы MAD с оптимизированным кодонным составом, выращивали в течение ночи. Насыщенные культуры разводили 1/100 и выращивали до OD600 0,6, и индуцировали посредством добавления арабинозы в документированной концентрации 0,4% и (если использовали термочувствительную плазмиду) переноса культуры в водяную баню с качанием при 42 градусах Цельсия. После индукции, клетки охлаждали на льду в течение 15 мин перед трехкратной промывкой с использованием 1/4 исходного объема культуры, с использованием 10% глицерина (например, промывка в 50 мл для 200 мл культуры). Клетки ресуспендировали в 1/100 исходного объема (например, 2 мл для 200 мл культуры) и хранили при -90 градусах Цельсия до готовности к использованию. Для проведения скринингов совместимости и эффективности редактирования, описанных в настоящем описании, с использованием 50 нг редактирующей кассеты трансформировали аликвоты клеток посредством электропорации. После электропорации, клетки восстанавливали в LB в течение 3 часов, и 100 мкл клеток рассевали на чашки МакКонки, содержащие 1% галактозу.
[00301] Эффективность редактирования определяли посредством деления количества белых колоний (редактированных клеток) на общее количество белых и красных колоний (редактированных и нередактированных клеток).
Пример 4. Анализ выбора PAM
[00302] Для получения двухцепочечного разрыва в последовательности-мишени, направляющая нуклеиновая кислота должна гибридизоваться с последовательностью-мишенью, и нуклеаза MAD должна узнавать последовательность PAM, смежную с последовательностью-мишенью. Если направляющая нуклеиновая кислота гибридизуется с последовательностью-мишенью, но нуклеаза MAD не узнает участок PAM, тогда расщепления не происходит.
[00303] PAM является специфическим для нуклеазы MAD, и не все нуклеазы обязательно MAD узнают одинаковый PAM. Для оценки требований участка PAM к нуклеазам MAD, проводили анализ, как показано на фигурах 6A-6C.
[00304] На фигуре 6A изображен экспрессирующий нуклеазу MAD вектор, как описано в другом месте, который содержит также ген устойчивости к хлорамфениколу и систему рекомбинации лямбда RED.
[00305] На фигуре 6B изображена самонацеленная редактирующая кассета. Направляющая нуклеиновая кислота разработана для нацеливания на последовательность-мишень, которая содержится в той же самой молекуле нуклеиновой кислоты. Последовательность-мишень фланкирована случайными нуклеотидами, показанными посредством N4, обозначающих четыре случайных нуклеотида на каждом конце последовательности-мишени. Следует понимать, что можно использовать также любое количество случайных нуклеотидов (например, 3, 5, 6, 7, 8 и т.д.). случайные нуклеотиды служат в качестве библиотеки потенциальных PAM.
[00306] На фигуре 6C изображен дизайн эксперимента. В сущности, экспрессирующим нуклеазу MAD вектором и редактирующей кассетой, содержащей случайные участки PAM, трансформировали клетку-хозяина. Если формировался функциональный комплекс способной к нацеливанию нуклеазы и нуклеаза MAD узнавала участок PAM, тогда вектор с редактирующей кассетой расщеплялся, и это приводило к гибели клетки. Если функциональный поддающийся нацеливанию комплекс не формировался или если нуклеаза MAD не узнавала PAM, тогда последовательность-мишень не расщеплялась, и клетка выживала. Способы детекции (например, секвенирование нового поколения (NGS)) использовали для последовательностей исходной и конечной популяций клеток для определения того, какие участки PAM являлись узнаваемыми данной нуклеазой MAD. Эти узнаваемые участки PAM затем использовали для определения консенсусного или неконсенсусного PAM для данной нуклеазы MAD.
[00307] Определили, что консенсусный PAM для MAD1-MAD8 и MAD10-MAD12 представляет собой TTTN. Определили, что консенсусный PAM для MAD9 представляет собой NNG. Определили, что консенсусный PAM для MAD13-MAD15 представляет собой TTN. Определили, что консенсусный PAM для MAD16-MAD18 представляет собой TA. Определили, что консенсусный PAM для MAD19-MAD20 представляет собой TTCN.
Пример 5: Тестирование гетерологичных направляющих нуклеиновых кислот
[00308] Эффективность редактирования тестирована для MAD1, MAD2 и MAD7, и показана на фигуре 7. Детали эксперимента и эффективность редактирования обобщены в таблице 3. Эффективность редактирования определяли посредством деления количества редактированных клеток на общее количество выделенных клеток. Различные редактирующие кассеты, нацеленные на ген galK, использовали для обеспечения скрининга редактируемых клеток. Направляющие нуклеиновые кислоты, кодировали в редактирующей кассете, содержащей направляющую последовательность, нацеленную на ген galK, и одну из различных каркасных последовательностей, для тестирования совместимости указанной нуклеазы MAD с указанной каркасной последовательностью, как обобщено в таблице 3.
[00309] Наблюдали, что эффективность редактирования для совместимых нуклеазы MAD и направляющих нуклеиновых кислот (содержащих указанные каркасные последовательности), составляла между 75-100% эффективность редактирования. MAD2 имела эффективность редактирования между 75-100%, и MAD7 имела эффективность редактирования между 97-100%.
[00310] Для MAD2 в комбинации с каркасом-1, каркасом-2, каркасом-4 или каркасом-13 в этих экспериментах получили эффективность редактирования 0%. Эти данные подразумевают, что MAD2 не формировала функциональный комплекс с этими тестированными направляющими нуклеиновыми кислотами, и что MAD2 является несовместимой с этими каркасными последовательностями. Для MAD7 в комбинации с каркасом-1, каркасом-2, каркасом-4 или каркасом-13 в этих экспериментах получили эффективность редактирования 0%. Эти данные подразумевают, что MAD7 не формировала функциональный комплекс с этими тестированными направляющими нуклеиновыми кислотами, и что MAD7 является несовместимой с этими каркасными последовательностями. Таким образом, направляющие нуклеиновые кислоты, которые можно использовать в системах и способах по настоящему описанию, можно идентифицировать с использованием эмпирических данных, и это может требовать от специалиста в данной области приемлемого экспериментирования с использованием способов, объясняемых в настоящем описании
[00311] Для MAD1, для всех тестированных комбинаций направляющих нуклеиновых кислот получили эффективность редактирования 0%, что подразумевает, что MAD1 не формировала функциональный комплекс ни с какой из тестированных направляющих нуклеиновых кислот. Эти данные также подразумевают, что MAD1 является несовместимой с тестированными каркасными последовательностями.
[00312] Совместно, эти данные подчеркивают непредсказуемость обнаружения совместимых пар нуклеаза MAD и каркасная последовательность для формирования функционального комплекса способной к нацеливанию нуклеазы. Некоторые тестированные нуклеазы MAD не функционировали ни с одной из тестированных каркасных последовательностей. Некоторые тестированные нуклеазы MAD функционировали только с некоторыми тестированными каркасными последовательностями, а не с другими.
Таблица 3
# | Направляемая нуклеиновой кислотой нуклеаза | Каркасная последовательность направляющей нуклеиновой кислоты | Мутация редактирующей последовательности | Ген-мишень | Эффективность редактирования |
1 | MAD1 | Каркас-1; SEQ ID NO: 84 | L80** | galK | 0% |
2 | MAD1 | Каркас-2; SEQ ID NO: 85 | Y145** | galK | 0% |
3 | MAD1 | Каркас-4; SEQ ID NO: 87 | Y145** | galK | 0% |
4 | MAD1 | Каркас-10; SEQ ID NO: 93 | Y145** | galK | 0% |
5 | MAD1 | Каркас-11; SEQ ID NO: 94 | L80** | galK | 0% |
6 | MAD1 | Каркас-12; SEQ ID NO: 95 | L10KpnI | galK | 0% |
7 | MAD1 | Каркас-13; SEQ ID NO: 96 | Y145** | galK | 0% |
8 | MAD1 | Каркас-12; SEQ ID NO: 95 | L10KpnI | galK | 0% |
9 | MAD2 | Каркас-10; SEQ ID NO: 93 | L80** | galK | 0% |
10 | MAD2 | Каркас-10; SEQ ID NO: 93 | Y145** | galK | 100% |
11 | MAD2 | Каркас-11; SEQ ID NO: 94 | L80** | galK | 98% |
12 | MAD2 | Каркас-11; SEQ ID NO: 94 | Y145** | galK | 99% |
13 | MAD2 | Каркас-12; SEQ ID NO: 95 | Y145** | galK | 98% |
14 | MAD2 | Каркас-12; SEQ ID NO: 95 | Y145** | galK | 0% |
15 | MAD2 | Каркас-13; SEQ ID NO: 96 | Y145** | galK | 0% |
16 | MAD2 | Каркас-1; SEQ ID NO: 84 | L80** | galK | 0% |
17 | MAD2 | Каркас-2; SEQ ID NO: 85 | Y145** | galK | 0% |
18 | MAD2 | Каркас-2; SEQ ID NO: 85 | Y145** | galK | 0% |
19 | MAD2 | Каркас-4; SEQ ID NO: 87 | Y145** | galK | 0% |
20 | MAD2 | Каркас-5; SEQ ID NO: 88 | L80** | galK | 99% |
21 | MAD2 | Каркас-12; SEQ ID NO: 95 | 89** | galK | 0% |
22 | MAD2 | Каркас-12; SEQ ID NO: 95 | 70** | galK | 75% |
23 | MAD2 | Каркас-12; SEQ ID NO: 95 | L10KpnI | galK | 79% |
32 | MAD7 | Каркас-1; SEQ ID NO: 84 | L80** | galK | 0% |
33 | MAD7 | Каркас-2; SEQ ID NO: 85 | Y145** | galK | 0% |
34 | MAD7 | Каркас-4; SEQ ID NO: 87 | Y145** | galK | 0% |
35 | MAD7 | Каркас-10; SEQ ID NO: 93 | Y145** | galK | 100% |
36 | MAD7 | Каркас-11; SEQ ID NO: 94 | L80** | galK | 97% |
37 | MAD7 | Каркас-12; SEQ ID NO: 95 | L10KpnI | galK | 0% |
38 | MAD7 | Каркас-13; SEQ ID NO: 96 | Y145** | galK | 0% |
39 | MAD7 | Каркас-12; SEQ ID NO: 95 | L10KpnI | galK | 0% |
Пример 6. Оценка MAD2 и MAD7
[00313] Способность MAD2 и MAD7 функционировать с гетерологичными направляющими нуклеиновыми кислотами тестировали с использованием сходного дизайна эксперимента, как описано выше. Тестировали совместимость MAD2 с другими каркасными последовательностями, и результаты эксперимента показаны на фигуре 8. Нуклеазы MAD, каркасные последовательности направляющей нуклеиновой кислоты и редактирующие последовательности, использованные в этом эксперименте, обобщены в таблице 4.
[00314] Тестировали совместимость MAD7 с другими каркасными последовательностями, и результаты эксперимента показаны на фигуре 9. Нуклеазы MAD, каркасные последовательности направляющей нуклеиновой кислоты и редактирующие последовательности, использованные в этом эксперименте, обобщены в таблице 5.
Таблица 4
# | Направляемая нуклеиновой кислотой нуклеаза | Каркасная последовательность направляющей нуклеиновой кислоты | Мутация редактирующей последовательности | Ген-мишень |
1 | MAD2 | Каркас-12; SEQ ID NO: 95 | N89KpnI | galK |
2 | MAD2 | Каркас-10; SEQ ID NO: 93 | L80** | galK |
3 | MAD2 | Каркас-5; SEQ ID NO: 88 | L80** | galK |
4 | MAD2 | Каркас-12; SEQ ID NO: 95 | D70KpnI | galK |
5 | MAD2 | Каркас-12; SEQ ID NO: 95 | Y145** | galK |
6 | MAD2 | Каркас-11; SEQ ID NO: 94 | Y145** | galK |
7 | MAD2 | Каркас-10; SEQ ID NO: 93 | Y145** | galK |
8 | MAD2 | Каркас-12; SEQ ID NO: 95 | L10KpnI | galK |
9 | MAD2 | Каркас-11; SEQ ID NO: 94 | L80** | galK |
10 | SpCas9 | S. pyogenese гРНК | Y145** | galK |
11 | MAD2 | Каркас-2; SEQ ID NO: 85 | Y145** | galK |
12 | MAD2 | Каркас-4; SEQ ID NO: 87 | Y145** | galK |
13 | MAD2 | Каркас-1; SEQ ID NO: 84 | L80** | galK |
14 | MAD2 | Каркас-13; SEQ ID NO: 96 | Y145** | galK |
Таблица 5
# | Направляемая нуклеиновой кислотой нуклеаза | Каркасная последовательность направляющей нуклеиновой кислоты | Мутация редактирующей последовательности | Ген-мишень |
1 | MAD7 | Каркас-1; SEQ ID NO: 84 | L80** | galK |
2 | MAD7 | Каркас-2; SEQ ID NO: 85 | Y145** | galK |
3 | MAD7 | Каркас-4; SEQ ID NO: 87 | Y145** | galK |
4 | MAD7 | Каркас-10; SEQ ID NO: 93 | Y145** | galK |
5 | MAD7 | Каркас-11; SEQ ID NO: 95 | L80** | galK |
[00315] В другом эксперименте, эффективность редактирования (фигура 10A) определяли посредством расчета соотношения редактированных колоний (белых колоний, редактированный ген galK) и общего количества колоний. Эффективность трансформации (фигура 10B) определяли посредством расчета общего количества выделенных клеток, по сравнению с исходным количеством клеток.
[00316] В этом примере (фигура 10A-10B), клетки, экспрессирующие galK, трансформировали с использованием экспрессирующих конструкций, экспрессирующих либо MAD2, либо MAD7, и соответствующей редактирующей кассеты, содержащей направляющую нуклеиновую кислоту, нацеленную на ген galK. Направляющая нуклеиновая кислота состояла из направляющей последовательности, нацеленной на ген galK, и последовательности каркаса-12 (SEQ ID NO: 95).
[00317] В описанном примере, MAD2 и MAD7 имели более низкую эффективность трансформации, по сравнению с Cas9 S. pyogenes, хотя эффективность редактирования MAD2 и MAD7 была немного выше, чем у Cas9 S. pyogenes.
[00318] Колонии из экспериментов редактирования выделяли, и репрезентативное количество подвергали NGS для определения присутствия редактирования. На фигуре 11 изображены результаты секвенирования для этих выбранных колоний, выделенных из анализа, описанного выше. Последовательность-мишень представляла собой кодирующую последовательность (CDS) galK. PAM TTTN показан как обратно комплементарная последовательность (дикого типа NAAA, мутантная NGAA). Мутации, на которые нацелена редактирующая последовательность, отмечены как кодоны-мишени. Изменения, по сравнению с последовательностью дикого типа, выделены. В этих экспериментах, использовали последовательность каркаса-12 (SEQ ID NO: 95). Направляющая последовательность из направляющей нуклеиновой кислоты была нацелена на ген galK.
[00319] Шесть из семи показанных последовательностей из эксперимента с MAD2 содержали сконструированную мутацию PAM и сконструированные мутации в кодонах-мишенях galK, где последовательность из одной колонии сохраняла PAM дикого типа и кодоны-мишени дикого типа, в то же время содержала также непреднамеренную мутацию выше участка-мишени.
[00320] Две из четырех показанных последовательностей из эксперимента с MAD7 содержали сконструированную мутацию PAM и мутантные кодоны-мишени. Одна колония содержала последовательность дикого типа, в то время как другая содержала делецию восьми нуклеотидов выше последовательности-мишени.
[00321] На фигуре 12 изображены результаты двух экспериментов, тестирующих способность отбора облегчать выделение редактированных клеток. В этом эксперименте, использовали нуклеаза MAD2 с направляющей нуклеиновой кислотой, содержащей последовательность каркаса-11, и направляющей последовательностью, нацеленной на galK. Редактирующая кассета содержала редактирующую последовательность, сконструированную для включения мутации L80** в galK, таким образом, обеспечения возможности скрининга редактированных клеток. В эксперименте 1, использовали нуклеазу MAD2 с направляющей нуклеиновой кислотой, содержащей последовательность каркаса-12, и направляющей последовательностью, нацеленной на galK. Редактирующая кассета содержала редактирующую последовательность, сконструированную для включения мутации L10KpnI в galK. В обоих экспериментах, отрицательную контрольную плазмиду с использованием направляющей нуклеиновой кислоты, которая является несовместимой с MAD2, включали в трансформацию. После трансформации, измеряли соотношение совместимых редактирующих кассет (содержащих каркас-11 или каркас-12 направляющих нуклеиновых кислот) и несовместимой редактирующей кассеты (отрицательного контроля) was measure. Эксперименты проводили в присутствии или в отсутствие отбора. Результаты показали, что выделено большее количество клеток, содержащих совместимую редактирующую кассету, по сравнению с несовместимой редактирующей кассетой, и этот результат увеличивался при использовании отбора.
Пример 7. Характеризация направляющей нуклеиновой кислоты
[00322] Последовательности каркасов 1-8, и 10-12 (SEQ ID NO: 84-91 и 93-95) подвергнуты выравниванию и показаны на фигуре 13. Нуклеотиды, совпадающие с консенсусной последовательностью, обесцвечены, в то время как нуклеотиды, отличающиеся от консенсусной последовательности, являются видимыми. Указана прогнозируемая область псевдоузла. Без связи с теорией, область на 5’ псевдоузла может влиять на связывание и/или кинетику направляемой нуклеиновой кислотой нуклеазы. Как показано на фигуре 13, как правило, по-видимому существует меньшая изменчивость между каркасными последовательностями в области псевдоузла (например, SEQ ID NO: 172-181), по сравнению с последовательностью вне области псевдоузла.
Пример 8. Эффективность редактирования для двух нуклеаз MAD
[00323] Анализ эффективности редактирования на основе чашек и молекулярный анализ эффективности редактирования использовали для тестирования эффективности редактирования различных комбинаций нуклеазы MAD и направляющей нуклеиновой кислоты.
[00324] На фигуре 15 показана количественная оценка данных, полученных с использованием молекулярного анализа эффективности редактирования с использованием нуклеазы MAD2 с направляющей нуклеиновой кислотой, содержащей каркас-12, и направляющей последовательностью, нацеленной на galK. Указанные мутации вводили в galK с использованием соответствующих редактирующих кассет, содержащих мутации. На фигуре 16 показано сравнение эффективности редактирования, определенной посредством анализа на основе чашек с использованием белых и красных колоний, как описано ранее, и молекулярного анализа эффективности редактирования. Как показано на фигуре 16, эффективность редактирования, как определено посредством двух отдельных анализов, согласуется.
Пример 9. Отслеживаемое редактирование
[00325] Генетическое редактирование можно отслеживать с использованием штрих-кода. Штрих-код можно включать в участок или около участка редактирования, как описано в настоящем описании. Когда проводят множество циклов конструирования, с проведением отличного редактирования в каждом цикле, может обеспечивать преимущество вставка штрих-кода в общую область в ходе каждого цикла конструирования, таким образом, можно секвенировать один участок и получить последовательности всех штрих-кодов из каждого цикла без необходимости секвенирования какждого редактированного участка индивидуально. На фигурах 17A и 17C, 18 и 19 показаны примеры таких отслеживаемых технологических процессов генной инженерии.
[00326] Как показано на фигуре 17A, клетку, экспрессирующую нуклеазой MAD, трансформируют плазмидой, содержащей редактирующую кассету и записывающую кассету. Редактирующая кассета содержит мутацию PAM и последовательность для редактирования гена. Записывающая кассета содержит штрих-код, в этом случае тестируют 15-н. штрих-код, уникальный для последовательностей. Как редактирующая кассета, так и записывающая кассета, каждая содержит направляющую нуклеиновую кислоту для отдельной последовательности-мишени. В библиотеке таких плазмид, записывающая кассета для каждого цикла может содержать одинаковую направляющую нуклеиновую кислота, так что штрих-код из первого цикла вставляют в одну и ту же локализацию среди всех вариантов, независимо от того, какую редактирующую кассету и соответствующее редактирование гена используют. Тем не менее, корреляцию между штрих-кодом и редактирующей кассетой определяют предварительно, так что редактирование можно идентифицировать посредством секвенирования штрих-кода. На фигуре 17B показан пример записывающей кассеты, сконструированной для делеции участка PAM, с включением в то же время 15-н. штрих-кода. Делетированный PAM используют для обогащения по редактированным клеткам, поскольку клетки с мутантным PAM избегают гибели клеток, в то время как клетки, содержащие последовательность PAM дикого типа, уничтожаются.
[00327] Сходный способ показан на фигуре 18. В этом случае, записывающую кассету из каждого цикла конструируют для нацеливания на последовательность, смежную с последовательностью из предшествующего цикла, и каждый раз, новый участок PAM подвергается делеции посредством записывающей кассеты. Результатом является массив штрих-кодов, с штрих-кодами из каждого цикла, котрые можно секвенировать для подтверждения того, что каждый цикл конструирования имел место, и для определения того, какая комбинация мутаций содержится в клетке, и в каком порядке осуществлены мутации. Каждую последующую записывающую кассету можно конструировать, чтобы она являлась гомологичной на одном конце области, содержащей мутантный PAM из предшествующего цикла, что может увеличивать эффективность получения полностью редактированных клеток в конце эксперимента. В других примерах, записывающую кассету конструируют для нацеливания на уникальное место посадки, включенное в предшествующую записывающую кассету. Это увеличивает эффективность выделения клеток, содержащих все желательные мутации, поскольку последующая записывающая кассета и штрих-код могут нацеливаться только на клетку, успешно завершившую предшествующий цикл конструирования.
[00328] На фигуре 19 изображен другой способ, позволяющий повторное использование селективных маркеров или иным образом избавление клетки от плазмиды из предшествующего цикла конструирования. В этом случае, трансформирующую плазмиду, содержащую направляющую нуклеиновую кислоту, конструируют для нацеливания на селективный маркер или другую уникальную последовательность в плазмиде из предшествующего цикла конструирования.
Пример 10. Дизайн библиотеки PAM на основе плазмиды (pPAM)
[00329] Библиотеки мишеней pPAM конструировали посредством получения индивидуальной спейсерной последовательности, фланкированной вырожденными нуклеотидами на 5’-конце и 3’-конце последовательности-мишени. Использовали форматы аранжировки N4-СПЕЙСЕРN=20-N4 и N5-СПЕЙСЕРN=20-N3. Эти последовательности заказывали в форме одного олигонуклеотида с вырожденностью в обозначенных положениях (например, N3, N4, и N5). Олигонуклеотиды амплифицировали и клонировали в гРНК-вектор, содержащий спейсер, совпадающий с библиотекой мишеней, для получения самонацеленного гРНК-вектора, который может истощаться в ситуациях конкурентного роста (фигура 20). В одном эксперименте, всего восемь различных спейсерных последовательностей клонировали в векторы, содержащие гРНК, разработанную для совпадения с соответствующей мишенью.
Пример 11. Способы
Клонирование библиотек мишеней
[00330] Все библиотеки мишеней, использованные для анализа специфичности PAM и спейсерных мотивов, клонировали в желательный участок клонирования посредством амплификации пула одноцепочечных перекрывающихся олигонуклеотидов. Линеаризованные остовы для клонирования получали посредством амплификации ПЦР с перекрыванием совместимых со вставкой ампликонов и расщепляли dpnI для исключения загрязнения исходным вектором. Линеаризованный остов и пулы вставок клонировали посредством сборки способом Gibson (с использованием либо готовой реакционной смеси для сборки Gibson Assembly Master Mix, либо набора для сборки ДНК NEBuilder HiFi DNA assembly набор, в соответствии с протоколом производителя). Половину каждого продукта сборки Gibson подвергали обессоливанию в течение 30 мин с использованием диализной мембраны 0,025 мкм, плавающей в деионизированной воде в чашке Петри. Это использовали для трансформации компетентных клеток E. cloni 10G supreme и восстанавливали в течение 1 час в LB. 1% продукта трансформации после восстановления (10 мкл) использовали для рассева на основе разведения для оценки КОЕ на реакцию клонирования и перекрывания библиотеки. Клонирование повторяли, если количества КОЕ составляли <10X размера библиотеки, для обеспечения полного перекрывания желательной протяженности последовательностей. Остальной объем продукта после восстановления переносили для культивирования в течение ночи в 25 мл, содержащие 100 мкг/мл карбенициллина для поддержания селективного давления, для репликации клонированной библиотеки.
[00331] После восстановления в течение ночи, аликвоты 2×1 мл отбирали из каждой реакционной смеси для клонирования библиотеки и хранили в форме препаратов для хранения в глицерине. Остальные 23 мл культуры осаждали и использовали для выделения плазмидной ДНК с использованием набора Qiagen Plasmid Plus Midi набор. Эту ДНК использовали в последующих трансформациях для получения представленных данных.
Получение компетентных клеток для исследований истощения гРНК
[00332] Для получения компетентных клеток для истощения гРНК, редактирующую плазмиду вводили в E. coli MG1655. Редактирующая плазмида содержала представляющую интерес индуцируемую температурой направляемую РНК нуклеазу (RGEN), индуцируемый арабинозой оперон RED λ и маркер устойчивости к хлорамфениколу. После выращивания в течение ночи, содержащие насыщенную RGEN линии клеток затем вводили в разведении 1/100 в 250 мл LB+25 мкг/мл хлорамфеникола в 500 мл встряхиваемых колбах с отражателями. Инокулированные культуры выращивали до OD 0,5-0,8 и переносили в водяную баню с встряхиванием при 42°C для индукции экспрессии RGEN. После индукции при 42°C, клетки помещали на лед на 10 мин. Затем клетки промывали 3X с использованием 100 мл ddH2O или 10% глицерина. После последней стадии промывки клетки ресуспендировали в 2,5 мл (или 1/100-й общего объема культуры) 10% глицерина и аликвотрировали на части по 200 мкл для хранения при -80°C.
Способ истощения гРНК
[00333] Каждый эксперимент истощения гРНК проводили с использованием одной 200 мкл аликвоты компетентных клеток, содержащих RGEN. Эту аликвоту клеток помещали в охлажденную кювету с просветом 2 см и подвергали электропорации с использованием системы Nepagene. Электропорацию проводили с использованием импульса 2400 В для переноса и 20 импульсов 150 В для перемешивания. Каждую трансформацию проводили с использованием 50-500 нг желательной библиотеки, как описано в папках экспериментов. После 2 час восстановления, 1% реакционной смеси после трансформации рассевали пятнами для определения эффективности трансформации (т.е. общего количества КОЕ), и остальной объем смеси после трансформации использовали для инокуляции 100 мл выросших культур. Из культур отбирали образцы в различных временных точках посредством отбора аликвоты 1 мл и проведения выделения ДНК с использованием набора QiaPrep Miniprep набор от Qiagen для нижестоящего секвенирования.
Общая подготовка и анализ NGS
[00334] Минипрепараты плазмид амплифицировали с использованием индексированных по эксперименту праймеров. Ампликоны пулировали для нормализации по ожидаемому количеству прочтений и очищали из геля до загрузки в устройства MiSeq/NextSeq. Затем проводили картирование индексированных файлов прочтений fastq по отношению к ожидаемым вариантам со 100% из дизайна эксперимента, и подсчитывали количества для проведения сравнительных анализов для наблюдаемых данных. Все количества нормализовали по частоте посредством уравнения Vf=(количество V)/(общее количество), где Vf представляет собой частоту варианта для данного индекса, количество V представляет собой количество, наблюдаемое для варианта, и общее количество представляет собой общее количество, наблюдаемое среди всех индексов эксперимента.
Анализ данных и расчет истощения.
[00335] Показатели истощения (или абсолютные показатели приспособленности) рассчитывали как log2 показатель истощения с использованием следующего уравнения: W=log2(Fx, f/Fx, i); где Fx, f представляет собой частоту кассеты X в конечной временной точке и Fx, i представляет собой исходную частоту кассеты X, и W представляет собой абсолютный показатель приспособленности каждого варианта. Частоты определяли посредством деления количества прочтений для каждого варианта на общее количество прочтений в эксперименте, включая прочтения, выпавшие из фильтрации. Каждый отбор проводили в двух повторах, и средневзвешенное значение количества из двух измерений использовали для вывода среднего показателя приспособленности каждой мутации следующим образом: Wсредн.=(ΣNi=1 счетi * Wi)/(ΣNi=1 счетi). Следует отметить, что рассчитанные показатели относятся к показателю истощения, когда рассчитанное значение является отрицательным, хотя оно может также относиться к показателю обогащения, если рассчитанное значение является положительным.
[00336] Эти показатели использовали для ранжирования и оценки вклада в приспособленность каждой мутации при различных исследованных видах селективного давления. Для всех отборов, средние абсолютные показатели приспособленности для синонимических мутаций представлены в форме составного показателя средней скорости роста. Абсолютные показатели обогащения считали значимыми, если обогащение мутанта составляло по меньшей мере μ±2*σ (т.е., P=0,05, принимая нормальное распределение) от значения для дикого типа. Среднее и пороги значимости регистрировали для каждого отбора. Каждый отбор проводили по меньшей мере в двух повторах, и значение порога отсечения 10 среди повторяющихся экспериментов принимали для включения в каждый анализ.
[00337] В некоторых случаях, данные нормализовали по данным контрольной библиотеки PAM NRRN или по данным другой нецелевой контрольной библиотеки.
[00338] На фигуре 21A показано, что сопротивление отражает количество трансформантов на лунку для компетентных клеток SOP и фиксированного количества ДНК. На фигуре 21B изображено сравнение средневзвешенного значения показателя истощения с Ec110 (4 повтора), Ec83* (5 повторов) и Ec78* (два повтора). Эти ампликоны секвенировали, и 3’-PAM использовали в качестве штрих-кода образца. На фигуре 22A показано, что количества для входной контрольной плазмиды EC110 и контрольной плазмиды EC110 после 15 часов роста являются почти идентичными. На фигуре 22B показано, что количества для контрольной плазмиды EC110 после 15 часов и 20 часов избыточного роста в жидкой культуре являются почти идентичными, что показывает стабильное поддержание входной плазмиды.
Пример 12. Анализ анализ pPAM для идентификации PAM MAD7 и PAM MAD2
[00339] Предпочтительность PAM для MAD2 и MAD7 определяли с использованием анализа истощения плазмиды pPAM и способов анализа данных, описанных выше. Показатели истощения для различных PAM рассчитывали, как описано выше, через 20 часов, как для MAD7 (фигура 23A), так и для MAD2 (фигура 23B). PAM, количество которых подверглось истощению или уменьшению, представляют собой PAM, способные подвергаться узнаванию и таким образом, расщеплению нуклеазой и комплексом гРНК. Предпочтительные участки PAM для обоих ферментов показаны слева направо, соответственно. MAD2 и MAD7 оба имеют предпочтение для PAM NYYN, хотя некоторые PAM NYYN действуют лучше, чем другие (фигуры 23A и 23B). Эффективность редактирования по сравнению с эффективностью разрезания дополнительно характеризовали для выбора плазмид PAM MAD7 (фигура 23C).
Пример 13. Дизайн анализа неспецифической активности на основе синтетических плазмид (SPOT)
[00340] Библиотеки мишеней для анализа неспецифической активности на основе синтетических плазмид (SPOT) конструировали посредством получения индивидуальных спейсерных последовательностей длиной 20 нуклеотидов и добавления подгруппы последовательностей PAM с каждой стороны. В некоторых экспериментах, YTTN PAM добавляли с 5’-стороны каждой мишени, и PAM NGG добавляли с 3’-стороны, таким образом, получая формат YTTN-СПЕЙСЕРN=20-NGG (SEQ ID NO: 377). На основании официальной номенклатуры IUPAC, Y=C или T; и N=A, C, T или G. Восемь комбинаций пар 5’-PAM - 3’-PAM тестировали в исходном эксперименте для каждой мишени, по одному для каждого 5’-PAM с образцами каждого 3’-PAM, проанализированными дважды. Конкретно, получали и тестировали следующие комбинации 5’ PAM - 3’ PAM: TTTA-AGG (SEQ ID NO: 378); TTTC-CGG (SEQ ID NO: 379); TTTG-GGG (SEQ ID NO: 380); TTTT-TGG (SEQ ID NO: 381); CTTA-AGG (SEQ ID NO: 382); CTTC-CGG (SEQ ID NO: 383); CTTG-GGG (SEQ ID NO: 384); и CTTT-TGG (SEQ ID NO: 385), где 20-нуклеотидный спейсер находился между каждой комбинацией PAM. Хотя только репрезентативное количество комбинаций тестировали в этом эксперименте, следует понимать, что можно тестировать также каждую возможную комбинацию PAM 5’-YTTN-N=20-NGG-3’ (SEQ ID NO: 377). Затем набор спейсеров-мишеней с различными комбинациями PAM использовали в качестве матрицы для конструирования точечных мутаций на протяжении последовательности спейсера. Дизайн библиотек мутаций в спейсере-мишени состоял из четырех различных групп мутаций для каждой последовательности PAM-спейсер и внутреннего контроля.
[00341] Первая библиотека мутаций представляла собой сканирующую библиотеку несовпадений, состоящую из непрерывных несовпадений 1, 2, 3 или 4 п.о., где каждое несовпадение являлось комплементарным нуклеотиду последовательности дикого типа. Получена каждая возможная мутация 1, 2, 3 и 4 непрерывных п.о. на протяжении всей длины спейсерной последовательности.
[00342] Вторая библиотека мутаций представляла собой сканирующую библиотеку делеций, состоящую из непрерывных делеций 1, 2, 3 или 4 п.о. Получена каждая возможная делеция 1, 2, 3, и 4 непрерывных п.о. на протяжении всей длины спейсерной последовательности.
[00343] Третья библиотека мутаций представляла собой библиотеку одиночных вставок, где вставку одиночного основания выполняли в каждом положении в спейсере. В некоторых экспериментах, каждую вставку 1 п.о. выполняли посредством дублирования нуклеотида непосредственно на 5’ от участка вставки. Другой дизайн библиотеки вставок включает дублирование нуклеотида непосредственно на 3’ от участка вставки, или получение каждого возможного варианта вставки нуклеотида, например, индивидуального варианта с вставкой одного из A, T, C и G в каждом положении в области спейсера.
[00344] Четвертая библиотека мутаций представляла собой библиотеку случайного мутагенеза, где положения 2-5 п.о. случайным образом подвергали мутагенезу для получения разнообразной группы мутантных последовательности, аппроксимирующие большинство биологически значимых видов разнообразия. Эти мутации 2-5 п.о. не обязательно должны были являться непрерывными и таким образом, часто имели не подвергнутый мутагенезу нуклеотид или нуклеотид дикого типа между мутантными нуклеотидами. Обнаружено, что такие не являющиеся непрерывными случайные мутации являются распространенными в биологических системах.
[00345] Как в случае библиотек pPAM, последовательности SPOT клонировали в гРНК-векторы, содержащие спейсер, совпадающий с библиотекой мишеней, для получения самонацеленного гРНК-вектора. Пулы олигонуклеотидов амплифицировали и клонировали в гРНК-вектор, содержащие спейсер, совпадающий с библиотекой мишеней, для получения самонацеленного гРНК-вектора, который может истощаться в условиях конкурентного роста из-за вырезания и потери плазмиды при селективном давлении. Восемь выбранных комбинаций 5’-3’ PAM, фланкирующих каждую из 8 различных спейсерных последовательностей клонировали в векторы, содержащие гРНК, разработанные для совпадения с мишенью.
[00346] С использованием анализа SPOT, возможны анализы истощения in vivo, независимо от продукции рибонуклеопротеинового комплекса. Этот анализ также позволяет уникальный анализ неспецифического взаимодействия с использованием систематического неспецифического дизайна посредством различных вариантов дизайна библиотеки мутаций. Дополнительные преимущества анализа SPOT включают более контролируемое изменение неспецифических кандидатов, анализ можно использовать для сравнения различных видов архитектуры PAM, и анализ можно комбинировать или смешивать с анализом библиотеки pPAM, описанным выше.
[00347] Другие анализы неспецифического взаимодействия, такие как Site-Seq, BLISS, Digenome-Seq или Circle-Seq, проводят поиск участков расщепления из экспериментов на млекопитающих и регистрируют неспецифические последовательности с эффективностью репарации NHEJ из глубокого секвенирования. С использованием этих других анализов, в большинстве исследований показаны неспецифические эффекты случайных несовпадений более 3 п.о.
Пример 14. Характеризация неспецифического взаимодействия
[00348] Неспецифические эффекты MAD7 и MAD2 анализировали с использованием анализа неспецифического взаимодействия на основе синтетической плазмиды (SPOT), описанного выше. Сначала, восемь мишеней с различными фланкирующими участками PAM тестировали по активности расщепления с использованием эталонной нуклеазы, MAD7 или MAD2. Затем выбранные мишени из вышеуказанных использовали в качестве исходных точек для получения различных случайных мутаций внутри мишени. В этом примере анализа, ампликон 171 п.о. получали при амплификации мишени и фланкирующих областей PAM, позволяющий либо прочтения 87 п.о. с встраиваемым индексом, либо прочтения 46 п.о. с прочтениями индекса 12 п.о.
[00349] Данные из примера эксперимента показаны на фигурах 24A-C. Мишени содержали указанное количество случайных мутаций (r3=3 п.о.; r4=4 п.о.; r5=5 п.о.). Cas9 использовали для получения графика истощения на фигуре 24A, MAD7 использовали для получения графика истощения на фигуре 24B, и MAD2 использовали для получения графика истощения на фигуре 24C.
[00350] Как видно при сравнении графиков истощения эталонного белка с графиками истощения MAD7 и MAD2, эталонный белок имеет намного больше событий неспецифического разрезания в каждой из библиотек r3, r4 и r5. Как для MAD7, так и для MAD2, показано меньше событий неспецифического разрезания для случайных мутаций, и фактически не присутствовало событий неспецифического разрезания для 5 п.о. случайных несовпадения. Эти события неспецифического разрезания, или их отсутствие, являлись независимыми от PAM или последовательности-мишени.
Пример 15. Комбинированное определение PAM и анализ неспецифического взаимодействия
[00351] Возможность характеризации специфичности PAM и неспецифических эффектов в комбинированном эксперименте тестировали посредством комбинации анализа pPAM и анализа SPOT, описанных выше, что в комбинации обозначено в настоящем описании как анализ анализ Inscripta (например, фигура 25). В примере анализа Inscripta ампликон 171 п.о. получали при амплификации мишени и фланкирующих областей PAM, позволяющий прочтения 46 п.о. с прочтениями индекса 12 п.о. Нацеливающие последовательности выбирали для единообразного исследования широкого диапазона значений температуры плавления для спейсерной последовательности.
[00352] Анализ Inscripta использовали для быстрой характеризации специфичности PAM и частот неспецифического взаимодействия для 10 ферментов. Истощение MAD7 было в основном идентичным между 20 часами (MAD7) и 24 часами (MAD7,24) истощения. Входная плазмида являлась сходной с Ec110, представляющей собой штамм E. coli, содержащий контрольную плазмиду, сходную с остовом вектора-переносчика, описанного выше, но лишенного кодирующего нуклеазу гена. Истощение MAD2 оставалось одинаковым для конститутивного промотора Ec78* (MAD2) по сравнению с Ec113, представляющей собой штамм E. coli, содержащий остов вектора-переносчика, как описано выше, содержащий ген, кодирующий the нуклеазу MAD7 под контролем конститутивного промотора proA вместо индуцируемой промоторной системы pL. Сильное истощение наблюдали для MAD7 или MAD2 и библиотека множества мишеней, и сильное истощение в библиотеке множества мишеней наблюдали также для MAD4. Меньшее истощение наблюдали для MAD5 по сравнению с MAD2, MAD7 и MAD4.
[00353] На основании этих данных, MAD7, MAD2, MAD4 и MAD5 выбрали для дальнейшей характеризации. Специфичности PAM анализировали для каждой с использованием данных анализа pPAM. Графики истощения для тестированных PAM TTN и CTTN показаны на фигуре 26A и фигуре 26B, и PAM RTTN и YCCN показаны на фигуре 26C.
[00354] Показатели истощения MAD7 для различных PAM показаны также на фигуре 27A-27B, и эти данные показывают, что содержание GC последовательности-мишени может влиять на масштаб активности истощения, что позволяет предполагать, что расщепление и нацеливание можно настраивать на основании выбора PAM и последовательности-мишени.
[00355] Показатели истощения MAD2 для различных PAM показаны также на фигуре 28A-29B и эти данные показывают, что содержание GC последовательности-мишени может влиять на масштаб активности истощения, что позволяет предполагать, что расщепление и нацеливание можно настраивать на основании выбора PAM и последовательности-мишени. Например, для PAM TTTA, при содержании GC, эквивалентным мишени 8, показано очень сильное истощение.
[00356] Показатели истощения MAD4 для различных PAM показаны также на фигуре 29A-29B, и эти данные показывают, что содержание GC последовательности-мишени может влиять на масштаб активности истощения, что позволяет предполагать, что расщепление и нацеливание можно настраивать на основании выбора PAM и последовательности-мишени. Для MAD4 также показан высокий показатели истощения с использованием мишени 8, имеющей наивысшее содержание GC из всех тестированных мишеней.
[00357] Показатели истощения MAD5 для различных PAM показаны также на фигуре 30A-30B. Эти данные показывают, что для MAD5 не получено сильного истощения для тестированных комбинаций последовательностей-мишеней и последовательностей PAM.
[00358] Эффекты неспецифического разрезания MAD7, MAD2 и MAD4 характеризовали дополнительно. Данные из примера анализа SPOT с использованием библиотек мутантов различных тестированных мишеней показаны на фигурах 31A-31C. Для MAD4 показана даже меньшая неспецифическая активность, чем для MAD2 и MAD7, для многих из тестированных классов мишеней, как указано в примере данных, показанных на фигурах 32A-32H. Указаны библиотеки мутантов, показанные на каждом графике и включающие случайные мутации (фигуры 32A и 32E), мутации делеции (фигуры 32B и 32F), мутации несовпадения (фигуры 32C и 32G), или мутации вставки (фигуры 32D и 32H). На фигурах 32I-32P показаны показатели истощения из экспериментов с использованием MAD7 и указанных библиотек мутаций, содержащих мутации в указанном положении внутри каждой тестированной последовательности-мишени. Эти данные представляют собой комбинацию всех PAM YTTN, использованных в эксперименте с использованием MAD7. Для фигур 32I-32P, «без мишени» рассчитывали для PAM 5’-NGGN, и wt (дикого типа) представляет собой контроль без мутаций в мишени, и «положение» представляет собой положение мутации внутри последовательности-мишени. На фигурах 32I-32J показаны данные для сканирующей библиотеки мутаций 1 п.о. (m1). На фигурах 32K-32L показаны данные для сканирующей библиотеки мутаций 2 п.о. (m2), имеющей 2 последовательные мутации, начиная с указанного положения. На фигурах 32M-32N показаны данные для сканирующей библиотеки мутаций 3 п.о. (m3), имеющей три последовательные мутации, начиная с указанного положения. Совместно, эти данные показывают, что последовательность затравки из положений 1-7 являются важными, поскольку мутации в этой области имеют тенденцию нарушать активность расщепления MAD7, как показано по уменьшению показателя истощения для мутаций в этих положениях. На фигурах 32O-32P показаны данные для сканирующей библиотеки мутаций 2 п.о. (m2) и показаны данные для одной мишени, организованные по последовательности PAM. Совместно, эти данные показывают, что некоторые последовательности PAM являются менее специфическими, чем другие, что позволяет предполагать взаимосвязь между силой PAM и специфичностью мишени. Например, PAM TTTA, по-видимому, поддерживает расщепление мишеней с тандемными несовпадениями 2 п.о. с более высокой частотой, чем остальные из тестированных комбинаций, например, по сравнению с PAM CTTT. Эти наблюдения позволяют предполагать, что сила PAM должна быть фактором в выборе мишени.
Пример 16. Характеризация совместимой последовательности направляющей РНК
[00359] Различные направляющие РНК, содержащие различные каркасные последовательности, тестировали для характеризации того, какие каркасные последовательности являются совместимыми с тестированными нуклеазами MAD. Тестировали Каркасы из массива эндогенных CRISPR для рассматриваемых нуклеаз MAD, так же как гетерологичные каркасные последовательности, происходящие из гетерологичных или ортогональных систем нуклеазы MAD. На фигуре 33 показан пример схемы различных комбинаций нуклеазы MAD и каркаса направляющей РНК, которые тестировали, и конструкции, которую использовали для тестирования совместимости тестированной нуклеазы MAD (например, MAD#) и каркасной последовательности направляющей РНК (например, crMAD#). Конструкция содержала промотор, управляющий экспрессией направляющей РНК, содержащей каркасную последовательность (повтор cr) и нацеливающую последовательность (например, спейсер galT45). Конструкция содержала также последовательность-мишень (например, galT45, 24 п.о.), на которую была нацелена нацеливающая последовательность направляющей РНК. Области PAM 3-4 п.о. фланкировали последовательность-мишень. Каждая конструкция содержала также уникальный ID последовательности или штрих-код, который использовали для идентификации каркасной последовательности. Идентификация могла происходить, например, после амплификации области штрих-кода/уникального ID и последовательности-мишени с использованием праймеров, фланкирующих эту область, как указано на фигуре 33. В некоторых примерах, амплификация приводила к ампликону 176 п.о., позволяющему прочтения 50 п.о. с прочтениями индекса 12 п.о., с использованием набора V3 Высокопроизводительный 1×75 п.о.
[00360] В иллюстративном эксперименте, тестировали 12 различных ферментов MAD с 10 различными каркасными последовательностями, полученные ампликоны для которых затем секвенировали в одном анализе секвенирования нового поколения.
[00361] Это анализ использовали для тестирования совместимости конкретных ферменты MAD с различными каркасными последовательностями. Первичные и вторичные структуры некоторых из тестирванных каркасных последовательностей (crMAD#) показаны на фигурах 34A и 34B. На фигуре 34A показано выравнивание каркасных последовательностей crРНК из указанной системы MAD. На фигуре 34B показана часть области псевдоузла из указанных crРНК MAD. Эти выравнивания на фигурах 34A-34B показали сильную консервативность последовательности и структуры области псевдоузла для этих выровненных crРНК MAD. Выравнивания, кроме того, показали, что присутствие, хотя и необязательное, последовательности, на 5’-конце области повтора (как отмечено на фигуре 34A), может быть менее важным для активности расщепления. Указаны отклонения последовательности от консенсусной последовательности выбранных crРНК MAD; например, чаще всего указанным 5’-нуклеотидом является C в crРНК MAD3, в отличие от U в консенсусной последовательности. В качестве дополнительного примера, второй нуклеотид в структуре петли представляет собой A в консенсусной последовательности и вместо этого, представляет собой 1) U в crРНК MAD10, 2) G в crРНК MAD4, MAD7 и MAD11, 3) C в crРНК MAD25 и 4) CU в crРНК MAD3. В качестве дополнительного примера, третий нуклеотид в структуре петли консенсусной последовательности представляет собой U и вместо этого, представляет собой G в crРНК MAD5. Как показано, для некоторых crРНК MAD, последовательность петли имеет длину 4 нуклеотида, в то время как для других (например, crРНК MAD3) последовательность петли имеет длину 4 нуклеотида.
[00362] Примеры результатов этого анализа показаны на фигурах 35A-35C для MAD7, MAD2 и MAD4, соответственно. Некоторые наблюдения для каждого набора данных перечислены ниже.
[00363] Как показано на фигуре 35A, MAD7, по-видимому, является совместимой с большинством тестированных каркасных последовательностей с петлей 4 п.о. По-видимому, присутствует также немного меньшая активность расщепления для последовательности петли UAGU в сочетании с более слабыми последовательностями PAM. Активность MAD7 широко распространяется на ряд последовательностей PAM, как показано по соответствующим показателям истощения. Совместно, эти результаты позволяют предполагать, что активность MAD7 можно настраивать посредством конструирования каркасной последовательности. Дополнительные данные из этих экспериментов для MAD7 показаны на фигурах 36A-36B, показывающих сравнение совместимости MAD7 с ее природной каркасной последовательностью и гетерологичными каркасными последовательностями, содержащими различные последовательности стебля-петли. Дополнительные данные, показывающие совместимость MAD7 с различными каркасными последовательностями с различными последовательностями стебля-петли, показаны на фигуре 37. Как показывают эти данные, положение -1 последовательности выше PAM, по-видимому, является важным, и первый нуклеотид «C» в положении -1 неблагоприятно влияет на истощение. По-видимому, существует следующая предпочтительность в положении -1: G>T>A>C, за исключением ситуации PAM CTTT, в этом случае предпочтительность, по-видимому, представляет собой: A>G>T>C. Богатые пиримидинами (T/C) спейсерные последовательности, особенно в области затравки, по-видимому, являются немного менее предпочтительными как для MAD7, так и для MAD2, в то время как обогащение пуринами (A/G) немного увеличено. Наличие C выше PAM также по-видимому, является неблагоприятным.
[00364] Как показано на фигуре 35B, MAD2 , по-видимому, является совместимой с большинством тестированных каркасных последовательностей с петлей 4 п.о. Наблюдали также бимодальное узнавание PAM. Дополнительные данные из этих экспериментов показаны на фигурах 36C-37D, показывающих сравнение совместимости MAD2 с ее природной каркасной последовательностью и гетерологичными каркасными последовательностями, содержащими различные последовательности стебля-петли.
[00365] Как показано на фигуре 35C, MAD4, по-видимому, является совместимой с большинством тестированных каркасных последовательностей с петлей 4 п.о. По-видимому, присутствует также немного меньшая активность расщепления для последовательности петли UAGU последовательность петли в сочетании с более слабыми последовательностями PAM. Узнавание PAM, по-видимому, является несколько бимодальным. Дополнительные данные из этих экспериментов показаны на фигурах 36E-36F, показывающих сравнение совместимости MAD4 с ее природной каркасной последовательностью и гетерологичными каркасными последовательностями, содержащими различные последовательности стебля-петли.
Пример 17. Характеризация активности MAD7 в дрожжах
[00366] Анализ отбора с CAN1 использовали для тестирования ряда видов архитектуры кассеты MAD7 дрожжей. В некоторых примерах экспериментов, одиннадцать различных кассет с различной ориентацией плеч гомологии тестировали по эффективности редактирования последовательности-мишени. Как правило, клетки дрожжей трансформировали с использованием одной из рассматриваемых кассет и вектора, экспрессирующего фермент MAD7, имеющего оптимизированный кодонный состав для экспрессии в S. cerevisiae. Трансформированные клетки рассевали на канаванин для отбора. Только клетки с успешным редактированием могли выживать при отборе с канаванином, показывая, что комбинация MAD7 и кассеты являлась успешной для осуществления желательного редактирования. Затем ДНК выделяли из отобранных клеток, и желательное редактирование подтверждали посредством либо расщепления, либо секвенирования. Детали тестированных кассет представлены в таблице 6. В таблице 6, подчеркнутые нуклеотиды указывают потенциальные проблемные последовательности из-за мотивов пента-T, которые могут служить потенциальным сигналом терминации транскрипции у эукариот и могут, таким образом вызывать проблемы с экспрессией. Таким образом, эти потенциальные проблемные последовательности изменяли в различных тестируемых линкерных последовательностях посредством либо удаления, либо замены одного или нескольких нуклеотидов на нуклеотиды, показанные жирным курсивом. Данные из примера эксперимента обобщены в таблице 7. Эти данные показывают, что кассета 36 п.о. типа «T на C» - F имеет предпочтительную ориентацию и организацию.
Таблица 6
Кассета | Длина (п.о.) | Линкерная последовательность | Каркасная последовательность |
Кассета E и F (crРНК MAD12) | 35 | GTCAAAAGACCTTTTT (SEQ ID NO: 386) |
AATTTCTACTCTTGTAGAT (SEQ ID NO: 387) |
Кассета C и D (альтернативная crРНК) | 36 | GTCTGGCCCCAAATTTT (SEQ ID NO: 388) | AATTTCTACTGTTGTAGAT (SEQ ID NO: 389) |
gg-мини | 21 | GG | AATTTCTACTCTTGTAGAT (SEQ ID NO: 387) |
Кассета A и B мини | 19 | AATTTCTACTCTTGTAGAT (SEQ ID NO: 387) |
|
Тип E и F («T на G») | 35 | GTCAAAAGACCTGTGT (SEQ ID NO: 390) |
AATTTCTACTCTTGTAGAT (SEQ ID NO: 387) |
Тип E и F («T на C») | 36 | GTCTGGCCCCAAATTCT (SEQ ID NO: 391) |
AATTTCTACTGTTGTAGAT (SEQ ID NO: 389) |
Таблица 7
crРНК | Колоний, рассеянных на канаванин | Колоний с ростом на канаванине | Процент роста | Успешный ПЦР из колоний на канаванине | Случаев редактирования, наблюдаемых при расщеплении продукта ПЦР | Процент редактирования по ПЦР |
35 п.о., тип «T на G» - E | 35 | 31 | 88,5% | 11 | 11 | 100% |
36 п.о. , тип «T на C» - E | 35 | 34 | 97,1% | 13 | 13 | 100% |
35 п.о. , тип «T на G» - F | 30 | 26 | 86,7% | 17 | 15 | 88,2% |
36 п.о., тип «T на C» - F | 30 | 30 | 100% | 9 | 9 | 100% |
21 п.о., crРНК gg-мини | 35 | 25 | 71,4% | 17 | 10 | 58,8% |
Кассета A | 10 | 0 | 0% | - | - | - |
Кассета B | 10 | 0 | 0% | - | - | - |
Кассета C | 35 | 34 | 97,1% | 25 | 25 | 100% |
Кассета D | 34 | 32 | 94,1% | 22 | 21 | 95,4% |
Кассета E | 35 | 35 | 100% | 26 | 23 | 88,5% |
Кассета F | 35 | 32 | 91,4% | 18 | 14 | 77,8% |
[00367] Тестировали также дополнительные аранжировки кассет, такие как показано в таблице 8. В этом цикле экспериментов, параметры кассеты фильтровали таким образом, чтобы не присутствовало TTTTT в спейсере (нацеливающей последовательности), и чтобы не присутствовало гомополимерных областей более 6 п.о. в плечах гомологии или спейсере (нацеливающей последовательности).
[00368] В таблице 9 обобщена эффективность редактирования выбранных кассет в дополнительных экспериментах, показывающих эффективность редактирования в диапазоне 25-100% на основании ожидаемых мутаций, и в таблице 10 обобщены последовательности, содержащиеся в указанных кассетах, и другие детали экспериментa, включая последовательности гена WT, подвергнутые нацеливанию, и мутантные последовательности, вставленные после расщепления DNS с использованием комплекса рассматриваемого фермент MAD и crРНК.
Таблица 8
Кассета | Каркас crРНК | Линкерная последовательность | Частичная каркасная последовательность |
Кассета G | MAD12 | GTCTGGCCCCAAATTCT (SEQ ID NO: 391) |
AATTTCTACTCTTGTAGAT (SEQ ID NO: 387) |
Кассета H | MAD5 | GTCTGGCCCCAAATTCT (SEQ ID NO: 391) |
AATTTCTACTAGTGTAGAT (SEQ ID NO: 392) |
Кассета I | MAD10 | GTCTGGCCCCAAATTCT (SEQ ID NO: 391) |
AATTTCTACTTTTGTAGAT (SEQ ID NO: 393) |
Кассета J | MAD4, 7 и 11 | GTCTGGCCCCAAATTCT (SEQ ID NO: 391) |
AATTTCTACTGTTGTAGAT (SEQ ID NO: 389) |
Кассета K | MAD25 | GTCTGGCCCCAAATTCT (SEQ ID NO: 391) |
AATTTCTACTATTGTAGAT (SEQ ID NO: 394) |
Таблица 9
Кассета L | Кассета M | Кассета N | Кассета O | |
Штамм | 1 | 1 | 1 | 2 |
% редактирования (технологический процесс) | 8% | 8% | ND | 9% |
Ожидаемые мутации/прочтения | 7 | 8 | 6 | 5 |
# Прочтения с редактированием/# общее количество прочтений | 7/85 | 22/55 | 20/119 | 6/64 |
Таблица 10
Кассета L | Кассета M | Кассета N | Кассета O | |
Нацеливающая последовательность crРНК | SEQ ID NO: 360 | SEQ ID NO: 361 | SEQ ID NO: 362 | SEQ ID NO: 363 |
Мутантная последовательность, вставленная в участок расщепления | SEQ ID NO: 364 | SEQ ID NO: 365 | SEQ ID NO: 366 | SEQ ID NO: 367 |
Последовательность гена WT до мутации | SEQ ID NO: 368 | SEQ ID NO: 369 | SEQ ID NO: 370 | SEQ ID NO: 371 |
Редактирующая кассета | SEQ ID NO: 372 | SEQ ID NO: 373 | SEQ ID NO: 374 | SEQ ID NO: 375 |
Пример 18. Расщепление последовательностей-мишеней млекопитающих in vitro и in vivo.
[00369] MAD7 использовали для нацеливания и расщепления мишеней в клетках млекопитающих. Получали экспрессирующие MAD7 конструкции с оптимизированным кодонным составом для E. coli или человека (например, фигура 38A). Кратко, конструкция I69 содержала промотор hCMV, функционально связанный с последовательностью MAD7 с оптимизированным кодонным составом E. coli, которая также содержала 5’ (N-концевой) эпитоп-метку V5 и сигнал ядерной локализации (NLS), и конструкция также содержала промотор EF1альфа, управляющий экспрессией репортера GFP, и ген устойчивости к бластицидину. Конструкция I19 является сходной с I69, за исключением того, что последовательности NLS и V5 находятся на 3’-конце (C-конце) последовательности MAD7. Конструкция I9 является сходной с последовательностью I69, с тем исключением, что последовательность MAD7 имеет оптимизированный кодонный состав для экспрессии в клетках человека вместо E. coli. Конструкция I18 является сходной с конструкцией I19, с тем исключением, что последовательность MAD7 имеет оптимизированный кодонный состав для экспрессии в клетках человека вместо E. coli. Использовали две последовательности направляющей РНК, как показано на фигуре 38B.
[00370] На фигурах 39A-39B показаны участки-мишени в двух генах-мишенях, PPIB (фигура 39A) и DNMT3B (фигура 39B). На фигурах 39C-39D обобщена последовательность PAM и последовательность-мишень, на которую нацелены указанные последовательности направляющей РНК, так же как процент содержания CG в последовательности-мишени и то, какая цепь ДНК подвергнута нацеливанию.
[00371] Каждым из экспрессирующих MAD7 векторов по отдельности трансфицировали клетки млекопитающих, и затем собирали лизаты клеток. Лизаты клеток оценивали посредством анализа Вестерн-блоттинга для подтверждения экспрессии MAD7. Лизаты клеток использовали также для анализа разрезания in vitro для оценки функции белка MAD7, которая может указывать на надлежащие экспрессию и сворачивание белка, экспрессированного в клетках млекопитающих. Этот анализ позволяет оценку экспрессии и способности к расщеплению MAD7 в отсутствие возможности для аппарата клетки корректировать событие расщепления или блокировать его из-за компактизации хроматина последовательности-мишени. После проведения анализа расщепления, лизат разделяли посредством электрофореза в геле и анализировали с использованием программного обеспечения ImageJ и денситометрии для определения % расщепления (% разрезания), который рассчитывали посредством деления интенсивности продукта расщепления на общую интенсивность полосы.
[00372] На фигуре 40 показана количественная оценка процента расщепления (эффективности разрезания) из примера эксперимента для указанных последовательностей-мишеней PPIB и DNMT3B, с использованием конструкции I18. Наблюдали небольшие различия расщепления in vitro между 42-мерными и 56-мерными последовательностями направляющей РНК, так что средние для них двух нанесены на график на фигуре 40. Для PPIB, восемь из десяти тестированных направляющих РНК приводили к направленному расщеплению, в то время как гРНК-14 и гРНК-25 приводили к не поддающемуся детекции расщеплению с использованием этого анализа. гРНК-15, нацеленная на PPIB, приводила к эффективному расщеплению, но его было сложно измерять из-за небольшого размера полученного продукта расщепления (с отличием приблизительно на 70 п.о. от неразрезанного), так что процент расщепления определили как составляющий > 90%. Для DNMT3B, девять из десяти тестированных направляющих РНК приводили к направленному расщеплению, в то время как гРНК-4 приводила к не поддающемуся детекции расщеплению с использованием этого анализа. гРНК-1, нацеленная на DNMT3B, приводила к эффективному расщеплению, но его было сложно измерять из-за небольшого размера полученного продукта расщепления (с отличием приблизительно на 70 п.о. от неразрезанного), так что процент расщепления определили как составляющий > 90%.
[00373] На фигуре 41 показана количественная оценка образования инделов (вставок или делеций) в клетках млекопитающих. Кратко, экспрессирующим нуклеазу MAD7 вектором (I9 или I18; см. фигуру 38A) и синтетической направляющей РНК совместно трансфицировали клетки HEK293T. После периода инкубации посредством 72 часа, расщепление in vivo оценивали посредством детекции образования инделов. Без намерения быть связанными теорией, после того, как происходит расщепление, в некоторых случаях, происходит репарация расщепленной ДНК посредством механизмов соединения негомологичных концов (NHEJ), которые часто приводят к вставке или делеции из участка расщепления одного или нескольких нуклеотидов. Эти события вставки и/или делеции обозначены как инделы. Инделы детектировали с использованием анализа детекции несовпадения ДНК с использованием анализа T7EI. Этот анализ несовпадения детектирует несовпадения между ожидаемыми неизмененными последовательностями и измененной последовательностью, содержащей инделы после расщепления и репарации NHEJ. В некоторых случаях, 56-мерная направляющая РНК приводила к более высокой частоте образования инделов, по сравнению с 42-мерной направляющей РНК. Для PPIB, две из трех направляющих РНК приводили к поддающемуся детекции расщеплению по этому способу, и три из трех для гена-мишени DNMT3B. для двух других конструкций, в которых использовали нуклеазу MAD7 с оптимизированным кодонным составом для E. coli, также показано формирование инделов с относительно сходной эффективностью, как для конструкций с оптимизированным кодонным составом для человека (данные не представлены). В общем, эти данные показывают успешную активность расщепления MAD7 в клетках млекопитающих in vivo.
[00374] Совместно, эти данные показывают, что MAD7 подвергается эффективной экспрессии и сворачиванию в клетках млекопитающих и эффективно функционирует in vitro и in vivo для последовательностей-мишеней млекопитающих. Данные in vitro показывают также, что более короткая 42-мерная гРНК осуществляет разрезание так эффективно, как более длинные 56-мерные гРНК, хотя это необязательно наблюдали при измерении эндогенного образования инделов в клетках млекопитающих.
Пример 19. Дополнительная характеризация нуклеаз MAD
[00375] Скрининг по редактированию проводили для дополнительной характеризации предпочтений PAM для выбранных нуклеаз MAD. Ген galK использовали в качестве мишени для этого скрининга. Некоторые примечательные наблюдения из этих данных включают то, что редактирование наблюдали для MAD7 с использованием PAM GTTG и TTTC, и редактирование наблюдали для MAD2 с использованием PAM TTTC. Некоторую клеточную токсичность наблюдали в этих экспериментах. В таблице 11 обобщены результаты этих экспериментов.
Таблица 11
Нуклеаза MAD | Разрезанных участков | Редактированных участков | Количество КОЕ редактированных клеток |
MAD2 | 4/7 | 2/7 | >1e5 |
MAD4 | 5/7 | 0/7 | 0 |
MAD7 | 5/7 | 2/7 | 1e4 |
[00376] Анализ скрининга PAM повторяли с использованием MAD2, MAD4 и MAD7. В соответствии с дизайном эксперимента для этого анализа, белые колонии отражают вставки стоп-кодона из-за гомологичной рекомбинации редактирующей кассеты, содержащей мутацию, в то время как красные колонии показывают, что стоп-кодон не был вставлен. Для MAD2 показано редактирование, согласующееся с описанными ранее данными о специфичности PAM. Для MAD4 показана высокая клеточная токсичность и наличие меньшего количества поддающихся наблюдению колоний, по сравнению с трансформированными MAD2 и MAD7 клетками. Для MAD7 показаны результаты редактирования, согласующиеся с описанными ранее данными о специфичности PAM, и показана более широкая эффективность редактирования, чем для MAD2.
[00377] Эти данные показывают эффективность редактирования более 90%, несмотря на низкую частоту выживаемости клеток. В Таблице 12 обобщены результаты экспериментов. Эти данные показывают, что существует более низкая изменчивость между участками PAM для MAD4 (в ~2,3 раза) по сравнению с MAD2 (в 25 раз) или MAD7 (в 101 раз). Эту кратность изменения рассчитывали следующим образом: кратность изменения =макс.(КОЕ редактированных)/мин.(КОЕ редактированных).
Таблица 12
Нуклеаза MAD | Разрезанных участков | Редактированных разрезанных участков | Количество КОЕ редактированных клеток | Кратность изменения между макс. и мин. КОЕ редактированных |
MAD2 | 5/10 | 2/5 | 1,7e5 | 25 |
MAD4 | 7/10 | 7/7 | <1,5e3 | 2,3 |
MAD7 | 6/10 | 6/7 | 6,7e4 | 101 |
[00378] В то время как изобретение охвачено описанием вариантов осуществления во множестве различных форм, как подробно описано в связи с предпочтительными вариантами осуществления изобретения, понятно, что настоящее описание следует рассматривать как иллюстрирующее принципы изобретения и оно не является ограничивающим изобретение конкретными вариантами осуществления, проиллюстрированными и описанными в настоящем описании. Специалист в данной области может вносить многочисленные изменения без отклонения от содержания изобретения. Объем изобретения определяется пунктами прилагаемой формулы изобретения и их эквивалентами. Реферат и название не следует рассматривать как ограничивающие объем настоящего изобретения, поскольку их целью является обеспечение возможности для компетентных органов, так же как для широкой общественности, быстро определять общий характер изобретения.
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> INSCRIPTA, INC.
<120> НАПРАВЛЯЕМЫЕ НУКЛЕИНОВЫМИ КИСЛОТАМИ НУКЛЕАЗЫ
<130> 49022-717.601
<140> PCT/US2018/034779
<141> 2018-05-25
<150> 15/631989
<151> 2017-06-23
<150> 15/632001
<151> 2017-06-23
<160> 801
<170> PatentIn версии 3.5
<210> 1
<211> 1358
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 1
Met Gly Lys Met Tyr Tyr Leu Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Tyr Ala Val Thr Asp Pro Ser Tyr His Leu Leu Lys Phe Lys Gly
20 25 30
Glu Pro Met Trp Gly Ala His Val Phe Ala Ala Gly Asn Gln Ser Ala
35 40 45
Glu Arg Arg Ser Phe Arg Thr Ser Arg Arg Arg Leu Asp Arg Arg Gln
50 55 60
Gln Arg Val Lys Leu Val Gln Glu Ile Phe Ala Pro Val Ile Ser Pro
65 70 75 80
Ile Asp Pro Arg Phe Phe Ile Arg Leu His Glu Ser Ala Leu Trp Arg
85 90 95
Asp Asp Val Ala Glu Thr Asp Lys His Ile Phe Phe Asn Asp Pro Thr
100 105 110
Tyr Thr Asp Lys Glu Tyr Tyr Ser Asp Tyr Pro Thr Ile His His Leu
115 120 125
Ile Val Asp Leu Met Glu Ser Ser Glu Lys His Asp Pro Arg Leu Val
130 135 140
Tyr Leu Ala Val Ala Trp Leu Val Ala His Arg Gly His Phe Leu Asn
145 150 155 160
Glu Val Asp Lys Asp Asn Ile Gly Asp Val Leu Ser Phe Asp Ala Phe
165 170 175
Tyr Pro Glu Phe Leu Ala Phe Leu Ser Asp Asn Gly Val Ser Pro Trp
180 185 190
Val Cys Glu Ser Lys Ala Leu Gln Ala Thr Leu Leu Ser Arg Asn Ser
195 200 205
Val Asn Asp Lys Tyr Lys Ala Leu Lys Ser Leu Ile Phe Gly Ser Gln
210 215 220
Lys Pro Glu Asp Asn Phe Asp Ala Asn Ile Ser Glu Asp Gly Leu Ile
225 230 235 240
Gln Leu Leu Ala Gly Lys Lys Val Lys Val Asn Lys Leu Phe Pro Gln
245 250 255
Glu Ser Asn Asp Ala Ser Phe Thr Leu Asn Asp Lys Glu Asp Ala Ile
260 265 270
Glu Glu Ile Leu Gly Thr Leu Thr Pro Asp Glu Cys Glu Trp Ile Ala
275 280 285
His Ile Arg Arg Leu Phe Asp Trp Ala Ile Met Lys His Ala Leu Lys
290 295 300
Asp Gly Arg Thr Ile Ser Glu Ser Lys Val Lys Leu Tyr Glu Gln His
305 310 315 320
His His Asp Leu Thr Gln Leu Lys Tyr Phe Val Lys Thr Tyr Leu Ala
325 330 335
Lys Glu Tyr Asp Asp Ile Phe Arg Asn Val Asp Ser Glu Thr Thr Lys
340 345 350
Asn Tyr Val Ala Tyr Ser Tyr His Val Lys Glu Val Lys Gly Thr Leu
355 360 365
Pro Lys Asn Lys Ala Thr Gln Glu Glu Phe Cys Lys Tyr Val Leu Gly
370 375 380
Lys Val Lys Asn Ile Glu Cys Ser Glu Ala Asp Lys Val Asp Phe Asp
385 390 395 400
Glu Met Ile Gln Arg Leu Thr Asp Asn Ser Phe Met Pro Lys Gln Val
405 410 415
Ser Gly Glu Asn Arg Val Ile Pro Tyr Gln Leu Tyr Tyr Tyr Glu Leu
420 425 430
Lys Thr Ile Leu Asn Lys Ala Ala Ser Tyr Leu Pro Phe Leu Thr Gln
435 440 445
Cys Gly Lys Asp Ala Ile Ser Asn Gln Asp Lys Leu Leu Ser Ile Met
450 455 460
Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Arg Lys Asp Asn Ser
465 470 475 480
Glu His Ala Trp Leu Glu Arg Lys Ala Gly Lys Ile Tyr Pro Trp Asn
485 490 495
Phe Asn Asp Lys Val Asp Leu Asp Lys Ser Glu Glu Ala Phe Ile Arg
500 505 510
Arg Met Thr Asn Thr Cys Thr Tyr Tyr Pro Gly Glu Asp Val Leu Pro
515 520 525
Leu Asp Ser Leu Ile Tyr Glu Lys Phe Met Ile Leu Asn Glu Ile Asn
530 535 540
Asn Ile Arg Ile Asp Gly Tyr Pro Ile Ser Val Asp Val Lys Gln Gln
545 550 555 560
Val Phe Gly Leu Phe Glu Lys Lys Arg Arg Val Thr Val Lys Asp Ile
565 570 575
Gln Asn Leu Leu Leu Ser Leu Gly Ala Leu Asp Lys His Gly Lys Leu
580 585 590
Thr Gly Ile Asp Thr Thr Ile His Ser Asn Tyr Asn Thr Tyr His His
595 600 605
Phe Lys Ser Leu Met Glu Arg Gly Val Leu Thr Arg Asp Asp Val Glu
610 615 620
Arg Ile Val Glu Arg Met Thr Tyr Ser Asp Asp Thr Lys Arg Val Arg
625 630 635 640
Leu Trp Leu Asn Asn Asn Tyr Gly Thr Leu Thr Ala Asp Asp Val Lys
645 650 655
His Ile Ser Arg Leu Arg Lys His Asp Phe Gly Arg Leu Ser Lys Met
660 665 670
Phe Leu Thr Gly Leu Lys Gly Val His Lys Glu Thr Gly Glu Arg Ala
675 680 685
Ser Ile Leu Asp Phe Met Trp Asn Thr Asn Asp Asn Leu Met Gln Leu
690 695 700
Leu Ser Glu Cys Tyr Thr Phe Ser Asp Glu Ile Thr Lys Leu Gln Glu
705 710 715 720
Ala Tyr Tyr Ala Lys Ala Gln Leu Ser Leu Asn Asp Phe Leu Asp Ser
725 730 735
Met Tyr Ile Ser Asn Ala Val Lys Arg Pro Ile Tyr Arg Thr Leu Ala
740 745 750
Val Val Asn Asp Ile Arg Lys Ala Cys Gly Thr Ala Pro Lys Arg Ile
755 760 765
Phe Ile Glu Met Ala Arg Asp Gly Glu Ser Lys Lys Lys Arg Ser Val
770 775 780
Thr Arg Arg Glu Gln Ile Lys Asn Leu Tyr Arg Ser Ile Arg Lys Asp
785 790 795 800
Phe Gln Gln Glu Val Asp Phe Leu Glu Lys Ile Leu Glu Asn Lys Ser
805 810 815
Asp Gly Gln Leu Gln Ser Asp Ala Leu Tyr Leu Tyr Phe Ala Gln Leu
820 825 830
Gly Arg Asp Met Tyr Thr Gly Asp Pro Ile Lys Leu Glu His Ile Lys
835 840 845
Asp Gln Ser Phe Tyr Asn Ile Asp His Ile Tyr Pro Gln Ser Met Val
850 855 860
Lys Asp Asp Ser Leu Asp Asn Lys Val Leu Val Gln Ser Glu Ile Asn
865 870 875 880
Gly Glu Lys Ser Ser Arg Tyr Pro Leu Asp Ala Ala Ile Arg Asn Lys
885 890 895
Met Lys Pro Leu Trp Asp Ala Tyr Tyr Asn His Gly Leu Ile Ser Leu
900 905 910
Lys Lys Tyr Gln Arg Leu Thr Arg Ser Thr Pro Phe Thr Asp Asp Glu
915 920 925
Lys Trp Asp Phe Ile Asn Arg Gln Leu Val Glu Thr Arg Gln Ser Thr
930 935 940
Lys Ala Leu Ala Ile Leu Leu Lys Arg Lys Phe Pro Asp Thr Glu Ile
945 950 955 960
Val Tyr Ser Lys Ala Gly Leu Ser Ser Asp Phe Arg His Glu Phe Gly
965 970 975
Leu Val Lys Ser Arg Asn Ile Asn Asp Leu His His Ala Lys Asp Ala
980 985 990
Phe Leu Ala Ile Val Thr Gly Asn Val Tyr His Glu Arg Phe Asn Arg
995 1000 1005
Arg Trp Phe Met Val Asn Gln Pro Tyr Ser Val Lys Thr Lys Thr
1010 1015 1020
Leu Phe Thr His Ser Ile Lys Asn Gly Asn Phe Val Ala Trp Asn
1025 1030 1035
Gly Glu Glu Asp Leu Gly Arg Ile Val Lys Met Leu Lys Gln Asn
1040 1045 1050
Lys Asn Thr Ile His Phe Thr Arg Phe Ser Phe Asp Arg Lys Glu
1055 1060 1065
Gly Leu Phe Asp Ile Gln Pro Leu Lys Ala Ser Thr Gly Leu Val
1070 1075 1080
Pro Arg Lys Ala Gly Leu Asp Val Val Lys Tyr Gly Gly Tyr Asp
1085 1090 1095
Lys Ser Thr Ala Ala Tyr Tyr Leu Leu Val Arg Phe Thr Leu Glu
1100 1105 1110
Asp Lys Lys Thr Gln His Lys Leu Met Met Ile Pro Val Glu Gly
1115 1120 1125
Leu Tyr Lys Ala Arg Ile Asp His Asp Lys Glu Phe Leu Thr Asp
1130 1135 1140
Tyr Ala Gln Thr Thr Ile Ser Glu Ile Leu Gln Lys Asp Lys Gln
1145 1150 1155
Lys Val Ile Asn Ile Met Phe Pro Met Gly Thr Arg His Ile Lys
1160 1165 1170
Leu Asn Ser Met Ile Ser Ile Asp Gly Phe Tyr Leu Ser Ile Gly
1175 1180 1185
Gly Lys Ser Ser Lys Gly Lys Ser Val Leu Cys His Ala Met Val
1190 1195 1200
Pro Leu Ile Val Pro His Lys Ile Glu Cys Tyr Ile Lys Ala Met
1205 1210 1215
Glu Ser Phe Ala Arg Lys Phe Lys Glu Asn Asn Lys Leu Arg Ile
1220 1225 1230
Val Glu Lys Phe Asp Lys Ile Thr Val Glu Asp Asn Leu Asn Leu
1235 1240 1245
Tyr Glu Leu Phe Leu Gln Lys Leu Gln His Asn Pro Tyr Asn Lys
1250 1255 1260
Phe Phe Ser Thr Gln Phe Asp Val Leu Thr Asn Gly Arg Ser Thr
1265 1270 1275
Phe Thr Lys Leu Ser Pro Glu Glu Gln Val Gln Thr Leu Leu Asn
1280 1285 1290
Ile Leu Ser Ile Phe Lys Thr Cys Arg Ser Ser Gly Cys Asp Leu
1295 1300 1305
Lys Ser Ile Asn Gly Ser Ala Gln Ala Ala Arg Ile Met Ile Ser
1310 1315 1320
Ala Asp Leu Thr Gly Leu Ser Lys Lys Tyr Ser Asp Ile Arg Leu
1325 1330 1335
Val Glu Gln Ser Ala Ser Gly Leu Phe Val Ser Lys Ser Gln Asn
1340 1345 1350
Leu Leu Glu Tyr Leu
1355
<210> 2
<211> 1334
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 2
Met Ser Ser Leu Thr Lys Phe Thr Asn Lys Tyr Ser Lys Gln Leu Thr
1 5 10 15
Ile Lys Asn Glu Leu Ile Pro Val Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Glu Asn Gly Leu Ile Asp Gly Asp Glu Gln Leu Asn Glu Asn Tyr Gln
35 40 45
Lys Ala Lys Ile Ile Val Asp Asp Phe Leu Arg Asp Phe Ile Asn Lys
50 55 60
Ala Leu Asn Asn Thr Gln Ile Gly Asn Trp Arg Glu Leu Ala Asp Ala
65 70 75 80
Leu Asn Lys Glu Asp Glu Asp Asn Ile Glu Lys Leu Gln Asp Lys Ile
85 90 95
Arg Gly Ile Ile Val Ser Lys Phe Glu Thr Phe Asp Leu Phe Ser Ser
100 105 110
Tyr Ser Ile Lys Lys Asp Glu Lys Ile Ile Asp Asp Asp Asn Asp Val
115 120 125
Glu Glu Glu Glu Leu Asp Leu Gly Lys Lys Thr Ser Ser Phe Lys Tyr
130 135 140
Ile Phe Lys Lys Asn Leu Phe Lys Leu Val Leu Pro Ser Tyr Leu Lys
145 150 155 160
Thr Thr Asn Gln Asp Lys Leu Lys Ile Ile Ser Ser Phe Asp Asn Phe
165 170 175
Ser Thr Tyr Phe Arg Gly Phe Phe Glu Asn Arg Lys Asn Ile Phe Thr
180 185 190
Lys Lys Pro Ile Ser Thr Ser Ile Ala Tyr Arg Ile Val His Asp Asn
195 200 205
Phe Pro Lys Phe Leu Asp Asn Ile Arg Cys Phe Asn Val Trp Gln Thr
210 215 220
Glu Cys Pro Gln Leu Ile Val Lys Ala Asp Asn Tyr Leu Lys Ser Lys
225 230 235 240
Asn Val Ile Ala Lys Asp Lys Ser Leu Ala Asn Tyr Phe Thr Val Gly
245 250 255
Ala Tyr Asp Tyr Phe Leu Ser Gln Asn Gly Ile Asp Phe Tyr Asn Asn
260 265 270
Ile Ile Gly Gly Leu Pro Ala Phe Ala Gly His Glu Lys Ile Gln Gly
275 280 285
Leu Asn Glu Phe Ile Asn Gln Glu Cys Gln Lys Asp Ser Glu Leu Lys
290 295 300
Ser Lys Leu Lys Asn Arg His Ala Phe Lys Met Ala Val Leu Phe Lys
305 310 315 320
Gln Ile Leu Ser Asp Arg Glu Lys Ser Phe Val Ile Asp Glu Phe Glu
325 330 335
Ser Asp Ala Gln Val Ile Asp Ala Val Lys Asn Phe Tyr Ala Glu Gln
340 345 350
Cys Lys Asp Asn Asn Val Ile Phe Asn Leu Leu Asn Leu Ile Lys Asn
355 360 365
Ile Ala Phe Leu Ser Asp Asp Glu Leu Asp Gly Ile Phe Ile Glu Gly
370 375 380
Lys Tyr Leu Ser Ser Val Ser Gln Lys Leu Tyr Ser Asp Trp Ser Lys
385 390 395 400
Leu Arg Asn Asp Ile Glu Asp Ser Ala Asn Ser Lys Gln Gly Asn Lys
405 410 415
Glu Leu Ala Lys Lys Ile Lys Thr Asn Lys Gly Asp Val Glu Lys Ala
420 425 430
Ile Ser Lys Tyr Glu Phe Ser Leu Ser Glu Leu Asn Ser Ile Val His
435 440 445
Asp Asn Thr Lys Phe Ser Asp Leu Leu Ser Cys Thr Leu His Lys Val
450 455 460
Ala Ser Glu Lys Leu Val Lys Val Asn Glu Gly Asp Trp Pro Lys His
465 470 475 480
Leu Lys Asn Asn Glu Glu Lys Gln Lys Ile Lys Glu Pro Leu Asp Ala
485 490 495
Leu Leu Glu Ile Tyr Asn Thr Leu Leu Ile Phe Asn Cys Lys Ser Phe
500 505 510
Asn Lys Asn Gly Asn Phe Tyr Val Asp Tyr Asp Arg Cys Ile Asn Glu
515 520 525
Leu Ser Ser Val Val Tyr Leu Tyr Asn Lys Thr Arg Asn Tyr Cys Thr
530 535 540
Lys Lys Pro Tyr Asn Thr Asp Lys Phe Lys Leu Asn Phe Asn Ser Pro
545 550 555 560
Gln Leu Gly Glu Gly Phe Ser Lys Ser Lys Glu Asn Asp Cys Leu Thr
565 570 575
Leu Leu Phe Lys Lys Asp Asp Asn Tyr Tyr Val Gly Ile Ile Arg Lys
580 585 590
Gly Ala Lys Ile Asn Phe Asp Asp Thr Gln Ala Ile Ala Asp Asn Thr
595 600 605
Asp Asn Cys Ile Phe Lys Met Asn Tyr Phe Leu Leu Lys Asp Ala Lys
610 615 620
Lys Phe Ile Pro Lys Cys Ser Ile Gln Leu Lys Glu Val Lys Ala His
625 630 635 640
Phe Lys Lys Ser Glu Asp Asp Tyr Ile Leu Ser Asp Lys Glu Lys Phe
645 650 655
Ala Ser Pro Leu Val Ile Lys Lys Ser Thr Phe Leu Leu Ala Thr Ala
660 665 670
His Val Lys Gly Lys Lys Gly Asn Ile Lys Lys Phe Gln Lys Glu Tyr
675 680 685
Ser Lys Glu Asn Pro Thr Glu Tyr Arg Asn Ser Leu Asn Glu Trp Ile
690 695 700
Ala Phe Cys Lys Glu Phe Leu Lys Thr Tyr Lys Ala Ala Thr Ile Phe
705 710 715 720
Asp Ile Thr Thr Leu Lys Lys Ala Glu Glu Tyr Ala Asp Ile Val Glu
725 730 735
Phe Tyr Lys Asp Val Asp Asn Leu Cys Tyr Lys Leu Glu Phe Cys Pro
740 745 750
Ile Lys Thr Ser Phe Ile Glu Asn Leu Ile Asp Asn Gly Asp Leu Tyr
755 760 765
Leu Phe Arg Ile Asn Asn Lys Asp Phe Ser Ser Lys Ser Thr Gly Thr
770 775 780
Lys Asn Leu His Thr Leu Tyr Leu Gln Ala Ile Phe Asp Glu Arg Asn
785 790 795 800
Leu Asn Asn Pro Thr Ile Met Leu Asn Gly Gly Ala Glu Leu Phe Tyr
805 810 815
Arg Lys Glu Ser Ile Glu Gln Lys Asn Arg Ile Thr His Lys Ala Gly
820 825 830
Ser Ile Leu Val Asn Lys Val Cys Lys Asp Gly Thr Ser Leu Asp Asp
835 840 845
Lys Ile Arg Asn Glu Ile Tyr Gln Tyr Glu Asn Lys Phe Ile Asp Thr
850 855 860
Leu Ser Asp Glu Ala Lys Lys Val Leu Pro Asn Val Ile Lys Lys Glu
865 870 875 880
Ala Thr His Asp Ile Thr Lys Asp Lys Arg Phe Thr Ser Asp Lys Phe
885 890 895
Phe Phe His Cys Pro Leu Thr Ile Asn Tyr Lys Glu Gly Asp Thr Lys
900 905 910
Gln Phe Asn Asn Glu Val Leu Ser Phe Leu Arg Gly Asn Pro Asp Ile
915 920 925
Asn Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Val Thr
930 935 940
Val Ile Asn Gln Lys Gly Glu Ile Leu Asp Ser Val Ser Phe Asn Thr
945 950 955 960
Val Thr Asn Lys Ser Ser Lys Ile Glu Gln Thr Val Asp Tyr Glu Glu
965 970 975
Lys Leu Ala Val Arg Glu Lys Glu Arg Ile Glu Ala Lys Arg Ser Trp
980 985 990
Asp Ser Ile Ser Lys Ile Ala Thr Leu Lys Glu Gly Tyr Leu Ser Ala
995 1000 1005
Ile Val His Glu Ile Cys Leu Leu Met Ile Lys His Asn Ala Ile
1010 1015 1020
Val Val Leu Glu Asn Leu Asn Ala Gly Phe Lys Arg Ile Arg Gly
1025 1030 1035
Gly Leu Ser Glu Lys Ser Val Tyr Gln Lys Phe Glu Lys Met Leu
1040 1045 1050
Ile Asn Lys Leu Asn Tyr Phe Val Ser Lys Lys Glu Ser Asp Trp
1055 1060 1065
Asn Lys Pro Ser Gly Leu Leu Asn Gly Leu Gln Leu Ser Asp Gln
1070 1075 1080
Phe Glu Ser Phe Glu Lys Leu Gly Ile Gln Ser Gly Phe Ile Phe
1085 1090 1095
Tyr Val Pro Ala Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly
1100 1105 1110
Phe Ala Asn Val Leu Asn Leu Ser Lys Val Arg Asn Val Asp Ala
1115 1120 1125
Ile Lys Ser Phe Phe Ser Asn Phe Asn Glu Ile Ser Tyr Ser Lys
1130 1135 1140
Lys Glu Ala Leu Phe Lys Phe Ser Phe Asp Leu Asp Ser Leu Ser
1145 1150 1155
Lys Lys Gly Phe Ser Ser Phe Val Lys Phe Ser Lys Ser Lys Trp
1160 1165 1170
Asn Val Tyr Thr Phe Gly Glu Arg Ile Ile Lys Pro Lys Asn Lys
1175 1180 1185
Gln Gly Tyr Arg Glu Asp Lys Arg Ile Asn Leu Thr Phe Glu Met
1190 1195 1200
Lys Lys Leu Leu Asn Glu Tyr Lys Val Ser Phe Asp Leu Glu Asn
1205 1210 1215
Asn Leu Ile Pro Asn Leu Thr Ser Ala Asn Leu Lys Asp Thr Phe
1220 1225 1230
Trp Lys Glu Leu Phe Phe Ile Phe Lys Thr Thr Leu Gln Leu Arg
1235 1240 1245
Asn Ser Val Thr Asn Gly Lys Glu Asp Val Leu Ile Ser Pro Val
1250 1255 1260
Lys Asn Ala Lys Gly Glu Phe Phe Val Ser Gly Thr His Asn Lys
1265 1270 1275
Thr Leu Pro Gln Asp Cys Asp Ala Asn Gly Ala Tyr His Ile Ala
1280 1285 1290
Leu Lys Gly Leu Met Ile Leu Glu Arg Asn Asn Leu Val Arg Glu
1295 1300 1305
Glu Lys Asp Thr Lys Lys Ile Met Ala Ile Ser Asn Val Asp Trp
1310 1315 1320
Phe Glu Tyr Val Gln Lys Arg Arg Gly Val Leu
1325 1330
<210> 3
<211> 1238
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 3
Met Asn Asn Tyr Asp Glu Phe Thr Lys Leu Tyr Pro Ile Gln Lys Thr
1 5 10 15
Ile Arg Phe Glu Leu Lys Pro Gln Gly Arg Thr Met Glu His Leu Glu
20 25 30
Thr Phe Asn Phe Phe Glu Glu Asp Arg Asp Arg Ala Glu Lys Tyr Lys
35 40 45
Ile Leu Lys Glu Ala Ile Asp Glu Tyr His Lys Lys Phe Ile Asp Glu
50 55 60
His Leu Thr Asn Met Ser Leu Asp Trp Asn Ser Leu Lys Gln Ile Ser
65 70 75 80
Glu Lys Tyr Tyr Lys Ser Arg Glu Glu Lys Asp Lys Lys Val Phe Leu
85 90 95
Ser Glu Gln Lys Arg Met Arg Gln Glu Ile Val Ser Glu Phe Lys Lys
100 105 110
Asp Asp Arg Phe Lys Asp Leu Phe Ser Lys Lys Leu Phe Ser Glu Leu
115 120 125
Leu Lys Glu Glu Ile Tyr Lys Lys Gly Asn His Gln Glu Ile Asp Ala
130 135 140
Leu Lys Ser Phe Asp Lys Phe Ser Gly Tyr Phe Ile Gly Leu His Glu
145 150 155 160
Asn Arg Lys Asn Met Tyr Ser Asp Gly Asp Glu Ile Thr Ala Ile Ser
165 170 175
Asn Arg Ile Val Asn Glu Asn Phe Pro Lys Phe Leu Asp Asn Leu Gln
180 185 190
Lys Tyr Gln Glu Ala Arg Lys Lys Tyr Pro Glu Trp Ile Ile Lys Ala
195 200 205
Glu Ser Ala Leu Val Ala His Asn Ile Lys Met Asp Glu Val Phe Ser
210 215 220
Leu Glu Tyr Phe Asn Lys Val Leu Asn Gln Glu Gly Ile Gln Arg Tyr
225 230 235 240
Asn Leu Ala Leu Gly Gly Tyr Val Thr Lys Ser Gly Glu Lys Met Met
245 250 255
Gly Leu Asn Asp Ala Leu Asn Leu Ala His Gln Ser Glu Lys Ser Ser
260 265 270
Lys Gly Arg Ile His Met Thr Pro Leu Phe Lys Gln Ile Leu Ser Glu
275 280 285
Lys Glu Ser Phe Ser Tyr Ile Pro Asp Val Phe Thr Glu Asp Ser Gln
290 295 300
Leu Leu Pro Ser Ile Gly Gly Phe Phe Ala Gln Ile Glu Asn Asp Lys
305 310 315 320
Asp Gly Asn Ile Phe Asp Arg Ala Leu Glu Leu Ile Ser Ser Tyr Ala
325 330 335
Glu Tyr Asp Thr Glu Arg Ile Tyr Ile Arg Gln Ala Asp Ile Asn Arg
340 345 350
Val Ser Asn Val Ile Phe Gly Glu Trp Gly Thr Leu Gly Gly Leu Met
355 360 365
Arg Glu Tyr Lys Ala Asp Ser Ile Asn Asp Ile Asn Leu Glu Arg Thr
370 375 380
Cys Lys Lys Val Asp Lys Trp Leu Asp Ser Lys Glu Phe Ala Leu Ser
385 390 395 400
Asp Val Leu Glu Ala Ile Lys Arg Thr Gly Asn Asn Asp Ala Phe Asn
405 410 415
Glu Tyr Ile Ser Lys Met Arg Thr Ala Arg Glu Lys Ile Asp Ala Ala
420 425 430
Arg Lys Glu Met Lys Phe Ile Ser Glu Lys Ile Ser Gly Asp Glu Glu
435 440 445
Ser Ile His Ile Ile Lys Thr Leu Leu Asp Ser Val Gln Gln Phe Leu
450 455 460
His Phe Phe Asn Leu Phe Lys Ala Arg Gln Asp Ile Pro Leu Asp Gly
465 470 475 480
Ala Phe Tyr Ala Glu Phe Asp Glu Val His Ser Lys Leu Phe Ala Ile
485 490 495
Val Pro Leu Tyr Asn Lys Val Arg Asn Tyr Leu Thr Lys Asn Asn Leu
500 505 510
Asn Thr Lys Lys Ile Lys Leu Asn Phe Lys Asn Pro Thr Leu Ala Asn
515 520 525
Gly Trp Asp Gln Asn Lys Val Tyr Asp Tyr Ala Ser Leu Ile Phe Leu
530 535 540
Arg Asp Gly Asn Tyr Tyr Leu Gly Ile Ile Asn Pro Lys Arg Lys Lys
545 550 555 560
Asn Ile Lys Phe Glu Gln Gly Ser Gly Asn Gly Pro Phe Tyr Arg Lys
565 570 575
Met Val Tyr Lys Gln Ile Pro Gly Pro Asn Lys Asn Leu Pro Arg Val
580 585 590
Phe Leu Thr Ser Thr Lys Gly Lys Lys Glu Tyr Lys Pro Ser Lys Glu
595 600 605
Ile Ile Glu Gly Tyr Glu Ala Asp Lys His Ile Arg Gly Asp Lys Phe
610 615 620
Asp Leu Asp Phe Cys His Lys Leu Ile Asp Phe Phe Lys Glu Ser Ile
625 630 635 640
Glu Lys His Lys Asp Trp Ser Lys Phe Asn Phe Tyr Phe Ser Pro Thr
645 650 655
Glu Ser Tyr Gly Asp Ile Ser Glu Phe Tyr Leu Asp Val Glu Lys Gln
660 665 670
Gly Tyr Arg Met His Phe Glu Asn Ile Ser Ala Glu Thr Ile Asp Glu
675 680 685
Tyr Val Glu Lys Gly Asp Leu Phe Leu Phe Gln Ile Tyr Asn Lys Asp
690 695 700
Phe Val Lys Ala Ala Thr Gly Lys Lys Asp Met His Thr Ile Tyr Trp
705 710 715 720
Asn Ala Ala Phe Ser Pro Glu Asn Leu Gln Asp Val Val Val Lys Leu
725 730 735
Asn Gly Glu Ala Glu Leu Phe Tyr Arg Asp Lys Ser Asp Ile Lys Glu
740 745 750
Ile Val His Arg Glu Gly Glu Ile Leu Val Asn Arg Thr Tyr Asn Gly
755 760 765
Arg Thr Pro Val Pro Asp Lys Ile His Lys Lys Leu Thr Asp Tyr His
770 775 780
Asn Gly Arg Thr Lys Asp Leu Gly Glu Ala Lys Glu Tyr Leu Asp Lys
785 790 795 800
Val Arg Tyr Phe Lys Ala His Tyr Asp Ile Thr Lys Asp Arg Arg Tyr
805 810 815
Leu Asn Asp Lys Ile Tyr Phe His Val Pro Leu Thr Leu Asn Phe Lys
820 825 830
Ala Asn Gly Lys Lys Asn Leu Asn Lys Met Val Ile Glu Lys Phe Leu
835 840 845
Ser Asp Glu Lys Ala His Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn
850 855 860
Leu Leu Tyr Tyr Ser Ile Ile Asp Arg Ser Gly Lys Ile Ile Asp Gln
865 870 875 880
Gln Ser Leu Asn Val Ile Asp Gly Phe Asp Tyr Arg Glu Lys Leu Asn
885 890 895
Gln Arg Glu Ile Glu Met Lys Asp Ala Arg Gln Ser Trp Asn Ala Ile
900 905 910
Gly Lys Ile Lys Asp Leu Lys Glu Gly Tyr Leu Ser Lys Ala Val His
915 920 925
Glu Ile Thr Lys Met Ala Ile Gln Tyr Asn Ala Ile Val Val Met Glu
930 935 940
Glu Leu Asn Tyr Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln
945 950 955 960
Ile Tyr Gln Lys Phe Glu Asn Met Leu Ile Asp Lys Met Asn Tyr Leu
965 970 975
Val Phe Lys Asp Ala Pro Asp Glu Ser Pro Gly Gly Val Leu Asn Ala
980 985 990
Tyr Gln Leu Thr Asn Pro Leu Glu Ser Phe Ala Lys Leu Gly Lys Gln
995 1000 1005
Thr Gly Ile Leu Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys Ile
1010 1015 1020
Asp Pro Thr Thr Gly Phe Val Asn Leu Phe Asn Thr Ser Ser Lys
1025 1030 1035
Thr Asn Ala Gln Glu Arg Lys Glu Phe Leu Gln Lys Phe Glu Ser
1040 1045 1050
Ile Ser Tyr Ser Ala Lys Asp Gly Gly Ile Phe Ala Phe Ala Phe
1055 1060 1065
Asp Tyr Arg Lys Phe Gly Thr Ser Lys Thr Asp His Lys Asn Val
1070 1075 1080
Trp Thr Ala Tyr Thr Asn Gly Glu Arg Met Arg Tyr Ile Lys Glu
1085 1090 1095
Lys Lys Arg Asn Glu Leu Phe Asp Pro Ser Lys Glu Ile Lys Glu
1100 1105 1110
Ala Leu Thr Ser Ser Gly Ile Lys Tyr Asp Gly Gly Gln Asn Ile
1115 1120 1125
Leu Pro Asp Ile Leu Arg Ser Asn Asn Asn Gly Leu Ile Tyr Thr
1130 1135 1140
Met Tyr Ser Ser Phe Ile Ala Ala Ile Gln Met Arg Val Tyr Asp
1145 1150 1155
Gly Lys Glu Asp Tyr Ile Ile Ser Pro Ile Lys Asn Ser Lys Gly
1160 1165 1170
Glu Phe Phe Arg Thr Asp Pro Lys Arg Arg Glu Leu Pro Ile Asp
1175 1180 1185
Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Leu Arg Gly Glu Leu
1190 1195 1200
Thr Met Arg Ala Ile Ala Glu Lys Phe Asp Pro Asp Ser Glu Lys
1205 1210 1215
Met Ala Lys Leu Glu Leu Lys His Lys Asp Trp Phe Glu Phe Met
1220 1225 1230
Gln Thr Arg Gly Asp
1235
<210> 4
<211> 1298
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 4
Met Thr Lys Thr Phe Asp Ser Glu Phe Phe Asn Leu Tyr Ser Leu Gln
1 5 10 15
Lys Thr Val Arg Phe Glu Leu Lys Pro Val Gly Glu Thr Ala Ser Phe
20 25 30
Val Glu Asp Phe Lys Asn Glu Gly Leu Lys Arg Val Val Ser Glu Asp
35 40 45
Glu Arg Arg Ala Val Asp Tyr Gln Lys Val Lys Glu Ile Ile Asp Asp
50 55 60
Tyr His Arg Asp Phe Ile Glu Glu Ser Leu Asn Tyr Phe Pro Glu Gln
65 70 75 80
Val Ser Lys Asp Ala Leu Glu Gln Ala Phe His Leu Tyr Gln Lys Leu
85 90 95
Lys Ala Ala Lys Val Glu Glu Arg Glu Lys Ala Leu Lys Glu Trp Glu
100 105 110
Ala Leu Gln Lys Lys Leu Arg Glu Lys Val Val Lys Cys Phe Ser Asp
115 120 125
Ser Asn Lys Ala Arg Phe Ser Arg Ile Asp Lys Lys Glu Leu Ile Lys
130 135 140
Glu Asp Leu Ile Asn Trp Leu Val Ala Gln Asn Arg Glu Asp Asp Ile
145 150 155 160
Pro Thr Val Glu Thr Phe Asn Asn Phe Thr Thr Tyr Phe Thr Gly Phe
165 170 175
His Glu Asn Arg Lys Asn Ile Tyr Ser Lys Asp Asp His Ala Thr Ala
180 185 190
Ile Ser Phe Arg Leu Ile His Glu Asn Leu Pro Lys Phe Phe Asp Asn
195 200 205
Val Ile Ser Phe Asn Lys Leu Lys Glu Gly Phe Pro Glu Leu Lys Phe
210 215 220
Asp Lys Val Lys Glu Asp Leu Glu Val Asp Tyr Asp Leu Lys His Ala
225 230 235 240
Phe Glu Ile Glu Tyr Phe Val Asn Phe Val Thr Gln Ala Gly Ile Asp
245 250 255
Gln Tyr Asn Tyr Leu Leu Gly Gly Lys Thr Leu Glu Asp Gly Thr Lys
260 265 270
Lys Gln Gly Met Asn Glu Gln Ile Asn Leu Phe Lys Gln Gln Gln Thr
275 280 285
Arg Asp Lys Ala Arg Gln Ile Pro Lys Leu Ile Pro Leu Phe Lys Gln
290 295 300
Ile Leu Ser Glu Arg Thr Glu Ser Gln Ser Phe Ile Pro Lys Gln Phe
305 310 315 320
Glu Ser Asp Gln Glu Leu Phe Asp Ser Leu Gln Lys Leu His Asn Asn
325 330 335
Cys Gln Asp Lys Phe Thr Val Leu Gln Gln Ala Ile Leu Gly Leu Ala
340 345 350
Glu Ala Asp Leu Lys Lys Val Phe Ile Lys Thr Ser Asp Leu Asn Ala
355 360 365
Leu Ser Asn Thr Ile Phe Gly Asn Tyr Ser Val Phe Ser Asp Ala Leu
370 375 380
Asn Leu Tyr Lys Glu Ser Leu Lys Thr Lys Lys Ala Gln Glu Ala Phe
385 390 395 400
Glu Lys Leu Pro Ala His Ser Ile His Asp Leu Ile Gln Tyr Leu Glu
405 410 415
Gln Phe Asn Ser Ser Leu Asp Ala Glu Lys Gln Gln Ser Thr Asp Thr
420 425 430
Val Leu Asn Tyr Phe Ile Lys Thr Asp Glu Leu Tyr Ser Arg Phe Ile
435 440 445
Lys Ser Thr Ser Glu Ala Phe Thr Gln Val Gln Pro Leu Phe Glu Leu
450 455 460
Glu Ala Leu Ser Ser Lys Arg Arg Pro Pro Glu Ser Glu Asp Glu Gly
465 470 475 480
Ala Lys Gly Gln Glu Gly Phe Glu Gln Ile Lys Arg Ile Lys Ala Tyr
485 490 495
Leu Asp Thr Leu Met Glu Ala Val His Phe Ala Lys Pro Leu Tyr Leu
500 505 510
Val Lys Gly Arg Lys Met Ile Glu Gly Leu Asp Lys Asp Gln Ser Phe
515 520 525
Tyr Glu Ala Phe Glu Met Ala Tyr Gln Glu Leu Glu Ser Leu Ile Ile
530 535 540
Pro Ile Tyr Asn Lys Ala Arg Ser Tyr Leu Ser Arg Lys Pro Phe Lys
545 550 555 560
Ala Asp Lys Phe Lys Ile Asn Phe Asp Asn Asn Thr Leu Leu Ser Gly
565 570 575
Trp Asp Ala Asn Lys Glu Thr Ala Asn Ala Ser Ile Leu Phe Lys Lys
580 585 590
Asp Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gly Lys Thr Phe Leu
595 600 605
Phe Asp Tyr Phe Val Ser Ser Glu Asp Ser Glu Lys Leu Lys Gln Arg
610 615 620
Arg Gln Lys Thr Ala Glu Glu Ala Leu Ala Gln Asp Gly Glu Ser Tyr
625 630 635 640
Phe Glu Lys Ile Arg Tyr Lys Leu Leu Pro Gly Ala Ser Lys Met Leu
645 650 655
Pro Lys Val Phe Phe Ser Asn Lys Asn Ile Gly Phe Tyr Asn Pro Ser
660 665 670
Asp Asp Ile Leu Arg Ile Arg Asn Thr Ala Ser His Thr Lys Asn Gly
675 680 685
Thr Pro Gln Lys Gly His Ser Lys Val Glu Phe Asn Leu Asn Asp Cys
690 695 700
His Lys Met Ile Asp Phe Phe Lys Ser Ser Ile Gln Lys His Pro Glu
705 710 715 720
Trp Gly Ser Phe Gly Phe Thr Phe Ser Asp Thr Ser Asp Phe Glu Asp
725 730 735
Met Ser Ala Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Val Ile Ser
740 745 750
Phe Asp Lys Ile Lys Glu Thr Tyr Ile Gln Ser Gln Val Glu Gln Gly
755 760 765
Asn Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Tyr Ser
770 775 780
Lys Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Glu
785 790 795 800
Glu Ala Asn Leu Asn Asn Val Val Ala Lys Leu Asn Gly Glu Ala Glu
805 810 815
Ile Phe Phe Arg Arg His Ser Ile Lys Ala Ser Asp Lys Val Val His
820 825 830
Pro Ala Asn Gln Ala Ile Asp Asn Lys Asn Pro His Thr Glu Lys Thr
835 840 845
Gln Ser Thr Phe Glu Tyr Asp Leu Val Lys Asp Lys Arg Tyr Thr Gln
850 855 860
Asp Lys Phe Phe Phe His Val Pro Ile Ser Leu Asn Phe Lys Ala Gln
865 870 875 880
Gly Val Ser Lys Phe Asn Asp Lys Val Asn Gly Phe Leu Lys Gly Asn
885 890 895
Pro Asp Val Asn Ile Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu
900 905 910
Tyr Phe Thr Val Val Asn Gln Lys Gly Glu Ile Leu Val Gln Glu Ser
915 920 925
Leu Asn Thr Leu Met Ser Asp Lys Gly His Val Asn Asp Tyr Gln Gln
930 935 940
Lys Leu Asp Lys Lys Glu Gln Glu Arg Asp Ala Ala Arg Lys Ser Trp
945 950 955 960
Thr Thr Val Glu Asn Ile Lys Glu Leu Lys Glu Gly Tyr Leu Ser His
965 970 975
Val Val His Lys Leu Ala His Leu Ile Ile Lys Tyr Asn Ala Ile Val
980 985 990
Cys Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val
995 1000 1005
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Ala Leu Ile Asp Lys
1010 1015 1020
Leu Asn Tyr Leu Val Phe Lys Glu Lys Glu Leu Gly Glu Val Gly
1025 1030 1035
His Tyr Leu Thr Ala Tyr Gln Leu Thr Ala Pro Phe Glu Ser Phe
1040 1045 1050
Lys Lys Leu Gly Lys Gln Ser Gly Ile Leu Phe Tyr Val Pro Ala
1055 1060 1065
Asp Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Phe
1070 1075 1080
Leu Asp Leu Arg Tyr Gln Ser Val Glu Lys Ala Lys Gln Leu Leu
1085 1090 1095
Ser Asp Phe Asn Ala Ile Arg Phe Asn Ser Val Gln Asn Tyr Phe
1100 1105 1110
Glu Phe Glu Ile Asp Tyr Lys Lys Leu Thr Pro Lys Arg Lys Val
1115 1120 1125
Gly Thr Gln Ser Lys Trp Val Ile Cys Thr Tyr Gly Asp Val Arg
1130 1135 1140
Tyr Gln Asn Arg Arg Asn Gln Lys Gly His Trp Glu Thr Glu Glu
1145 1150 1155
Val Asn Val Thr Glu Lys Leu Lys Ala Leu Phe Ala Ser Asp Ser
1160 1165 1170
Lys Thr Thr Thr Val Ile Asp Tyr Ala Asn Asp Asp Asn Leu Ile
1175 1180 1185
Asp Val Ile Leu Glu Gln Asp Lys Ala Ser Phe Phe Lys Glu Leu
1190 1195 1200
Leu Trp Leu Leu Lys Leu Thr Met Thr Leu Arg His Ser Lys Ile
1205 1210 1215
Lys Ser Glu Asp Asp Phe Ile Leu Ser Pro Val Lys Asn Glu Gln
1220 1225 1230
Gly Glu Phe Tyr Asp Ser Arg Lys Ala Gly Glu Val Trp Pro Lys
1235 1240 1245
Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Leu
1250 1255 1260
Trp Asn Leu Gln Gln Ile Asn Gln Trp Glu Lys Gly Lys Thr Leu
1265 1270 1275
Asn Leu Ala Ile Lys Asn Gln Asp Trp Phe Ser Phe Ile Gln Glu
1280 1285 1290
Lys Pro Tyr Gln Glu
1295
<210> 5
<211> 1235
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 5
Met His Thr Gly Gly Leu Leu Ser Met Asp Ala Lys Glu Phe Thr Gly
1 5 10 15
Gln Tyr Pro Leu Ser Lys Thr Leu Arg Phe Glu Leu Arg Pro Ile Gly
20 25 30
Arg Thr Trp Asp Asn Leu Glu Ala Ser Gly Tyr Leu Ala Glu Asp Arg
35 40 45
His Arg Ala Glu Cys Tyr Pro Arg Ala Lys Glu Leu Leu Asp Asp Asn
50 55 60
His Arg Ala Phe Leu Asn Arg Val Leu Pro Gln Ile Asp Met Asp Trp
65 70 75 80
His Pro Ile Ala Glu Ala Phe Cys Lys Val His Lys Asn Pro Gly Asn
85 90 95
Lys Glu Leu Ala Gln Asp Tyr Asn Leu Gln Leu Ser Lys Arg Arg Lys
100 105 110
Glu Ile Ser Ala Tyr Leu Gln Asp Ala Asp Gly Tyr Lys Gly Leu Phe
115 120 125
Ala Lys Pro Ala Leu Asp Glu Ala Met Lys Ile Ala Lys Glu Asn Gly
130 135 140
Asn Glu Ser Asp Ile Glu Val Leu Glu Ala Phe Asn Gly Phe Ser Val
145 150 155 160
Tyr Phe Thr Gly Tyr His Glu Ser Arg Glu Asn Ile Tyr Ser Asp Glu
165 170 175
Asp Met Val Ser Val Ala Tyr Arg Ile Thr Glu Asp Asn Phe Pro Arg
180 185 190
Phe Val Ser Asn Ala Leu Ile Phe Asp Lys Leu Asn Glu Ser His Pro
195 200 205
Asp Ile Ile Ser Glu Val Ser Gly Asn Leu Gly Val Asp Asp Ile Gly
210 215 220
Lys Tyr Phe Asp Val Ser Asn Tyr Asn Asn Phe Leu Ser Gln Ala Gly
225 230 235 240
Ile Asp Asp Tyr Asn His Ile Ile Gly Gly His Thr Thr Glu Asp Gly
245 250 255
Leu Ile Gln Ala Phe Asn Val Val Leu Asn Leu Arg His Gln Lys Asp
260 265 270
Pro Gly Phe Glu Lys Ile Gln Phe Lys Gln Leu Tyr Lys Gln Ile Leu
275 280 285
Ser Val Arg Thr Ser Lys Ser Tyr Ile Pro Lys Gln Phe Asp Asn Ser
290 295 300
Lys Glu Met Val Asp Cys Ile Cys Asp Tyr Val Ser Lys Ile Glu Lys
305 310 315 320
Ser Glu Thr Val Glu Arg Ala Leu Lys Leu Val Arg Asn Ile Ser Ser
325 330 335
Phe Asp Leu Arg Gly Ile Phe Val Asn Lys Lys Asn Leu Arg Ile Leu
340 345 350
Ser Asn Lys Leu Ile Gly Asp Trp Asp Ala Ile Glu Thr Ala Leu Met
355 360 365
His Ser Ser Ser Ser Glu Asn Asp Lys Lys Ser Val Tyr Asp Ser Ala
370 375 380
Glu Ala Phe Thr Leu Asp Asp Ile Phe Ser Ser Val Lys Lys Phe Ser
385 390 395 400
Asp Ala Ser Ala Glu Asp Ile Gly Asn Arg Ala Glu Asp Ile Cys Arg
405 410 415
Val Ile Ser Glu Thr Ala Pro Phe Ile Asn Asp Leu Arg Ala Val Asp
420 425 430
Leu Asp Ser Leu Asn Asp Asp Gly Tyr Glu Ala Ala Val Ser Lys Ile
435 440 445
Arg Glu Ser Leu Glu Pro Tyr Met Asp Leu Phe His Glu Leu Glu Ile
450 455 460
Phe Ser Val Gly Asp Glu Phe Pro Lys Cys Ala Ala Phe Tyr Ser Glu
465 470 475 480
Leu Glu Glu Val Ser Glu Gln Leu Ile Glu Ile Ile Pro Leu Phe Asn
485 490 495
Lys Ala Arg Ser Phe Cys Thr Arg Lys Arg Tyr Ser Thr Asp Lys Ile
500 505 510
Lys Val Asn Leu Lys Phe Pro Thr Leu Ala Asp Gly Trp Asp Leu Asn
515 520 525
Lys Glu Arg Asp Asn Lys Ala Ala Ile Leu Arg Lys Asp Gly Lys Tyr
530 535 540
Tyr Leu Ala Ile Leu Asp Met Lys Lys Asp Leu Ser Ser Ile Arg Thr
545 550 555 560
Ser Asp Glu Asp Glu Ser Ser Phe Glu Lys Met Glu Tyr Lys Leu Leu
565 570 575
Pro Ser Pro Val Lys Met Leu Pro Lys Ile Phe Val Lys Ser Lys Ala
580 585 590
Ala Lys Glu Lys Tyr Gly Leu Thr Asp Arg Met Leu Glu Cys Tyr Asp
595 600 605
Lys Gly Met His Lys Ser Gly Ser Ala Phe Asp Leu Gly Phe Cys His
610 615 620
Glu Leu Ile Asp Tyr Tyr Lys Arg Cys Ile Ala Glu Tyr Pro Gly Trp
625 630 635 640
Asp Val Phe Asp Phe Lys Phe Arg Glu Thr Ser Asp Tyr Gly Ser Met
645 650 655
Lys Glu Phe Asn Glu Asp Val Ala Gly Ala Gly Tyr Tyr Met Ser Leu
660 665 670
Arg Lys Ile Pro Cys Ser Glu Val Tyr Arg Leu Leu Asp Glu Lys Ser
675 680 685
Ile Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Tyr Ser Glu Asn Ala His
690 695 700
Gly Asn Lys Asn Met His Thr Met Tyr Trp Glu Gly Leu Phe Ser Pro
705 710 715 720
Gln Asn Leu Glu Ser Pro Val Phe Lys Leu Ser Gly Gly Ala Glu Leu
725 730 735
Phe Phe Arg Lys Ser Ser Ile Pro Asn Asp Ala Lys Thr Val His Pro
740 745 750
Lys Gly Ser Val Leu Val Pro Arg Asn Asp Val Asn Gly Arg Arg Ile
755 760 765
Pro Asp Ser Ile Tyr Arg Glu Leu Thr Arg Tyr Phe Asn Arg Gly Asp
770 775 780
Cys Arg Ile Ser Asp Glu Ala Lys Ser Tyr Leu Asp Lys Val Lys Thr
785 790 795 800
Lys Lys Ala Asp His Asp Ile Val Lys Asp Arg Arg Phe Thr Val Asp
805 810 815
Lys Met Met Phe His Val Pro Ile Ala Met Asn Phe Lys Ala Ile Ser
820 825 830
Lys Pro Asn Leu Asn Lys Lys Val Ile Asp Gly Ile Ile Asp Asp Gln
835 840 845
Asp Leu Lys Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr
850 855 860
Val Thr Met Val Asp Arg Lys Gly Asn Ile Leu Tyr Gln Asp Ser Leu
865 870 875 880
Asn Ile Leu Asn Gly Tyr Asp Tyr Arg Lys Ala Leu Asp Val Arg Glu
885 890 895
Tyr Asp Asn Lys Glu Ala Arg Arg Asn Trp Thr Lys Val Glu Gly Ile
900 905 910
Arg Lys Met Lys Glu Gly Tyr Leu Ser Leu Ala Val Ser Lys Leu Ala
915 920 925
Asp Met Ile Ile Glu Asn Asn Ala Ile Ile Val Met Glu Asp Leu Asn
930 935 940
His Gly Phe Lys Ala Gly Arg Ser Lys Ile Glu Lys Gln Val Tyr Gln
945 950 955 960
Lys Phe Glu Ser Met Leu Ile Asn Lys Leu Gly Tyr Met Val Leu Lys
965 970 975
Asp Lys Ser Ile Asp Gln Ser Gly Gly Ala Leu His Gly Tyr Gln Leu
980 985 990
Ala Asn His Val Thr Thr Leu Ala Ser Val Gly Lys Gln Cys Gly Val
995 1000 1005
Ile Phe Tyr Ile Pro Ala Ala Phe Thr Ser Lys Ile Asp Pro Thr
1010 1015 1020
Thr Gly Phe Ala Asp Leu Phe Ala Leu Ser Asn Val Lys Asn Val
1025 1030 1035
Ala Ser Met Arg Glu Phe Phe Ser Lys Met Lys Ser Val Ile Tyr
1040 1045 1050
Asp Lys Ala Glu Gly Lys Phe Ala Phe Thr Phe Asp Tyr Leu Asp
1055 1060 1065
Tyr Asn Val Lys Ser Glu Cys Gly Arg Thr Leu Trp Thr Val Tyr
1070 1075 1080
Thr Val Gly Glu Arg Phe Thr Tyr Ser Arg Val Asn Arg Glu Tyr
1085 1090 1095
Val Arg Lys Val Pro Thr Asp Ile Ile Tyr Asp Ala Leu Gln Lys
1100 1105 1110
Ala Gly Ile Ser Val Glu Gly Asp Leu Arg Asp Arg Ile Ala Glu
1115 1120 1125
Ser Asp Gly Asp Thr Leu Lys Ser Ile Phe Tyr Ala Phe Lys Tyr
1130 1135 1140
Ala Leu Asp Met Arg Val Glu Asn Arg Glu Glu Asp Tyr Ile Gln
1145 1150 1155
Ser Pro Val Lys Asn Ala Ser Gly Glu Phe Phe Cys Ser Lys Asn
1160 1165 1170
Ala Gly Lys Ser Leu Pro Gln Asp Ser Asp Ala Asn Gly Ala Tyr
1175 1180 1185
Asn Ile Ala Leu Lys Gly Ile Leu Gln Leu Arg Met Leu Ser Glu
1190 1195 1200
Gln Tyr Asp Pro Asn Ala Glu Ser Ile Arg Leu Pro Leu Ile Thr
1205 1210 1215
Asn Lys Ala Trp Leu Thr Phe Met Gln Ser Gly Met Lys Thr Trp
1220 1225 1230
Lys Asn
1235
<210> 6
<211> 1260
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 6
Met Asp Ser Leu Lys Asp Phe Thr Asn Leu Tyr Pro Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Lys Pro Val Gly Lys Thr Leu Glu Asn Ile Glu
20 25 30
Lys Ala Gly Ile Leu Lys Glu Asp Glu His Arg Ala Glu Ser Tyr Arg
35 40 45
Arg Val Lys Lys Ile Ile Asp Thr Tyr His Lys Val Phe Ile Asp Ser
50 55 60
Ser Leu Glu Asn Met Ala Lys Met Gly Ile Glu Asn Glu Ile Lys Ala
65 70 75 80
Met Leu Gln Ser Phe Cys Glu Leu Tyr Lys Lys Asp His Arg Thr Glu
85 90 95
Gly Glu Asp Lys Ala Leu Asp Lys Ile Arg Ala Val Leu Arg Gly Leu
100 105 110
Ile Val Gly Ala Phe Thr Gly Val Cys Gly Arg Arg Glu Asn Thr Val
115 120 125
Gln Asn Glu Lys Tyr Glu Ser Leu Phe Lys Glu Lys Leu Ile Lys Glu
130 135 140
Ile Leu Pro Asp Phe Val Leu Ser Thr Glu Ala Glu Ser Leu Pro Phe
145 150 155 160
Ser Val Glu Glu Ala Thr Arg Ser Leu Lys Glu Phe Asp Ser Phe Thr
165 170 175
Ser Tyr Phe Ala Gly Phe Tyr Glu Asn Arg Lys Asn Ile Tyr Ser Thr
180 185 190
Lys Pro Gln Ser Thr Ala Ile Ala Tyr Arg Leu Ile His Glu Asn Leu
195 200 205
Pro Lys Phe Ile Asp Asn Ile Leu Val Phe Gln Lys Ile Lys Glu Pro
210 215 220
Ile Ala Lys Glu Leu Glu His Ile Arg Ala Asp Phe Ser Ala Gly Gly
225 230 235 240
Tyr Ile Lys Lys Asp Glu Arg Leu Glu Asp Ile Phe Ser Leu Asn Tyr
245 250 255
Tyr Ile His Val Leu Ser Gln Ala Gly Ile Glu Lys Tyr Asn Ala Leu
260 265 270
Ile Gly Lys Ile Val Thr Glu Gly Asp Gly Glu Met Lys Gly Leu Asn
275 280 285
Glu His Ile Asn Leu Tyr Asn Gln Gln Arg Gly Arg Glu Asp Arg Leu
290 295 300
Pro Leu Phe Arg Pro Leu Tyr Lys Gln Ile Leu Ser Asp Arg Glu Gln
305 310 315 320
Leu Ser Tyr Leu Pro Glu Ser Phe Glu Lys Asp Glu Glu Leu Leu Arg
325 330 335
Ala Leu Lys Glu Phe Tyr Asp His Ile Ala Glu Asp Ile Leu Gly Arg
340 345 350
Thr Gln Gln Leu Met Thr Ser Ile Ser Glu Tyr Asp Leu Ser Arg Ile
355 360 365
Tyr Val Arg Asn Asp Ser Gln Leu Thr Asp Ile Ser Lys Lys Met Leu
370 375 380
Gly Asp Trp Asn Ala Ile Tyr Met Ala Arg Glu Arg Ala Tyr Asp His
385 390 395 400
Glu Gln Ala Pro Lys Arg Ile Thr Ala Lys Tyr Glu Arg Asp Arg Ile
405 410 415
Lys Ala Leu Lys Gly Glu Glu Ser Ile Ser Leu Ala Asn Leu Asn Ser
420 425 430
Cys Ile Ala Phe Leu Asp Asn Val Arg Asp Cys Arg Val Asp Thr Tyr
435 440 445
Leu Ser Thr Leu Gly Gln Lys Glu Gly Pro His Gly Leu Ser Asn Leu
450 455 460
Val Glu Asn Val Phe Ala Ser Tyr His Glu Ala Glu Gln Leu Leu Ser
465 470 475 480
Phe Pro Tyr Pro Glu Glu Asn Asn Leu Ile Gln Asp Lys Asp Asn Val
485 490 495
Val Leu Ile Lys Asn Leu Leu Asp Asn Ile Ser Asp Leu Gln Arg Phe
500 505 510
Leu Lys Pro Leu Trp Gly Met Gly Asp Glu Pro Asp Lys Asp Glu Arg
515 520 525
Phe Tyr Gly Glu Tyr Asn Tyr Ile Arg Gly Ala Leu Asp Gln Val Ile
530 535 540
Pro Leu Tyr Asn Lys Val Arg Asn Tyr Leu Thr Arg Lys Pro Tyr Ser
545 550 555 560
Thr Arg Lys Val Lys Leu Asn Phe Gly Asn Ser Gln Leu Leu Ser Gly
565 570 575
Trp Asp Arg Asn Lys Glu Lys Asp Asn Ser Cys Val Ile Leu Arg Lys
580 585 590
Gly Gln Asn Phe Tyr Leu Ala Ile Met Asn Asn Arg His Lys Arg Ser
595 600 605
Phe Glu Asn Lys Val Leu Pro Glu Tyr Lys Glu Gly Glu Pro Tyr Phe
610 615 620
Glu Lys Met Asp Tyr Lys Phe Leu Pro Asp Pro Asn Lys Met Leu Pro
625 630 635 640
Lys Val Phe Leu Ser Lys Lys Gly Ile Glu Ile Tyr Lys Pro Ser Pro
645 650 655
Lys Leu Leu Glu Gln Tyr Gly His Gly Thr His Lys Lys Gly Asp Thr
660 665 670
Phe Ser Met Asp Asp Leu His Glu Leu Ile Asp Phe Phe Lys His Ser
675 680 685
Ile Glu Ala His Glu Asp Trp Lys Gln Phe Gly Phe Lys Phe Ser Asp
690 695 700
Thr Ala Thr Tyr Glu Asn Val Ser Ser Phe Tyr Arg Glu Val Glu Asp
705 710 715 720
Gln Gly Tyr Lys Leu Ser Phe Arg Lys Val Ser Glu Ser Tyr Val Tyr
725 730 735
Ser Leu Ile Asp Gln Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys
740 745 750
Asp Phe Ser Pro Cys Ser Lys Gly Thr Pro Asn Leu His Thr Leu Tyr
755 760 765
Trp Arg Met Leu Phe Asp Glu Arg Asn Leu Ala Asp Val Ile Tyr Lys
770 775 780
Leu Asp Gly Lys Ala Glu Ile Phe Phe Arg Glu Lys Ser Leu Lys Asn
785 790 795 800
Asp His Pro Thr His Pro Ala Gly Lys Pro Ile Lys Lys Lys Ser Arg
805 810 815
Gln Lys Lys Gly Glu Glu Ser Leu Phe Glu Tyr Asp Leu Val Lys Asp
820 825 830
Arg His Tyr Thr Met Asp Lys Phe Gln Phe His Val Pro Ile Thr Met
835 840 845
Asn Phe Lys Cys Ser Ala Gly Ser Lys Val Asn Asp Met Val Asn Ala
850 855 860
His Ile Arg Glu Ala Lys Asp Met His Val Ile Gly Ile Asp Arg Gly
865 870 875 880
Glu Arg Asn Leu Leu Tyr Ile Cys Val Ile Asp Ser Arg Gly Thr Ile
885 890 895
Leu Asp Gln Ile Ser Leu Asn Thr Ile Asn Asp Ile Asp Tyr His Asp
900 905 910
Leu Leu Glu Ser Arg Asp Lys Asp Arg Gln Gln Glu Arg Arg Asn Trp
915 920 925
Gln Thr Ile Glu Gly Ile Lys Glu Leu Lys Gln Gly Tyr Leu Ser Gln
930 935 940
Ala Val His Arg Ile Ala Glu Leu Met Val Ala Tyr Lys Ala Val Val
945 950 955 960
Ala Leu Glu Asp Leu Asn Met Gly Phe Lys Arg Gly Arg Gln Lys Val
965 970 975
Glu Ser Ser Val Tyr Gln Gln Phe Glu Lys Gln Leu Ile Asp Lys Leu
980 985 990
Asn Tyr Leu Val Asp Lys Lys Lys Arg Pro Glu Asp Ile Gly Gly Leu
995 1000 1005
Leu Arg Ala Tyr Gln Phe Thr Ala Pro Phe Lys Ser Phe Lys Glu
1010 1015 1020
Met Gly Lys Gln Asn Gly Phe Leu Phe Tyr Ile Pro Ala Trp Asn
1025 1030 1035
Thr Ser Asn Ile Asp Pro Thr Thr Gly Phe Val Asn Leu Phe His
1040 1045 1050
Ala Gln Tyr Glu Asn Val Asp Lys Ala Lys Ser Phe Phe Gln Lys
1055 1060 1065
Phe Asp Ser Ile Ser Tyr Asn Pro Lys Lys Asp Trp Phe Glu Phe
1070 1075 1080
Ala Phe Asp Tyr Lys Asn Phe Thr Lys Lys Ala Glu Gly Ser Arg
1085 1090 1095
Ser Met Trp Ile Leu Cys Thr His Gly Ser Arg Ile Lys Asn Phe
1100 1105 1110
Arg Asn Ser Gln Lys Asn Gly Gln Trp Asp Ser Glu Glu Phe Ala
1115 1120 1125
Leu Thr Glu Ala Phe Lys Ser Leu Phe Val Arg Tyr Glu Ile Asp
1130 1135 1140
Tyr Thr Ala Asp Leu Lys Thr Ala Ile Val Asp Glu Lys Gln Lys
1145 1150 1155
Asp Phe Phe Val Asp Leu Leu Lys Leu Phe Lys Leu Thr Val Gln
1160 1165 1170
Met Arg Asn Ser Trp Lys Glu Lys Asp Leu Asp Tyr Leu Ile Ser
1175 1180 1185
Pro Val Ala Gly Ala Asp Gly Arg Phe Phe Asp Thr Arg Glu Gly
1190 1195 1200
Asn Lys Ser Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr Asn
1205 1210 1215
Ile Ala Leu Lys Gly Leu Trp Ala Leu Arg Gln Ile Arg Gln Thr
1220 1225 1230
Ser Glu Gly Gly Lys Leu Lys Leu Ala Ile Ser Asn Lys Glu Trp
1235 1240 1245
Leu Gln Phe Val Gln Glu Arg Ser Tyr Glu Lys Asp
1250 1255 1260
<210> 7
<211> 1263
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 7
Met Asn Asn Gly Thr Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser
1 5 10 15
Leu Gln Lys Thr Leu Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln
20 25 30
Gln Phe Ile Val Lys Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly
35 40 45
Glu Asn Arg Gln Ile Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly
50 55 60
Phe Ile Ser Glu Thr Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser
65 70 75 80
Leu Phe Glu Lys Met Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp
85 90 95
Thr Leu Ile Lys Glu Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys
100 105 110
Phe Ala Asn Asp Asp Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile
115 120 125
Ser Asp Ile Leu Pro Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala
130 135 140
Ser Glu Lys Glu Glu Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe
145 150 155 160
Ala Thr Ser Phe Lys Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser
165 170 175
Ala Asp Asp Ile Ser Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn
180 185 190
Ala Glu Ile Phe Phe Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys
195 200 205
Ser Leu Ser Asn Asp Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp
210 215 220
Ser Leu Lys Glu Met Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr
225 230 235 240
Gly Glu Phe Ile Thr Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys
245 250 255
Gly Lys Val Asn Ser Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu
260 265 270
Asn Lys Asn Leu Tyr Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys
275 280 285
Ile Ala Asp Thr Ser Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu
290 295 300
Glu Val Tyr Gln Ser Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys
305 310 315 320
His Ile Val Glu Arg Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr
325 330 335
Asn Leu Asp Lys Ile Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser
340 345 350
Gln Lys Thr Tyr Arg Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile
355 360 365
His Tyr Asn Asn Ile Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys
370 375 380
Val Lys Lys Ala Val Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile
385 390 395 400
Asn Glu Leu Val Ser Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys
405 410 415
Ala Glu Thr Tyr Ile His Glu Ile Ser His Ile Leu Asn Asn Phe Glu
420 425 430
Ala Gln Glu Leu Lys Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu
435 440 445
Leu Lys Ala Ser Glu Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala
450 455 460
Phe His Trp Cys Ser Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp
465 470 475 480
Asn Asn Phe Tyr Ala Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro
485 490 495
Val Ile Ser Leu Tyr Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro
500 505 510
Tyr Ser Thr Lys Lys Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala
515 520 525
Asp Gly Trp Ser Lys Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu
530 535 540
Met Arg Asp Asn Leu Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys
545 550 555 560
Pro Asp Lys Lys Ile Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp
565 570 575
Tyr Lys Lys Met Ile Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile
580 585 590
Pro Lys Val Phe Leu Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro
595 600 605
Ser Ala Tyr Ile Leu Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser
610 615 620
Ser Lys Asp Phe Asp Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe
625 630 635 640
Lys Asn Cys Ile Ala Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp
645 650 655
Phe Ser Asp Thr Ser Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu
660 665 670
Val Glu Leu Gln Gly Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys
675 680 685
Asp Ile Asp Leu Leu Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His
705 710 715 720
Thr Met Tyr Leu Lys Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile
725 730 735
Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser
740 745 750
Ile Lys Asn Pro Ile Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg
755 760 765
Thr Tyr Glu Ala Glu Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val
770 775 780
Arg Lys Asn Ile Pro Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe
785 790 795 800
Asn Asp Lys Ser Asp Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys
805 810 815
Asn Val Val Gly His His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr
820 825 830
Arg Tyr Thr Tyr Asp Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn
835 840 845
Phe Lys Ala Asn Lys Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr
850 855 860
Ile Ala Lys Glu Lys Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu
865 870 875 880
Arg Asn Leu Ile Tyr Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val
885 890 895
Glu Gln Lys Ser Phe Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys
900 905 910
Leu Lys Gln Gln Glu Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys
915 920 925
Glu Ile Gly Lys Ile Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val
930 935 940
Ile His Glu Ile Ser Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala
945 950 955 960
Met Glu Asp Leu Ser Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu
965 970 975
Arg Gln Val Tyr Gln Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn
980 985 990
Tyr Leu Val Phe Lys Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu
995 1000 1005
Lys Gly Tyr Gln Leu Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val
1010 1015 1020
Gly His Gln Cys Gly Cys Ile Phe Tyr Val Pro Ala Ala Tyr Thr
1025 1030 1035
Ser Lys Ile Asp Pro Thr Thr Gly Phe Val Asn Ile Phe Lys Phe
1040 1045 1050
Lys Asp Leu Thr Val Asp Ala Lys Arg Glu Phe Ile Lys Lys Phe
1055 1060 1065
Asp Ser Ile Arg Tyr Asp Ser Glu Lys Asn Leu Phe Cys Phe Thr
1070 1075 1080
Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn Thr Val Met Ser Lys
1085 1090 1095
Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg Ile Lys Arg Arg
1100 1105 1110
Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr Ile Asp Ile
1115 1120 1125
Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile Asn Trp
1130 1135 1140
Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu Ile
1145 1150 1155
Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg
1160 1165 1170
Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile
1175 1180 1185
Ser Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys
1190 1195 1200
Ala Gly Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr
1205 1210 1215
Cys Ile Ala Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu
1220 1225 1230
Asn Trp Lys Glu Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile
1235 1240 1245
Ser Asn Lys Asp Trp Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu
1250 1255 1260
<210> 8
<211> 1318
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 8
Met Thr Asn Lys Phe Thr Asn Gln Tyr Ser Leu Ser Lys Thr Leu Arg
1 5 10 15
Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Phe Ile Gln Glu Lys
20 25 30
Gly Leu Leu Ser Gln Asp Lys Gln Arg Ala Glu Ser Tyr Gln Glu Met
35 40 45
Lys Lys Thr Ile Asp Lys Phe His Lys Tyr Phe Ile Asp Leu Ala Leu
50 55 60
Ser Asn Ala Lys Leu Thr His Leu Glu Thr Tyr Leu Glu Leu Tyr Asn
65 70 75 80
Lys Ser Ala Glu Thr Lys Lys Glu Gln Lys Phe Lys Asp Asp Leu Lys
85 90 95
Lys Val Gln Asp Asn Leu Arg Lys Glu Ile Val Lys Ser Phe Ser Asp
100 105 110
Gly Asp Ala Lys Ser Ile Phe Ala Ile Leu Asp Lys Lys Glu Leu Ile
115 120 125
Thr Val Glu Leu Glu Lys Trp Phe Glu Asn Asn Glu Gln Lys Asp Ile
130 135 140
Tyr Phe Asp Glu Lys Phe Lys Thr Phe Thr Thr Tyr Phe Thr Gly Phe
145 150 155 160
His Gln Asn Arg Lys Asn Met Tyr Ser Val Glu Pro Asn Ser Thr Ala
165 170 175
Ile Ala Tyr Arg Leu Ile His Glu Asn Leu Pro Lys Phe Leu Glu Asn
180 185 190
Ala Lys Ala Phe Glu Lys Ile Lys Gln Val Glu Ser Leu Gln Val Asn
195 200 205
Phe Arg Glu Leu Met Gly Glu Phe Gly Asp Glu Gly Leu Ile Phe Val
210 215 220
Asn Glu Leu Glu Glu Met Phe Gln Ile Asn Tyr Tyr Asn Asp Val Leu
225 230 235 240
Ser Gln Asn Gly Ile Thr Ile Tyr Asn Ser Ile Ile Ser Gly Phe Thr
245 250 255
Lys Asn Asp Ile Lys Tyr Lys Gly Leu Asn Glu Tyr Ile Asn Asn Tyr
260 265 270
Asn Gln Thr Lys Asp Lys Lys Asp Arg Leu Pro Lys Leu Lys Gln Leu
275 280 285
Tyr Lys Gln Ile Leu Ser Asp Arg Ile Ser Leu Ser Phe Leu Pro Asp
290 295 300
Ala Phe Thr Asp Gly Lys Gln Val Leu Lys Ala Ile Phe Asp Phe Tyr
305 310 315 320
Lys Ile Asn Leu Leu Ser Tyr Thr Ile Glu Gly Gln Glu Glu Ser Gln
325 330 335
Asn Leu Leu Leu Leu Ile Arg Gln Thr Ile Glu Asn Leu Ser Ser Phe
340 345 350
Asp Thr Gln Lys Ile Tyr Leu Lys Asn Asp Thr His Leu Thr Thr Ile
355 360 365
Ser Gln Gln Val Phe Gly Asp Phe Ser Val Phe Ser Thr Ala Leu Asn
370 375 380
Tyr Trp Tyr Glu Thr Lys Val Asn Pro Lys Phe Glu Thr Glu Tyr Ser
385 390 395 400
Lys Ala Asn Glu Lys Lys Arg Glu Ile Leu Asp Lys Ala Lys Ala Val
405 410 415
Phe Thr Lys Gln Asp Tyr Phe Ser Ile Ala Phe Leu Gln Glu Val Leu
420 425 430
Ser Glu Tyr Ile Leu Thr Leu Asp His Thr Ser Asp Ile Val Lys Lys
435 440 445
His Ser Ser Asn Cys Ile Ala Asp Tyr Phe Lys Asn His Phe Val Ala
450 455 460
Lys Lys Glu Asn Glu Thr Asp Lys Thr Phe Asp Phe Ile Ala Asn Ile
465 470 475 480
Thr Ala Lys Tyr Gln Cys Ile Gln Gly Ile Leu Glu Asn Ala Asp Gln
485 490 495
Tyr Glu Asp Glu Leu Lys Gln Asp Gln Lys Leu Ile Asp Asn Leu Lys
500 505 510
Phe Phe Leu Asp Ala Ile Leu Glu Leu Leu His Phe Ile Lys Pro Leu
515 520 525
His Leu Lys Ser Glu Ser Ile Thr Glu Lys Asp Thr Ala Phe Tyr Asp
530 535 540
Val Phe Glu Asn Tyr Tyr Glu Ala Leu Ser Leu Leu Thr Pro Leu Tyr
545 550 555 560
Asn Met Val Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Thr Glu Lys
565 570 575
Ile Lys Leu Asn Phe Glu Asn Ala Gln Leu Leu Asn Gly Trp Asp Ala
580 585 590
Asn Lys Glu Gly Asp Tyr Leu Thr Thr Ile Leu Lys Lys Asp Gly Asn
595 600 605
Tyr Phe Leu Ala Ile Met Asp Lys Lys His Asn Lys Ala Phe Gln Lys
610 615 620
Phe Pro Glu Gly Lys Glu Asn Tyr Glu Lys Met Val Tyr Lys Leu Leu
625 630 635 640
Pro Gly Val Asn Lys Met Leu Pro Lys Val Phe Phe Ser Asn Lys Asn
645 650 655
Ile Ala Tyr Phe Asn Pro Ser Lys Glu Leu Leu Glu Asn Tyr Lys Lys
660 665 670
Glu Thr His Lys Lys Gly Asp Thr Phe Asn Leu Glu His Cys His Thr
675 680 685
Leu Ile Asp Phe Phe Lys Asp Ser Leu Asn Lys His Glu Asp Trp Lys
690 695 700
Tyr Phe Asp Phe Gln Phe Ser Glu Thr Lys Ser Tyr Gln Asp Leu Ser
705 710 715 720
Gly Phe Tyr Arg Glu Val Glu His Gln Gly Tyr Lys Ile Asn Phe Lys
725 730 735
Asn Ile Asp Ser Glu Tyr Ile Asp Gly Leu Val Asn Glu Gly Lys Leu
740 745 750
Phe Leu Phe Gln Ile Tyr Ser Lys Asp Phe Ser Pro Phe Ser Lys Gly
755 760 765
Lys Pro Asn Met His Thr Leu Tyr Trp Lys Ala Leu Phe Glu Glu Gln
770 775 780
Asn Leu Gln Asn Val Ile Tyr Lys Leu Asn Gly Gln Ala Glu Ile Phe
785 790 795 800
Phe Arg Lys Ala Ser Ile Lys Pro Lys Asn Ile Ile Leu His Lys Lys
805 810 815
Lys Ile Lys Ile Ala Lys Lys His Phe Ile Asp Lys Lys Thr Lys Thr
820 825 830
Ser Glu Ile Val Pro Val Gln Thr Ile Lys Asn Leu Asn Met Tyr Tyr
835 840 845
Gln Gly Lys Ile Ser Glu Lys Glu Leu Thr Gln Asp Asp Leu Arg Tyr
850 855 860
Ile Asp Asn Phe Ser Ile Phe Asn Glu Lys Asn Lys Thr Ile Asp Ile
865 870 875 880
Ile Lys Asp Lys Arg Phe Thr Val Asp Lys Phe Gln Phe His Val Pro
885 890 895
Ile Thr Met Asn Phe Lys Ala Thr Gly Gly Ser Tyr Ile Asn Gln Thr
900 905 910
Val Leu Glu Tyr Leu Gln Asn Asn Pro Glu Val Lys Ile Ile Gly Leu
915 920 925
Asp Arg Gly Glu Arg His Leu Val Tyr Leu Thr Leu Ile Asp Gln Gln
930 935 940
Gly Asn Ile Leu Lys Gln Glu Ser Leu Asn Thr Ile Thr Asp Ser Lys
945 950 955 960
Ile Ser Thr Pro Tyr His Lys Leu Leu Asp Asn Lys Glu Asn Glu Arg
965 970 975
Asp Leu Ala Arg Lys Asn Trp Gly Thr Val Glu Asn Ile Lys Glu Leu
980 985 990
Lys Glu Gly Tyr Ile Ser Gln Val Val His Lys Ile Ala Thr Leu Met
995 1000 1005
Leu Glu Glu Asn Ala Ile Val Val Met Glu Asp Leu Asn Phe Gly
1010 1015 1020
Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Lys
1025 1030 1035
Leu Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Leu Val Leu Lys
1040 1045 1050
Asp Lys Gln Pro Gln Glu Leu Gly Gly Leu Tyr Asn Ala Leu Gln
1055 1060 1065
Leu Thr Asn Lys Phe Glu Ser Phe Gln Lys Met Gly Lys Gln Ser
1070 1075 1080
Gly Phe Leu Phe Tyr Val Pro Ala Trp Asn Thr Ser Lys Ile Asp
1085 1090 1095
Pro Thr Thr Gly Phe Val Asn Tyr Phe Tyr Thr Lys Tyr Glu Asn
1100 1105 1110
Val Asp Lys Ala Lys Ala Phe Phe Glu Lys Phe Glu Ala Ile Arg
1115 1120 1125
Phe Asn Ala Glu Lys Lys Tyr Phe Glu Phe Glu Val Lys Lys Tyr
1130 1135 1140
Ser Asp Phe Asn Pro Lys Ala Glu Gly Thr Gln Gln Ala Trp Thr
1145 1150 1155
Ile Cys Thr Tyr Gly Glu Arg Ile Glu Thr Lys Arg Gln Lys Asp
1160 1165 1170
Gln Asn Asn Lys Phe Val Ser Thr Pro Ile Asn Leu Thr Glu Lys
1175 1180 1185
Ile Glu Asp Phe Leu Gly Lys Asn Gln Ile Val Tyr Gly Asp Gly
1190 1195 1200
Asn Cys Ile Lys Ser Gln Ile Ala Ser Lys Asp Asp Lys Ala Phe
1205 1210 1215
Phe Glu Thr Leu Leu Tyr Trp Phe Lys Met Thr Leu Gln Met Arg
1220 1225 1230
Asn Ser Glu Thr Arg Thr Asp Ile Asp Tyr Leu Ile Ser Pro Val
1235 1240 1245
Met Asn Asp Asn Gly Thr Phe Tyr Asn Ser Arg Asp Tyr Glu Lys
1250 1255 1260
Leu Glu Asn Pro Thr Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala
1265 1270 1275
Tyr His Ile Ala Lys Lys Gly Leu Met Leu Leu Asn Lys Ile Asp
1280 1285 1290
Gln Ala Asp Leu Thr Lys Lys Val Asp Leu Ser Ile Ser Asn Arg
1295 1300 1305
Asp Trp Leu Gln Phe Val Gln Lys Asn Lys
1310 1315
<210> 9
<211> 1339
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 9
Met Glu Gln Glu Tyr Tyr Leu Gly Leu Asp Met Gly Thr Gly Ser Val
1 5 10 15
Gly Trp Ala Val Thr Asp Ser Glu Tyr His Val Leu Arg Lys His Gly
20 25 30
Lys Ala Leu Trp Gly Val Arg Leu Phe Glu Ser Ala Ser Thr Ala Glu
35 40 45
Glu Arg Arg Met Phe Arg Thr Ser Arg Arg Arg Leu Asp Arg Arg Asn
50 55 60
Trp Arg Ile Glu Ile Leu Gln Glu Ile Phe Ala Glu Glu Ile Ser Lys
65 70 75 80
Lys Asp Pro Gly Phe Phe Leu Arg Met Lys Glu Ser Lys Tyr Tyr Pro
85 90 95
Glu Asp Lys Arg Asp Ile Asn Gly Asn Cys Pro Glu Leu Pro Tyr Ala
100 105 110
Leu Phe Val Asp Asp Asp Phe Thr Asp Lys Asp Tyr His Lys Lys Phe
115 120 125
Pro Thr Ile Tyr His Leu Arg Lys Met Leu Met Asn Thr Glu Glu Thr
130 135 140
Pro Asp Ile Arg Leu Val Tyr Leu Ala Ile His His Met Met Lys His
145 150 155 160
Arg Gly His Phe Leu Leu Ser Gly Asp Ile Asn Glu Ile Lys Glu Phe
165 170 175
Gly Thr Thr Phe Ser Lys Leu Leu Glu Asn Ile Lys Asn Glu Glu Leu
180 185 190
Asp Trp Asn Leu Glu Leu Gly Lys Glu Glu Tyr Ala Val Val Glu Ser
195 200 205
Ile Leu Lys Asp Asn Met Leu Asn Arg Ser Thr Lys Lys Thr Arg Leu
210 215 220
Ile Lys Ala Leu Lys Ala Lys Ser Ile Cys Glu Lys Ala Val Leu Asn
225 230 235 240
Leu Leu Ala Gly Gly Thr Val Lys Leu Ser Asp Ile Phe Gly Leu Glu
245 250 255
Glu Leu Asn Glu Thr Glu Arg Pro Lys Ile Ser Phe Ala Asp Asn Gly
260 265 270
Tyr Asp Asp Tyr Ile Gly Glu Val Glu Asn Glu Leu Gly Glu Gln Phe
275 280 285
Tyr Ile Ile Glu Thr Ala Lys Ala Val Tyr Asp Trp Ala Val Leu Val
290 295 300
Glu Ile Leu Gly Lys Tyr Thr Ser Ile Ser Glu Ala Lys Val Ala Thr
305 310 315 320
Tyr Glu Lys His Lys Ser Asp Leu Gln Phe Leu Lys Lys Ile Val Arg
325 330 335
Lys Tyr Leu Thr Lys Glu Glu Tyr Lys Asp Ile Phe Val Ser Thr Ser
340 345 350
Asp Lys Leu Lys Asn Tyr Ser Ala Tyr Ile Gly Met Thr Lys Ile Asn
355 360 365
Gly Lys Lys Val Asp Leu Gln Ser Lys Arg Cys Ser Lys Glu Glu Phe
370 375 380
Tyr Asp Phe Ile Lys Lys Asn Val Leu Lys Lys Leu Glu Gly Gln Pro
385 390 395 400
Glu Tyr Glu Tyr Leu Lys Glu Glu Leu Glu Arg Glu Thr Phe Leu Pro
405 410 415
Lys Gln Val Asn Arg Asp Asn Gly Val Ile Pro Tyr Gln Ile His Leu
420 425 430
Tyr Glu Leu Lys Lys Ile Leu Gly Asn Leu Arg Asp Lys Ile Asp Leu
435 440 445
Ile Lys Glu Asn Glu Asp Lys Leu Val Gln Leu Phe Glu Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Asn Lys Ile Asp Asp Gly Lys Glu Gly
465 470 475 480
Lys Phe Thr Trp Ala Val Arg Lys Ser Asn Glu Lys Ile Tyr Pro Trp
485 490 495
Asn Phe Glu Asn Val Val Asp Ile Glu Ala Ser Ala Glu Lys Phe Ile
500 505 510
Arg Arg Met Thr Asn Lys Cys Thr Tyr Leu Met Gly Glu Asp Val Leu
515 520 525
Pro Lys Asp Ser Leu Leu Tyr Ser Lys Tyr Met Val Leu Asn Glu Leu
530 535 540
Asn Asn Val Lys Leu Asp Gly Glu Lys Leu Ser Val Glu Leu Lys Gln
545 550 555 560
Arg Leu Tyr Thr Asp Val Phe Cys Lys Tyr Arg Lys Val Thr Val Lys
565 570 575
Lys Ile Lys Asn Tyr Leu Lys Cys Glu Gly Ile Ile Ser Gly Asn Val
580 585 590
Glu Ile Thr Gly Ile Asp Gly Asp Phe Lys Ala Ser Leu Thr Ala Tyr
595 600 605
His Asp Phe Lys Glu Ile Leu Thr Gly Thr Glu Leu Ala Lys Lys Asp
610 615 620
Lys Glu Asn Ile Ile Thr Asn Ile Val Leu Phe Gly Asp Asp Lys Lys
625 630 635 640
Leu Leu Lys Lys Arg Leu Asn Arg Leu Tyr Pro Gln Ile Thr Pro Asn
645 650 655
Gln Leu Lys Lys Ile Cys Ala Leu Ser Tyr Thr Gly Trp Gly Arg Phe
660 665 670
Ser Lys Lys Phe Leu Glu Glu Ile Thr Ala Pro Asp Pro Glu Thr Gly
675 680 685
Glu Val Trp Asn Ile Ile Thr Ala Leu Trp Glu Ser Asn Asn Asn Leu
690 695 700
Met Gln Leu Leu Ser Asn Glu Tyr Arg Phe Met Glu Glu Val Glu Thr
705 710 715 720
Tyr Asn Met Gly Lys Gln Thr Lys Thr Leu Ser Tyr Glu Thr Val Glu
725 730 735
Asn Met Tyr Val Ser Pro Ser Val Lys Arg Gln Ile Trp Gln Thr Leu
740 745 750
Lys Ile Val Lys Glu Leu Glu Lys Val Met Lys Glu Ser Pro Lys Arg
755 760 765
Val Phe Ile Glu Met Ala Arg Glu Lys Gln Glu Ser Lys Arg Thr Glu
770 775 780
Ser Arg Lys Lys Gln Leu Ile Asp Leu Tyr Lys Ala Cys Lys Asn Glu
785 790 795 800
Glu Lys Asp Trp Val Lys Glu Leu Gly Asp Gln Glu Glu Gln Lys Leu
805 810 815
Arg Ser Asp Lys Leu Tyr Leu Tyr Tyr Thr Gln Lys Gly Arg Cys Met
820 825 830
Tyr Ser Gly Glu Val Ile Glu Leu Lys Asp Leu Trp Asp Asn Thr Lys
835 840 845
Tyr Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Thr Met Asp Asp Ser
850 855 860
Leu Asn Asn Arg Val Leu Val Lys Lys Lys Tyr Asn Ala Thr Lys Ser
865 870 875 880
Asp Lys Tyr Pro Leu Asn Glu Asn Ile Arg His Glu Arg Lys Gly Phe
885 890 895
Trp Lys Ser Leu Leu Asp Gly Gly Phe Ile Ser Lys Glu Lys Tyr Glu
900 905 910
Arg Leu Ile Arg Asn Thr Glu Leu Ser Pro Glu Glu Leu Ala Gly Phe
915 920 925
Ile Glu Arg Gln Ile Val Glu Thr Arg Gln Ser Thr Lys Ala Val Ala
930 935 940
Glu Ile Leu Lys Gln Val Phe Pro Glu Ser Glu Ile Val Tyr Val Lys
945 950 955 960
Ala Gly Thr Val Ser Arg Phe Arg Lys Asp Phe Glu Leu Leu Lys Val
965 970 975
Arg Glu Val Asn Asp Leu His His Ala Lys Asp Ala Tyr Leu Asn Ile
980 985 990
Val Val Gly Asn Ser Tyr Tyr Val Lys Phe Thr Lys Asn Ala Ser Trp
995 1000 1005
Phe Ile Lys Glu Asn Pro Gly Arg Thr Tyr Asn Leu Lys Lys Met
1010 1015 1020
Phe Thr Ser Gly Trp Asn Ile Glu Arg Asn Gly Glu Val Ala Trp
1025 1030 1035
Glu Val Gly Lys Lys Gly Thr Ile Val Thr Val Lys Gln Ile Met
1040 1045 1050
Asn Lys Asn Asn Ile Leu Val Thr Arg Gln Val His Glu Ala Lys
1055 1060 1065
Gly Gly Leu Phe Asp Gln Gln Ile Met Lys Lys Gly Lys Gly Gln
1070 1075 1080
Ile Ala Ile Lys Glu Thr Asp Glu Arg Leu Ala Ser Ile Glu Lys
1085 1090 1095
Tyr Gly Gly Tyr Asn Lys Ala Ala Gly Ala Tyr Phe Met Leu Val
1100 1105 1110
Glu Ser Lys Asp Lys Lys Gly Lys Thr Ile Arg Thr Ile Glu Phe
1115 1120 1125
Ile Pro Leu Tyr Leu Lys Asn Lys Ile Glu Ser Asp Glu Ser Ile
1130 1135 1140
Ala Leu Asn Phe Leu Glu Lys Gly Arg Gly Leu Lys Glu Pro Lys
1145 1150 1155
Ile Leu Leu Lys Lys Ile Lys Ile Asp Thr Leu Phe Asp Val Asp
1160 1165 1170
Gly Phe Lys Met Trp Leu Ser Gly Arg Thr Gly Asp Arg Leu Leu
1175 1180 1185
Phe Lys Cys Ala Asn Gln Leu Ile Leu Asp Glu Lys Ile Ile Val
1190 1195 1200
Thr Met Lys Lys Ile Val Lys Phe Ile Gln Arg Arg Gln Glu Asn
1205 1210 1215
Arg Glu Leu Lys Leu Ser Asp Lys Asp Gly Ile Asp Asn Glu Val
1220 1225 1230
Leu Met Glu Ile Tyr Asn Thr Phe Val Asp Lys Leu Glu Asn Thr
1235 1240 1245
Val Tyr Arg Ile Arg Leu Ser Glu Gln Ala Lys Thr Leu Ile Asp
1250 1255 1260
Lys Gln Lys Glu Phe Glu Arg Leu Ser Leu Glu Asp Lys Ser Ser
1265 1270 1275
Thr Leu Phe Glu Ile Leu His Ile Phe Gln Cys Gln Ser Ser Ala
1280 1285 1290
Ala Asn Leu Lys Met Ile Gly Gly Pro Gly Lys Ala Gly Ile Leu
1295 1300 1305
Val Met Asn Asn Asn Ile Ser Lys Cys Asn Lys Ile Ser Ile Ile
1310 1315 1320
Asn Gln Ser Pro Thr Gly Ile Phe Glu Asn Glu Ile Asp Leu Leu
1325 1330 1335
Lys
<210> 10
<211> 1280
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 10
Met Asn Lys Phe Glu Asn Phe Thr Gly Leu Tyr Pro Ile Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Tyr Ile Glu
20 25 30
Lys Ser Glu Ile Leu Glu Asn Asp Asn Tyr Arg Ala Glu Lys Tyr Glu
35 40 45
Glu Val Lys Asp Ile Ile Asp Gly Tyr His Lys Trp Phe Ile Asn Glu
50 55 60
Thr Leu His Asp Leu His Ile Asn Trp Ser Glu Leu Lys Val Ala Leu
65 70 75 80
Glu Asn Asn Arg Ile Glu Lys Ser Asp Ala Ser Lys Lys Glu Leu Gln
85 90 95
Arg Val Gln Lys Ile Lys Arg Glu Glu Ile Tyr Asn Ala Phe Ile Glu
100 105 110
His Glu Ala Phe Gln Tyr Leu Phe Lys Glu Asn Leu Leu Ser Asp Leu
115 120 125
Leu Pro Ile Gln Ile Glu Gln Ser Glu Asp Leu Asp Ala Glu Lys Lys
130 135 140
Lys Gln Ala Val Glu Thr Phe Asn Arg Phe Ser Thr Tyr Phe Thr Gly
145 150 155 160
Phe His Glu Asn Arg Lys Asn Ile Tyr Ser Lys Glu Gly Ile Ser Thr
165 170 175
Ser Val Thr Tyr Arg Ile Val His Asp Asn Phe Pro Lys Phe Leu Glu
180 185 190
Asn Met Lys Val Phe Glu Ile Leu Arg Asn Glu Cys Pro Glu Val Ile
195 200 205
Ser Asp Thr Ala Asn Glu Leu Ala Pro Phe Ile Asp Gly Val Arg Ile
210 215 220
Glu Asp Ile Phe Leu Ile Asp Phe Phe Asn Ser Thr Phe Ser Gln Asn
225 230 235 240
Gly Ile Asp Tyr Tyr Asn Arg Ile Leu Gly Gly Val Thr Thr Glu Thr
245 250 255
Gly Glu Lys Tyr Arg Gly Ile Asn Glu Phe Thr Asn Leu Tyr Arg Gln
260 265 270
Gln His Pro Glu Phe Gly Lys Ser Lys Lys Ala Thr Lys Met Val Val
275 280 285
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asp Thr Leu Ser Phe Ile Pro
290 295 300
Glu Met Phe Gly Asn Asp Lys Gln Val Gln Asn Ser Ile Gln Leu Phe
305 310 315 320
Tyr Asn Arg Glu Ile Ser Gln Phe Glu Asn Glu Gly Val Lys Thr Asp
325 330 335
Val Cys Thr Ala Leu Ala Thr Leu Thr Ser Lys Ile Ala Glu Phe Asp
340 345 350
Thr Glu Lys Ile Tyr Ile Gln Gln Pro Glu Leu Pro Asn Val Ser Gln
355 360 365
Arg Leu Phe Gly Ser Trp Asn Glu Leu Asn Ala Cys Leu Phe Lys Tyr
370 375 380
Ala Glu Leu Lys Phe Gly Thr Ala Glu Lys Val Ala Asn Arg Lys Lys
385 390 395 400
Ile Asp Lys Trp Leu Lys Ser Asp Leu Phe Ser Phe Thr Glu Leu Asn
405 410 415
Lys Ala Leu Glu Phe Ser Gly Lys Asp Glu Arg Ile Glu Asn Tyr Phe
420 425 430
Ser Glu Thr Gly Ile Phe Ala Gln Leu Val Lys Thr Gly Phe Asp Glu
435 440 445
Ala Gln Ser Ile Leu Glu Thr Glu Tyr Thr Ser Glu Val His Leu Lys
450 455 460
Asp Gln Gln Thr Asp Ile Glu Lys Ile Lys Thr Phe Leu Asp Ala Leu
465 470 475 480
Gln Asn Leu Met His Leu Leu Lys Ser Leu Cys Val Ser Glu Glu Ala
485 490 495
Asp Arg Asp Ala Ala Phe Tyr Asn Glu Phe Asp Met Leu Tyr Asn Gln
500 505 510
Leu Lys Leu Val Val Pro Leu Tyr Asn Lys Val Arg Asn Tyr Ile Thr
515 520 525
Gln Lys Leu Phe Arg Ser Asp Lys Ile Lys Ile Tyr Phe Glu Asn Lys
530 535 540
Gly Gln Phe Leu Gly Gly Trp Val Asp Ser Gln Thr Glu Asn Ser Asp
545 550 555 560
Asn Gly Thr Gln Ala Gly Gly Tyr Ile Phe Arg Lys Glu Asn Val Ile
565 570 575
Asn Glu Tyr Asp Tyr Tyr Leu Gly Ile Cys Ser Asp Pro Lys Leu Phe
580 585 590
Arg Arg Thr Thr Ile Val Ser Glu Asn Asp Arg Ser Ser Phe Glu Arg
595 600 605
Leu Asp Tyr Tyr Gln Leu Lys Thr Ala Ser Val Tyr Gly Asn Ser Tyr
610 615 620
Cys Gly Lys His Pro Tyr Thr Glu Asp Lys Asn Glu Leu Val Asn Ser
625 630 635 640
Ile Asp Arg Phe Val His Leu Ser Gly Asn Asn Ile Leu Ile Glu Lys
645 650 655
Ile Ala Lys Asp Lys Val Lys Ser Asn Pro Thr Thr Asn Thr Pro Ser
660 665 670
Gly Tyr Leu Asn Phe Ile His Arg Glu Ala Pro Asn Thr Tyr Glu Cys
675 680 685
Leu Leu Gln Asp Glu Asn Phe Val Ser Leu Asn Gln Arg Val Val Ser
690 695 700
Ala Leu Lys Ala Thr Leu Ala Thr Leu Val Arg Val Pro Lys Ala Leu
705 710 715 720
Val Tyr Ala Lys Lys Asp Tyr His Leu Phe Ser Glu Ile Ile Asn Asp
725 730 735
Ile Asp Glu Leu Ser Tyr Glu Lys Ala Phe Ser Tyr Phe Pro Val Ser
740 745 750
Gln Thr Glu Phe Glu Asn Ser Ser Asn Arg Thr Ile Lys Pro Leu Leu
755 760 765
Leu Phe Lys Ile Ser Asn Lys Asp Leu Ser Phe Ala Glu Asn Phe Glu
770 775 780
Lys Gly Asn Arg Gln Lys Ile Gly Lys Lys Asn Leu His Thr Leu Tyr
785 790 795 800
Phe Glu Ala Leu Met Lys Gly Asn Gln Asp Thr Ile Asp Ile Gly Thr
805 810 815
Gly Met Val Phe His Arg Val Lys Ser Leu Asn Tyr Asn Glu Lys Thr
820 825 830
Leu Lys Tyr Gly His His Ser Thr Gln Leu Asn Glu Lys Phe Ser Tyr
835 840 845
Pro Ile Ile Lys Asp Lys Arg Phe Ala Ser Asp Lys Phe Leu Phe His
850 855 860
Leu Ser Thr Glu Ile Asn Tyr Lys Glu Lys Arg Lys Pro Leu Asn Asn
865 870 875 880
Ser Ile Ile Glu Phe Leu Thr Asn Asn Pro Asp Ile Asn Ile Ile Gly
885 890 895
Leu Asp Arg Gly Glu Arg His Leu Ile Tyr Leu Thr Leu Ile Asn Gln
900 905 910
Lys Gly Glu Ile Leu Arg Gln Lys Thr Phe Asn Ile Val Gly Asn Thr
915 920 925
Asn Tyr His Glu Lys Leu Asn Gln Arg Glu Lys Glu Arg Asp Asn Ala
930 935 940
Arg Lys Ser Trp Ala Thr Ile Gly Lys Ile Lys Glu Leu Lys Glu Gly
945 950 955 960
Phe Leu Ser Leu Val Ile His Glu Ile Ala Lys Ile Met Val Glu Asn
965 970 975
Asn Ala Ile Val Val Leu Glu Asp Leu Asn Phe Gly Phe Lys Arg Gly
980 985 990
Arg Phe Lys Val Glu Lys Gln Ile Tyr Gln Lys Phe Glu Lys Met Leu
995 1000 1005
Ile Asp Lys Leu Asn Tyr Leu Val Phe Lys Asp Lys Lys Ala Asn
1010 1015 1020
Glu Ala Gly Gly Val Leu Lys Gly Tyr Gln Leu Ala Glu Lys Phe
1025 1030 1035
Glu Ser Phe Gln Lys Met Gly Lys Gln Ser Gly Phe Leu Phe Tyr
1040 1045 1050
Val Pro Ala Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr Gly Phe
1055 1060 1065
Val Asn Met Leu Asn Leu Asn Tyr Thr Asn Met Lys Asp Ala Gln
1070 1075 1080
Thr Leu Leu Ser Gly Met Asp Lys Ile Ser Phe Asn Ala Asp Ala
1085 1090 1095
Asn Tyr Phe Glu Phe Glu Leu Asp Tyr Glu Lys Phe Lys Thr Asn
1100 1105 1110
Gln Thr Asp His Thr Asn Lys Trp Thr Ile Cys Thr Val Gly Glu
1115 1120 1125
Lys Arg Phe Thr Tyr Asn Ser Ala Thr Lys Glu Thr Thr Thr Val
1130 1135 1140
Asn Val Thr Glu Asp Leu Lys Lys Leu Leu Asp Lys Phe Glu Val
1145 1150 1155
Lys Tyr Ser Asn Gly Asp Asn Ile Lys Asp Glu Ile Cys Arg Gln
1160 1165 1170
Thr Asp Ala Lys Phe Phe Glu Ile Ile Leu Trp Leu Leu Lys Leu
1175 1180 1185
Thr Met Gln Met Arg Asn Ser Asn Thr Lys Thr Glu Glu Asp Phe
1190 1195 1200
Ile Leu Ser Pro Val Lys Asn Ser Asn Gly Glu Phe Phe Arg Ser
1205 1210 1215
Asn Asp Asp Ala Asn Gly Ile Trp Pro Ala Asp Ala Asp Ala Asn
1220 1225 1230
Gly Ala Tyr His Ile Ala Leu Lys Gly Leu Tyr Leu Val Lys Glu
1235 1240 1245
Cys Phe Asn Lys Asn Glu Lys Ser Leu Lys Ile Glu His Lys Asn
1250 1255 1260
Trp Phe Lys Phe Ala Gln Thr Arg Phe Asn Gly Ser Leu Thr Lys
1265 1270 1275
Asn Gly
1280
<210> 11
<211> 1154
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 11
Met Glu Asn Phe Lys Asn Leu Tyr Pro Ile Asn Lys Thr Leu Arg Phe
1 5 10 15
Glu Leu Arg Pro Tyr Gly Lys Thr Leu Glu Asn Phe Lys Lys Ser Gly
20 25 30
Leu Leu Glu Lys Asp Ala Phe Lys Ala Asn Ser Arg Arg Ser Met Gln
35 40 45
Ala Ile Ile Asp Glu Lys Phe Lys Glu Thr Ile Glu Glu Arg Leu Lys
50 55 60
Tyr Thr Glu Phe Ser Glu Cys Asp Leu Gly Asn Met Thr Ser Lys Asp
65 70 75 80
Lys Lys Ile Thr Asp Lys Ala Ala Thr Asn Leu Lys Lys Gln Val Ile
85 90 95
Leu Ser Phe Asp Asp Glu Ile Phe Asn Asn Tyr Leu Lys Pro Asp Lys
100 105 110
Asn Ile Asp Ala Leu Phe Lys Asn Asp Pro Ser Asn Pro Val Ile Ser
115 120 125
Thr Phe Lys Gly Phe Thr Thr Tyr Phe Val Asn Phe Phe Glu Ile Arg
130 135 140
Lys His Ile Phe Lys Gly Glu Ser Ser Gly Ser Met Ala Tyr Arg Ile
145 150 155 160
Ile Asp Glu Asn Leu Thr Thr Tyr Leu Asn Asn Ile Glu Lys Ile Lys
165 170 175
Lys Leu Pro Glu Glu Leu Lys Ser Gln Leu Glu Gly Ile Asp Gln Ile
180 185 190
Asp Lys Leu Asn Asn Tyr Asn Glu Phe Ile Thr Gln Ser Gly Ile Thr
195 200 205
His Tyr Asn Glu Ile Ile Gly Gly Ile Ser Lys Ser Glu Asn Val Lys
210 215 220
Ile Gln Gly Ile Asn Glu Gly Ile Asn Leu Tyr Cys Gln Lys Asn Lys
225 230 235 240
Val Lys Leu Pro Arg Leu Thr Pro Leu Tyr Lys Met Ile Leu Ser Asp
245 250 255
Arg Val Ser Asn Ser Phe Val Leu Asp Thr Ile Glu Asn Asp Thr Glu
260 265 270
Leu Ile Glu Met Ile Ser Asp Leu Ile Asn Lys Thr Glu Ile Ser Gln
275 280 285
Asp Val Ile Met Ser Asp Ile Gln Asn Ile Phe Ile Lys Tyr Lys Gln
290 295 300
Leu Gly Asn Leu Pro Gly Ile Ser Tyr Ser Ser Ile Val Asn Ala Ile
305 310 315 320
Cys Ser Asp Tyr Asp Asn Asn Phe Gly Asp Gly Lys Arg Lys Lys Ser
325 330 335
Tyr Glu Asn Asp Arg Lys Lys His Leu Glu Thr Asn Val Tyr Ser Ile
340 345 350
Asn Tyr Ile Ser Glu Leu Leu Thr Asp Thr Asp Val Ser Ser Asn Ile
355 360 365
Lys Met Arg Tyr Lys Glu Leu Glu Gln Asn Tyr Gln Val Cys Lys Glu
370 375 380
Asn Phe Asn Ala Thr Asn Trp Met Asn Ile Lys Asn Ile Lys Gln Ser
385 390 395 400
Glu Lys Thr Asn Leu Ile Lys Asp Leu Leu Asp Ile Leu Lys Ser Ile
405 410 415
Gln Arg Phe Tyr Asp Leu Phe Asp Ile Val Asp Glu Asp Lys Asn Pro
420 425 430
Ser Ala Glu Phe Tyr Thr Trp Leu Ser Lys Asn Ala Glu Lys Leu Asp
435 440 445
Phe Glu Phe Asn Ser Val Tyr Asn Lys Ser Arg Asn Tyr Leu Thr Arg
450 455 460
Lys Gln Tyr Ser Asp Lys Lys Ile Lys Leu Asn Phe Asp Ser Pro Thr
465 470 475 480
Leu Ala Lys Gly Trp Asp Ala Asn Lys Glu Ile Asp Asn Ser Thr Ile
485 490 495
Ile Met Arg Lys Phe Asn Asn Asp Arg Gly Asp Tyr Asp Tyr Phe Leu
500 505 510
Gly Ile Trp Asn Lys Ser Thr Pro Ala Asn Glu Lys Ile Ile Pro Leu
515 520 525
Glu Asp Asn Gly Leu Phe Glu Lys Met Gln Tyr Lys Leu Tyr Pro Asp
530 535 540
Pro Ser Lys Met Leu Pro Lys Gln Phe Leu Ser Lys Ile Trp Lys Ala
545 550 555 560
Lys His Pro Thr Thr Pro Glu Phe Asp Lys Lys Tyr Lys Glu Gly Arg
565 570 575
His Lys Lys Gly Pro Asp Phe Glu Lys Glu Phe Leu His Glu Leu Ile
580 585 590
Asp Cys Phe Lys His Gly Leu Val Asn His Asp Glu Lys Tyr Gln Asp
595 600 605
Val Phe Gly Phe Asn Leu Arg Asn Thr Glu Asp Tyr Asn Ser Tyr Thr
610 615 620
Glu Phe Leu Glu Asp Val Glu Arg Cys Asn Tyr Asn Leu Ser Phe Asn
625 630 635 640
Lys Ile Ala Asp Thr Ser Asn Leu Ile Asn Asp Gly Lys Leu Tyr Val
645 650 655
Phe Gln Ile Trp Ser Lys Asp Phe Ser Ile Asp Ser Lys Gly Thr Lys
660 665 670
Asn Leu Asn Thr Ile Tyr Phe Glu Ser Leu Phe Ser Glu Glu Asn Met
675 680 685
Ile Glu Lys Met Phe Lys Leu Ser Gly Glu Ala Glu Ile Phe Tyr Arg
690 695 700
Pro Ala Ser Leu Asn Tyr Cys Glu Asp Ile Ile Lys Lys Gly His His
705 710 715 720
His Ala Glu Leu Lys Asp Lys Phe Asp Tyr Pro Ile Ile Lys Asp Lys
725 730 735
Arg Tyr Ser Gln Asp Lys Phe Phe Phe His Val Pro Met Val Ile Asn
740 745 750
Tyr Lys Ser Glu Lys Leu Asn Ser Lys Ser Leu Asn Asn Arg Thr Asn
755 760 765
Glu Asn Leu Gly Gln Phe Thr His Ile Ile Gly Ile Asp Arg Gly Glu
770 775 780
Arg His Leu Ile Tyr Leu Thr Val Val Asp Val Ser Thr Gly Glu Ile
785 790 795 800
Val Glu Gln Lys His Leu Asp Glu Ile Ile Asn Thr Asp Thr Lys Gly
805 810 815
Val Glu His Lys Thr His Tyr Leu Asn Lys Leu Glu Glu Lys Ser Lys
820 825 830
Thr Arg Asp Asn Glu Arg Lys Ser Trp Glu Ala Ile Glu Thr Ile Lys
835 840 845
Glu Leu Lys Glu Gly Tyr Ile Ser His Val Ile Asn Glu Ile Gln Lys
850 855 860
Leu Gln Glu Lys Tyr Asn Ala Leu Ile Val Met Glu Asn Leu Asn Tyr
865 870 875 880
Gly Phe Lys Asn Ser Arg Ile Lys Val Glu Lys Gln Val Tyr Gln Lys
885 890 895
Phe Glu Thr Ala Leu Ile Lys Lys Phe Asn Tyr Ile Ile Asp Lys Lys
900 905 910
Asp Pro Glu Thr Tyr Ile His Gly Tyr Gln Leu Thr Asn Pro Ile Thr
915 920 925
Thr Leu Asp Lys Ile Gly Asn Gln Ser Gly Ile Val Leu Tyr Ile Pro
930 935 940
Ala Trp Asn Thr Ser Lys Ile Asp Pro Val Thr Gly Phe Val Asn Leu
945 950 955 960
Leu Tyr Ala Asp Asp Leu Lys Tyr Lys Asn Gln Glu Gln Ala Lys Ser
965 970 975
Phe Ile Gln Lys Ile Asp Asn Ile Tyr Phe Glu Asn Gly Glu Phe Lys
980 985 990
Phe Asp Ile Asp Phe Ser Lys Trp Asn Asn Arg Tyr Ser Ile Ser Lys
995 1000 1005
Thr Lys Trp Thr Leu Thr Ser Tyr Gly Thr Arg Ile Gln Thr Phe
1010 1015 1020
Arg Asn Pro Gln Lys Asn Asn Lys Trp Asp Ser Ala Glu Tyr Asp
1025 1030 1035
Leu Thr Glu Glu Phe Lys Leu Ile Leu Asn Ile Asp Gly Thr Leu
1040 1045 1050
Lys Ser Gln Asp Val Glu Thr Tyr Lys Lys Phe Met Ser Leu Phe
1055 1060 1065
Lys Leu Met Leu Gln Leu Arg Asn Ser Val Thr Gly Thr Asp Ile
1070 1075 1080
Asp Tyr Met Ile Ser Pro Val Thr Asp Lys Thr Gly Thr His Phe
1085 1090 1095
Asp Ser Arg Glu Asn Ile Lys Asn Leu Pro Ala Asp Ala Asp Ala
1100 1105 1110
Asn Gly Ala Tyr Asn Ile Ala Arg Lys Gly Ile Met Ala Ile Glu
1115 1120 1125
Asn Ile Met Asn Gly Ile Ser Asp Pro Leu Lys Ile Ser Asn Glu
1130 1135 1140
Asp Tyr Leu Lys Tyr Ile Gln Asn Gln Gln Glu
1145 1150
<210> 12
<211> 1307
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 12
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 13
<211> 1129
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 13
Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240
Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415
Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445
Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460
Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685
Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700
Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720
Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735
Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750
Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765
Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780
Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800
Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815
Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 14
<211> 1108
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 14
Met Ala Thr Arg Ser Phe Ile Leu Lys Ile Glu Pro Asn Glu Glu Val
1 5 10 15
Lys Lys Gly Leu Trp Lys Thr His Glu Val Leu Asn His Gly Ile Ala
20 25 30
Tyr Tyr Met Asn Ile Leu Lys Leu Ile Arg Gln Glu Ala Ile Tyr Glu
35 40 45
His His Glu Gln Asp Pro Lys Asn Pro Lys Lys Val Ser Lys Ala Glu
50 55 60
Ile Gln Ala Glu Leu Trp Asp Phe Val Leu Lys Met Gln Lys Cys Asn
65 70 75 80
Ser Phe Thr His Glu Val Asp Lys Asp Val Val Phe Asn Ile Leu Arg
85 90 95
Glu Leu Tyr Glu Glu Leu Val Pro Ser Ser Val Glu Lys Lys Gly Glu
100 105 110
Ala Asn Gln Leu Ser Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn
115 120 125
Ser Gln Ser Gly Lys Gly Thr Ala Ser Ser Gly Arg Lys Pro Arg Trp
130 135 140
Tyr Asn Leu Lys Ile Ala Gly Asp Pro Ser Trp Glu Glu Glu Lys Lys
145 150 155 160
Lys Trp Glu Glu Asp Lys Lys Lys Asp Pro Leu Ala Lys Ile Leu Gly
165 170 175
Lys Leu Ala Glu Tyr Gly Leu Ile Pro Leu Phe Ile Pro Phe Thr Asp
180 185 190
Ser Asn Glu Pro Ile Val Lys Glu Ile Lys Trp Met Glu Lys Ser Arg
195 200 205
Asn Gln Ser Val Arg Arg Leu Asp Lys Asp Met Phe Ile Gln Ala Leu
210 215 220
Glu Arg Phe Leu Ser Trp Glu Ser Trp Asn Leu Lys Val Lys Glu Glu
225 230 235 240
Tyr Glu Lys Val Glu Lys Glu His Lys Thr Leu Glu Glu Arg Ile Lys
245 250 255
Glu Asp Ile Gln Ala Phe Lys Ser Leu Glu Gln Tyr Glu Lys Glu Arg
260 265 270
Gln Glu Gln Leu Leu Arg Asp Thr Leu Asn Thr Asn Glu Tyr Arg Leu
275 280 285
Ser Lys Arg Gly Leu Arg Gly Trp Arg Glu Ile Ile Gln Lys Trp Leu
290 295 300
Lys Met Asp Glu Asn Glu Pro Ser Glu Lys Tyr Leu Glu Val Phe Lys
305 310 315 320
Asp Tyr Gln Arg Lys His Pro Arg Glu Ala Gly Asp Tyr Ser Val Tyr
325 330 335
Glu Phe Leu Ser Lys Lys Glu Asn His Phe Ile Trp Arg Asn His Pro
340 345 350
Glu Tyr Pro Tyr Leu Tyr Ala Thr Phe Cys Glu Ile Asp Lys Lys Lys
355 360 365
Lys Asp Ala Lys Gln Gln Ala Thr Phe Thr Leu Ala Asp Pro Ile Asn
370 375 380
His Pro Leu Trp Val Arg Phe Glu Glu Arg Ser Gly Ser Asn Leu Asn
385 390 395 400
Lys Tyr Arg Ile Leu Thr Glu Gln Leu His Thr Glu Lys Leu Lys Lys
405 410 415
Lys Leu Thr Val Gln Leu Asp Arg Leu Ile Tyr Pro Thr Glu Ser Gly
420 425 430
Gly Trp Glu Glu Lys Gly Lys Val Asp Ile Val Leu Leu Pro Ser Arg
435 440 445
Gln Phe Tyr Asn Gln Ile Phe Leu Asp Ile Glu Glu Lys Gly Lys His
450 455 460
Ala Phe Thr Tyr Lys Asp Glu Ser Ile Lys Phe Pro Leu Lys Gly Thr
465 470 475 480
Leu Gly Gly Ala Arg Val Gln Phe Asp Arg Asp His Leu Arg Arg Tyr
485 490 495
Pro His Lys Val Glu Ser Gly Asn Val Gly Arg Ile Tyr Phe Asn Met
500 505 510
Thr Val Asn Ile Glu Pro Thr Glu Ser Pro Val Ser Lys Ser Leu Lys
515 520 525
Ile His Arg Asp Asp Phe Pro Lys Phe Val Asn Phe Lys Pro Lys Glu
530 535 540
Leu Thr Glu Trp Ile Lys Asp Ser Lys Gly Lys Lys Leu Lys Ser Gly
545 550 555 560
Ile Glu Ser Leu Glu Ile Gly Leu Arg Val Met Ser Ile Asp Leu Gly
565 570 575
Gln Arg Gln Ala Ala Ala Ala Ser Ile Phe Glu Val Val Asp Gln Lys
580 585 590
Pro Asp Ile Glu Gly Lys Leu Phe Phe Pro Ile Lys Gly Thr Glu Leu
595 600 605
Tyr Ala Val His Arg Ala Ser Phe Asn Ile Lys Leu Pro Gly Glu Thr
610 615 620
Leu Val Lys Ser Arg Glu Val Leu Arg Lys Ala Arg Glu Asp Asn Leu
625 630 635 640
Lys Leu Met Asn Gln Lys Leu Asn Phe Leu Arg Asn Val Leu His Phe
645 650 655
Gln Gln Phe Glu Asp Ile Thr Glu Arg Glu Lys Arg Val Thr Lys Trp
660 665 670
Ile Ser Arg Gln Glu Asn Ser Asp Val Pro Leu Val Tyr Gln Asp Glu
675 680 685
Leu Ile Gln Ile Arg Glu Leu Met Tyr Lys Pro Tyr Lys Asp Trp Val
690 695 700
Ala Phe Leu Lys Gln Leu His Lys Arg Leu Glu Val Glu Ile Gly Lys
705 710 715 720
Glu Val Lys His Trp Arg Lys Ser Leu Ser Asp Gly Arg Lys Gly Leu
725 730 735
Tyr Gly Ile Ser Leu Lys Asn Ile Asp Glu Ile Asp Arg Thr Arg Lys
740 745 750
Phe Leu Leu Arg Trp Ser Leu Arg Pro Thr Glu Pro Gly Glu Val Arg
755 760 765
Arg Leu Glu Pro Gly Gln Arg Phe Ala Ile Asp Gln Leu Asn His Leu
770 775 780
Asn Ala Leu Lys Glu Asp Arg Leu Lys Lys Met Ala Asn Thr Ile Ile
785 790 795 800
Met His Ala Leu Gly Tyr Cys Tyr Asp Val Arg Lys Lys Lys Trp Gln
805 810 815
Ala Lys Asn Pro Ala Cys Gln Ile Ile Leu Phe Glu Asp Leu Ser Asn
820 825 830
Tyr Asn Pro Tyr Glu Glu Arg Ser Arg Phe Glu Asn Ser Lys Leu Met
835 840 845
Lys Trp Ser Arg Arg Glu Ile Pro Arg Gln Val Ala Leu Gln Gly Glu
850 855 860
Ile Tyr Gly Leu Gln Val Gly Glu Val Gly Ala Gln Phe Ser Ser Arg
865 870 875 880
Phe His Ala Lys Thr Gly Ser Pro Gly Ile Arg Cys Ser Val Val Thr
885 890 895
Lys Glu Lys Leu Gln Asp Asn Arg Phe Phe Lys Asn Leu Gln Arg Glu
900 905 910
Gly Arg Leu Thr Leu Asp Lys Ile Ala Val Leu Lys Glu Gly Asp Leu
915 920 925
Tyr Pro Asp Lys Gly Gly Glu Lys Phe Ile Ser Leu Ser Lys Asp Arg
930 935 940
Lys Leu Val Thr Thr His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln
945 950 955 960
Lys Arg Phe Trp Thr Arg Thr His Gly Phe Tyr Lys Val Tyr Cys Lys
965 970 975
Ala Tyr Gln Val Asp Gly Gln Thr Val Tyr Ile Pro Glu Ser Lys Asp
980 985 990
Gln Lys Gln Lys Ile Ile Glu Glu Phe Gly Glu Gly Tyr Phe Ile Leu
995 1000 1005
Lys Asp Gly Val Tyr Glu Trp Gly Asn Ala Gly Lys Leu Lys Ile
1010 1015 1020
Lys Lys Gly Ser Ser Lys Gln Ser Ser Ser Glu Leu Val Asp Ser
1025 1030 1035
Asp Ile Leu Lys Asp Ser Phe Asp Leu Ala Ser Glu Leu Lys Gly
1040 1045 1050
Glu Lys Leu Met Leu Tyr Arg Asp Pro Ser Gly Asn Val Phe Pro
1055 1060 1065
Ser Asp Lys Trp Met Ala Ala Gly Val Phe Phe Gly Lys Leu Glu
1070 1075 1080
Arg Ile Leu Ile Ser Lys Leu Thr Asn Gln Tyr Ser Ile Ser Thr
1085 1090 1095
Ile Glu Asp Asp Ser Ser Lys Gln Ser Met
1100 1105
<210> 15
<211> 1149
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 15
Met Pro Thr Arg Thr Ile Asn Leu Lys Leu Val Leu Gly Lys Asn Pro
1 5 10 15
Glu Asn Ala Thr Leu Arg Arg Ala Leu Phe Ser Thr His Arg Leu Val
20 25 30
Asn Gln Ala Thr Lys Arg Ile Glu Glu Phe Leu Leu Leu Cys Arg Gly
35 40 45
Glu Ala Tyr Arg Thr Val Asp Asn Glu Gly Lys Glu Ala Glu Ile Pro
50 55 60
Arg His Ala Val Gln Glu Glu Ala Leu Ala Phe Ala Lys Ala Ala Gln
65 70 75 80
Arg His Asn Gly Cys Ile Ser Thr Tyr Glu Asp Gln Glu Ile Leu Asp
85 90 95
Val Leu Arg Gln Leu Tyr Glu Arg Leu Val Pro Ser Val Asn Glu Asn
100 105 110
Asn Glu Ala Gly Asp Ala Gln Ala Ala Asn Ala Trp Val Ser Pro Leu
115 120 125
Met Ser Ala Glu Ser Glu Gly Gly Leu Ser Val Tyr Asp Lys Val Leu
130 135 140
Asp Pro Pro Pro Val Trp Met Lys Leu Lys Glu Glu Lys Ala Pro Gly
145 150 155 160
Trp Glu Ala Ala Ser Gln Ile Trp Ile Gln Ser Asp Glu Gly Gln Ser
165 170 175
Leu Leu Asn Lys Pro Gly Ser Pro Pro Arg Trp Ile Arg Lys Leu Arg
180 185 190
Ser Gly Gln Pro Trp Gln Asp Asp Phe Val Ser Asp Gln Lys Lys Lys
195 200 205
Gln Asp Glu Leu Thr Lys Gly Asn Ala Pro Leu Ile Lys Gln Leu Lys
210 215 220
Glu Met Gly Leu Leu Pro Leu Val Asn Pro Phe Phe Arg His Leu Leu
225 230 235 240
Asp Pro Glu Gly Lys Gly Val Ser Pro Trp Asp Arg Leu Ala Val Arg
245 250 255
Ala Ala Val Ala His Phe Ile Ser Trp Glu Ser Trp Asn His Arg Thr
260 265 270
Arg Ala Glu Tyr Asn Ser Leu Lys Leu Arg Arg Asp Glu Phe Glu Ala
275 280 285
Ala Ser Asp Glu Phe Lys Asp Asp Phe Thr Leu Leu Arg Gln Tyr Glu
290 295 300
Ala Lys Arg His Ser Thr Leu Lys Ser Ile Ala Leu Ala Asp Asp Ser
305 310 315 320
Asn Pro Tyr Arg Ile Gly Val Arg Ser Leu Arg Ala Trp Asn Arg Val
325 330 335
Arg Glu Glu Trp Ile Asp Lys Gly Ala Thr Glu Glu Gln Arg Val Thr
340 345 350
Ile Leu Ser Lys Leu Gln Thr Gln Leu Arg Gly Lys Phe Gly Asp Pro
355 360 365
Asp Leu Phe Asn Trp Leu Ala Gln Asp Arg His Val His Leu Trp Ser
370 375 380
Pro Arg Asp Ser Val Thr Pro Leu Val Arg Ile Asn Ala Val Asp Lys
385 390 395 400
Val Leu Arg Arg Arg Lys Pro Tyr Ala Leu Met Thr Phe Ala His Pro
405 410 415
Arg Phe His Pro Arg Trp Ile Leu Tyr Glu Ala Pro Gly Gly Ser Asn
420 425 430
Leu Arg Gln Tyr Ala Leu Asp Cys Thr Glu Asn Ala Leu His Ile Thr
435 440 445
Leu Pro Leu Leu Val Asp Asp Ala His Gly Thr Trp Ile Glu Lys Lys
450 455 460
Ile Arg Val Pro Leu Ala Pro Ser Gly Gln Ile Gln Asp Leu Thr Leu
465 470 475 480
Glu Lys Leu Glu Lys Lys Lys Asn Arg Leu Tyr Tyr Arg Ser Gly Phe
485 490 495
Gln Gln Phe Ala Gly Leu Ala Gly Gly Ala Glu Val Leu Phe His Arg
500 505 510
Pro Tyr Met Glu His Asp Glu Arg Ser Glu Glu Ser Leu Leu Glu Arg
515 520 525
Pro Gly Ala Val Trp Phe Lys Leu Thr Leu Asp Val Ala Thr Gln Ala
530 535 540
Pro Pro Asn Trp Leu Asp Gly Lys Gly Arg Val Arg Thr Pro Pro Glu
545 550 555 560
Val His His Phe Lys Thr Ala Leu Ser Asn Lys Ser Lys His Thr Arg
565 570 575
Thr Leu Gln Pro Gly Leu Arg Val Leu Ser Val Asp Leu Gly Met Arg
580 585 590
Thr Phe Ala Ser Cys Ser Val Phe Glu Leu Ile Glu Gly Lys Pro Glu
595 600 605
Thr Gly Arg Ala Phe Pro Val Ala Asp Glu Arg Ser Met Asp Ser Pro
610 615 620
Asn Lys Leu Trp Ala Lys His Glu Arg Ser Phe Lys Leu Thr Leu Pro
625 630 635 640
Gly Glu Thr Pro Ser Arg Lys Glu Glu Glu Glu Arg Ser Ile Ala Arg
645 650 655
Ala Glu Ile Tyr Ala Leu Lys Arg Asp Ile Gln Arg Leu Lys Ser Leu
660 665 670
Leu Arg Leu Gly Glu Glu Asp Asn Asp Asn Arg Arg Asp Ala Leu Leu
675 680 685
Glu Gln Phe Phe Lys Gly Trp Gly Glu Glu Asp Val Val Pro Gly Gln
690 695 700
Ala Phe Pro Arg Ser Leu Phe Gln Gly Leu Gly Ala Ala Pro Phe Arg
705 710 715 720
Ser Thr Pro Glu Leu Trp Arg Gln His Cys Gln Thr Tyr Tyr Asp Lys
725 730 735
Ala Glu Ala Cys Leu Ala Lys His Ile Ser Asp Trp Arg Lys Arg Thr
740 745 750
Arg Pro Arg Pro Thr Ser Arg Glu Met Trp Tyr Lys Thr Arg Ser Tyr
755 760 765
His Gly Gly Lys Ser Ile Trp Met Leu Glu Tyr Leu Asp Ala Val Arg
770 775 780
Lys Leu Leu Leu Ser Trp Ser Leu Arg Gly Arg Thr Tyr Gly Ala Ile
785 790 795 800
Asn Arg Gln Asp Thr Ala Arg Phe Gly Ser Leu Ala Ser Arg Leu Leu
805 810 815
His His Ile Asn Ser Leu Lys Glu Asp Arg Ile Lys Thr Gly Ala Asp
820 825 830
Ser Ile Val Gln Ala Ala Arg Gly Tyr Ile Pro Leu Pro His Gly Lys
835 840 845
Gly Trp Glu Gln Arg Tyr Glu Pro Cys Gln Leu Ile Leu Phe Glu Asp
850 855 860
Leu Ala Arg Tyr Arg Phe Arg Val Asp Arg Pro Arg Arg Glu Asn Ser
865 870 875 880
Gln Leu Met Gln Trp Asn His Arg Ala Ile Val Ala Glu Thr Thr Met
885 890 895
Gln Ala Glu Leu Tyr Gly Gln Ile Val Glu Asn Thr Ala Ala Gly Phe
900 905 910
Ser Ser Arg Phe His Ala Ala Thr Gly Ala Pro Gly Val Arg Cys Arg
915 920 925
Phe Leu Leu Glu Arg Asp Phe Asp Asn Asp Leu Pro Lys Pro Tyr Leu
930 935 940
Leu Arg Glu Leu Ser Trp Met Leu Gly Asn Thr Lys Val Glu Ser Glu
945 950 955 960
Glu Glu Lys Leu Arg Leu Leu Ser Glu Lys Ile Arg Pro Gly Ser Leu
965 970 975
Val Pro Trp Asp Gly Gly Glu Gln Phe Ala Thr Leu His Pro Lys Arg
980 985 990
Gln Thr Leu Cys Val Ile His Ala Asp Met Asn Ala Ala Gln Asn Leu
995 1000 1005
Gln Arg Arg Phe Phe Gly Arg Cys Gly Glu Ala Phe Arg Leu Val
1010 1015 1020
Cys Gln Pro His Gly Asp Asp Val Leu Arg Leu Ala Ser Thr Pro
1025 1030 1035
Gly Ala Arg Leu Leu Gly Ala Leu Gln Gln Leu Glu Asn Gly Gln
1040 1045 1050
Gly Ala Phe Glu Leu Val Arg Asp Met Gly Ser Thr Ser Gln Met
1055 1060 1065
Asn Arg Phe Val Met Lys Ser Leu Gly Lys Lys Lys Ile Lys Pro
1070 1075 1080
Leu Gln Asp Asn Asn Gly Asp Asp Glu Leu Glu Asp Val Leu Ser
1085 1090 1095
Val Leu Pro Glu Glu Asp Asp Thr Gly Arg Ile Thr Val Phe Arg
1100 1105 1110
Asp Ser Ser Gly Ile Phe Phe Pro Cys Asn Val Trp Ile Pro Ala
1115 1120 1125
Lys Gln Phe Trp Pro Ala Val Arg Ala Met Ile Trp Lys Val Met
1130 1135 1140
Ala Ser His Ser Leu Gly
1145
<210> 16
<211> 1252
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 16
Met Thr Lys Leu Arg His Arg Gln Lys Lys Leu Thr His Asp Trp Ala
1 5 10 15
Gly Ser Lys Lys Arg Glu Val Leu Gly Ser Asn Gly Lys Leu Gln Asn
20 25 30
Pro Leu Leu Met Pro Val Lys Lys Gly Gln Val Thr Glu Phe Arg Lys
35 40 45
Ala Phe Ser Ala Tyr Ala Arg Ala Thr Lys Gly Glu Met Thr Asp Gly
50 55 60
Arg Lys Asn Met Phe Thr His Ser Phe Glu Pro Phe Lys Thr Lys Pro
65 70 75 80
Ser Leu His Gln Cys Glu Leu Ala Asp Lys Ala Tyr Gln Ser Leu His
85 90 95
Ser Tyr Leu Pro Gly Ser Leu Ala His Phe Leu Leu Ser Ala His Ala
100 105 110
Leu Gly Phe Arg Ile Phe Ser Lys Ser Gly Glu Ala Thr Ala Phe Gln
115 120 125
Ala Ser Ser Lys Ile Glu Ala Tyr Glu Ser Lys Leu Ala Ser Glu Leu
130 135 140
Ala Cys Val Asp Leu Ser Ile Gln Asn Leu Thr Ile Ser Thr Leu Phe
145 150 155 160
Asn Ala Leu Thr Thr Ser Val Arg Gly Lys Gly Glu Glu Thr Ser Ala
165 170 175
Asp Pro Leu Ile Ala Arg Phe Tyr Thr Leu Leu Thr Gly Lys Pro Leu
180 185 190
Ser Arg Asp Thr Gln Gly Pro Glu Arg Asp Leu Ala Glu Val Ile Ser
195 200 205
Arg Lys Ile Ala Ser Ser Phe Gly Thr Trp Lys Glu Met Thr Ala Asn
210 215 220
Pro Leu Gln Ser Leu Gln Phe Phe Glu Glu Glu Leu His Ala Leu Asp
225 230 235 240
Ala Asn Val Ser Leu Ser Pro Ala Phe Asp Val Leu Ile Lys Met Asn
245 250 255
Asp Leu Gln Gly Asp Leu Lys Asn Arg Thr Ile Val Phe Asp Pro Asp
260 265 270
Ala Pro Val Phe Glu Tyr Asn Ala Glu Asp Pro Ala Asp Ile Ile Ile
275 280 285
Lys Leu Thr Ala Arg Tyr Ala Lys Glu Ala Val Ile Lys Asn Gln Asn
290 295 300
Val Gly Asn Tyr Val Lys Asn Ala Ile Thr Thr Thr Asn Ala Asn Gly
305 310 315 320
Leu Gly Trp Leu Leu Asn Lys Gly Leu Ser Leu Leu Pro Val Ser Thr
325 330 335
Asp Asp Glu Leu Leu Glu Phe Ile Gly Val Glu Arg Ser His Pro Ser
340 345 350
Cys His Ala Leu Ile Glu Leu Ile Ala Gln Leu Glu Ala Pro Glu Leu
355 360 365
Phe Glu Lys Asn Val Phe Ser Asp Thr Arg Ser Glu Val Gln Gly Met
370 375 380
Ile Asp Ser Ala Val Ser Asn His Ile Ala Arg Leu Ser Ser Ser Arg
385 390 395 400
Asn Ser Leu Ser Met Asp Ser Glu Glu Leu Glu Arg Leu Ile Lys Ser
405 410 415
Phe Gln Ile His Thr Pro His Cys Ser Leu Phe Ile Gly Ala Gln Ser
420 425 430
Leu Ser Gln Gln Leu Glu Ser Leu Pro Glu Ala Leu Gln Ser Gly Val
435 440 445
Asn Ser Ala Asp Ile Leu Leu Gly Ser Thr Gln Tyr Met Leu Thr Asn
450 455 460
Ser Leu Val Glu Glu Ser Ile Ala Thr Tyr Gln Arg Thr Leu Asn Arg
465 470 475 480
Ile Asn Tyr Leu Ser Gly Val Ala Gly Gln Ile Asn Gly Ala Ile Lys
485 490 495
Arg Lys Ala Ile Asp Gly Glu Lys Ile His Leu Pro Ala Ala Trp Ser
500 505 510
Glu Leu Ile Ser Leu Pro Phe Ile Gly Gln Pro Val Ile Asp Val Glu
515 520 525
Ser Asp Leu Ala His Leu Lys Asn Gln Tyr Gln Thr Leu Ser Asn Glu
530 535 540
Phe Asp Thr Leu Ile Ser Ala Leu Gln Lys Asn Phe Asp Leu Asn Phe
545 550 555 560
Asn Lys Ala Leu Leu Asn Arg Thr Gln His Phe Glu Ala Met Cys Arg
565 570 575
Ser Thr Lys Lys Asn Ala Leu Ser Lys Pro Glu Ile Val Ser Tyr Arg
580 585 590
Asp Leu Leu Ala Arg Leu Thr Ser Cys Leu Tyr Arg Gly Ser Leu Val
595 600 605
Leu Arg Arg Ala Gly Ile Glu Val Leu Lys Lys His Lys Ile Phe Glu
610 615 620
Ser Asn Ser Glu Leu Arg Glu His Val His Glu Arg Lys His Phe Val
625 630 635 640
Phe Val Ser Pro Leu Asp Arg Lys Ala Lys Lys Leu Leu Arg Leu Thr
645 650 655
Asp Ser Arg Pro Asp Leu Leu His Val Ile Asp Glu Ile Leu Gln His
660 665 670
Asp Asn Leu Glu Asn Lys Asp Arg Glu Ser Leu Trp Leu Val Arg Ser
675 680 685
Gly Tyr Leu Leu Ala Gly Leu Pro Asp Gln Leu Ser Ser Ser Phe Ile
690 695 700
Asn Leu Pro Ile Ile Thr Gln Lys Gly Asp Arg Arg Leu Ile Asp Leu
705 710 715 720
Ile Gln Tyr Asp Gln Ile Asn Arg Asp Ala Phe Val Met Leu Val Thr
725 730 735
Ser Ala Phe Lys Ser Asn Leu Ser Gly Leu Gln Tyr Arg Ala Asn Lys
740 745 750
Gln Ser Phe Val Val Thr Arg Thr Leu Ser Pro Tyr Leu Gly Ser Lys
755 760 765
Leu Val Tyr Val Pro Lys Asp Lys Asp Trp Leu Val Pro Ser Gln Met
770 775 780
Phe Glu Gly Arg Phe Ala Asp Ile Leu Gln Ser Asp Tyr Met Val Trp
785 790 795 800
Lys Asp Ala Gly Arg Leu Cys Val Ile Asp Thr Ala Lys His Leu Ser
805 810 815
Asn Ile Lys Lys Ser Val Phe Ser Ser Glu Glu Val Leu Ala Phe Leu
820 825 830
Arg Glu Leu Pro His Arg Thr Phe Ile Gln Thr Glu Val Arg Gly Leu
835 840 845
Gly Val Asn Val Asp Gly Ile Ala Phe Asn Asn Gly Asp Ile Pro Ser
850 855 860
Leu Lys Thr Phe Ser Asn Cys Val Gln Val Lys Val Ser Arg Thr Asn
865 870 875 880
Thr Ser Leu Val Gln Thr Leu Asn Arg Trp Phe Glu Gly Gly Lys Val
885 890 895
Ser Pro Pro Ser Ile Gln Phe Glu Arg Ala Tyr Tyr Lys Lys Asp Asp
900 905 910
Gln Ile His Glu Asp Ala Ala Lys Arg Lys Ile Arg Phe Gln Met Pro
915 920 925
Ala Thr Glu Leu Val His Ala Ser Asp Asp Ala Gly Trp Thr Pro Ser
930 935 940
Tyr Leu Leu Gly Ile Asp Pro Gly Glu Tyr Gly Met Gly Leu Ser Leu
945 950 955 960
Val Ser Ile Asn Asn Gly Glu Val Leu Asp Ser Gly Phe Ile His Ile
965 970 975
Asn Ser Leu Ile Asn Phe Ala Ser Lys Lys Ser Asn His Gln Thr Lys
980 985 990
Val Val Pro Arg Gln Gln Tyr Lys Ser Pro Tyr Ala Asn Tyr Leu Glu
995 1000 1005
Gln Ser Lys Asp Ser Ala Ala Gly Asp Ile Ala His Ile Leu Asp
1010 1015 1020
Arg Leu Ile Tyr Lys Leu Asn Ala Leu Pro Val Phe Glu Ala Leu
1025 1030 1035
Ser Gly Asn Ser Gln Ser Ala Ala Asp Gln Val Trp Thr Lys Val
1040 1045 1050
Leu Ser Phe Tyr Thr Trp Gly Asp Asn Asp Ala Gln Asn Ser Ile
1055 1060 1065
Arg Lys Gln His Trp Phe Gly Ala Ser His Trp Asp Ile Lys Gly
1070 1075 1080
Met Leu Arg Gln Pro Pro Thr Glu Lys Lys Pro Lys Pro Tyr Ile
1085 1090 1095
Ala Phe Pro Gly Ser Gln Val Ser Ser Tyr Gly Asn Ser Gln Arg
1100 1105 1110
Cys Ser Cys Cys Gly Arg Asn Pro Ile Glu Gln Leu Arg Glu Met
1115 1120 1125
Ala Lys Asp Thr Ser Ile Lys Glu Leu Lys Ile Arg Asn Ser Glu
1130 1135 1140
Ile Gln Leu Phe Asp Gly Thr Ile Lys Leu Phe Asn Pro Asp Pro
1145 1150 1155
Ser Thr Val Ile Glu Arg Arg Arg His Asn Leu Gly Pro Ser Arg
1160 1165 1170
Ile Pro Val Ala Asp Arg Thr Phe Lys Asn Ile Ser Pro Ser Ser
1175 1180 1185
Leu Glu Phe Lys Glu Leu Ile Thr Ile Val Ser Arg Ser Ile Arg
1190 1195 1200
His Ser Pro Glu Phe Ile Ala Lys Lys Arg Gly Ile Gly Ser Glu
1205 1210 1215
Tyr Phe Cys Ala Tyr Ser Asp Cys Asn Ser Ser Leu Asn Ser Glu
1220 1225 1230
Ala Asn Ala Ala Ala Asn Val Ala Gln Lys Phe Gln Lys Gln Leu
1235 1240 1245
Phe Phe Glu Leu
1250
<210> 17
<211> 1287
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 17
Met Lys Arg Ile Leu Asn Ser Leu Lys Val Ala Ala Leu Arg Leu Leu
1 5 10 15
Phe Arg Gly Lys Gly Ser Glu Leu Val Lys Thr Val Lys Tyr Pro Leu
20 25 30
Val Ser Pro Val Gln Gly Ala Val Glu Glu Leu Ala Glu Ala Ile Arg
35 40 45
His Asp Asn Leu His Leu Phe Gly Gln Lys Glu Ile Val Asp Leu Met
50 55 60
Glu Lys Asp Glu Gly Thr Gln Val Tyr Ser Val Val Asp Phe Trp Leu
65 70 75 80
Asp Thr Leu Arg Leu Gly Met Phe Phe Ser Pro Ser Ala Asn Ala Leu
85 90 95
Lys Ile Thr Leu Gly Lys Phe Asn Ser Asp Gln Val Ser Pro Phe Arg
100 105 110
Lys Val Leu Glu Gln Ser Pro Phe Phe Leu Ala Gly Arg Leu Lys Val
115 120 125
Glu Pro Ala Glu Arg Ile Leu Ser Val Glu Ile Arg Lys Ile Gly Lys
130 135 140
Arg Glu Asn Arg Val Glu Asn Tyr Ala Ala Asp Val Glu Thr Cys Phe
145 150 155 160
Ile Gly Gln Leu Ser Ser Asp Glu Lys Gln Ser Ile Gln Lys Leu Ala
165 170 175
Asn Asp Ile Trp Asp Ser Lys Asp His Glu Glu Gln Arg Met Leu Lys
180 185 190
Ala Asp Phe Phe Ala Ile Pro Leu Ile Lys Asp Pro Lys Ala Val Thr
195 200 205
Glu Glu Asp Pro Glu Asn Glu Thr Ala Gly Lys Gln Lys Pro Leu Glu
210 215 220
Leu Cys Val Cys Leu Val Pro Glu Leu Tyr Thr Arg Gly Phe Gly Ser
225 230 235 240
Ile Ala Asp Phe Leu Val Gln Arg Leu Thr Leu Leu Arg Asp Lys Met
245 250 255
Ser Thr Asp Thr Ala Glu Asp Cys Leu Glu Tyr Val Gly Ile Glu Glu
260 265 270
Glu Lys Gly Asn Gly Met Asn Ser Leu Leu Gly Thr Phe Leu Lys Asn
275 280 285
Leu Gln Gly Asp Gly Phe Glu Gln Ile Phe Gln Phe Met Leu Gly Ser
290 295 300
Tyr Val Gly Trp Gln Gly Lys Glu Asp Val Leu Arg Glu Arg Leu Asp
305 310 315 320
Leu Leu Ala Glu Lys Val Lys Arg Leu Pro Lys Pro Lys Phe Ala Gly
325 330 335
Glu Trp Ser Gly His Arg Met Phe Leu His Gly Gln Leu Lys Ser Trp
340 345 350
Ser Ser Asn Phe Phe Arg Leu Phe Asn Glu Thr Arg Glu Leu Leu Glu
355 360 365
Ser Ile Lys Ser Asp Ile Gln His Ala Thr Met Leu Ile Ser Tyr Val
370 375 380
Glu Glu Lys Gly Gly Tyr His Pro Gln Leu Leu Ser Gln Tyr Arg Lys
385 390 395 400
Leu Met Glu Gln Leu Pro Ala Leu Arg Thr Lys Val Leu Asp Pro Glu
405 410 415
Ile Glu Met Thr His Met Ser Glu Ala Val Arg Ser Tyr Ile Met Ile
420 425 430
His Lys Ser Val Ala Gly Phe Leu Pro Asp Leu Leu Glu Ser Leu Asp
435 440 445
Arg Asp Lys Asp Arg Glu Phe Leu Leu Ser Ile Phe Pro Arg Ile Pro
450 455 460
Lys Ile Asp Lys Lys Thr Lys Glu Ile Val Ala Trp Glu Leu Pro Gly
465 470 475 480
Glu Pro Glu Glu Gly Tyr Leu Phe Thr Ala Asn Asn Leu Phe Arg Asn
485 490 495
Phe Leu Glu Asn Pro Lys His Val Pro Arg Phe Met Ala Glu Arg Ile
500 505 510
Pro Glu Asp Trp Thr Arg Leu Arg Ser Ala Pro Val Trp Phe Asp Gly
515 520 525
Met Val Lys Gln Trp Gln Lys Val Val Asn Gln Leu Val Glu Ser Pro
530 535 540
Gly Ala Leu Tyr Gln Phe Asn Glu Ser Phe Leu Arg Gln Arg Leu Gln
545 550 555 560
Ala Met Leu Thr Val Tyr Lys Arg Asp Leu Gln Thr Glu Lys Phe Leu
565 570 575
Lys Leu Leu Ala Asp Val Cys Arg Pro Leu Val Asp Phe Phe Gly Leu
580 585 590
Gly Gly Asn Asp Ile Ile Phe Lys Ser Cys Gln Asp Pro Arg Lys Gln
595 600 605
Trp Gln Thr Val Ile Pro Leu Ser Val Pro Ala Asp Val Tyr Thr Ala
610 615 620
Cys Glu Gly Leu Ala Ile Arg Leu Arg Glu Thr Leu Gly Phe Glu Trp
625 630 635 640
Lys Asn Leu Lys Gly His Glu Arg Glu Asp Phe Leu Arg Leu His Gln
645 650 655
Leu Leu Gly Asn Leu Leu Phe Trp Ile Arg Asp Ala Lys Leu Val Val
660 665 670
Lys Leu Glu Asp Trp Met Asn Asn Pro Cys Val Gln Glu Tyr Val Glu
675 680 685
Ala Arg Lys Ala Ile Asp Leu Pro Leu Glu Ile Phe Gly Phe Glu Val
690 695 700
Pro Ile Phe Leu Asn Gly Tyr Leu Phe Ser Glu Leu Arg Gln Leu Glu
705 710 715 720
Leu Leu Leu Arg Arg Lys Ser Val Met Thr Ser Tyr Ser Val Lys Thr
725 730 735
Thr Gly Ser Pro Asn Arg Leu Phe Gln Leu Val Tyr Leu Pro Leu Asn
740 745 750
Pro Ser Asp Pro Glu Lys Lys Asn Ser Asn Asn Phe Gln Glu Arg Leu
755 760 765
Asp Thr Pro Thr Gly Leu Ser Arg Arg Phe Leu Asp Leu Thr Leu Asp
770 775 780
Ala Phe Ala Gly Lys Leu Leu Thr Asp Pro Val Thr Gln Glu Leu Lys
785 790 795 800
Thr Met Ala Gly Phe Tyr Asp His Leu Phe Gly Phe Lys Leu Pro Cys
805 810 815
Lys Leu Ala Ala Met Ser Asn His Pro Gly Ser Ser Ser Lys Met Val
820 825 830
Val Leu Ala Lys Pro Lys Lys Gly Val Ala Ser Asn Ile Gly Phe Glu
835 840 845
Pro Ile Pro Asp Pro Ala His Pro Val Phe Arg Val Arg Ser Ser Trp
850 855 860
Pro Glu Leu Lys Tyr Leu Glu Gly Leu Leu Tyr Leu Pro Glu Asp Thr
865 870 875 880
Pro Leu Thr Ile Glu Leu Ala Glu Thr Ser Val Ser Cys Gln Ser Val
885 890 895
Ser Ser Val Ala Phe Asp Leu Lys Asn Leu Thr Thr Ile Leu Gly Arg
900 905 910
Val Gly Glu Phe Arg Val Thr Ala Asp Gln Pro Phe Lys Leu Thr Pro
915 920 925
Ile Ile Pro Glu Lys Glu Glu Ser Phe Ile Gly Lys Thr Tyr Leu Gly
930 935 940
Leu Asp Ala Gly Glu Arg Ser Gly Val Gly Phe Ala Ile Val Thr Val
945 950 955 960
Asp Gly Asp Gly Tyr Glu Val Gln Arg Leu Gly Val His Glu Asp Thr
965 970 975
Gln Leu Met Ala Leu Gln Gln Val Ala Ser Lys Ser Leu Lys Glu Pro
980 985 990
Val Phe Gln Pro Leu Arg Lys Gly Thr Phe Arg Gln Gln Glu Arg Ile
995 1000 1005
Arg Lys Ser Leu Arg Gly Cys Tyr Trp Asn Phe Tyr His Ala Leu
1010 1015 1020
Met Ile Lys Tyr Arg Ala Lys Val Val His Glu Glu Ser Val Gly
1025 1030 1035
Ser Ser Gly Leu Val Gly Gln Trp Leu Arg Ala Phe Gln Lys Asp
1040 1045 1050
Leu Lys Lys Ala Asp Val Leu Pro Lys Lys Gly Gly Lys Asn Gly
1055 1060 1065
Val Asp Lys Lys Lys Arg Glu Ser Ser Ala Gln Asp Thr Leu Trp
1070 1075 1080
Gly Gly Ala Phe Ser Lys Lys Glu Glu Gln Gln Ile Ala Phe Glu
1085 1090 1095
Val Gln Ala Ala Gly Ser Ser Gln Phe Cys Leu Lys Cys Gly Trp
1100 1105 1110
Trp Phe Gln Leu Gly Met Arg Glu Val Asn Arg Val Gln Glu Ser
1115 1120 1125
Gly Val Val Leu Asp Trp Asn Arg Ser Ile Val Thr Phe Leu Ile
1130 1135 1140
Glu Ser Ser Gly Glu Lys Val Tyr Gly Phe Ser Pro Gln Gln Leu
1145 1150 1155
Glu Lys Gly Phe Arg Pro Asp Ile Glu Thr Phe Lys Lys Met Val
1160 1165 1170
Arg Asp Phe Met Arg Pro Pro Met Phe Asp Arg Lys Gly Arg Pro
1175 1180 1185
Ala Ala Ala Tyr Glu Arg Phe Val Leu Gly Arg Arg His Arg Arg
1190 1195 1200
Tyr Arg Phe Asp Lys Val Phe Glu Glu Arg Phe Gly Arg Ser Ala
1205 1210 1215
Leu Phe Ile Cys Pro Arg Val Gly Cys Gly Asn Phe Asp His Ser
1220 1225 1230
Ser Glu Gln Ser Ala Val Val Leu Ala Leu Ile Gly Tyr Ile Ala
1235 1240 1245
Asp Lys Glu Gly Met Ser Gly Lys Lys Leu Val Tyr Val Arg Leu
1250 1255 1260
Ala Glu Leu Met Ala Glu Trp Lys Leu Lys Lys Leu Glu Arg Ser
1265 1270 1275
Arg Val Glu Glu Gln Ser Ser Ala Gln
1280 1285
<210> 18
<211> 1192
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 18
Met Ala Glu Ser Lys Gln Met Gln Cys Arg Lys Cys Gly Ala Ser Met
1 5 10 15
Lys Tyr Glu Val Ile Gly Leu Gly Lys Lys Ser Cys Arg Tyr Met Cys
20 25 30
Pro Asp Cys Gly Asn His Thr Ser Ala Arg Lys Ile Gln Asn Lys Lys
35 40 45
Lys Arg Asp Lys Lys Tyr Gly Ser Ala Ser Lys Ala Gln Ser Gln Arg
50 55 60
Ile Ala Val Ala Gly Ala Leu Tyr Pro Asp Lys Lys Val Gln Thr Ile
65 70 75 80
Lys Thr Tyr Lys Tyr Pro Ala Asp Leu Asn Gly Glu Val His Asp Ser
85 90 95
Gly Val Ala Glu Lys Ile Ala Gln Ala Ile Gln Glu Asp Glu Ile Gly
100 105 110
Leu Leu Gly Pro Ser Ser Glu Tyr Ala Cys Trp Ile Ala Ser Gln Lys
115 120 125
Gln Ser Glu Pro Tyr Ser Val Val Asp Phe Trp Phe Asp Ala Val Cys
130 135 140
Ala Gly Gly Val Phe Ala Tyr Ser Gly Ala Arg Leu Leu Ser Thr Val
145 150 155 160
Leu Gln Leu Ser Gly Glu Glu Ser Val Leu Arg Ala Ala Leu Ala Ser
165 170 175
Ser Pro Phe Val Asp Asp Ile Asn Leu Ala Gln Ala Glu Lys Phe Leu
180 185 190
Ala Val Ser Arg Arg Thr Gly Gln Asp Lys Leu Gly Lys Arg Ile Gly
195 200 205
Glu Cys Phe Ala Glu Gly Arg Leu Glu Ala Leu Gly Ile Lys Asp Arg
210 215 220
Met Arg Glu Phe Val Gln Ala Ile Asp Val Ala Gln Thr Ala Gly Gln
225 230 235 240
Arg Phe Ala Ala Lys Leu Lys Ile Phe Gly Ile Ser Gln Met Pro Glu
245 250 255
Ala Lys Gln Trp Asn Asn Asp Ser Gly Leu Thr Val Cys Ile Leu Pro
260 265 270
Asp Tyr Tyr Val Pro Glu Glu Asn Arg Ala Asp Gln Leu Val Val Leu
275 280 285
Leu Arg Arg Leu Arg Glu Ile Ala Tyr Cys Met Gly Ile Glu Asp Glu
290 295 300
Ala Gly Phe Glu His Leu Gly Ile Asp Pro Gly Ala Leu Ser Asn Phe
305 310 315 320
Ser Asn Gly Asn Pro Lys Arg Gly Phe Leu Gly Arg Leu Leu Asn Asn
325 330 335
Asp Ile Ile Ala Leu Ala Asn Asn Met Ser Ala Met Thr Pro Tyr Trp
340 345 350
Glu Gly Arg Lys Gly Glu Leu Ile Glu Arg Leu Ala Trp Leu Lys His
355 360 365
Arg Ala Glu Gly Leu Tyr Leu Lys Glu Pro His Phe Gly Asn Ser Trp
370 375 380
Ala Asp His Arg Ser Arg Ile Phe Ser Arg Ile Ala Gly Trp Leu Ser
385 390 395 400
Gly Cys Ala Gly Lys Leu Lys Ile Ala Lys Asp Gln Ile Ser Gly Val
405 410 415
Arg Thr Asp Leu Phe Leu Leu Lys Arg Leu Leu Asp Ala Val Pro Gln
420 425 430
Ser Ala Pro Ser Pro Asp Phe Ile Ala Ser Ile Ser Ala Leu Asp Arg
435 440 445
Phe Leu Glu Ala Ala Glu Ser Ser Gln Asp Pro Ala Glu Gln Val Arg
450 455 460
Ala Leu Tyr Ala Phe His Leu Asn Ala Pro Ala Val Arg Ser Ile Ala
465 470 475 480
Asn Lys Ala Val Gln Arg Ser Asp Ser Gln Glu Trp Leu Ile Lys Glu
485 490 495
Leu Asp Ala Val Asp His Leu Glu Phe Asn Lys Ala Phe Pro Phe Phe
500 505 510
Ser Asp Thr Gly Lys Lys Lys Lys Lys Gly Ala Asn Ser Asn Gly Ala
515 520 525
Pro Ser Glu Glu Glu Tyr Thr Glu Thr Glu Ser Ile Gln Gln Pro Glu
530 535 540
Asp Ala Glu Gln Glu Val Asn Gly Gln Glu Gly Asn Gly Ala Ser Lys
545 550 555 560
Asn Gln Lys Lys Phe Gln Arg Ile Pro Arg Phe Phe Gly Glu Gly Ser
565 570 575
Arg Ser Glu Tyr Arg Ile Leu Thr Glu Ala Pro Gln Tyr Phe Asp Met
580 585 590
Phe Cys Asn Asn Met Arg Ala Ile Phe Met Gln Leu Glu Ser Gln Pro
595 600 605
Arg Lys Ala Pro Arg Asp Phe Lys Cys Phe Leu Gln Asn Arg Leu Gln
610 615 620
Lys Leu Tyr Lys Gln Thr Phe Leu Asn Ala Arg Ser Asn Lys Cys Arg
625 630 635 640
Ala Leu Leu Glu Ser Val Leu Ile Ser Trp Gly Glu Phe Tyr Thr Tyr
645 650 655
Gly Ala Asn Glu Lys Lys Phe Arg Leu Arg His Glu Ala Ser Glu Arg
660 665 670
Ser Ser Asp Pro Asp Tyr Val Val Gln Gln Ala Leu Glu Ile Ala Arg
675 680 685
Arg Leu Phe Leu Phe Gly Phe Glu Trp Arg Asp Cys Ser Ala Gly Glu
690 695 700
Arg Val Asp Leu Val Glu Ile His Lys Lys Ala Ile Ser Phe Leu Leu
705 710 715 720
Ala Ile Thr Gln Ala Glu Val Ser Val Gly Ser Tyr Asn Trp Leu Gly
725 730 735
Asn Ser Thr Val Ser Arg Tyr Leu Ser Val Ala Gly Thr Asp Thr Leu
740 745 750
Tyr Gly Thr Gln Leu Glu Glu Phe Leu Asn Ala Thr Val Leu Ser Gln
755 760 765
Met Arg Gly Leu Ala Ile Arg Leu Ser Ser Gln Glu Leu Lys Asp Gly
770 775 780
Phe Asp Val Gln Leu Glu Ser Ser Cys Gln Asp Asn Leu Gln His Leu
785 790 795 800
Leu Val Tyr Arg Ala Ser Arg Asp Leu Ala Ala Cys Lys Arg Ala Thr
805 810 815
Cys Pro Ala Glu Leu Asp Pro Lys Ile Leu Val Leu Pro Val Gly Ala
820 825 830
Phe Ile Ala Ser Val Met Lys Met Ile Glu Arg Gly Asp Glu Pro Leu
835 840 845
Ala Gly Ala Tyr Leu Arg His Arg Pro His Ser Phe Gly Trp Gln Ile
850 855 860
Arg Val Arg Gly Val Ala Glu Val Gly Met Asp Gln Gly Thr Ala Leu
865 870 875 880
Ala Phe Gln Lys Pro Thr Glu Ser Glu Pro Phe Lys Ile Lys Pro Phe
885 890 895
Ser Ala Gln Tyr Gly Pro Val Leu Trp Leu Asn Ser Ser Ser Tyr Ser
900 905 910
Gln Ser Gln Tyr Leu Asp Gly Phe Leu Ser Gln Pro Lys Asn Trp Ser
915 920 925
Met Arg Val Leu Pro Gln Ala Gly Ser Val Arg Val Glu Gln Arg Val
930 935 940
Ala Leu Ile Trp Asn Leu Gln Ala Gly Lys Met Arg Leu Glu Arg Ser
945 950 955 960
Gly Ala Arg Ala Phe Phe Met Pro Val Pro Phe Ser Phe Arg Pro Ser
965 970 975
Gly Ser Gly Asp Glu Ala Val Leu Ala Pro Asn Arg Tyr Leu Gly Leu
980 985 990
Phe Pro His Ser Gly Gly Ile Glu Tyr Ala Val Val Asp Val Leu Asp
995 1000 1005
Ser Ala Gly Phe Lys Ile Leu Glu Arg Gly Thr Ile Ala Val Asn
1010 1015 1020
Gly Phe Ser Gln Lys Arg Gly Glu Arg Gln Glu Glu Ala His Arg
1025 1030 1035
Glu Lys Gln Arg Arg Gly Ile Ser Asp Ile Gly Arg Lys Lys Pro
1040 1045 1050
Val Gln Ala Glu Val Asp Ala Ala Asn Glu Leu His Arg Lys Tyr
1055 1060 1065
Thr Asp Val Ala Thr Arg Leu Gly Cys Arg Ile Val Val Gln Trp
1070 1075 1080
Ala Pro Gln Pro Lys Pro Gly Thr Ala Pro Thr Ala Gln Thr Val
1085 1090 1095
Tyr Ala Arg Ala Val Arg Thr Glu Ala Pro Arg Ser Gly Asn Gln
1100 1105 1110
Glu Asp His Ala Arg Met Lys Ser Ser Trp Gly Tyr Thr Trp Gly
1115 1120 1125
Thr Tyr Trp Glu Lys Arg Lys Pro Glu Asp Ile Leu Gly Ile Ser
1130 1135 1140
Thr Gln Val Tyr Trp Thr Gly Gly Ile Gly Glu Ser Cys Pro Ala
1145 1150 1155
Val Ala Val Ala Leu Leu Gly His Ile Arg Ala Thr Ser Thr Gln
1160 1165 1170
Thr Glu Trp Glu Lys Glu Glu Val Val Phe Gly Arg Leu Lys Lys
1175 1180 1185
Phe Phe Pro Ser
1190
<210> 19
<211> 986
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 19
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val
20 25 30
Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys
35 40 45
Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn
50 55 60
Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu
65 70 75 80
Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys
85 90 95
Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys
100 105 110
Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys
115 120 125
Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser
130 135 140
Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala
145 150 155 160
Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp
165 170 175
Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg
325 330 335
Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys
340 345 350
Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val
355 360 365
Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro
370 375 380
Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys
385 390 395 400
Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys
405 410 415
Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg
420 425 430
Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu
435 440 445
Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp
450 455 460
Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp
465 470 475 480
Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly
485 490 495
Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val
500 505 510
Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr
515 520 525
Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe
530 535 540
Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp
545 550 555 560
Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly
565 570 575
Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu
580 585 590
Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu
595 600 605
Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu
610 615 620
Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly
625 630 635 640
Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu
645 650 655
Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp
660 665 670
Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly
675 680 685
Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile
690 695 700
Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala
705 710 715 720
Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe
725 730 735
Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala
740 745 750
Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe
755 760 765
Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met
770 775 780
Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu
785 790 795 800
Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala
805 810 815
Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Thr
820 825 830
Ala Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser Asp Gly
835 840 845
Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly Gln Ile
850 855 860
Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu Ser
865 870 875 880
Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile Ser
885 890 895
Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys Lys
900 905 910
Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp Cys
915 920 925
Gly His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg
930 935 940
Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys
945 950 955 960
Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg
965 970 975
Arg Leu Lys Glu Val Trp Lys Pro Asn Ala
980 985
<210> 20
<211> 973
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полипептид
<400> 20
Met Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn
1 5 10 15
Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg
20 25 30
Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys
35 40 45
Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu
50 55 60
Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His
65 70 75 80
Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg
85 90 95
Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro
100 105 110
Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser
115 120 125
Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp
130 135 140
Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu
145 150 155 160
His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp
165 170 175
Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp
180 185 190
Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro
195 200 205
Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys
210 215 220
Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys
225 230 235 240
Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu
245 250 255
Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala
260 265 270
Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile
275 280 285
Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu
290 295 300
Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu
305 310 315 320
Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala
325 330 335
Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile
340 345 350
Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly
355 360 365
Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser Glu Glu Asp
370 375 380
Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu
385 390 395 400
Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp
405 410 415
Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His
420 425 430
Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala
435 440 445
Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly
450 455 460
Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu
465 470 475 480
Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala
485 490 495
Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys
500 505 510
Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu
515 520 525
Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys
530 535 540
Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys
545 550 555 560
Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro
565 570 575
Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu
580 585 590
Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu
595 600 605
Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg
610 615 620
Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu
625 630 635 640
Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp
645 650 655
Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly
660 665 670
Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile
675 680 685
Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala
690 695 700
Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr
705 710 715 720
Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala
725 730 735
Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe
740 745 750
Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met
755 760 765
Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu
770 775 780
Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala
785 790 795 800
Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser
805 810 815
Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly
820 825 830
Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile
835 840 845
Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser
850 855 860
Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser
865 870 875 880
Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys
885 890 895
Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys
900 905 910
Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg
915 920 925
Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn
930 935 940
Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln
945 950 955 960
Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970
<210> 21
<211> 4077
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 21
atgggaaaaa tgtattatct tggtctggat ataggaacaa attctgttgg atatgccgta 60
accgacccat cgtaccattt gctcaaattt aaaggcgaac cgatgtgggg tgcccacgtg 120
tttgctgcgg ggaatcaatc agctgaacgg agaagctttc gtacgagccg cagacgcctt 180
gaccgcaggc aacagcgtgt caaactggtt caagaaatct ttgctcccgt gattagtccc 240
attgatccac gtttttttat cagacttcat gagagcgctt tatggcggga tgatgtggct 300
gaaacggata aacatatttt ctttaatgac ccgacctata cggataagga atattattct 360
gactatccaa ccatccatca tctcattgtg gaccttatgg aaagcagtga aaagcatgac 420
ccgcggcttg tttatttggc tgttgcctgg ctggttgctc atcgtggtca tttcctcaat 480
gaagtggata aggataatat tggggatgtc ctgagttttg acgcctttta tcctgagttt 540
ctggcatttc tttccgataa tggggtgtca ccttgggtat gtgagtcaaa agcactccaa 600
gcgaccctgc tttcacgaaa ctccgtcaac gataagtata aagccttgaa gtctctgatc 660
tttggcagcc aaaagccgga ggataatttt gatgccaata tcagtgaaga tggacttatc 720
caacttttag caggaaaaaa ggtcaaggtc aataaacttt ttcctcaaga aagtaatgat 780
gcttccttta cactcaatga taaggaagat gcaattgagg aaatcttagg aacgcttaca 840
ccggatgagt gtgaatggat tgcgcatatt aggaggctgt ttgattgggc catcatgaaa 900
catgctctca aagatggcag aacaatctcc gaatcgaaag taaagctcta tgaacagcat 960
caccatgact tgacacagct caagtatttt gtgaagacct atctagcaaa ggaatatgat 1020
gacatttttc gaaacgtaga tagtgaaaca accaaaaact atgtcgcata ttcctatcat 1080
gtaaaagaag tcaagggtac attgcccaaa aataaggcaa cccaagaaga attttgcaag 1140
tatgtccttg gaaaggtaaa gaacatcgaa tgcagtgaag ctgataaggt tgattttgat 1200
gaaatgattc agcgtcttac agacaattcc tttatgccga aacaagtatc aggtgaaaac 1260
agggttatcc cttaccagct ttactattat gaactaaaga ctattttgaa taaagccgct 1320
tcttatctgc cttttttgac ccaatgcgga aaagatgcca tctccaatca agataagctc 1380
ctttccatca tgacctttcg gattccgtat ttcgttgggc ccttgcgcaa ggacaattca 1440
gagcatgcct ggctggaacg aaaagcaggg aaaatctatc cgtggaattt taacgacaaa 1500
gttgaccttg ataaaagtga agaagcgttc attcggagaa tgacgaatac ctgcacttat 1560
tatcccggtg aagatgtttt gccacttgac tcccttattt atgaaaaatt catgatcctc 1620
aatgaaatca ataatatccg aattgatggt tatcctattt ctgtagatgt aaaacagcag 1680
gtttttggcc tctttgaaaa gaagagaaga gtgaccgtaa aggatatcca gaatctcctg 1740
ctttccttgg gtgccttgga taagcatggt aaattgacgg gaatcgatac taccatccat 1800
agcaattaca atacatacca tcattttaaa tcgctcatgg agcgtggcgt tcttactcgt 1860
gatgatgtgg aacgcattgt ggagcgtatg acctatagtg atgatacaaa acgcgtccgt 1920
ctttggctga acaataatta tggaacgctc actgctgacg acgtaaagca tatttcaagg 1980
ctccgaaagc atgattttgg ccggctttcc aaaatgttcc tcacaggcct aaagggagtt 2040
cataaggaaa cgggggaacg agcttccatt ttggatttta tgtggaatac caatgataac 2100
ttgatgcagc ttttatctga atgttatact ttttcggatg aaattaccaa gctgcaggaa 2160
gcatactatg ccaaggcgca gctttccctg aatgattttc tggactccat gtatatttca 2220
aatgctgtca aacgtcctat ctatcgaact cttgccgttg taaatgacat acgcaaagcc 2280
tgtgggacgg cgccaaaacg catttttatc gaaatggcaa gagatgggga aagcaaaaag 2340
aaaaggagcg taacaagaag agaacaaatc aagaatcttt ataggtccat ccgcaaggat 2400
tttcagcagg aggtagattt ccttgaaaaa atccttgaaa acaaaagcga tggacagctg 2460
caaagcgatg cgctctatct atactttgcg cagcttggaa gggatatgta taccggggac 2520
cctatcaagt tggagcatat caaggaccag tccttctata atattgatca tatctatccc 2580
caaagcatgg tcaaggacga tagtcttgat aacaaggtgt tggttcaatc ggaaattaat 2640
ggagagaaga gcagtcgata tcctcttgat gctgctatcc gtaataaaat gaagcctctt 2700
tgggatgctt attataacca tggcctgatt tccctcaaga agtatcagcg tttgacgcgg 2760
agcactccct ttacagatga tgaaaagtgg gatttcatca atcggcagct tgttgagaca 2820
agacaatcca cgaaggcctt ggcaatctta ctaaaaagga agttccctga tacggagatt 2880
gtctactcca aggcagggct ttcttctgat tttcggcatg agtttggtct cgtaaaatcg 2940
aggaatatca atgacctgca ccatgcaaag gacgcatttc ttgcgattgt aacaggaaat 3000
gtctatcatg aacgctttaa tcgccggtgg tttatggtga accagcccta ttccgtcaag 3060
accaagacgt tgtttacgca ttctattaaa aatggtaatt ttgtagcttg gaatggagaa 3120
gaggatcttg gccgcattgt taaaatgtta aagcaaaata agaacactat tcatttcacg 3180
cggttctctt ttgatcgaaa ggaaggcctg tttgatattc agccactaaa agcgtcaacc 3240
ggtcttgtac caagaaaagc cggactagac gtggtaaaat atggtggcta tgacaaatcg 3300
acagcagctt attatctcct tgttcgattt acactagaag ataaaaagac tcaacataaa 3360
ttgatgatga ttcctgtaga aggcttgtat aaagctcgaa ttgaccatga taaggaattc 3420
ttaacggact atgcacaaac tacaatcagt gaaatcctac aaaaagataa acaaaaggtg 3480
ataaatataa tgtttccaat gggaacaagg cacattaaac tgaattccat gatttcaatc 3540
gatggttttt atctttccat tggaggaaag tctagtaagg gaaaatcggt gttgtgtcat 3600
gctatggtac ctcttattgt acctcataag atagaatgtt atattaaggc gatggagtct 3660
tttgcacgta aatttaaaga aaataataaa ttaaggattg tggaaaagtt tgataagatt 3720
acggtggaag ataacttgaa cctatacgaa ctatttttac aaaaacttca acataaccca 3780
tataataagt tcttctccac acaatttgat gtgctgacta atggaagaag tacatttact 3840
aaattatctc cagaggaaca agttcaaacg ttattgaata tcttatcaat ttttaaaact 3900
tgtcggagct ctggctgcga tttaaaatcc attaacggtt ctgctcaagc tgccagaatt 3960
atgatcagcg cagatttaac tggactctca aaaaaatatt ccgatattcg gcttgttgag 4020
caatcagcat ctggactttt tgttagtaaa tcacaaaatc ttttggagta tttatga 4077
<210> 22
<211> 4005
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 22
atgtcttcat taacaaaatt tacaaataaa tacagtaagc agctaaccat aaaaaatgaa 60
ctcatcccag taggaaagac tctcgagaac attaaggaaa acggtctcat agatggagat 120
gaacagctaa acgagaatta tcaaaaagca aagataatcg ttgatgattt tctacgagat 180
ttcataaata aagctttaaa taatacccaa ataggaaatt ggagagaatt agcagatgct 240
ttaaataaag aagatgaaga taacatagaa aagctccaag acaaaatcag aggaataatt 300
gtaagtaaat tcgagacatt tgatttgttt tcttcttact cgataaagaa agacgaaaag 360
ataatagatg atgataatga tgttgaagaa gaggagctag atctaggaaa aaaaacttcc 420
tcatttaaat atatttttaa gaaaaacctt tttaaattag tacttccttc ttatttaaag 480
acaacaaatc aggataaact gaaaataatc tcttcttttg ataatttttc tacctatttc 540
agaggattct ttgagaacag aaaaaatatt ttcactaaga agcctatatc tacgtcaatt 600
gcctacagaa ttgtccatga taactttcca aagtttctag ataacatcag atgttttaat 660
gtgtggcaaa cagaatgccc acagttaatt gtaaaggctg ataattattt aaaatcaaag 720
aacgtcatag ctaaagataa atctttagca aactatttta ctgtaggagc atatgattac 780
ttcttatccc agaatggcat tgatttctac aacaacatta tcggcggtct accagcattt 840
gctggtcatg agaaaatcca aggacttaat gaatttataa atcaagaatg ccaaaaggac 900
agcgaactaa aatctaaact gaaaaacaga catgctttca aaatggctgt tctatttaag 960
caaattcttt cagatagaga aaaaagtttt gttatagacg agttcgaatc tgatgctcag 1020
gtcatagatg cggttaagaa cttctatgca gaacaatgta aggataataa tgttattttt 1080
aaccttctaa atcttatcaa gaatatagcg ttcttatctg atgatgaatt agatggaatt 1140
tttatagaag gcaagtattt aagctctgtt tcccaaaagc tatattcaga ttggtcgaag 1200
cttcgaaatg atattgaaga tagtgcaaac agtaaacaag gaaataaaga gttagcaaag 1260
aaaattaaaa caaataaagg cgatgttgaa aaggccataa gtaaatatga gttttcttta 1320
tcagaactta actcaattgt acatgataat acaaaattca gtgaccttct ttcttgtacg 1380
ttacataaag tggctagcga aaaactagtg aaagttaatg aaggggactg gccaaaacac 1440
ctgaaaaata atgaagaaaa acaaaagata aaagagcctt tagatgcatt gttagaaatt 1500
tataatacat tgctgatatt caactgcaag tcatttaata agaacggtaa tttctatgtt 1560
gattatgaca gatgcataaa tgagctttct agtgttgttt atttatataa caaaacaaga 1620
aattactgta caaagaaacc ttataacaca gacaaattca aattaaactt taacagtcct 1680
caattaggag agggctttag taagtcgaaa gaaaatgact gtctgacatt attatttaaa 1740
aaagacgaca attactatgt tggaattatc agaaaagggg caaaaattaa ctttgatgat 1800
acacaagcca ttgcagacaa tacagataac tgtatattta agatgaatta tttcctatta 1860
aaagatgcta aaaagtttat tcctaaatgt tcaattcagt taaaagaagt aaaagcacat 1920
tttaaaaaat cagaggatga ttatatcctg agtgacaaag aaaaatttgc ctctcccctt 1980
gttattaaga aatcaacatt tttattagca acagcacatg taaaaggaaa gaaaggaaac 2040
ataaaaaaat tccaaaagga atattctaag gaaaatccaa cagaatatag aaattctctg 2100
aatgaatgga ttgcattttg taaagaattt ctaaaaacat ataaggcggc aacaatcttt 2160
gacattacaa cgttaaaaaa agctgaagaa tatgctgata ttgttgagtt ttataaggat 2220
gtagataatc tttgttataa actagagttt tgccctatta aaacatcttt cattgagaat 2280
cttattgata atggggactt atatttattc agaatcaata ataaagattt cagttcaaaa 2340
tctactggta caaagaatct tcatacgctc tatcttcagg caatctttga tgaaagaaac 2400
ctcaataatc ctactattat gttaaatggc ggagcagagt tattttatcg aaaagaaagc 2460
attgaacaga aaaataggat aactcataag gcaggatcaa ttcttgtaaa caaggtttgt 2520
aaggatggaa caagtctaga tgacaaaatc agaaacgaaa tatatcaata tgaaaacaag 2580
tttattgata cattgtctga tgaagctaaa aaagttttac ctaatgtaat aaaaaaagaa 2640
gcaactcacg acataacaaa agataagcga tttacatcag ataagttctt tttccattgc 2700
ccattaacaa ttaactataa ggaaggagat acaaaacaat ttaacaatga ggttttatct 2760
ttccttagag gtaatccaga cattaatatc atcggaattg acagaggaga aagaaacctt 2820
atatacgtaa ctgttattaa tcagaaaggc gaaatacttg acagcgtttc gtttaacaca 2880
gtaacaaaca agtcgagcaa aattgaacaa actgttgatt atgaggaaaa gcttgctgtt 2940
agggaaaaag aaagaataga agcaaaaaga tcctgggatt caatatcaaa gatagcaacc 3000
ttaaaagaag gttatctatc agctattgtt catgagatat gcctactgat gatcaaacac 3060
aacgcaatcg ttgtacttga gaatctaaat gcaggattta agagaattag aggaggatta 3120
tcagaaaagt ctgtttatca gaaattcgag aagatgctta ttaacaaact aaattacttt 3180
gtatctaaaa aagaatcaga ctggaataaa cctagtggac ttttaaatgg tttacaactt 3240
tcagaccagt tcgagtcatt tgagaaatta ggaattcaat ctgggttcat cttctatgtt 3300
cctgcagcat atacatctaa gattgatcct acaacaggat ttgcaaatgt tcttaactta 3360
tccaaggtaa gaaatgttga tgcaataaag agttttttca gtaatttcaa tgaaatttca 3420
tatagcaaaa aagaagctct ctttaaattc tcttttgatt tagattcctt atcaaagaag 3480
ggcttcagct catttgtaaa attcagtaaa tctaaatgga atgtatatac atttggagag 3540
agaataataa aaccaaagaa taagcaaggg tatcgtgaag ataagagaat taatttaaca 3600
tttgaaatga aaaaacttct gaatgaatat aaagtaagtt ttgatcttga aaacaactta 3660
attccaaatc taacctctgc aaatctgaaa gataccttct ggaaagaact attctttatt 3720
tttaaaacaa ctctgcagct tagaaacagt gtaacaaatg gcaaagaaga tgtactgatt 3780
tctccagtaa agaacgctaa aggagagttc tttgtatcag gaactcataa caagacatta 3840
cctcaagact gtgatgcaaa tggagcatat catatcgccc taaaaggtct gatgattctt 3900
gaacgtaaca atcttgttag agaagaaaaa gacacaaaga agataatggc aatttctaat 3960
gttgactggt ttgagtatgt tcaaaaaagg agaggtgtcc tgtaa 4005
<210> 23
<211> 3717
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 23
atgaacaact atgatgagtt taccaaactg tacccaatac agaaaacgat aaggttcgaa 60
ttgaagccgc agggaagaac gatggaacac ctcgaaacat tcaacttttt cgaagaggac 120
agggatagag cggagaaata taagatttta aaggaagcaa tcgacgagta tcataagaag 180
tttatagacg aacatctaac aaatatgtct cttgactgga attctttaaa acagatttca 240
gagaaatact ataagagtag agaggaaaaa gacaagaaag tttttctgtc agaacagaaa 300
cgcatgaggc aagagatagt ttctgagttc aaaaaagacg atcggtttaa agatcttttt 360
tcaaaaaaat tgttttctga acttctcaag gaagagattt acaaaaaagg aaaccatcag 420
gaaattgacg cattgaaaag ttttgataaa ttctcaggct attttattgg gttgcatgag 480
aaccgaaaaa atatgtattc tgacggagac gagatcacgg ctatctctaa ccgtattgta 540
aatgagaatt tcccgaagtt cctcgacaac cttcagaaat atcaggaagc tcgtaaaaaa 600
tatccagagt ggatcattaa ggcagaatct gctttagttg cacataatat caagatggat 660
gaagtctttt ccttagagta tttcaacaaa gtcctgaatc aagaaggaat acagagatac 720
aatctcgccc taggtggcta tgtgaccaaa agtggtgaga aaatgatggg gcttaatgat 780
gcacttaatc ttgcccatca aagtgaaaaa agcagcaagg gaaggataca catgactcca 840
ctcttcaaac agattctgag tgaaaaagag tccttttctt atataccaga tgtttttaca 900
gaagactctc aacttttacc atccattggt gggttctttg cacaaataga aaatgataag 960
gacgggaata tttttgacag agcattagaa ttgatatctt cttatgcaga atacgataca 1020
gaaaggatat atatcaggca agcggacata aacagagttt ctaatgttat tttcggggag 1080
tggggaacac tgggggggtt aatgagggaa tacaaagcag actctatcaa cgacatcaat 1140
ttggagagaa catgcaagaa ggtagacaag tggctcgact caaaggagtt tgcgttatca 1200
gatgtattag aggcaataaa aagaaccggc aataatgatg cttttaatga atatatctca 1260
aagatgcgca ctgccaggga aaagattgac gctgcaagaa aggaaatgaa attcatttcg 1320
gaaaaaatat ctggagacga agaatcgatc catattatca aaaccttatt ggactcggtg 1380
caacagtttt tacatttttt caatttattc aaagcgcgtc aggacattcc tcttgatgga 1440
gcattctatg cggagttcga tgaagtccat agcaaactgt ttgctattgt tccgttgtat 1500
aataaggtta ggaactatct tacgaaaaat aaccttaaca cgaaaaagat aaagctaaac 1560
ttcaagaatc caactctggc aaacggatgg gatcaaaaca aggtatatga ctacgcctcc 1620
ttaatctttc tccgcgatgg taattattat ctcggaataa taaatccaaa aaggaaaaag 1680
aatattaaat tcgaacaagg gtctggaaat ggcccattct accggaagat ggtgtacaaa 1740
caaattccag ggccgaacaa gaacttacca agagtcttcc tcacatctac gaaaggcaaa 1800
aaagagtaca agccgtcaaa ggagataata gaaggatatg aagcggacaa acacataaga 1860
ggagataaat tcgatctgga tttctgtcat aagctgatag acttcttcaa ggaatccatc 1920
gagaagcaca aggactggag taagttcaac ttctatttct ctccaactga atcatatgga 1980
gacatcagcg aattctatct ggatgtagaa aaacagggat accggatgca ttttgagaat 2040
atttctgccg agacgattga tgagtatgtc gaaaaggggg acttattcct cttccagata 2100
tacaacaaag actttgtgaa agcggcaacc ggaaaaaaag atatgcacac catttattgg 2160
aacgcggcat tctcgcccga gaaccttcag gatgtggtag tgaaactgaa cggtgaagca 2220
gaacttttct acagagacaa gagcgacatc aaggagatag ttcacaggga gggagagata 2280
ctggtcaatc gtacctacaa cggcaggaca cctgtgcctg acaagatcca caaaaaatta 2340
acagattatc ataatggccg taccaaagat ctcggagaag caaaagaata cctcgataag 2400
gtcagatatt tcaaagcgca ctacgacatc acaaaggatc gcagatacct gaatgataaa 2460
atatacttcc atgtgcctct gacattgaat ttcaaagcaa acgggaagaa gaatctcaat 2520
aagatggtaa ttgaaaagtt cctctcggac gaaaaagcgc atattattgg gattgatcgc 2580
ggggaaagga atcttcttta ctattctatc attgacaggt caggtaaaat aatcgatcaa 2640
cagagcctca acgtcatcga tggattcgat taccgagaga aactgaatca gagggagatc 2700
gagatgaagg atgccagaca aagctggaat gctatcggga agataaagga cctcaaggaa 2760
gggtatcttt caaaagcggt ccacgaaatt accaagatgg cgatacaata caatgccatt 2820
gttgtcatgg aggaactcaa ttatgggttc aaacgcggac gtttcaaagt tgagaagcag 2880
atatatcaga aattcgagaa tatgctgatt gacaagatga attatctggt attcaaggat 2940
gctccggatg aaagtccggg aggagtcctc aatgcatatc agcttactaa tccgcttgaa 3000
agtttcgcta aacttgggaa acagacagga attcttttct atgttccggc agcctatact 3060
tcgaagatag atccgacgac cgggtttgtc aatcttttca atacttcaag taaaacgaac 3120
gcacaggaaa gaaaagaatt cttgcaaaaa ttcgagtcga tctcctattc cgctaaagac 3180
ggaggaatat tcgcattcgc gttcgattat cggaagttcg gaacgtcaaa aacagaccac 3240
aaaaatgtat ggaccgcata cacgaacggg gaaaggatga ggtacataaa agagaaaaaa 3300
cgcaacgaac tgttcgaccc ctcgaaggag atcaaagagg ctctcacttc atcaggaatc 3360
aaatatgacg gcggacagaa catattgcca gatatcctga ggagcaacaa taacggtctg 3420
atctacacaa tgtattcctc tttcatagcg gccattcaaa tgagggtcta tgacgggaaa 3480
gaagactata tcatctcgcc gataaagaac agcaagggag agttcttcag gaccgatccg 3540
aaaagaaggg aacttccgat agacgcggat gcgaacggcg cgtataacat tgctctcagg 3600
ggcgaattga cgatgcgtgc gatagcggag aagttcgatc cggactcgga aaagatggcg 3660
aagctagaac tgaaacataa ggactggttc gaattcatgc agacaagggg ggattga 3717
<210> 24
<211> 3897
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 24
atgacaaaaa catttgattc agaatttttt aatttatatt ctcttcaaaa aacagttcgt 60
tttgaactca agccggttgg tgaaacagcc tcgtttgttg aagattttaa aaacgaaggt 120
ttgaaacgag ttgtttcaga ggatgaacgg cgtgcggttg attaccaaaa agtgaaagaa 180
attattgatg actaccaccg agattttatt gaagaatcgc tgaactattt tcctgagcag 240
gtctcaaaag acgctttgga acaagctttt cacctttatc aaaaactaaa agccgctaag 300
gttgaagagc gtgaaaaagc attgaaagaa tgggaagccc ttcagaaaaa actgcgcgaa 360
aaagttgtta aatgtttttc agattcaaac aaagcacgct tttcccgcat tgataaaaaa 420
gaactgatta aagaagattt aattaactgg ttggttgcac aaaatcgcga agatgacatt 480
ccaaccgttg aaacctttaa caactttacg acttatttta cggggtttca tgaaaaccga 540
aaaaacattt attcaaaaga cgatcatgcc acagccattt catttcgact cattcatgaa 600
aacctgccta agttttttga taatgtgatc agctttaata aattgaagga aggatttcca 660
gagctgaaat ttgataaggt taaggaagat ttagaagttg attatgactt gaaacatgcc 720
tttgaaatcg aatactttgt caattttgtt acccaagccg gaattgacca atataactat 780
cttttggggg gtaaaacctt agaagacggc accaaaaagc aaggcatgaa tgaacaaatc 840
aatctgttca agcaacagca aacccgagac aaagcccgac aaattcccaa actcatacca 900
ttgtttaaac aaattctaag cgaacgaacg gaaagccaat cgtttattcc aaaacaattt 960
gaatcagacc aagagctatt tgactcactg caaaaactgc ataacaactg ccaagataaa 1020
tttaccgtac tgcaacaagc cattttaggc ttagccgaag cagatctgaa aaaagtattc 1080
attaaaacat ctgatcttaa tgcgctatca aataccattt ttggaaatta cagtgtgttt 1140
tcggatgcgt tgaatttata caaagaatcg ctcaaaacaa aaaaggcgca agaagcgttt 1200
gaaaaactac ccgctcacag cattcatgac ttgattcaat atttggagca atttaatagc 1260
tctttggatg cagaaaaaca gcaatcaact gacaccgtac tgaattactt tattaaaaca 1320
gacgagctgt attctcggtt cataaaatca acgagcgaag ccttcacaca agtacaacca 1380
ctctttgaat tggaagcatt aagctcaaaa cgtcgtccac cggaaagtga agacgaaggc 1440
gcaaaaggtc aggaagggtt tgagcaaatt aaacgcataa aagcctattt ggataccttg 1500
atggaggcgg tgcattttgc aaaaccactt tatctggtga aggggcgcaa aatgattgaa 1560
ggtctggaca aagaccaaag tttctatgaa gcctttgaaa tggcttacca agaactagaa 1620
agtctgatta ttccaatcta caacaaagct cgtagttatt taagtcgtaa accgtttaaa 1680
gcggacaaat tcaaaattaa ttttgataat aatacattgc tttccggttg ggatgctaat 1740
aaagaaacgg ctaacgcttc aattttgttt aagaaggatg gtttgtatta tttaggaatc 1800
atgcctaaag gaaaaacgtt tttgttcgat tacttcgttt catcggaaga ttctgaaaag 1860
ttaaaacaaa gaagacaaaa aaccgccgaa gaagcgcttg cgcaagatgg cgaaagctac 1920
tttgaaaaaa ttcgttacaa gctgttacct ggcgccagca aaatgttgcc gaaagtattt 1980
ttttccaaca aaaacatagg gttttacaac ccaagtgatg acatacttcg tatcaggaat 2040
acagcctctc acactaaaaa cggaacaccg caaaaagggc actctaaagt agagtttaat 2100
ttgaatgatt gtcataagat gattgatttc tttaaatcaa gcattcaaaa gcatccagag 2160
tggggaagtt ttggattcac cttttcagat acatcagatt ttgaagatat gagcgccttt 2220
tatcgagaag tcgaaaacca aggttatgtc attagtttcg ataaaataaa agaaacttac 2280
attcagagtc aagttgaaca ggggaaccta tatttattcc aaatctacaa taaagacttc 2340
tcgccctaca gcaaaggcaa accaaattta cacacgcttt actggaaagc gttgtttgag 2400
gaagccaacc taaataatgt ggtggcaaaa ctcaatggtg aagctgaaat tttctttagg 2460
cgacactcaa tcaaagcatc tgataaagtg gtgcacccag cgaatcaagc cattgacaat 2520
aaaaacccgc ataccgaaaa aacgcaaagc acctttgaat atgatcttgt aaaagacaag 2580
cgctataccc aagacaaatt cttcttccat gtaccgattt cattgaactt taaggcacaa 2640
ggtgtttcaa aatttaacga taaagtgaat ggatttttaa agggtaaccc agatgtcaat 2700
attattggca ttgaccgagg cgaacgacac cttctgtatt tcactgtggt gaatcagaaa 2760
ggtgaaattt tggttcaaga gtcgcttaat accctaatga gtgataaagg gcatgtgaat 2820
gactaccagc aaaaactcga caaaaaagaa caagaacgcg atgccgctcg caaaagctgg 2880
acgacggttg aaaatatcaa agaattaaaa gaaggctatt tatctcatgt tgttcataag 2940
ttggcacacc tgattattaa atacaatgcc attgtttgct tggaagacct gaattttggt 3000
ttcaaacgcg ggcgttttaa agtggaaaaa caagtttatc agaaatttga aaaagcgctt 3060
attgataagc ttaactactt ggtatttaaa gaaaaagagt taggcgaggt gggccattat 3120
ctaaccgcct atcagttgac cgcaccgttt gaaagtttca agaagttagg caagcaaagt 3180
ggcatattgt tttatgttcc ggcggattac acctccaaaa ttgacccaac caccgggttt 3240
gtcaactttc ttgatctgcg ttatcagagt gtcgaaaaag ccaaacagct cttaagcgac 3300
tttaatgcca ttcgttttaa ttcagtacaa aactattttg agttcgaaat agattacaaa 3360
aaactcacac ccaaacgtaa agttggtact cagagtaaat gggtgatttg tacctatgga 3420
gatgtccgct atcaaaatcg gcgtaatcaa aaaggtcact gggaaacgga agaagtcaat 3480
gtgactgaaa aactaaaagc ccttttcgcc agtgattcca aaactacaac cgtaatcgat 3540
tacgccaatg acgacaacct aattgacgtc attctggaac aggacaaagc cagcttcttc 3600
aaagaactgt tatggttatt aaaactcacc atgacgctcc gccacagcaa aatcaaaagt 3660
gaagacgact ttattctttc acccgttaaa aacgaacaag gcgagtttta cgatagtcga 3720
aaagcgggcg aggtgtggcc taaagatgca gacgccaatg gcgcttatca catagcgttg 3780
aaaggcttgt ggaatctgca acagatcaat cagtgggaaa agggtaaaac acttaatctg 3840
gcgattaaaa accaggattg gttcagtttt attcaagaaa agccctatca agaataa 3897
<210> 25
<211> 3708
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 25
atgcacacag gcggattact tagcatggat gccaaggagt ttaccggaca gtaccccctt 60
tcgaagactc tgcgttttga actgagaccg ataggcagaa cgtgggacaa tctcgaagca 120
tcggggtatc ttgcggagga cagacaccgt gcagaatgct atcccagggc aaaagagctc 180
ttggacgaca accatcgtgc attcctcaac cgtgtcctgc ctcagatcga tatggattgg 240
cacccgatcg cagaggcatt ctgcaaagtc cacaagaatc cgggaaacaa ggaattggct 300
caggattaca atcttcagct gtccaaacgc agaaaggaga tttcggccta tctgcaggat 360
gcggacggct ataaaggtct gtttgccaaa cctgcattgg atgaagcaat gaagatcgcg 420
aaagaaaacg gaaatgaatc ggacatagag gttcttgagg cattcaacgg tttctccgta 480
tacttcaccg gatatcatga gagcagggag aacatctatt cggacgagga tatggtgtcg 540
gtagcttatc gcatcaccga agacaatttc ccgagattcg tttccaatgc gcttatattc 600
gataagctga atgagtcgca ccccgatata atctcggaag tatccggaaa tctgggcgta 660
gacgacatcg gaaaatattt tgatgtgtct aactacaata atttcctgtc gcaggccggt 720
atagatgact acaatcacat catcggcggc catacgacgg aggacggtct gatccaggca 780
ttcaatgttg ttctgaatct caggcatcag aaagaccccg gattcgaaaa aatccaattc 840
aaacagctgt acaaacagat actcagcgtc cgtacatcca aatcctatat cccgaaacag 900
ttcgataatt cgaaggagat ggtggactgc atctgcgact atgtgtccaa gatcgaaaaa 960
tccgaaacgg tcgagagagc attgaagctg gtaaggaaca tatcttcttt tgatttgcgc 1020
ggaatattcg taaacaagaa gaatctccgc attctttcca acaaactgat tggtgattgg 1080
gacgcgatcg aaaccgcgct gatgcactcc tcctcttcgg aaaatgataa gaaatccgtc 1140
tacgacagcg ccgaggcatt tacgctggat gatatctttt cgtccgttaa aaaattctca 1200
gatgcatctg cagaggatat cggaaaccgg gcggaggaca tatgcagagt catatctgag 1260
accgctccgt tcataaacga tctgagggct gtcgatttgg acagtttgaa tgacgacggt 1320
tacgaggcgg cggtttccaa gataagggaa tctctggaac catatatgga tctgtttcat 1380
gaactggaga tattctccgt aggcgatgaa ttcccgaaat gtgcagcttt ctacagtgaa 1440
cttgaagaag tctccgaaca gctaatcgag attataccgt tattcaacaa ggcccgttcg 1500
ttctgtacgc gcaagagata cagtacggac aagataaagg tcaatttgaa attcccgaca 1560
ctcgccgacg gatgggatct caacaaagaa cgcgacaaca aagccgcaat actcaggaaa 1620
gacggaaagt actacctggc catactggat atgaagaaag atctttcttc gatcagaact 1680
tcggatgaag acgaatccag ttttgagaaa atggagtaca agcttcttcc gagtccggta 1740
aagatgctgc caaagatctt cgtaaaatcg aaggcggcca aggagaagta cggtctgacc 1800
gaccgtatgc tggagtgcta cgataaaggg atgcacaaga gcggcagtgc attcgatctc 1860
ggattttgtc acgaattgat cgattactac aagaggtgca tcgcagaata tcccggctgg 1920
gacgtcttcg atttcaagtt cagggaaaca tcggattatg gcagcatgaa ggagttcaat 1980
gaggatgttg caggggccgg atactatatg tccctcagaa agatcccttg ttcggaggtc 2040
tacaggcttc ttgatgagaa atcgatatat cttttccaga tctacaacaa agattattcg 2100
gaaaacgctc atgggaataa gaacatgcat accatgtatt gggaagggct cttttccccc 2160
cagaatctgg aatcccctgt gtttaaactc agcggcggtg cggagctttt cttccgtaaa 2220
tcctccatac ccaatgacgc caaaacggtc catccgaagg gaagcgtcct ggttccgcgc 2280
aatgatgtaa acggccgcag gatacctgac agcatatatc gggagctcac cagatatttc 2340
aaccgcggag attgccgcat aagcgacgag gcaaagagtt atctggacaa ggtgaaaacc 2400
aagaaagctg accacgatat cgtgaaagac aggaggttca cggtggacaa gatgatgttc 2460
cacgtcccta tcgccatgaa tttcaaagcg atttcgaagc cgaatctcaa taaaaaggtg 2520
attgacggca taatcgacga ccaagatctg aagatcatcg gcatagaccg cggagagcgc 2580
aacctcatct acgtaaccat ggtggatcgc aaagggaaca tcctctatca ggatagcctc 2640
aatattctga acggatacga ttaccgtaag gccctcgacg tccgcgaata tgacaataaa 2700
gaggctcgga ggaactggac gaaggtcgaa ggcatccgta agatgaaaga ggggtatctg 2760
tcgcttgcag tcagcaaatt ggcagatatg atcatagaga acaatgcgat tatcgtcatg 2820
gaggatctca atcacggatt caaggcaggg cgttcgaaga tagagaaaca ggtctatcag 2880
aagttcgaat ccatgctcat aaacaaactc ggttacatgg tcctcaagga taagtctatc 2940
gatcagagcg gcggagctct ccacggatac cagcttgcca accatgtgac aacattggca 3000
tctgtaggta aacaatgtgg agtgatattc tacatccctg ctgcatttac atccaagata 3060
gatccgacaa caggatttgc agatctgttc gccctcagca atgttaaaaa cgtggcatct 3120
atgagagaat ttttctccaa gatgaagtct gtaatctatg ataaggcgga gggaaaattc 3180
gcatttacct tcgactatct tgattataat gtgaaatccg agtgcggaag gaccctttgg 3240
accgtgtata cggtcggaga gagattcaca tacagcaggg tcaatagaga atatgtcaga 3300
aaagttccga cagacataat ctacgacgca ttgcaaaagg caggaatatc tgttgaaggg 3360
gatctcaggg acaggattgc tgaatcggat ggcgacactc tgaagagcat attctatgca 3420
ttcaagtatg cattggatat gagagtagag aaccgcgaag aggattacat acagtctcct 3480
gtcaaaaatg cctccggaga attcttctgt tccaagaacg caggcaaatc gctccctcag 3540
gattccgatg cgaacggtgc atacaatatc gcactcaagg ggatcctgca gctacgtatg 3600
ctttccgagc agtatgatcc gaatgcagag agcatacggt tgccactgat aaccaacaag 3660
gcctggctga cctttatgca gtccggtatg aagacatgga agaactga 3708
<210> 26
<211> 3783
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 26
atggatagtt tgaaagattt caccaatctg taccctgtca gtaagacatt gagatttgaa 60
ttaaagcccg ttggaaagac tttagaaaat atcgagaaag caggtatttt gaaagaggat 120
gagcatcgtg cagaaagtta tcggagggtg aagaaaataa ttgatactta tcataaggta 180
tttatcgatt cttctcttga aaatatggct aaaatgggta ttgagaatga aataaaagca 240
atgctccaaa gtttctgcga attgtataaa aaagatcatc gcactgaggg tgaagacaag 300
gcattagata aaattcgagc agtacttcgt ggcctgattg ttggggcttt cactggtgtt 360
tgcggaagac gggaaaatac agtccaaaac gagaagtacg agagtttgtt caaagaaaag 420
ttgataaaag aaattttacc tgattttgtg ctctctactg aggctgaaag cttgcctttc 480
tctgttgaag aagctacgag gtcactgaag gagtttgata gctttacatc ctactttgct 540
ggtttttacg agaatagaaa gaatatatac tcgacgaaac ctcaatccac tgccattgct 600
tatcgtctta ttcatgagaa cttgccgaag ttcattgata atattcttgt ttttcagaag 660
atcaaagagc ctatagccaa agagctggaa catattcgtg cggacttttc tgccgggggg 720
tacataaaaa aggatgagag attggaggat attttttcgt tgaactatta tatccacgtg 780
ttatctcagg ctgggatcga aaaatataac gcattgattg ggaagattgt gacagaagga 840
gatggagaga tgaaagggct caatgaacac atcaaccttt acaaccaaca aagaggcaga 900
gaggatcggc tccctctttt taggcctctt tataaacaga tattgagtga cagagagcaa 960
ttatcatact tgcctgagag ttttgaaaaa gatgaggagc tcctcagggc tctaaaagag 1020
ttctatgatc atatcgcaga agacattctc ggacgtactc aacagttgat gacttctatt 1080
tcagaatatg atttatctcg gatatacgta aggaacgata gccaattgac tgatatatca 1140
aaaaaaatgt tgggagattg gaatgctatc tacatggcta gagaacgagc atatgaccac 1200
gagcaggctc ccaaaagaat cacggcgaaa tacgagaggg acaggattaa agctcttaaa 1260
ggagaagaga gtataagtct ggcaaatctt aatagttgta ttgcctttct ggacaatgtt 1320
agagattgcc gtgtagatac ttatctttcc acactgggcc agaaggaagg accacatggt 1380
ctatctaatc tcgttgagaa cgtttttgcc tcataccatg aagcagagca attgttgagc 1440
tttccatacc ccgaagagaa taatctgatt caggacaagg acaatgtggt gttaattaag 1500
aatcttctcg acaatatcag tgatctgcag aggttcttga aacctctttg gggtatggga 1560
gacgaacccg ataaagatga aagattttat ggagagtata attatatccg aggagctcta 1620
gatcaggtga tccctctgta caataaggta aggaactacc tcactcggaa gccttattcg 1680
accagaaaag taaaactcaa ttttgggaat tctcaattgc ttagtggttg ggatagaaat 1740
aaggaaaagg ataatagctg tgtgattttg cgtaaggggc agaacttcta tttggctatt 1800
atgaacaata ggcacaaaag aagtttcgaa aacaaggtgt tgcccgagta taaggaggga 1860
gaaccttact tcgaaaagat ggattataaa tttttgcctg atcctaataa aatgcttcct 1920
aaggtttttc tttcgaaaaa aggaatagag atatacaaac caagtccgaa gcttttagaa 1980
caatatggac atggaactca caaaaaggga gataccttta gtatggatga tttgcacgaa 2040
ctgatcgatt tcttcaaaca ctcaatcgag gctcatgaag attggaagca attcggattc 2100
aaattttctg atacggctac ttatgagaat gtatctagtt tctatagaga agttgaggat 2160
caggggtata agctctcttt ccgaaaagtt tcggaatctt atgtctattc attaatagat 2220
caaggcaagt tgtatttatt tcagatatac aacaaggact tttctccctg cagcaaaggg 2280
acacctaatc tgcatacctt gtattggaga atgctttttg acgagcgcaa tttggcagat 2340
gtcatataca aactggatgg gaaggctgaa atctttttcc gagagaagag tttgaaaaat 2400
gatcatccca cgcatccggc tggtaagcct atcaaaaaga aaagtcgaca aaaaaaagga 2460
gaggagagtc tgtttgagta tgatttagtc aaggataggc actatacgat ggataagttc 2520
cagtttcatg tgcctattac tatgaatttt aaatgttctg caggaagcaa agtcaatgat 2580
atggttaatg ctcatattcg agaggcaaag gatatgcatg tcattggaat tgatcgtgga 2640
gaacgcaatc tgctgtatat atgcgtgata gatagtcgag ggacgatttt ggatcaaatt 2700
tctctgaata cgattaacga tatagactat catgatttat tggagagtcg agacaaagac 2760
cgtcagcagg agcgccgaaa ctggcaaact atcgaaggga tcaaggagct aaaacaaggc 2820
taccttagtc aggcggttca tcggatagcc gaactgatgg tggcttataa ggctgtagtt 2880
gctttggagg atttgaatat ggggttcaaa cgtgggcggc agaaagtaga aagttctgtt 2940
tatcagcagt ttgagaaaca gctgatagat aagctcaact atcttgtgga caagaagaaa 3000
aggcctgaag atattggagg attgttgaga gcctatcaat ttacggcccc atttaagagt 3060
tttaaggaaa tgggaaagca aaacggcttc ttgttttata tcccggcttg gaacacgagc 3120
aacatagatc cgactactgg atttgttaat ttatttcatg cccagtatga aaatgtagat 3180
aaagcgaaga gcttctttca aaagtttgat tcaattagtt acaacccgaa gaaagactgg 3240
tttgagtttg cattcgatta taaaaacttt actaaaaagg ctgaaggaag tcgttctatg 3300
tggatattat gcacacatgg ttcccgaata aagaatttta gaaattccca gaagaatggt 3360
caatgggatt ccgaagaatt cgccttgacg gaggctttta agtctctttt tgtgcgatat 3420
gagatagatt ataccgctga tttgaaaaca gctattgtgg acgaaaagca aaaagacttc 3480
ttcgtggatc ttctgaagct attcaaattg acagtacaga tgcgcaacag ctggaaagag 3540
aaggatttgg attatctaat ctctcctgta gcaggggctg atggccgttt cttcgataca 3600
agagagggaa ataaaagtct gcctaaggat gcagatgcca atggagctta taatattgcc 3660
ctaaaaggac tttgggctct acgccagatt cggcaaactt cagaaggcgg taaactcaaa 3720
ttggcgattt ccaataagga atggctacag tttgtgcaag agagatctta cgagaaagac 3780
tga 3783
<210> 27
<211> 3792
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 27
atgaataatg gaacaaataa ctttcagaat tttatcggaa tttcttcttt gcagaagact 60
cttaggaatg ctctcattcc aaccgaaaca acacagcaat ttattgttaa aaacggaata 120
attaaagaag atgagctaag aggagaaaat cgtcagatac ttaaagatat catggatgat 180
tattacagag gtttcatttc agaaacttta tcgtcaattg atgatattga ctggacttct 240
ttatttgaga aaatggaaat tcagttaaaa aatggagata acaaagacac tcttataaaa 300
gaacagactg aataccgtaa ggcaattcat aaaaaatttg caaatgatga tagatttaaa 360
aatatgttca gtgcaaaatt aatctcagat attcttcctg aatttgtcat tcataacaat 420
aattattctg catcagaaaa ggaagaaaaa acacaggtaa ttaaattatt ttccagattt 480
gcaacgtcat tcaaggacta ttttaaaaac agggctaatt gtttttcggc tgatgatata 540
tcttcatctt cttgtcatag aatagttaat gataatgcag agatattttt tagtaatgca 600
ttggtgtata ggagaattgt aaaaagtctt tcaaatgatg atataaataa aatatccgga 660
gatatgaagg attcattaaa ggaaatgtct ctggaagaaa tttattctta tgaaaaatat 720
ggggaattta ttacacagga aggtatatct ttttataatg atatatgtgg taaagtaaat 780
tcatttatga atttatattg ccagaaaaat aaagaaaaca aaaatctcta taagctgcaa 840
aagcttcata aacagatact gtgcatagca gatacttctt atgaggtgcc gtataaattt 900
gaatcagatg aagaggttta tcaatcagtg aatggatttt tggacaatat tagttcgaaa 960
catatcgttg aaagattgcg taagattgga gacaactata acggctacaa tcttgataag 1020
atttatattg ttagtaaatt ctatgaatca gtttcacaaa agacatatag agattgggaa 1080
acaataaata ctgcattaga aattcattac aacaatatat tacccggaaa tggtaaatct 1140
aaagctgaca aggtaaaaaa agcggtaaag aatgatctgc aaaaaagcat tactgaaatc 1200
aatgagcttg ttagcaatta taaattatgt tcggatgata atattaaagc tgagacatat 1260
atacatgaaa tatcacatat tttgaataat tttgaagcac aggagcttaa gtataatcct 1320
gaaattcatc tggtggaaag tgaattgaaa gcatctgaat taaaaaatgt tctcgatgta 1380
ataatgaatg cttttcattg gtgttcggtt ttcatgacag aggagctggt agataaagat 1440
aataattttt atgccgagtt agaagagata tatgacgaaa tatatccggt aatttcattg 1500
tataatcttg tgcgtaatta tgtaacgcag aagccatata gtacaaaaaa aattaaattg 1560
aattttggta ttcctacact agcggatgga tggagtaaaa gtaaagaata tagtaataat 1620
gcaattattc tcatgcgtga taatttgtac tatttaggaa tatttaatgc aaaaaataag 1680
cctgacaaaa agataattga aggtaataca tcagaaaata aaggggatta taagaagatg 1740
atttataatc ttctgccagg accaaataaa atgatcccca aggtattcct ctcttcaaaa 1800
accggagtgg aaacatataa gccgtctgcc tatatattgg agggctataa acaaaacaag 1860
catattaaat cctctaagga ttttgatata acattttgtc acgatttgat tgattatttt 1920
aagaactgta tagcaataca tcctgaatgg aagaattttg gctttgattt ttctgacacc 1980
tccacatatg aagatatcag cggattttac agagaagtcg aattacaagg ttataaaatc 2040
gactggacat atatcagcga aaaggatatt gatttgttgc aggaaaaagg acagttatat 2100
ttattccaaa tatataacaa agatttttcc aagaaaagta ccggaaatga taatcttcat 2160
actatgtatt tgaagaattt gtttagtgaa gagaatttaa aggatattgt actgaaatta 2220
aacggtgagg cggaaatctt ctttagaaaa tcaagcataa agaatccaat aattcataaa 2280
aaaggctcta ttcttgttaa tagaacatat gaagcagagg aaaaagatca atttggaaat 2340
atccagatag tcagaaaaaa cataccggaa aatatatatc aggagcttta taaatatttc 2400
aatgataaaa gtgataaaga actttcggat gaagcagcta agcttaagaa tgtagtaggt 2460
catcatgagg ctgctacaaa catagtaaaa gattatagat atacatatga taaatatttt 2520
cttcatatgc ctattacaat caattttaaa gccaataaga caggctttat taatgacaga 2580
atattacaat atattgctaa agaaaaggat ttgcatgtaa taggcattga tcgtggtgaa 2640
agaaacctga tatatgtttc agtaattgat acttgtggaa atattgttga acaaaaatcg 2700
tttaacattg ttaatggata tgattatcag attaagctca agcagcagga gggggcgcga 2760
caaatcgcac gaaaagaatg gaaagaaatc ggcaaaataa aagaaattaa agaaggctat 2820
ttatctcttg taattcatga aatttcaaag atggttatta aatataatgc cataattgca 2880
atggaggatt taagctacgg atttaaaaaa ggtcgtttca aggttgagcg acaggtttac 2940
cagaagtttg agacaatgct tatcaacaaa ctcaactatc tggtatttaa agatatatcc 3000
ataacggaaa acggtggtct tctaaaggga taccagctta catatattcc agataaactg 3060
aaaaatgtgg gtcatcaatg tggctgtata ttttatgtac ctgctgccta tacatcaaaa 3120
atagatccta caaccggatt tgtaaatata ttcaaattta aagatttaac agttgatgcg 3180
aagagagaat ttataaaaaa atttgacagt atcagatatg attcagaaaa aaatctgttt 3240
tgttttacat tcgattataa taactttatt acgcaaaata ctgttatgtc aaagtcaagc 3300
tggagtgtat atacgtacgg agttaggata aaaagaagat ttgtcaatgg caggttctca 3360
aatgaatcgg atacaattga tataacaaaa gatatggaaa aaacactcga aatgacagat 3420
ataaattgga gagatggtca tgatctgagg caggatatta ttgattatga aatcgtacaa 3480
cacatatttg agatttttag attgactgta caaatgagaa acagtttaag tgaattagaa 3540
gacagggatt atgaccgttt gatttctccg gtgctcaatg aaaataatat attttatgat 3600
tcagctaaag caggagatgc gttacctaaa gacgcagatg ctaatggtgc atattgtata 3660
gctctaaaag gcttgtatga aatcaaacaa attacagaga attggaaaga agacggtaag 3720
ttttcaagag ataaacttaa aatttccaat aaggactggt ttgactttat tcaaaataaa 3780
aggtatttat aa 3792
<210> 28
<211> 3957
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 28
atgacaaaca aatttacaaa ccagtactcg ctttccaaaa cacttcgatt tgagttgatt 60
ccacaaggaa aaacattgga atttattcaa gaaaaaggat tgctctctca agataaacaa 120
cgagcggaga gttatcaaga aatgaaaaaa actattgata aatttcataa atactttatc 180
gatttagctt taagcaatgc taaactaact catttagaaa cttacttgga attatacaat 240
aaaagtgctg aaacaaaaaa agaacaaaaa tttaaagacg atttaaagaa agtacaagac 300
aatttacgaa aagaaatcgt taaatctttt tcagatggtg atgcaaaatc aatttttgca 360
attttggata aaaaagaact gattaccgta gaacttgaaa aatggtttga aaacaacgaa 420
caaaaagaca tttattttga cgaaaaattc aaaacgttta ctacttattt tactggtttt 480
catcaaaaca gaaaaaacat gtattcggtt gaacccaatt ctacagcaat tgcttatcga 540
ttgattcatg aaaatttacc taaattttta gaaaatgcta aagcatttga aaaaataaaa 600
caagtagaaa gtttgcaagt taattttaga gaattaatgg gggaatttgg agatgaaggg 660
ctaattttcg taaatgaatt agaagaaatg tttcaaatca attattataa tgatgtgctt 720
tcacaaaatg gaattacaat ttataatagt ataatttcag gatttaccaa aaatgatata 780
aaatataaag gtctaaatga atacataaat aattacaatc aaaccaaaga caaaaaagac 840
cgtttgccaa aattaaaaca attgtataaa cagattttga gtgataggat ttcactttcg 900
tttttgcccg atgcttttac ggatgggaaa caagttttga aagccatatt tgacttttat 960
aaaatcaact tactttctta taccattgaa ggacaggaag aaagccaaaa tcttttacta 1020
ttaattcgtc agacaattga aaacctttct agttttgata cccaaaaaat ttatctaaaa 1080
aatgataccc atttaaccac tatttcacaa caagtatttg gcgatttttc ggtgttttca 1140
actgctttaa attattggta tgaaactaaa gtaaatccaa aatttgaaac ggaatatagc 1200
aaagccaacg aaaaaaaacg agaaatttta gataaagcca aagcggtatt tacaaaacaa 1260
gattattttt caattgcttt tttacaagaa gtactttcgg aatacattct taccttagat 1320
cacacttctg atattgtaaa aaagcattcc tccaactgta ttgcggatta ttttaaaaat 1380
cattttgtag ccaaaaaaga aaatgaaacc gacaaaacct ttgattttat tgctaatatt 1440
actgcaaaat accaatgtat tcaaggtatt ttagaaaatg cagaccaata cgaagacgaa 1500
ctcaaacaag accaaaaatt aattgataat ttgaaattct ttttagatgc tattttagaa 1560
ttgttgcatt ttattaaacc tttgcattta aaatcagaaa gcattaccga aaaagacact 1620
gctttttatg atgtgtttga aaattattac gaagcattga gtttgttgac cccattatat 1680
aatatggtgc gaaactatgt aacgcaaaag ccgtacagca ccgaaaaaat aaaattaaat 1740
tttgaaaatg cacaattatt gaatggttgg gatgccaata aagaaggtga ttacctaact 1800
accattttga aaaaagacgg taattatttt ttagccataa tggataaaaa gcataacaaa 1860
gcgtttcaaa agtttccaga aggaaaagaa aattatgaaa aaatggtgta taaactattg 1920
cctggagtaa ataagatgtt gccaaaagta tttttttcca ataaaaatat tgcttacttc 1980
aacccatcaa aagagttatt agaaaactat aaaaaagaga cgcacaaaaa aggagacaca 2040
ttcaatttag aacattgtca tacgttgatc gattttttca aggactcttt aaacaaacat 2100
gaagactgga aatactttga ttttcaattt tctgaaacaa aatcgtatca agatttgagt 2160
ggtttttata gagaagtaga acatcaaggc tacaaaatca attttaaaaa tatcgattca 2220
gaatatattg atggtttggt gaacgaaggt aaattgtttc tatttcaaat ttacagcaaa 2280
gatttttcgc ctttttccaa agggaaaccg aacatgcaca ctttgtattg gaaagcctta 2340
tttgaagaac aaaatttgca aaatgtaatc tataaattga atggacaagc cgaaatattt 2400
tttagaaaag cctctataaa acctaaaaat ataatattgc acaaaaagaa aattaaaatt 2460
gccaaaaagc attttattga taaaaaaaca aaaacatctg aaattgttcc tgttcaaaca 2520
ataaaaaacc tcaatatgta ctaccaagga aaaataagtg aaaaagaatt aacacaagat 2580
gatttaaggt atattgataa ttttagcatt ttcaatgaaa aaaataaaac aattgatatt 2640
ataaaagaca aacgatttac ggttgataaa tttcagtttc atgtgccgat taccatgaac 2700
tttaaagcaa cgggcggaag ttatatcaat caaaccgtat tagaatattt gcaaaacaat 2760
cccgaagtta agattattgg attggataga ggcgaacgcc atttggtata tctgacactg 2820
atagaccagc aaggaaacat cttgaaacaa gaaagtttga atacaatcac cgattctaaa 2880
atctcgacac cttatcataa gttgttggat aacaaggaaa acgagcgtga cttggctcga 2940
aaaaattggg gaacggtgga aaacatcaaa gaactcaaag aaggctacat cagtcaagtg 3000
gtgcataaaa ttgctacgtt gatgctggaa gaaaatgcca ttgtggtaat ggaagatttg 3060
aattttggat ttaaacgtgg acgttttaaa gtggaaaaac aaatttatca aaagctggaa 3120
aaaatgttga ttgacaaatt gaattatttg gttttaaaag acaaacaacc tcaggaatta 3180
ggcggattgt acaacgcatt acaactcacc aataaatttg aaagtttcca aaaaatgggt 3240
aaacaatcgg gctttttgtt ttatgtaccc gcttggaaca cctccaaaat agacccaacc 3300
acagggtttg tcaattattt ttataccaaa tatgaaaatg ttgacaaagc caaagccttt 3360
tttgaaaaat ttgaggcgat tcgtttcaat gcagaaaaga agtattttga atttgaagta 3420
aaaaaatata gcgattttaa cccaaaagcc gaaggcactc aacaagcctg gaccatttgc 3480
acgtatggcg aacgaataga aaccaaacga caaaaagacc aaaacaacaa atttgtaagc 3540
actccaatta atctaaccga aaagatagaa gactttttgg gtaaaaacca aattgtttat 3600
ggtgatggta attgcatcaa atctcaaatt gctagcaaag acgacaaggc tttttttgaa 3660
accttattgt attggttcaa aatgacttta caaatgcgaa acagcgaaac aagaacagat 3720
atagattatc taatttcgcc cgtgatgaat gacaacggaa cattttacaa cagccgagat 3780
tatgaaaaat tagaaaatcc aactttgccc aaagatgccg atgccaacgg agcgtatcat 3840
attgccaaaa aaggattgat gcttttgaat aaaatagacc aagccgactt gacaaaaaaa 3900
gtggatttat ctattagtaa cagagattgg ttgcaatttg tacaaaaaaa taaataa 3957
<210> 29
<211> 4019
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 29
atggaacagg agtactattt aggactggat atgggaaccg gatctgtagg atgggctgtt 60
acagattcgg aatatcatgt cttgcgtaaa catggaaaag cactatgggg agtccgatta 120
tttgaaagtg catcgacagc agaagaacga agaatgttcc gaacatcaag aagaagacta 180
gatcgaagaa actggagaat tgaaatttta caggaaattt ttgcagagga aataagtaag 240
aaagatccag gatttttctt gcgaatgaaa gaaagcaaat attatccaga agataagcga 300
gatatcaatg gaaattgtcc ggaactgcca tatgcattat ttgttgatga cgattttaca 360
gataaagatt atcataaaaa atttccgaca atttatcatc tcaggaaaat gttgatgaat 420
acagaggaga caccggatat ccggttggtg tatctggcaa ttcatcatat gatgaagcat 480
aggggccatt tcttgttatc tggtgacatt aatgagatta aggagttcgg aacgacattt 540
tcaaaattgt tggagaatat caaaaatgag gaattggatt ggaatcttga actgggaaaa 600
gaagaatatg ctgttgtaga aagtatttta aaagataaca tgttaaaccg atccacaaag 660
aaaaccagat taataaaagc attaaaagca aaatcaatat gtgaaaaggc tgtactgaat 720
ttattggctg gtggaacggt gaaattgagt gatatatttg gtcttgaaga attaaatgag 780
acagaaagac cgaagatttc ctttgctgat aatggatacg atgattatat cggagaagtt 840
gaaaatgagc tgggagaaca attctatatt atagagacgg caaaagcagt gtatgactgg 900
gcggtattag ttgaaatatt gggaaaatat acgtcaattt cagaagcgaa agtagcaacg 960
tatgaaaaac ataaatcgga tttacaattt ttgaaaaaga tagttcggaa atatctgaca 1020
aaggaggaat ataaagatat ttttgtaagt acgagtgaca aattgaaaaa ttactctgct 1080
tatataggaa tgacgaaaat aaatggaaaa aaggttgatt tgcagagcaa acggtgcagt 1140
aaagaagaat tctatgattt tattaagaaa aacgtactta aaaagctaga aggacaacct 1200
gaatatgaat atttgaaaga agagctagaa agagaaacat ttctaccaaa acaggtgaac 1260
agggataatg gtgtaatacc gtatcagatt catttgtacg agttgaaaaa gatattagga 1320
aatttacggg ataaaataga cctcattaaa gagaacgaag ataaactggt tcaattattt 1380
gaattcagaa ttccgtatta tgttggtccg ctgaataaga tagatgacgg aaaagaggga 1440
aaatttacat gggctgtacg gaaaagtaat gaaaagatat atccatggaa ttttgaaaat 1500
gtagttgata tagaagcaag tgcagaaaaa tttatccgga gaatgacaaa taagtgtaca 1560
tatctgatgg gcgaagatgt attgccgaag gattcattgc tttacagtaa atatatggtt 1620
ttaaatgaat taaataatgt aaagttggat ggcgaaaaat tatctgtaga attgaaacaa 1680
cggttgtata cagatgtatt ttgtaagtat cggaaagtaa ctgtaaagaa gataaaaaat 1740
tacttgaaat gtgaaggtat catatccggc aatgtcgaaa taactggaat tgatggtgat 1800
tttaaggcat cgttaacggc atatcatgat tttaaagaaa tcttgacagg aacagaattg 1860
gctaaaaagg acaaagaaaa tattattacc aatatagtat tgtttggaga tgataaaaag 1920
ctgctgaaaa agagactgaa tcgattatat cctcagatta cgccgaatca gttgaagaaa 1980
atatgtgcgc tatcctatac aggctgggga agattttcta aaaagttctt agaagaaata 2040
acagctccag atccggaaac gggagaggta tggaatatca ttacggcatt gtgggaatcg 2100
aataataatc tgatgcaatt attaagtaat gaatatcggt ttatggaaga agtcgaaaca 2160
tacaatatgg gaaaacagac taaaacattg tcgtacgaaa cagtagagaa tatgtatgtt 2220
tctccatctg tgaaaagaca gatatggcag acgctgaaaa tcgtgaaaga attagaaaaa 2280
gtaatgaaag aatctccgaa acgtgtattt attgagatgg cgagagaaaa gcaagaaagt 2340
aagagaaccg aatcgcgtaa aaaacaacta atagatttgt ataaggcttg taaaaatgaa 2400
gaaaaagatt gggtaaaaga actgggagat caggaagaac agaaattacg aagcgataag 2460
ttgtacctat attatacgca aaagggtcgt tgtatgtatt ctggcgaggt aatagaactg 2520
aaagacttat gggataatac aaaatatgat attgatcata tatatccaca atctaaaacg 2580
atggatgaca gtcttaataa tcgcgtattg gtaaaaaaga aatataatgc aacaaaatca 2640
gataagtatc cattaaatga aaatatacga catgagagaa aaggcttttg gaagtcactg 2700
ttagatggag ggtttataag taaagaaaaa tatgaacgct taataagaaa tacagaattg 2760
agtccggaag aattagcagg atttattgaa aggcagattg ttgaaacgag gcagagtaca 2820
aaagctgtag cggaaatatt aaagcaagtg tttccggaaa gtgaaattgt atatgtcaaa 2880
gcaggtacgg tttcaagatt cagaaaagat tttgaattac tgaaagttcg agaagtgaat 2940
gatttgcatc acgcaaagga tgcgtattta aatattgtag ttggtaatag ttattatgtg 3000
aaatttacta agaatgcatc atggtttata aaagaaaatc cgggacgtac ttacaactta 3060
aaaaagatgt ttacatcagg ttggaatatt gaacgaaatg gagaagttgc atgggaagtc 3120
gggaaaaaag gaacaattgt aacggtaaaa caaataatga ataaaaataa tatattggtg 3180
acaagacagg ttcatgaagc gaaaggtggg ctgtttgatc agcagattat gaaaaaagga 3240
aaaggtcaga ttgctataaa ggaaactgat gaacgtcttg catcaataga aaagtatgga 3300
ggctataata aagctgccgg ggcatatttt atgctggtag aatctaaaga taaaaaagga 3360
aaaacaattc gaacgataga atttatacca ttatatttaa agaataaaat cgagtcggat 3420
gaatcaatag cattgaactt tttagaaaaa ggcagaggtt tgaaagaacc aaagatacta 3480
ttgaaaaaaa ttaagattga tacattattt gatgtggacg gattcaaaat gtggttgtct 3540
ggaagaacag gggacagact actatttaaa tgtgcaaatc aattgatttt ggatgagaaa 3600
ataattgtaa caatgaaaaa aattgtaaag tttattcaaa ggagacaaga aaatagagaa 3660
ttaaaattat ctgataaaga tggaattgat aatgaagtac ttatggaaat atataacact 3720
tttgtggata agttagaaaa cacagtgtat agaatacgat tatccgaaca ggcaaaaacg 3780
cttatagata aacaaaaaga atttgaaagg ttatcactag aggataaaag tagtactttg 3840
tttgaaattt tacatatttt tcagtgtcaa agtagtgcgg ccaatttaaa aatgataggc 3900
ggacctggaa aagcaggaat attagttatg aataataata taagtaagtg taacaaaatt 3960
tctattataa atcagtctcc aacaggaatt ttcgaaaatg agattgattt gttaaagat 4019
<210> 30
<211> 3858
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 30
atgaaatctt tcgattcatt cacaaatctt tattctcttt caaaaacctt gaaatttgag 60
atgagacctg tcggaaatac ccaaaaaatg ctcgacaatg caggagtatt tgaaaaagac 120
aaactaattc aaaaaaagta cggaaaaaca aagccgtatt tcgacagact ccacagagaa 180
tttatagaag aagcgctcac gggggtagag ctaataggac tagatgagaa ctttaggaca 240
cttgttgact ggcaaaaaga taagaaaaat aatgtcgcaa tgaaagcgta tgaaaatagt 300
ttgcagcggc tgagaacgga aataggtaaa atatttaacc taaaggctga ggattgggta 360
aagaacaaat atccaatatt agggctgaaa aataaaaata ccgatatttt attcgaagag 420
gctgtattcg ggatattgaa agcccgatat ggagaagaaa aagatacttt tatagaagta 480
gaggaaatag ataaaaccgg caaatcaaag atcaatcaaa tatcaatttt cgatagttgg 540
aaaggattta caggatattt caaaaaattt tttgaaacca gaaagaattt ttacaaaaac 600
gacggaactt ctacagcaat tgctacaagg atcattgatc aaaatctgaa aagattcata 660
gataatctgt caatagttga aagtgtgaga caaaaggttg atctcgccga gacagaaaaa 720
tctttcagca tatctctatc gcaattcttc tcaatagact tttataacaa gtgtctcctt 780
caagatggta ttgattacta caacaagata atcggtggag aaactctcaa aaatggcgaa 840
aaactaatag gtctcaatga actaataaat caatataggc agaataataa ggatcagaaa 900
atcccatttt tcaaacttct tgataaacaa attttgagtg aaaagatatt atttttggat 960
gaaataaaaa atgacacaga actgatcgag gcgctgagtc agttcgcaaa aacagccgaa 1020
gaaaaaacaa aaattgtcaa aaagcttttt gccgattttg tagaaaataa ttccaaatac 1080
gatcttgcac agatttatat ttcccaagaa gcattcaata ctatatcaaa caagtggaca 1140
agcgaaactg agacgttcgc taaatatcta ttcgaagcaa tgaagagtgg aaaacttgca 1200
aagtatgaga aaaaagataa tagctataaa tttcctgatt ttattgccct ttcacagatg 1260
aagagtgctt tattaagtat cagccttgag ggacattttt ggaaagagaa atactacaaa 1320
atttcaaaat tccaagagaa gaccaattgg gagcagtttc ttgcaatttt tctatacgag 1380
tttaactctc ttttcagcga caaaataaat acaaaagatg gagaaacaaa gcaagttgga 1440
tactatctat ttgccaaaga cctgcataat cttatcttaa gtgagcagat tgatattcca 1500
aaagattcaa aagtcacaat aaaagatttt gccgattctg tactcacaat ctaccaaatg 1560
gcaaaatatt ttgcggtaga aaaaaaacga gcgtggcttg ccgagtatga actagattca 1620
ttttataccc agccagacac aggctattta cagttttatg ataacgccta cgaggatatt 1680
gtgcaggtat acaacaagct tcgaaactat ctgaccaaaa agccatatag cgaggagaaa 1740
tggaagttga attttgaaaa ttctacgctg gcaaatggat gggataagaa caaagaatct 1800
gataattcag cagttattct acaaaaaggt ggaaaatatt atttgggact gattactaaa 1860
ggacacaaca aaatttttga tgaccgtttt caagaaaaat ttattgtggg aattgaaggt 1920
ggaaaatatg aaaaaatagt ctataaattt ttccccgacc aggcaaaaat gtttcccaaa 1980
gtgtgctttt ctgcaaaagg actcgaattt tttagaccgt ctgaagaaat tttaagaatt 2040
tataacaatg cagagtttaa aaaaggagaa acttattcaa tagatagtat gcagaagttg 2100
attgattttt ataaagattg cttgactaaa tatgaaggct gggcatgtta tacctttcgg 2160
catctaaaac ccacagaaga ataccaaaac aatattggag agttttttcg agatgttgca 2220
gaggacggat acaggattga ttttcaaggc atttcagatc aatatattca tgaaaaaaac 2280
gagaaaggcg aacttcacct ttttgaaatc cacaataaag attggaattt ggataaggca 2340
cgagacggaa agtcaaaaac aacacaaaaa aaccttcata cactctattt cgaatcgctc 2400
ttttcaaacg ataatgttgt tcaaaacttt ccaataaaac tcaatggtca agctgaaatt 2460
ttttatagac cgaaaacgga aaaagacaaa ttagaatcaa aaaaagataa gaaagggaat 2520
aaagtgattg accataaacg ctatagtgag aataagattt tttttcatgt tcctctcaca 2580
ctaaaccgca ctaaaaatga ctcatatcgc tttaatgctc aaatcaacaa ctttctcgca 2640
aataataaag atatcaacat catcggtgta gataggggag aaaagcattt agtctattat 2700
tcggtgatta cacaagctag tgacatctta gaaagtggct cactaaatga gctaaatggc 2760
gtgaattatg ctgaaaaact gggaaaaaag gcagaaaatc gagaacaagc acgcagagac 2820
tggcaagacg tacaagggat caaagacctc aagaaaggat atatttcaca ggtggtgcga 2880
aagcttgctg atttagcaat taaacacaat gccattatca ttcttgaaga tttgaatatg 2940
agatttaaac aagttcgggg cggtatcgaa aaatccattt atcaacagtt agaaaaagca 3000
ctgatagata aattaagctt tcttgtagac aaaggtgaaa aaaatcccga gcaagcagga 3060
catcttctga aagcatatca gctttcggcc ccatttgaga catttcaaaa aatgggcaaa 3120
cagacgggta taatctttta tacacaagct tcgtatacct caaaaagtga ccctgtaaca 3180
ggttggcgac cacacctgta tctcaaatat ttcagtgcca aaaaagcaaa agacgatatt 3240
gcaaagttta caaaaataga atttgtaaac gataggtttg agcttaccta tgatataaag 3300
gactttcagc aagcaaaaga atatccaaat aaaactgttt ggaaagtttg ctcaaatgta 3360
gagagattca ggtgggacaa aaacctcaat caaaacaaag gcggatatac tcactacaca 3420
aatataactg agaatatcca agagcttttt acaaaatatg gaattgatat cacaaaagat 3480
ttgctcacac agatttctac aattgatgaa aaacaaaata cctcattttt tagagatttt 3540
attttttatt tcaaccttat ttgccaaatc agaaataccg atgattctga gattgctaaa 3600
aagaatggga aagatgattt tatactgtca cctgttgagc cgtttttcga tagccgaaaa 3660
gacaatggaa ataaacttcc tgagaatgga gatgataacg gcgcgtataa catagcaaga 3720
aaagggattg tcatactcaa caaaatctca caatattcag agaaaaacga aaattgcgag 3780
aaaatgaaat ggggggattt gtatgtatca aacattgact gggacaattt tgtaacccaa 3840
gctaatgcac ggcattaa 3858
<210> 31
<211> 3516
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 31
atgattatct tatatattag tacctcgaat atgaacatgg aaggagtatt tatggaaaat 60
tttaaaaact tgtatccaat aaacaaaaca cttcgatttg aattaagacc ctatggaaaa 120
acattggaaa attttaaaaa atccggactt ttagaaaaag atgcctttaa ggcaaatagt 180
agacgaagta tgcaagctat aatcgatgaa aaattcaaag agactatcga agaacgctta 240
aagtacactg aattcagtga atgtgatctt ggaaacatga catcaaaaga taaaaaaata 300
actgataaag cagctacaaa tttaaaaaag caagttatct tatcttttga cgatgaaata 360
tttaataatt acctaaaacc tgataaaaat attgacgcat tatttaaaaa tgatccttca 420
aatcctgtaa tctctacatt taaaggtttt acgacatatt ttgtgaattt ttttgaaatt 480
cgaaaacata ttttcaaggg agaatcatca ggctcaatgg cataccgaat tatagatgaa 540
aacctgacaa catacttgaa taatattgaa aaaataaaaa aactgccaga agaattaaaa 600
tcacagctag aaggcattga tcagattgat aaacttaata attataatga gttcattaca 660
cagtcaggta taacacacta taatgaaatc atcggcggta tatcaaaatc agagaatgtc 720
aaaatacagg gaattaatga aggaattaat ctatactgtc agaagaacaa agttaaactt 780
cctcgactga ctccgctata caaaatgata ttatcagaca gagtttccaa ctcttttgta 840
ttagacacta ttgaaaatga cacagaatta attgaaatga taagtgattt gattaataag 900
actgagattt cgcaagatgt tataatgtca gatattcaaa atattttcat aaaatacaaa 960
caacttggta atttgccggg tatctcatat tcttcaatag ttaatgctat ttgctcggat 1020
tatgacaaca atttcggaga tgggaagcga aaaaaatctt acgaaaatga tcgcaaaaag 1080
catttggaga ctaatgtata ctccataaat tatatttctg aattgcttac agataccgat 1140
gtttcatcaa atatcaagat gagatataaa gagcttgagc aaaattatca ggtttgcaaa 1200
gaaaatttta atgccacaaa ctggatgaat attaaaaata taaaacaatc tgaaaaaaca 1260
aaccttatta aagatttgtt agatatactt aaatcgattc aacgtttcta tgatttgttt 1320
gatattgttg acgaagataa aaatccaagt gctgaatttt atacctggtt atcaaaaaat 1380
gctgaaaagc ttgactttga attcaattct gtatataaca agtcacgaaa ctatctcacc 1440
aggaaacaat actctgataa aaaaatcaag ctgaattttg attctccaac attggccaaa 1500
gggtgggatg ctaacaaaga aatagataac tccacgatta taatgcgtaa atttaataat 1560
gacagaggcg attatgatta cttccttggc atatggaata aatccacacc tgcaaatgaa 1620
aaaataatcc cactggagga taatggatta ttcgaaaaaa tgcaatataa gctgtatcca 1680
gatcctagta agatgttacc gaaacaattt ctatcaaaaa tatggaaggc aaagcatcct 1740
acgacacctg aatttgataa aaaatataaa gagggaagac ataaaaaagg tcctgatttc 1800
gaaaaagaat tcctgcatga attgattgat tgcttcaaac atggtcttgt taatcacgat 1860
gaaaaatatc aggatgtttt tggcttcaat ctccgtaaca ctgaagatta taattcatat 1920
acagagtttc tcgaagatgt ggaaagatgc aattacaatc tttcatttaa caaaattgct 1980
gatacttcaa accttattaa tgatgggaaa ttgtatgtat ttcagatatg gtcaaaagac 2040
ttttctattg attcaaaagg tactaaaaac ttgaatacaa tctattttga atcactattt 2100
tcagaagaaa acatgataga aaaaatgttc aagctttctg gagaggctga gatattctat 2160
cgaccagcat cgttgaatta ttgtgaagat atcataaaaa aaggtcatca ccatgcagaa 2220
ttaaaagata agtttgacta tcctataata aaagataagc gatattcaca agataagttt 2280
ttctttcatg tgccaatggt tataaattat aaatctgaga aactgaattc caaaagcctt 2340
aacaaccgaa caaatgaaaa cctgggacag tttacacata ttataggtat agacaggggc 2400
gagcggcact tgatttattt aactgttgtt gatgtttcca ctggtgaaat cgttgaacag 2460
aaacatctgg acgaaattat caatactgat accaagggag ttgaacacaa aacccattat 2520
ttgaataaat tggaagaaaa atctaaaaca agagataacg agcgtaaatc atgggaagct 2580
attgaaacta tcaaagaatt aaaagaaggc tatatttctc atgtaattaa tgaaatacaa 2640
aagctgcaag aaaaatataa tgccttaatc gtaatggaaa atcttaacta tgggttcaaa 2700
aactcacgaa tcaaagttga aaaacaggtt tatcaaaaat tcgagacagc attgattaaa 2760
aagttcaatt atattattga taaaaaagat ccagaaacct atatacatgg ttaccagctt 2820
acaaatccta ttaccactct ggataagatt ggaaatcaat ctggaatagt gctgtatatt 2880
cctgcgtgga atacttctaa gatagatccc gtcacaggat ttgtaaacct tctgtacgca 2940
gatgatttga agtataaaaa tcaggagcag gccaaatcat tcattcagaa aatagacaac 3000
atatattttg aaaatggaga gtttaaattt gatattgatt tttccaaatg gaataatcgc 3060
tactcaataa gtaaaactaa atggacgtta acaagttatg ggactcgcat ccagacattt 3120
agaaatcccc agaaaaacaa taagtgggat tctgctgaat atgatttgac agaagagttt 3180
aaattaattt taaatataga cggaacgtta aagtcacagg acgtagaaac atacaaaaaa 3240
ttcatgtctt tatttaaact aatgctacag cttcgaaact ctgttacagg aaccgacatt 3300
gattatatga tctctcctgt cactgataaa acaggaacac atttcgattc aagagaaaat 3360
attaaaaatc ttcctgccga tgcagatgcc aatggtgcct acaacattgc gcgcaaagga 3420
ataatggcta ttgaaaatat aatgaacggt ataagcgatc cactaaaaat aagcaacgaa 3480
gactatttaa agtatattca gaatcaacag gaataa 3516
<210> 32
<211> 3924
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 32
atgacccaat ttgaaggttt taccaattta taccaagttt cgaagaccct tcgttttgaa 60
ctgattcccc aaggaaaaac actcaaacat atccaggagc aagggttcat tgaggaggat 120
aaagctcgca atgaccatta caaagagtta aaaccaatca ttgaccgcat ctataagact 180
tatgctgatc aatgtctcca actggtacag cttgactggg agaatctatc tgcagccata 240
gactcctatc gtaaggaaaa aaccgaagaa acacgaaatg cgctgattga ggagcaagca 300
acatatagaa atgcgattca tgactacttt ataggtcgga cggataatct gacagatgcc 360
ataaataagc gccatgctga aatctataaa ggacttttta aagctgaact tttcaatgga 420
aaagttttaa agcaattagg gaccgtaacc acgacagaac atgaaaatgc tctactccgt 480
tcgtttgaca aatttacgac ctatttttcc ggcttttatg aaaaccgaaa aaatgtcttt 540
agcgctgaag atatcagcac ggcaattccc catcgaatcg tccaggacaa tttccctaaa 600
tttaaggaaa actgccatat ttttacaaga ttgataaccg cagttccttc tttgcgggag 660
cattttgaaa atgtcaaaaa ggccattgga atctttgtta gtacgtctat tgaagaagtc 720
ttttcctttc ccttttataa tcaacttcta acccaaacgc aaattgatct ttataatcaa 780
cttctcggcg gcatatctag ggaagcaggc acagaaaaaa tcaagggact taatgaagtt 840
ctcaatctgg ctatccaaaa aaatgatgaa acagcccata taatcgcgtc cctgccgcat 900
cgttttattc ctctttttaa acaaattctt tccgatcgaa atacgttatc ctttattttg 960
gaagaattca aaagcgatga ggaagtcatc caatccttct gcaaatataa aaccctcttg 1020
agaaacgaaa atgtactgga gactgcagaa gcccttttca atgaattaaa ttccattgat 1080
ttgactcata tctttatttc ccataaaaag ttagaaacca tctcttcagc gctttgtgac 1140
cattgggata ccttgcgcaa tgcactttac gaaagacgga tttctgaact cactggcaaa 1200
ataacaaaaa gtgccaaaga aaaagttcaa aggtcattaa aacatgagga tataaatctc 1260
caagaaatta tttctgctgc aggaaaagaa ctatcagaag cattcaaaca aaaaacaagt 1320
gaaattcttt cccatgccca tgctgcactt gaccagcctc ttcccacaac attaaaaaaa 1380
caggaagaaa aagaaatcct caaatcacag ctcgattcgc ttttaggcct ttatcatctt 1440
cttgattggt ttgctgtcga tgaaagcaat gaagtcgacc cagaattctc agcacggctg 1500
acaggcatta aactagaaat ggaaccaagc ctttcgtttt ataataaagc aagaaattat 1560
gcgacaaaaa agccctattc ggtggaaaaa tttaaattga attttcaaat gccaaccctt 1620
gcctctggtt gggatgtcaa taaagaaaaa aataatggag ctattttatt cgtaaaaaat 1680
ggtctctatt accttggtat catgcctaaa cagaaggggc gctataaagc cctgtctttt 1740
gagccgacag aaaaaacatc agaaggattc gataagatgt actatgacta cttcccagat 1800
gccgcaaaaa tgattcctaa gtgttccact cagctaaagg ctgtaaccgc tcattttcaa 1860
actcatacca cccccattct tctctcaaat aatttcattg aacctcttga aatcacaaaa 1920
gaaatttatg acctgaacaa tcctgaaaag gagcctaaaa agtttcaaac ggcttatgca 1980
aagaagacag gcgatcaaaa aggctataga gaagcgcttt gcaaatggat tgactttacg 2040
cgggattttc tctctaaata tacgaaaaca acttcaatcg atttatcttc actccgccct 2100
tcttcgcaat ataaagattt aggggaatat tacgccgaac tgaatccgct tctctatcat 2160
atctccttcc aacgaattgc tgaaaaggaa atcatggatg ctgtagaaac gggaaaattg 2220
tatctgttcc aaatctacaa taaggatttt gcgaagggcc atcacgggaa accaaatctc 2280
cacaccctgt attggacagg tctcttcagt cctgaaaacc ttgcgaaaac cagcatcaaa 2340
cttaatggtc aagcagaatt gttctatcga cctaaaagcc gcatgaagcg gatggcccat 2400
cgtcttgggg aaaaaatgct gaacaaaaaa ctaaaggacc agaagacacc gattccagat 2460
accctctacc aagaactgta cgattatgtc aaccaccggc taagccatga tctttccgat 2520
gaagcaaggg ccctgcttcc aaatgttatc accaaagaag tctcccatga aattataaag 2580
gatcggcggt ttacttccga taaatttttc ttccatgttc ccattacact gaattatcaa 2640
gcagccaata gtcccagtaa attcaaccag cgtgtcaatg cctaccttaa ggagcatccg 2700
gaaacgccca tcattggtat cgatcgtgga gaacgcaatc taatctatat taccgtcatt 2760
gacagtactg ggaaaatttt ggagcagcgt tccctgaata ccatccagca atttgactac 2820
caaaaaaaat tggacaacag ggaaaaagag cgtgttgccg cccgtcaagc ctggtccgtc 2880
gtcggaacga tcaaagacct taaacaaggc tacttgtcac aggtcatcca tgaaattgta 2940
gacctgatga ttcattacca agctgttgtc gtccttgaaa acctcaactt cggatttaaa 3000
tcaaaacgga caggcattgc cgaaaaagca gtctaccaac aatttgaaaa gatgctaata 3060
gataaactca actgtttggt tctcaaagat tatcctgctg agaaagtggg aggcgtctta 3120
aacccgtatc aacttacaga tcagttcacg agctttgcaa aaatgggcac gcaaagcggc 3180
ttccttttct atgtaccggc cccttatacc tcaaagattg atcccctgac tggttttgtc 3240
gatccctttg tatggaagac cattaaaaat catgaaagtc ggaagcattt cctagaagga 3300
tttgatttcc tgcattatga tgtcaaaaca ggtgatttta tcctccattt taaaatgaat 3360
cggaatctct ctttccagag agggcttcct ggcttcatgc cagcttggga tattgttttc 3420
gaaaagaatg aaacccaatt tgatgcaaaa gggacgccct tcattgcagg aaaacgaatt 3480
gttcctgtaa tcgaaaatca tcgttttacg ggtcgttaca gagacctcta tcccgctaat 3540
gaactcattg cccttctgga agaaaaaggc attgtcttta gagacggaag taatatatta 3600
cccaaacttt tagaaaatga tgattctcat gcaattgata cgatggtcgc cttgattcgc 3660
agtgtactcc aaatgagaaa cagcaatgcc gcaacggggg aagactacat caactctccc 3720
gttagggatc tgaacggggt gtgtttcgac agtcgattcc aaaatccaga atggccaatg 3780
gatgcggatg ccaacggagc ttatcatatt gccttaaaag ggcagcttct tctgaaccac 3840
ctcaaagaaa gcaaagatct gaaattacaa aacggcatca gcaaccaaga ttggctggcc 3900
tacattcagg aactgagaaa ctga 3924
<210> 33
<211> 3390
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 33
atggccgtca aatccatcaa agtgaaactt cgtctcgacg atatgccgga gattcgggcc 60
ggtctatgga aacttcataa ggaagtcaat gcgggggttc gatattacac ggaatggctc 120
agtcttctcc gtcaagagaa cttgtatcga agaagtccga atggggacgg agagcaagaa 180
tgtgataaga ctgcagaaga atgcaaagcc gaattgttgg agcggctgcg cgcgcgtcaa 240
gtggagaatg gacaccgtgg tccggcggga tcggacgatg aattgctgca gttggcgcgt 300
caactctatg agttgttggt tccgcaggcg ataggtgcga aaggcgacgc gcagcaaatt 360
gcccgcaaat ttttgagccc cttggccgac aaggacgcag ttggtgggct tggaatcgcg 420
aaggcgggga acaaaccgcg gtgggttcgc atgcgcgaag cgggggaacc aggctgggaa 480
gaggagaagg agaaggctga gacgaggaaa tctgcggatc ggactgcgga tgttttgcgc 540
gcgctcgcgg attttgggtt aaagccactg atgcgcgtat acaccgattc tgagatgtca 600
tcggtggagt ggaaaccgct tcggaaggga caagccgttc ggacgtggga tagggacatg 660
ttccaacaag ctatcgaacg gatgatgtcg tgggagtcgt ggaatcagcg cgttgggcaa 720
gagtacgcga aactcgtaga acaaaaaaat cgatttgagc agaagaattt cgtcggccag 780
gaacatctgg tccatctcgt caatcagttg caacaagata tgaaagaagc atcgcccgga 840
ctcgaatcga aagagcaaac cgcgcactat gtgacgggac gggcattgcg cggatcggac 900
aaggtatttg agaagtgggg gaaactcgcc cccgatgcac ctttcgattt gtacgacgcc 960
gaaatcaaga atgtgcagag acgtaacacg agacgattcg gatcacatga cttgttcgca 1020
aaattggcag agccagagta tcaggccctg tggcgcgaag atgcttcgtt tctcacgcgt 1080
tacgcggtgt acaacagcat ccttcgcaaa ctgaatcacg ccaaaatgtt cgcgacgttt 1140
actttgccgg atgcaacggc gcacccgatt tggactcgct tcgataaatt gggtgggaat 1200
ttgcaccagt acaccttttt gttcaacgaa tttggagaac gcaggcacgc gattcgtttt 1260
cacaagctat tgaaagtcga gaatggtgtc gcaagagaag ttgatgatgt caccgtgccc 1320
atttcaatgt cagagcaatt ggataatctg cttcccagag atcccaatga accgattgcg 1380
ctatattttc gagattacgg agccgaacag catttcacag gtgaatttgg tggcgcgaag 1440
atccagtgcc gccgggatca gctggctcat atgcaccgac gcagaggggc gagggatgtt 1500
tatctcaatg tcagcgtacg tgtgcagagt cagtctgagg cgcggggaga acgtcgcccg 1560
ccgtatgcgg cagtatttcg tctggtcggg gacaaccatc gcgcgtttgt ccatttcgat 1620
aaactatcgg attatcttgc ggaacatccg gatgatggga agctcgggtc ggaggggttg 1680
ctttccgggc tgcgggtgat gagtgtcgat ctcggccttc gcacatctgc atcgatttcc 1740
gtttttcgcg ttgcccggaa ggacgagttg aagccgaact caaaaggtcg tgtaccgttt 1800
ttctttccga taaaagggaa tgacaatctc gtcgcggttc atgagcgatc acaactcttg 1860
aagctgcctg gcgaaacgga gtcgaaggac ctgcgtgcta tccgagaaga acgccaacgg 1920
acattgcggc agttgcggac gcaactggcg tatttgcggc tgctcgtgcg gtgtgggtcg 1980
gaagatgtgg ggcggcgtga acggagttgg gcaaagctta tcgagcagcc ggtggatgcg 2040
gccaatcaca tgacaccgga ttggcgcgag gcttttgaaa acgaacttca gaagcttaag 2100
tcactccatg gtatctgtag cgacaaggaa tggatggatg ctgtctacga gagcgttcgc 2160
cgcgtgtggc gtcacatggg caaacaggtt cgcgattggc gaaaggacgt acgaagcgga 2220
gagcggccca agattcgcgg ctatgcgaaa gacgtggtcg gtggaaactc gattgagcaa 2280
atcgagtatc tggaacgtca gtacaagttc ctcaagagtt ggagcttctt tggtaaggtg 2340
tcgggacaag tgattcgtgc ggagaaggga tctcgttttg cgatcacgct gcgcgaacac 2400
attgatcacg cgaaggaaga tcggctgaag aaattggcgg atcgcatcat tatggaggct 2460
ctcggctatg tgtacgcgtt ggatgagcgc ggcaaaggaa agtgggttgc gaagtatccg 2520
ccgtgccagc tcatcctgct ggaggaattg agcgagtacc agttcaataa cgacaggcct 2580
ccgagcgaaa acaaccagtt gatgcaatgg agtcatcgcg gcgtgttcca ggagttgata 2640
aatcaggccc aagtccatga tttactcgtt gggacgatgt atgcagcgtt ctcgtcgcga 2700
ttcgacgcgc gaactggggc accgggtatc cgctgtcgcc gggttccggc gcgttgcacc 2760
caggagcaca atccagaacc atttccttgg tggctgaaca agtttgtggt ggaacatacg 2820
ttggatgctt gtcccctacg cgcagacgac ctcatcccaa cgggtgaagg agagattttt 2880
gtctcgccgt tcagcgcgga ggagggggac tttcatcaga ttcacgccga cctgaatgcg 2940
gcgcaaaatc tgcagcagcg actctggtct gattttgata tcagtcaaat tcggttgcgg 3000
tgtgattggg gtgaagtgga cggtgaactc gttctgatcc caaggcttac aggaaaacga 3060
acggcggatt catatagcaa caaggtgttt tataccaata caggtgtcac ctattatgag 3120
cgagagcggg ggaagaagcg gagaaaggtt ttcgcgcaag agaaattgtc ggaggaagag 3180
gcggagttgc tcgtggaagc agacgaggcg agggagaaat cggtcgtttt gatgcgtgat 3240
ccgtctggca tcatcaatcg gggaaattgg accaggcaaa aggaattttg gtcgatggtg 3300
aaccagcgga tcgaaggata cttggtcaag cagattcgct cgcgcgttcc attacaagat 3360
agtgcgtgtg aaaacacggg ggatatttaa 3390
<210> 34
<211> 3327
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 34
atggcgacac gcagttttat tttaaaaatt gaaccaaatg aagaagttaa aaagggatta 60
tggaagacgc atgaggtatt gaatcatgga attgcctact acatgaatat tctgaaacta 120
attagacagg aagctattta tgaacatcat gaacaagatc ctaaaaatcc gaaaaaagtt 180
tcaaaagcag aaatacaagc cgagttatgg gattttgttt taaaaatgca aaaatgtaat 240
agttttacac atgaagttga caaagatgtt gtttttaaca tcctgcgtga actatatgaa 300
gagttggtcc ctagttcagt cgagaaaaag ggtgaagcca atcaattatc gaataagttt 360
ctgtacccgc tagttgatcc gaacagtcaa agtgggaaag ggacggcatc atccggacgt 420
aaacctcggt ggtataattt aaaaatagca ggcgacccat cgtgggagga agaaaagaaa 480
aaatgggaag aggataaaaa gaaagatccc cttgctaaaa tcttaggtaa gttagcagaa 540
tatgggctta ttccgctatt tattccattt actgacagca acgaaccaat tgtaaaagaa 600
attaaatgga tggaaaaaag tcgtaatcaa agtgtccggc gacttgataa ggatatgttt 660
atccaagcat tagagcgttt tctttcatgg gaaagctgga accttaaagt aaaggaagag 720
tatgaaaaag ttgaaaagga acacaaaaca ctagaggaaa ggataaaaga ggacattcaa 780
gcatttaaat cccttgaaca atatgaaaaa gaacggcagg agcaacttct tagagataca 840
ttgaatacaa atgaataccg attaagcaaa agaggattac gtggttggcg tgaaattatc 900
caaaaatggc taaagatgga tgaaaatgaa ccatcagaaa aatatttaga agtatttaaa 960
gattatcaac ggaaacatcc acgagaagcc ggggactatt ctgtctatga atttttaagc 1020
aagaaagaaa atcattttat ttggcgaaat catcctgaat atccttattt gtatgctaca 1080
ttttgtgaaa ttgacaaaaa aaagaaagac gctaagcaac aggcaacttt tactttggct 1140
gacccgatta accatccgtt atgggtacga tttgaagaaa gaagcggttc gaacttaaac 1200
aaatatcgaa ttttaacaga gcaattacac actgaaaagt taaaaaagaa attaacagtt 1260
caacttgatc gtttaattta tccaactgaa tccggcggtt gggaggaaaa aggtaaagta 1320
gatatcgttt tgttgccgtc aagacaattt tataatcaaa tcttccttga tatagaagaa 1380
aaggggaaac atgcttttac ttataaggat gaaagtatta aattccccct taaaggtaca 1440
cttggtggtg caagagtgca gtttgaccgt gaccatttgc ggagatatcc gcataaagta 1500
gaatcaggaa atgttggacg gatttatttt aacatgacag taaatattga accaactgag 1560
agccctgtta gtaagtcttt gaaaatacat agggacgatt tccccaagtt cgttaatttt 1620
aaaccgaaag agctcaccga atggataaaa gatagtaaag ggaaaaaatt aaaaagtggt 1680
atagaatccc ttgaaattgg tctacgggtg atgagtatcg acttaggtca acgtcaagcg 1740
gctgctgcat cgatttttga agtagttgat cagaaaccgg atattgaagg gaagttattt 1800
tttccaatca aaggaactga gctttatgct gttcaccggg caagttttaa cattaaatta 1860
ccgggtgaaa cattagtaaa atcacgggaa gtattgcgga aagctcggga ggacaactta 1920
aaattaatga atcaaaagtt aaactttcta agaaatgttc tacatttcca acagtttgaa 1980
gatatcacag aaagagagaa gcgtgtaact aaatggattt ctagacaaga aaatagtgat 2040
gttcctcttg tatatcaaga tgagctaatt caaattcgtg aattaatgta taaaccctat 2100
aaagattggg ttgccttttt aaaacaactc cataaacggc tagaagtcga gattggcaaa 2160
gaggttaagc attggcgaaa atcattaagt gacgggagaa aaggtcttta cggaatctcc 2220
ctaaaaaata ttgatgaaat tgatcgaaca aggaaattcc ttttaagatg gagcttacgt 2280
ccaacagaac ctggggaagt aagacgcttg gaaccaggac agcgttttgc gattgatcaa 2340
ttaaaccacc taaatgcatt aaaagaagat cgattaaaaa agatggcaaa tacgattatc 2400
atgcatgcct taggttactg ttatgatgta agaaagaaaa agtggcaggc aaaaaatcca 2460
gcatgtcaaa ttattttatt tgaagattta tctaactaca atccttacga ggaaaggtcc 2520
cgttttgaaa actcaaaact gatgaagtgg tcacggagag aaattccacg acaagtcgcc 2580
ttacaaggtg aaatttacgg attacaagtt ggggaagtag gtgcccaatt cagttcaaga 2640
ttccatgcga aaaccgggtc gccgggaatt cgttgcagtg ttgtaacgaa agaaaaattg 2700
caggataatc gcttttttaa aaatttacaa agagaaggac gacttactct tgataaaatc 2760
gcagttttaa aagaaggaga cttatatcca gataaaggtg gagaaaagtt tatttcttta 2820
tcaaaggatc gaaagttggt aactacgcat gctgatatta acgcggccca aaatttacag 2880
aagcgttttt ggacaagaac acatggattt tataaagttt actgcaaagc ctatcaggtt 2940
gatggacaaa ctgtttatat tccggagagc aaggaccaaa aacaaaaaat aattgaagaa 3000
tttggggaag gctattttat tttaaaagat ggtgtatatg aatggggtaa tgcggggaaa 3060
ctaaaaatta aaaaaggttc ctctaaacaa tcatcgagtg aattagtaga ttcggacata 3120
ctgaaagatt catttgattt agcaagtgaa cttaagggag agaaactcat gttatatcga 3180
gatccgagtg gaaacgtatt tccttccgac aagtggatgg cagcaggagt attttttggc 3240
aaattagaaa gaatattgat ttctaagtta acaaatcaat actcaatatc aacaatagaa 3300
gatgattctt caaaacaatc aatgtaa 3327
<210> 35
<211> 3450
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 35
atgcccaccc gcaccatcaa tctgaaactt gttcttggga aaaatcctga aaacgcaaca 60
ttgcgacgcg ccctattttc gacacaccgt ttggttaacc aagcgacgaa acgtattgag 120
gaattcttgt tgctgtgtcg tggagaagcc tacagaacag tggataatga ggggaaggaa 180
gccgagattc cacgtcatgc agtccaagaa gaagctcttg cctttgccaa agctgctcaa 240
cgccacaacg gctgtatatc cacctatgaa gaccaagaga ttcttgatgt actgcggcaa 300
ctgtacgaac gtcttgttcc ttcggtcaac gaaaacaacg aggcaggcga tgctcaagct 360
gctaacgcct gggtcagtcc gctcatgtcg gcagaaagcg aaggaggctt gtcggtctac 420
gacaaggtgc ttgatccacc gccggtttgg atgaagctta aagaagaaaa ggctccagga 480
tgggaagccg cttctcaaat ttggattcag agtgatgagg gacagtcgtt acttaataag 540
ccaggtagcc ctccccgctg gattcgaaaa ctgcgatctg ggcaaccgtg gcaagatgat 600
ttcgtcagtg accaaaagaa aaagcaagat gagctgacca aagggaacgc accacttata 660
aaacaactca aagaaatggg gttgttgcct cttgttaacc cattttttag acatcttctt 720
gaccctgaag gtaaaggcgt gagtccatgg gaccgtcttg ctgtacgcgc tgcagtggct 780
cactttatct cctgggaaag ttggaatcat agaacacgtg cagaatacaa ttccttgaaa 840
ctacggcgag acgagtttga ggcagcatcc gacgaattca aagacgattt tactttgctc 900
cgacaatatg aagccaaacg ccatagtaca ttgaaaagca tcgcgctggc cgacgattcg 960
aacccttacc ggattggagt acgttctctg cgtgcctgga accgcgttcg tgaagaatgg 1020
atagacaagg gtgcaacaga agaacaacgc gtgaccatat tgtcaaagct tcaaacacaa 1080
cttcggggaa aattcggcga tcccgatctg ttcaactggc tagctcagga taggcatgtc 1140
catttgtggt ctcctcggga cagcgtgaca ccattggttc gcatcaatgc ggtagataaa 1200
gttctgcgtc gacgaaaacc gtatgcattg atgacctttg cccatccccg cttccaccct 1260
cgatggatac tgtacgaggc tccaggagga agcaatctcc gtcaatatgc attggattgt 1320
acagaaaacg ctctacacat cacgttgcct ttgcttgtcg acgatgcgca cggaacctgg 1380
attgaaaaaa agatcagggt gccgctggca ccatccggac aaattcaaga tttaactctg 1440
gaaaaacttg agaagaaaaa aaatcgttta tactaccgtt ccggttttca gcagtttgcc 1500
ggcttggctg gcggagctga ggttcttttc cacagaccct atatggaaca cgacgaacgc 1560
agcgaggagt ctcttttgga acgtccggga gccgtttggt tcaaattgac cctggatgtg 1620
gcaacacagg ctcccccgaa ctggcttgat ggtaagggcc gtgtccgtac accgccggag 1680
gtacatcatt ttaaaaccgc attgtcgaat aaaagcaaac atacacgtac gctgcagccg 1740
ggtctccgtg tcttgtcagt agacttgggc atgcgaacat tcgcctcctg ctcagtattt 1800
gaactcatcg agggaaagcc tgagacaggc cgtgccttcc ctgttgccga tgagagatca 1860
atggacagcc cgaataaact gtgggccaag catgaacgta gttttaaact gacgctcccc 1920
ggcgaaaccc cttctcgaaa ggaagaggaa gagcgtagca tagcaagagc ggaaatttat 1980
gcactgaaac gcgacataca acgcctcaaa agcctactcc gcttaggtga agaagataac 2040
gataaccgtc gtgatgcatt gcttgaacag ttctttaaag gatggggaga agaagacgtt 2100
gtgcctggac aagcgtttcc acgctctctt ttccaagggt tgggagctgc cccgtttcgc 2160
tcaactccag agttatggcg tcagcattgc caaacatatt atgacaaagc ggaagcctgt 2220
ctggctaaac atatcagtga ttggcgcaag cgaactcgtc cccgtccgac atcgcgggag 2280
atgtggtaca aaacacgttc ctatcatggc ggcaagtcca tttggatgtt ggaatatctt 2340
gatgccgttc gaaaactgct tctcagttgg agcttacgtg gtcgtactta cggtgccatt 2400
aatcgccagg atacagcccg gtttggttct ttggcatcac ggctgctcca ccatatcaat 2460
tccctaaagg aagaccgcat caaaacagga gccgactcta tcgttcaggc tgctcgcggg 2520
tatattcctc tccctcatgg caagggttgg gaacaaagat atgagccttg tcagctcata 2580
ttatttgaag acctcgcacg atatcgcttt cgcgtggatc gacctcgtcg agagaacagc 2640
caactcatgc agtggaacca tcgagccatc gtggcagaaa caacgatgca agccgaactc 2700
tacggacaaa ttgtcgaaaa tactgcagcg gggttcagca gtcgttttca cgcggcgaca 2760
ggtgcccccg gtgtacgttg tcgttttctt ctagaaagag actttgataa cgatttgccc 2820
aaaccgtacc ttctcaggga actttcttgg atgctcggca atacaaaagt cgagtctgaa 2880
gaagaaaagc ttcgattgct gtctgaaaaa atcaggccag gcagtcttgt tccttgggat 2940
ggaggcgaac agttcgctac cctgcatccc aaaagacaaa cactttgcgt cattcatgcc 3000
gatatgaatg ctgcccaaaa tttacaacgc cggtttttcg gtcgatgcgg cgaggccttt 3060
cggcttgttt gtcaacccca cggtgacgac gtgttacgac tcgcatccac cccaggagct 3120
cgtcttcttg gagccctgca gcagcttgaa aatggacaag gagctttcga gttggttcga 3180
gacatggggt caacaagtca aatgaaccgg ttcgtcatga agtctttggg aaaaaagaaa 3240
ataaaacccc ttcaggacaa caatggagac gacgagcttg aagacgtgtt gtccgtactc 3300
ccggaggaag acgacacagg acgtatcaca gtcttccgcg attcatcagg aatctttttt 3360
ccttgcaacg tctggatacc ggccaaacag ttttggccag cagtacgcgc catgatttgg 3420
aaggtcatgg cttcccattc tttggggtga 3450
<210> 36
<211> 3759
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 36
atgacaaagt taagacaccg acagaaaaaa ttaacacacg actgggctgg ctccaaaaag 60
agggaagtat taggctcaaa tggcaagctt cagaatccgt tgttaatgcc ggttaaaaaa 120
ggtcaggtta ctgagttccg gaaagcgttt tctgcgtatg ctcgcgcaac gaaaggagaa 180
atgactgacg gccgaaagaa tatgtttacg catagtttcg agccatttaa gacaaagccc 240
tcgcttcatc agtgtgaatt ggcagataaa gcatatcaat ctttacattc gtatctgcct 300
ggttctcttg ctcattttct attatctgct cacgcattag gttttcgtat tttttcaaaa 360
tctggtgaag caactgcatt ccaggcatcc tctaaaattg aagcttacga atcaaaattg 420
gcaagcgaat tagcttgtgt agatttatct attcaaaact tgactatttc aacgcttttt 480
aatgcgctta caacgtctgt aagagggaag ggcgaagaaa ctagcgctga ccccttaatt 540
gcacgatttt acaccttact tactggcaag cctctgtctc gagacactca agggcctgaa 600
cgtgatttag cagaagttat ctcgcgtaag atagctagtt cttttggcac atggaaagaa 660
atgacggcaa accctcttca gtcattacaa ttttttgaag aggaactcca tgcgctggat 720
gccaatgtct cgctctcacc cgccttcgac gttttaatta aaatgaatga tttgcagggc 780
gatttaaaaa atcgaaccat tgtttttgat cctgacgccc ctgtttttga atataacgca 840
gaagaccctg ccgacataat tattaaactt acagctcgtt acgctaaaga agctgtcatc 900
aaaaatcaaa acgtaggaaa ttacgttaaa aacgctatta ctaccacaaa tgccaatggt 960
cttggttggc ttttgaacaa aggtttgtcg ttactccctg tctcgaccga tgacgaattg 1020
ctagagttta ttggcgttga acgatctcat ccctcatgcc atgccttaat tgaattgatt 1080
gcacaattag aagcccccga gctctttgag aagaacgtat tttcagatac tcgttctgaa 1140
gttcaaggta tgattgattc agctgtttct aatcatattg ctcgtctttc cagctctaga 1200
aatagcttgt caatggatag tgaagaatta gaacgtttaa tcaaaagctt tcagatacac 1260
acacctcatt gctcactttt tattggcgcc caatcacttt cacagcagtt agaatctttg 1320
cctgaagccc ttcaatcggg cgttaattca gccgatattt tactaggctc tactcaatat 1380
atgctcacca attctttggt tgaagagtca attgcaactt atcaaagaac acttaatcgc 1440
atcaattact tgtcaggtgt tgcaggtcag attaacggcg caataaagcg aaaagcgata 1500
gatggagaaa aaattcactt gcctgcagct tggtcagagt tgatatcttt accatttata 1560
ggccagcctg ttatagatgt tgaaagcgat ttagctcatc taaaaaatca ataccaaaca 1620
ctttcaaatg agtttgatac tcttatatct gctttgcaaa agaattttga tttgaacttt 1680
aataaagcgc tccttaatcg tactcagcat tttgaagcca tgtgtagaag cactaagaaa 1740
aacgctttat ccaaaccaga gatcgtttcc tatcgcgacc tgcttgctcg attaacttct 1800
tgtttgtatc gaggctcttt agttttgcgt cgtgccggca ttgaagtgtt aaaaaaacat 1860
aaaatatttg agtcaaacag cgaacttcgt gaacatgttc atgaaagaaa gcatttcgtg 1920
tttgttagtc ctctagatcg caaagccaag aaactccttc gattaactga ttcgcgtcca 1980
gacttgttac atgttattga tgaaatattg cagcacgata atcttgaaaa caaagaccgc 2040
gagtcacttt ggctagttcg ctctggttat ttgcttgcag gacttccaga tcaactttct 2100
tcatctttta ttaacttgcc tatcattact caaaaaggag atagacgcct tatagacctg 2160
attcagtatg atcaaattaa tcgtgatgct tttgttatgt tagtgacctc tgcattcaag 2220
tctaatttgt ctggtctgca gtatcgtgcc aataagcaat cgttcgttgt tactcgcacg 2280
ctaagccctt atctcggctc aaaacttgtc tacgtaccca aggataaaga ttggttagtt 2340
ccttctcaaa tgtttgaagg acgatttgct gacattcttc aatcagatta tatggtctgg 2400
aaagatgccg gtcgtctttg tgttattgat actgcaaaac acctttctaa tataaagaag 2460
tctgtatttt catccgaaga agttctcgct tttttaagag aactccctca ccgcacattt 2520
atccagaccg aagttcgcgg ccttggcgtt aatgtcgatg gaattgcatt taataatggt 2580
gatattccgt cattaaaaac cttttcaaat tgcgttcagg taaaagtttc tcggactaat 2640
acatccctag ttcaaacact taatcgttgg tttgaaggag gaaaagtttc tcctccgagc 2700
attcaatttg aacgggcgta ttataaaaaa gacgatcaaa ttcatgaaga cgcagcgaaa 2760
agaaagatac gattccagat gcccgcaact gagttggttc atgcttctga cgatgcgggg 2820