Способ секвенирования на основе одного флуоресцентного красителя

Изобретение относится к области биотехнологии, конкретно к способам секвенирования молекулы нуклеиновой кислоты. Предложенные способы включают использование одного флуоресцентного красителя или двух флуоресцентных красителей, которые испускают один и тот же флуоресцентный сигнал, и позволяют осуществлять точное секвенирование матричной нуклеиновой кислоты. 16 н. и 1 з.п. ф-лы, 4 ил., 5 табл., 4 пр.

 

Область техники

Настоящее изобретение относится к области секвенирования нуклеиновых кислот. В частности, настоящее изобретение предусматривает способ секвенирования на основе одного флуоресцентного красителя. Кроме того, настоящее изобретение также относится к модифицированному нуклеозиду и нуклеотиду и набору, содержащему нуклеозид и/или нуклеотид, которые, в частности, пригодны для использования в способе секвенирования по изобретению. Кроме того, настоящее изобретение также относится к использованию нуклеозида, нуклеотида и набора для секвенирования.

Прием известного уровня техники

Технология секвенирования ДНК включает технологию секвенирования ДНК первого поколения, представленную в процессе секвенирования Сэнгера, и технологию секвенирования ДНК второго поколения, представленную в Illumina Hiseq 2500, Roche 454, ABI Solid, BGISEQ-500 и т. п. Процесс секвенирования Сэнгера имеет характеристики простой экспериментальной операции, интуитивных и точных результатов, короткого периода эксперимента и т. д. Он имеет широкое применение в таких областях, как обнаружение клинической мутации гена и генотипирование, которые требуют большого времени для обнаружения результатов. Однако недостатками процесса секвенирования Сэнгер являются малая пропускная способность и высокая стоимость, что ограничивает его применение в крупномасштабном секвенировании генов.

По сравнению с технологией секвенирования ДНК первого поколения, технология секвенирования ДНК второго поколения обладает характеристиками большой пропускной способности секвенирования, низкой стоимость, высокой степени автоматизации и одномолекулярного секвенирования. Если брать технологию секвенирования Hiseq 2500V2 в качестве примера, экспериментальная процедура позволяет создавать данные о 10-200 млрд оснований, и усредненные расходы на основание составляют меньше 1/1000 стоимости секвенирования для способа секвенирования по Сэнгеру; и получаемый результат секвенирования можно обрабатывать и анализировать непосредственно с помощью компьютера. Следовательно, технология секвенирования ДНК второго поколения очень хорошо подходит для крупномасштабного секвенирования.

В технологии секвенирования ДНК второго поколения, которая разработана, преимущественно используют приемы секвенирования посредством лигирования (SBL) и секвенирования посредством синтеза (SBS). Типичные примеры этих технологий секвенирования включают способ секвенирования SOLiD, разработанный Applied Biosystems, способ комбинированного лигирования зондов и якорей (cPAL), разработанный в Complete Genomics, и способ комбинированного синтеза зондов и якорей (cPAS), разработанный в BGI Gene, и процесс секвенирования Illumina, разработанный в комании Illumina и технологической компании Solexa. Среди этих способов секвенирования Illumina и Complate Genomics используют способ обнаружения оптических сигналов. Для того чтобы идентифицировать и различать четыре основания (A, T/U, C и G), обычно необходимо использовать четыре флуоресцентных красителя для того, чтобы метить эти четыре основания соответствующим образом. В этом случае, чтобы считывать флуоресцентные сигналы, которые несут соответствующие основания, устройство для секвенирования следует оборудовать по меньшей мере двумя монохроматическими источниками возбуждающего света и по меньшей мере двумя камерами, результатом чего является дорогостоящее изготовление и большой объем устройства для секвенирования.

Сообщалось о том, что идентификации и различения четырех оснований можно достичь с использованием двую типов флуоресцентных красителей (Sara Goodwin, et.al. Nature Reviews Genetics 17, 333-351 (2016)). Например, система секвенирования NextSeq и система секвенирования Mini-Seq, разработанные компанией Illumina, используют способ секвенирования на основе двойных флуоресцентных красителей. В таких способах секвенирования идентификации и различения четырех оснований достигают посредством различных комбинаций двух флуоресцентных красителей. Например, четыре основания различают посредством мечения основания A первым флуоресцентным красителем, мечения основания G вторым флуоресцентным красителем, мечения основания C первым и вторым флуоресцентными красителями одновременно, где основание T/U не метят. В таких способах секвенирования для устройства для секвенирования нужна только одна камера, но все еще нужно по меньшей мере 2 монохроматических источника возбуждающего света. Следовательно, стоимость изготовления аппарата для секвенирования с использованием флуоресцентных красителей двух типов все еще относительно высока и объем аппарата все еще относительно велик. Кроме того, качество секвенирования в способе секвенирования на основе двойных флуоресцентных красителей значительно ниже по сравнению со способом секвенирования с использованием четырех флуоресцентных красителей, преимущественно потому, что сложно отличать двухцветную флуоресценцию от одноцветной флуоресценции, и, следовательно, точность снижена.

Секвенатор третьего поколения из Oxford Nanopore очень мал благодаря его принципу секвенирования. Его даже можно переносить в космос и затем выполнять эксперименты по секвенированию. По сравнению с большим секвенатором второго поколения, секвенатор третьего поколения демонстрирует свое превосходство в этом отношении. Однако секвенатор третьего поколения имеет высокую частоту ошибок, которая ограничивает ценность его применения. Следовательно, нужно разрабатывать новый способ секвенирования для того, чтобы дополнительно снижать стоимость изготовления и объем устройства для секвенирования, а также обеспечивать высокое качество секвенирования.

Сущность изобретения

Для того чтобы решать вышеуказанные технические проблемы, авторы изобретения из настоящей заявки разработали новый способ секвенирования, в котором используют всего один флуоресцентный краситель или два флуоресцентных красителя, которые способны испускать один и тот же флуоресцентный сигнал в одних и тех же условия возбуждения для того, чтобы различать четыре основания. Таким образом, аппарату для секвенирования для осуществления способа секвенирования по настоящему изобретению нужны только один источник возбуждающего света и одна камера, что тем самым значительно снижает стоимость изготовления и объем аппарата для секвенирования. Например, устройство для секвенирования, используемое для способа секвенирования по настоящему изобретению, можно в целях удобства носить для незамедлительного/локального обнаружения. Кроме того, способ секвенирования по настоящему изобретению имеет высокое качество секвенирования, сравнимое с таковым способов секвенирования на основе четырех флуоресцентных красителей, и его можно использовать в различных применениях секвенирования.

Таким образом, в одном из аспектов, изобретение относится к способу секвенирования молекулы нуклеиновой кислоты, включающему стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и четырех соединений для того, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу; где четыре соединения представляют собой соответственно производные нуклеотидов A, (T/U), C и G и имеют способность комплементарного спаривания оснований; и каждое из четырех соединений имеет гидроксильную группу (-OH) в 3'-положении рибозы или дезоксирибозы, которую защищают защитной группой; и первое соединение и третье соединение неспособны испускать флуоресцентный сигнал (например, не несут флуорофор), второе соединение способно испускать флуоресцентный сигнал (например, несет флуорофор) и четвертое соединение не испускает флуоресцентный сигнал или испускает тот же флуоресцентный сигнал, что и второе соединение (например, несет флуорофор, где флуорофор является таким же, как флуорофор во втором соединении; или флуорофор имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и флуорофор во втором соединении);

(3) отжиг праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты, и вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию, образует дуплекс, прикрепленный к основе;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал; или

(ii) если четвертое соединение не испускает флуоресцентный сигнал, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение и позволяет четвертому соединению испускать тот же флуоресцентный сигнал, что и второе соединение (например, посредством модификации четвертого соединения для того, чтобы нести флуорофор, где флуорофор представляет собой то же, что и флуорофор второго соединения или имеет тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение и позволяет третьему соединению испускать тот же флуоресцентный сигнал, что и второе соединение (например, посредством модификации третьего соединения для того, чтобы нести флуорофор, который представляет собой то же самое, что и флуорофор второго соединения, или имеет тот же спектр испускания, что и флуорофор второго соединения) и способна удалять флуоресцентный сигнал четвертого соединения (например, удалять флуорофор на четвертом соединении или гасить флуоресцентный сигнал, испускаемый флуорофором на четвертом соединении); и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления способ дополнительно включает стадии:

(8) проведения обработки дуплекса или выращенной нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка способна удалять защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном на 3'-конце растущей нити нуклеиновой кислоты, и удалять флуоресцентный сигнал на дуплексе или растущей нити нуклеиновой кислоты, если присутствует; и

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления реакции полимеризации нуклеотидов и указанных четырех соединений для того, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу, и затем проведения стадий с (4) до (7).

Необязательно, способ дополнительно включает следующую стадию (11):

(11) повторения стадий (8)-(10) одие или несколько раз.

В способе по настоящему изобретению, если, на стадии (4), первое соединение встраивают на 3'-конце растущей нити нуклеиновой кислоты, то, поскольку само первое соединение не несет флуорофор и на него не оказывает воздействия обработка на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7).

Если, на стадии (4), второе соединение встраивают на 3'-конце растущей нити нуклеиновой кислоты, то, поскольку самое второе соединение несет флуорофор и на него не оказывает воздействия обработка на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7).

Если, на стадии (4), третье соединение встраивают на 3'-конце растущей нити нуклеиновой кислоты, то (i) поскольку само третье соединение не несет флуорофор, его не обнаруживают на стадии (5); и (ii) поскольку третье соединение выполнило обработку со стадии (6) и теряет свой флуоресцентный сигнал, флуоресцентный сигнал обнаруживают на стадии (7).

Если, на стадии (4), четвертое соединение встраивают на 3'-конце растущей нити нуклеиновой кислоты, то, (i) поскольку само четвертое соединение несет флуорофор или несет флуорофор после обработки на стадии (5), флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку четвертое соединение теряет свой флуоресцентный сигнал из-за обработки со стадии (6), флуоресцентный сигнал не обнаруживают на стадии (7).

Следовательно, в некоторых предпочтительных вариантах осуществления, тип соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), определяют в соответствии с результатами обнаружения со стадий (5) и (7), где,

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс не испускает флуоресцентный сигнал, определяют, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), представляет собой первое соединение;

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс испускает флуоресцентный сигнал, определяют, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), представляет собой второе соединение;

когда результат обнаружения со стадии (5) является таким, что дуплекс не испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс испускает флуоресцентный сигнал, определяют, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), представляет собой третье соединение;

когда результат обнаружения со стадии (5) является таким, что сигнал дуплекса испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс не испускает флуоресцентный сигнал, определяют, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), представляет собой четвертое соединение;

необязательно, на основе принципа комплементарного спаривания оснований, тип основания в соответствующем положении молекулы нуклеиновой кислоты, подлежащей секвенированию, определяют в соответствии с типом соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4).

В некоторых образцовых вариантах осуществления, способ по настоящему изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов, и первого, второго, третьего и четвертого соединений, которые имеют структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R5b независимо представляют собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал;

R7a представляет собой флуорофор, способный испускать флуоресцентный сигнал (Dye1), или реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования, или один элемент пары связывания;

и Dye и Dye имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно, между R5b и R7a, имеет место реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, и R7a представляет собой Dye1, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал; или

(ii) если четвертое соединение не испускает флуоресцентный сигнал и R7a представляет собой реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования, или представляет собой один элемент пары связывания, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение и позволяет R7a в четвертом соединении специфически взаимодействовать с/связываться с или выполнять вторую реакцию биоортогонального лигирования со средством (например, другим элементом пары связывания или соединения, который способен выполнять вторую реакцию биоортогонального лигирования с R7a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент пары связывания, несущий флуорофор, имеет структуру: R7b-L-Dye1; где R7b представляет собой другой элемент пары связывания, L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye; или

соединение, способное выполнять вторую реакцию биоортогонального лигирования с R7a и несущее флуорофор, имеет следующую структуру: R7b-L-Dye1; где R7b представляет собой группу, способную выполнять вторую реакцию биоортогонального лигирования с R7a, L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение, и позволяет R5a в третьем соединении осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий структуру, отличную от, но имеющий тот же спектр испускания, что и флуорофор второго соединения), тем самым флуорофор в средстве вводят в третье соединение и заставляют третье соединение испускать флуоресцентный сигнал; и указанная обработка (i) позволяет R5b в четвертом соединении осуществлять реакцию биоортогонального расщепления, тем самым удаляя флуорофор в четвертом соединении, или (ii) позволяет R8 в четвертом соединении вступать в реакцию с соединением, несущим гасящую группу, чтобы осуществлять третью реакцию ортогонального лигирования, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 в четвертом соединении; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a и R4b осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу), и, удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a или R4b), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления способ дополнительно включает стадию:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, способ по настоящему изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой (i) один элемент второй пары связывания и представляет собой один элемент третьей пары связывания; или

представляет собой (ii) только один элемент третьей пары связывания; и R6a представляет собой Dye1 или R6a также связывают с -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофоры, способные испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5) (i) если четвертое соединение не испускает флуоресцентный сигнал, R6a представляет собой один элемент второй пары связывания, и между тем он представляет собой один элемент третьей пары связывания, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством (например, другим элементом второй пары связывания), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий структуру, отличную от, но имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

другой элемент второй пары связывания, несущий флуорофор, имеет следующую структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент второй пары связывания, и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и Dye; или

(ii) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, R6a представляет собой только один элемент третьей пары связывания, и R6a представляет собой Dye1 или также соединяют с -L3-Dye1, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение и позволяет R5a в третьем соединении специфически связываться с другим элементом первой пары связывания, несущим флуорофор, вводя флуорофор в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и указанная обработка (i) способна заставлять R6a в четвертом соединении специфически связываться с другим элементом третьей пары связывания, несущим гасящую группу, чтобы гасить флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении, или (ii) способна заставлять R8 в четвертом соединении выполнять реакцию ортогонального лигирования с соединением, несущим гасящую группу для того, чтобы гасить флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении,

другой элемент первой пары связывания, несущий флуорофор, имеет структуру: R5b-L5-Dye3; где R5b представляет собой другой элемент первой пары связывания и L5 независимо представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и флуорофор во втором соединении, или имеет другую структуру, но тот же спектр испускания; и,

другой элемент третьей пары связывания, несущий гасящую группу, имеет структуру: R6c-L6-Que; где R6c представляет собой другой элемент второй пары связывания и L6 независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, или R4c осуществлять реакцию биоортогонального расщепления, делая соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, имеющим свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу) и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых предпочтительных вариантах осуществления, способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, имеющего структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

R6a представляет собой (i) один элемент первой пары связывания и представляет собой один элемент второй пары связывания; или

представляет собой (ii) только один элемент второй пары связывания, и R6a представляет собой Dye1 или R6a также связывают с -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал; Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5) (i) если четвертое соединение не испускает флуоресцентный сигнал, R6a представляет собой один элемент первой пары связывания и представляет собой один элемент второй пары связывания, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством (например, другим элементом первой пары связывания), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, который имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

другой элемент первой пары связывания, несущий флуорофор, имеет структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент первой пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет структуру, отличную от Dye, но имеет тот же или по существу тот же спектр испускания, что и Dye; или

(ii) если четвертое соединение не испускает тот же флуоресцентный сигнал, что и второе соединение, R6a представляет собой только один элемент второй пары связывания и R6a представляет собой Dye1 или R6a также связывают с -L3-Dye1, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение, и позволяет R5a в третьем соединении осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, тот же флуорофор, что и флуорофор второго соединения, или флуорофор, имеющий спектр испускания, тот же или по существу тот же, что и спектр испускания флуорофора второго соединения), тем самым вводя флуорофор в средстве в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и указанная обработка (i) способна заставлять R6a в четвертом соединении специфически связываться с другим элементом второй пары связывания, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении, или (ii) способна заставлять R8 в четвертом соединении выполнять вторую реакцию ортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении; где

другой элемент второй пары связывания, несущий гасящую группу имеет структуру: R6c-L'-Que; где R6c представляет собой другой элемент второй пары связывания, L' независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу) и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых предпочтительных вариантах осуществления, способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, имеющего структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы тем самым формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой флуорофор, способный испускать флуоресцентный сигнал (Dye1), реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования, и/или один элемент второй пары связывания;

L1 независимо представляют собой линкерную группу или отсутствуют;

L2 независимо представляют собой линкерную группу или отсутствуют;

Dye и Dye1 представляют флуорофоры, способные испускать флуоресцентный сигнал; и Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, и R6a представляет собой Dye1, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, цепь или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал; или

(ii) если четвертое соединение не испускает флуоресцентный сигнал и R6a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования, или представляет собой один элемент второй пары связывания, проведения обработки дуплекса или растущей нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение и позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со или выполнять первую реакцию биоортогонального лигирования со средством (например, другим элементом второй пары связывания или соединением, способным выполнять первую реакцию биоортогонального лигирования с R6a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий спектр испускания, тот же или по существу тот же, что и спектр испускания флуорофора второго соединения); после этого, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

другой элемент второй пары связывания, несущий флуорофор, имеет следующую структуру: R6b-L'-Dye1; где R6b представляет собой другой элемент второй пары связывания, L' независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет структуру, отличную от Dye, но имеет тот же или по существу тот же спектр испускания, что и Dye; или

соединение, способное выполнять первую реакцию биоортогонального лигирования с R6a и несущее флуорофор, имеет следующую структуру: R6b-L'-Dye1; где R6b представляет собой группу, способную выполнять первую реакцию биоортогонального лигирования с R6a, L' независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет структуру, отличную от Dye, но имеет тот же или по существу тот же спектр испускания, что и Dye;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение и позволяет R5a в третьем соединении специфически связываться с другим элементом первой пары связывания, несущим флуорофор, чтобы вводить флуорофор в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; где обработка (i) позволяет R4c в четвертом соединении осуществлять реакцию биоортогонального расщепления для того, чтобы удалять флуорофор в четвертом соединении, или (ii) позволяет R8 в четвертом соединении осуществлять вторую реакцию ортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 в четвертом соединении; где

другой элемент первой пары связывания, несущий флуорофор, имеет следующую структуру: R5b-L-Dye2; где R5b представляет собой другой элемент первой пары связывания, L независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал, где флуорофор представляет собой то же, что и флуорофор второго соединения, или имеет спектр испускания, тот же или по существу тот же, что и флуорофор второго соединения; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a и R4b осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу) и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a или R4b), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления способ по настоящему изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой один элемент второй пары связывания, необязательно, R6a представляет собой Dye1 или также связывают в -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофоры, способные испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение не испускает флуоресцентный сигнал, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством (например, другим элементом второй пары связывания), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и флуорофор во втором соединении); после этого, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент второй пары связывания, несущий флуорофор, имеет следующую структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент второй пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и Dye; между тем, R6b представляет собой один элемент третьей пары связывания; или

(ii) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение и позволяет R5a в третьем соединении специфически взаимодействовать с/связываться с другим элементом первой пары связывания, несущим флуорофор, тем самым вводя флуорофор в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и обработка (i) позволяет R6b специфически взаимодействовать с/связываться с другим элементом R6c третьей пары связывания, тем самым диссоциируя конъюгат между R6b и R6a и заставляя четвертое соединение терять его флуорофор, или (ii) позволяет R8 в четвертом соединении осуществлять реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении; где

другой элемент первой пары связывания, несущий флуорофор, имеет следующую структуру: R5b-L5-Dye3; где R5b представляет собой другой элемент первой пары связывания и L5 независимо представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, способный испускать флуоресцентный сигнал, где флуорофор имеет ту же структуру, что и флуорофор во втором соединении, или имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и флуорофор во втором соединении;

(7) удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе d, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу), и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых предпочтительных вариантах осуществления, способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

R6a представляет собой один элемент первой пары связывания, необязательно, R6a представляет собой Dye1 или также связывают в -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал; Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений на 3'-конце растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение не испускает флуоресцентный сигнал, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством (например, другим элементом первой пары связывания), несущим флуорофор (например, флуорофор, который имеет ту же структуру, что и флуорофор второго соединения, или флуорофор, который имеет структуру, отличную от, но имеет тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс и растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент первой пары связывания, несущий флуорофор, имеет следующую структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент первой пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или флуорофор имеет структуру, отличную от, но тот же или по существу тот же спектр испускания, что и Dye; между тем, R6b представляет собой один элемент второй пары связывания; или

(ii) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс и растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение и позволяет R5a в третьем соединении осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, такой же как флуорофор второго соединения, или флуорофор, имеющий спектр испускания, такой же или по существу такой же, как у флуорофора второго соединения), тем самым вводя флуорофор в средстве в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и обработка (i) позволяет R6b специфически взаимодействовать с/связываться с другим элементом R6c второй пары связывания, тем самым диссоциируя конъюгат между R6b и R6a и заставляя четвертое соединение терять его флуорофор, или (ii) позволяет R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении; где

другой элемент второй пары связывания, несущий гасящую группу, имеет следующую структуру: R6c-L'-Que; где R6c представляет собой другой элемент второй пары связывания, L' независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2;

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу) и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(11) повторения стадий (8)-(10) один или несколько раз.

В другом аспекте изобретение относится к набору, содержащему четыре соединения, как определено выше. В некоторых предпочтительных вариантах осуществления набор по изобретению содержит четыре соединения (т. е. первое, второе, третье и четвертое соединения), где:

четыре соединения представляют собой производные нуклеотидов A, (T/U), C и G, соответственно, и обладают способностью комплементарного спаривания оснований; и

каждое из четырех соединений имеет гидроксильную группу (-OH) в 3'-положении рибозы или дезоксирибозы, которое защищают защитной группой; и защитную группу можно удалять;

первое соединение и третье соединение неспособны испускать флуоресцентный сигнал (например, не несут флуорофор), второе соединение способно испускать флуоресцентный сигнал и четвертое соединение неспособно испускать флуоресцентный сигнал или способно испускать тот же флуоресцентный сигнал, что и второе соединение (например, несет флуорофор, где флуорофор является таким же, как флуорофор во втором соединении, или флуорофор имеет структуру, отличающуюся от, но имеет тот же или по существу тот же спектр испускания, что и флуорофор во втором соединении); и,

третье соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, при обработке (например, за счет того, что третье соединение несет тот же флуорофор, что и флуорофор второго соединения, или за счет того, что третье соединение несет флуорофор, который имеет тот же или по существу тот же спектр испускания, что и флуорофор второго соединения);

где, если четвертое соединение не испускает тот же флуоресцентный сигнал, что и второе соединение, флуоресцентный четвертого соединения можно удалять при обработке (например, посредством удаления флуорофора или посредством гашения флуоресцентного сигнала, испускаемого флуорофором);

если четвертое соединение не испускает флуоресцентный сигнал, четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, после первой обработки (например, за счет того, что четвертое соединение несет тот же флуорофор, что и флуорофор второго соединения, или за счет того, что четвертое соединение несет флуорофор, который имеет тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); и флуоресцентный сигнал четвертого соединения можно удалять после второй обработки (например, посредством удаления флуорофора или посредством гашения флуоресцентного сигнала, испускаемого флуорофором).

В некоторых предпочтительных вариантах осуществления набор по настоящему изобретению дополнительно содержит: средство и/или устройство для извлечения молекулы нуклеиновой кислоты из образца; средство для предварительной обработки молекулы нуклеиновой кислоты; основу для прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию; средство для прикрепления (например, ковалентного или нековалентного связывания) молекулы нуклеиновой кислоты, подлежащей секвенированию, с основой; праймер для инициации полимеризации нуклеотидов; полимеразу для осуществления реакции полимеризации нуклеотидов; один или несколько буферных растворов; один или несколько промывающих растворов; или любое их сочетание.

КРАТКОЕ ОПИСАНИЕ ФИГУР

На фиг. 1 представлены результаты сравнения экспериментальных фотографий 1 и 2, полученных в экспериментальном примере 1.

На фиг. 2 представлены результаты сравнения экспериментальных фотографий 1 и 2, полученных в экспериментальном примере 2.

На фиг. 3 представлены результаты сравнения экспериментальных фотографий 1 и 2, полученных в экспериментальном примере 3.

На фиг. 4 представлены результаты сравнения экспериментальных фотографий 1 и 2, полученных в экспериментальном примере 4.

Информация о последовательностях

Информация о последовательностях, используемых в настоящем изобретении, приведена в следующей таблице:

SEQ
ID
Последовательность Длина Описание SEQ
ID
Последовательность Длина Описание
1 TAGGTCCGAT 10 п. о. Синтетический олигонуклеотид 19 TGTCTGCGAA 10 п. о. Синтетический олигонуклеотид
2 GGACGGAATC 10 п. о. Синтетический олигонуклеотид 20 ATTGGTACAA 10 п. о. Синтетический олигонуклеотид
3 CTTACTGCCG 10 п. о. Синтетический олигонуклеотид 21 CGATTGTGGT 10 п. о. Синтетический олигонуклеотид
4 ACCTAATTGA 10 п. о. Синтетический олигонуклеотид 22 ACAGACTTCC 10 п. о. Синтетический олигонуклеотид
5 TTCGTATCCG 10 п. о. Синтетический олигонуклеотид 23 TCCACACTCT 10 п. о. Синтетический олигонуклеотид
6 GGTAACGAGC 10 п. о. Синтетический олигонуклеотид 24 CACCACAAGC 10 п. о. Синтетический олигонуклеотид
7 CAACGTATAA 10 п. о. Синтетический олигонуклеотид 25 TAGAGGACAA 10 п. о. Синтетический олигонуклеотид
8 ACGTCGCGTT 10 п. о. Синтетический олигонуклеотид 26 CCTAGCGAAT 10 п. о. Синтетический олигонуклеотид
9 TTCTGCTAGC 10 п. о. Синтетический олигонуклеотид 27 GTAGTCATCG 10 п. о. Синтетический олигонуклеотид
10 AGGAAGATAG 10 п. о. Синтетический олигонуклеотид 28 GCTGAGCTGT 10 п. о. Синтетический олигонуклеотид
11 GCTCTTGCTT 10 п. о. Синтетический олигонуклеотид 29 AACCTAGATA 10 п. о. Синтетический олигонуклеотид
12 CAAGCACGCA 10 п. о. Синтетический олигонуклеотид 30 TTGCCATCTC 10 п. о. Синтетический олигонуклеотид
13 CGGCAATCCG 10 п. о. Синтетический олигонуклеотид 31 AGATCTTGCG 10 п. о. Синтетический олигонуклеотид
14 ATCAGGATTC 10 п. о. Синтетический олигонуклеотид 32 CGCTATCGGC 10 п. о. Синтетический олигонуклеотид
15 TCATTCCAGA 10 п. о. Синтетический олигонуклеотид 33 GCAACGATGG 10 п. о. Синтетический олигонуклеотид
16 GATGCTGGAT 10 п. о. Синтетический олигонуклеотид 34 TAATCGTTCA 10 п. о. Синтетический олигонуклеотид
17 GTGAGTGATG 10 п. о. Синтетический олигонуклеотид 35 GTTCGCTCTA 10 п. о. Синтетический олигонуклеотид
18 GAGTCAGCTG 10 п. о. Синтетический олигонуклеотид 36 TCTCACACAT 10 п. о. Синтетический олигонуклеотид

Подробное описание изобретения

В настоящем изобретении все технические и научные термины, используемые в настоящем описании, имеют то же значение, как их обычно понимает специалист в области, к которой относится изобретение, если не определено иное. В вариантах осуществления настоящего изобретения можно использовать способы и материалы, подобные или эквивалентные тем, что описаны в настоящем описании, и образцовые подходящие способы и материалы описаны далее. Все публикации, патентные заявки, патенты и другие источники включены в настоящее описание посредством ссылки. Кроме того, материалы, способы и примеры являются только иллюстративными и не ограничивающими. Кроме того, для лучшего понимания настоящего изобретения, далее приведены определения и объяснения связанных терминов.

Как используют в настоящем описании, термин «основа» относится к любому материалу (твердому или полутвердому), который допускает стабильное прикрепление нуклеиновой кислоты, такому как латексная гранула, гранула декстрана, полистирол, полипропилен, полиакриламидный гель, тонкий слой золота, стеклянная и кремниевая пластина. В некоторых образцовых вариантах осуществления основа является оптически прозрачной, такой как стекло. Как используют в настоящем описании, «стабильное прикрепление» обозначает, что связь между молекулой нуклеиновой кислоты и основой достаточно сильна, так что молекула нуклеиновой кислоты не будет откреплена от основы вследствие условий, используемых в различных реакциях или обработках (например, реакции полимеризации, реакции биоортогонального расщепления, реакции биоортогонального лигирования и промывающей обработке).

Как используют в настоящем описании, термин «прикреплять» или «связывать» предназначен покрывать любую форму связи, такую как ковалентная связь и нековалентная связь. В некоторых образцовых вариантах осуществления молекулу нуклеиновой кислоты предпочтительно связывают с основой посредством ковалентной связи.

Как используют в настоящем описании, термин «фрагментирование» относится к процессу превращения большого фрагмента нуклеиновой кислоты (например, большого фрагмента ДНК) в маленький фрагмент нуклеиновой кислоты (например, маленький фрагмент ДНК). В некоторых вариантах осуществления термин «большой фрагмент нуклеиновой кислоты» предназначен охватывать молекулы нуклеиновой кислоты (например, ДНК) более 5 т. о., более 10 т. о., более 25 т. о. (например, ДНК), например, более 500 т. о., более 1 млн о., более 5 млн о. или более крупные молекулы нуклеиновой кислоты (например, ДНК).

Как используют в настоящем описании, термин «заполнение конца» относится к процессу дополнения конца молекулы нуклеиновой кислоты, имеющей свисающий конец для того, чтобы формировать молекулу нуклеиновой кислоты, имеюую тупой конец.

Как используют в настоящем описании, термины «адаптер» и «адаптерная последовательность» используют взаимозаменяемо. Как используют в настоящем описании, термины «адаптер» и «адаптерная последовательность» относятся к сегменту олигонуклеотидной последовательности, введенному искусственно на 5'-конце и/или 3'-конце молекулы нуклеиновой кислоты. Адаптер в целом может содержать одну или несколько областей для достижения конкретной функции. Таким образом, когда адаптер вводят искусственно на 5'- и/или 3'-конце молекулы нуклеиновой кислоты, адаптер будет выполнять конкретную функцию, тем самым облегчая последующее применение. Например, адаптер может содержать одну или несколько областей связывания праймеров для того, чтобы содействовать связыванию праймера. В некоторых образцовых вариантах осуществления, адаптер может содержать одну или несколько областей связывания праймеров, например, область связывания праймера, способную к гибридизации с праймером для амплификации, и/или область связывания праймера, способну к гибридизации с праймером для использования в реакции секвенирования. В некоторых предпочтительных вариантах осуществления, адаптер содержит универсальную адаптерную последовательность, способную к гибридизации с универсальным праймером, например, универсальную адаптерную последовательность, способную к гибридизации с универсальным праймером амплификации и/или универсальным праймером секвенирования. Таким образом, молекулу нуклеиновой кислоты, несущую адаптер, можно в целях удобства амплифицировать и/или секвенировать с использованием универсального праймера амплификации и/или универсального праймера секвенирования. В некоторых образцовых вариантах осуществления адаптер также может содержать метку или последовательность метки.

Как используют в настоящем описании, термины «метка» и «последовательность метки» можно использовать взаимозаменяемо. Как используют в настоящем описании, термины «метка» и «последовательность метки» относятся к сегменту олигонуклеотидной последовательности с конкретной последовательностью оснований, введенной на 5'- и/или 3'-конце молекулы нуклеиновой кислоты. Метку широко используют для того, чтобы идентифицировать/различать источник молекулы нуклеиновой кислоты. Например, различные метки можно вводить в различные молекулы нуклеиновой кислоты из различных источников, тем самым, когда эти молекулы нуклеиновой кислоты из различных источников смешивают вместе, источник каждой молекулы нуклеиновой кислоты можно точно определять с помощью уникальной последовательности метки, которую несет каждая молекула нуклеиновой кислоты. Последовательность метки может иметь любую длину, такую как 2-50 п. о., такую как 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 п. о., в соответствии с фактическим нуждами.

Как используют в настоящем описании, термин «гибридизация» в целом относится к гибридизации при строгих условиях. Приемы гибридизации хорошо известны в области молекулярной биологии. Для иллюстративных целей строгие условия включвают, например, умеренно строгие условия (например, гибридизацию проводят приблизительно при 45°C в 6× хлориде натрия/цитрате натрия (SSC), после чего следует одно или несколько промываний в 0,2× SSC/0,1% SDS приблизительно при 50-65°C); очень строгие условия (например, гибридизацию проводят приблизительно при 45°C в 6× SSC, после чего следует одно или несколько промываний в 0,1× SSC/0,2% SDS приблизительно при 68°C); и специалистам в данной области известны другие строгие условия гибридизации (см., например, Ausubel, F.M., et al., 1989, Current Protocols in Molecular Biology, том 1, Green Publishing Associates, Inc., и John Wiley & Sons, Inc., New York, стр. 6.3.1-6.3.6 и 2.10.3).

Как используют в настоящем описании, выражение «реакционная система, содержащая фазу раствора и твердую фазу» обозначает, что реакционная система по настоящему изобретению содержит основу и вещество, прикрепленное к основе (твердая фаза), и вещество (фаза раствора), растворенное в растворе/растворителе. Соответственно, выражение «удаление фазы раствора реакционной системы» обозначает удаление раствора в реакционной системе и вещества (фазы раствора), содержащегося в нем, и сохранение только основы в реакционной системе и вещества (твердой фазы), прикрепленного к основе. В контексте настоящего изобретения вещество (твердая фаза), прикрепленное к основе, может содержать молекулу нуклеиновой кислоты, подлежащую секвенированию, растущую нить нуклеиновой кислоты и/или дуплекс, образованный молекуой нуклеиновой кислоты, подлежащей секвенированию, и растущей нитью нуклеиновой кислоты.

Как используют в настоящем описании, термин «праймер» относится к олигонуклеотидной последовательности, которая образует гибрид с комплементарной последовательностью и инициирует специфическую реакцию полимеризации. В целом, последовательность праймера выбирают/разрабатывают для того, чтобы иметь максимальную активность гибридизации с комплементарной последовательностью, при этом имея очень низкую неспецифическую активность гибридизации для других последовательностей, тем самым минимизируя неспецифическую амплификацию. Способы разработки праймеров хорошо известны специалистам в данной области, и их можно осуществлять с использованием коммерчески доступного программного обеспечения (например, Primer Premier версии 6.0, Oligo версии 7.36 и т. д.).

Как используют в настоящем описании, термин «полимераза» относится к ферменту, способному выполнять реакцию полимеризации нуклеотидов. Такой фермент способен вводить нуклеотид, спаренный с нуклеотидом в положении, соответствующем матричной нуклеиновой кислоте, на 3'-конце растущей нити нуклеиновой кислоты в соответствии с принципом комплементарного спаривания оснований.

Как используют в настоящем описании, выражения «A, (T/U), C и G» предназначены для того, чтобы охватывать два случая: «A, T, C и G» и «A, U, C и G». Таким образом, выражение «четыре соединения представляют собой производны нуклеотидов A, (T/U), C и G, соответственно» предназначено для того, чтобы обозначать, что четыре соединения представляют собой производные нуклеотидов A, T, C и G, соответственно, или производные нуклеотидов A, U, C и G, соответственно.

Как используют в настоящем описании, выражение «соединение, обладающее способностью комплементарного спаривания оснований» обозначает, что соединение способно к спариванию с соответствующим основанием и образованию водородной связи в соответствии с принципом комплементарного спаривания оснований. В соответствии с принципом комплементарного спаривания оснований, основание A может образовывать пару с основанием T или U, а основание G может образовывать пару с основанием C. Следовательно, когда соединение, обладающее способностью комплементарного спаривания оснований, представляет собой производное нуклеотида A, оно может образовывать пару с основанием T или U; когда соединение, обладающее способностью комплементарного спаривания оснований, представляет собой производное нуклеотида T или U, оно может образовывать пару с основанием A; когда соединение, обладающее способностью комплементарного спаривания оснований, представляет собой производное нуклеотида C, оно может образовывать пару с основанием G; когда соединение, обладающее способностью комплементарного спаривания оснований, представляет собой производное нуклеотида G, оно может образовывать пару с основанием C.

Как используют в настоящем описании, выражение «гидроксил (-OH) защищают защитной группой» обозначает, что H в свободной гидроксильной группе (-OH) заменяют на защитную группу (P) для того, чтобы формировать защищенную гидроксильную группу (-OP). В некоторых предпочтительных вариантах осуществления защитную группу (P) можно удалять, тем самым защищенную гидроксильную группу (-OP) превращают в свободную гидроксильную группу (-OH).

Как используют в настоящем описании, термин «пара связывания» обозначает пару молекул (т. е. два элемента), которые способны взаимодействовать друг с другом посредством специфического нековалентного взаимодействия. В общем случае, два элемента пары связывания полагаются на свою трехмерную структуру для того, чтобы достигать специфического взаимодействия (т. е. специфического распознания и связывания). Типичные пары связывания включают, например, антиген (например, низкомолекулярный антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-растительный лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину и бромдезоксигуанозин в 5-положении и антитело к нему и т. д.

Как используют в настоящем описании, термин «специфическое взаимодействие/связывание» относится к реакции неслучайного взаимодействия/связывания между двумя молекулами, например, взаимодействие между антитела и антигена, на который оно направлено. В некоторых вариантах осуществления присутствие специфического взаимодействия между двумя элементами пары связывания обозначает, что один элемент пары связывания связывается с другим элементом с KD меньше приблизительно 10-5 M, например, меньше приблизительно 10-6 M, 10-7 M, 10-8 M, 10-9 M или 10-10 M или меньше.

Как используют в настоящем описании, термин «KD» относится к равновесной константе диссоциации для взаимодействия двух элементов пары связывания, которую используют для того, чтобы описывать аффинность связывания между двумя элементами. Чем меньше равновесная константа диссоциации, тем прочнее связывание между двумя элементами и выше аффинность между двумя элементами. Обычно один элемент пары связывания связывается с другим элементом с равновесной константой диссоциации (KD) меньше приблизительно 10-5 M, например, меньше приблизительно 10-6 M, 10-7 M, 10-8 M, 10-9 M или 10-10 M или меньше. Различные известные способы можно использовать для того, чтобы определять аффинность связывания двух элементов пары связывания, например, с использованием поверхностного плазмонного резонанса (SPR).

Как используют в настоящем описании, термин «биоортогональная реакция» относится к химической реакции, которая может протекать в организме (например, живой клетке или ткани), не затрагивая биохимическую реакцию самого организма. Биоортогональная реакция обладает высокой активностью и избирательностью при физиологических условиях и ее субстрат и/или механизм реакции редки или отсутствуют в организме, следовательно, она сохраняет хорошую инертность в отношении активных молекул в организме, и ее можно осуществлять in vivo без нарушений. Биоортогональную реакцию можно использовать для того, чтобы метить биомакромолекулу или активное низкомолекулярное соединение, и можно применять в молекулярной визуализации, скрининге лекарственных средств и т. п.

Как используют в настоящем описании, термин «реакция биоортогонального расщепления» относится к биоортогональной реакции, в которой реакционноспособная группя в субстрате выполняет расщепление ковалентной связи для того, чтобы формировать продукт. Реакции, которые можно использовать в качестве реакции биоортогонального расщепления, включают, но не ограничиваясь этим, катализируемую Ru реакцию деаллилирования, катализируемую Pd реакцию депропаргилирования, катализируемую Cu реакцию депропаргилирования, специфическую IED-DA-индуцированную реакцию «клик и высвобождение» и вызываемое напряжением индуцированное алкен-азидным циклоприсоединение арил-азидное восстановление.

Как используют в настоящем описании, термин «реакция биоортогонального лигирования» относится к биоортогональной реакции, в которой реакционноспособная группа в субстрате выполняет формирование ковалентной связи для того, чтобы формировать продукт. Реакции, которые можно использовать в качестве реакции биоортогонального лигирования включают, но не ограничиваясь этим, лигирование Штаудингера, катализируемое Cu азид-алкиновое циклоприсоединение (AAC), вызываемое напряжением азид-алкиновое циклоприсоединение (SPAAC), реакцию Дильса-Алдера с обратными электронными требованиями (IEDDA), катализируемое Pd перекрестное сочетание Сузуки, реакцию формирования дисульфидной связи для тиола и производных тиолов.

Как используют в настоящем описании, термин «реакционноспособная группа» относится к группе, способной выполнять химическую реакцию. Выражение «реакционноспособная группа, способная выполнять реакцию биоортогонального лигирования» обозначает, что реакционноспособная группа способна выполнять реакцию биоортогонального лигирования с другой реакционноспособной группой (комплементарная группа) и образует ковалентную связь между двумя реакционноспособными группами, что ведет к ковалентной связи между различными соединениями, соответственно, содержащими две реакционноспособные группы, или между различными фрагментами одного соединения, содержащего две реакционноспособные группы. Выражение «реакционноспособная группа, способная выполнять реакцию биоортогонального расщепления» обозначает, что реакционноспособная группа способна выполнять реакцию биоортогонального расщепления и вызывает отщепление или отсоединение реакционноспособной группы или ее части от соединения, содержащего реакционноспособную группу.

Как используют в настоящем описании, термин «циклоенилиден» включает как двухвалентную группу, получаемую посредством элиминации двух атомов водорода с одного и того же атома углерода на циклоолефине, так и двухвалентную группу, получаемую посредством элиминации одного атома водорода на каждом из двух атомов углерода на циклоолефине.

Как используют в настоящем описании, обозначают транс-циклооктен.

(1) Способ секвенирования

Авторы изобретения в настоящей заявке разработали новый способ секвенирования, в котором используют один флуоресцентный краситель для того, чтобы различать четыре основания.

Таким образом, в одном из аспектов изобретение относится к способу секвенирования молекулы нуклеиновой кислоты, включающему стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, прикрепленной к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и четырех соединений для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу; где четыре соединения представляют собой, соответственно производные, нуклеотидов A, (T/U), C и G и обладают способностью комплементарного спаривания оснований; и каждое из четырех соединений имеет гидроксильную группу (-OH) в 3'-положении рибозы или дезоксирибозы, которую защищают защитной группой; и первое соединение и третье соединение неспособны испускать флуоресцентный сигнал (например, не несут флуорофор), второе соединение способно испускать флуоресцентный сигнал (например, несет флуорофор) и четвертое соединение не испускает флуоресцентный сигнал или испускает тот же флуоресцентный сигнал, что и второе соединение (например, несет флуорофор, где флуорофор является таким же, как флуорофор во втором соединении, или флуорофор имеет структуру, отличную от флуорофора во втором соединении, но имеет тот же или по существу тот же спектр испускания, что и флуорофор во втором соединении);

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал; или

(ii) если четвертое соединение не испускает флуоресцентный сигнал, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, но способна заставлять четвертое соединение испускать тот же флуоресцентный сигнал, что и второе соединение (например, посредством модификации четвертого соединения для того, чтобы нести флуорофор, где флуорофор представляет собой то же, что и флуорофор второго соединения, или имеет тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает влияния на первое соединение и второе соединение, но позволяет третьему соединению испускать тот же флуоресцентный сигнал второго соединения (например, посредством модификации третьего соединения для того, чтобы нести флуорофор, где флуорофор представляет собой то же, что и флуорофор во втором соединении, или имеет тот же спектр испускания, что и флуорофор второго соединения), и способна удалять флуоресцентный сигнал четвертого соединения (например, удаляя флуорофор на четвертом соединении или гася флуоресцентный сигнал, испускаемый флуорофором на четвертом соединении); и

(7) удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка способна удалять защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном на 3'-конце растущей нити нуклеиновой кислоты, и удаления флуоресцентного сигнала на дуплексе или растущей нити нуклеиновой кислоты, если присутствует; и

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и четырех соединений для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, и последующего проведения стадий с (4) до (7).

Необязательно способ дополнительно включает следующую стадию (11):

(11) повторения стадий (8)-(10) один или несколько раз.

Молекула нуклеиновой кислоты

В способе по настоящему изобретению, молекула нуклеиновой кислоты, подлежащая секвенированию, может представляьт собой любую молекулу нуклеиновой кислоты, представляющую интерес. В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, содержит дезоксирибонуклеотиды, рибонуклеотиды, модифицированные дезоксирибонуклеотиды, модифицированные рибонуклеотиды или любое их сочетание. В способе по изобретению, молекула нуклеиновой кислоты, подлежащая секвенированию, не ограничена ее типом. В некоторых предпочтительных вариантах осуществления, молекула нуклеиновой кислоты, подлежащая секвенированию, представляет собой ДНК или РНК. В некоторых предпочтительных вариантах осуществления, молекула нуклеиновой кислоты, подлежащая секвенированию, может представлять собой геномную ДНК, митохондриальную ДНК, хлоропластную ДНК, мРНК, кДНК, мкРНК или миРНК. В некоторых предпочтительных вариантах осуществления, молекула нуклеиновой кислоты, подлежащая секвенированию, является линейной или круглой. В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, является двухцепочечной или одноцепочечной. Например, молекула нуклеиновой кислоты, подлежащая секвенированию, может представлять собой одноцепочечную ДНК (оцДНК), двухцепочечную ДНК (дцДНК), одноцепочечную РНК (оцРНК), двухцепочечную РНК (дцРНК) или гибрид ДНК и РНК. В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, представляет собой одноцепочечную ДНК. В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, представляет собой двухцепочечную ДНК.

В способе по изобретению молекула нуклеиновой кислоты, подлежащая секвенированию, не ограничена ее источником. В некоторых предпочтительных вариантах осуществления молекулу нуклеиновой кислоты, подлежащую секвенированию, можно получать из любого источника, например, любой клетки, ткани или организма (например, вируса, бактерии, гриба, растения или животного). В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, происходит от млекопитающего (например, человека, не являющегося человеком примата, грызуна или собаки), растения, птицы, рептилии, рыбы, гриба, бактерии или вируса.

Способ извлечения или получения молекулы нуклеиновой кислоты из клеток, тканей или организма хорошо известны специалистам в данной области. Подходящие способы включают, но не ограничиваясь этим, преципитацию с этанолом, экстрагирование хлороформом и т. п. Подробное описание таких способов можно найти, например, в J. Sambrook et al., Molecular Cloning: A Laboratory Manual, 2-е изд., Cold Spring Harbor Laboratory Press, 1989, и F. M. Ausubel et al., Short Protocols in Molecular Biology, 3-е изд., John Wiley & Sons, Inc., 1995. Кроме того, различные коммерческие наборы можно использовать для того, чтобы извлекать молекулы нуклеиновой кислоты из различных источников, таких как клетки, ткани или организм.

В способе по изобретению молекула нуклеиновой кислоты, подлежащая секвенированию, не ограничена по ее длине. В некоторых предпочтительных вариантах осуществления, молекула нуклеиновой кислоты, подлежащая секвенированию, может составлять по меньшей мере 10 п. о., по меньшей мере 20 п. о., по меньшей мере 30 п. о., по меньшей мере 40 п. о., по меньшей мере 50 п. о., по меньшей мере 100 п. о., по меньшей мере 200 п. о., по меньшей мере 300 п. о., по меньшей мере 400 п. о., по меньшей мере 500 п. о., по меньшей мере 1000 п. о. в длину или по меньшей мере 2000п. о. В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, может составлять 10-20 п. о., 20-30 п. о., 30-40 п. о., 40-50 п. о., 50-100 п. о., 100-200 п. о., 200-300 п. о., 300-400 п. о., 400-500 п. о., 500-1000 п. о., 1000-2000 п. о. или больше 2000 п. о. В некоторых предпочтительных вариантах осуществления молекула нуклеиновой кислоты, подлежащая секвенированию, может иметь длину 10-1000 п. о. для того, чтобы содействовать высокопропускному секвенированию.

В некоторых предпочтительных вариантах осуществления, молекулу нуклеиновой кислоты можно предварительно обрабатывать перед прикреплением молекулы нуклеиновой кислоты к основе. Такая предварительная обработка включает, но не ограничиваясь этим, фрагментирование молекулы нуклеиновой кислоты, комплементацию конца, добавление адаптера, добавление метки, репарацию однонитевого разрыва, амплификацию молекулы нуклеиновой кислоты, выделение и очистку молекулы нуклеиновой кислоты и любое их сочетание.

Например, в некоторых предпочтительных вариантах осуществления молекулу нуклеиновой кислоты можно подвергать фрагментированию для того, чтобы получать молекулу нуклеиновой кислоты подходящей длины. В способе по изобретению фрагментирование молекулы нуклеиновой кислоты (например, ДНК) можно осуществлять любым способом, известным специалистам в данной области. Например, фрагментирование можно осуществлять с помощью ферментативных или механических средств. Механический способ может представлять собой ультразвуковой или физический сдвиг. Ферментативный способ можно осуществлять посредством расщепления с использованием нуклеазы (например, дезоксирибонуклеазы) или рестрикционной эндонуклеазы. В некоторых предпочтительных вариантах осуществления, фрагментирование ведет к концу с неизвестной последовательностью. В некоторых предпочтительных вариантах осуществления фрагментирование ведет к концу с известной последовательностью.

В некоторых предпочтительных вариантах осуществления в ферментативном способе используют ДНКазу I для того, чтобы фрагментировать молекулу нуклеиновой кислоты. ДНКаза I представляет собой универсальный фермент, который неспецифически расщепляет двухцепочечную ДНК (дцДНК) для того, чтобы высвобождать 5'-фосфорилированные динуклеотидные, тринуклеотидные и олигонуклеотидные продукты. ДНКаза I обладает оптимальной активностью в буфере, содержащем Mn2+, Mg2+ и Ca2+, но не другие соли, и ее широко используют для того, чтобы фрагментировать большой ДНК-геном на небольшие фрагменты ДНК, и небольшие получаемые фрагменты ДНК впоследствии можно использовать для того, чтобы конструировать ДНК-библиотеку.

Характерная фрагментация ДНКазы I будет вести к случайному расщеплению молекул ДНК (т. е. вне зависимости от последовательности), и, когда используют в присутствии буфера, содержащего ионы марганца, преобладающе продуцировать фрагменты дцДНК с тупыми концами (Melgar, E. and D. A. Goldthwait.1968. Deoxyribonucleic acid nucleases. II. The effects of metal on the mechanism of action of deoxyribonuclease I. J. Biol. Chem. 243: 4409). Когда геномную ДНК обрабатывают с использованием ДНКазы I, можно учитывать три фактора: (i) используемое количество фермента (Ед.); (ii) температура расщепления (°C); и (iii) время инкубации (минуты). В целом, крупные фрагменты ДНК или целую геномную ДНК можно расщеплять с использованием ДНКазы I в течение 1-2 минут между 10°C и 37°C для того, чтобы получать молекулы ДНК подходящей длины.

Таким образом, в некоторых предпочтительных вариантах осуществления молекулу нуклеиновой кислоты, представляющую интерес (молекулу нуклеиновой кислоты, подлежащую секвенированию), фрагментируют перед стадией (1). В некоторых предпочтительных вариантах осуществления, молекулу нуклеиновой кислоты, подлежащую секвенированию, подвергают фрагментированию с помощью ферментативных или механических средств. В некоторых предпочтительных вариантах осуществления молекулу нуклеиновой кислоты, подлежащую секвенированию, фрагментируют с помощью ДНКазы I. В некоторых предпочтительных вариантах осуществления молекулу нуклеиновой кислоты, подлежащую секвенированию, подвергают фрагментированию посредством обработки звуком. В некоторых предпочтительных вариантах осуществления фрагментированная молекула нуклеиновой кислоты составляет 50-2000 п. о. в длину, например, 50-100 п. о., 100-200 п. о., 200-300 п. о., 300-400 п. о., 400-500 п. о., 500-1000 п. о., 1000-2000 п. о., 50-1500 п. о. или 50-1000 п. о.

Фрагментирование двухцепочечной молекулы нуклеиновой кислоты (например, дцДНК, геномной ДНК) позволяет получать фрагменты нуклеиновой кислоты, имеющие тупой конец или свисающие концы в один или два нуклеотида в длину. Например, когда геномную ДНК (гДНК) обрабатывают с помощью обработки звуком или ДНКазой I, продукт может содержать фрагмент ДНК, имеющий тупой конец или свисающий конец. В этом случае, конец молекулы нуклеиновой кислоты, имеющий свисающий конец, можно заполнять с использованием полимеразы для того, чтобы формировать молекулу нуклеиновой кислоты, имеющую тупой конец, чтобы содействовать последующим применениям (например, чтобы содействовать лигированию фрагментированной молекулы нуклеиновой кислоты с адаптером).

Таким образом, в некоторых предпочтительных вариантах осуществления, после фрагментирования молекулы нуклеиновой кислоты, подлежащей секвенированию (например, дцДНК), фрагментированную молекулу нуклеиновой кислоты обрабатывают ДНК полимеразой для того, чтобы получать фрагмент ДНК, имеющий тупой конец. В некоторых предпочтительных вариантах осуществления, ДНК полимераза может представлять собой любую известную ДНК полимеразу, такую как ДНК полимераза T4, ДНК полимераза Pfu, ДНК полимераза Кленова. В некоторых случаях, использование ДНК полимеразы Pfu может быть полезным, поскольку ДНК полимераза Pfu не может только дополнять свисающий конец для того, чтобы формировать тупой конец, но также обладает 3'-5' экзонуклеазой активностью и может удалять однонуклеотидные и динуклеотидные свисающие концы для того, чтобы дополнительно увеличивать число фрагментов ДНК с тупыми концами (Costa, G. L. and M. P. Weiner.1994a. Protocols for cloning and analysis of blunt-ended PCR-generated DNA fragments. PCR Methods Appl 3 (5): S95; Costa, G. L.t A. Grafsky and M.P.Wemer. 1994b. Cloning and analysis of PCR-generated DNA fragments. PCR Methods Appl 3 (6): 338; Costa, G. L. and M.P.Weiner.1994c. Polishing with T4 or Pfu polymerase increases the efficiency of cloning of PCR products. Nucleic Acids Res. 22(12): 2423).

В некоторых предпочтительных вариантах осуществления, адаптер/адаптеры можно вводить на 5'- и/или 3'-конец молекулы нуклеиновой кислоты, подлежащей секвенированию. В целом, адаптер представляет собой олигонуклеотидную последовательность, и он может представлять собой любую последовательность любой длины. Адаптер подходящей длины и последовательности можно выбирать с помощью способов, хорошо известных в данной области. Например, адаптер, прикрепленный к концу молекулы нуклеиновой кислоты, подлежащей секвенированию, обычно представляет собой относительно короткую нуклеотидную последовательность между 5 и 100 нуклеотидами в длину (например, 5-10 п. о., 10-20 п. о., 20-30 п. о., 30-40 п. о., 40-50 п. о., 50-100 п. о.). В некоторых предпочтительных вариантах осуществления адаптер может иметь область связывания праймера. Такую область связывания праймера можно отжигать или гибридизовать с праймером и можно использовать для того, чтобы инициировать специфическую полимеразную реакцию. В некоторых предпочтительных вариантах осуществления адаптер имеет одну или несколько областей связывания праймеров. В некоторых предпочтительных вариантах осуществления адаптер имеет одну или несколько областей, которые способны к гибридизации с праймером для амплификации. В некоторых предпочтительных вариантах осуществления, адаптер имеет одну или несколько областей, которые способны к гибридизации с праймером, используемым в реакции секвенирования. В некоторых предпочтительных вариантах осуществления, адаптер вводят на 5'-конце молекулы нуклеиновой кислоты, подлежащей секвенированию. В некоторых предпочтительных вариантах осуществления адаптер вводят на 3'-конце молекулы нуклеиновой кислоты, подлежащей секвенированию. В некоторых предпочтительных вариантах осуществления адаптеры вводят на 5'- и 3'-концах молекулы нуклеиновой кислоты, подлежащей секвенированию. В некоторых вариантах осуществления адаптер содержит универсальную адаптерную последовательность, которая способна к гибридизации с универсальным праймером. В некоторых вариантах осуществления адаптер содержит универсальную адаптерную последовательность, которая способна к гибридизации с универсальным праймером амплификации и/или универсальным праймером секвенирования.

В некоторых предпочтительных вариантах осуществления последовательность метки можно вводить вмолекулу нуклеиновой кислоты, подлежащую секвенированию, или последовательность метки можно вводить в адаптер, описанный выше. Последовательность метки относится к сегменту олигонуклеотида, который имеет конкретную последовательность оснований. В соответствии с фактическим нуждами, последовательность метки может иметь любую длину, такую как 2-50 п. о., такую как 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 п. о. В некоторых предпочтительных вариантах осуществления последовательность метки, содержащую конкретную последовательность, вводят в каждую молекулу нуклеиновой кислоты, подлежащую секвенированию, чтобы содействовать различению источника каждой молекулы нуклеиновой кислоты, подлежащей секвенированию. В некоторых предпочтительных вариантах осуществления, последовательность метки можно вводить непосредственно на 5'- и/или 3'-конце молекулы нуклеиновой кислоты, подлежащей секвенированию. В некоторых предпочтительных вариантах осуществления, последовательность метки можно вводить в адаптер и затем адаптер лигируют с 5'- и/или 3'-концом молекулы нуклеиновой кислоты, подлежащей секвенированию. Последовательность метки можно располагать в любом положении в адаптерной последовательности, таком как 5'- и/или 3'-конец адаптерной последовательности. В некоторых предпочтительных вариантах осуществления, адаптер содержит область связывания праймера и последовательность метки. В некоторых дополнительных предпочтительных вариантах осуществления область связывания праймера содержит универсальную адаптерную последовательность, которую распознает универсальный праймер, и, предпочтительно, последовательность метки можно располагать на 3'-конце области связывания праймера.

В некоторых предпочтительных вариантах осуществления, различные последовательности меток используют для того, чтобы метить/различать молекулы нуклеиновой кислоты из различных источников. В таких вариантах осуществления, предпочтительно, одни и те же последовательности меток вводят в молекулы нуклеиновой кислоты из одного и того же источника, и для каждого источника нуклеиновой кислоты используют уникальную последовательность метки. Впоследствии, молекулы нуклеиновой кислоты из различных источников можно комбинировать для того, чтобы формировать библиотеку, и источник каждой молекулы нуклеиновой кислоты в библиотеке можно идентифицировать/отличать по уникальной последовательности метки, которую несет каждая молекула нуклеиновой кислоты.

Молекулу нуклеиновой кислоты, подлежащую секвенированию можно соединять с адаптером или последовательностью метки посредством способов, хорошо известных в данной области (например, ПЦР или реакция лигирования). Например, если известна часть последовательности молекулы нуклеиновой кислоты, подлежащей секвенированию, молекулу нуклеиновой кислоты, подлежащую секвенированию, можно амплифицировать посредством ПЦР с подходящим праймером ПЦР (который содержит адаптерную последовательность и последовательность, которая способна к специфическому распознаванию молекулы нуклеиновой кислоты, подлежащей секвенированию). Получаемый амплифицированный продукт представляет собой молекулу нуклеиновой кислоты, подлежащую секвенированию, в котору вводят адаптер/адаптеры на 5'- и/или 3'-конце. В некоторых вариантах осуществления молекулу нуклеиновой кислоты можно соединять с адаптером с использованием неспецифической лигазы (например, ДНК лигазы T4). В некоторых вариантах осуществления молекулу нуклеиновой кислоты и адаптер можно обрабатывать рестрикционной эндонуклеазой, тем самым позволяя им иметь одни и те же липкие концы, и затем можно использовать лигазу для того, чтобы соединять молекулу нуклеиновой кислоты с адаптером, имеющим те же липкие концы, тем самым получая молекулу нуклеиновой кислоты, соединенную с адаптером.

В некоторых вариантах осуществления после соединения молекулы нуклеиновой кислоты с адаптером с использованием лигазы, получаемый продукт может иметь однонитевой разрыв в точке соединения. В этом случае полимеразу можно использовать для репарации однонитевых разрывов. Например, ДНК полимеразы, которые утратили 3'-5' экзонуклеазную активность, но проявляют 5'-3' экзонуклеазную активность, могут обладать способностью распознавать однонитевые разрывы и восстанавливать однонитевые разрывы (Hamilton, S.C., J.W.Farchaus and M.C.Davis. 2001. DNA polymerases as engines for biotechnology. BioTechniques 31:370). ДНК полимеразы, которые можно использовать с этой целью, включают, например, polI из Thermoanaerobacter thermoсераicus, ДНК polI из E. coli и фага phi29. В предпочтительном варианте осуществления polI из Bacillus stearothermophilus используют для репарации однонитевого разрыва дцДНК и формирования ненадрезанной дцДНК.

В некоторых предпочтительных вариантах осуществления, молекулы нуклеиновой кислоты, подлежащие секвенированию, также можно амплифицировать для увеличения количества или числа копий молекул нуклеиновой кислоты. Способы амплификации молекул нуклеиновой кислоты хорошо известны специалистам в данной области, и их типичным примером является ПЦР. Например, молекулы нуклеиновой кислоты можно амплифицировать с использованием следующих способов: (i) полимеразная цепная реакция (ПЦР), требующая циклинга температуры (см., например, Saiki et al., 1995. Science 230: 1350-1354), лигазная цепная реакция (см., например, Barany, 1991. Proc. Natl. Acad. Sci. USA 88: 189-193; Barringer et al., 1990. Ген 89: 117-122), и амплификация на основе транскрипции (см., например, Kwoh et al., 1989. Proc. Natl. Acad. Sci. USA 86:1173-1177); (ii) система изотермальной амплификации (см., например, Guatelli et al., 1990. Proc. Natl. Acad. Sci. USA 87: 1874-1878); система репликазы QP (см., например, Lizardi et al., 1988. BioTechnology 6: 1197-1202); и амплификация замещением цепей (Nucleic Acids Res. 1992 Apr 11; 20(7): 1691-6). В некоторых предпочтительных вариантах осуществления молекулу нуклеиновой кислоты, подлежащую секвенированию, амплифицируют посредством ПЦР, и праймеры, используемые для ПЦР амплификации, содержат адаптерную последовательность и/или последовательность метки. продукт ПЦР, получаемый таким образом, будет нести адаптерную последовательность и/или последовательность метки, которую в целях удобства можно использовать для последующих применений (например, высокопропускное секвенирование).

В некоторых предпочтительных вариантах осуществления, молекулы нуклеиновой кислоты, подлежащие секвенированию, также выделяют и очищают до или после различных стадий предварительной обработки. Такие стадии разделения и очистки могут быть полезны. Например, в некоторых предпочтительных вариантах осуществления, стадии выделения и очистки можно использовать для получения молекул нуклеиновой кислоты подходящей длины (например, 50-1000 п. о.), подлежащих секвенированию, для последующих применений (например, высокопропускное секвенирование). В некоторых предпочтительных вариантах осуществления, электрофорез в агарозном геле можно использовать для того, чтобы разделять и очищать молекулы нуклеиновой кислоты, подлежащие секвенированию. В некоторых предпочтительных вариантах осуществления, молекулы нуклеиновой кислоты, подлежащие секвенированию, можно выделять и очищать посредством эксклюзионной хроматографии или седиментации в сахарозе.

Следует понимать, что стадии предварительной обработки, описанные выше (например, фрагментирование, ed, добавление адаптеров, добавление метки, репарация однонитевого разрыва, амплификация, выделение и очистка), являются лишь образцовыми и не ограничивающими. Специалисты в данной области могут выполнять любую желаемую предварительную обработку молекул нуклеиновой кислоты, подлежащих секвенированию, в соответствии с фактическим нуждами, и каждая стадия предварительной обработки не ограничена конкретным порядком. Например, в некоторых вариантах осуществления молекулу нуклеиновой кислоты можно сначала фрагментировать и добавлять адаптер перед амплификацией. В других вариантах осуществления молекулу нуклеиновой кислоты можно амплифицировать перед фрагментированием и добавлением адаптера. В некоторых вариантах осуществления молекулу нуклеиновой кислоты фрагментируют и адаптер добавляют без стадии амплификации.

В некоторых образцовых вариантах осуществления, перед стадией (1), молекулу нуклеиновой кислоты, представляющую интерес (например, геномную ДНК), подвергают следующей предварительной обработке:

(i) фрагментация молекулы нуклеиновой кислоты, представляющей интерес (например, большого фрагмента нуклеиновой кислоты, например, геномной ДНК), чтобы получать фрагментированную молекулу нуклеиновой кислоты;

(ii) соединение фрагментированной молекулы нуклеиновой кислоты с адаптерной последовательностью, содержащей, например, область связывания праймера, способную к гибридизации с универсальным праймером амплификации, область связывания праймера, способного к гибридизации с универсальным праймером секвенирования, и/или последовательность метки, и необязательно выполнение выделения, очистки и денатурации для того, чтобы получать молекулу нуклеиновой кислоты, подлежащую секвенированию;

(iii) соединение молекулы нуклеиновой кислоты, подлежащей секвенированию, с основой для получения молекулы нуклеиновой кислоты, подлежащей секвенированию, которая прикреплена к основе.

Основа

В большинстве случаев, основа для лигирования молекулы нуклеиновой кислоты, подлежащей секвенированию, находится в твердой фазе для простоты обращения. Следовательно, в настоящем раскрытии, «основу» иногда также обозначают как «твердый носитель». Однако следует понимать, что «основа», упоминаемая в настоящем описании, не ограничена твердым веществом, она также может быть полутвердой (например, гель).

В способе по настоящему изобретению, основу для лигирования молекулы нуклеиновой кислоты, подлежащей секвенированию, можно создавать из различных подходящих материалов. Такие материалы включают, например, неорганические вещества, природные полимеры, синтетические полимеры и любое их сочетание. Конкретные примеры включают, но не ограничиваясь этим, целлюлозу, производные целлюлозы (такие как нитроцеллюлоза), акриловые смолы, стекло, силикагель, полистирол, желатин, поливинилпирролидон, сополимеры винила и акриламида и полистирол, сшитый дивинилбензолом (см., например, Merrifield Biochemistry 1964, 3, 1385-1390), полиакриламид, латекс, декстран, резину, кремний, пластмассу, натуральную губку, металлопластик, сшитый декстран (например, Sephadex™), агарозный гель (Sepharose™) и другие основы, известные специалистам в данной области.

В некоторых предпочтительных вариантах осуществления, основа для лигирования молекулы нуклеиновой кислоты, подлежащей секвенированию, может представлять собой твердый носитель, содержащий инертный субстрат или матрицу (например, предметные стекла, полимерные гранулы и т. д.), указанный инертный субстрат или матрицу функционализировали, например, с помощью промежуточных материалов, содержащих активные группы, которые делают возможным ковалентное прикрепление биомолекул, таких как полинуклеотиды. Примеры таких основ включают, но не ограничиваясь этим, полиакриламидные гидрогели, основанные на инертном субстрате, таком как стекль, в частности, полиакриламидные гидрогели, как описано в WO 2005/065814 и US 2008/0280773, где содержание патентной заявки включено, таким образом, посредством ссылки в полном объеме. В таких вариантах осуществления биомолекулу (например, полинуклеотид) можно непосредственно и ковалентно прикреплять к промежуточному материалу (например, гидрогелю), тогда как сам промежуточный материал можно нековалентно прикреплять к субстрату или матрице (например, стеклянному субстрату). В некоторых предпочтительных вариантах осуществления основа представляет собой предметное стекло или пластину, имеющие поверхность, модифицированную слоем химических групп на основе авидина, амино, акриламидсилана или альдегида.

В настоящем изобретении, основа или твердый носитель не ограничены их размером, геометрической формой и конфигурацией. В некоторых вариантах осуществления основа или твердый носитель представляет собой плоскую структуру, такую как предметное стекло, чип, микрочип и/или массив. Поверхность такой основы может быть в форме плоского слоя.

В некоторых вариантах осуществления основа или ее поверхность является не плоской, такой как внутренняя или внешня поверхность трубки или контейнера. В некоторых вариантах осуществления основа или твердый носитель содержит микросферы или гранулы. Как используют в настоящем описании, «микросфера» или «гранула» или «частица» или грамматический эквивалент относится к небольшой дискретной частице. Подходящие ингредиенты гранул включают, но не ограничиваясь этим, пластмассы, керамику, стекло, полистирол, метилстирол, акриловые полимеры, парамагнитные материалы, золь оксида церия, углеграфит, диоксид титана, латекс, сшитый декстран, такой как Sepharose, целлюлозу, нейлон, сшитые мицеллы и тефлон, а также любые другие материалы, указанные в настоящем описании для получения твердых носителей. Кроме того, гранулы могут быть сферическими или несферическими. В некоторых вариантах осуществления можно использовать сферические гранулы. В некоторых вариантах осуществления можно использовать неправильные частицы. Кроме того, гранулы также могут быть пористыми.

В некоторых предпочтительных вариантах осуществления, основа для лигирования молекулы нуклеиновой кислоты, подлежащей секвенированию представляет собой массив гранул или лунок (также обозначаемый как чип). Массив можно получать с использованием любых материалов, приведенных в настоящем описании для получения твердого носителя, и, предпочтительно, поверхность гранул или пор в массиве функционализируют для того, чтобы содействовать лигированию молекул нуклеиновой кислоты. Число гранул или отверстий в массиве не ограничено. Например, каждый массив может содержать 10-102, 102-103, 103-104, 104-105, 105-106, 106-107, 107-108, 108-109 или больше гранул или пор. В некоторых образцовых вариантах осуществления одну или несколько молекул нуклеиновой кислоты можно прикреплять к поверхности каждой гранулы или лунки. Соответственно, каждый массив можно соединять с 10-102, 102-103, 103-104, 104-105, 105-106, 106-107, 107-108, 108-109 или больше молекул нуклеиновой кислоты. Таким образом, такие массивы можно использовать особенно благоприятно для высокопропускного секвенирования молекул нуклеиновой кислоты.

Как в целом известно в данной области, для создания основы можно использовать различные приемы. Такие приемы включают, но не ограничиваясь этим, фотолитографию, приемы штамповки, технологию пластмассовых пленок и приемы микротравления. Как примут во внимание специалисты в данной области, используемые приемы зависят от композиции, структуры и геометрической формы основы.

Соединение молекулы нуклеиновой кислоты, подлежащей секвенированию, с основой

В способе по изобретению, молекулу нуклеиновой кислоты, подлежащую секвенированию, можно соединять (например, ковалентно или нековалентно соединять) с основой любым способом, известным специалистам в данной области. Например, молекулу нуклеиновой кислоты, подлежащую секвенированию, можно соединять с основой посредством ковалентного прикрепления, или посредством необратимой пассивной адсорбции, или посредством межмолекулярной аффинности (например, аффинности между биотином и авидином). Однако предпочтительно связь между молекулой нуклеиновой кислоты, подлежащей секвенированию, и основой достаточно сильна, чтобы молекула нуклеиновой кислоты не откреплялась от основы вследствие условий, используемых в различных реакциях и при промывании водой или буферным раствором.

Например, в некоторых предпочтительных вариантах осуществления, 5'-конец молекулы нуклеиновой кислоты, подлежащей секвенированию несет устройство, способное ковалентно прикреплять молекулу нуклеиновой кислоты к основе, например, химически модифицированную функциональную группу. Примеры таких функциональных групп включают, но не ограничиваясь этим, фосфатную группу, молекулу карбоновой кислоты, молекулу альдегида, тиол, гидроксильную группу, диметокситритильную группу (DMT) или аминогруппу.

Например, в некоторых предпочтительных вариантах осуществления 5'-конец молекулы нуклеиновой кислоты, подлежащей секвенированию, можно модифицировать химической функциональной группой (например, фосфорной кислотой, тиолом или аминогруппой), а основу (например, пористое стекло гранулу) можно дериватизировать с помощью аминоалкоксисилана (например, аминопропилтриметоксисилана, аминопропилтриэтоксисилана, 4-аминобутилтриэтоксисилана и т. д.), тем самым ковалентно связывая молекулу нуклеиновой кислоты с основой посредством химической реакции между активными группами. В некоторых предпочтительных вариантах осуществления, 5'-конец молекулы нуклеиновой кислоты, подлежащей секвенированию, можно модифицировать группой карбоновой кислоты или альдегида, а основу (например, латексные гранулы) дериватизируют с использованием гидразина, тем самым ковалентно связывая молекулу нуклеиновой кислоты с основой посредством химической реакции между активными группами (Kremsky et al., 1987).

Альтернативно, сшивающее средство можно использовать для того, чтобы связывать молекулу нуклеиновой кислоты, представляющую интерес, с основой. Такие сшивающие средства включают, например, янтарный ангидрид, фенилдиизотиоцианат (Guo et al., 1994), малеиновый ангидрид (Yang et al., 1998), гидрохлорид 1-этил-3-(3-диметиламинопропил)-карбодиимида (EDC), м-малеимидобензойной кислоты-N-гидроксисукцинимидный сложный эфир (MBS), N-сукцинимидил [4-йодацетил]аминобензойную кислоту (SIAB), 4-(N-малеимидометил)циклогексан-1-карбоновую кислоту сукцинимид (SMCC), сложный N-γ-малеимидобутирилоксисукцинимидиловый эфир (GMBS), 4-(п-малеимидофенил)масляной кислоты сукцинимид (SMPB) и соответствующие тио-соединения (водорастворимые).

Кроме того, основу также можно дериватизировать с использованием бифункционального сшивателя, такого как гомобифункциональный сшиватель и гетеробифункциональный сшиватель, чтобы предоставлять модифицированную функционализированную поверхность. После этого молекула нуклеиновой кислоты, имеющая 5'-фосфат, тиол или аминогруппу, способна взаимодействовать с функционализированной поверхностью для того, чтобы формировать ковалентную связь между нуклеиновой кислотой и основой. Большое число бифункциональных сшивателей и способов их использования хорошо известны в данной области (см., например, Pierce Catalog and Handbook, стр. 155-200).

Праймер, полимераза и производное основания

В некоторых предпочтительных вариантах осуществления, на стадии (2), праймер для инициации полимеризации нуклеотидов, полимеразу для осуществления полимеризации нуклеотидов и четыре производные оснований добавляют к молекуле нуклеиновой кислоты, подлежащей секвенированию, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу.

В способе по настоящему изобретению, праймер может быть любой длины и может содержать любую последовательность или любую основу до тех пор, пока он способен к специфическому отжигу с областью целевой молекулы нуклеиновой кислоты. Другими словами, в способе по настоящему изобретению, праймер не ограничен его длиной, структурой и композицией. Например, в некоторых образцовых вариантах осуществления, праймеры могут составлять 5-50 п. о. в длину, например, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50 п. о. В некоторых образцовых вариантах осуществления праймеры способны формировать вторичную структуру (например, структуру шпильки). В некоторых образцовых вариантах осуществления праймер не образует какую-либо вторичную структуру (например, структуру шпильки). В некоторых образцовых вариантах осуществления, праймеры могут содержать встречаемые в природе или не встречаемые в природе нуклеотиды. В некоторых образцовых вариантах осуществления праймер содержит или состоит из встречаемых в природе нуклеотидов. В некоторых образцовых вариантах осуществления, праймер содержит модифицированный нуклеотид, такой как замкнутая нуклеиновая кислота (LNA). В некоторых образцовых вариантах осуществления, праймер способен к гибридизации с нуклеиновой кислотой, представляющей интерес, при строгих условиях, таких как умеренно строгие условия или очень строгие условия. В некоторых образцовых вариантах осуществления, праймер имеет последовательность, которая полностью комплементарна целевой последовательности в молекуле нуклеиновой кислоты, представляющей интерес. В некоторых образцовых вариантах осуществления, праймер частично комплементарен целевой последовательности в молекуле нуклеиновой кислоты, представляющей интерес, (например, присутствует несовпадение). В некоторых образцовых вариантах осуществления праймер содержит последовательность универсального праймера. В некоторых образцовых вариантах осуществления, молекула нуклеиновой кислоты, подлежащая секвенированию, содержит адаптер, а адаптер содержит последовательность, способную к гибридизации с универсальным праймером, и используемый праймер представляет собой универсальный праймер.

В способе по настоящему изобретению, различные известные полимеразы можно использовать для полимеризации нуклеотидов. В некоторых образцовых вариантах осуществления, полимераза способна синтезировать новую нить ДНК (например, ДНК полимераза) с использованием ДНК в качестве матрицы. В некоторых образцовых вариантах осуществления полимераза способна синтезировать новую нить ДНК (например, обратная транскриптаза) с использованием РНК в качестве матрицы. В некоторых образцовых вариантах осуществления, полимераза способна синтезировать новую РНК нить (например, РНК полимераза) с использованием ДНК или РНК в качестве матрицы. Соответственно, в некоторых предпочтительных вариантах осуществления, полимеразу выбирают из группы, состоящей из ДНК полимеразы, РНК полимеразы и обратной транскриптазы. Подходящую полимеразу можно выбирать для полимеризации нуклеотидов в соответствии с фактическим нуждами. В некоторых предпочтительных вариантах осуществления, реакция полимеризации представляет собой полимеразную цепную реакцию (ПЦР). В некоторых предпочтительных вариантах осуществления, реакция полимеризации представляет собой реакцию обратной транскрипции.

Кроме того, как описано выше, в способе по настоящему изобретению, можно повторять стадии (4)-(7). Следовательно, в некоторых предпочтительных вариантах осуществления изобретения можно осуществлять один или несколько раундов полимеризации нуклеотидов. Другими словами, в некоторых предпочтительных вариантах осуществления изобретения полимеризацию нуклеотидов можно осуществлять на одной или нескольких стадиях. В этом случае, одну и ту же или различные полимеразы можно использовать для каждого раунда полимеризации нуклеотидов. Например, первую ДНК полимеразу можно использовать в первом раунде полимеризации нуклеотидов и вторую ДНК полимеразу можно использовать во втором раунде полимеризации нуклеотидов. Однако в некоторых образцовых вариантах осуществления одну и ту же полимеразу (например, одну и ту же ДНК полимеразу) используют для всей полимеризации нуклеотидов.

В способе по настоящему изобретению, четыре соединения, используемые на стадии (2), представляют собой производные нуклеотидов A, (T/U), C и G, соответственно. В некоторых образцовых вариантах осуществления, четыре соединения представляют собой производные рибозы или дезоксирибонуклеотиды A, T, C и G, соответственно. В некоторых образцовых вариантах осуществления, четыре соединения представляют собой производные рибозы или дезоксирибонуклеотиды A, U, C и G, соответственно. В частности, благоприятно, что четыре соединения не осуществляют химические реакции друг с другом в ходе полимеризации нуклеотидов.

Кроме того, описанные четыре соединения обладают способностью комплементарного спаривания оснований. Например, когда соединение представляет собой производное нуклеотида A, оно будет способно образовывать пару с основанием T или U. Когда соединение представляет собой производное нуклеотида T или U, оно будет способно образовывать пару с основанием A. Когда соединение представляет собой производное нуклеотида C, оно будет способно образовывать пару с основанием G. Когда соединение представляет собой производное нуклеотида G, оно будет способно образовывать пару с основанием C. Таким образом, на стадии (4), полимераза (например, ДНК полимераза) будет встраивать соединение, способное к комплементарному образованию пары с основанием в соответствующем положении в матричной нуклеиновой кислоте, в 3'-конец растущей нити нуклеиновой кислоты в соответствии с принципом комплементарного спаривания оснований. Соответственно, после определения типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, с помощью флуоресцентного сигнала, тип основания в соответствующем положении в матричной нуклеиновой кислоте можно определять в соответствии с принципом комплементарного спаривания оснований. Например, если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, идентифицируют как производное нуклеотида A, тогда можно определять, что основание в соответствующем положении в матричной нуклеиновой кислоте представляет собой T или U. Если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, идентифицируют как производное нуклеотида T или U, тогда определяют, что основание в соответствующем положении в матричной нуклеиновой кислоте представляет собой A. Если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, идентифицируют как производное нуклеотида C, то определяют, что основание в соответствующем положении в матричной нуклеиновой кислоте, представляет собой G. Если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, идентифицируют как производное нуклеотида G, то определяют, что основание в соответствующем положении в матричной нуклеиновой кислоте представляет собой C.

В некоторых предпочтительных вариантах осуществления, защищают гидроксигруппы (-OH) в 3'-положении рибозы или дезоксирибозы четырех соединений. Другими словами, в некоторых предпочтительных вариантах осуществления, гидроксильные группы (-OH) в 3'-положении рибозы или дезоксирибозы четырех соединений защищают с помощью защитной группы, таким образом они способны терминировать полимеризацию полимеразы (например, ДНК полимеразы). Например, когда любое из четырех соединений вводят в 3'-конец растущей нити нуклеиновой кислоты, полимераза неспособна выполнять следующий раунд полимеризации из-за того, что свободная гидроксильная группа (-OH) не присутствует в 3'-положении рибозы или дезоксирибозы соединения, и тем самым будет происходить терминация реакции полимеризации. В этом случае, в каждом раунде полимеризации одно и только одно основание встраивают в растущую нить нуклеиновой кислоты.

В частности, благоприятно можно удалять защитные группы в 3'-положении рибозы или дезоксирибозы четырех соединений. В некоторых предпочтительных вариантах осуществления, после стадии (7) (например, на стадии (8)), защитную группу удаляют и превращают в свободную гидроксильную группу (-OH). Впоследствии, полимеразу и четыре соединения можно использовать для того, чтобы осуществлять следующий раунд полимеризации выращенной нити нуклеиновой кислоты и вводить еще одно основание.

Таким образом, четыре соединения, используемые на стадии (2), обладают свойствами обратимой терминации: когда их встраивают в 3'-конец растущей нити нуклеиновой кислоты (например, на стадии (4)), они будут терминировать полимеразу и продолжать полимеризацию, чтобы терминировать дальнейшее достраивание растущей нити нуклеиновой кислоты; и, после удаления содержащейся защитной группы, полимераза сможет продолжать полимеризовать растущую нить нуклеиновой кислоты (например, на стадии (10)), продолжая достраивать цепь нуклеиновой кислоты.

Флуоресцентный сигнал и флуорофор

В способе по изобретению, можно использовать любой материал, способный испускать флуоресцентный сигнал (например, флуорофор). Примеры флуорофоров включают, но не ограничиваясь этим, различные известные флуоресцентные метки, такие как AF532, ALEX-350, FAM, VIC, TET, CAL Fluor® Gold 540, JOE, HEX, CAL Fluor Orange 560, TAMRA, CAL Fluor Red 590, ROX, CAL Fluor Red 610, техасский красный, CAL Fluor Red 635, Quasar 670, CY3, CY5, CY5.5, Quasar 705 и т. п. Такие флуорофоры и способы их обнаружения хорошо известны в данной области, и их можно выбирать в соответствии с фактическим нуждами.

Тазличные флуорофоры могут иметь один и тот же или по существу один и тот же спектр испускания в одинаковых или близких условиях возбуждения и, тем самым, испускать один и тот же или по существу один и тот же флуоресцентный сигнал. Например, CY3 способен испускать флуоресценцию на длине волны приблизительно 560 нм под действием возбуждающего света с длиной волны приблизительно 550 нм, и AF532 способен испускать флуоресценцию на длине волны приблизительно 555 нм под действием возбуждающего света, имеющего длину волны приблизительно 530 нм. Выбор подходящих условий возбуждающего света позволяет получать для этих двух один и тот же или по существу один и тот же спектр испускания. В настоящем изобретении спектр испускания обозначает, что при одних и тех же условиях возбуждения, максимальная длина волны испускания в спектре испускания близка (например, фазовая разница составляет меньше 20 нм), с тем, чтобы на оптическом фильтре получать один и тот же сигнал, рассматриваемый как по существу один и тот же спектр.

В некоторых вариантах осуществления флуорофор может представлять собой один элемент пары связывания и/или способен выполнять биоортогональную реакцию (например, реакцию биоортогонального лигирования или реакцию биоортогонального расщепления). Например, флуорофор Cy3, в качестве одного элемента пары связывания, способен к специфическому связыванию с другим элементом Cy3 антителом пары связывания.

Определение соединения, встраиваемого в растущую нить нуклеиновой кислоты

В способе по изобретению, тип соединения, встраивемого в растущую нить нуклеиновой кислоты, идентифицируют/определяют с помощью только одногофлуорофора (или другого флуорофора, способного испускать тот же флуоресцентный сигнал). С этой целью, в способе по изобретению, обнаружение флуоресцентного сигнала на дуплексе или растущей нити нуклеиновой кислоты осуществляют два раза после каждого раунда полимеризации. В кратком изложении в способе по настоящему изобретению сначала одно из четырех соединений встраивают в 3'-конец (стадия 4) растущей нити нуклеиновой кислоты в соответствии с принципом комплементарного спаривания оснований с использованием полимеразы, молекулу нуклеиновой кислоты, подлежащую секвенированию, используют в качестве матрицы; затем, если само четвертое соединение способно испускать флуоресцентный сигнал, растущую нить нуклеиновой кислоты сначала обнаруживают для того, чтобы определять, испускает ли она флуоресцентный сигнал; если четвертое соединение не несет флуорофор, дуплекс или растущую нить нуклеиновой кислоты подвергают обработке в реакционной системе, содержащей фазу раствора и твердую фазу, обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, но позволяет четвертому соединению испускать тот же флуоресцентный сигнал, что и второе соединение (стадия 5); после обнаружения, растущую нить нуклеиновой кислоты обрабатывают, обработка не оказывает эффекта на первое соединение и второе соединение, но позволяет третьему соединению испускать тот же флуоресцентный сигнал, что и второе соединение, и способна удалять флуоресцентный сигнал четвертого соединения (стадия 6); затем растущую нить нуклеиновой кислоты подвергают второму обнаружению для того, чтобы определять, испускает ли она флуоресценциый сигнал (стадия 7). На основе результатов двух обнаружений флуоресцентного сигнала, можно точно определять тип соединения, встроенного в 3'-конец растущей нити нуклеиновой кислоты.

В частности, если первое соединение встраивают в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), то, поскольку само первое соединение не несет флуорофор и на него не влияет обработка на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих стадиях (5) и (7), то можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой первое соединение.

Если второе соединение встраивают в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), то, поскольку самое второе соединение несет флуорофор и на него не оказывает воздействия обработка на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7), то можно определять, что соединениое встроенне на 3'-конце растущей нити нуклеиновой кислоты представляет собой второе соединение.

Если третье соединение встраивают в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), то (i) поскольку само третье соединение не несет флуорофор, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) поскольку третье соединение выполняет обработку со стадии (6) и испускает флуоресцентный сигнал, флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5) и флуоресцентный сигнал обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой третье соединение.

Если четвертое соединение встраивают в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), то (i) поскольку само четвертое соединение несет флуорофор или несет флуорофор после обработки на стадии (5), флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку четвертое соединение теряет свой флуоресцентный сигнал после обработки на стадии (6), флуоресцентный сигнал не обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и флуоресцентный сигнал не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой четвертое соединение.

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, после стадии (7), определение типов соединений, встроенных на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения со стадий (5) и (7), когда дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), как первое соединение;

когда оба результата обнаружения со стадий (5) и (7), когда дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), как второе соединение;

когда результат обнаружения на стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения на стадии (7) является таким, когда дуплекс или растущая нить нуклеиновой кислоты испускают флуоресцентный сигнал, определяют соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), как третье соединение; и

когда результат обнаружения на стадии (5) являлется таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения на стадии (7) является таким, когда дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты на стадии (4), как четвертое соединение.

В некоторых предпочтительных вариантах осуществления способ по настоящему изобретению дополнительно включает, после стадии (7), определение типов оснований в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, в соответствии с типом соединения, встроенного в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), на основе принципа комплементарного спаривания оснований. Например, если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, идентифицируют как первое соединение (например, производное нуклеотида A), то можно определять, что основание в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, можно определять как основание, способно образовывать пару с первым соединением (например, T или U).

Более конкретно, если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты идентифицируют как производное нуклеотида A, то можно определять, что основание в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, представляет собой T или U. Если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, определяют как производное нуклеотида T или U, то можно определять, что основание в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, представляет собой A. Если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, определяют как производное нуклеотида C, то можно определять, что основание в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, представляет собой G. Если соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты определяют как производное нуклеотида G, то определяют, что основание в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, представляет собой C.

Обработка дуплекса или растущей нити нуклеиновой кислоты

В некоторых предпочтительных вариантах осуществления способов по изобретению, каждый раунд полимеризации может включать два обнаружения флуоресцентного сигнала, а также две или три обработки дуплекса или растущей нити нуклеиновой кислоты, где обработку на стадии (6) можно использовать для того, чтобы изменять флуоресцентный сигнал третьего соединения и четвертого соединения (так, что удобно различать/идентифицировать тип соединения, встроенного в 3'-конец растущей нити нуклеиновой кислоты); обработку на стадии (8) можно использовать для того, чтобы удалять защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном на 3'-конце растущей нити нуклеиновой кислоты (так, что можно инициировать новый раунд полимеризации), и удалять флуоресцентный сигнал, который может нести дуплекс или растущая нить нуклеиновой кислоты (тем самым избегая вмешательства в последующее обнаружение флуоресценции); необязательно, если само четвертое соединение не может испускать флуоресцентный сигнал, то стадия (5) включает обработку, позволяющую четвертому соединению нести флуорофор.

Подходящую обработку можно разрабатывать и выбирать в соответствии со структурой и типом используемых четырех соединений. Например, в некоторых образцовых вариантах осуществления реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления и/или реакцию биоортогонального лигирования, можно вводить в одно или несколько из четырех соединений с тем, чтобы контролировать (например, поддерживать или менять) способность четырех соединений испускать флуоресцентный сигнал на стадии (6). В некоторых образцовых вариантах осуществления элементы пары связывания можно вводить в одно или несколько из четырех соединений с тем, чтобы контролировать (например, поддерживать или менять) способность четырех соединений испускать флуоресцентные сигналы на стадии (6).

Например, в некоторых образцовых вариантах осуществления, реакционноспособную группу, способную выполнять реакцию биоортогонального лигирования, можно вводить в третье соединение, и флуорофор можно вводить в третье соединение посредством реакции биоортогонального лигирования на стадии (6), чтобы позволять третьему соединению испускать флуоресцентный сигнал. В некоторых образцовых вариантах осуществления на стадии (6) один элемент пары связывания можно вводить в третье соединение и флуорофор можно вводить в третье соединение посредством специфического взаимодействия между элементом и другим элементом (несущим флуорофор) пары связывания, чтобы позволять соединению испускать флуоресцентный сигнал. В некоторых образцовых вариантах осуществления реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления, можно вводить в четвертое соединение, и флуорофор в четвертом соединении можно отщеплять с помощью реакции биоортогонального расщепления на стадии (6) для того, чтобы позволять четвертому соединению терять его способность испускать флуоресцентный сигнал. В некоторых образцовых вариантах осуществления один элемент пары связывания можно вводить в четвертое соединение, и гасящую группу, которая способна к гашению флуоресценции, можно вводить в четвертое соединение посредством специфического взаимодействия между элементом и другим элементом (несущим гасящую группу) пары связывания для того, чтобы позволять четвертому соединению терять способность испускать флуоресцентный сигнал. В некоторых образцовых вариантах осуществления реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления, можно вводить в четыре соединения с тем, чтобы удалять защитную группу в 3'-положении рибозы или дезоксирибозы и флуоресцентный сигнал, который может быть представлен на стадии (8).

Стадия промывания

В способе по изобретению, стадию промывания можно увеличивать при необходимости. Стадию промывания можно увеличивать на любом желаемом этапе и необязательно стадию промывания можно осуществлять один или несколько раз.

Например, одно или несколько промываний можно осуществлять на стадии (5) после удаления фазы раствора реакционной системы для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезной, что можно использовать для того, чтобы полностью удалять свободное (т. е. не встроенное в растущую нить нуклеиновой кислоты) соединение, несущее флуорофор, чтобы снижать неспецифический флуоресцентный сигнал, насколько возможно.

Аналогичным образом, одно или несколько промываний можно осуществлять на стадии (7) после удаления фазы раствора реакционной системы для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезной, что можно использовать для того, чтобы полностью удалять средства (которые могут нести флуоресценцию), используемые на стадии (6), чтобы снижать неспецифический флуоресцентный сигнал насколько возможно.

Аналогичным образом, одно или несколько промываний можно осуществлять на стадии (9) после удаления фазы раствора реакционной системы для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезной, что можно использовать для того, чтобы полностью удалять средства и получаемые продукты (которые могут нести флуоресценцию) на стадии (8), чтобы снижать неспецифический флуоресцентный сигнал насколько возможно, и избегать нежелательных эффектов, оказываемых на последующую реакцию полимеризации, насколько возможно.

Стадию промывания можно осуществлять с использованием различных подходящих промывающих растворов. Примеры таких промывающих растворов включают, но не ограничиваясь этим, фосфатный буфер, цитратный буфер, буфер Tris-HCl, ацетатный буфер, карбонатный буфер и т. п. Специалисты в данной области способны выбирать подходящий промывающий раствор (включая подходящие ингредиенты, концентрацию, ионную силу, pH и т. д.) в соответствии с фактическими потребностями.

Далее подробно описаны два образцовых варианта осуществления способа по изобретению. Однако следует понимать, что варианты осуществления, описанные подробно далее, являются лишь иллюстративными и не ограничивающими. Модификации и модификации вариантов осуществления, которые описаны подробно далее, видны специалистам в данной области.

Образцовый вариант осуществления 1

В некоторых образцовых вариантах осуществления, способностью четырех соединений испускать флуоресцентные сигналы управляют (например, поддерживают или изменяют) на стадии (6) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления и/или реакцию биоортогонального лигирования; и предпочтительно удаления защитной группы и флуоресцентного сигнала можно достичь на стадии (8) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления. Например, в некоторых образцовых вариантах осуществления, первое, второе, третье и четвертое соединения могут иметь структуры формул (I), (II), (III) и (IV), соответственно:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R5b независимо представляют собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал;

R7a представляет собой флуорофор, способный испускать флуоресцентный сигнал (Dye1), или реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования, или один элемент пары связывания;

кроме того, Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно, реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования, присутствует между R5b и R7a.

В таком образцовом варианте осуществления само четвертое соединение может нести флуорофор, способный испускать тот же флуоресцентный сигнал, что и второе соединение, или может не нести флуорофор, но специфически взаимодействовать/связываться со средством (например, другим элементом пары связывания или соединением, способным выполнять вторую реакцию биоортогонального лигирования с R7a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий тот же спектр испускания, что и флуорофор второго соединения) на стадии (5), чтобы вводить флуорофор в четвертое соединение, и позволяет четвертому соединению испускать тот же флуоресцентный сигнал, что и у второго соединения. Кроме того, флуорофор (например, флуорофор, такой же как флуорофор второго соединения, или флуорофор, имеющий отличающуюся структуру, но тот же или по существу тот же спектр испускания, что и у второго соединения) можно вводить в третье соединение, заставляя R5a осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор; и (1) флуорофор в четвертом соединении можно удалять, заставляя R5b в четвертом соединении осуществлять реакцию биоортогонального расщепления, или (ii) флуоресцентный сигнал четвертого соединения можно гасить, заставляя R8 в четвертом соединении осуществлять третью реакцию биоортогонального лигирования с соединением, несущим гасящую группу. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая не оказывает эффекта на первое соединение и второе соединение, но позволяет R5a осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, такой же как флуорофор второго соединения, или флуорофор, имеющий отличающуюся структуру, но тот же или по существу тот же спектр испускания, что и у второго соединения) (тем самым вводя флуорофор, который несет средство, в третье соединение, и заставляя третье соединение нести флуорофор и испускать флуоресцентный сигнал); кроме того, обработка позволяет R5b осуществлять реакцию биоортогонального расщепления (тем самым удаляя флуорофор в четвертом соединении, и делая четвертое соединение более не испускающим флуоресцентный сигнал), или позволяет R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором, в четвертом соединении. В таких образцовых вариантах осуществления, перед обработкой на стадии (6), первое соединение и третье соединение, если присутствуют, не испускают флуорофор, и второе соединение и четвертое соединение, если присутствуют, флуоресцируют; кроме того, после обработки на стадии (6), первое соединение (если присутствует) все еще не флуоресцирует, второе соединение (если присутствует) все еще флуоресцирует, третье соединение (если присутствует) меняется для того, чтобы флуоресцировать, и четвертое соединение(если присутствует) меняется для того, чтобы не флуоресцировать. Следовательно, тип соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, можно определять посредством обнаружения и сравнения флуоресцентного сигнала.

Кроме того, в таких образцовых вариантах осуществления, позволяя R3a, R3b, R3c, R3d, R4a, R4b осуществлять реакцию биоортогонального расщепления, удаляют защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном в 3'-конец растущей нити нуклеиновой кислоты, и удаляют флуорофор (если присутствует) на дуплексе или растущей нити нуклеиновой кислоты. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая позволяет R3a, R3b, R3c, R3d, R4a, R4b осуществлять реакцию биоортогонального расщепления. В таких образцовых вариантах осуществления, после обработки на стадии (8), растущая нить нуклеиновой кислоты не будет иметь флуорофор, и рибоза или дезоксирибоза на 3'-конце растущей нити нуклеиновой кислоты будет иметь свободную гидроксильную группу в 3'-положении, где свободную гидроксильную группу можно использовать для того, чтобы инициировать следующий раунд полимеризации.

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, прикрепленной к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R5b независимо представляют собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал;

R7a представляет собой флуорофор, способный испускать флуоресцентный сигнал (Dye1), или реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования, или один элемент пары связывания;

также Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования между R5b и R7a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты, и вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию, образует дуплекс, прикрепленный к основе;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, и R7a представляет собой Dye1, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал; или

(ii) если четвертое соединение не испускает флуоресцентный сигнал, и R7a представляет собой реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования или представляет собой один элемент пары связывания, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R7a в четвертом соединении специфически взаимодействовать с/связываться с или выполнять вторую реакцию биоортогонального лигирования со средством (например, другим элементом пары связывания или соединением, которое способно выполнять вторую реакцию биоортогонального лигирования с R7a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент пары связывания, несущий флуорофор, имеет структуру: R7b-L-Dye1; где R7b представляет собой другой элемент пары связывания, L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye; или

соединение, способное выполнять вторую реакцию биоортогонального лигирования с R7a и несущее флуорофор, имеет следующую структуру: R7b-L-Dye1; где R7b представляет собой группу, способную выполнять вторую реакцию биоортогонального лигирования с R7a, L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение и позволяет R5a в третьем соединении осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий структуру, отличную от, но имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения), тем самым вводя флуорофор, который несет средство, в третье соединение и заставляя третье соединение испускать флуоресцентный сигнал; и указанная обработка (i) позволяет R5b в четвертом соединении осуществлять реакцию биоортогонального расщепления, тем самым удаляя флуорофор в четвертом соединении, или (ii) позволяет R8 в четвертом соединении вступать в реакцию с соединением, несущим гасящую группу, чтобы осуществлять третью реакцию ортогонального лигирования, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 в четвертом соединении; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a и R4b осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу), и, удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a или R4b), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадию:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, на стадии (4), если соединение формулы (I) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (I) не несет флуорофор и оно не вступает в реакцию на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих из стадий (5)-(7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (I).

На стадии (4), если соединение формулы (II) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (II) несет флуорофор и оно не выполняет какую-либо реакцию на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (II).

На стадии (4), если соединение формулы (III) встраивают в 3'-конец растущей нити нуклеиновой кислоты, (i) поскольку соединение формулы (III) не несет флуорофор, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) соединение формулы (III) выполняет реакцию биоортогонального лигирования со средством, несущим флуорофор, на стадии (6), вводя флуорофор в растущую нить нуклеиновой кислоты, следовательно флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5) и флуоресцентный сигнал обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (III).

На стадии (4), если соединение формулы (IV) встраивают в 3'-конец растущей нити нуклеиновой кислоты, (i) поскольку само соединение формулы (IV) несет флуорофор или несет флуорофор после обработки на стадии (5), флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку соединение формулы (IV) выполняет реакцию биоортогонального расщепления или третью реакцию биоортогонального лигирования на стадии (6) для утраты флуорофора или флуоресцентный сигнал гасят, флуоресцентный сигнал не будут обнаруживать на стадии (7) тем самым. Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и флуоресцентный сигнал не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (IV).

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает: после стадии (7), определение типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (I);

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (II);

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (III); и

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (IV).

В некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, что после стадии (7), на основе принципа комплементарного спаривания оснований, тип основания в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, определяют в соответствии с типом соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) не вступают в реакцию друг с другом в ходе реакции полимеризации нуклеотидов.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание T или U и Base4 представляет собой основание C. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание T или U и Base4 представляет собой основание C.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пиримидиновые основания и Base3 и Base4 представляют собой пуриновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание A и Base4 представляет собой основание G. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание A и Base4 представляет собой основание G.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R1. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой монофосфатную группу (-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой дифосфатную группу (-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой трифосфатную группу (-PO3H-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой тетрафосфатную группу (-PO3H-PO3H-PO3H-PO3H2).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R2. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -OH.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a, R4b, R5a, R5b независимо способны выполнять биоортогональное расщепление или реакцию лигирования. Как используют в настоящем описании, выражение «независимо способны выполнять биоортогональное расщепление или реакцию лигирования» обозначает, что реакционноспособные группы, средства или молекулы и т. д. способны выполнять биоортогональное расщепление или реакции лигирования, соответственно, и не взаимодействуют или не влияют друг на друга. Например, выражение «R3a и R3b способны выполнять биоортогональное расщепление или реакцию лигирования независимо» обозначает, что R3a, так и R3b способны выполнять биоортогональное расщепление или реакцию лигирования, R3a не влияет на биоортогональное расщепление или реакцию лигирования R3b, а R3b не влияет на биоортогональное расщепление или реакцию лигирования R3a.

В некоторых образцовых вариантах осуществления, R3a представляет собой первую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии первого средства; R3b представляет собой вторую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии второго средства; R3c представляет собой третью реакционноспособную группую, способную выполнять реакцию биоортогонального расщепления в присутствии третьего средства; R3d представляет собой четвертую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии четвертого средства; R4a представляет собой пятую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии пятого средства; R4b представляет собой шестую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии шестого средства; R5a представляет собой седьмую реакционноспособную группу, способную выполнять реакцию биоортогонального лигирования в присутствии седьмого средства; и R5b представляет собой восьмую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии восьмого средства.

Предпочтительно, в таких вариантах осуществления, на стадии (6), можно добавлять седьмое средство и восьмое средство, тем самым позволяя R5a (если присутствует) в соединении формулы (III) осуществлять первую реакцию биоортогонального лигирования и позволяя R5b (если присутствует) в соединении формулы (IV) осуществлять реакцию биоортогонального расщепления. Например, седьмое средство может содержать соединение M, которое несет тот же флуорофор, что и флуорофор второго соединения и четвертого соединения (или флуорофор, имеющий структуру, отличную от, но имеющий тот же или по существу тот же спектр испускания), и соединение M способно выполнять первую реакцию биоортогонального лигирования с R5a, тем самым вводя флуорофор в соединении M в соединение формулы (III). Кроме того, восьмое средство позволяет R5b в соединении формулы (IV) осуществлять реакцию биоортогонального расщепления, тем самым удаляя R5b и флуорофор, прикрепленный к нему, в соединении формулы (IV). В таких вариантах осуществления, особенно предпочтительно, что, на стадии (6), седьмое средство не вступает в реакцию с первым соединением или со вторым соединением, и кроме того предпочтительно восьмое средство не вступает в реакцию с первым соединением или со вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), седьмое средство и восьмое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где седьмое средство содержит соединение M, и соединение M несет тот же флуорофор (или флуорофор, имеющий структуру, отличную от, но тот же или по существу тот же спектр испускания), что и второе соединение и четвертое соединение, и соединение M способно выполнять реакцию биоортогонального лигирования с R5a, тем самым вводя флуорофор в соединении M в третье соединение; затем дуплекс инкубируют с седьмым средством и восьмым средством в условиях, которые позволяют соединению M осуществлять реакцию биоортогонального лигирования с R5a и позволяют R5b осуществлять реакцию биоортогонального расщепления.

Более предпочтительно, в таких вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство можно добавлять, тем самым заставляя R3a, R3b, R3c, R3d, R4a, R4b (если присутствуют) осуществлять реакцию биоортогонального расщепления, соответственно. Следовательно, R3a, R3b, R3c, R3d (если присутствуют) будут удалены из 3'-положения рибозы или дезоксирибозы (другими словами, -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) будут превращены в свободную гидроксильную группу), и R4a и флуорофор, прикрепленный к нему, (если присутствует) и R4b и флуорофор, прикрепленный к нему, (если присутствует) также будут удалены. Таким образом, после стадии (8), растущая нить нуклеиновой кислоты не несет флуорофор и имеет свободную гидроксильную группу на 3'-конце, которую можно использовать для следующего раунда полимеризации. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство добавляют для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, и дуплекс инкубируют с первым средством, вторым средством, третьим средством, четвертым средством, пятым средством и шестым средством в условиях, которые позволяют R3a, R3b, R3c, R3d, R4a и R4b осуществлять реакцию биоортогонального расщепления, соответственно.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одно и то же средство. Другими словами, на стадии (8), каждый из одинаковых R3a, R3b, R3c и R3d (если присутствует) будет выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства (т. е. первого средства) и удален из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R4a и R4b способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), пятое средство и шестое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R4a и R4b представляют собой одну и ту же реакционноспособную группу. В этом случае, предпочтительно, на стадии (8), пятое средство и шестое средство представляют собой одно и то же средство. Другими словами, на стадии (8), одни и те же R4a и R4b (если присутствуют) будут выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства (т. е. пятого средства) и удалены из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a и R4b способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство. Другими словами, на стадии (8), средство (т. е. первое средство) добавляют для того, чтобы заставлять R3a, R3b, R3c, R3d, R4a и R4b (если присутствуют) осуществлять реакцию биоортогонального расщепления и удалять их из растущей нить нуклеиновой кислоты, соответственно, в присутствии указанного средства (т. е. первого средства).

В некоторых образцовых вариантах осуществления, R7a представляет собой флуорофор Dye1, который способен испускать флуоресцентный сигнал, где Dye1 имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye. Следовательно, само четвертое соединение способно испускать тот же флуоресцентный сигнал, что и у второго соединения.

В некоторых образцовых вариантах осуществления, четвертое соединение не несет флуорофор и R7a представляет собой реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования. В таких вариантах осуществления, стадия (5) включает: добавление девятого средства для того, чтобы заставлять R7a (если присутствует) в соединении формулы (IV) осуществлять вторую реакцию биоортогонального лигирования. Например, девятое средство может содержать соединение M', которое имеет структуру R7b-L-Dye1, где R7b представляет собой группу, способную выполнять вторую реакцию биоортогонального лигирования с R7a, и L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye или имеет другую структуру, но тот же спектр испускания, что и Dye.

В некоторых образцовых вариантах осуществления, четвертое соединение не несет флуорофор и R7a представляет собой один элемент пары связывания. В таких вариантах осуществления, стадия (5) включает добавление девятого средства для того, чтобы заставлять R7a (если присутствует) в соединении формулы (IV) специфически взаимодействовать с и/или связываться с другим элементом пары связывания. Например, девятое средство может содержать соединение M'', которое имеет структуру R7b-L-Dye1, где R7b представляет собой другой элемент пары связывания, L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye.

В некоторых образцовых вариантах осуществления, реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования, присутствует между R5b и R7a четвертого соединения. В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a, R4b, R5a и R8 независимо способны выполнять биоортогональное расщепление или реакцию лигирования. В некоторых образцовых вариантах осуществления, R8a способен выполнять третью реакцию биоортогонального лигирования в присутствии десятого средства.

Предпочтительно, в таких вариантах осуществления, на стадии (6), можно добавлять седьмое средство и десятое средство, тем самым позволяя R5a (если присутствует) в соединении формулы (III) осуществлять первую реакцию биоортогонального лигирования и позволяя R8 (если присутствует) в соединении формулы (IV) осуществлять третью реакцию биоортогонального лигирования. Например, седьмое средство может содержать соединение M, которое несет флуорофор, такой же как флуорофор второго соединения и четвертого соединения (или флуорофор, имеющий структуру, отличную от, но тот же или по существу тот же спектр испускания, что и флуорофор второго соединения и четвертого соединения), и соединение M способно выполнять первую реакцию биоортогонального лигирования с R5a и тем самым вводить флуорофор в соединении M в соединение формулы (III). Кроме того, десятое средство позволяет R8 в соединении формулы (IV) осуществлять третью реакцию биоортогонального лигирования, тем самым гася флуоресцентный сигнал в соединении формулы (IV). В таких вариантах осуществления, особенно предпочтительно, на стадии (6), седьмое средство не вступает в реакцию с первым соединением или со вторым соединением и кроме того предпочтительно десятое средство не вступает в реакцию с первым соединением или со вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), седьмое средство и десятое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где седьмое средство содержит соединение M, где соединение M несет флуорофор, тот же что и флуорофор второго соединения и четвертого соединения (или флуорофор, имеющий структуру, отличную от, но тот же или по существу тот же спектр испускания, что и флуорофор второго соединения и четвертого соединения), и соединение M способно выполнять первую реакцию биоортогонального лигирования с R5a, тем самым вводя флуорофор в соединении M в третье соединение; десятое средство содержет соединение M''', которое несет гаситель, и указанное соединение M''' способно выполнять третью реакцию биоортогонального лигирования с R8, тем самым вводя гаситель в соединении M''' в четвертое соединение; затем дуплекс инкубируют с седьмым средством и десятым средством в условиях, которые позволяют соединению M''' осуществлять первую реакцию биоортогонального лигирования с R5a и позволяют M4 осуществлять третью реакцию биоортогонального лигирования с R8.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d независимо выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5 циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой . В некоторых предпочтительных вариантах осуществления, -C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу, и их выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5 циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил представляет собой . В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу и представляют собой -CH2N3.

В некоторых предпочтительных вариантах осуществления, R4a и R4b независимо выбирают из группы, состоящей из: -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой

В некоторых предпочтительных вариантах осуществления, R4a и R4b представляют собой одну и ту же реакционноспособную группу, и их выбирают из группы, состоящей из: -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, оба R4a и R4b представляют собой

В некоторых предпочтительных вариантах осуществления, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство независимо содержат материал, выбранный из группы, состоящей из:

комплекса палладия (например, комплекс палладия с четырьмя трифенилфосфин 3,3',3''-трисульфоновыми кислотами);

комплекса рутения (например, комплекс рутения с хинолинкарбоксилатом (или его производным), аллилом или циклопентадиеном);

фосфида (например, карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3); и

соединения Q, которое имеет структурную формулу , где Z1 и Z2 независимо выбирают из модифицированной или немодифицированной алкильной группы (например, C1-C6 алкильной группы, такой как C1 алкильная группа, C2 алкильная группа, C3 алкильная группа, C4 алкильная группа, C5 алкильная группа или C6 алкильная группа) и модифицированного или немодифицированного арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил или пиридил).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2. В этом случае, предпочтительно, R4a и R4b представляют собой Кроме того, предпочтительно первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат комплекс палладия или комплекс рутения. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3. В этом случае, предпочтительно, R4a и R4b представляют собой Кроме того, предпочтительно первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой . В этом случае, предпочтительно, R4a и R4b представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третьи средства, четвертое средство, пятое средство и шестое средство содержат соединение Q, как определено выше. Кроме того, предпочтительно, в соединении Q, Z1 представляет собой метил; и Z2 представляет собой модифицированный или немодифицированный пиридил. Более предпочтительно, соединение Q представляет собой , где W представляет собой водород или модифицирующую группу. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат соединение Q, как определено выше.

В некоторых предпочтительных вариантах осуществления, линкерные группы L1 и L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении и L в R7b-L-Dye1 не зависят друг от друга и конкретно не ограничены. Специалист в данной области может выбирать подходящие линкерные группы L1, L2 и L в соответствии с основаниями (Base1, Base2, Base3 или Base4) в соединениях и реакционноспособными группами (R4a, R4b, R5a или R5b).

В некоторых образцовых вариантах осуществления, L1 и L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении и L в R7b-L-Dye1 независимо выбирают из группы, состоящей из:

где m1, m2, m3, m4, n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых образцовых вариантах осуществления, L1 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: , где m1, m2, m3 и m4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, L1 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, L2 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из:

где n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e, и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, L2 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: , где n1, n2, n3, n4, p1, p2, p3 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, L2 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, R5a выбирают из группы, состоящей из:

В некоторых предпочтительных вариантах осуществления, R5b выбирают из группы, состоящей из:

.

В некоторых предпочтительных вариантах осуществления, седьмое средство содержит соединение M, которое выбирают из группы, состоящей из:

Соединения M1, которое имеет структурную формулу , где Y выбирают из алкильной группы (например, C1-C6 алкильной группы, например, C1 алкильной группы, C2 алкильной группы, C3 алкильной группы, C4 алкильной группы, C5 алкильной группы или C6 алкильной группы) и арила (например, 6-10-членного арила, например, 6-членного арила, 7-членного арила, 8-членного арила, 9-членного арила или 10-членного арила, например, фенильной группы), L0 отсутствует или представляет собой линкерную группу, Dye представляет собой флуорофор, где флуорофор представляет собой то же, что и флуорофор во втором соединении и в четвертом соединении (или флуорофор имеет структуру, отличающуюся от, но тот же или по существу тот же спектр испускания, что и у второго соединения и четвертого соединения);

соединение M2, которое имеет структурную формулу , где Dye представляет собой флуорофор, который является таким же, как флуорофор второго соединения и четвертого соединения (или имеет структуру, отличную от, но тот же или по существу тот же спектр испускания, что и у второго соединения и четвертого соединения); и

соединение M3, которое имеет формулу , где Z3 независимо выбирают из алкила (например C1-C6 алкила, например, C1 алкила, C2 алкила, C3 алкила, C4 алкила, C5 алкила или C6 алкила) и арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, например, фенил), и Dye представляет собой флуорофор, который является таким же, как таковой во втором соединении и четвертом соединении (или имеет структуру, отличную от, но тот же или по существу тот же спектр испускания, что и таковой у второго соединения и четвертого соединения).

В одном из вариантов осуществления настоящего изобретения, линкерная группа L0 конкретно не ограничена. Специалист в данной области может выбирать подходящую линкерную группу L0 в соответствии с фактическим нуждами. Например, в некоторых предпочтительных вариантах осуществления, L0 может представлять собой , где q1, q2, q3, q4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, седьмое средство содержит соединение M1 и Y представляет собой C1-C6 алкил, такой как метил.

В некоторых предпочтительных вариантах осуществления, L0 в соединении M1 представляет собой . В некоторых предпочтительных вариантах осуществления, Dye в соединении M1 представляет собой AF532. В некоторых предпочтительных вариантах осуществления, соединение M1 имеет структуру:

.

В некоторых предпочтительных вариантах осуществления, в дополнение к соединению M, седьмое средство дополнительно содержит комплекс рутения. В некоторых предпочтительных вариантах осуществления, седьмое средство содержит соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, восьмое средство содержит соединение M как определено выше, и соединение M выбирают из соединений M1, M2 и M3 как определено выше. В некоторых предпочтительных вариантах осуществления, в дополнение к соединению M, восьмое средство дополнительно содержит комплекс рутения. В некоторых предпочтительных вариантах осуществления, восьмое средство содержит соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, в присутствии одного и того же средства R5a способен выполнять реакцию биоортогонального лигирования и R5b способен выполнять реакцию биоортогонального расщепления. В этом случае, предпочтительно, на стадии (7), седьмое средство и восьмое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R5a представляет собой . В этом случае, предпочтительно, R5b представляет собой . Кроме того, предпочтительно, седьмое средство и восьмое средство содержат соединение M1. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M1 как определено выше.

В некоторых предпочтительных вариантах осуществления, R5a представляет собой . В этом случае, предпочтительно, R5b представляет собой . Кроме того, предпочтительно, седьмое средство и восьмое средство содержат соединение M2. Более предпочтительно, как седьмое средство, так и восьмое средство содержит соединение M2 и комплекс рутения. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M2 и комплекс рутения как определено выше.

В некоторых предпочтительных вариантах осуществления, R5a представляет собой . В этом случае, предпочтительно, R5b представляет собой . Кроме того, предпочтительно, седьмое средство и восьмое средство содержат соединение M3. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M3 как определено выше.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a и R4b представляют собой ; первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестые средства содержат комплекс палладия или комплекс рутения; R5a представляет собой ; R5b представляет собой ; седьмое средство и восьмое средство содержат соединение M1. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат комплекс палладия или комплекс рутения. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M1 как определено выше.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a и R4b представляют собой ; первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестые средства содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой ; R5b представляет собой ; седьмое средство и восьмое средство содержат соединение M1. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M1 как определено выше.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a и R4b представляют собой ; первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой ; R5b представляет собой ; седьмое средство и восьмое средство содержат соединение M2 и комплекс рутения. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a и R4b представляют собой , первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестые средства содержат комплекс палладия или комплекс рутения; R5a представляет собой ; R5b представляет собой ; седьмое средство и восьмое средство содержат соединение M3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат комплекс палладия или комплекс рутения. Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой , R4a и R4b представляют собой ; первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат соединение Q (например, соединение Q как определено выше); R5a представляет собой ; R5b представляет собой ; седьмое средство и восьмое средство содержат соединение M2 и комплекс рутения. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат соединение Q (например, соединение Q как определено выше). Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a и R4b представляют собой ; первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат соединение Q (например, соединение Q как определено выше); R5a представляет собой ; R5b представляет собой ; седьмое средство и восьмое средство содержат соединение M3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одно и то же средство и содержат соединение Q (например, соединение Q как определено выше). Предпочтительно, седьмое средство и восьмое средство представляют собой одно и то же средство и содержат соединение M3.

В некоторых предпочтительных вариантах осуществления, Dye в третьем соединении представляет собой Cy3 или AF532.

В некоторых предпочтительных вариантах осуществления, R7a в четвертом соединении представляет собой Dye1. В некоторых предпочтительных вариантах осуществления, Dye1 представляет собой Cy3 или AF532.

В некоторых предпочтительных вариантах осуществления, Dye в третьем соединении представляет собой AF532, и R7a в четвертом соединении представляет собой Cy3.

В некоторых предпочтительных вариантах осуществления, Dye в третьем соединении представляет собой Cy3 и R7a в четвертом соединении представляет собой AF532.

В некоторых образцовых вариантах осуществления, само четвертое соединение не несет флуорофор и R7a представляет собой реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования. В некоторых предпочтительных вариантах осуществления, R7a выбирают из группы, состоящей из: . В некоторых образцовых вариантах осуществления, соединение M, способное выполнять вторую реакцию биоортогонального лигирования с R7a, выбирают из группы, состоящей из соединений M1, M2 и M3 как определено выше.

В некоторых образцовых вариантах осуществления, само четвертое соединение не несет флуорофор и R7a представляет собой один элемент пары связывания. В некоторых предпочтительных вариантах осуществления, пару связывания выбирают из группы, состоящей из: антиген (например, низкомолекулярный антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину, а также бромдезоксигуанозин 5-положения и его антитело. В некоторых предпочтительных вариантах осуществления, два элемента пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину.

В некоторых предпочтительных вариантах осуществления, первое соединение имеет структуру, представленную в формуле (Ia):

В некоторых предпочтительных вариантах осуществления, второе соединение имеет структуру, представленную в формуле (IIa):

В некоторых предпочтительных вариантах осуществления, третье соединение имеет структуру, представленную в формуле (IIIa):

В некоторых предпочтительных вариантах осуществления, четвертое соединение имеет структуру, представленную в формуле (IVa):

Дополнительно, как описано выше, способ по настоящему изобретению может включать стадию промывания, при необходимости. Стадию промывания можно добавлять к любому желаемому этапу, и необязательно стадию промывания можно осуществлять один или несколько раз.

Например, на стадии (5), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления флуорофорнесущего соединения (например, соединения формулы (II) или соединения формулы (IV)), которое является свободным (т. е. не встроенным в нить нуклеиновой кислоты), тем самым минимизируя неспецифический флуоресцентный сигнал насколько возможно.

Аналогичным образом, на стадии (7), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления несущего флуоресценцию средства, используемого на стадии (6), тем самым минимизируя неспецифический флуоресцентный сигнал насколько возможно. Аналогичным образом, на стадии (9), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления средств, используемых на стадии (8), и получаемых продуктов (которые могут нести флуоресценцию), тем самым минимизируя неспецифический флуоресцентный сигнал и избегая нежелательного эффекта, оказываемого на последующую реакцию полимеризации насколько возможно.

Стадию промывания можно осуществлять с использованием различных подходящих промывающих растворов. Примеры таких промывающмх растворов включают, но не ограничиваясь этим, фосфатный буфер, цитратный буфер, буфер Tris-HCl, ацетатный буфер, карбонатный буфер и т. п. Специалисты в данной области способны выбирать подходящий промывающий раствор (включая подходящий ингредиент, концентрацию, ионную силу, значение pH и т. д.) в соответствии с фактическими потребностями.

Образцовый вариант осуществления 2

В некоторых образцовых вариантах осуществления, способностью четырех соединений испускать флуоресцентные сигналы управляют (например, поддерживют или изменяют) на стадии (6) с использованием пары связывания (которая содержит два элемента, которые взаимодействуют друг с другом посредством специфического нековалентного взаимодействия); и предпочтительно удаления защитной группы и флуоресцентного сигнала можно достичь на стадии (8) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления. Например, в некоторых образцовых вариантах осуществления, первое, второе, третье и четвертое соединения могут иметь структуры формул (I), (II), (III) и (IV), соответственно:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой (i) один элемент второй пары связывания, и также представляет собой один элемент третьей пары связывания; или

представляет собой (ii) только один элемент третьей пары связывания; и R6a представляет собой Dye1 или R6a связывают с -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно, реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования, присутствует между R4c и R6a.

В таком образцовом варианте осуществления, само четвертое соединение может нести флуорофор, способный испускать тот же флуоресцентный сигнал, что и второе соединение, или может не нести флуорофор, но специфически взаимодействовать со/связываться со средством (например, другим элементом второй пары связывания или соединением, способным выполнять вторую реакцию биоортогонального лигирования с R6a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения) на стадии (5), чтобы вводить флуорофор в четвертое соединение, и и позволяет четвертому соединению испускать тот же флуоресцентный сигнал, что и у второго соединения. Кроме того, флуорофор можно вводить в третье соединение посредством специфического взаимодействия/связывания между R5a и другим элементом (представленным как «R5b-L-Dye3» в настоящем описании, где R5b представляет собой другой элемент первой пары связывания, L представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, который способен испускать флуоресцентный сигнал, предпочтительно флуорофор, который является таким же, как флуорофор второго соединения, или флуорофор, который имеет другую структуру, но тот же или по существу тот же спектр испускания, что и у второго соединения) первой пары связывания, несущим флуорофор. Кроме того, (i) флуоресцентный сигнал, испускаемый четвертым соединением, можно гасить посредством специфического взаимодействия/связывания между R6a с другим элементом третьей пары связывания, несущим гасящую группу (представленную как «R6c-L6-Que» в настоящем описании, где R6c представляет собой другой элемент третьей пары связывания, L6 представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, которая способна гасить флуоресцентный сигнал, испускаемый посредством Dye); или (ii) флуоресцентный сигнал в четвертом соединении можно гасить, позволяя R8 в четвертом соединении осуществлять реакцию биоортогонального лигирования с соединением, несущим гасящую группу. В таких образцовых вариантах осуществления, R6a может представлять собой элемент двух пар связывания (вторая пара связывания R6a и R6b и третья пара связывания R6a и R6c). Особенно предпочтительно, два элемента первой пары связывания (R5a и R5b) не взаимодействуют с двумя элементами третьей пары связывания (R6a и R6b). Кроме того, особенно предпочтительно, R5a и R5b не влияют на специфическое взаимодействие между R6a и R6c, и R6a и R6c не влияют на специфическое взаимодействие между R5a и R5b.

Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая не оказывает эффекта на первое соединение и второе соединение, но позволяет R5a осуществлять специфическое взаимодействие/связывание с другим элементом (R5b-L5-Dye3) первой пары связывания, несущим флуорофор (тем самым вводя флуорофор в третье соединение для того, чтобы позволять ему нести флуорофор и испускать флуоресцентный сигнал), и позволяет R6a осуществлять специфическое взаимодействие/связывание с другим элементом (R6c-L6-Que) второй пары связывания, несущим гасящую группу (тем самым гася флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении), или позволяет R8 в четвертом соединении осуществлять реакцию биоортогонального лигирования с соединением, несущим гасящую группу (тем самым гася флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении). В таких образцовых вариантах осуществления, перед обработкой на стадии (6), первое соединение и третье соединение, если присутствуют, не испускают флуорофор, и второе соединение и четвертое соединение, если присутствуют, флуоресцируют; кроме того, после обработки на стадии (6), первое соединение (если присутствует) все еще не флуоресцирует, второе соединение (если присутствует) все еще флуоресцирует, третье соединение (если присутствует) меняется для того, чтобы флуоресцировать, и четвертое соединение (если присутствует) меняется для того, чтобы не флуоресцировать. Следовательно, тип соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, можно определять посредством обнаружения и сравнения флуоресцентного сигнала. В способе по настоящему изобретению, подходящую гасящую группу можно выбирать в соответствии с используемым флуорофором. Гасящие группы для различных флуорофоров хорошо известны в данной области, и их примеры включают, но не ограничиваясь этим, DABCYL, гасители BHQ (такие как BHQ-1 или BHQ-2), ECLIPSE и/или TAMRA.

Кроме того, в таких образцовых вариантах осуществления, позволяя R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, удаляют защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном в 3'-конец растущей нити нуклеиновой кислоты, и удаляют флуорофор (если присутствует) на дуплексе или растущей нити нуклеиновой кислоты. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления. В таких образцовых вариантах осуществления, после обработки на стадии (8), растущая нить нуклеиновой кислоты не будет иметь флуорофор, и рибоза или дезоксирибоза на 3'-конце растущей нити нуклеиновой кислоты будет иметь свободную гидроксильную группу в 3'-положении, где свободную гидроксильную группу можно использовать для того, чтобы инициировать следующий раунд полимеризации.

Следовательно, в некоторых вариантах осуществления способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, прикрепленной к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой (i) один элемент второй пары связывания, и также представляет собой один элемент третьей пары связывания; или

представляет собой (ii) только один элемент третьей пары связывания; и R6a представляет собой Dye1 или R6a связывают с -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно, реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования, присутствует между R4c и R6a.

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, где праймер служит в качестве начальной растущей нити нуклеиновой кислоты, и вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию, образует дуплекс, прикрепленный к основе;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5) (i) если четвертое соединение неспособно испускать флуоресцентный сигнал, R6a представляет собой один элемент второй пары связывания и также представляет собой один элемент третьей пары связывания, то дуплекс или растущую нить нуклеиновой кислоты подвергают обработке в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, но позволяет R6a в четвертом соединении осуществлять специфическое взаимодействие/связывание со средством (например, другим элементом второй пары связывания), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий структуру, отличающуюся от, но тот же или по существу тот же спектр испускания, что и у второго соединения); после этого, удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент второй пары связывания, несущий флуорофор, имеет следующую структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент второй пары связывания, и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет другую структур, но тот же или по существу тот же спектр испускания, что и Dye;

(ii) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, R6a представляет собой только один элемент третьей пары связывания и R6a представляет собой Dye1 или также связан с -L3-Dye1, то удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение, но она позволяет R5a в третьем соединении специфически связываться с другим элементрм первой пары связывания, несущим флуорофор, тем самым вводя флуорофор в третье соединение, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и, обработка (i) позволяет R6a в четвертом соединении специфически связываться с другим элементом третьей пары связывания, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении, или (ii) позволяет R8 в четвертом соединении осуществлять реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении; где

другой элемент первой пары связывания, несущий флуорофор, имеет структуру: R5b-L5-Dye3; где R5b представляет собой другой элемент первой пары связывания и L5 независимо представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, способный испускать флуоресцентный сигнал, имеющий ту же структуру, что и флуорофор во втором соединении, или имеющий отличающуюся структуру, но имеющий тот же спектр испускания, что и у второго соединения; и,

другой элемент третьей пары связывания, несущий гасящую группу, имеет структуру: R6c-L6-Que; где R6c представляет собой другой элемент второй пары связывания и L6 независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2;

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу), и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадию:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, на стадии (4), если соединение формулы (I) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (I) не несет флуорофор и оно не вступает в реакцию на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих из стадий (5)-(7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (I).

На стадии (4), если соединение формулы (II) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (II) несет флуорофор и оно не выполняет какую-либо реакцию на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (II).

На стадии (4), если соединение формулы (III) встраивают в 3'-конец растущей нити нуклеиновой кислоты, (i) поскольку соединение формулы (III) не несет флуорофор, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) соединение формулы (III) выполняет реакцию биоортогонального лигирования со средством, несущим флуорофор, на стадии (6), вводя флуорофор в растущую нить нуклеиновой кислоты, следовательно, флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5) и флуоресцентный сигнал обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (III).

На стадии (4), если соединение формулы (IV) встраивают в 3'-конец растущей нити нуклеиновой кислоты, (i) поскольку само соединение формулы (IV) несет флуорофор или несет флуорофор после обработки на стадии (5), флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку соединение формулы (IV) выполняет реакцию биоортогонального расщепления или третью реакцию биоортогонального лигирования на стадии (6) для того, чтобы утрачивать флуорофор, или гасят флуоресцентный сигнал, флуоресцентный сигнал, тем самым, не будут обнаруживать на стадии (7). Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и флуоресцентный сигнал не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (IV).

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает: после стадии (7), определение типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты на стадии (4) в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (I);

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (II);

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (III); и,

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (IV).

В некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, после стадии (7), на основе принципа комплементарного спаривания оснований, что тип основания в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, определяют в соответствии с типом соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) не вступают в реакцию друг с другом в ходе реакции полимеризации нуклеотидов.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания, и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание T или U и Base4 представляет собой основание C. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание T или U и Base4 представляет собой основание C.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пиримидиновые основания и Base3 и Base4 представляют собой пуриновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание A и Base4 представляет собой основание G. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание A и Base4 представляет собой основание G.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R1. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой монофосфатную группу (-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой дифосфатную группу (-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой трифосфатную группу (-PO3H-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой тетрафосфатную группу (-PO3H-PO3H-PO3H-PO3H2).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R2. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -OH.

В некоторых предпочтительных вариантах осуществления, каждый один из R3a, R3b, R3c, R3d, R4a, R4b, R4c независимо способен выполнять реакцию биоортогонального расщепления. Как используют в настоящем описании, выражение «каждый независимо способен выполнять реакцию биоортогонального расщепления» обозначает, что реакционноспособные группы, средства или молекулы и т. д. способны выполнять реакцию биоортогонального расщепления, соответственно, и не взаимодействовать или не влиять друг на друга. Например, выражение «каждый один из R3a и R3b независимо способен выполнять реакцию биоортогонального расщепления» обозначает, что оба R3a и R3b способны выполнять реакцию биоортогонального расщепления и R3a не влияет на реакцию биоортогонального расщепления R3b, R3b не влияет на реакцию биоортогонального расщепления R3a.

В некоторых образцовых вариантах осуществления, R3a представляет собой первую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии первого средства; R3b представляет собой вторую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии второго средства; R3c представляет собой третью реакционноспособную группую, способную выполнять реакцию биоортогонального расщепления в присутствии третьего средства; R3d представляет собой четвертую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии четвертого средства; R4a представляет собой пятую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии пятого средства; R4b представляет собой шестую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии шестого средства; и R4c представляет собой седьмую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии седьмого средства.

Предпочтительно, в таких вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство можно добавлять для того, чтобы заставлять R3a, R3b, R3c, R3d, R4a, R4b, R4c (если присутствуют) осуществлять реакцию биоортогонального расщепления соответственно. Следовательно, R3a, R3b, R3c, R3d (если присутствуют) будут удалены из 3'-положения рибозы или дезоксирибозы (другими словами, -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) будут превращены в свободную гидроксильную группу), и R4a и флуорофор, прикрепленный к нему (если присутствует), R4b и флуорофор, прикрепленный к нему (если присутствует), и R4c и флуорофор, прикрепленный к нему (если присутствует), также будут удалены. Таким образом, после стадии (8), растущая нить нуклеиновой кислоты не будет нести флуорофор и будет иметь свободную гидроксильную группу на 3'-конце, которую можно использовать для следующего раунда полимеризации. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство добавляют для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, и дуплекс инкубируют с первым средством, вторым средством, третьим средством, четвертым средством, пятым средством, шестым средством и седьмым средством в условиях, которые позволяют R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, соответственно.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одно и то же средство. Другими словами, на стадии (8), каждый из одинаковых R3a, R3b, R3c и R3d (если присутствует) будет выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства (т. е. первого средства), и их удаляют из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой одну и ту же реакционноспособную группу. В этом случае, предпочтительно, на стадии (8), пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство. Другими словами, на стадии (8), одинаковые R4a, R4b и R4c (если присутствуют) будут выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства (т. е. пятого средства), и их удаляют из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a, R4b и R4c способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство. Другими словами, на стадии (8), средство (т. е. первое средство) добавляют для того, чтобы заставлять R3a, R3b, R3c, R3d, R4a, R4b и R4c (если присутствуют) осуществлять реакцию биоортогонального расщепления и удалять из растущей нити нуклеиновой кислоты соответственно в присутствии указанного средства (т. е. первого средства).

В некоторых образцовых вариантах осуществления, особенно предпочтительно, что два элемента первой пары связывания (R5a и R5b) не вступают в реакцию с двумя элементамм третьей пары связывания (R6a и R6c). Кроме того, особенно предпочтительн, что R5a и R5b не влияют на специфическое взаимодействие между R6a и R6c и что R6a и R6c не влияют на специфическое взаимодействие между R5a и R5b. В таких вариантах осуществления, предпочтительно, R5b-L5-Dye3 и R6c-L6-Que можно добавлять на стадии (6), тем самым позволяя R5a (если присутствует) в соединении формулы (III) специфически связываться с R5b в R5b-L5-D3 и позволяя R6a (если присутствует) в соединении формулы (IV) специфически связываться с R6c в R6c-L6-Que. Следовательно, флуорофор Dye, связанный с R5b, вводят в соединение формулы (III) посредством специфического взаимодействия между двумя элементами (R5a и R5b) первой пары связывания, тем самым позволяя соединению формулы (III) испускать флуоресцентный сигнал. Между тем, гасящую группу Que, соединенную с R6c, вводят в соединение формулы (IV) посредством специфического взаимодействия между двумя элементами (R6a и R6c) третьей пары связывания, тем самым гася флуоресцентный сигнал, испускаемый посредством Dye в соединении формулы (IV), и соединение формулы (IV) более не флуоресцирует. В таких вариантах осуществления, особенно предпочтительно, что, R5b-L5-Dye3 не вступает в реакцию с первым соединением и вторым соединением на стадии (6), и кроме того предпочтительно R6c-L6-Que не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), R5b-L5-Dye3 и R6c-L6-Que можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где R5b представляет собой другой элемент первой пары связывания, L5 представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, способный испускать флуоресцентный сигнал, R6c представляет собой другой элемент третьей пары связывания, L6 представляет собой линкерную группу или отсутствует и Que представляет гасящую группу для флуоресцентного сигнала, испускаемого посредством Dye1 или Dye2; затем дуплекс инкубируют с R5b-L5-Dye3 и R6c-L6-Que в условиях, которые допускают специфическое связывание между R5a и R5b и допускают специфическое связывание между R6a и R6c.

В некоторых образцовых вариантах осуществления, R6a представляет собой один элемент третьей пары связывания; и R6a представляет собой Dye1, или R6a дополнительно соединяют с -L3-Dye1, где Dye1 имеет ту же структуру, что и Dye, или имеет отличающуюся структуру, но тот же спектр испускания, что и Dye, следовательно, само четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение. В таких вариантах осуществления, стадия (6) включает добавление восьмого средства, тем самым позволяя R6a (если присутствует) в соединении формулы (IV) специфически взаимодействовать с и/или специфически связываться с другим элементом третьей пары связывания. Например, восьмое средство может содержать другой элемент третьей пары связывания, несущий флуорофор, который имеет структуру R6c-L6-Que, где R6c представляет собой другой элемент третьей пары связывания, L6 независимо представляет собой линкерную группу или отсутствует и Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2.

В некоторых образцовых вариантах осуществления, четвертое соединение не несет флуорофор и R6a представляет собой один элемент второй пары связывания и представляет собой один элемент третьей пары связывания. В таких вариантах осуществления, стадия (5) включает добавление девятого средства, тем самым позволяя R6a (если присутствует) в соединении формулы (IV) специфически взаимодействовать с и/или специфически связываться с другим элементом второй пары связывания. Например, девятое средство может содержать другой элемент второй пары связывания, несущий флуорофор, который имеет структуру R6b-L4-Dye2, где R6b представляет собой другой элемент второй пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал, имеющий ту же структуру, что и Dye, или имеющий отличающуюся структуру, но имеющий тот же спектр испускания, что и Dye. В таких вариантах осуществления, стадия (6) включает добавление десятого средства, тем самым позволяя R6a (если присутствует) в соединении формулы (IV) специфически взаимодействовать с и/или связываться с другим элементом третьей пары связывания. Например, десятое средство может содержать другой элемент третьей пары связывания, несущий флуорофор, который имеет структуру R6c-L6-Que, где R6c представляет собой другой элемент третьей пары связывания и L6 независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2.

Предпочтительно, вариантах осуществления предыдущих двух типов одиннадцатое средство и десятое средство можно добавлять на стадии (6), тем самым позволяя R5a (если присутствует) в соединении формулы (III) специфически взаимодействовать с и/или специфически связываться с другим элементом первой пары связывания и позволяя R6a (если присутствует) в соединении формулы (IV) специфически взаимодействовать с и/или специфически связываться с другим элементом третьей пары связывания. Например, одиннадцатое средство может содержать другой элемент первой пары связывания, где другой элемент первой пары связывания несет тот же флуорофор (или флуорофор имеет другую структуру, но тот же или по существу тот же флуорофор), что и второе соединение и четвертое соединение, и другой элемент первой пары связывания способен специфически связываться с R5a, тем самым вводя флуорофор, который он несет, в соединение формулы (III). Кроме того, десятое средство содержит другой элемент третьей пары связывания, несущий гаситель, где другой элемент третьей пары связывания способен специфически взаимодействовать с и/или специфически связываться с R6a (если присутствует), тем самым гасят флуоресцентный сигнал в соединении формулы (IV). В таких вариантах осуществления, особенно предпочтительно, что, на стадии (6), одиннадцатое средство не вступает в реакцию с первым соединением и вторым соединением, и кроме того предпочтительно, десятое средство не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, одиннадцатое средство и десятое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу на стадии (6), где одиннадцатое средство содержит другой элемент первой пары связывания, и другой элемент первой пары связывания может нести тот же флуорофор (или флуорофор имеет другую структуру, но тот же или по существу тот же спектр испускания), что и флуорофор второго соединения и четвертого соединения, и другой элемент первой пары связывания спосбен специфически взаимодействовать с и/или специфически связываться с R5a, тем самым вводя флуорофор, который он несет, в третье соединение; десятое средство содержит другой элемент третьей пары связывания, где другой элемент третьей пары связывания несет гаситель и спосбен специфически взаимодействовать с и/или специфически связываться с R6a, тем самым вводя гаситель, который он несет, в четвертое соединение; затем дуплекс инкубируют с одиннадцатым средством и десятым средством в определенных условиях, где условия позволяют R5a специфически взаимодействовать с и/или специфически связываться с другим элементом первой пары связывания и позволяют R6a специфически взаимодействовать с и/или специфически связываться с другим элементом третьей пары связывания.

В некоторых образцовых вариантах осуществления, реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования, существует между R5b и R7a четвертого соединения. В некоторых предпочтительных вариантах осуществления, каждый один из R3a, R3b, R3c, R3d, R4a, R4b, R5a и R8 независимо способен выполнять биоортогональное расщепление или реакцию лигирования. В некоторых образцовых вариантах осуществления R8a способен выполнять третью реакцию биоортогонального лигирования в присутствии двенадцатого средства.

Предпочтительно, в таких вариантах осуществления одиннадцатое средство и двенадцатое средство можно добавлять на стадии (6), заставляя R5a (если присутствует) в соединении формулы (III) осуществлять первую реакцию биоортогонального лигирования, и R8 (если присутствует) в соединении формулы (IV) позволяют осуществлять третью реакцию биоортогонального лигирования. Например, одиннадцатое средство может содержать другой элемент первой пары связывания, и другой элемент первой пары связывания несет тот же флуорофор, что и второе соединение и четвертое соединение (или флуорофор имеет другую структуру, но тот же или по существу тот же флуорофор), и другой элемент первой пары связывания способен к специфическому связыванию с R5a и тем самым ко введению флуорофора, который он несет, в соединение формулы (III). Кроме того, двенадцатое средство позволяет R8 в соединении формулы (IV) осуществлять третью реакцию биоортогонального лигирования и тем самым гася флуоресцентный сигнал в соединении формулы (IV). В таких вариантах осуществления, также особенно предпочтительно, что одиннадцатое средство не вступает в реакцию с первым соединением и вторым соединением на стадии (6), и кроме того предпочтительно двенадцатое средство не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, одиннадцатое средство и двенадцатое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу на стадии (6), где одиннадцатое средство содержит другой элемент первой пары связывания, и другой элемент первой пары связывания может нести тот же флуорофор (или флуорофор имеет другую структуру, но тот же или по существу тот же флуорофор), что и второе соединение и четвертое соединение, и другой элемент первой пары связывания спосбен специфически взаимодействовать с и/или специфически связываться с R5a, тем самым флуорофор, который он несет, можно вводить в третье соединение; двенадцатое средство содержит соединение M, указанное соединение M несет гаситель, и соединение M способно выполнять третью реакцию биоортогонального лигирования с R8 для того, чтобы вводить гаситель в соединении M в четвертое соединение; затем дуплекс инкубируют с одиннадцатым средством и двенадцатым средством в условиях, которые позволяют R5a специфически взаимодействовать с и/или специфически связываться с другим элементом первой пары связывания, и условиях, которые позволяют M осуществлять третью реакцию биоортогонального лигирования с R8.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d независимо выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5 циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу, и их выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5 циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил представляет собой. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу и представляют собой -CH2N3.

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c независимо выбирают из группы, состоящей из: , -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой одну и ту же реакционноспособную группу, и их выбирают из группы, состоящей из: , -O-C3-8 циклоалкенилен. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой . В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой .

В некоторых предпочтительных вариантах осуществления, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестоей средство и седьмое средство независимо содержат материал, выбранный из группы, состоящей из:

комплекса палладия (например, комплекс палладия с четырьмя трифенилфосфин 3,3',3''-трисульфоновыми кислотами);

комплекса рутения (например, комплекс рутения с хинолинкарбоксилатом (или его производным), аллилом или циклопентадиеном);

фосфида (например, карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3); и

соединения Q, которое имеет структурную формулу , где Z1 и Z2 независимо выбирают из модифицированной или немодифицированной алкильной группы (например, C1-C6 алкильной группы, такой как C1 алкильная группа, C2 алкильная группа, C3 алкильная группа, C4 алкильная группа, C5 алкильная группа или C6 алкильная группа) и модифицированного или немодифицированного арила (например, 6-10-членный арил, такой как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил или пиридил).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2. В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство содержат комплекс палладия или комплекс рутения. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3. В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство и содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой . В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третьи средства, четвертое средство, пятое средство, шестое средство и седьмое средство содержат соединение Q как определено выше. Кроме того, предпочтительно, в соединении Q Z1 представляет собой метил; и Z2 представляет собой модифицированный или немодифицированный пиридил. Более предпочтительно, соединение Q представляет собой , где W представляет собой водород или модифицирующую группу. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство и содержат соединение Q как определено выше.

В некоторых предпочтительных вариантах осуществления, линкерные группы L1, L2 и L3 в первом соединении, втором соединении, третьем соединении и четвертом соединении и L4, L5 и L6 в R6b-L4-Dye2, R5b-L5-Dye3 и R6c-L6-Que не зависят друг от друга и конкретно не ограничены. Специалист в данной области может выбирать подходящие линкерные группы L1, L2, L3, L4, L5 и L6 в соответствии с основаниями (Base1, Base2, Base3 или Base4) в соединениях, реакционноспособными группами (R4a, R4b и R4c) и элементами (R5a, R5b, R6a и R6b) первой пары связывания и второй пары связывания.

В некоторых образцовых вариантах осуществления, линкерные группы L1, L2, L3, L4, L5 и L6 независимо выбирают из группы, состоящей из:

где m1, m2, m3, m4, n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых образцовых вариантах осуществления, L1 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: , где m1, m2, m3 и m4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, L1 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, L2 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из:

где n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e, и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, L2 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: , где n1, n2, n3, n4, p1, p2, p3 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, L2 в первом соединении, втором соединении, третьем соединении или четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, R5a и R5b представляют собой два элемента первой пары связывания, R6a и R6b представляют собой два элемента второй пары связывания, и R6a и R6c представляют собой два элемента третьей пары связывания. В некоторых предпочтительных вариантах осуществления, первую пару связывания и вторую пару связывания независимо выбирают из группы, состоящей из: антиген (например, низкомолекулярного антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-растительный лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину и бромдезоксигуанозин 5-положения и его антитело.

В некоторых предпочтительных вариантах осуществления два элемента первой пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину. В некоторых предпочтительных вариантах осуществления, R5a представляет собой биотин или дезтиобиотин и R5b представляет собой авидин (например, стрептавидин). В некоторых предпочтительных вариантах осуществления, R5a представляет собой дигоксин и R5b представляет собой антитело к дигоксину.

В некоторых предпочтительных вариантах осуществления два элемента второй пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину. В некоторых предпочтительных вариантах осуществления R6a представляет собой биотин или дезтиобиотин, и R6b представляет собой авидин (например, стрептавидин). В некоторых предпочтительных вариантах осуществления, R6a представляет собой дигоксин и R6b представляет собой антитело к дигоксину.

В некоторых предпочтительных вариантах осуществления, два элемента третьей пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина), (c) дигоксина и антитела к дигоксину, (d) Cy3 и антитела к Cy3. В некоторых предпочтительных вариантах осуществления, R6a представляет собой Cy3 и R6c представляет собой антитело к Cy3. Особенно предпочтительно, что два элемента первой пары связывания (R5a и R5b) не взаимодействуют с двумя элементами третьей пары связывания (R6a и R6c). Кроме того, особенно предпочтительно, что R5a и R5b не влияют на специфическое взаимодействие между R6a и R6c и что R6a и R6c не влияют на специфическое взаимодействие между R5a и R5b. Таким образом, в некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания представляют собой биотин и авидин (например, стрептавидин), и два элемента третьей пары связывания представляют собой дигоксин и антитело к дигоксину. В некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания представляют собой дигоксин и антитело к дигоксину и два элемента третьей пары связывания представляют собой биотин и авидин (например, стрептавидин). В некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания представляют собой биотин и авидин (например, стрептавидин) и два элемента третьей пары связывания представляют собой Cy3 и антитело к Cy3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит комплекс палладия или комплекс рутения; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой дигоксин; R6b представляет собой антитело к дигоксину. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой дигоксин; R6b представляет собой антитело к дигоксину. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a, R4b и R4c представляют собой , первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит комплекс палладия или комплекс рутения; R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой , R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой дигоксин; R6b представляет собой антитело к дигоксину. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a, R4b и R4c представляют собой , первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит комплекс палладия или комплекс рутения; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой Cy3; R6b представляет собой антитело к Cy3. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой Cy3; R6b представляет собой антитело к Cy3. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой Cy3; R6b представляет собой антитело к Cy3. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, первое соединение имеет структуру, представленную в формуле (Ib):

В некоторых предпочтительных вариантах осуществления, второе соединение имеет структуру, представленную в формуле (IIb):

В некоторых предпочтительных вариантах осуществления, третье соединение имеет структуру, представленную в формуле (IIIb):

В некоторых предпочтительных вариантах осуществления, четвертое соединение имеет структуру, представленную в формуле (IVb):

Дополнительно, как описано выше, способ по настоящему изобретению может включать стадию промывания при необходимости. Стадию промывания можно добавлять на любом желаемом этапе, и необязательно стадию промывания можно осуществлять один или несколько раз.

Например, на стадии (5), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления флуорофорнесущего соединения (например, R6b-L4-Dye2, соединения формулы (II) или соединения формулы (IV)), которое является свободным (т. е. не встроенным в нить нуклеиновой кислоты), тем самым минимизируя неспецифический флуоресцентный сигнал насколько возможно.

Аналогичным образом, на стадии (7), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления несущего флуоресценцию средства (например R5b-L5-Dye3), используемого на стадии (6), тем самым минимизируя неспецифический флуоресцентный сигнал насколько возможно.

Аналогичным образом, на стадии (9), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления средств, используемых на стадии (8), и получаемых продуктов (которые могут нести флуоресценцию), тем самым минимизируя неспецифический флуоресцентный сигнал и избегая нежелательного эффекта, оказываемого на последующую реакцию полимеризации насколько возможно.

Стадию промывания можно осуществлять с использованием различных подходящих промывающих растворов. Примеры таких промывающих растворов включают, но не ограничиваясь этим, фосфатный буфер, цитратный буфер, буфер Tris-HCl, ацетатный буфер, карбонатный буфер и т. п. Специалисты в данной области способны выбирать подходящий промывающий раствор (включая подходящий ингредиент, концентрацию, ионную силу, значение pH и т. д.) в соответствии с фактическими потребностями.

Образцовый вариант осуществления 3

В некоторых образцовых вариантах осуществления, способностью четырех соединений испускать флуоресцентные сигналы управляют (например, поддерживают или изменяют) на стадии (6) с использованием пары связывания (которая содержит два элемента, которые взаимодействуют друг с другом посредством специфического нековалентного взаимодействия); и, предпочтительно, удаления защитной группы и флуоресцентного сигнала можно достичь на стадии (8) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления. Например, в некоторых образцовых вариантах осуществления, первое, второе, третье и четвертое соединения могут иметь структуры формул (I), (II), (III) и (IV), соответственно:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

R6a представляет собой (i) один элемент первой пары связывания и представляет собой один элемент второй пары связывания; или

представляет собой (ii) только один элемент второй пары связывания, и R6a представляет собой Dye1 или R6a также связывают с -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал; Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно, реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования, присутствует между R4c и R6a.

В таких образцовых вариантах осуществления, само четвертое соединение может нести флуорофор, способный испускать тот же флуоресцентный сигнал, что и у второго соединения, или может не нести флуорофор, но специфически взаимодействовать со/связываться со средством (например, другим элементом первой пары связывания), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения) на стадии (5), тем самым вводя флуорофор в соединение IV и заставляя соединение IV испускать тот же флуоресцентный сигнал, что и второе соединение. Кроме того, позволяя R5a осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, тот же, что у второго соединения, или флуорофор, имеющий структуру, отличную от, но имеющий тот же или по существу тот же спектр испускания, что и у второго соединения), флуорофор вводят в третье соединение. Кроме того, (i) флуоресцентный сигнал, испускаемый четвертым соединением, можно гасить, позволяя R6a специфически взаимодействовать с/специфически связываться с другим элементом (представленным в настоящем описании как «R6c-L'-Que», где R6c представляет собой другой элемент второй пары связывания, L' представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, которая способна гасить флуоресцентный сигнал, испускаемый посредством Dye) второй пары связывания, несущим гасящую группу; или (ii) флуоресцентный сигнал, испускаемый четвертым соединением, можно гасить, позволяя R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу. В таких образцовых вариантах осуществления, особенно предпочтительно, что R5a и средство, несущее флуорофор, не вступает в реакцию с двумя элементами второй пары связывания (R6a и R6b). Кроме того, особенно предпочтительно, что R5a и средство, несущее флуорофор, не влияют на специфическое взаимодействие между R6a и R6b, и R6a и R6b не влияют на реакцию биоортогонального лигирования между R5a и средством, несущим флуорофор.

Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая не оказывает эффекта на первое соединение и второе соединение, но позволяет R5a осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, такой же как флуорофор второго соединения, или флуорофор, имеющий отличающуюся структуру, но тот же или по существу тот же спектр испускания, что и у второго соединения) (тем самым вводя флуорофор, который несет средство, в третье соединение и заставляя третье соединение нести флуорофор и испускать флуоресцентный сигнал); кроме того, обработка позволяет R6a специфически взаимодействовать с/связываться с другим элементом (R6b-L'-Que) пары связывания, несущим гасящую группу (тем самым гася флуорофор в четвертом соединении и заставляя четвертое соединение более не испускать флуоресцентный сигнал), или позволяет R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу (тем самым гася флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении). В таких образцовых вариантах осуществления, перед обработкой на стадии (6), первое соединение и третье соединение, если присутствуют, не испускают флуорофор, и второе соединение и четвертое соединение, если присутствуют, флуоресцируют; кроме того, после обработки на стадии (6), первое соединение (если присутствует) все еще не флуоресцирует, второе соединение (если присутствует) все еще флуоресцирует, третье соединение (если присутствует) меняется для того, чтобы флуоресцировать, и четвертое соединение (если присутствует) меняется для того, чтобы не флуоресцировать. Следовательно, тип соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, можно определять посредством обнаружения и сравнения флуоресцентного сигнала.

В способе по настоящему изобретению, подходящую гасящую группу можно выбирать в соответствии с используемым флуорофором. Гасящие группы для различных флуорофоров хорошо известны в данной области и типичные их примеры включают, но не ограничиваясь этим, DABCYL, гасители BHQ (такие как BHQ-1 или BHQ-2), ECLIPSE и/или TAMRA.

Кроме того, в таких образцовых вариантах осуществления, позволяя R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления, удаляют защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном в 3'-конец растущей нити нуклеиновой кислоты, и удаляют флуорофор (если присутствует) на дуплексе или растущей нити нуклеиновой кислоты. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления. В таких образцовых вариантах осуществления, после обработки на стадии (8), растущая нить нуклеиновой кислоты не будет иметь флуорофор, и рибоза или дезоксирибоза на 3'-конце растущей нити нуклеиновой кислоты будет иметь свободную гидроксильную группу в 3'-положении, где свободную гидроксильную группу можно использовать для того, чтобы инициировать следующий раунд полимеризации.

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, прикрепленной к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляют собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

R6a представляет собой (i) один элемент первой пары связывания, и представляет собой один элемент второй пары связывания; или

представляет собой (ii) только один элемент второй пары связывания, и R6a представляет собой Dye1 или R6a также связывают с -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye представляет флуорофор, способный испускать флуоресцентный сигнал; Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, и праймер служит в качестве начальной растущей нити нуклеиновой кислоты, и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5) (i) если четвертое соединение неспособно испускать флуоресцентный сигнал, R6a представляет собой один элемент первой пары связывания и представляет собой один элемент второй пары связывания, то проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством (например, другим элементом первой пары связывания), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий структуру, отличную от, но имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент первой пары связывания, несущий флуорофор, имеет следующую структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент первой пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же или по существу тот же спектр испускания, что и Dye;

(ii) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, R6a представляет собой только один элемент второй пары связывания, и R6a представляет собой Dye1 или R6a также связывают с -L3-Dye1, то удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение, но способна позволять R5a в третьем соединении осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий структуру, отличную от, но имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения), тем самым вводя флуорофор в средстве в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и обработка (i) способна позволять R6a в четвертом соединении специфически связываться с другим элементом второй пары связывания, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении, или (ii) способна позволять R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении; где

другой элемент второй пары связывания, несущий гасящую группу, имеет следующую структуру: R6c-L'-Que; где R6c представляет собой другой элемент второй пары связывания, L' независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2;

(7) удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b и R4c осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствует) в свободную гидроксильную группу), и, удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадию:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, на стадии (4), если соединение формулы (I) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (I) не несет флуорофор и оно не вступает в реакцию на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих из стадий (5)-(7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (I).

На стадии (4), если соединение формулы (II) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (II) несет флуорофор и оно не выполняет какую-либо реакцию на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (II).

На стадии (4), если соединение формулы (III) встраивают в 3'-конец растущей нити нуклеиновой кислоты, (i) поскольку соединение формулы (III) не несет флуорофор, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) соединение формулы (III) выполняет реакцию биоортогонального лигирования со средством, несущим флуорофор, на стадии (6), вводя флуорофор в растущую нить нуклеиновой кислоты, следовательно, флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5) и флуоресцентный сигнал обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (III).

На стадии (4), если соединение формулы (IV) встраивают в 3'-конец растущей нити нуклеиновой кислоты, (i) поскольку само соединение формулы (IV) несет флуорофор или несет флуорофор после обработки на стадии (5), флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку соединение формулы (IV) специфически связывается с парой связывания, несущей гасящую группу (R6b-L'-Que), или выполняет реакцию биоортогонального расщепления или третью реакцию биоортогонального лигирования на стадии (6), тем самым вводя гасящую группу в растущую нить нуклеиновой кислоты или гася флуоресцентный сигнал, флуоресцентный сигнал, тем самым, не будут обнаруживать на стадии (7). Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и флуоресцентный сигнал не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (IV).

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает: после стадии (7), определение типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты на стадии (4) в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (I);

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (II);

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (III); и,

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (IV).

В некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, что, после стадии (7), на основе принципа комплементарного спаривания оснований, тип основания в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, определяют в соответствии с типом соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) не вступают в реакцию друг с другом в ходе реакции полимеризации нуклеотидов.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания, и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание T или U и Base4 представляет собой основание C. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание T или U и Base4 представляет собой основание C.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пиримидиновые основания и Base3 и Base4 представляют собой пуриновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание A и Base4 представляет собой основание G. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание A и Base4 представляет собой основание G.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R1. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой монофосфатную группу (-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой дифосфатную группу (-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой трифосфатную группу (-PO3H-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой тетрафосфатную группу (-PO3H-PO3H-PO3H-PO3H2).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R2. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -OH.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a, R4b, R4c независимо способны выполнять реакцию биоортогонального расщепления. Как используют в настоящем описании, выражение «независимо способны выполнять реакцию биоортогонального расщепления» обозначает, что реакционноспособные группы, средства или молекулы и т. д. способны выполнять реакции биоортогонального расщепления, соответственно, и не взаимодействуют друг с другом или не влияют друг на друга. Например, выражение «R3a и R3b способны выполнять реакцию биоортогонального расщепления независимо» обозначает, что оба R3a и R3b способны выполнять реакцию биоортогонального расщепления, R3a не влияет на реакцию биоортогонального расщепления R3b, и R3b не влияет на реакцию биоортогонального расщепления R3a.

В некоторых образцовых вариантах осуществления, R3a представляет собой первую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии первого средства; R3b представляет собой вторую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии второго средства; R3c представляет собой третью реакционноспособную группую, способную выполнять реакцию биоортогонального расщепления в присутствии третьего средства; R3d представляет собой четвертую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии четвертого средства; R4a представляет собой пятую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии пятого средства; R4b представляет собой шестую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии шестого средства; R4c представляет собой седьмую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии седьмого средства; и R5a представляет собой восьмую реакционноспособную группу, способную выполнять реакцию биоортогонального лигирования в присутствии восьмого средства.

Предпочтительно, в таких вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство можно добавлять, тем самым заставляя R3a, R3b, R3c, R3d, R4a, R4b, R4c (если присутствуют) осуществлять реакцию биоортогонального расщепления, соответственно. Следовательно, R3a, R3b, R3c, R3d (если присутствуют) будут удалены из 3'-положения рибозы или дезоксирибозы (другими словами, -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) будут превращены в свободную гидроксильную группу), и R4a и флуорофор, прикрепленный к нему (если присутствует), R4b и флуорофор, прикрепленный к нему (если присутствует), и R4c и флуорофор, прикрепленный к нему (если присутствует), также будут удалены. Таким образом, после стадии (8), растущая нить нуклеиновой кислоты не несет флуорофор и имеет свободную гидроксильную группу на 3'-конце, которую можно использовать для следующего раунда полимеризации. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство добавляют для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, и дуплекс инкубируют с первым средством, вторым средством, третьим средством, четвертым средством, пятым средством, шестым средством и седьмым средством в условиях, которые позволяют R3a, R3b, R3c, R3d, R4a, R4b и R4c осуществлять реакцию биоортогонального расщепления, соответственно.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одну и ту же реакционноспособную группу. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одно и то же средство. Другими словами, на стадии (8), каждый из одинаковых R3a, R3b, R3c и R3d (если присутствует) будет выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства (т. е. первого средства), и их удаляют из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство.

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой одну и ту же реакционноспособную группу. В этом случае, предпочтительно, на стадии (8), пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство. Другими словами, на стадии (8), одни и те же R4a, R4b и R4c (если присутствуют) будут выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства (т. е. пятого средства), и их удаляют из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a, R4b и R4c способны выполнять реакцию биоортогонального расщепления, соответственно, в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одно и то же средство. Другими словами, на стадии (8), средство (т. е. первое средство) добавляют для того, чтобы заставлять R3a, R3b, R3c, R3d, R4a, R4b и R4c (если присутствуют) осуществлять реакцию биоортогонального расщепления, и их удаляют из растущей нити нуклеиновой кислоты, соответственно, в присутствии указанного средства (т. е. первого средства).

В некоторых образцовых вариантах осуществления, особенно предпочтительно, что R5a и средство, несущей флуорофор, не взаимодействуют с двумя элементами второй пары связывания (R6a и R6b). Кроме того, особенно предпочтительно, что R5a и средство, несущее флуорофор, не влияют на специфическое взаимодействие между R6a и R6b, и R6a и R6b не влияют на реакцию биоортогонального лигирования между R5a и средством, несущим флуорофор.

В таких вариантах осуществления, предпочтительно, на стадии (6), восьмое средство и R6c-L'-Que можно добавлять для того, чтобы позволять R5a (если присутствует) в соединении формулы (III) осуществлять реакцию биоортогонального лигирования, и позволять R6a (если присутствует) в соединении формулы (IV) специфически связываться с R6c в R6c-L'-Que. Например, восьмое средство может содержать соединение M, несущее флуорофор, который является таким же (или другим по структуре, но имеет тот же или по существу тот же спектр испускания), что и у второго соединения и четвертого соединения, и соединение M способно выполнять реакцию биоортогонального лигирования с R5a, и тем самым флуорофор в соединении M вводят в соединение формулы (III), чтобы заставлять соединение формулы (III) испускать флуоресцентный сигнал. Кроме того, посредством специфического взаимодействия между двумя элементами пары связывания (R6a и R6c), гасящую группу Que, соединенную с R6c, вводят в соединение формулы (IV), чтобы гасить флуоресцентный сигнал, испускаемый соединением формулы (IV), и соединение формулы (IV) более не испускает флуоресценцию. В таких вариантах осуществления, также особенно предпочтительно, что на стадии (6), восьмое средство не вступает в реакцию с первым соединением и вторым соединением, и кроме того предпочтительно R6c-L'-Que не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), восьмое средство и R6c-L'-Que можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где восьмое средство содержит соединение M, несущее флуорофор, который является таким же (или имеет другую структуру, но имеет тот же или по существу тот же спектр испускания), как и второе соединение и четвертое соединение, и соединение M способно выполнять реакцию биоортогонального лигирования с R5a, тем самым флуорофор в соединении M можно вводить в третье соединение; и R6c представляет собой другой элемент второй пары связывания, L' представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye; затем дуплекс инкубируют с восьмым средством и средствои R6c-L'-Que в условиях, позволяющих соединению M осуществлять реакцию биоортогонального лигирования с R5a и позволяющих R6a специфически связываться с R6c.

В некоторых образцовых вариантах осуществления, R6a представляет собой флуорофор Dye1, способный испускать флуоресцентный сигнал, Dye1 имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, с тем, чтобы само четвертое соединение было способно испускать тот же флуоресцентный сигнал, что и второе соединение.

В некоторых образцовых вариантах осуществления, само четвертое соединение не несет флуорофор и R7a представляет собой один элемент первой пары связывания. В таких вариантах осуществления, стадия (5) включает добавление девятого средства, позволяющего R6a (если присутствует) в соединении формулы (IV) специфически взаимодействовать с и/или связываться с другим элементом пары связывания. Например, девятое средство может содержать соединение M', имеющее структуру R6b-L4-Dye2, где R6b представляет собой другой элемент первой пары связывания, L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал, имеющий ту же структуру, что и Dye, или имеющий структуру, отличную от Dye, но имеющий тот же или по существу тот же спектр испускания, что и Dye.

В некоторых образцовых вариантах осуществления, реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования, существует между R4c и R6a четвертого соединения. В некоторых предпочтительных вариантах осуществления, каждый один из R3a, R3b, R3c, R3d, R4a, R4b, R5a и R8 независимо способен выполнять биоортогональное расщепление или реакцию лигирования. В некоторых образцовых вариантах осуществления, R8a способен выполнять вторую реакцию биоортогонального лигирования в присутствии десятого средства.

Предпочтительно, в таких вариантах осуществления, на стадии (6), седьмое средство и десятое средство можно добавлять для того, чтобы позволять R5a (если присутствует) в соединении формулы (III) осуществлять первую реакцию биоортогонального лигирования и позволять R8 (если присутствует) в соединении формулы (IV) осуществлять вторую реакцию биоортогонального лигирования. Например, седьмое средство может содержать соединение M, несущее флуорофор, такой же (или имеющий другую структуру, но имеющий тот же или по существу тот же спектр испускания), что и второе соединение и четвертое соединение, и соединение M способно выполнять первую реакцию биоортогонального лигирования с R5a, и тем самым флуорофор в соединении M вводят в соединение формулы (III). Кроме того, десятое средство позволяет R8 в соединении формулы (IV) осуществлять вторую реакцию биоортогонального лигирования, и тем самым гасят флуоресцентный сигнал в соединении формулы (IV). В таких вариантах осуществления, также особенно предпочтительно, что седьмое средство не вступает в реакцию с первым соединением и вторым соединением на стадии (6), и, кроме того, предпочтительно десятое средство не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), седьмое средство и десятое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где седьмое средство содержит соединение M, которое несет флуорофор, тот же (или имеющий другую структуру, но тот же или по существу тот же спектр испускания) что и второе соединение и четвертое соединение, и соединение M способно выполнять первую реакцию биоортогонального лигирования с R5a, тем самым флуорофор в соединении M вводят в третье соединение; десятое средство содержит соединение M'', несущее гаситель, и соединение M'', способно выполнять вторую реакцию биоортогонального лигирования с R8, тем самым гаситель в соединении M'' вводят в четвертое соединение; затем дуплекс инкубируют с седьмым средством и десятым средством в условиях, позволяющих соединению M'' осуществлять первую реакцию биоортогонального лигирования с R5a и позволяющих M'' осуществлять вторую реакцию биоортогонального лигирования с R8.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c и R3d независимо выбран из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5 членного циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой . В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы, и их выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5-членного циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой . В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы и все представляют собой -CH2N3.

В некоторых предпочтительных вариантах осуществления, каждый R4a, R4b и R4c независимо выбирают из группы, состоящей из: , -O-C3-8 циклоалкенилен. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой . В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой одни и те же реакционноспособные группы, и их выбирают из группы, состоящей из: и -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой . В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, оба R4a, R4b и R4c представляют собой .

В некоторых предпочтительных вариантах осуществления, каждое первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство независимо содержит вещество, выбранное из группы, состоящей из:

комплекса палладия (например, комплекс палладия с четырьмя трифенилфосфин 3,3',3''-трисульфоновыми кислотами );

комплекса рутения (например, комплекс рутения с хинолинкарбоксилатом (или его производным), аллилом или циклопентадиеном);

фосфида (например, карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3); и

соединения Q, имеющего структурную формулу , где каждый Z1 и Z2 независимо выбирают из модифицированного или немодифицированного алкила (например, C1-C6 алкила, такого как C1 алкильная, C2 алкильная, C3 алкильная, C4 алкильная, C5 алкильная или C6 алкильная группа) и модифицированного или немодифицированного арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил или пиридил).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2. В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство содержат комплекс палладия или комплекс рутения. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3. В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства, и они содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой . В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третьи средства, четвертое средство, пятое средство, шестое средство и седьмое средство содержат соединение Q как определено выше. Кроме того, предпочтительно, в соединении Q, Z1 представляет собой метильную группу; и Z2 представляет собой модифицированную или немодифицированную пиридильную группу. Более предпочтительно, соединение Q представляет собой , где W представляет собой водород или модифицирующую группу. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства и содержат соединение Q как определено выше.

В некоторых предпочтительных вариантах осуществления, каждая линкерная группа L1, L2 и L3 в первом соединении, втором соединении, третьем соединении и четвертом соединении, L4 в R6b-L4-Dye2 и линкерная группа L' в R6b-L'-Que является независимой и конкретно не ограничена. Специалист в данной области может выбирать подходящие линкерные группы L1, L2, L3, L4 и L' в соответствии с основаниями (Base1, Base2, Base3 и Base4), реакционноспособными группам (R4a, R4b, R4c и R5a), используемыми в соединениях, и элементами (R6a и R6b) пары связывания.

В некоторых образцовых вариантах осуществления каждую линкерную группу L1, L2, L3, L4 и L' независимо выбирают из группы, состоящей из:

где каждый m1, m2, m3, m4, n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых образцовых вариантах осуществления, каждую L1 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: , где каждый m1, m2, m3 и m4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L1 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из:

где каждый n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e, и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: , где каждый n1, n2, n3, n4, p1, p2, p3 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, R5a выбирают из группы, состоящей из:

.

В некоторых предпочтительных вариантах осуществления, восьмое средство содержит соединение M, выбранное из группы, состоящей из:

соединения M1, которое имеет структурную формулу , где Y выбирают из алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенильная группа), Dye представляет собой флуорофор, и флуорофор представляет собой то же, что и флуорофор во втором соединении и четвертом соединении (или флуорофор имеет другую структуру, но тот же или по существу тот же спектр испускания);

соединения M2, которое имеет структурную формулу , где Dye представляет собой флуорофор, и флуорофор представляет собой то же, что и флуорофор во втором соединении и четвертом соединении (или флуорофор имеет другую структуру, но тот же или по существу тот же спектр испускания);

соединения M3, которое имеет структурную формулу , где Z3 независимо выбирают из алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенильная группа), и Dye представляет собой флуорофор. где флуорофор представляет собой то же, что и флуорофор во втором соединении и четвертом соединении (или флуорофор имеет другую структуру, но те же или по существу те же спектры испускания).

В одном из вариантов осуществления настоящего изобретения, линкерная группа L0 конкретно не ограничена. Специалист в данной области может выбирать подходящую линкерную группу L0 в соответствии с фактическим нуждами. Например, в некоторых предпочтительных вариантах осуществления, L0 может представлять собой , где каждый q1, q2, q3, q4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, восьмое средство содержит соединение M1, где Y представляет собой C1-C6 алкил, такой как метил.

В некоторых предпочтительных вариантах осуществления, L0 в соединении M1 представляет собой . В некоторых предпочтительных вариантах осуществления, Dye в соединении M1 представляет собой AF532. В некоторых предпочтительных вариантах осуществления, соединение M1 имеет следующую структуру:

В некоторых предпочтительных вариантах осуществления, в дополнение к соединению M, восьмое средство дополнительно содержит комплекс рутения. В некоторых предпочтительных вариантах осуществления, восьмое средство содержит соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R5a представляет собой . В этом случае, предпочтительно, восьмое средство содержит соединение M1.

В некоторых предпочтительных вариантах осуществления, R5a представляет собой . В этом случае, предпочтительно, восьмое средство содержит соединение M2. Более предпочтительно, каждое восьмое средство содержит соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R5a представляет собой . В этом случае, предпочтительно, восьмое средство содержит соединение M3.

В некоторых предпочтительных вариантах осуществления, R6a и R6b представляют собой два элемента первой пары связывания. В некоторых предпочтительных вариантах осуществления, R6a и R6c представляют собой два элемента второй пары связывания. В некоторых предпочтительных вариантах осуществления, каждую первую пару связывания и вторую пару связывания независимо выбирают из группы, состоящей из: антиген (например, низкомолекулярный антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-растительный лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину и бромгидроксидезоксигуанозин 5-положения и его антитело.

В некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину. В некоторых предпочтительных вариантах осуществления, два элемента второй пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину. В некоторых предпочтительных вариантах осуществления, R6a представляет собой биотин или дезтиобиотин и R6b представляет собой авидин (например, стрептавидин). В некоторых предпочтительных вариантах осуществления, R6a представляет собой дигоксин и R6b представляет собой антитело к дигоксину.

Особенно предпочтительно, что R5a и средство, несущее флуорофор, не взаимодействуют с двумя элементами (R6a и R6c) второй пары связывания. Кроме того, особенно предпочтительно, что R5a и средство, несущее флуорофор, не влияют на специфическое взаимодействие между R6a и R6c, и R6a и R6c не влияют на реакцию биоортогонального лигирования между R5a и средством, несущим флуорофор.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; и R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат комплекс палладия или комплекс рутения; R5a представляет собой ; восьмое средство содержит соединение M1; R6a представляет собой биотин; и R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одно и то же средство и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат фосфонид, такой как карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой ; восьмое средство содержит соединение M1; и R6a представляет собой биотин; R6b представляет собой авидин (такой как стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат фосфин, такой как карбоксифосфин или гидроксифосфин, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат фосфонид, такой как карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой ; восьмое средство содержит соединение M2 и комплекс рутения; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат фосфин, такой как карбоксифосфин или гидроксифосфин, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; и R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат комплекс палладия или комплекс рутения; R5a представляет собой ; восьмое средство содержит соединение M3; R6a представляет собой биотин; и R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой , R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат соединение Q (например, соединение Q как определено выше); R5a представляет собой ; восьмое средство содержит соединение M2 и комплекс рутения; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой , R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат соединение Q (например, соединение Q как определено выше); R5a представляет собой ; восьмое средство содержит соединение M3; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

Дополнительно, как описано выше, способ по настоящему изобретению может включать стадию промывания при необходимости. Стадию промывания можно добавлять на любом желаемом этапе, и необязательно стадию промывания можно осуществлять один или несколько раз.

Например, на стадии (5), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления флуорофорнесущего соединения (например, соединения формулы (II) или соединения формулы (IV)), которое является свободным (т. е. не встроенным в нить нуклеиновой кислоты), тем самым минимизируя неспецифический флуоресцентный сигнал насколько возможно.

Аналогичным образом, на стадии (7), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления несущего флуоресценцию средства, используемого на стадии (6), тем самым минимизируя неспецифический флуоресцентный сигнал насколько возможно.

Аналогичным образом, на стадии (9), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна для достаточного удаления средств, используемых на стадии (8), и получаемых продуктов (которые могут нести флуоресценцию), тем самым минимизируя неспецифический флуоресцентный сигнал и избегая нежелательного эффекта, оказываемого на последующую реакцию полимеризации насколько возможно.

Стадию промывания можно осуществлять с использованием различных подходящих промывающих растворов. Примеры таких промывающих растворов включают, но не ограничиваясь этим, фосфатный буфер, цитратный буфер, буфер Tris-HCl, ацетатный буфер, карбонатный буфер и т. п. Специалисты в данной области способны выбирать подходящий промывающий раствор (включая подходящий ингредиент, концентрацию, ионную силу, значение pH и т. д.) в соответствии с фактическими потребностями.

Образцовый вариант осуществления 4

В некоторых образцовых вариантах осуществления, способностью четырех соединений испускать флуоресцентный сигнал управляют (например, поддерживают или изменяют) на стадии (6) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления, и пары связывания (содержащей два элементы, которые могут взаимодействовать друг с другом через специфическое нековалентное действие); и предпочтительно, удаления защитной группы и флуоресцентного сигнала можно достичь на стадии (8) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления. Например, в некоторых образцовых вариантах осуществления, первое, второе, третье и четвертое соединения могут иметь структуры формул (I), (II), (III) и (IV), соответственно:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

каждый R3a, R3b, R3c, R3d, R4a, R4b и R6 независимо представляет собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой флуорофор (Dye1), способный испускать флуоресцентный сигнал; реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования, и/или один элемент второй пары связывания;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания; необязательно, реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования, присутствует между R4c и R6a.

В таком образцовом варианте осуществления, само четвертое соединение может нести флуорофор, способный испускать тот же флуоресцентный сигнал, что и второе соединение, или может не нести флуорофор, но специфически взаимодействовать со/связываться со средством (например, другим элементом второй пары связывания или соединением, способным выполнять первую реакцию биоортогонального лигирования с R6a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения) на стадии (5), чтобы вводить флуорофор в четвертое соединение, и оно способно испускать тот же флуоресцентный сигнал, что и второе соединение. Кроме того, третье соединение можно делать способным нести флуорофор посредством специфического взаимодействия/связывания между R5a и другим элементом (это представлено как «R5b-L-Dye2» в настоящем описании, где R5b представляет собой другой элемент первой пары связывания, L представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал, он предпочтительно представляет собой флуоресцентный сигнал, который является таким же, как у второго соединения, или флуоресцентный сигнал, который имеет тот же или по существу тот же спектр испускания, что и у второго соединения) первой пары связывания, несущим флуорофор. Кроме того, (i) подвергая R4c в четвертом соединении реакции биоортогонального расщепления для того, чтобы удалять флуорофор в четвертом соединении, или (ii) позволяя R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гасят флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении. В таких образцовых вариантах осуществления, особенно предпочтительно, что два элемента (R5a и R5b) первой пары связывания не взаимодействуют с R4c. Кроме того, особенно предпочтительно, что R5a и R5b не влияют на реакцию биоортогонального расщепления R4c, и R4c не влияют на специфическое взаимодействие между R5a и R5b. Особенно предпочтительно, два элемента (R5a и R5b) первой пары связывания не взаимодействуют с R8. Кроме того, особенно предпочтительно, что R5a и R5b на влияют на реакцию биоортогонального лигирования R8 и R8 не влияет на специфическое взаимодействие между R5a и R5b.

Таким образом, в некоторых предпочтительных вариантах осуществления, на стадии (6), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая не влияет на первое соединение и второе соединение, но обработка делает возможным специфическое взаимодействие/специфическое связывание между R5a с другим элементом (R5b-L-Dye2) пары связывания, несущим флуорофор (таким образом вводя флуорофор в третье соединение, что позволяет ему нести флуорофор и испускать флуоресцентный сигнал), и позволяет R4c осуществлять реакцию биоортогонального расщепления (таким образом удаляя флуорофор в четвертом соединении с тем, чтобы он более не испускал флуоресцентный сигнал) или позволяет R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу, (тем самым гася флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении). В таких образцовых вариантах осуществления, перед обработкой на стадии (6), первое соединение и третье соединение (если присутствуют) не флуоресцируют, а второе соединение и четвертое соединение (если присутствуют) флуоресцируют; также, после обработки на стадии (6), первое соединение (если присутствует) все еще не флуоресцирует, второе соединение (если присутствует) все еще флуоресцирует, третье соединение (если присутствует) меняется для того, чтобы флуоресцировать, и четвертое соединение (если присутствует) меняется для того, чтобы не флуоресцировать. Таким образом, тип соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, можно определять по результатам двух обнаружений флуоресцентного сигнала.

Кроме того, в таких образцовых вариантах осуществления, защитную группю в 3'-положении рибозы или дезоксирибозы в соединении, встроенном в 3'-конец растущей нити нуклеиновой кислоты, и флуорофор (если присутствует) на дуплексе или растущей нити нуклеиновой кислоты, можно удалять, подвергая R3a, R3b, R3c, R3d, R4a, R4b реакции биоортогонального расщепления. Следовательно, в некоторых предпочтительных вариантах осуществления, дуплекс или растущую нить нуклеиновой кислоты подвергают обработке на стадии (8), и такая обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b осуществлять реакцию биоортогонального расщепления. В таких образцовых вариантах осуществления, после обработки на стадии (8), растущая нить нуклеиновой кислоты не имеет какой-либо флуорофор, и ее 3'-концевой нуклеотид имеет свободный гидроксил в 3'-положении рибозы или дезоксирибозы, и три гидроксила можно использовать для следующего раунда полимеризации.

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению включает следующие стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, прикрепленной к основе, или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймера для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений, имеющих структуры формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

каждый R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 каждый независимо выбирают из -H и -OH;

каждый R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляет собой реакционноспособные группы, способные выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой флуорофор (Dye1), способный испускать флуоресцентный сигнал, реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования, и/или один элемент второй пары связывания;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и Dye и Dye1 имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания; необязательно, реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования, присутствует между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, и праймер служит в качестве начальной растущей нити нуклеиновой кислоты, и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5)(i) если четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, и R6a представляет собой Dye1, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал; или

(ii) если четвертое соединение не испускает флуоресцентный сигнал и R6a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования, или представляет собой один элемент второй пары связывания, проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, и позволяет R6a в четвертом соединении специфически взаимодействовать с/связываться с или выполнять первую реакцию биоортогонального лигирования со средством (например, другим элементом второй пары связывания или соединением, которое способно выполнять первую реакцию биоортогонального лигирования с R6a), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и флуорофор второго соединения, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

где другой элемент второй пары связывания, несущий флуорофор, имеет структуру: R6b-L'-Dye1; где R6b представляет собой другой элемент второй пары связывания, L' независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же или по существу тот же спектр испускания, что и Dye; или

соединение, способное выполнять первую реакцию биоортогонального лигирования с R6a и несущее флуорофор, имеет следующую структуру: R6b-L'-Dye1; где R6b представляет собой группу, способную выполнять вторую реакцию биоортогонального лигирования с R6a, L' независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания, что и Dye;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает эффекта на первое соединение и второе соединение, но позволяет R5a в третьем соединении специфически связываться с другим элементом первой пары связывания, несущим флуорофор, тем самым вводя флуорофор в третье соединение для того, чтобы заставлять третье соединение испускать флуоресцентный сигнал; и, обработка (i) позволяет R4c в четвертом соединении осуществлять реакцию биоортогонального расщепления для того, чтобы удалять флуорофор в четвертом соединении, или (ii) позволяет R8 в четвертом соединении осуществлять вторую реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 в четвертом соединении; где

другой элемент первой пары связывания, несущий флуорофор, имеет следующую структуру: R5b-L'-Dye2; где R5b представляет собой другой элемент первой пары связывания, L независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал, и он является таким же, как флуорофор во втором соединении, или он имеет тот же или по существу тот же спектр испускания; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b осуществлять реакцию биоортогонального расщепления, тем самым позволяя соединению, встроенному на 3'-конце растущей нити нуклеиновой кислоты, иметь свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) в свободную гидроксильную группу и удаляя флуорофор на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a или R4b), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7);

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадию:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, на стадии (4), если соединение формулы (I) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то, поскольку само соединение формулы (I) не несет флуорофор и оно не вступает в реакцию на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих из стадий (5)-(7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (I).

На стадии (4), если соединение формулы (II) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то, поскольку само соединение формулы (II) несет флуорофор и оно не выполняет какую-либо реакцию на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (II).

На стадии (4), если соединение формулы (III) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то, (i) поскольку соединение формулы (III) не несет флуорофор, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) поскольку соединение формулы (III) специфически связывается с другим элементом (R5b-L-Dye2) пары связывания, несущим флуорофор, вводя флуорофор в растущую нить нуклеиновой кислоты, флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5) и флуоресцентный сигнал обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (III).

На стадии (4), если соединение формулы (IV) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то (i) поскольку само соединение формулы (IV) несет флуорофор или его обрабатывают на стадии (5), чтобы оно несло флуорофор, флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку соединение формулы (IV) выполняет реакцию биоортогонального расщепления или вторую реакцию биоортогонального лигирования на стадии (6) для утраты флуорофора или флуоресцентный сигнал гасят, флуоресцентный сигнал не будут обнаруживать на стадии (7). Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и флуоресцентный сигнал не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (IV).

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, после стадии (7), определение типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты на стадии (4) в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения на стадиях (5) и (7), дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (I);

когда оба результата обнаружения на стадиях (5) и (7), дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (II);

когда результат обнаружения на стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения на стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (III); и,

когда результат обнаружения на стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения на стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (IV);

в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, после стадии (7), на основе принципа комплементарного спаривания оснований, в соответствии с типом соединения, встроенным в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), определяют тип основания в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) не выполняют химическую реакцию друг с другом в процессе реакции полимеризации нуклеотидов.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания, и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание T или U и Base4 представляет собой основание C. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание T или U и Base4 представляет собой основание C.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания, и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание A и Base4 представляет собой основание G. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание A и Base4 представляет собой основание G.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R1. В некоторых предпочтительных вариантах осуществления, каждый R1 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, каждый R1 независимо представляет собой монофосфатную группу (-PO3H2). В некоторых предпочтительных вариантах осуществления, каждый R1 независимо представляет собой дифосфатную группу (-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, каждый R1 независимо представляет собой трифосфатную группу (-PO3H-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, каждый R1 независимо представляет собой a тетрафосфатную группу (-PO3H-PO3H-PO3H-PO3H2).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R2. В некоторых предпочтительных вариантах осуществления, R2 каждый независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R2 каждый независимо представляет собой -OH.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c, R3d, R4a, R4b независимо способен выполнять реакцию биоортогонального расщепления. Как используют в настоящем описании, выражение «каждый независимо способен выполнять реакцию биоортогонального расщепления» обозначает, что реакционноспособные группы, средства или молекулы и т. д. способны выполнять реакцию биоортогонального расщепления, соответственно, и они не взаимодействуют друг с другом или не влияют друг на друга. Например, выражение «каждый независимо R3a и R3b способен выполнять реакцию биоортогонального расщепления» обозначает, что оба R3a и R3b способны выполнять реакцию биоортогонального расщепления, и R3a не влияет на реакцию биоортогонального расщепления R3b, R3b не влияет на протекание реакции биоортогонального расщепления R3a.

В некоторых образцовых вариантах осуществления, R3a представляет собой первую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии первого средства; R3b представляет собой вторую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии второго средства; R3c представляет собой третью реакционноспособную группую, способную выполнять реакцию биоортогонального расщепления в присутствии третьего средства; R3d представляет собой четвертую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии четвертого средства; R4a представляет собой пятую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии пятого средства; R4b представляет собой шестую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии шестого средства; и R4c представляет собой седьмую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии седьмого средства.

В некоторых образцовых вариантах осуществления, особенно предпочтительно, что два элемента первой пары связывания (R5a и R5b) не взаимодействуют с R4c. Кроме того, особенно предпочтительно, что R5a и R5b на влияют на реакцию биоортогонального расщепления R4c, и что R4c не влияет на специфическое взаимодействие между R5a и R5b. Предпочтительно, в таких вариантах осуществления, R5b-L-Dye2 и седьмое средство добавляют на стадии (6), позволяя R5a (если присутствует) в соединении формулы (III) специфически связываться с R5b в R5b-L-Dye2 и позволяя R4c (если присутствует) в соединении формулы (IV) осуществлять реакцию биоортогонального расщепления, тем самым, посредством специфического взаимодействия между двумя элементами (R5a и R5b) пары связывания, флуорофор Dye2, связанный с R5b, вводят в соединение формулы (III) для того, чтобы позволять соединению формулы (III) испускать флуоресцентный сигнал. Одновременно, седьмое средство способно позволять R4c осуществлять реакцию биоортогонального расщепления в соединении формулы (IV), тем самым удаляя R6 в соединении формулы (IV) и флуорофор, связанный с ним. В таких вариантах осуществления, также особенно предпочтительно, что на стадии (6) R5b-L-Dye2 не вступает в реакцию с первым соединением и вторым соединением, и кроме того предпочтительно, седьмое средство не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), R5b-L-Dye2 и седьмое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где R5b представляет собой другой элемент первой пары связывания, L представляет собой линкерную группу или отсутствует; Dye представляет флуорофор, способный испускать флуоресцентный сигнал; затем, в условиях, которые позволяют R5a специфически связываться с R5b и позволяют R4c осуществлять реакцию биоортогонального расщепления, дуплекс инкубируют с R5b-L-Dye2 и седьмым средством.

В некоторых образцовых вариантах осуществления, реакционноспособная группа R8, способная выполнять вторую реакцию биоортогонального лигирования, присутствует между R5b и R7a в четвертом соединении. В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c, R3d, R4a, R4b, R5a и R8 независимо способен выполнять биоортогональное расщепление или реакцию лигирования. В некоторых предпочтительных вариантах осуществления, R8a способен выполнять третью реакцию биоортогонального лигирования в присутствии восьмого средства.

В таких вариантах осуществления, особенно предпочтительно, что два элемента (R5a и R5b) первой пары связывания не взаимодействуют с R8. Кроме того, особенно предпочтительно, что R5a и R5b не влияет на реакцию биоортогонального лигирования R8 и R8 не влияет на специфическое взаимодействие между R5a и R5b. Предпочтительно, в таких вариантах осуществления, на стадии (6), R5b-L-Dye2 и восьмое средство можно добавлять так, что R5a (если присутствует) в соединении формулы (III) специфически связывается с R5b в R5b-L-Dye2 так, что R8 (если присутствует) в соединении формулы (IV) выполняет реакцию биоортогонального лигирования. Таким образом, посредством специфического взаимодействия между двумя элементами пары связывания (R5a и R5b), флуорофор Dye2, связанный с R5b, вводят в соединение формулы (III) так, что соединение формулы (III) испускает флуоресцентный сигнал. Одновременно, восьмое средство способно позволять R4c в соединении формулы (IV) осуществлять реакцию биоортогонального лигирования, тем самым флуорофор гасят в соединении формулы (IV). В таких вариантах осуществления, также особенно предпочтительно, что, на стадии (6), R5b-L-Dye2 не вступает в реакцию с первым соединением и вторым соединением, и кроме того предпочтительно, восьмое средство не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), R5b-L-Dye2 и восьмое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, где R5b представляет собой другой элемент первой пары связывания, L представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, способный испускать флуоресцентный сигнал; затем, в условиях, которые позволяют R5a специфически связываться с R5b и позволяют R8 осуществлять реакцию биоортогонального лигирования, дуплекс инкубируют с R5b-L-Dye2 и восьмым средством.

Кроме того, предпочтительно в таких вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство можно добавлять так, что каждый R3a, R3b, R3c, R3d, R4a, R4b (если присутствуют) выполняет реакцию биоортогонального расщепления. Таким образом, R3a, R3b, R3c, R3d (если присутствуют) будут удалены из 3'-положения рибозы или дезоксирибозы (другими словами, -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) будут превращены в свободный гидроксил), и R4a и флуорофор, связанный с ним (если присутствует), и R4b и флуорофор, связанный с ним (если присутствует), также будут удалены. Таким образом, после стадии (8), растущая нить нуклеиновой кислоты не несет флуорофор и будет иметь свободную гидроксильную группу на 3'-конце, которую можно использовать для следующего раунда полимеризации. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство добавляют для того, чтобы формировать реакционную систему, содержащую фазу раствора и твердую фазу, и дуплекс и первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство инкубируют в условиях, которые позволяют R3a, R3b, R3c, R3d, R4a и R4b осуществлять реакцию биоортогонального расщепления.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c и R3d способен выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одни и те же средства.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одни и те же средства. Другими словами, на стадии (8), каждый одинаковый R3a, R3b, R3c и R3d (если присутствует) будет выполнять реакцию биоортогонального расщепления и отщепляться от растущей нити нуклеиновой кислоты в присутствии одного и того же средства (т. е. первого средства).

В некоторых предпочтительных вариантах осуществления, каждый R4a и R4b способен выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), пятое средство и шестое средство представляют собой одни и те же средства.

В некоторых предпочтительных вариантах осуществления, R4a и R4b представляют собой одни и те же реакционноспособные группы. В этом случае, предпочтительно, на стадии (8), пятое средство и шестое средство представляют собой одни и те же средства. Другими словами, на стадии (8), в присутствии одного и того же средства (т. е. пятого средства), каждый одинаковый R4a и R4b (если присутствует) будет выполнять реакцию биоортогонального расщепления и отщепляться от растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c, R3d, R4a и R4b способен выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одни и те же средства. Другими словами, на стадии (8), необходимо только добавлять то же средство (т. е. первое средство), и в присутствии одного и того же средства (т. е. первого средства), каждый R3a, R3b, R3c, R3d, R4a и R4b (если присутствует) будет выполнять реакцию биоортогонального расщепления и отщепляться от растущей нити нуклеиновой кислоты.

В некоторых образцовых вариантах осуществления, R6a представляет собой флуорофор Dye1, способный испускать флуоресцентный сигнал, Dye1 имеет ту же структуру, что и Dye, или является структурно отличным, но имеет тот же спектр испускания, с тем, чтобы само четвертое соединение было способно испускать флуоресцентный сигнал, как второе соединение.

В некоторых образцовых вариантах осуществления, само четвертое соединение не несет флуорофор и R6a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования. В таких вариантах осуществления, стадия (5) включает добавление девятого средства так, что R6a (если присутствует) в соединении формулы (IV) выполняет первую реакцию биоортогонального лигирования. Например, девятое средство может содержать соединение M', имеющее структуру R6b-L'-Dye1, где R6b представляет собой группу, способную выполнять первую реакцию биоортогонального лигирования с R6a, и L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же спектр испускания.

В некоторых образцовых вариантах осуществления, четвертое соединение не несет флуорофор и R6a представляет собой один элемент второй пары связывания. В таких вариантах осуществления, стадия (5) включает добавление девятого средства так, что R6a (если присутствует) в соединении формулы (IV) специфически взаимодействует с и/или связывается с другим элементом второй пары связывания. Например, девятое средство может содержать соединение M'', имеющее структуру R6b-L'-Dye1, где R6b представляет собой другой элемент второй пары связывания, L независимо представляет собой линкерную группу или отсутствует; Dye1 представляет флуорофор, который способен испускать флуоресцентный сигнал, и имеет ту же структуру, что и Dye, или другую структуру, но тот же спектр испускания.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c и R3d независимо выбран из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5-членного циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой . В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы, и их выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5-членного циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой . В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы и все представляют собой -CH2N3.

В некоторых предпочтительных вариантах осуществления, каждый R4a и R4b независимо выбирают из группы, состоящей из: , -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой . В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, R4a и R4b представляют собой одни и те же реакционноспособные группы, и их выбирают из группы, состоящей из: и -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» выбирают из группы, состоящей из -O-C3 циклоалкенилена, -O-C4 циклоалкенилена, -O-C5 циклоалкенилена, -O-C6 циклоалкенилена, -O-C7 циклоалкенилена и -O-C8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой . В некоторых предпочтительных вариантах осуществления, указанный «-O-C3-8 циклоалкенилен» представляет собой .

В некоторых предпочтительных вариантах осуществления, оба R4a и R4b представляют собой .

В некоторых предпочтительных вариантах осуществления, каждое первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство независимо содержит вещество, выбранное из группы, состоящей из:

комплекса палладия (например, комплекс палладия с четырьмя трифенилфосфин 3,3',3''-трисульфоновыми кислотами);

комплекса рутения (например, комплекс рутения с хинолинкарбоксилатом (или его производным), аллилом или циклопентадиеном);

фосфида (например, карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3); и

соединения Q, имещего структурную формулу , где каждый Z1 и Z2 независимо выбирают из модифицированной или немодифицированной алкильной группы (например, C1-C6 алкильной группы, такой как C1 алкильная группа, C2 алкильная группа, C3 алкильная группа, C4 алкильная группа, C5 алкильная группа или C6 алкильная группа) и модифицированного или немодифицированного арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил или пиридил).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2. В этом случае, предпочтительно, R4a и R4b представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат комплекс палладия или комплекс рутения. Предпочтительно, первое средство, второе средство, третье %средство, четвертое средство, пятое средство и шестое средство представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3. В этом случае, предпочтительно, R4a и R4b представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одни и те же средства, и они содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой . В этом случае, предпочтительно, R4a и R4b представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третьи средства, четвертое средство, пятое средство и шестое средство содержат соединение Q как определено выше. Кроме того, предпочтительно, в соединении Q, Z1 представляет собой метильную группу; и Z2 представляет собой модифицированную или немодифицированную пиридильную группу. Более предпочтительно, соединение Q представляет собой , где W представляет собой водород или модифицирующую группу. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство и шестое средство представляют собой одни и те же средства и содержат соединение Q как определено выше.

В некоторых предпочтительных вариантах осуществления, каждая линкерная группа L1 и L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении, линкерная группа L в R5b-L-Dye и линкерная группа L' в R6b-L'-Dye1 является независимой и конкретно не ограничена. Специалист в данной области может выбирать подходящие линкерные группы L1, L2, L и L' в соответствии с основаниями (Base1, Base2, Base3 и Base4), реакционноспособными группами (R4a, R4b и R6), используемыми в соединениях, и элементами (R5a и R5b) пары связывания.

В некоторых образцовых вариантах осуществления, каждую линкерную группу L1, L2, L и L' независимо выбирают из группы, состоящей из:

где каждый m1, m2, m3, m4, n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых образцовых вариантах осуществления, каждую L1 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: , где каждый m1, m2, m3 и m4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L1 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из:

где каждый n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e, и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: , где каждый n1, n2, n3, n4, p1, p2, p3 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из:

В некоторых предпочтительных вариантах осуществления, R5a и R5b представляют собой два элемента первой пары связывания. В некоторых предпочтительных вариантах осуществления, R6a и R6b представляют собой два элемента второй пары связывания. В некоторых предпочтительных вариантах осуществления, пару связывания выбирают из группы, состоящей из: антиген (например, низкомолекулярный антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-растительный лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину и бромдезоксигуанозин 5-положения и его антитело.

В некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину. В некоторых предпочтительных вариантах осуществления, два элемента второй пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину. В некоторых предпочтительных вариантах осуществления, R5a представляет собой дигоксин или дезтиобиотин, и R5b представляет собой авидин (например, стрептавидин). В некоторых предпочтительных вариантах осуществления, R5a представляет собой дигоксин и R5b представляет собой антитело к дигоксину. В некоторых предпочтительных вариантах осуществления, R4c выбирают из группы, состоящей из:

В некоторых предпочтительных вариантах осуществления, седьмое средство содержит соединение M, выбранное из группы, состоящей из:

соединения M1, которое имеет структурную формулу , где Y выбирают из алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, например, фенильная группа), L0 отсутствует или представляет собой линкерную группу, Dye представляет собой флуорофор, и флуорофор представляет собой то же, что и флуорофор во втором соединении и четвертом соединении (или флуорофор имеет другую структуру, но тот же или по существу тот же спектр испускания, что и у второго соединения и четвертого соединения);

соединения M2, которое имеет структурную формулу , где Dye представляет собой флуорофор, и флуорофор представляет собой то же, что и флуорофор во втором соединении и четвертом соединении (или отличается по структуре, но тот же или по существу тот же спектр испускания);

соединения M3, которое имеет структурную формулу , где Z3 независимо выбирают из алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенильная группа), и Dye представляет собой флуорофор. Флуорофор представляет собой то же, что и флуорофор во втором соединении и четвертом соединении (или структуры различны, но спектры испускания представляют собой одно и то же или по существу одно и то же).

В одном из вариантов осуществления настоящего изобретения, линкерная группа L0 конкретно не ограничена. Специалист в данной области может выбирать подходящую линкерную группу L0 в соответствии с фактическим нуждами. Например, в некоторых предпочтительных вариантах осуществления, L0 может представлять собой , где каждый q1, q2, q3, q4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, седьмое средство содержит соединение M1, где Y представляет собой C1-C6 алкил, такой как метил.

В некоторых предпочтительных вариантах осуществления, L0 в соединении M1 представляет собой . В некоторых предпочтительных вариантах осуществления, Dye в соединении M1 представляет собой AF532. В некоторых предпочтительных вариантах осуществления, соединение M1 имеет следующую структуру:

.

В некоторых предпочтительных вариантах осуществления, в дополнение к соединению M, седьмое средство дополнительно содержит комплекс рутения. В некоторых предпочтительных вариантах осуществления, седьмое средство содержит соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R4c представляет собой . В этом случае, предпочтительно, седьмое средство содержит соединение M1.

В некоторых предпочтительных вариантах осуществления, R4c представляет собой . В этом случае, предпочтительно, седьмое средство содержит соединение M2. Более предпочтительно, каждое седьмое средство содержит соединение M2 и комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R4c представляет собой . В этом случае, предпочтительно, седьмое средство содержит соединение M3.

Особенно предпочтительно, два элемента пары связывания (R5a и R5b) не взаимодействуют с R4c. Кроме того, особенно предпочтительно, что R5a и R5b не влияют на реакцию биоортогонального расщепления R4c и R4c не влияет на специфическое взаимодействие между R5a и R5b. В некоторых образцовых вариантах осуществления, четвертое соединение содержит реакционноспособную группу R8, способную выполнять вторую реакцию биоортогонального лигирования. В некоторых предпочтительных вариантах осуществления, R8 выбирают из групп, состоящих из: .

В некоторых образцовых вариантах осуществления, соединение, способное выполнять вторую реакцию биоортогонального лигирования с R8, представляет собой N, N содержит следующие группы: .

В некоторых предпочтительных вариантах осуществления, соединение N выбирают из групп, состоящих из следующих соединений:

соединение N1, имеющее структурную формулу , где Y выбирают из алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и арила (например, 6-10-членный арил, такой как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил), L0 отсутствует или представляет собой линкерную группу, Que представляет собой гаситель, способный гасить флуоресцентный сигнал на четвертом соединении;

соединение N2, имеющее структурную формулу , в котором Que представляет собой гаситель, способный гасить флуоресцентный сигнал на четвертом соединении;

соединение N3, имеющее структурную формулу , где каждый Z3 независимо выбирают из алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил), Que представляет собой гаситель, способный гасить флуоресцентный сигнал на четвертом соединении;

В одном из вариантов осуществления настоящего изобретения, линкерная группа L0 конкретно не ограничена. Специалист в данной области может выбирать подходящую линкерную группу L0 в соответствии с фактическим нуждами. Например, в некоторых предпочтительных вариантах осуществления, L0 может представлять собой , где каждый q1, q2, q3, q4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых вариантах осуществления соединение N представляет собой 1,2,4,5-тетразин BHQ2, имеющий структуру:

.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; и R4a и R4b представляют собой ; первое, второе, третье, четвертое, пятое и шестое средства содержат комплекс палладия или комплекс рутения; R5a представляет собой биотин; и R5b представляет собой авидин (например, стрептавидин); R4c представляет собой ; седьмое средство содержит соединение M1. Предпочтительно, первое, второе, третье, четвертое, пятое и шестое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a и R4b представляют собой ; первое, второе, третье, четвертое, пятое и шестое средства содержат фосфонид, такой как карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой биотин; R5b представляет собой авидин (такой как стрептавидин); R6 представляет собой ; седьмое средство содержит соединение M1. Предпочтительно, первое, второе, третье, четвертое, пятое и шестое средства представляют собой одни и те же средства и содержат фосфин, такой как карбоксифосфин или гидроксифосфин, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a и R4b представляют собой ; первое, второе, третье, четвертое, пятое и шестое средства содержат фосфонид, такой как карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6 представляет собой ; седьмое средство содержит соединение M2 и комплекс рутения. Предпочтительно, первое, второе, третье, четвертое, пятое и шестое средства представляют собой одни и те же средства и содержат фосфин, такой как карбоксифосфин или гидроксифосфин, например, P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a и R4b представляют собой ; первое, второе, третье, четвертое, пятое и шестое средства содержат комплекс палладия или комплекс рутения; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6 представляет собой ; седьмое содержит соединение M3. Предпочтительно, первое, второе, третье, четвертое, пятое и шестое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a и R4b представляют собой ; первое, второе, третье, четвертое, пятое и шестое средства содержат соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6 представляет собой ; седьмое средство содержит соединение M2 и комплекс рутения. Предпочтительно, первое, второе, третье, четвертое, пятое и шестое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a и R4b представляют собой ; первое, второе, третье, четвертое, пятое и шестое средства содержат соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6 представляет собой ; седьмое средство содержит соединение M3. Предпочтительно, первое, второе, третье, четвертое, пятое и шестое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, Dye в третьем соединении представляет собой Cy3 или AF532.

В некоторых предпочтительных вариантах осуществления, R6a в четвертом соединении представляет собой Dye1. В некоторых предпочтительных вариантах осуществления, Dye1 представляет собой Cy3 или AF532.

В некоторых предпочтительных вариантах осуществления, Dye в третьем соединении представляет собой AF532 и R6a в четвертом соединении представляет собой AF532.

В некоторых образцовых вариантах осуществления, само четвертое соединение не несет флуорофор и R6a представляет собой реакционноспособную группу, способную выполнять вторую реакцию биоортогонального лигирования. В некоторых предпочтительных вариантах осуществления, R6a выбирают из группы, состоящей из: . В некоторых образцовых вариантах осуществления, соединение N способное выполнять вторую реакцию биоортогонального лигирования с R7a, выбирают из группы, состоящей из соединений N1, N2, N3.

В некоторых образцовых вариантах осуществления, четвертое соединение не несет флуорофор и R7a представляет собой один элемент второй пары связывания. В некоторых предпочтительных вариантах осуществления, вторую пару связывания выбирают из группы, состоящей из: антиген (например, низкомолекулярный антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-растительный лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину и бромдезоксигуанозин 5-положения и его антитело. В некоторых предпочтительных вариантах осуществления, два элемента пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дезтиобиотина и авидина (например, стрептавидина) и (c) дигоксина и антитела к дигоксину.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой AF532, R8 представляет собой . Восьмое средство содержит соединение N, и соединение N представляет собой 1,2,4,5-тетразин BHQ2.

В некоторых предпочтительных вариантах осуществления, первое соединение имеет структуру, представленную в формуле (Ic):

В некоторых предпочтительных вариантах осуществления, второе соединение имеет структуру, представленную в формуле (IIc):

В некоторых предпочтительных вариантах осуществления, третье соединение имеет структуру, представленную в формуле (IIIc):

В некоторых предпочтительных вариантах осуществления, четвертое соединение имеет структуру, представленную в формуле (IVc):

Дополнительно, как описано выше, в способе по настоящему изобретению, стадию промывания можно добавлять при необходимости. Стадию промывания можно добавлять на любрм желаемом этапе, и необязательно стадию промывания можно осуществлять один или несколько раз.

Например, на стадии (5), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна, что можно использовать для того, чтобы в достаточной мере удалять свободные соединения (т. е. не встроенные в растущую нить нуклеиновой кислоты), несущие флуорофор (например, соединения формулы (II) и соединения формулы (IV)), тем самым уменьшая неспецифические флуоресцентные сигналы насколько возможно.

Аналогичным образом, на стадии (7), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна, что можно использовать для того, чтобы в достаточной мере удалять средство, несущее флуоресценцию, которое использовали на стадии (6), тем самым снижая неспецифические флуоресцентные сигналы насколько возможно.

Аналогичным образом, на стадии (9), после удаления фазы раствора реакционной системы, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора. Такая стадия промывания может быть полезна, что можно использовать для того, чтобы в достаточной мере удалять средства, используемые на стадии (8), а также получаемые продукты (которые могут нести флуоресценцию), тем самым снижая неспецифические флуоресцентные сигналы насколько возможно и избегая нежелательного эффекта, оказываемого на последующую реакцию полимеризации.

Стадию промывания можно осуществлять с использованием различных подходящих промывающих растворов. Примеры таких промывающих растворов включают, но не ограничиваясь этим, фосфатный буфер, цитратный буфер, буфер Tris-HCl, ацетатный буфер, карбонатный буфер и т. п. Специалисты в данной области способны выбирать подходящий промывающий раствор (включая подходящие ингредиенты, концентрации, ионную силу, pH и т. д.) в соответствии с фактическими потребностями.

Образцовый вариант осуществления 5

В некоторых образцовых вариантах осуществления, способностью четырех соединений испускать флуоресцентные сигналы можно управлять (например, поддерживать или изменять) на стадии (6) с использованием пары связывания (содержащей два элемента, которые могут взаимодействовать друг с другом посредством специфического нековалентного взаимодействия); и предпочтительно, удаления защитной группы и флуоресцентного сигнала можно достичь на стадии (8) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления. Например, в некоторых образцовых вариантах осуществления, первое, второе, третье и четвертое соединения могут иметь структуры формул (I), (II), (III) и (IV), соответственно:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

каждый R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляет собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой один элемент второй пары связывания, необязательно, R6a представляет собой Dye1, или его связывают в -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру или имеют различные структуры, но имеют один и тот же или по существу один и тот же спектр испускания;

необязательно, реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования, присутствует между R4c и R6a.

В таком образцовом варианте осуществления, само четвертое соединение может нести флуорофор, способный испускать тот же флуоресцентный сигнал, что и второе соединение, или может не нести флуорофор, но специфически взаимодействует со/связывается со средством (например, другим элементом второй пары связывания, представленным как «R6b-L4-Dye2» в настоящем описании), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения) на стадии (5), тем самым флуорофор вводят в четвертое соединение, и он способен испускать тот же флуоресцентный сигнал, что и второе соединение.

Кроме того, третье соединение можно делать несущим флуорофор посредством специфического взаимодействия/связывания между R5a и другим элементом (представленным как «R5b-L5-Dye3» в настоящем описании, где R5b представляет собой другой элемент первой пары связывания, L5 представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, который способен испускать флуоресцентный сигнал, он предпочтительно представляет собой флуорофор, который является таким же, как второе соединение (или флуорофор, который имеет другую структуру, но тот же или по существу тот же спектр испускания) первой пары связывания, несущее флуорофор. Кроме того, (i) R6b можно делать специфически взаимодействующим с/связывающимся с другим элементом R6c третьей пары связывания, чтобы диссоциировать конъюгат R6b и R6a, тем самым заставляя четвертое соединение терять флуорофор, или (ii) R8 в четвертом соединении можно делать осуществляющим реакцию биоортогонального лигирования с соединением, несущим гасящую группу, чтобы гасить флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении. В таких образцовых вариантах осуществления, R6b может представлять собой один элемент двух пар связывания (R6a и R6b второй пары связывания, R6b и R6c третьей пары связывания). Особенно предпочтительно, два элемента первой пары связывания (R5a и R5b) не взаимодействуют с двумя элементами третьей пары связывания (R6b и R6c). Кроме того, особенно предпочтительно, что R5a и R5b не влияют на специфическое взаимодействие между R6b и R6c и что R6b и R6c не влияют на специфическое взаимодействие между R5a и R5b.

Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая не оказывает эффекта на первое соединение и второе соединение, но позволяет R5a специфически взаимодействовать с/связываться с другим элементом (R5b-L5-Dye3) первой пары связывания, несущим флуорофор (тем самым флуорофор вводят в третье соединение так, что оно несет флуорофор и испускает флуоресцентный сигнал), и R6b можно делать специфически взаимодействующим с/связывающимся с другим элементом (R6c) третьей пары связывания, тем самым заставляя четвертое соединение терять флуорофор, или R8 в четвертом соединении позволяют осуществлять реакцию биоортогонального лигирования с соединением, несущим гаситель, тем самым гася флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении. В таких образцовых вариантах осуществления, перед обработкой на стадии (6), первое соединение и третье соединение, если присутствует, не флуоресцируют, и второе соединение и четвертое соединение, если присутствуют, флуоресцируют; также, после обработки на стадии (6), первое соединение (если присутствует) все еще не флуоресцирует, второе соединение (если присутствует) все еще флуоресцирует, третье соединение (если присутствует) меняется для того, чтобы флуоресцировать, и четвертое соединение, если присутствует, меняется для того, чтобы не флуоресцировать. Следовательно, тип соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, можно определять по результатам двух обнаружений флуоресцентного сигнала.

Кроме того, в таких образцовых вариантах осуществления, защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном в 3'-конец растущей нити нуклеиновой кислоты, и флуорофор (если присутствует) на дуплексе или растущей нити нуклеиновой кислоты можно удалять, подвергая R3a, R3b, R3c, R3d, R4a, R4b, R4c реакции биоортогонального расщепления. Следовательно, в некоторых предпочтительных вариантах осуществления, дуплекс или растущую нить нуклеиновой кислоты подвергают обработке на стадии (8), и такая обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления. В таких образцовых вариантах осуществления, после обработки на стадии (8), растущая нить нуклеиновой кислоты не будет иметь какой-либо флуорофор, и ее 3'-концевой нуклеотид будет иметь свободный гидроксил в 3'-положении рибозы или дезоксирибозы, и свободный гидроксил можно использовать для инициации следующего раунда реакции полимеризации.

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, на основе или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймеров для инициации полимеризации нуклеотидов, полимераз для осуществления полимеризации нуклеотидов и первого, второго, третьего и четвертого соединений формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу:

Где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

каждый R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 каждый независимо выбирают из -H и -OH;

каждый R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляет собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой один элемент первой пары связывания;

R6a представляет собой один элемент второй пары связывания, необязательно, R6a представляет собой Dye1 или также его связывают в -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру или имеют различные структуры, но тот же или по существу тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, и праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5) (i) четвертое соединение не может испускать флуоресцентный сигнал, и тогда дуплекс или растущую нить нуклеиновой кислоты подвергают обработке в реакционной системе, содержащей фазу раствора и твердую фазу, обработка не оказывает эффекта на первое соединение, второе соединение и третье соединение, но позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством, несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); тогда удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного на основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

другой элемент второй пары связывания, несущий флуорофор, имеет структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент второй пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же или по существу тот же спектр испускания; между тем, R6b представляет собой один элемент третьей пары связывания;

(ii) четвертое соединение, способно испускать тот же флуоресцентный сигнал, что и второе соединение, тогда удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает влияния на первое соединение и второе соединение, но позволяет R5a в третьем соединении специфически свыязываться с другим элементом первой пары связывания, тем самым вводя флуорофор в третье соединение для того, чтобы позволять ему испускать флуоресцентный сигнал; и (i) позволять другому элементу R6b специфически взаимодействовать с/связываться с другим элементом R6c третьей пары связывания для того, чтобы диссоциировать конъюгат R6b и R6a, тем самым заставляя четвертое соединение терять флуорофор, или (ii) позволять R8 в четвертом соединении осуществлять реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2, в четвертом соединении; где

другой элемент первой пары связывания, несущий флуорофор, имеет следующую структуру: R5b-L5-Dye3; где R5b представляет собой другой элемент первой пары связывания и L5 независимо представляет собой линкерную группу или отсутствует; Dye3 обозначает флуорофор, способный испускать флуоресцентный сигнал, и имеет ту же структуру, что и флуорофор во втором соединении, или другую структуру, но тот же или по существу тот же спектр испускания;

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, которая позволяет R3a, R3b, R3c, R3d, R4a, R4b и R4c осуществлять реакцию биоортогонального расщепления так, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, имеет свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) в свободную гидроксигруппу) и удаления флуорофора на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, если, на стадии (4), соединение формулы (I) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то, поскольку соединение формулы (I) не несет флуорофор и оно не вступает в реакцию на стадии (6), флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (I).

Если, на стадии (4), соединение формулы (II) встраивают в 3'-конец растущей нити нуклеиновой кислоты, поскольку само соединение формулы (II) несет флуорофор и не выполняет какую-либо реакцию на стадии (6), флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (II).

Если, на стадии (4), соединение формулы (III) встраивают на 3'-конце растущей нити нуклеиновой кислоты, то (i) поскольку соединение формулы (III) не несет флуорофор, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) поскольку соединение формулы (III) специфически связывается с другим элементом (R5b-L-Dye3) в первой паре связывания, несущим флуорофор, вводя флуорофор в растущую нить нуклеиновой кислоты, следовательно, флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5), но обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (III).

Если, на стадии (4), соединение формулы (IV) встраивают на 3'-конце растущей нити нуклеиновой кислоты, то (i) поскольку само соединение формулы (IV) несет флуорофор или его обрабатывают на стадии (5), чтобы оно несло флуорофор, следовательно, флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку соединение формулы (IV) теряет флуорофор на стадии (6) из-за диссоциации конъюгата R6a и R6b или выполняет реакцию биоортогонального лигирования, вводя гасящую группу в растущую нить нуклеиновой кислоты, которая гасит флуоресцентный сигнал, испускаемый флуорофором, и, следовательно, флуоресцентный сигнал не обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (IV).

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает: после стадии (7), определение типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (I);

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (II);

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (III); и,

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (IV).

В некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает, что, после стадии (7), на основе принципа комплементарного спаривания оснований, тип основания в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию, определяют в соответствии с типом соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) не вступают в реакцию друг с другом в ходе реакции полимеризации нуклеотидов.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания, и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание T или U и Base4 представляет собой основание C. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание T или U и Base4 представляет собой основание C.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пиримидиновые основания и Base3 и Base4 представляют собой пуриновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание A и Base4 представляет собой основание G. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание A и Base4 представляет собой основание G.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R1. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой монофосфатную группу (-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой дифосфатную группу (-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой трифосфатную группу (-PO3H-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой тетрафосфатную группу (-PO3H-PO3H-PO3H-PO3H2).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R2. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -OH.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c, R3d, R4a, R4b, R4c независимо способен выполнять реакцию биоортогонального расщепления. Как используют в настоящем описании, выражение «каждый способен независимо выполнять реакцию биоортогонального расщепления» обозначает, что каждое из упомянутых реакционноспособных групп, средств или молекул и т. д. способны выполнять реакцию биоортогонального расщепления, при этом не взаимодействуя друг с другом или не влияя друг на друга. Например, выраженипе «каждый R3a и R3b независимо способен выполнять реакцию биоортогонального расщепления» обозначает, что оба R3a и R3b способны выполнять реакцию биоортогонального расщепления, и R3a не влияет на протекание реакции биоортогонального расщепления R3b и R3b не влияет на протекание реакции биоортогонального расщепления R3a.

В некоторых образцовых вариантах осуществления, R3a представляпт собой первую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии первого средства; R3b представляет собой вторую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии второго средства; R3c представляет собой третью реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии третьего средства; R3d представляет собой четвертую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии четвертого средства; R4a представляет собой пятую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии пятого средства; R4b представляет собой шестую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии шестого средства; R4c представляет собой седьмую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии седьмого средства;

Предпочтительно, в таких вариантах осуществления, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство можно добавлять на стадии (8), тем самым позволяя каждому R3a, R3b, R3c, R3d, R4a, R4b и R4c (если присутствуют) осуществлять реакцию биоортогонального расщепления. Таким образом, R3a, R3b, R3c, R3d (если присутствуют) будут удалены из 3'-положения рибозы или дезоксирибозы (другими словами, -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) будут превращены в свободную гидроксигруппу) и R4a и флуорофор (если присутствует), прикрепленный к нему, R4b и fl (если присутствует), прикрепленный к нему, и R4c и флуорофор (если присутствует), прикрепленный к нему, также будут удалены. Таким образом, после стадии (8), растущая нить нуклеиновой кислоты не будет нести флуорофор и имеет свободную гидроксильную группу на 3'-конце, которую можно использовать для следующего раунда полимеризации. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство добавляют для того, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу, и дуплекс инкубируют с использованием первого средства, второго средства, третьего средства, четвертого средства, пятого средства, шестого средства и седьмого средства в условиях, позволяющих каждому R3a, R3b, R3c, R3d, R4a, R4b и R4c осуществлять реакцию биоортогонального расщепления.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d способен выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одни и те же средства.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство и четвертое средство представляют собой одни и те же средства. Другими словами, на стадии (8), каждый одинаковый R3a, R3b, R3c и R3d (если присутствует) будет выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства (т. е. первого средства) и будет вырезан из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления R4a, R4b и R4c способен выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства. Предпочтительно, на стадии (8), пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства.

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой одни и те же реакционноспособные группы. В этом случае, предпочтительно, на стадии (8), пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства. Другими словами, на стадии (8), каждый одинаковый R4a, R4b и R4c (если присутствует) будет выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства (т. е. пятого средства) и будет вырезан из растущей нити нуклеиновой кислоты.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c, R3d, R4a, R4b и R4c способен выполнять реакцию биоортогонального расщепления в присутствии одного и того же средства. В этом случае, предпочтительно, на стадии (8), первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства. Другими словами, на стадии (8), необходимо только добавлять одно и то же средство (т. е. первое средство), и каждый R3a, R3b, R3c, R3d, R4a, R4b и R4c (если присутствует) будет выпонять реакцию биоортогонального расщепления в присутствии одного и того же средства (т. е. первого средства) и будет вырезан из растущей нити нуклеиновой кислоты.

В некоторых образцовых вариантах осуществления, особенно предпочтительно, что два элемента (R5a и R5b) первой пары связывания не взаимодействуют с двумя элементами (R6b и R6c) третьей пары связывания. Кроме того, особенно предпочтительно, что R5a и R5b не влияют на специфическое взаимодействие между R6b и R6c, и что R6b и R6c не влияют на специфическое взаимодействие между R5a и R5b. В таких вариантах осуществления, предпочтительно, на стадии (6), R5b-L5-Dye3 и R6c можно добавлять так, что R5a (если присутствует) в соединении формулы (III) специфически связывается с R5b в R5b-L5-Dye3, и конъюгат R6a (если присутствует) и R6b в соединении формулы (IV) диссоциирует. Таким образом, флуорофор Dye3, связанный с R5b, вводят в соединение формулы (III) через специфическое взаимодействие между двумя элементами (R5a и R5b) первой пары связывания, так что соединение формулы (III) испускает флуоресцентный сигнал. Одновременно конъюгат R6a и R6b диссоциирует через специфическое взаимодействие между двумя элементами (R6b и R6c) третьей пары связывания, так что соединение формулы (IV) теряет флуорофор и соединение формулы (IV) более не флуореацирует. В таких вариантах осуществления, также особенно предпочтительно, что, на стадии (6), R5b-L5-Dye3 не вступает в реакцию с первым соединением и вторым соединением, и кроме того предпочтительно, R6c не вступает в реакцию с первым соединением и вторым соединением. Таким образом, в некоторых предпочтительных вариантах осуществления, на стадии (6), R5b-L5-Dye3 и R6c можно добавлять для того, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу, где R5b представляет собой другой элемент первой пары связывания, L5 представляет собой линкерную группу или отсутствует; Dye3 представляет флуорофор, способный испускать флуоресцентный сигнал, и R6c представляет собой другой элемент третьей пары связывания; затем дуплекс инкубируют с R5b-L5-Dye3 и R6c-L6-Que в условиях, позволяющих R5a и R5b специфически связываться друг с другом и позволяющих R6a и R6b специфически связываться друг с другом.

В некоторых образцовых вариантах осуществления, четвертое соединение не несет флуорофор и R6a представляет собой один элемент второй пары связывания. В таких вариантах осуществления, стадия (5) включает добавление девятого средства так, что R6a (если присутствует) в соединении формулы (IV), специфически взаимодействует с и/или связывается с другим элементом второй пары связывания. Например, девятое средство может содержать другой элемент, несущий флуорофор, второй пары связывания, который имеет структуру R6b-L4-Dye2, где R6b представляет собой другой элемент второй пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или структурно отличен, но имеет тот же спектр испускания. В таких вариантах осуществления, стадия (6) включает добавление десятого средства так, что конъюгат R6a (если присутствует) и R6b в соединении формулы (IV) диссоциирует. Например, десятое средство может содержать другой элемент R6c третьей пары связывания, который способен к специфическому связыванию с R6b, чтобы заменять R6a, так что конъюгат, образуемый с помощью R6a и R6b, диссоциирует.

Предпочтительно, в таких вариантах осуществления, на стадии (6), восьмое средство и девятое средство можно добавлять так, что R5a (если присутствует) в соединении формулы (III), специфически взаимодействует с и/или связывается с другим элементом первой пары связывания и диссоциирует конъюгат образуемый с помощью R6a и R6b в соединении формулы (IV). Например, восьмое средство может содержать другой элемент первой пары связывания, другой элемент первой пары связывания несет тот же флуорофор (или структура отличается, но спектр испускания является таким же или по существу таким же), как и второе соединение и четвертое соединение, и другой элемент первой пары связывания способен к специфическому связыванию с R5a, тем самым вводя флуорофор, который он несет, в соединение формулы (III). Кроме того, девятое средство содержит другой элемент третьей пары связывания и спосбно специфически взаимодействовать с и/или специфически связываться с R6b так, что конъюгат, образуемый с помощью R6a и R6b в соединении формулы (IV), диссоциирует, и это ведет к утрате флуорофоров в соединении формулы (IV). В таких вариантах осуществления, также особенно предпочтительно, что, на стадии (6), восьмое средство не вступает в реакцию с первым соединением и вторым соединением и, кроме того, предпочтительно девятое средство не вступает в реакцию с первым соединением и вторым соединением. Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), восьмое средство и девятое средство можно добавлять для того, чтобы формировать реакционную систему, содержащую фазую раствора и твердую фазу, где восьмое средство содержит другой элемент первой пары связывания, другой элемент первой пары связывания может нести тот же флуорофор (или флуорофор, имеющий структуру, отличную от, но тот же или по существу тот же спектр испускания), что и второе соединение и четвертое соединение, и указанный другой элемент первой пары связывания способен специфически взаимодействовать с и/или связываться с R5a для того, чтобы вводить флуорофор, который он несет, в третье соединение; девятое средство содержит другой элемент третьей пары связывания, и другой элемент третьей пары связывания способен специфически взаимодействовать с и/или связываться с R6b так, что диссоциирует конъюгат, образуемый с помощью R6a и R6b в соединении формулы (IV); затем дуплекс инкубируют с седьмым средством и девятым средством в условиях, позволяющих R5a специфически взаимодействовать с и/или связываться с другим элементом первой пары связывания и позволяющих R6b специфически взаимодействовать с и/или связываться с другим элементом третьей пары связывания.

В некоторых образцовых вариантах осуществления, реакционноспособная группа R8, способная выполнять третью реакцию биоортогонального лигирования, присутствует между R5b и R7a четвертого соединения. В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c, R3d, R4a, R4b, R5a и R8 может выполнять реакцию биоортогонального расщепления или реакцию биоортогонального лигирования. В некоторых образцовых вариантах осуществления, R8a способен выполнять реакцию биоортогонального лигирования в присутствии десятого средства.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c и R3d независимо выбран из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенила, C4 циклоалкенила, C5-членного циклоалкенила, C6 циклоалкенила, C7 циклоалкенила или C8 циклоалкенила). В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы, и их выбирают из группы, состоящей из -CH2CH=CH2, -CH2N3, C3-8 циклоалкенила (например, C3 циклоалкенильной группы, C4 циклоалкенильной группы, C5-членной циклоалкенильной группы, C6 циклоалкенильной группы, C7 циклоалкенильной группы или C8 циклоалкенильной группы). В некоторых предпочтительных вариантах осуществления C3-8 циклоалкенил выбирают из группы, состоящей из C3 циклоалкенила и C8 циклоалкенила. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой. В некоторых предпочтительных вариантах осуществления, C3-8 циклоалкенильная группа представляет собой .

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой одни и те же реакционноспособные группы и все представляют собой -CH2N3.

В некоторых предпочтительных вариантах осуществления, каждый R4a, R4b и R4c независимо выбирают из группы, состоящей из: , -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкениленовое подзвено» выбирают из группы, состоящей из -O-C3 циклоалкениленового подзвена, -O-C4 циклоалкениленового подзвена, -O-C5 циклоалкениленового подзвена, -O-C6 циклоалкениленового подзвена, -O-C7 циклоалкениленового подзвена и -O-C8 циклоалкениленового подзвена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкениленовое подзвено» представляет собой . В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкениленовое подзвено» представляет собой .

В некоторых предпочтительных вариантах осуществления, R4a, R4b и R4c представляют собой одни и те же реакционноспособные группы, и их выбирают из группы, состоящей из:

, -O-C3-8 циклоалкенилена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкениленовое подзвено» выбирают из группы, состоящей из -O-C3 циклоалкениленового подзвена, -O-C4 циклоалкениленового подзвена, -O-C5 циклоалкениленового подзвена, -O-C6 циклоалкениленового подзвена, -O-C7 циклоалкениленового подзвена и -O-C8 циклоалкениленового подзвена. В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкениленовое подзвено» представляет собой . В некоторых предпочтительных вариантах осуществления, «-O-C3-8 циклоалкениленовое подзвено» представляет собой .

В некоторых предпочтительных вариантах осуществления, оба R4a, R4b и R4c представляют собой .

В некоторых предпочтительных вариантах осуществления, каждое первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство независимо содержит материалы, выбранные из группы, состоящей из:

комплекса палладия (например, комплекс палладия с четырьмя трифенилфосфин 3,3',3''-трисульфоновыми кислотами);

комплекса рутения (например, комплекс рутения с хинолинкарбоксилатом (или его производным), аллилом или циклопентадиеном);

фосфида (например, карбоксифосфин или гидроксифосфин, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3); и

соединения Q, имещего структурную формулу , где каждый Z1 и Z2 независимо выбирают из модифицированного или немодифицированного алкила (например, C1-C6 алкила, такого как C1 алкил, C2 алкил, C3 алкил, C4 алкил, C5 алкил или C6 алкил) и модифицированного или немодифицированного арила (например, 6-10-членного арила, такого как 6-членный арил, 7-членный арил, 8-членный арил, 9-членный арил или 10-членный арил, такой как фенил или пиридил).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2. В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство содержат комплекс палладия или комплекс рутения. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3. В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства, и они содержат фосфонат, такой как карбоксилфосфонат или гидроксилфосфонат, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой . В этом случае, предпочтительно, R4a, R4b и R4c представляют собой . Кроме того, предпочтительно, первое средство, второе средство, третьи средства, четвертое средство, пятое средство, шестое средство и седьмое средство содержат соединение Q как определено выше. Кроме того, предпочтительно, в соединении Q, Z1 представляет собой метильную группу; и Z2 представляет собой модифицированную или немодифицированную пиридильную группу. Более предпочтительно, соединение Q представляет собой , где W представляет собой водород или модифицирующую группу. Предпочтительно, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство представляют собой одни и те же средства и содержат соединение Q как определено выше.

В некоторых предпочтительных вариантах осуществления, каждая линкерная группа L1, L2 и L3 в первом соединении, втором соединении, третьем соединении и четвертом соединении и линкерная группа L4, L5 и L6 в R6b-L4-Dye2, R5b-L5-Dye3 и R6c-L6-Que является независимой и конкретно не ограничена. Специалист в данной области может выбирать подходящие линкерные группы L1, L2, L3, L4, L5 и L6 в соответствии с основаниями (Base1, Base2, Base3 и Base4) и реакционноспособными группами (R4a, R4b и R4c), используемыми в соединениях и элементах (R5a, R5b, R6a и R6b) первой пары связывания и второй пары связывания.

В некоторых образцовых вариантах осуществления, каждую линкерную группу L1, L2, L3, L4, L5 и L6 независимо выбирают из группы, состоящей из:

где каждый m1, m2, m3, m4, n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых образцовых вариантах осуществления, каждую L1 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: , где каждый m1, m2, m3 и m4 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L1 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из:

где каждый n1, n2, n3, n4, p1, p2, p3, a, b, c, d, e, и f независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: , где каждый n1, n2, n3, n4, p1, p2, p3 независимо выбирают из 0, 1, 2, 3, 4, 5 или 6.

В некоторых предпочтительных вариантах осуществления, каждую L2 в первом соединении, втором соединении, третьем соединении и четвертом соединении независимо выбирают из группы, состоящей из: .

В некоторых предпочтительных вариантах осуществления, R5a и R5b представляют собой два элемента первой пары связывания, R6a и R6b представляют собой два элемента второй пары связывания и R6b и R6c представляют собой два элемента третьей пары связывания. В некоторых предпочтительных вариантах осуществления, каждую первую пару связывания и вторую пару связывания независимо выбирают из группы, состоящей из: антиген (например, низкомолекулярный антиген)-антитело, гаптен-антитело, гормон-рецептор, лиганд-рецептор, нить нуклеиновой кислоты-комплементарная нить нуклеиновой кислоты, субстрат-фермент, аналог субстрата-фермент, ингибитор-фермент, сахар-растительный лектин, биотин-авидин (например, авидин и стрептавидин), дигоксин и антитело к дигоксину и бромдезоксигуанозин 5-положения и его антитело.

В некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дигоксина и антитела к дигоксину; и (c) дезтиобиотина и стрептавидина.

В некоторых предпочтительных вариантах осуществления, два элемента второй пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина); (b) дигоксина и антитела к дигоксину; (c) дезтиобиотина и стрептавидина.

В некоторых предпочтительных вариантах осуществления, два элемента третьей пары связывания выбирают из группы, состоящей из: (a) биотина и авидина (например, стрептавидина), (b) дигоксина и антитела к дигоксину; (c) дезтиобиотина и стрептавидина.

Особенно предпочтительно, что два элемента первой пары связывания (R5a и R5b) не взаимодействуют с двумя элементами третьей пары связывания (R6a и R6c). Кроме того, особенно предпочтительно, что R5a и R5b не влияют на специфическое взаимодействие между R6b и R6c и что R6b и R6c не влияют на специфическое взаимодействие между R5a и R5b. Таким образом, в некоторых предпочтительных вариантах осуществления, два элемента первой пары связывания представляют собой дигоксин и антитело к дигоксину и два элемента третьей пары связывания представляют собой стрептавидин и биотин, соответственно. В некоторых предпочтительных вариантах осуществления, два элемента второй пары связывания представляют собой дезтиобиотин и стрептавидин, соответственно.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит комплекс палладия или комплекс рутения; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой дигоксин; R6b представляет собой антитело к дигоксину. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой дигоксин; R6b представляет собой антитело к дигоксину. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3; R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат фосфид, такой как карбоксилфосфид или гидроксилфосфид, такой как P(CH2CH2COOH)3 или P(CH2CH2OH)3.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a, R4b и R4c представляют собой , первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат комплекс палладия или комплекс рутения; R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой , R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой дигоксин; R6b представляет собой антитело к дигоксину. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой биотин; R6b представляет собой авидин (например, стрептавидин). Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2CH=CH2; R4a, R4b и R4c представляют собой , первое, второе, третье, четвертое, пятое, шестое и седьмое средства содержат комплекс палладия или комплекс рутения; R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой Cy3; R6b представляет собой антитело к Cy3. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средства представляют собой одни и те же средства и содержат комплекс палладия или комплекс рутения.

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой Cy3; R6b представляет собой антитело к Cy3. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой ; R4a, R4b и R4c представляют собой ; первое, второе, третье, четвертое, пятое, шестое и седьмое средство содержит соединение Q (например, соединение Q как определено выше); R5a представляет собой биотин; R5b представляет собой авидин (например, стрептавидин); R6a представляет собой Cy3; R6b представляет собой антитело к Cy3. Предпочтительно, первое, второе, третье, четвертое, пятое, шестое и седьмое средство представляют собой одни и те же средства и содержат соединение Q (например, соединение Q как определено выше).

В некоторых предпочтительных вариантах осуществления, R3a, R3b, R3c и R3d представляют собой -CH2-N3; R4a, R4b и R4c представляют собой ; R5a представляет собой дигоксин; R5b представляет собой антитело к дигоксину; R6a представляет собой дезтиобиотин; R6b представляет собой стрептавидин авидин (например, стрептавидин); R6c представляет собой биотин.

В некоторых предпочтительных вариантах осуществления, первое соединение имеет структуру, представленную в формуле (Id):

В некоторых предпочтительных вариантах осуществления, второе соединение имеет структуру, представленную в формуле (IId):

В некоторых предпочтительных вариантах осуществления, третье соединение имеет структуру, представленную в формуле (IIId):

В некоторых предпочтительных вариантах осуществления, четвертое соединение имеет структуру, представленную в формуле (IVd):

Дополнительно, как описано выше, стадии промывания можно добавлять при необходимости в способ в соответствии с настоящим изобретением. Стадию промывания можно добавлять на любом желаемом этапе, и необязательно стадию промывания можно осуществлять один или несколько раз.

Например, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора на стадии (5) после удаления фазы раствора реакционной системы. Такая стадия промывания может быть полезна в том отношении, что ее можно использовать для того, чтобы по существу удалять свободные (т. е. не встроенные в растущие нити нуклеиновой кислоты) флуорофор-содержащие соединения (например, соединение формулы (II) или соединение формулы (IV)) для того, чтобы минимизировать неспецифические флуоресцентные сигналы.

Аналогичным образом, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора на стадии (7), после удаления фазы раствора реакционной системы, такая стадия промывания может быть полезна в том отношении, что ее можно использовать для того, чтобы в достаточной мере удалять средство, несущее флуоресценцию, которое использовали на стадии (6), чтобы минимизировать неспецифические флуоресцентные сигналы.

Аналогичным образом, одно или несколько промываний можно осуществлять для того, чтобы в достаточной мере удалять остаточную фазу раствора на стадии (9) после удаления фазы раствора реакционной системы. Такая стадия промывания может быть полезна, и ее можно использовать для того, чтобы в достаточной мере удалять средства, используемые на стадии (8), а также получаемые продукты (которые могут нести флуоресценцию), тем самым снижая неспецифические флуоресцентные сигналы и избегая нежелательного эффекта, оказываемого на последующую реакцию полимеризации насколько возможно.

Различные подходящие промывающие растворы можно использовать для стадии промывания. Примеры таких промывающих растворов включают, но не ограничиваясь этим, фосфатный буфер, цитратный буфер, буфер Tris-HCl, ацетатный буфер, карбонатный буфер и т. п. Специалисты в данной области способны выбирать подходящий промывающий раствор (включая подходящие ингредиенты, концентрацию, ионную силу, значение pH и т. д.) для стадии промывания в соответствии с фактическими потребностями.

Образцовый вариант осуществления 6

В некоторых образцовых вариантах осуществления, способностью четырех соединений испускать флуоресцентные сигналы можно управлять (например, поддерживать или изменять) на стадии (6) с использованием пары связывания (содержащей два элемента, которые могут взаимодействоать друг с другом посредством специфической нековалентной функции); и предпочтительно, удаления защитной группы и флуоресцентного сигнала можно достичь на стадии (8) с использованием реакционноспособной группы, способной выполнять реакцию биоортогонального расщепления. Например, в некоторых образцовых вариантах осуществления, первое, второе, третье и четвертое соединения могут иметь структуры формул (I), (II), (III) и (IV), соответственно:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 независимо выбирают из -H и -OH;

каждый R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляет собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

R6a представляет собой один элемент первой пары связывания, необязательно, R6a представляет собой Dye1 или его связывают в -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и оба они имеют одну и ту же структуру, или имеют различные структуры, но тот же или по существу тот же спектр испускания;

необязательно, реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования, присутствует между R4c и R6a.

В таком образцовом варианте осуществления, само четвертое соединение может нести флуорофор, способный испускать тот же флуоресцентный сигнал, что и второе соединение, или может не нести флуорофор, но специфически взаимодействует со/связывается со средством (например, другим элементом первой пары связывания, представленным как «R6b-L4-Dye2» в настоящем описании), несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения) на стадии (5), тем самым флуорофор вводят в четвертое соединение, и он способен испускать тот же флуоресцентный сигнал, что и второе соединение.

Кроме того, R5a можно делать осуществляющим реакцию биоортогонального лигирования с соединением, несущим флуорофор (представленный как M в настоящем описании), так что третье соединение можно делать несущим флуорофор. Кроме того, (i) R6b можно делать специфически взаимодействующим с/связывающимся с другим элементом R6c второй пары связывания, чтобы диссоциировать конъюгат R6b и R6a, тем самым заставляя четвертое соединение терять флуорофор, или (ii) R8 в четвертом соединении можно делать осуществляющим реакцию биоортогонального лигирования с соединением, несущим гасящую группу для того, чтобы гасить флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении. В таких образцовых вариантах осуществления, R6b может представлять собой один элемент двух пар связывания (R6a и R6b первой пары связывания, R6b и R6c второй пары связывания). Особенно предпочтительно, два элемента первой пары связывания (R5a и R5b) не взаимодействуют с двумя элементами третьей пары связывания (R6b и R6c). Кроме того, особенно предпочтительно, что M не влияет на специфическое взаимодействие между R6b и R6c и что R6b и R6c не влияет на реакцию биоортогонального лигирования между R5a и M.

Следовательно, в некоторых предпочтительных вариантах осуществления, на стадии (6), дуплекс или растущую нить нуклеиновой кислоты подвергают обработке, которая не оказывает влияния на первое соединение и второе соединение, но позволяет R5a осуществлять реакцию биоортогонального лигирования с M (тем самым флуорофор вводят в третье соединение, чтобы позволять ему нести флуорофор и испускать флуоресцентный сигнал), и обработка позволяет R6b специфически взаимодействовать с/связываться с другим элементом (R6c) второй пары связывания (тем самым заставляя четвертое соединение терять флуорофор), или R8 в четвертом соединении позволяют осуществлять реакцию биоортогонального лигирования с соединением, несущим гаситель, тем самым гася флуоресцентный сигнал, испускаемый флуорофором в четвертом соединении. В таких образцовых вариантах осуществления, перед обработкой на стадии (6), первое соединение и третье соединение, если присутствует, не флуоресцируют, и второе соединение и четвертое соединение, если присутствуют, флуоресцируют; также, после обработки на стадии (6), первое соединение (если присутствует) все еще не флуоресцирует, второе соединение (если присутствует) все еще флуоресцирует, третье соединение (если присутствует) меняется для того, чтобы флуоресцировать, и четвертое соединение, если присутствует, меняется для того, чтобы не флуоресцировать. Следовательно, тип соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты, можно определять по результатам двух обнаружений флуоресцентного сигнала.

Кроме того, в таких образцовых вариантах осуществления, защитную группу в 3'-положении рибозы или дезоксирибозы в соединении, встроенном в 3'-конец растущей нити нуклеиновой кислоты, и флуорофор (если присутствует) на дуплексе или растущей нити нуклеиновой кислоты, можно удалять, подвергая R3a, R3b, R3c, R3d, R4a, R4b, R4c реакции биоортогонального расщепления. Следовательно, в некоторых предпочтительных вариантах осуществления, дуплекс или растущую нить нуклеиновой кислоты подвергают обработке на стадии (8), и такая обработка позволяет R3a, R3b, R3c, R3d, R4a, R4b, R4c осуществлять реакцию биоортогонального расщепления. В таких образцовых вариантах осуществления, после обработки на стадии (8), растущая нить нуклеиновой кислоты не будет иметь какой-либо флуорофор, и ее 3'-концевой нуклеотид будет иметь свободный гидроксил в 3'-положении рибозы или дезоксирибозы, и свободный гидроксил можно использовать для инициации следующего раунда реакции полимеризации.

Следовательно, в некоторых предпочтительных вариантах осуществления способ по изобретению включает стадии:

(1) предоставления молекулы нуклеиновой кислоты, подлежащей секвенированию, на основе или прикрепления молекулы нуклеиновой кислоты, подлежащей секвенированию, к основе;

(2) добавления праймеров для инициации полимеризации нуклеотидов, полимеразы для осуществления полимеризации нуклеотидов, и первого, второго, третьего и четвертого соединений формулы (I), формулы (II), формулы (III) и формулы (IV), соответственно, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу:

где Base1, Base2, Base3 и Base4 представляют 4 различных основания, и их выбирают из A, (T/U), C и G;

каждый R1 независимо выбирают из -H, монофосфатной группы (-PO3H2), дифосфатной группы (-PO3H-PO3H2), трифосфатной группы (-PO3H-PO3H-PO3H2) и тетрафосфатной группы (-PO3H-PO3H-PO3H-PO3H2);

R2 каждый независимо выбирают из -H и -OH;

каждый R3a, R3b, R3c, R3d, R4a, R4b и R4c независимо представляет собой реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления;

R5a представляет собой реакционноспособную группу, способную выполнять первую реакцию биоортогонального лигирования;

R6a представляет собой один элемент первой пары связывания, необязательно, R6a представляет собой Dye1 или также связывают в -L3-Dye1;

L1 независимо представляет собой линкерную группу или отсутствует;

L2 независимо представляет собой линкерную группу или отсутствует;

L3 представляет собой линкерную группу или отсутствует;

Dye и Dye1 представляют флуорофор, способный испускать флуоресцентный сигнал; и, оба они имеют одну и ту же структуру, или имеют различные структуры, но тот же или по существу тот же спектр испускания;

необязательно имеет место реакционноспособная группа R8, способная выполнять реакцию биоортогонального лигирования между R4c и R6a;

(3) отжига праймера с молекулой нуклеиновой кислоты, подлежащей секвенированию, и праймер служит в качестве начальной растущей нити нуклеиновой кислоты и образует дуплекс, прикрепленный к основе вместе с молекулой нуклеиновой кислоты, подлежащей секвенированию;

(4) выполнения реакции полимеризации нуклеотидов с использованием полимеразы в условиях, позволяющих полимеразе осуществлять полимеризацию нуклеотидов, тем самым встраивая одно из четырех соединений в 3'-конец растущей нити нуклеиновой кислоты;

(5) (i) четвертое соединение не может испускать флуоресцентный сигнал, и затем дуплекс или растущую нить нуклеиновой кислоты подвергают обработке в реакционной системе, содержащей фазу раствора и твердую фазу, обработка не оказывает влияния на первое соединение, второе соединение и третье соединение, но позволяет R6a в четвертом соединении специфически взаимодействовать со/связываться со средством, несущим флуорофор (например, флуорофор, имеющий ту же структуру, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения); после этого, удаления фазы раствора реакционной системы из предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

другой элемент первой пары связывания, несущий флуорофор, имеет структуру: R6b-L4-Dye2; где R6b представляет собой другой элемент первой пары связывания и L4 независимо представляет собой линкерную группу или отсутствует; Dye2 представляет флуорофор, который способен испускать флуоресцентный сигнал и имеет ту же структуру, что и Dye, или имеет другую структуру, но тот же или по существу тот же спектр испускания; между тем, R6b представляет собой один элемент второй пары связывания;

(ii) четвертое соединение способно испускать тот же флуоресцентный сигнал, что и второе соединение, тогда удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал;

(6) проведения обработки дуплекса или растущей нити нуклеиновой кислоты в реакционной системе, содержащей фазу раствора и твердую фазу, где обработка не оказывает влияния на первое соединение и второе соединение, но позволяет R5a в третьем соединении осуществлять первую реакцию биоортогонального лигирования со средством, несущим флуорофор (например, тот же флуорофор, что и второе соединение, или флуорофор, имеющий тот же или по существу тот же спектр испускания, что и флуорофор второго соединения), тем самым вводя флуорофор в указанном средстве в третье соединение, чтобы позволять ему испускать флуоресцентный сигнал; и (i) позволять другому элементу R6b специфически взаимодействовать с/связываться с другим элементом R6c второй пары связывания для того, чтобы диссоциировать конъюгат R6b и R6a, тем самым заставляя четвертое соединение терять флуорофор, или (ii) позволять R8 в четвертом соединении осуществлять реакцию биоортогонального лигирования с соединением, несущим гасящую группу, тем самым гася флуоресцентный сигнал, испускаемый флуорофором Dye1 или Dye2 в четвертом соединении. Где

другой элемент второй пары связывания, несущий гасящую группу, имеет следующую структуру: R6c-L'-Que; где R6c представляет собой другой элемент второй пары связывания и L' независимо представляет собой линкерную группу или отсутствует; Que представляет гасящую группу, способную гастить флуоресцентный сигнал, испускаемый посредством Dye1 или Dye2; и

(7) удаления фазы раствора реакционной системы на предыдущей стадии, сохранения дуплекса, прикрепленного к основе, и обнаружения того, дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал.

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадии:

(8) проведения обработки дуплекса или растущей нити нуклеиновой кислоты на предыдущей стадии в реакционной системе, содержащей фазу раствора и твердую фазу, которая позволяет R3a, R3b, R3c, R3d, R4a, R4b и R4c осуществлять реакцию биоортогонального расщепления так, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты имеет свободную гидроксильную группу в 3'-положении рибозы или дезоксирибозы (другими словами, превращая -OR3a, -OR3b, -OR3c или -OR3d (если присутствуют) в свободную гидроксигруппу), и удаления флуорофора на дуплексе или растущей нити нуклеиновой кислоты (другими словами, удаляя флуорофор, прикрепленный к R4a, R4b или R4c), если присутствует;

(9) удаления фазы раствора реакционной системы на предыдущей стадии;

(10) добавления полимеразы для осуществления полимеризации нуклеотидов и первого соединения, второго соединения, третьего соединения и четвертого соединения, тем самым образуя реакционную систему, содержащую фазу раствора и твердую фазу, и последующего выполнения стадий (4)-(7).

В некоторых предпочтительных вариантах осуществления, способ дополнительно включает стадию:

(11) повторения стадий (8)-(10) один или несколько раз.

В некоторых образцовых вариантах осуществления, на стадии (4), если соединение формулы (I) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то поскольку соединение формулы (I) не несет флуорофор, и оно не вступает в реакцию на стадии (6), и, следовательно, флуоресцентный сигнал не обнаруживают на стадиях (5) и (7). Другими словами, если флуоресцентный сигнал не обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (I).

Если, на стадии (4), соединение формулы (II) встраивают в 3'-конец растущей нити нуклеиновой кислоты, то поскольку само соединение формулы (II) несет флуорофор, и оно не выполняет какую-либо реакцию на стадии (6). Следовательно, флуоресцентный сигнал обнаруживают на обеих стадиях (5) и (7). Другими словами, если флуоресцентный сигнал обнаруживают на обеих из стадий (5) и (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (II).

Если, на стадии (4), соединение формулы (III) встраивают на 3'-конце растущей нити нуклеиновой кислоты, то (i) поскольку соединение формулы (III) не несет флуорофор, следовательно, флуоресцентный сигнал не обнаруживают на стадии (5); и (ii) поскольку соединение формулы (III) выполняет реакцию биоортогонального лигирования с соединением M, несущим флуорофор, на стадии (6), тем самым флуорофор вводят в растущую нить нуклеиновой кислоты, следовательно, флуоресцентный сигнал обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал не обнаруживают на стадии (5) и флуоресцентный сигнал обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (III).

Если на стадии (4) соединение формулы (IV) встраивают на 3'-конце растущей нити нуклеиновой кислоты, то (i) поскольку само соединение формулы (IV) несет флуорофор, или его обрабатывают на стадии (5) для того, чтобы оно несло флуорофор, следовательно, флуоресцентный сигнал обнаруживают на стадии (5); и (ii) поскольку соединение формулы (IV) теряет флуорофор на стадии (6) из-за диссоциации конъюгата R6a и R6b или выполняет реакцию биоортогонального лигирования, вводя гасящую группу в растущую нить нуклеиновой кислоты, гасящую флуоресцентный сигнал, испускаемый флуорофором, следовательно, флуоресцентный сигнал не обнаруживают на стадии (7). Другими словами, если флуоресцентный сигнал обнаруживают на стадии (5) и не обнаруживают на стадии (7), можно определять, что соединение, встроенное на 3'-конце растущей нити нуклеиновой кислоты, представляет собой соединение формулы (IV).

Следовательно, в некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает: после стадии (7), определение типа соединения, встраиваемого в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), в соответствии с результатами обнаружения на стадиях (5) и (7), где

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (I);

когда оба результата обнаружения со стадий (5) и (7) являются такими, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (II);

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (III); и,

когда результат обнаружения со стадии (5) является таким, что дуплекс или растущая нить нуклеиновой кислоты испускает флуоресцентный сигнал, и результат обнаружения со стадии (7) является таким, что дуплекс или растущая нить нуклеиновой кислоты не испускает флуоресцентный сигнал, определяют, что соединение, встроенное в 3'-конец растущей нити нуклеиновой кислоты на стадии (4), представляет собой соединение формулы (IV).

В некоторых предпочтительных вариантах осуществления, способ по настоящему изобретению дополнительно включает то, что, после стадии (7), на основе принципа комплементарного спаривания оснований, тип основания в соответствующем положении в молекуле нуклеиновой кислоты, подлежащей секвенированию определяют в соответствии с типом соединения, встроенного на 3'-конце растущей нити нуклеиновой кислоты на стадии (4).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) не вступают в реакцию друг с другом в ходе реакции полимеризации нуклеотидов.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пуриновые основания, и Base3 и Base4 представляют собой пиримидиновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание G, Base2 представляет собой основание A, Base3 представляет собой основание T или U и Base4 представляет собой основание C. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание C и Base4 представляет собой основание T или U. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание A, Base2 представляет собой основание G, Base3 представляет собой основание T или U и Base4 представляет собой основание C.

В некоторых предпочтительных вариантах осуществления, Base1 и Base2 представляют собой пиримидиновые основания и Base3 и Base4 представляют собой пуриновые основания. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание C, Base2 представляет собой основание T или U, Base3 представляет собой основание A и Base4 представляет собой основание G. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание G и Base4 представляет собой основание A. В некоторых предпочтительных вариантах осуществления, Base1 представляет собой основание T или U, Base2 представляет собой основание C, Base3 представляет собой основание A и Base4 представляет собой основание G.

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R1. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой монофосфатную группу (-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой дифосфатную группу (-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой трифосфатную группу (-PO3H-PO3H-PO3H2). В некоторых предпочтительных вариантах осуществления, R1 независимо представляет собой тетрафосфатную группу (-PO3H-PO3H-PO3H-PO3H2).

В некоторых предпочтительных вариантах осуществления, соединение формулы (I), соединение формулы (II), соединение формулы (III) и соединение формулы (IV) имеют один и тот же R2. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -H. В некоторых предпочтительных вариантах осуществления, R2 независимо представляет собой -OH.

В некоторых предпочтительных вариантах осуществления, каждый R3a, R3b, R3c, R3d, R4a, R4b, R4c независимо способен выполнять реакцию биоортогонального расщепления. Как используют в настоящем описании, выражение «каждый способен независимо выполнять реакцию биоортогонального расщепления» обозначает, что каждое из упомянутых реакционноспособных групп, средств или молекул и т. д. способно выполнять реакцию биоортогонального расщепления, при этом не взаимодействуя друг с другом или не влияя друг на друга. Например, выражение «каждый R3a и R3b независимо способен выполнять реакцию биоортогонального расщепления» обозначает, что оба R3a и R3b способны выполнять реакцию биоортогонального расщепления и R3a не влияет на протекание реакции биоортогонального расщепления R3b и R3b не влияет на протекание реакции биоортогонального расщепления R3a.

В некоторых образцовых вариантах осуществления, R3a представляет собой первую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии первого средства; R3b представляет собой вторую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии второго средства; R3c представляет собой третью реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии третьего средства; R3d представляет собой четвертую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии четвертого средства; R4a представляет собой пятую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии пятого средства; R4b представляет собой шестую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии шестого средства; и R4c представляет собой седьмую реакционноспособную группу, способную выполнять реакцию биоортогонального расщепления в присутствии седьмого средства;

Предпочтительно, в таких вариантах осуществления, первое средство, второе средство, третье средство, четвертое средство, пятое средство, шестое средство и седьмое средство можно добавлять на стадии (8), тем самым позволяя каждому R3a, R3b, R