环外胺取代的香豆素化合物及其作为荧光标记物的用途

文档序号:704460 发布日期:2021-04-13 浏览:31次 >En<

阅读说明:本技术 环外胺取代的香豆素化合物及其作为荧光标记物的用途 (Exocyclic amine substituted coumarin compound and application thereof as fluorescent marker ) 是由 N.罗马诺夫 C.阿纳斯塔西 P.麦考利 于 2020-02-28 设计创作,主要内容包括:本申请涉及环外胺-取代的香豆素衍生物以及它们作为荧光标记物的用途。这些化合物可用作核酸测序应用中核苷酸的荧光标记物。(The present application relates to exocyclic amine-substituted coumarin derivatives and their use as fluorescent labels. These compounds are useful as fluorescent labels for nucleotides in nucleic acid sequencing applications.)

环外胺取代的香豆素化合物及其作为荧光标记物的用途

通过引用并入优先权申请

本申请要求2019年3月1日提交的美国临时申请号62/812,837的优先权权益,将其全部内容通过引入并入本文。

技术领域

本公开内容涉及环外胺取代的香豆素衍生物及其作为荧光标记物的用途。特别地,该化合物可以在核酸测序应用中被用作核苷酸的荧光标记物。

背景技术

在本申请中引用若干出版物和专利文献,以便更充分地描述本公开内容所属的领域的状态。这些出版物和文献中的每一公开内容通过引用并入本文。

携带荧光标记物的核酸的非放射性检测是分子生物学中的重要技术。在重组DNA技术中采用的许多程序先前依赖于用例如32P放射性地标记的核苷酸或多核苷酸的使用。放射性化合物允许对核酸和其他感兴趣的分子的灵敏检测。然而,在放射性同位素的使用中存在严重的限制,诸如它们的费用、有限的储存期、灵敏度不足以及更重要的安全性考量。消除对放射性标记物的需求降低了安全风险和与例如试剂处置有关的环境影响和成本两者。适于非放射性荧光检测的方法通过非限制性举例而言包括自动DNA测序、杂交方法、聚合酶链式反应产物的实时检测以及免疫测定。

对于许多应用,期望的是,采用多个光谱上可区分的荧光标记物以实现对多个空间上重叠的分析物的独立检测。在这样的多重方法中,反应容器的数目可以减少,这简化了实验方案并且有助于生产特定应用的试剂盒。在多色自动DNA测序系统中,例如,多重荧光检测允许在单个电泳泳道中分析多个核苷酸碱基,从而与单色方法相比增加了通量(throughput)并且降低了与泳道间的电泳迁移率变化有关的不确定性。

然而,多重荧光检测可能是有问题的,且存在限制合适的荧光标记物的选择的许多重要因素。首先,在给定的应用中可能难以发现具有适合分辨的吸收和发射光谱的染料化合物。此外,当若干荧光染料被一起使用时,通过同时激发产生在可区别的光谱区内的荧光信号可能被复杂化,因为这些染料的吸收带通常是疏散的,所以甚至对于两种染料仍难以实现可比较的荧光激发效率。许多激发方法使用类似激光器的高功率光源并且因此染料必须具有充分的光稳定性以经受得住这样的激发。对分子生物学方法特别重要的最终考量是在荧光染料必须与化学试剂(reagent chemistries)诸如例如DNA合成溶剂和试剂、缓冲液、聚合酶以及连接酶相容的程度上。

随着测序技术进展,已经形成了对于另外的荧光染料化合物、其核酸缀合物和满足所有上文限制并且特别地适于高通量分子方法诸如固相测序及类似方法的多个荧光染料组的需求。

具有改进的荧光性质诸如合适的荧光强度、荧光的形状和荧光的波长最大值的荧光染料分子可以改进核酸测序的速度和准确度。当在基于水的生物缓冲液中并且在较高温度进行测量时,强的荧光信号是特别重要的,因为大部分染料的荧光强度在这样的条件下是显著较低的。此外,染料附接的所述碱基的性质也影响荧光最大值、荧光强度和染料的其他光谱性质(spectraldye properties)。核酸碱基和荧光染料之间的序列特异性相互作用可以通过该荧光染料的特定设计来调整。荧光染料的结构的优化可以改进核苷酸并入的效率、降低测序误差的水平并且减少核酸测序中对试剂的使用,并且因此降低核酸测序的成本。

一些光学和技术发展已经导致图像质量极大提高,但最终受到光学分辨率差的限制。通常,光学显微镜的光学分辨率限于以所使用的光的波长的约一半间距的物体。然而实际上,只有相距很远(至少200nm至350nm)放置的物体才能通过光学显微镜分辨出来。提高图像分辨率且增加每单位表面积可分辨的物体的数目的一种方式是使用较短波长的激发光。例如,在相同的光学器件下,如果光波长缩短Δλ~100nm,分辨率将是更好的(约Δ50nm/(约15%)),将记录到失真较小的图像,并且可识别区域上的物体的密度将增加约35%。

某些核酸测序方法采用激光来激发和检测染料标记的核苷酸。这些仪器使用较长波长的光,诸如红色激光,以及能够在660nm激发的合适的染料。为了检测更密集堆积的核酸测序簇同时保持可用的分辨率,可以使用较短波长的蓝色光源(450nm-460nm)。在此情况下,光学分辨率将不受较长波长的红色荧光染料的发射波长的限制,而受能够被下一个最长波长的光源激发的染料的发射的限制,例如,受532nm处的“绿色激光”的限制。因此,对在测序应用中用于荧光检测的蓝色染料标记物存在需求。

尽管蓝色染料化学和相关的激光技术已有改进例如以产生用于DVD和蓝光光盘(Blu-ray disk)的染料,但是这些化合物不适于生物标记并且不能被用作生物标志物。

不幸的是,适于核苷酸标记的具有强荧光的商购可得的蓝色染料仍然非常罕见。本文描述了适于核苷酸标记的在蓝光激发下具有强荧光的新的荧光化合物。

发明内容

本发明涉及环外胺-取代的香豆素衍生物。该化合物可以被用作荧光标记物,特别是在核酸测序应用中用于核苷酸标记的荧光标记物。在一些方面中,染料在短波长光吸收光,最佳地吸收在450nm-460nm的波长处的光,并且在使用具有450nm-460nm波长的蓝色波长激发源的情况下特别有利。由于荧光发射较短的波长,蓝色波长激发允许检测和分辨每单位面积的较高密度的特征。当这样的染料用于核苷酸的缀合物中时,可以看到在核酸测序方法期间获得的测序读段的长度、强度、准确性和质量方面的改进。

本发明一些实施方案涉及式(I)的化合物,或其盐:

其中X为O、S、Se或NRn,其中Rn为H、C1-6烷基或C6-10芳基;

环A为3至10元杂环基;

R、R1、R2和R4各自独立地为H、卤素、-CN、-CO2H、氨基、-OH、C-酰胺基、N-酰胺基、-NO2、-SO3H、-SO2NRaRb、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的烷氧基、任选取代的氨基烷基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、或任选取代的杂芳基;

各个R3独立地为卤素、-CN、-CO2H、-(CH2)p-CO2Rc、-(CH2)q-C(O)NRdRe、氨基、-OH、C-酰胺基、N-酰胺基、-NO2、-SO3H、-SO2NRaRb、任选取代的C1-6烷基、任选取代的C2-6烯基、任选取代的C2-6炔基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、或任选取代的杂芳基,或两个R3形成氧代(=O);其中p和q各自为1、2、3或4;

各个R5独立地为卤素、-CN、-CO2Rf、氨基、-OH、C-酰胺基、N-酰胺基、-NO2、-SO3H、-SO2NRaRb、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的烷氧基、任选取代的氨基烷基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、或任选取代的杂芳基;

各个Ra和Rb独立地为H或任选取代的C1-6烷基;

各个Rc、Rd、Re和Rf独立地为H、任选取代的C1-6烷基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、或任选取代的杂芳基;

m为0、1、2、3或4;且n为0、1、2、3,4或5。

在一些方面,m或n至少之一不为0。在一些其他方面,当R、R1、R2和R4各自为H时,则m或n至少之一不为0。例如,当R、R1、R2和R4各自为H,m为0时,则n为1、2、3、4或5。当R、R1、R2和R4为H,n为0时,则m为1、2、3或4。在一些方面,当m为1;R5为-CO2H;R、R1、R2、R4各自为H;环A为时;则X为O、Se或NRn

在一些其它实施方案中,本公开的化合物与基底部分诸如例如核苷、核苷酸、多核苷酸、多肽、碳水化合物、配体、颗粒、细胞、半固体表面(例如,凝胶)或固体表面缀合。缀合可以经由羧基基团(-CO2H)进行,该羧基基团可以使用本领域已知的方法与一个部分(诸如核苷酸)上的氨基基团或羟基基团或与该部分结合的连接基反应,以形成酰胺或酯。

本公开的一些其他方面涉及包含连接基基团的染料化合物,以使得能够例如共价附接至基底部分。连接可以在染料的任何位置,包括在任何R基团上进行。在一些实施方案中,可以经由式(I)的R3或R5进行连接。

本公开的另一些方面提供了由下式定义的核苷或核苷酸化合物:

N-L-染料

其中N为核苷酸;

L为任选的连接基部分;且

染料为根据本发明的荧光化合物。

本文所述的一些其他实施方案涉及用式(I)的化合物标记的部分,特别是核苷酸或寡核苷酸。

一些其他的公开内容提供了使用本发明的染料化合物进行测序的方法。

根据另外的方面,本公开还提供了包含染料化合物(游离的或呈缀合物形式)的试剂盒,所述试剂盒可以被用于各种免疫测定、寡核苷酸或核酸标记、或用于边合成边DNA测序。在又一个方面中,本公开内容提供了包含染料“组”的试剂盒,该试剂盒特别适于在自动仪器平台上进行边合成边测序的循环。在一些方面中是包含一种或多种核苷酸的试剂盒,其中至少一种核苷酸是本文描述的标记的核苷酸。

本公开内容的另外的方面是本公开内容的化合物的化学制备,所述化合物包括环外胺取代的香豆素染料和被这样的染料标记的部分诸如核苷酸。

另外的方面是测序方法,所述测序方法包括在测序测定中将本文描述的标记的核苷酸掺入多核苷酸中,以及检测所掺入的标记的核苷酸。

附图说明

图1为散点图,其示出了在两通道测序分析中用本文所述的染料I-4标记的完全官能化的A核苷酸的可用性。

图2为散点图,其示出了在两通道测序分析中用本文所述的染料I-5标记的完全功能化的A核苷酸的可用性。

图3为散点图,其示出了在两通道测序分析中用本文所述的染料I-6标记的完全官能化的A核苷酸的可用性。

具体实施方式

本公开内容提供了环外胺取代的香豆素化合物,其特别适用于荧光检测和边合成边测序的方法。本文所述的实施方案涉及式(I)的结构的染料及其衍生物,其盐和内消旋形式。

在一些方面,X为O。在一些方面,X为S。在一些方面,X为Se。在一些方面,X为NRn,其中Rn为H、C1-6烷基、或C6-10芳基,且在一方面,Rn为H。在一些其它实施方案中,当m为1;R5为-CO2H;R、R1、R2、R4各自为H;环A为则X为O、Se或NRn。在一些其它实施方案中,当n为0;环A为R、R1、R2、R4各自为H;X为O时;则m为1、2、3或4。在一些方面,当n为0,则m为1、2、3或4且至少一个R5为-CO2H。在一些其它方面,当n为1且R3为-CO2H时,则m为0或R5不为-CO2H。

在一些方面,R为H、卤素、-CO2H、氨基、-OH、C-酰胺基、N-酰胺基、-NO2、-SO3H、-SO2NH2、任选取代的烷基、任选取代的烯基、任选取代的炔基、任选取代的烷氧基、任选取代的氨基烷基、任选取代的碳环基、任选取代的杂环基、任选取代的芳基、或任选取代的杂芳基。在一方面,R为H。在另一方面,R为卤素。在一些方面,R为任选取代的C1-6烷基。在一些方面,R为-CO2H。在一些方面,R为-SO3H。在一些方面,R为-SO2NRaRb,其中Ra和Rb独立地为H或任选取代的C1-6烷基。在一方面,R为-SO2NH2。在一些方面,R不为-CN。

在一些方面,R1为H。在一些方面,R1为卤素。在一些方面,R1为-CN。在一些方面,R1为C1-6烷基。在一些方面,R1为-SO2NRaRb,其中Ra和Rb独立地为H或任选取代的C1-6烷基。在一方面,R1为-SO2NH2.在一些方面,R1不为-CN。

在一些方面,R2为H。在一些方面,R2为卤素。在一些方面,R2为-SO3H。在一些方面,R2为任选取代的烷基,例如C1-6烷基。在一些其它实施方案中,R2为任选取代有-CO2H或-SO3H的C1-4烷基。

在一些方面,R4为H。在一些方面,R4为-SO3H。在一些方面,R4为任选取代的烷基,例如C1-6烷基。在一些其它实施方案中,R4任选取代有-CO2H或-SO3H的C1-4烷基。

在一些方面,环A为3至7元单杂环。在一些其它实施方案中,所述3至7元单杂环包含一个或多个选自氮、氧和硫的杂原子。在一些其它实施方案中,所述3至7元单杂环包含一个氮原子。在一些方面,环A为在一个这样的实施方案中,环A为在一些方面,环A is在一个这样的实施方案中,环A为在一些方面,环A为在一个这样的实施方案中,环A为在本文所述的环A的一些方面,n为0。在本文所述的环A的一些方面,n为1。在本文所述的环A的一些方面,n为2或3。在一些方面,各个R3独立地为-CO2H、-SO3H、任选取代有-CO2H或-SO3H的C1-4烷基、-(CH2)p-CO2Rc、或任选取代的C1-6烷基。在一些方面,R3为甲基、乙基、丙基、异丙基、丁基、异丁基、仲丁基、叔丁基、戊基、或己基。在其它方面,R3为取代的C1-4烷基。在一些方面,R3为取代有-CO2H或-SO3H的C1-4烷基或C2-6烷基。在一些其它实施方案中,n为1且R3为-CO2H或-(CH2)p-CO2Rc。在一些其它实施方案中,Rc为H或C1-4烷基。

式(I)的部分的苯环任选地在一个、两个、三个或四个位置上被表示为R5的取代基取代。当m为0,苯环为未取代。当m大于1,各个R5可相同或不同。在一些方面,m为0。在其它方面,m为1。在其它方面,m为2。在一些方面,m为1、2或3,且各个R5独立地为卤素、-CN、-CO2Rf,氨基、-OH、-SO3H、-SO2NRaRb或任选取代的C1-6烷基,其中Rf为H或C1-4烷基。在一些其它实施方案中,R5为-CO2H、-SO3H、-SO2NH2、或取代有-CO2H、-SO3H或-SO2NH2的C1-6烷基。在一些其它实施方案中,R5为-(CH2)xCOOH,其中x为2、3、4、5或6。在一些实施方案中,当R、R1、R2、R4各自为H;n为0;m为1时;则在以下位置取代: 在一个实施方案中,R5为-CO2H。

式(I)的化合物的具体实例包括其中X为O、S或NH;各个R、R1、R2和R4为H;环A为n为0或1;R3为-CO2H或-(CH2)p-CO2Rc;p为1、2、3或4;Rc为H或C1-6烷基;m为0或1;且R5为卤素、-CO2Rf、-SO3H、-SO2NRaRb,或取代有-SO3H或-SO2NRaRb的C1-6烷基。在一些实施方案中,Ra和Rb中至少一个或两个为H或C1-6烷基。在一些其它实施方案中,Rf为H或C1-4烷基。在一些其它实施方案中,当m为0,则n为1;或当n为0,则m为1。在一个实施方案中,m和n都为1。在一些其它实施方案中,当m为1,在以下位置取代: 在一个实施方案中,R5为-CO2H。在另一实施方案中,R5为卤素如氯,或-SO3H。在另一实施方案中,R5为-SO2NRaRb,其中Ra和Rb中至少一个或两个为H或C1-6烷基。

式(I)的化合物的具体实例包括其中X为O、S或NH;各个R、R1、R2和R4为H;环A为n为0或1;R3为-CO2H或-(CH2)p-CO2Rc;p为1、2、3或4;Rc为H或C1-6烷基;m为0或1;且R5为卤素、-CO2Rf、-SO3H、-SO2NRaRb,或取代有-SO3H或-SO2NRaRb的C1-6烷基。在一些实施方案中,Ra和Rb中至少一个或两个为H或C1-6烷基。在一些其它实施方案中,Rf为H或C1-4烷基。在一些其它实施方案中,当m为0,则n为1;或当n为0,则m为1。在一个实施方案中,m和n都为1。在一些其它实施方案中,当m为1,在以下位置取代: 在一个实施方案中,R5为-CO2H。在另一实施方案中,R5为卤素,如氯,或-SO3H。在另一实施方案中,R5为-SO2NRaRb,其中Ra和Rb中至少一个或两个为H或C1-6烷基。

式(I)的化合物的具体实例包括其中X为O、S或NH;各个R、R1、R2和R4为H;环A为n为0或1;R3为-CO2H或-(CH2)p-CO2Rc;p为1、2、3或4;Rc为H或C1-6烷基;m为0或1;且R5为卤素、-CO2Rf、-SO3H、-SO2NRaRb,或取代有-SO3H或-SO2NRaRb的C1-6烷基。在一些实施方案中,Ra和Rb中至少一个或两个为H或C1-6烷基。在一些其它实施方案中,Rf为H或C1-4烷基。在一些其它实施方案中,当m为0,则n为1;或当n为0,则m为1。在一个实施方案中,m和n都为1。在一些其它实施方案中,当m为1,在以下位置取代: 在一个实施方案中,R5为-CO2H。在另一实施方案中,R5为卤素,如氯,或-SO3H。在另一实施方案中,R5为-SO2NRaRb,其中Ra和Rb中至少一个或两个为H或C1-6烷基。

环外胺-取代的香豆素染料的具体实例包括:

及其盐和内消旋形式。

特别有用的化合物为用本文所述的染料标记的核苷酸或寡核苷酸。标记的核苷酸或寡核苷酸可通过羧基或烷基-羧基基团附接至本文公开的染料化合物以形成酰胺或烷基-酰胺。例如,本文公开的染料化合物通过式(I)的R3或R5附接至核苷酸或寡核苷酸。在一些实施方案中,式(I)的R3为-CO2H或-(CH2)p-CO2H且该附接使用-CO2H基团形成酰胺。在一些实施方案中,式(I)的R5为-CO2H且该附接使用-CO2H基团形成酰胺。标记的核苷酸或寡核苷酸可以使标记物通过连接基部分被附接至嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位。

标记的核苷酸或寡核苷酸还可以具有被共价地附接至核苷酸的核糖或脱氧核糖的阻断基团。阻断基团可以被附接在核糖或脱氧核糖的任何位置处。在特定的实施方案中,阻断基团在核苷酸的核糖或脱氧核糖的3’OH位。

本文提供了包含两种或更多种核苷酸的试剂盒,其中至少一种核苷酸是用本公开内容的化合物标记的核苷酸。试剂盒可以包含两种或更多种标记的核苷酸。这些核苷酸可以用两种或更多种荧光标记物标记。标记物中的两种或更多种可以使用单激发源来激发,所述单激发源可以是激光器。例如,两种或更多种标记物的激发带可以是至少部分重叠的,使得在光谱的重叠区中的激发引起两种标记物均发射荧光。在特定的实施方案中,来自两种或更多种标记物的发射将发生在光谱的不同区域中,使得标记物中的至少一种的存在可以通过光学区分该发射而确定。

试剂盒可以包含四种标记的核苷酸,其中四种核苷酸中的第一核苷酸用如本文公开的化合物标记。在这样的试剂盒中,四种核苷酸中的每种可以用与其他三种核苷酸上的标记物相同或不同的化合物标记。因此,化合物中的一种或多种可以具有不同的吸收最大值和/或发射最大值,使得该化合物可与其他化合物区别。例如,每种化合物可以具有不同的吸收最大值和/或发射最大值,使得化合物中的每种可与其他三种化合物区别。将理解,除了最大值之外的吸收光谱和/或发射光谱的部分可以不同并且这些差异可以被利用以将化合物区别开。试剂盒可以是使得化合物中的两种或更多种具有不同的吸收最大值。本发明的化合物通常吸收在低于500nm区域内的光。

本文所述的化合物、核苷酸或试剂盒可以被用于检测、测量或鉴定生物系统(包括,例如其过程或其组分)。可以采用这些化合物、核苷酸或试剂盒的示例性技术包括测序、表达分析、杂交分析、遗传分析、RNA分析、细胞测定(例如,细胞结合或细胞功能分析)或蛋白测定(例如,蛋白结合测定或蛋白活性测定)。使用可以是在用于进行特定技术的自动化仪器(诸如自动测序仪器)上。测序仪器可以包括在不同的波长运行的两种激光器。

本文公开了合成本公开内容的化合物的方法。根据本公开内容的染料可以从多种不同的合适的起始材料合成。例如,式(I)的化合物可通过使式(II)的化合物与式(III)的任选取代的环胺反应来制备:

其中各个变量,X、R、R1、R2、R3、R4、R5、环A、m和n如本文定义。反应可在有机溶剂中在环境温度或升高的温度进行。

定义

本文使用的章节标题仅为了组织的目的并且不被解释为限制所描述的主题。

应注意,如在本说明书和所附权利要求中所使用的,单数形式“一个”、“一种”和“所述”包括复数指示物,除非清楚地且明确地受限于一个指示物。对本领域技术人员将明显的是,可以对本文描述的各种实施方案作出各种修改和变型而不偏离本教导的精神或范围。因此,意图的是,本文描述的各种实施方案覆盖在所附权利要求及其等同物的范围内的其他修改和变型。

除非另有定义,否则本文使用的所有技术术语和科学术语具有与本领域的普通技术人员通常理解的相同的含义。术语“包括”以及其他形式诸如“包含”、“含有”和“涵盖”的使用是非限制性的。术语“具有(having)”以及其他形式诸如“具有(have)”、“具有(has)”和“具有(had)”的使用是非限制性的。如在本说明书中所使用的,无论是在过渡措辞中还是在权利要求的主体中,术语“包括”和“包含”应被解释为具有开放式含义。意即,上文的术语应与措辞“具有至少”或“包括至少”同义地解释。例如,当在工艺流程的上下文中使用时,术语“包括(comprising)”意指该工艺流程包括至少所叙述的步骤,但可以包括其他的步骤。当在化合物、组合物或装置的上下文中使用时,术语“包括(comprising)”意指该化合物、组合物或装置包括至少所叙述的特征或组分,但还可以包括其他的特征或组分。

如本文使用的,术语“共价地附接”或“共价地结合”指的是化学键的形成,其特征由在原子之间共享电子对体现。例如,共价地附接的聚合物涂层指的是较之经由其他手段附接至基底的官能化表面,与该表面形成化学键的聚合物涂层,所述其他手段例如粘合或静电相互作用。应当清楚,被共价地附接至表面的聚合物还可以经由除共价附接之外的手段结合。

如本文使用的,术语“卤素(halogen)”或“卤代(halo)”意指元素周期表的第7列的放射稳定性原子(radio-stable atom)中的任一种,例如氟、氯、溴或碘,其中氟和氯是优选的。

如本文使用的,“烷基”指的是完全饱和(即,不包含双键或三键)的直链或支链的烃链。烷基基团可以具有1个至20个碳原子(无论何时其在本文中出现,诸如“1至20”的数值范围指的是在给定范围内的每个整数;例如,“1个至20个碳原子”意指该烷基基团可以由1个碳原子、2个碳原子、3个碳原子等诸如此类,直到且包括20个碳原子组成,但是本定义还覆盖在未指定数值范围的情况下出现的术语“烷基”)。烷基基团还可以是具有1个至9个碳原子的中等大小的烷基。烷基基团还可以是具有1个至6个碳原子的低级烷基。烷基基团可以被指定为“C1-4烷基”或类似的名称。仅通过举例的方式,“C1-6烷基”指示,在该烷基链中存在一个至六个碳原子,即该烷基链选自由以下组成的组:甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基以及叔丁基。典型的烷基基团包括,但绝不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基、己基等。

如本文使用的,“烷氧基”指的是式-OR,其中R是如上文定义的烷基,诸如“C1-9烷氧基”,包括但不限于甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基等。

如本文使用的,“烯基”指的是包含一个或多个双键的直链或支链的烃链。烯基基团可以具有2个至20个碳原子,但是本定义还覆盖在未指定数值范围的情况下出现的术语“烯基”。烯基基团还可以是具有2个至9个碳原子的中等大小的烯基。烯基基团还可以是具有2个至6个碳原子的低级烯基。烯基基团可以被指定为“C2-6烯基”或类似的名称。仅通过举例的方式,“C2-6烯基”指示,在该烯基链中存在两个至六个碳原子,即该烯基链选自由以下组成的组:乙烯基、丙烯-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基-丙烯-1-基、2-甲基-丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基以及丁-1,2-二烯-4-基。典型的烯基基团包括,但绝不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基等。

如本文使用的,“炔基”指的是包含一个或多个三键的直链或支链的烃链。炔基基团可以具有2个至20个碳原子,但是本定义还覆盖在未指定数值范围的情况下出现的术语“炔基”。炔基基团还可以是具有2个至9个碳原子的中等大小的炔基。炔基基团还可以是具有2个至6个碳原子的低级炔基。炔基基团可以被指定为“C2-6炔基”或类似的名称。仅举例而言,“C2-6炔基”指示,在该炔基链中存在两个至六个碳原子,即该炔基链选自由以下组成的组:乙炔基、丙炔-1-基、丙炔-2-基、丁炔-1-基、丁炔-3-基、丁炔-4-基以及2-丁炔基。典型的炔基基团包括,但绝不限于乙炔基、丙炔基、丁炔基、戊炔基和己炔基等。

如本文使用的,“杂烷基”指的是在链骨架中包含一个或多个杂原子(即,不同于碳的元素,包括但不限于氮、氧和硫)的直链或支链的烃链。杂烷基基团可以具有1个至20个碳原子,但是本定义还覆盖在未指定数值范围的情况下出现的术语“杂烷基”。杂烷基基团还可以是具有1个至9个碳原子的中等大小的杂烷基。杂烷基基团还可以是具有1个至6个碳原子的低级杂烷基。杂烷基基团可以被指定为“C1-6杂烷基”或类似的名称。杂烷基基团可以包含一个或多个杂原子。仅通过举例的方式,“C4-6杂烷基”指示,在该杂烷基链中存在四个至六个碳原子并且在该链的骨架中另外存在一个或多个杂原子。

术语“芳香族的”指的是具有共轭π电子体系的环或环体系,并且包括碳环芳香族基团(例如,苯基)和杂环芳香族基团(例如,吡啶)两者。该术语包括单环基团或稠环多环(即,共享相邻原子对的环)基团,条件是整个环体系是芳香族的。

如本文使用的,“芳基”指的是在环骨架中仅包含碳的芳香族环或芳香族环体系(即,共享两个相邻的碳原子的两个或更多个稠环)。当芳基是环体系时,在该体系中的每个环都是芳香族的。芳基基团可以具有6个至18个碳原子,但是本定义还覆盖在未指定数值范围的情况下出现的术语“芳基”。在一些实施方案中,芳基基团具有6个至10个碳原子。芳基基团可以被指定为“C6-10芳基”、“C6芳基或C10芳基”或类似的名称。芳基基团的实例包括但不限于苯基、萘基、薁基(azulenyl)以及蒽基。

“芳烷基”或“芳基烷基”是作为取代基经由亚烷基基团连接的芳基基团,诸如“C7-14芳烷基”及类似基团,包括但不限于苄基、2-苯基乙基、3-苯基丙基以及萘基烷基。在一些情况下,亚烷基基团是低级亚烷基基团(即,C1-6亚烷基基团)。

如本文使用的,“杂芳基”指的是在环骨架中包含一个或多个杂原子(即,不同于碳的元素,包括但不限于氮、氧和硫)的芳香族环或芳香族环体系(即,共享两个相邻原子的两个或更多个稠环)。当杂芳基是环体系时,在该体系中的每个环是芳香族的。杂芳基基团可以具有5-18个环成员(即,组成环骨架的原子数,包括碳原子和杂原子),但是本定义还覆盖在未指定数值范围的情况下出现的术语“杂芳基”。在一些实施方案中,杂芳基基团具有5个至10个环成员或5个至7个环成员。杂芳基基团可以被指定为“5元-7元杂芳基”、“5元-10元杂芳基”或类似的名称。杂芳基环的实例包括,但不限于呋喃基、噻吩基、酞嗪基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、异噁唑基、异噻唑基、三唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、三嗪基、喹啉基、异喹啉基、苯并咪唑基、苯并噁唑基、苯并噻唑基、吲哚基、异吲哚基以及苯并噻吩基。

“杂芳烷基”或“杂芳基烷基”是作为取代基经由亚烷基基团连接的杂芳基基团。实例包括但不限于2-噻吩基甲基、3-噻吩基甲基、呋喃基甲基、噻吩基乙基、吡咯基烷基、吡啶基烷基、异噁唑基烷基以及咪唑基烷基。在一些情况下,亚烷基基团是低级亚烷基基团(即,C1-6亚烷基基团)。

如本文使用的,“碳环基”意指在环体系骨架中仅包含碳原子的非芳香族环或非芳香族环体系。当碳环基是环体系时,两个或更多个环可以以稠合的、桥接的或螺连接的方式连接在一起。碳环基可以具有任意饱和度,条件是在环体系中的至少一个环不是芳香族的。因此,碳环基包括环烷基、环烯基以及环炔基。碳环基基团可以具有3个至20个碳原子,但是本定义还覆盖在未指定数值范围的情况下出现的术语“碳环基”。碳环基基团还可以是具有3个至10个碳原子的中等大小的碳环基。碳环基基团还可以是具有3个至6个碳原子的碳环基。碳环基基团可以被指定为“C3-6碳环基”或类似的名称。碳环基环的实例包括但不限于环丙基、环丁基、环戊基、环己基、环己烯基、2,3-二氢-茚、双环[2.2.2]辛基、金刚烷基以及螺[4.4]壬基。

如本文使用的,“环烷基”意指完全饱和的碳环基环或碳环基环体系。实例包括环丙基、环丁基、环戊基以及环己基。

如本文使用的,“杂环基”意指在环骨架中包含至少一个杂原子的非芳香族环或非芳香族环体系。杂环基可以以稠合的、桥接的或螺连接的方式连接在一起。杂环基可以具有任何饱和度,条件是在环体系中的至少一个环不是芳香族的。杂原子可以存在于环体系中的非芳香族环或芳香族环中。杂环基基团可以具有3个至20个环成员(即,组成环骨架的原子数,包括碳原子和杂原子),但是本定义还覆盖在未指定数值范围的情况下出现的术语“杂环基”。杂环基基团还可以是具有3个至10个环成员的中等大小的杂环基。杂环基基团还可以是具有3个至6个环成员的杂环基。杂环基基团可以被指定为“3元-6元杂环基”或类似的名称。在优选的六元单环杂环基中,杂原子选自O、N或S中的一个至多达三个,并且在优选的五元单环杂环基中,杂原子选自一个或两个选自O、N或S的杂原子。杂环基环的实例包括,但不限于氮杂基(azepinyl)、吖啶基、咔唑基、噌啉基、二氧戊环基、咪唑啉基、咪唑烷基、吗啉基、环氧乙烷基、氧杂环庚烷基(oxepanyl)、硫杂环庚烷基(thiepanyl)、哌啶基、哌嗪基、二氧代哌嗪基、吡咯烷基、吡咯烷酮基(pyrrolidonyl)、吡咯烷二酮基(pyrrolidionyl)、4-哌啶酮基、吡唑啉基、吡唑烷基、1,3-二噁英基、1,3-二噁烷基、1,4-二噁英基、1,4-二噁烷基、1,3-氧硫杂环己烷基、1,4-氧硫杂环己二烯基、1,4-氧硫杂环己烷基、2H-1,2-噁嗪基、三噁烷基、六氢-1,3,5-三嗪基、1,3-间二氧杂环戊烯基、1,3-二噁茂烷、1,3-二硫杂环戊二烯基、1,3-二硫戊环基、异噁唑啉基、异噁唑烷基、噁唑啉基、噁唑烷基、噁唑烷酮基、噻唑啉基、噻唑烷基、1,3-氧硫杂环戊烷基、吲哚啉基、异吲哚啉基、四氢呋喃基、四氢吡喃基、四氢噻吩基、四氢噻喃基、四氢-1,4-噻嗪基、硫吗啉基(thiamorpholinyl)、二氢苯并呋喃基、苯并咪唑烷基以及四氢喹啉。

如本文定义的,“O-羧基”基团指的是“-OC(=O)R”基团,其中R选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。

如本文定义的,“C-羧基”基团指的是“-C(=O)OR”基团,其中R选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。非限制性实例包括羧基(即,-C(=O)OH)。

如本文定义的,“磺酰基”基团指的是“-SO2R”基团,其中R选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。

“亚磺基”基团指的是“-S(=O)OH”基团。

如本文定义的,“S-磺酰氨基”基团指的是“-SO2NRARB”基团,其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。

如本文定义的,“N-磺酰氨基”基团指的是“-N(RA)SO2RB”基团,其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。

如本文定义的,“C-酰氨基”基团指的是“-C(=O)NRARB”基团,其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。

如本文定义的,“N-酰氨基”基团指的是“-N(RA)C(=O)RB”基团,其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。

如本文定义的,“氨基”基团指的是“-NRARB”基团,其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基以及3元-10元杂环基。非限制性实例包括游离的氨基(即,-NH2)。

如本文定义的,“氨基烷基”基团指的是经由亚烷基基团连接的氨基基团。

如本文定义的,“烷氧基烷基”基团指的是经由亚烷基基团连接的烷氧基基团,诸如“C2-8烷氧基烷基”等。

如本文使用的,被取代的基团衍生自未被取代的母体基团(parent group),在该母体基团中一个或多个氢原子已被交换为另一个原子或基团。除非另有指示,否则当基团被认为是“被取代的”时,意指该基团被独立地选自以下的一个或多个取代基取代:C1-C6烷基、C1-C6烯基、C1-C6炔基、C1-C6杂烷基、C3-C7碳环基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、C3-C7-碳环基-C1-C6-烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、3元-10元杂环基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、3元-10元杂环基-C1-C6-烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、芳基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、芳基(C1-C6)烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、5元-10元杂芳基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、5元-10元杂芳基(C1-C6)烷基(任选地被卤素、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基,和C1-C6卤代烷氧基取代)、卤素、-CN、羟基、C1-C6烷氧基、C1-C6烷氧基(C1-C6)烷基(即,醚)、芳氧基、硫氢基(巯基)、卤素(C1-C6)烷基(例如,-CF3)、卤素(C1-C6)烷氧基(例如,-OCF3)、C1-C6烷基硫代、芳基硫代、氨基、氨基(C1-C6)烷基、硝基、O-氨基甲酰基、N-氨基甲酰基、O-硫代氨基甲酰基、N-硫代氨基甲酰基、C-酰氨基、N-酰氨基、S-磺酰胺基、N-磺酰胺基、C-羧基、O-羧基、酰基、氰酰基、异氰酰基、硫代氰酰基、异硫代氰酰基、亚磺酰基、磺酰基、-SO3H、亚磺基、-OSO2C1-4烷基、以及氧代(=O)。在基团被描述为“任选取代的”任何情况下,该基团可以被上文的取代基取代。

在一些实施方案中,取代的烷基基团、烯基基团或炔基基团,其被选自由卤素、-CN、SO3 -、-SO3H、-SRA、-ORA、-NRBRC、氧代、-CONRBRC、-SO2NRBRC、-COOH和-COORB组成的组中的一个或多个取代基取代,其中RA、RB和RC各自独立地选自H、烷基、取代的烷基、烯基、取代的烯基、炔基、取代的炔基、芳基,和取代的芳基。

本文描述的化合物可以被表示为若干内消旋形式。在绘制单一结构的情况下,意向的是相关内消旋形式中的任何一种。本文描述的香豆素化合物虽由单一结构表示,但可以被等同地示为相关内消旋形式的任何一种。对于式(I),示例性的内消旋结构在如下所示:

在本文描述的化合物的单个内消旋形式被示出的每种情况下,替代性内消旋形式同样被预期。

如本领域普通技术人员理解的,本文描述的化合物可以离子化形式,例如-CO2 -或-SO3 -存在。如果化合物包含带正电荷的取代基基团或带负电荷的取代基基团例如SO3 -时,该化合物还可以包含带负电荷的抗衡离子或带正电荷的抗衡离子,使得该化合物整体上是中性的。在其他方面中,化合物可以盐的形式存在,其中抗衡离子由共轭酸或共轭碱提供。

应当理解,视上下文而定,某些基团命名惯例(naming conventions)可以包括单基团或双基团。例如,在取代基需要两个附接至分子的剩余部分的点时,应理解,该取代基是双基团。例如,被识别为需要两个附接点的烷基的取代基包括双基团,诸如-CH2-、-CH2CH2-、-CH2CH(CH3)CH2-及类似基团。其他基团命名惯例清楚地指示,该基团是双基团,诸如“亚烷基”或“亚烯基”。

当两个“相邻的”R基团被表述为“连同它们被附接至的原子”形成环时,意指这些原子、介于中间的键(intervening bond)和两个R基团的集体单元是所叙述的环。例如,当存在以下子结构:

并且R1和R2被定义为选自由氢和烷基组成的组中,或者R1和R2连同它们与之附接的原子形成芳基或碳环基时,意味着R1和R2可以选自氢或烷基,或可选择地,该子结构具有以下结构:

其中A是芳基环或包含所述双键的碳环基。

标记的核苷酸

根据本公开内容的方面,提供适于附接至基底部分的染料化合物,所述染料化合物特别地包含能够附接至基底部分的连接基基团。基底部分实际上可以是本公开内容的染料可以被缀合至的任何分子或物质,并且通过非限制性举例而言,基底部分可以包括核苷、核苷酸、多核苷酸、碳水化合物、配体、颗粒、固体表面、有机聚合物和无机聚合物、染色体、细胞核、活细胞以及其组合或装配体(assemblage)。染料可以通过任选的连接基、通过包括疏水吸引、离子吸引和共价附接的多种手段被缀合。在一些方面中,染料通过共价附接被缀合至基底。更特别地,共价附接借助于连接基基团。在一些情况下,这样的标记的核苷酸还被称为“修饰的核苷酸(modified nucleotide)”。

本公开内容还提供了用本文陈述的染料中的一种或多种标记的核苷和核苷酸的缀合物(修饰的核苷酸)。标记的核苷和核苷酸可用于标记多核苷酸,所述多核苷酸诸如,非限制性举例而言,在PCR扩增、等温扩增、固相扩增、多核苷酸测序(例如,固相测序)、切口平移反应及类似过程中,经由酶促合成形成。

与生物分子的附接可以经由式(I)的化合物的R、R1、R2、R3、R4、R5或X位置。在一些方面,连接经由式(I)的R3或R5基团。在一些实施方案中,取代基基团是羧基或取代的烷基,例如被-CO2H或羧基基团的活化形式,例如酰胺或酯取代的烷基,其可以被用于附接至生物分子的氨基基团或羟基基团。如本文使用的术语“活化的酯”指的是能够在温和条件下例如与包含氨基基团的化合物反应的羧基基团衍生物。活化的酯的非限制性实例包括但不限于对硝基苯基、五氟苯基以及琥珀酰亚氨基酯。

在一些实施方案中,染料化合物可以经由核苷酸碱基而共价地附接至寡核苷酸或核苷酸。例如,标记的核苷酸或寡核苷酸可以有标记物,该标记物通过连接基部分被附接至嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位。标记的核苷酸或寡核苷酸还可以具有被共价地附接至核苷酸的核糖或脱氧核糖的3′-OH阻断基团。

如本文描述的新的荧光染料的特别有益的应用是用于标记生物分子,例如核苷酸或寡核苷酸。本申请的一些实施方案涉及用如本文描述的新的荧光化合物标记的核苷酸或寡核苷酸。

连接基

如本文公开的染料化合物可以包括在取代位置的一处上的反应性连接基基团,其用于使化合物共价附接至基底或另一个分子。反应性连接基基团是能够形成键(例如,共价键或非共价键),特别是共价键的部分。在特定的实施方案中,连接基可以是可裂解的连接基。术语“可裂解的连接基”的使用不意在暗示整个连接基需要被去除。裂解位点可以位于连接基上,以确保连接基的一部分在裂解之后仍与染料和/或基底部分附接。通过非限制性举例的方式,可裂解的连接基可以是亲电性地可裂解的连接基、亲核性地可裂解的连接基、可光裂解的连接基、在还原条件下可裂解的(例如包含二硫化物或叠氮化物的连接基)、在氧化条件下可裂解的、经由使用安全捕获连接基可裂解的以及通过去除机制可裂解的。使用可裂解的连接基将染料化合物附接至基底部分确保标记物可以视需要在检测之后去除,避免下游步骤中的任何信号干扰。

有益的连接基基团可以见于PCT公布第WO2004/018493号(通过引用并入本文)中,所述连接基基团的实例包括可以使用水溶性膦或由过渡金属和至少部分地可溶于水的配体形成的水溶性过渡金属催化剂裂解的连接基。在水性溶液中,后者形成至少部分地可溶于水的的过渡金属络合物。这样的可裂解的连接基可以被用于将核苷酸的碱基连接至标记物,诸如本文陈述的染料。

特定的连接基包括在PCT公布第WO2004/018493号(通过引用并入本文)中公开的那些,诸如包含下式的部分的那些连接基:

(其中X选自包括O、S、NH和NQ的组,其中Q是C1-10取代的或未取代的烷基基团,Y选自包括O、S、NH和N(烯丙基)的组,T是氢或C1-C10取代的或未取代的烷基基团,并且*指示该部分被连接至核苷酸或核苷的剩余部分的位置)。在一些方面,连接基将核苷酸的碱基连接至标记物,诸如例如本文描述的染料化合物。

连接基的额外的实例包括在美国公开第2016/0040225号和第2019/0017111号中公开的那些(通过引用并入本文),诸如包含下式的部分的那些连接基:

本文阐述的连接基部分可以包括介于核苷酸/核苷和标记物之间的全部或部分连接基结构。

在特定的实施方案中,可改变荧光染料(荧光团)和鸟嘌呤碱基之间的连接基的长度,例如通过引入聚乙二醇间隔基基团,从而与通过本领域已知的其他连接附接至鸟嘌呤碱基的相同荧光团相比增加荧光强度。示例性连接基及其性质在PCT公布第WO2007020457号(通过引用并入本文)中陈述。连接基的设计并且特别地其增加的长度可以允许在被掺入多核苷酸诸如DNA中时提高附接至鸟苷核苷酸的鸟嘌呤碱基的荧光团的亮度。因此,当染料用于在需要检测被附接至包含鸟嘌呤的核苷酸的荧光染料标记物的任何分析方法中使用时,如果连接基包含式-((CH2)2O)n-的间隔基基团是有益的,其中n是介于2和50之间的整数,如在WO 2007/020457中描述的。

核苷和核苷酸可以在糖或核碱基上的位点处被标记。如本领域已知的,“核苷酸”由含氮碱基、糖和一个或多个磷酸酯基组成。在RNA中,糖是核糖并且在DNA中糖是脱氧核糖,即缺少存在于核糖中的羟基基团的糖。含氮碱基是嘌呤或嘧啶的衍生物。嘌呤是腺嘌呤(A)和鸟嘌呤(G),并且嘧啶是胞嘧啶(C)和胸腺嘧啶(T)或在RNA的背景下是尿嘧啶(U)。脱氧核糖的C-1原子结合至嘧啶的N-1或嘌呤的N-9。核苷酸还是核苷的磷酸酯,其中酯化发生在被附接至糖的C-3或C-5的羟基基团上。核苷酸通常是单磷酸酯、双磷酸酯或三磷酸酯。

“核苷”在结构上与核苷酸类似但没有磷酸部分。核苷类似物的实例将是其中标记物被连接至碱基并且没有磷酸基团被附接至糖分子的核苷类似物

虽然碱基通常被称为嘌呤或嘧啶,但技术人员将理解,不改变核苷酸或核苷进行沃森-克里克碱基配对(Watson-Crick base pairing)的能力的衍生物和类似物是可用的。“衍生物”或“类似物”意指化合物或分子,其核心结构与母体化合物的核心结构相同或非常相似,但其具有化学或物理修饰(诸如例如不同的或另外的侧基,其允许衍生的核苷酸或核苷被连接至另一个分子)。例如,碱基可以是脱氮嘌呤。在特定的实施方案中,衍生物应该能够进行沃森-克里克配对。“衍生物”和“类似物”还包括例如具有修饰的碱基部分和/或修饰的糖部分的合成的核苷酸衍生物或核苷衍生物。这样的衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中被讨论。核苷酸类似物还可以包含修饰的磷酸二酯键,该磷酸二酯键包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯(phosphoranilidate)键、氨基磷酸酯键以及类似物。

染料可以例如通过连接基被附接至核苷酸碱基上的任何位置。在特定的实施方案中,对所产生的类似物仍然可以进行沃森-克里克碱基配对。特定的核碱基标记位点包括嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置。如上文描述的,连接基基团可以被用于将染料共价地附接至核苷或核苷酸。

在特定的实施方案中,标记的核苷或核苷酸可以是可通过酶掺入的和可通过酶延伸的。因此,连接基部分可以具有足以将核苷酸连接至化合物的长度,使得该化合物不明显地干扰核酸复制酶对核苷酸的整体结合和识别。因此,连接基还可以包含间隔基单元。例如,间隔基(spacer)使核苷酸碱基远离裂解位点或标记物。

使用本文描述的染料标记的核苷或核苷酸可以有下式:

其中染料是染料化合物;B是核碱基,诸如例如尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤、鸟嘌呤等;L是可以存在或可以不存在的任选的连接基基团;R可以是H、单磷酸酯、二磷酸酯、三磷酸酯、硫代磷酸酯、磷酸酯类似物、被附接至反应性含磷基团的-O-或被阻断基团保护的-O-;R″可以是H、OH、亚磷酰胺或3′-OH阻断基团,并且R″′是H或OH。在R″是亚磷酰胺的情况下,R′是酸可裂解的羟基保护基团,所述酸可裂解的羟基保护基团允许随后的在自动合成条件下的单体偶联。

在特定的实施方案中,阻断基团是分开的并且独立于染料化合物,即不附接至染料化合物。可替代地,染料可以包含3′-OH阻断基团的全部或一部分。因此,R″可以是可以包含染料化合物或可以不包含染料化合物的3′-OH阻断基团。

在又一可选择的实施方案中,在戊糖的3′碳上不存在阻断基团,并且例如附接至碱基的染料(或染料和连接基构建体)可以具有足以充当另外的核苷酸掺入的阻断物的大小或结构。因此,阻断可以是由于立体位阻或可以是由于大小、电荷和结构的组合,无论染料是否被附接至糖的3′位。

还又一个可选择的实施方案中,阻断基团存在于戊糖的2′碳或4′碳上并且可以具有足以充当另外的核苷酸掺入的阻断物的大小或结构。

当修饰的核苷酸被掺入时,阻断基团的使用允许诸如通过终止延伸来控制聚合。如果阻断作用是可逆的,例如,通过非限制性举例而言,通过改变化学条件或通过去除化学阻断物,则延伸可以在某些点停止并且然后允许继续。

在又一个特定的实施方案中,3′-OH阻断基团将包含在WO2004/018497和WO2014/139596中公开的部分,两者在此通过引用并入。例如,阻断基团可以是叠氮甲基(-CH2N3)或取代的叠氮甲基(例如,-CH(CHF2)N3或CH(CH2F)N3)、或烯丙基。

在特定的实施方案中,连接基(在染料和核苷酸之间)和阻断基团都存在并且是分开的部分。在特定的实施方案中,连接基和阻断基团在大体上类似的条件下都是可裂解的。因此,脱保护和脱阻断过程可以是更有效的,因为将仅需要单次处理来去除染料化合物和阻断基团两者。然而,在一些实施方案中,连接基和阻断基团不需要是在类似的条件下可裂解的,而是在不同的条件下单独地可裂解的。

本公开内容还涵盖掺入染料化合物的多核苷酸。这样的多核苷酸可以是分别包含以磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的DNA或RNA。多核苷酸可以包含天然存在的核苷酸、除本文描述的标记的核苷酸之外的非天然存在的(或修饰的)核苷酸或其任何组合与本文陈述的至少一种修饰的核苷酸(例如,用染料化合物标记的)的组合。根据本公开内容的多核苷酸还可以包括非天然骨架连接和/或非核苷酸化学修饰。还预期包括包含至少一种标记的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物的嵌合结构。

非限制示例性的,本文描述的标记的核苷酸包含:

其中L代表连接基,并且R代表如上文描述的糖残基。

在一些实施方案中,非限制示例性的荧光染料缀合物如下所示:

试剂盒

本公开内容还提供了包含用染料标记的修饰的核苷和/或核苷酸的试剂盒。这样的试剂盒通常将包含用本文陈述的染料标记的至少一种修饰的核苷酸或核苷以及至少一种另外的组分。另外的组分可以是在上文陈述的方法中或在下文实施例部分中鉴定的组分中的一种或多种。可以被组合到本公开内容的试剂盒中的组分的一些非限制性实例在下文中陈述。

在特定的实施方案中,试剂盒可以包含用本文陈述的染料标记的至少一种修饰的核苷酸或核苷以及修饰的或未修饰的核苷酸或核苷。例如,用根据本公开内容的染料标记的修饰的核苷酸可与以下物质组合供应:未标记的或天然的核苷酸和/或荧光标记的核苷酸或其任何组合。因此,试剂盒可以包含用根据本公开内容的染料标记的修饰的核苷酸和用其他,例如现有技术染料化合物标记的修饰的核苷酸。核苷酸的组合可以作为分开的个体组分(例如,每个容器或管一种核苷酸类型)或作为核苷酸混合物(例如,两种或更多种核苷酸混合在同一容器或管中)被提供。

在试剂盒包含用染料化合物标记的多于一种修饰的核苷酸,特别地两种、或三种、或更特别地四种修饰的核苷酸的情况下,不同的核苷酸可以用不同的染料化合物标记,或一种核苷酸可以是黑色的(没有染料化合物)。在不同的核苷酸用不同的染料化合物标记的情况下,试剂盒的特征是,这些染料化合物是光谱上可区别的荧光染料。如本文使用的,术语“光谱上可区别的荧光染料”指的是这样的荧光染料,当两种或更多种这样的染料存在于一种样品中时,它们在可以通过荧光检测设备(例如,商业化的基于毛细管的DNA测序平台)区别的波长发射荧光能量。当以试剂盒的形式提供用荧光染料化合物标记的两种修饰的核苷酸时,一些实施方案的特征是,光谱上可区别的荧光染料可以在相同的波长(诸如例如通过相同的激光)被激发。当以试剂盒形式提供用荧光染料化合物标记的四种修饰的核苷酸时,一些实施方案的特征是,光谱上可区别的荧光染料中的两种可以均在一个波长被激发,并且另两种光谱上可区别的染料可以均在另一波长被激发。特定的激发波长是488nm和532nm。

在一个实施方案中,试剂盒包含用本公开内容的化合物标记的修饰的核苷酸和用第二染料标记的第二修饰的核苷酸,其中这些染料具有至少10nm,特别地20nm至50nm的吸收最大值的差异。更特别地,两种染料化合物具有在15nm-40nm之间的斯托克斯位移(Stokes shift),其中“斯托克斯位移”是峰值吸收波长和峰值发射波长之间的距离。

在另外的实施方案中,试剂盒还可以包含用荧光染料标记的两种其他的修饰的核苷酸,其中染料通过相同的激光器在532nm处被激发。染料可以具有至少10nm,特别地20nm至50nm的吸收最大值的差异。更特别地,两种染料化合物可以具有在20nm-40nm之间的斯托克斯位移。与本公开内容的染料在光谱上可区别并且满足上文的标准的特定染料是如在美国专利第5,268,486号(例如Cy3)或WO 0226891(Alexa 532;Molecular Probes A20106)中描述的聚次甲基类似物或如在美国专利第6,924,372号中公开的不对称聚次甲基类,所述专利中的每一个通过引用并入本文。可选择的染料包括罗丹明类似物,例如四甲基罗丹明及其类似物。

在可选择的实施方案中,本公开内容的试剂盒可以包含其中相同的碱基被两种不同的化合物标记的核苷酸。第一核苷酸可以用本公开内容的化合物标记。第二核苷酸可以用光谱上不同的化合物(例如在小于600nm处吸收的‘绿色’染料)标记。第三核苷酸可以用本公开内容的化合物和光谱上不同的化合物的混合物标记,并且第四核苷酸可以是‘黑色的’并且不包含标记物。因此,简言之,核苷酸1-4可以被标记为‘蓝色’、‘绿色’、‘蓝色/绿色’和黑色。为了进一步简化仪器,四种核苷酸可以用由单激光器激发的两种染料标记,并且因此核苷酸1-4的标记可以是‘蓝1’、‘蓝2’、‘蓝1/蓝2’和黑色。

核苷酸可以包含本公开内容的两种染料。试剂盒可以包含用本公开内容的染料标记的两种或更多种核苷酸。试剂盒可以包含另外的核苷酸,其中该核苷酸用在520nm至560nm的区域内吸收的染料标记。试剂盒还可以包含未标记的核苷酸。

虽然本文中关于具有被不同的染料化合物标记的不同核苷酸的配置例示了试剂盒,但应能理解,试剂盒可以包含具有相同染料化合物的2种、3种、4种或更多种不同的核苷酸。

在特定的实施方案中,试剂盒可以包含能够催化将修饰的核苷酸掺入到多核苷酸中的聚合酶。待被包含在这样的试剂盒中的其他组分可以包括缓冲剂及类似物。用根据本公开内容的染料标记的修饰的核苷酸和包括不同核苷酸的混合物的其他任何核苷酸组分可以以在使用之前待被稀释的浓缩的形式被提供在试剂盒中。在这样的实施方案中,还可以包括合适的稀释缓冲剂。再次地,在本文陈述的方法中鉴定的组分中的一种或多种可以被包含在本公开内容的试剂盒中。

测序方法

包含根据本公开内容的染料化合物的修饰的核苷酸(或核苷)可以在任何分析方法中使用,诸如包括检测附接至核苷酸或核苷的荧光标记物(无论以其自身独立地或掺入到较大分子结构或缀合物中,或与较大分子结构或缀合物缔合)的方法。在本上下文中,术语“掺入到多核苷酸中”可以意指,5′磷酸以磷酸二酯键连接至自身可以形成较长多核苷酸链的一部分的第二(修饰的或未修饰的)核苷酸的3′羟基基团。本文陈述的修饰的核苷酸的3′末端可以或可以不以磷酸二酯键连接至另外的(修饰的或未修饰的)核苷酸的5′磷酸。因此,在一个非限制性实施方案中,本公开内容提供了检测被掺入到多核苷酸中的修饰的核苷酸的方法,该方法包括:(a)将本公开内容的至少一种修饰的核苷酸掺入到多核苷酸中,以及(b)通过检测来自被附接至所述修饰的核苷酸的染料化合物的荧光信号来检测被掺入到多核苷酸中的修饰的核苷酸。

所述方法可以包括:合成步骤(a),其中将根据本公开内容的一种或多种修饰的核苷酸掺入到多核苷酸中;以及检测步骤(b),其中被掺入到多核苷酸中的一种或多种修饰的核苷酸通过检测或定量地测量它们的荧光来检测。

本申请的一些实施方案涉及测序方法,其包括:(a)将如本文描述的至少一种标记的核苷酸掺入到多核苷酸中;以及(b)通过检测来自被附接至所述修饰的核苷酸的新的荧光染料的荧光信号来检测被掺入到多核苷酸中的标记的核苷酸。

在一个实施方案中,在合成步骤中,至少一种修饰的核苷酸通过聚合酶的作用被掺入到多核苷酸中。然而,可以使用将修饰的核苷酸连接至多核苷酸的其他方法,诸如例如,化学寡核苷酸合成或标记的寡核苷酸与未标记的寡核苷酸的连接。因此,当提及核苷酸和多核苷酸使用时,术语“掺入”可以涵盖通过化学方法以及酶方法的多核苷酸合成。

在特定的实施方案中,合成步骤被执行并且可以任选地包括将模板多核苷酸链与包含本公开内容的荧光标记的修饰的核苷酸的反应混合物一起孵育。还可以在允许在退火到模板多核苷酸链的多核苷酸链上的游离3′羟基基团和修饰的核苷酸上的5′磷酸基团之间形成磷酸二酯键的条件下提供聚合酶。因此,合成步骤可以包括如通过核苷酸与模板链的互补碱基配对指导的多核苷酸链形成。

在本方法的所有实施方案中,可以在被掺入标记的核苷酸到其中的多核苷酸链被退火到模板链的同时,或者在其中使两条链分开的变性步骤之后进行检测步骤。可以在合成步骤和检测步骤之间包括另外的步骤,例如化学或酶促反应步骤或纯化步骤。特别地,掺入标记的核苷酸的靶链可以被分离或纯化并且然后被进一步加工或在随后的分析中使用。举例而言,在合成步骤中的如本文描述的修饰的核苷酸标记的靶多核苷酸可以随后被用作标记的探针或引物。在其他实施方案中,本文陈述的合成步骤的产物可以经受另外的反应步骤,并且如果需要,这些随后步骤的产物被纯化或分离。

用于合成步骤的合适的条件对于熟悉标准分子生物学技术的人员将是熟知的。在一个实施方案中,合成步骤可以类似于标准引物延伸反应,其使用包括如本文描述的修饰的核苷酸的核苷酸前体,在合适的聚合酶的存在下形成与模板链互补的延伸的靶链。在其他的实施方案中,合成步骤本身可以形成产生标记的双链扩增产物的扩增反应的一部分,所述标记的双链扩增产物包括通过拷贝靶多核苷酸链和模板多核苷酸链获得的退火的互补链。其他示例性合成步骤包括切口平移、链置换聚合、随机引发的DNA标记等。对于合成步骤特别有用的聚合酶是能够催化如本文陈述的修饰的核苷酸的掺入的聚合酶。可以使用多种天然存在的或修饰的聚合酶。举例而言,热稳定聚合酶可以被用于使用热循环条件进行的合成反应,然而热稳定聚合酶对于等温引物延伸反应可能不是期望的。能够掺入根据本公开内容的修饰的核苷酸的合适的热稳定聚合酶包括在WO2005/024010或WO06120433(两者中的每一个通过引用并入本文)中描述的那些。在较低的温度诸如37℃进行的合成反应中,聚合酶不一定必须是热稳定聚合酶,因此聚合酶的选择将取决于许多因素,诸如反应温度、pH、链置换活性等。

在特定的非限制性实施方案中,本公开内容涵盖核酸测序、再测序、全基因组测序、单核苷酸多态性评分的方法、涉及当掺入到多核苷酸中时检测用本文陈述的染料标记的修饰的核苷酸或核苷的任何其他应用。受益于用包含荧光染料的修饰的核苷酸标记的多核苷酸的使用的多种其他应用中的任一种可以使用具有本文陈述的染料的修饰的核苷酸或核苷。

在特定的实施方案中,本公开内容提供包含根据本公开内容的染料化合物的修饰的核苷酸在多核苷酸边合成边测序反应中的用途。边合成边测序通常涉及使用聚合酶或连接酶在5′至3′方向上将一种或多种核苷酸或寡核苷酸顺序性添加至增长的多核苷酸链,以便形成与待被测序的模板核酸互补的延伸的多核苷酸链。以一种或多种添加的核苷酸存在的碱基的身份可以在检测步骤或“成像”步骤中被确定。添加的碱基的身份可以在每个核苷酸掺入步骤之后被确定。然后,模板的序列可以使用常规的沃森-克里克碱基配对法则来推导。使用用本文陈述的染料标记的修饰的核苷酸用于确定单碱基的身份例如在单核苷酸多态性的评分方面可能是有用的,并且这样的单碱基延伸反应在本公开内容的范围内。

在本公开内容的实施方案中,模板多核苷酸的序列通过经由检测被附接至掺入的核苷酸的荧光标记物来检测将一种或多种核苷酸掺入到与待被测序的模板多核苷酸互补的新生链中而确定。模板多核苷酸的测序可以用合适的引物来引发(或被制备为将包含作为发夹的部分的引物的发夹构建体),并且新生链通过在聚合酶催化的反应中将核苷酸添加至引物的3′末端以逐步方式延伸。

在特定的实施方案中,不同的核苷酸三磷酸(A、T、G和C)中的每一个可以用独特的荧光团标记并且还在3′位置处包含阻断基团以防止不受控制的聚合。可替代地,四种核苷酸中的一种可以是未标记的(黑色的)。聚合酶将核苷酸掺入到与模板多核苷酸互补的新生链中,并且阻断基团防止核苷酸的进一步掺入。任何未掺入的核苷酸可以被洗去,并且来自每一个掺入的核苷酸的荧光信号可以通过合适的手段诸如使用激光激发和合适的发射滤光器的电荷耦合装置通过光学“读取”。然后,3′阻断基团和荧光染料化合物可以被去除(脱保护)(同时地或相继地),以暴露新生链以用于另外的核苷酸掺入。通常,掺入的核苷酸的身份将在每一个掺入步骤之后被确定,但这不是严格地必要的。类似地,美国专利第5,302,509号(其通过引用并入本文)公开了对固定在固体支撑体上的多核苷酸测序的方法。

如上文例示的,所述方法利用在DNA聚合酶的存在下将荧光标记的、3′阻断的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的增长的链中。聚合酶掺入与靶多核苷酸互补的碱基,但通过3′-阻断基团来防止进一步的添加。然后,可以确定掺入的核苷酸的标记物并且阻断基团通过化学裂解去除以允许进一步的聚合发生。待在边合成边测序反应中被测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板通常将包含具有游离的3′羟基基团的双链区域,所述具有游离的3′羟基基团的双链区域在测序反应中用作用于另外的核苷酸的添加的引物或起始点。待被测序的模板的区域将使该游离的3′羟基基团悬垂于互补链上。待被测序的模板的悬垂区域可以是单链的,但可以是双链的,条件是“切口存在”于与待被测序的模板链互补的链上以提供游离3′OH基团用于引发测序反应。在这样的实施方案中,测序可以通过链置换进行。在某些实施方案中,携带游离的3′羟基基团的引物可以作为与待被测序的模板的单链区域杂交的单独组分(例如,短寡核苷酸)被添加。可选择地,引物和待被测序的模板链可以各自形成能够形成分子内双链体(duplex)(诸如例如发夹环结构)的部分地自身互补的核酸链的一部分。发夹多核苷酸和藉以可将它们附接至固体支撑体的方法在PCT公布第WO0157248号和第WO2005/047301号中公开,两个公布中的每一个通过引用并入本文。核苷酸可以被相继地添加至增长的引物,导致在5′至3′方向上合成多核苷酸链。已经被添加的碱基的性质可以特别地但不一定在每次核苷酸添加之后被确定,因此为核酸模板提供序列信息。因此,通过经由与核苷酸的5′磷酸基团形成磷酸二酯键而将核苷酸连接至核酸链的游离的3′羟基基团,核苷酸被掺入到核酸链(或多核苷酸)中。

待被测序的核酸模板可以是DNA或RNA,或者甚至包含脱氧核苷酸和核糖核苷酸的杂交分子(hybrid molecule)。核酸模板可以包含天然存在的核苷酸和/或非天然存在的核苷酸以及天然的骨架连接或非天然的骨架连接,条件是这些不阻止模板在测序反应中的复制。

在某些实施方案中,待被测序的核酸模板可以经由本领域已知的任何合适的连接方法(例如经由共价附接)被附接至固体支撑体。在某些实施方案中,模板多核苷酸可以被直接地附接至固体支撑体(例如,基于二氧化硅的支撑体)。然而,在本公开内容的其他实施方案中,固体支撑体的表面可以以某种方式被修饰,以便允许模板多核苷酸的直接共价附接,或者以便通过自身可以被非共价地附接至固体支撑体的水凝胶或聚电解质多层固定模板多核苷酸。

其中多核苷酸已经被直接地附接至基于二氧化硅的支撑体的阵列是例如在WO00006770(通过引用并入本文)中公开的那些,其中多核苷酸通过玻璃上的侧环氧基团与多核苷酸上的内部氨基基团之间的反应被固定在玻璃支撑体上。此外,多核苷酸可以通过基于硫的亲核试剂与固体支撑体的反应被附接至固体支撑体,例如,如在W02005/047301(通过引用并入本文)中描述的。固体支撑的模板多核苷酸的又一个另外的实例是其中模板多核苷酸被附接至被支撑在基于二氧化硅或其他固体支撑体上的水凝胶,例如,如在W000/31148、W001/01143、W002/12566、W003/014392,美国专利第6,465,178号和第WO00/53812号中描述的,这些专利中的每个通过引用并入本文。

可固定模板多核苷酸的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶在上文引用的参考文献中和在WO2005/065814(其通过引用并入本文)中描述。可以被使用的具体水凝胶包括在WO 2005/065814和美国公布第2014/0079923中描述的那些。在一个实施方案中,水凝胶是PAZAM(聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺))。

DNA模板分子可以被附接至珠粒或微粒,例如,如在美国专利第6,172,218号(其通过引用并入本文)中描述的。附接至珠粒或微粒对于测序应用可能是有用的。可以制备珠粒文库,其中每个珠粒包含不同的DNA序列。示例性的文库和用于产生它们的方法在Nature,437,376-380(2005);Science,309,5741,1728-1732(2005)(它们中的每个通用引用并入本文)中描述。使用本文陈述的核苷酸对这样的珠粒的阵列的测序在本公开内容的范围内。

待被测序的模板可以形成在固体支撑体上的“阵列”的一部分,在此情况下,阵列可以采取任何方便的形式。因此,本公开内容的方法可应用于所有类型的高密度阵列,包括单分子阵列、成簇的阵列和珠粒阵列。用本公开内容的染料化合物标记的修饰的核苷酸可以被用于对在基本上任何类型的阵列(包括但不限于通过使核酸分子固定在固体支撑体上形成的阵列)上的模板进行测序。

然而,用本公开内容的染料化合物标记的修饰的核苷酸在对成簇的阵列测序的背景下是特别有益的。在成簇的阵列中,阵列上的不同区域(通常被称为位点或特征)包含多个多核苷酸模板分子。通常,多个多核苷酸分子不能够通过光学手段被个体分辨而是代替地作为总体被检测。取决于如何形成阵列,阵列上的每个位点可以包含一个单独的多核苷酸分子的多个拷贝(例如,位点对于特别的单链核酸物质或双链核酸物质是同质的)或甚至小数目的不同的多核苷酸分子的多个拷贝(例如,两个不同的核酸物质的多个拷贝)。核酸分子的成簇阵列可以使用本领域通常已知的技术来产生。举例而言,WO98/44151和WO00/18957(它们中的每个被并入本文)描述了核酸扩增的方法,其中模板和扩增产物都保持固定在固体支撑体上,以便形成包含固定的核酸分子的簇或“克隆”的阵列。存在于根据这些方法制备的成簇的阵列上的核酸分子是使用本公开内容的染料化合物标记的修饰的核苷酸测序的合适的模板。

用本公开内容的染料化合物标记的修饰的核苷酸在对单分子阵列上的模板测序方面也是有用的。如本文使用的术语“单分子阵列”或“SMA”指的是分布(或排列)在固体支撑体上的多核苷酸分子的群体,其中任何单独的多核苷酸与群体中的任意个体多核苷酸的间距使得个体分辨单独的多核苷酸分子是可能的。因此,在一些实施方案中,被固定至固体支撑体的表面上的靶核酸分子可能能够通过光学手段分辨。这意指各自代表一种多核苷酸的一个或多个不同的信号将出现在所使用的特定成像装置的可分辨区域内。

可以实现单分子检测,其中阵列上相邻的多核苷酸分子之间的间距是至少100nm,更特别地至少250nm,还更特别地至少300nm,甚至更特别地至少350nm。因此,每一个分子作为单分子荧光点是个体可分辨且可检测的,并且来自所述单分子荧光点的荧光还呈现出单步光漂白。

术语“个体地分辨(individually resolved)”和“个体分辨(individualresolution)”在本文中用于说明,当可视化时,使阵列上的一个分子与其邻近的分子相区别是可能的。阵列上的个体分子之间的分离将部分地通过用于分辨个体分子的特定技术来确定。单分子阵列的一般特征将通过参考已公布的申请WO00/06770和WO01/57248来理解,它们中的每个通过引用并入本文。虽然本公开内容的修饰的核苷酸的一种用途是在边合成边测序反应中,但修饰的核苷酸的实用性不限于这样的方法。事实上,核苷酸可以被有利地用于需要检测被附接至掺入到多核苷酸中的核苷酸的荧光标记物的任何测序方法中。

特别地,用本公开内容的染料化合物标记的修饰的核苷酸可以被用于自动化荧光测序方案,特别是基于Sanger和合作者的链终止测序方法的荧光染料终止子循环测序。这样的方法通常使用酶和循环测序以将荧光标记的双脱氧核苷酸掺入到引物延伸测序反应中。所谓的Sanger测序方法以及有关的方案(Sanger型)利用已标记的双脱氧核苷酸的随机化链终止。

因此,本公开内容还涵盖用染料化合物标记的修饰的核苷酸,所述修饰的核苷酸是在3′位和2′位两处均缺少羟基基团的双脱氧核苷酸,这样的修饰的双脱氧核苷酸适于在Sanger型测序方法等方法中使用。

将认识到,掺入3′阻断基团的用本公开内容的染料化合物标记的修饰的核苷酸还可以在Sanger法和有关的方案中具有实用性,因为通过使用修饰的双脱氧核苷酸实现的相同效果可以通过使用具有3′-OH阻断基团的修饰的核苷酸来实现:两者均阻止随后核苷酸的掺入。在根据本公开内容的且具有3′阻断基团的核苷酸将被用于Sanger型测序方法的情况下,将领会,被附接至核苷酸的染料化合物或可检测的标记物不需要经由可裂解的连接基来连接,因为在本公开内容的标记的核苷酸被掺入的每种情况下;核苷酸不需要被随后掺入并且因此标记物不需要从核苷酸中去除。

实施例

在以下实施例中进一步详细地公开了另外的实施方案,这些实施例不以任何方式意图限制权利要求书的范围。

实施例1:化合物I-1:7-(3-羧基氮杂环丁烷-1-基)-3-(5-氯-苯并噁唑-2-基)香 豆素

在圆底烧瓶中将3-(5-氯-苯并噁唑-2-基)-7-氟-香豆素(0.32g,1mmol)和3-羧基氮杂环丁烷(0.2g,2mmol)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。在120℃搅拌7小时,且在室温静置1小时后,将混合物用水(15mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.25g(63%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值396.05。实测值m/z:(+)397(M+1)+;(-)395(M-1)-.

实施例2.化合物I-2:7-(3-羧基氮杂环丁烷-1-基)-3-(苯并噁唑-2-基)香豆素

在圆底烧瓶中将3-(苯并噁唑-2-基)-7-氟-香豆素(0.56h,2mmol)和3-羧基氮杂环丁烷(0.3g,3mmol)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。在125℃搅拌9小时且在室温静置1小时后,反应混合物用水(10mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.41g(56%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值362.09。实测值m/z:(+)363(M+1)+.

实施例3.化合物I-3:7-(3-羧基氮杂环丁烷-1-基)-3-(苯并咪唑-2-基)香豆素

在圆底烧瓶中将3-(苯并咪唑-2-基)-7-氟-香豆素(FC-2,0.56g,2mmol,1eq.)和3-羧基氮杂环丁烷(AC-C4,0.3g,3mmol,1.5eq)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。混合物在120℃搅拌9小时。添加额外部分的3-羧基氮杂环丁烷(0.3g,3mmol)和DIPEA(0.26g,2mmol)。在120℃再搅拌3小时,且在室温静置1小时后,反应混合物用水(10mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.26g(36%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值361.11。实测值m/z:(+)362(M+1)+;(-)360(M-1)-.

实施例4.化合物I-4:7-(3-羧基氮杂环丁烷-1-基)-3-(苯并噻唑-2-基)香豆素

在圆底烧瓶中将3-(苯并噻唑-2-基)-7-氟-香豆素(0.30g,1mmol)和3-羧基氮杂环丁烷(0.2g,2mmol)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。在120℃搅拌8小时且在室温静置1小时后,反应混合物用水(10mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.28g(75%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值378.07。实测值m/z:(+)379(M+1)+;(-)377(M-1)-.

实施例5.化合物I-5:7-(3-羧基吡咯烷-1-基)-3-(苯并噻唑-2-基)香豆素

在圆底烧瓶中将3-(苯并噻唑-2-基)-7-氟-香豆素(0.30g,1mmol)和3-羧基吡咯烷(0.23g,2mmol)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。在120℃搅拌6小时且在室温静置1小时后,反应混合物用水(20mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.31g(80%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值392.08。实测值m/z:(+)393(M+1)+;(-)391(M-1)-.

实施例6.化合物I-6:7-(4-羧基哌啶-1-基)-3-(苯并噻唑-2-基)香豆素

在圆底烧瓶中将3-(苯并噻唑-2-基)-7-氟-香豆素(0.30g,1mmol)和六氢异烟酸(0.26g,2mmol)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。在120℃搅拌6小时且在室温静置1小时后,反应混合物用水(20mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.34g(83%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值406.10。实测值m/z:(+)407(M+1)+;(-)405(M-1)-

实施例7.化合物I-7:7-(3-羧基氮杂环丁烷-1-基)-3-(6-磺基-苯并噻唑-2-基) 香豆素

在约-5℃将7-(3-羧基氮杂环丁烷-1-基)-3-(苯并噻唑-2-基)香豆素(0.38g,1mmol)添加至20%发烟硫酸(0.5mL)。将混合物在冷却下搅拌几小时,然后在室温搅拌3小时。在80℃搅拌1小时且在室温静置1小时后,反应混合物用无水乙醚(10mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产物通过HPLC纯化。产率0.1g(22%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值458.02。实测值m/z:(+)459(M+1)+.

实施例8.化合物I-8:7-(3-羧基氮杂环丁烷-1-基)-3-(6-磺酰胺基-苯并噁唑-2- 基)香豆素

在圆底烧瓶中将3-(6-磺酰胺基-苯并噁唑-2-基)-7-氟-香豆素(0.36g,1mmol)和3-羧基氮杂环丁烷(0.3g,3mmol)添加至无水二甲基亚砜(DMSO,5mL)。将混合物在室温搅拌几分钟,然后添加DIPEA(0.52g,4mmol)。在125℃搅拌9小时且在室温静置1小时后,反应混合物用水(10mL)稀释且搅拌过夜。所得沉淀通过抽吸过滤收集。产率0.26g(60%)。产物的纯度、结构和组成通过HPLC、NMR和LCMS证实。MS(DUIS):MW计算值441.06。实测值m/z:(+)442(M+1)+

实施例9.荧光强度的比较

将示例性的染料溶液(最大激发波长450nm)的荧光强度与用于同一光谱范围的标准染料相比较。所得结果如表1所示,并且展现出示例性染料用于基于荧光的分析应用的显著的优势。

表1.实施例中公开的新的荧光染料的光谱性质。

实施例10.用于合成完全官能化的核苷酸缀合物的一般程序

本文公开的香豆素荧光染料与合适的氨基-取代的腺嘌呤(A)和胞嘧啶(C)核苷酸衍生物A-LN3-NH2或C-LN3-NH2偶联:

在根据以下腺嘌呤示例性方案用合适的试剂活化染料的羧基基团后

用于腺嘌呤偶联的一般产物如在下文中示出:

ffA-LN3-染料是指具有LN3连接基和使用文本公开的香豆素染料标记的完全官能化的腺嘌呤(A)核苷酸。每个结构中的R基团是指偶联后的香豆素染料部分。

染料(10μmol)的干燥是通过将其放入5mL圆底烧瓶中,再溶解在无水的二甲基甲酰胺(DMF,1mL)中,然后在真空中蒸发掉溶剂。该过程重复两次。干燥的染料在室温,溶解于无水的N,N-二甲基乙酰胺(DMA,0.2mL)中。将N,N,N’,N’-四甲基-O-(N-琥珀酰亚胺基)脲鎓四氟硼酸酯(TSTU,1.5当量,15μmol,4.5mg)加入到染料溶液中,然后经由微量移液器向该溶液加入DIPEA(3当量,30μmol,3.8mg,5.2μL)。在氮气下密封该反应烧瓶。该反应过程通过TLC(洗脱液乙腈-水1∶9)和HPLC进行监控。同时,将适当的氨基-被取代的核苷酸衍生物的溶液(A-LN3-NH2,20mM,1.5当量,15μmol,0.75mL)在真空下进行浓缩,再将其重新溶解在水(20μL)中。将在DMA中的活化的染料的溶液转移到烧瓶中,该烧瓶包含N-LN3-NH2的溶液。加入更多的DIPEA(3eq,30μmol,3.8mg,5.2μL)和三乙基胺(1μL)。每小时通过TLC、HPLC和LCMS监控偶联的过程。当反应完成后,经由移液管将三乙基碳酸氢铵缓冲溶液(TEAB,0.05M~3mL)加入到该反应混合物中。完全官能化的核苷酸的初步纯化是通过使得已淬灭的反应混合物通过DEAE-Sephadex柱来移除大多数仍未反应的染料。例如,将倒入空置的25g Biotage填料柱(cartridge)中,溶剂体系TEAB/MeCN。在真空下浓缩自Sephadex柱得到的溶液。将余下的材料复溶在最小体积的水和乙腈中,然后经由20μm Nylon过滤器过滤。经由制备型-HPLC纯化滤得的溶液。制备的化合物的成分通过LCMS确定。

和胞嘧啶偶联的一般产物如下式所示,随后的相似过程如上所描述。

ffC-LN3-染料是指具有LN3连接基和用本文公开的香豆素染料标记的完全官能化的胞嘧啶(C)核苷酸。每个结构中的R基团是指偶联后的香豆素染料部分。

实施例11.式(I)的化合物的酰胺衍生物的制备

本文描述的一些另外的实施方案涉及式(I)的化合物的酰胺衍生物及其制备方法,该方法包括通过羧酸活化,转化式(Ia)的化合物为式(Ia′)的化合物:

且将式(Ia′)化合物与式(Am)的伯或仲胺反应,得到式(Ib)的酰胺衍生物:

其中变量X、R、R1、R2、R3、R4,和n如本文所定义;R′是羧基活化剂的残基部分(诸如N-羟基琥珀酰亚胺、硝基苯酚、五氟苯酚、HOBt、BOP、PyBOP、DCC等);RA和RB的每一个独立地为氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元-10元杂芳基、3元-10元杂环基、芳烷基、杂芳烷基、或(杂环基)烷基。

制备式(Ib)化合物的一般程序

将合适的式(Ia)的染料(0.001mol)溶解在适当的无水的有机溶剂(DMF,1.5mL)中。向该溶液加入羧基活化剂,诸如TSTU、BOP或PyBOP。在室温搅拌该反应混合物约20min,然后加入合适的胺衍生物。将该反应混合物搅拌过夜、过滤并用0.1M TEAB水溶液淬灭过量的活化剂。在真空中蒸发掉溶剂,并且将残留物复溶于TEAB溶液中,再经过HPLC纯化。

实施例12.两通道测序应用

在双通道检测方法中证明了在测序应用中用本文所述的新染料标记的A核苷酸的效率。关于本文所述的双通道方法,可以利用美国专利申请号2013/0079232中描述的方法和系统对核酸进行测序,该专利申请的公开内容通过引用整体并入本文。

在双通道检测中,可以通过提供在第一通道中检测到的第一核苷酸类型,在第二通道中检测到的第二核苷酸类型,在第一和第二通道中检测到的第三核苷酸类型,以及在两个通道中均未检测到的或最少检测到的缺少标记的第四核苷酸类型,来对核酸进行测序。散点图是通过对实验的RTA2.0.93分析生成的。图1至图3中所示的散点图是在26个循环运行中每一个的第5循环。

图1示出包含以下的完全官能化的核苷酸(ffN)混合物的散点图:A-I-4(0.5μM)、A-NR550S0(1.5μM)、C-NR440(2μM)、黑色G(2μM)和T-AF550POPOS0(2μM)在具有Pol812的掺合缓冲液中。蓝色暴露(通道1)500ms,绿色暴露(通道2)1000ms;在扫描混合中扫描)。

图2示出包含以下的完全官能化的核苷酸(ffN)混合物的散点图:A-I-5(1μM)、A-NR550S0(1μM)、C-NR440(2μM)、黑色G(2μM)和T-AF550POPOS0(2μM)在具有Pol812的掺合缓冲液中。蓝色暴露(通道1)500ms,绿色暴露(通道2)1000ms;在扫描混合中扫描。

图3示出包含以下的完全官能化的核苷酸(ffN)混合物的散点图:A-I-6(1μM)、A-NR550S0(1μM)、C-NR440(2μM)、黑色G(2μM)和T-AF550POPOS0(2μM)在具有Pol812的掺合缓冲液中。蓝色暴露(通道1)500ms,绿色暴露(通道2)1000ms;在扫描混合中扫描。

在图1-3每个中,“G”核苷酸是未标记的,并显示为左下黑斑(cloud)(“黑色G”)。来自由本文所述的新染料标记的“A”核苷酸和绿色染料(NR550S0)的混合物的信号在图1-3中分别显示为右上方的黑斑。来自用染料AF550POPOS0标记的“T”核苷酸的信号由左上方的黑斑指示,而来自由染料NR440标记的“C”核苷酸的信号由右下方的黑斑指示。X轴显示一个(蓝色)通道的信号强度,Y轴显示另一个(绿色)通道的信号强度。NR440、AF550POPOS0和NR550S0的化学结构分别在PCT公开号WO2018060482A1、WO2017051201A1和WO2014135221A1中公开,所有这些文献均通过引用并入本文。

图1-3各自显示,标记有本文所述新型染料的完全官能的A-核苷酸缀合物提供了足够的信号强度和极好的黑斑分离。

41页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:香槟色调的金属效应颜料

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!