高强度标记的反应物组合物和测序方法

文档序号:1803571 发布日期:2021-11-05 浏览:22次 >En<

阅读说明:本技术 高强度标记的反应物组合物和测序方法 (High-strength labeled reactant compositions and sequencing methods ) 是由 乔纳森·M·罗斯伯格 杰瑞米·雷克伊 布莱恩·瑞德 施兴华 黄海冬 大卫·达德 于 2020-01-23 设计创作,主要内容包括:提供了可用于检测样品中单个分子的组合物。在一些方面,本公开提供了与包含FRET标记的核酸连接的核苷酸,所述FRET标记包含至少三个发光分子。在一些实施方案中,本文所述的核酸包含一种或多种提供增强的荧光强度的结构特征。在一些方面,提供了使用本公开的标记的核苷酸进行测序的方法。(Compositions are provided that can be used to detect a single molecule in a sample. In some aspects, the disclosure provides a nucleotide linked to a nucleic acid comprising a FRET label comprising at least three luminescent molecules. In some embodiments, a nucleic acid described herein comprises one or more structural features that provide enhanced fluorescence intensity. In some aspects, methods of sequencing using the labeled nucleotides of the present disclosure are provided.)

高强度标记的反应物组合物和测序方法

相关申请

本申请依据35 U.S.C.§119(e)要求2019年1月23日提交的美国临时专利申请号62/795,932的优先权,其全部内容通过引用并入本文。

技术领域

本申请一般涉及明亮标记的反应物组合物和使用其检测单个分子的方法。

背景技术

新一代测序技术的进步使得对单个分子进行大规模并行分析成为可能,这从根本上改变了生命科学研究的格局。其中一些技术涉及使用发光标记的反应成分实时监测生物反应。用光源照射标记以引起发光,并用光电检测器检测发光。可以记录和分析这些事件,以根据相应的发光特性识别各个反应成分。在多种类型中识别特定类型的标记分子时,关键是每种类型都具有独特且易于识别的发光特性。此外,例如激发源功率和仪器整体尺寸的这些参数可以决定仪器要求。

发明内容

本文公开的技术的方面涉及包含FRET标记的标记反应组分,所述FRET标记包含三个或更多个发光分子,包括至少一个供体分子和至少一个受体分子。在一些实施方案中,本申请涉及标记的核苷酸,所述标记的核苷酸包含与核酸连接的核苷多磷酸,所述核酸包含FRET标记,所述FRET标记包含至少三个发光分子,所述至少三个发光分子包括至少一个供体分子和至少一个受体分子。本文公开的技术的其他方面涉及标记的反应组分,所述标记的反应组分包含两个或更多个发光标记,所述发光标记被接头(例如,受限接头)分隔。在一些实施方案中,本申请涉及将发光标记分隔以防止由于标记-标记相互作用引起的可检测信号的衰减。在一些方面,本申请提供标记的核苷酸,其包含通过接头与两个或更多个发光标记连接的核苷酸(例如,核苷多磷酸)。在一些方面,本申请提供了用于对模板核酸进行测序的组合物、方法和试剂盒。

在一些方面,本申请提供了标记的核苷酸,其包含与FRET标记连接的核苷酸(例如,核苷多磷酸),所述FRET标记包含至少三个发光分子,所述至少三个发光分子包括至少一个供体分子和至少一个受体分子。在一些实施方案中,本公开的接头可用于提供具有FRET标记的核苷酸(例如,核苷多磷酸)。在一些实施方案中,所述标记的核苷酸的标记是FRET标记,其可以通过接头或作为接头的一部分连接到所述核苷多磷酸。在一些实施方案中,所述接头是核酸接头。

在一些实施方案中,所述核苷酸被配置为用作聚合反应中的底物。

在一些实施方案中,本申请的标记的核苷酸包含FRET标记,该标记包含的供体分子与受体分子的比例为1:1。在一些实施方案中,所述供体分子与受体分子的比例大于1:1(如1.5:1、2:1、2.5:1、3:1、3.5:1、4:1或更高)。在一些实施方案中,所述受体分子与供体分子的比例大于1:1(如1.5:1、2:1、2.5:1、3:1、3.5:1、4:1或更高)。在一些实施方案中,FRET标记包含至少两个供体分子和至少一个受体分子。在一些实施方案中,FRET标记包含两个供体分子和一个受体分子。在一些实施方案中,FRET标记包含三个供体分子和一个受体分子。在一些实施方案中,FRET标记包含四个供体分子和一个受体分子。在一些实施方案中,FRET标记包含四个供体分子和两个受体分子。在一些实施方案中,FRET标记包含至少一个供体分子和至少两个受体分子。在一些实施方案中,FRET标记包含两个受体分子和一个供体分子。在一些实施方案中,FRET标记包含三个受体分子和一个供体分子。在一些实施方案中,FRET标记包含四个受体分子和一个供体分子。

在一些实施方案中,本申请的标记的核苷酸包含FRET标记,该标记包含至少三个以最小距离彼此分隔的发光标记。例如,在一些实施方案中,每个供体分子和受体分子相隔至少1nm。在一些实施方案中,每个供体分子和受体分子相隔约1-3nm。在一些实施方案中,每个供体分子和受体分子相隔3-13个碱基。在一些实施方案中,每个供体分子和受体分子相隔3-6个碱基。在一些实施方案中,每个供体分子和受体分子相隔3、4、5、6、7、8、9、10、11、12或13个碱基。

在一些实施方案中,FRET标记的每个供体分子和受体分子对具有至少80%(例如至少85%、至少90%或至少95%)的FRET效率。

在一些方面,本申请提供标记的核苷酸,其包含通过接头与两个或更多个发光标记连接的核苷酸(例如,核苷多磷酸)。在一些实施方案中,所述核苷酸被配置为用作聚合反应中的底物。在一些实施方案中,本申请的标记的核苷酸包含至少两个或更多个以最小距离彼此分隔的发光标记。在一些实施方案中,每个发光标记与任何其他发光标记相隔至少5埃。在一些实施方案中,每个发光标记与任何其他发光标记相隔至少5、至少10、至少15、至少20、至少25、至少30、至少40或至少50埃。在一些实施方案中,每个发光标记包括与任何其他发光标记的质心相隔至少5埃的质心。

在一些实施方案中,本申请的标记的核苷酸包含一个或多个通过间隔分子与接头连接的发光标记。在一些实施方案中,间隔分子将发光标记连接到接头上的连接位点。在一些实施方案中,发光标记通过间隔分子连接到接头上,该间隔分子在发光标记和接头上的连接位点之间包含至少8个连续原子。在一些实施方案中,间隔分子在发光标记和接头上的连接位点之间包含少于50个、少于40个、少于30个或少于20个连续原子。在一些实施方案中,发光标记被整合到接头中。

在一些实施方案中,接头是寡聚物(例如,寡聚物接头或聚合物接头)。在一些实施方案中,寡聚物包含单体单元。在一些实施方案中,寡聚物包含两种或更多种不同类型的单体单元。在一些实施方案中,寡聚物包含多个相同类型的单体单元(例如,寡聚物是一种类型单体单元的聚合物)。在一些实施方案中,寡聚物包括具有多个第一类型单体单元的第一区域和具有多个第二类型单体单元的第二区域。在一些实施方案中,寡聚物包含多个不同区域(例如,2、3、4、5或更多个),每个区域包含多个不同类型的单体单元。在一些实施方案中,寡聚物包含至少5个单体单元。在一些实施方案中,寡聚物包含至少10个单体单元。在一些实施方案中,寡聚物包含少于150个、少于100个或少于50个单体单元(例如,至少5个单体单元且少于200、150、100、75、50或25个单体单元;至少10个单体单元且少于200、150、100、75、50或25个单体单元)。

在一些实施方案中,其中接头是寡聚物(例如,寡聚物接头、聚合物接头),每个发光标记或分子与每个其他标记被至少5个单体单元的寡聚物隔开。在一些实施方案中,第一发光标记或分子在第一位置整合到接头中,第二发光标记或分子在第二位置整合到接头中或与之相连,所述第一位置与第二位置相隔至少5个单体单元。在一些实施方案中,其中相邻的发光标记或分子被整合到接头中,所述标记可以被少于5个单体单元隔开。在一些实施方案中,每个发光标记或分子在连接位点处连接至接头,该连接位点与任何其他连接位点相隔至少5个单体单元(例如,至少6个、至少8个、至少10个、至少12个、至少14个、至少16个、至少18个、至少20个或更多个单体单元)。在一些实施方案中,每个发光标记或分子连接在连接位点处,该连接位点与任何其他连接位点相隔至少5个单体单元且少于40个单体单元(例如少于38个、少于36个、少于34个、少于32个、少于30个、少于28个、少于26个、少于24个、少于22个或少于20个单体单元)。在一些实施方案中,发光标记或分子被整合到寡聚物的两个连续单体单元之间的接头中(例如共价连接寡聚物的两个相邻单体单元)。

在一些实施方案中,接头足够刚性以防止连接至接头的两个或更多个发光标记或分子之间的相互作用。在一些实施方案中,接头的刚性足以保持每个标记相对于它们作为连接到同一接头上的单个标记存在时的强度的至少75%、至少80%、至少85%、至少90%、至少95%、例如95-100%(例如,约95%、约96%、约97%、约98%、约99%、约100%)。

在一些实施方案中,所述接头是肽。在一些实施方案中,肽的氨基酸组成提供结构刚性(例如,由于肽接头中存在一个或多个聚脯氨酸片段)。在一些实施方案中,90%或更多(例如,全部)的肽接头由聚脯氨酸聚合物组成。在一些实施方案中,通过由化学修饰限制肽来提供肽刚性。例如,在一些实施方案中,肽包含一个或多个环化片段。在一些实施方案中,肽是环化肽(例如,订书肽(stapled peptide)、端对端环化肽等)。在一些实施方案中,可以通过并入一种或多种刚性氨基酸聚合物片段和一种或多种化学修饰的氨基酸聚合物片段的组合来提供足够的肽刚性。

在一些实施方案中,接头是多糖(例如,肝素、硫酸肝素、聚葡萄糖、聚乳糖、氨基糖苷、N-乙酰氨基糖苷及其组合)。

在一些实施方案中,所述接头是核酸。在一些实施方案中,核酸包括脱氧核糖核酸(DNA)、核糖核酸(RNA)、肽核酸(PNA)、锁核酸(LNA)或其衍生物。在一些实施方案中,通过使用一个或多个双链核酸片段(例如,分隔两个或多个不同标记)来提供足够的刚性。在一些实施方案中,足够的刚性由核酸(例如单链或双链核酸,或包含一个或多个单链和一个或多个双链片段的核酸)的一种或多种化学修饰提供。在一些实施方案中,核酸包含一个或多个双链片段和一个或多个化学修饰片段的组合。

在一些实施方案中,核酸包含一个或多个单链和一个或多个双链片段的组合。在一些实施方案中,单链片段可以环的形式存在(例如,如在本文别处描述的茎环二级结构中)。在一些实施方案中,单链片段以双链片段内的未配对区域的形式存在。例如,内部环可在双链片段内形成,其中一条链的一个或多个碱基不与另一条链的一个或多个相邻碱基形成碱基配对相互作用。未配对区域的另一实例包括凸环(bulge loop),其可在双链片段内形成,其中一条链相对于另一条链包含一个或多个额外碱基。在一些实施方案中,单链区域和双链区域赋予结构刚性。

在一些实施方案中,单链区域(例如,未配对区域)的长度为至少2个碱基(例如,2、3、4、5、6、7、8、9、10或更多个碱基长)。在一些实施方案中,单链区域的长度为2-10个碱基(例如,2-8、4-10或4-8个碱基长)。在一些实施方案中,双链区域的长度为2-40个碱基(例如,2-20、2-10、10-40、10-30、10-20、20-40或20-30个碱基长)。

在一些实施方案中,所述核酸包含一个或多个茎环结构(例如,2、3、4、5、6个或更多个茎环结构)。在一些实施方案中,FRET标记的至少一个供体分子位于茎环结构的环中。在一些实施方案中,FRET标记的至少一个受体分子位于茎环结构的环中。在一些实施方案中,每个茎环的环区域包含至少4个未配对碱基(例如,4、5、6、7、8个或更多个未配对碱基)。在一些实施方案中,每个茎环的环区域包含具有小于33%G/C含量的序列。

在一些实施方案中,FRET标记的至少一个受体分子位于FRET标记的一个或多个供体分子的5’侧。例如,在一些实施方案中,至少一个受体分子位于连接位点处,所述连接位点在一个或多个供体分子上游(5')一个或多个碱基处。在一些实施方案中,FRET标记的至少一个受体分子位于FRET标记的一个或多个供体分子的3’侧。例如,在一些实施方案中,至少一个受体分子位于连接位点处,所述连接位点在一个或多个供体分子下游(3')一个或多个碱基处。

在一些实施方案中,核酸包含连接到两个或更多个发光标记的第一寡核苷酸链。在一些实施方案中,两个或更多个发光标记连接在第一寡核苷酸链上的两个或更多个连接位点处。在一些实施方案中,FRET标记的三个或更多个发光分子连接在第一寡核苷酸链上的三个或更多个连接位点处。在一些实施方案中,每个发光标记或分子包含具有中心点的空间体积,该中心点与任何其他发光标记或分子的中心点相隔至少5埃。例如,在一些实施方案中,每个发光标记或分子包含具有中心点的空间体积,该中心点与任何其他发光标记或分子的中心点相隔至少6埃、约5-10埃、约6-10埃、约10-15埃、约15-20埃、约20-25埃或约25-50埃。

在一些实施方案中,核酸进一步包含与第一寡核苷酸链杂交的第二寡核苷酸链。在一些实施方案中,第一寡核苷酸链与核苷酸(例如,核苷多磷酸)连接。在一些实施方案中,第二寡核苷酸链与核苷酸(例如,核苷多磷酸)连接。在一些实施方案中,FRET标记的至少一个发光分子与其他发光分子位于不同的链上。在一些实施方案中,受体分子与一个或多个供体分子在不同的链上。在一些实施方案中,至少一个供体分子和至少一个受体分子在核酸的同一条链上。

在一些实施方案中,两个或更多个连接位点在第一寡核苷酸链上彼此相隔至少5个碱基(例如,至少5个核苷酸)。在一些实施方案中,两个或更多个连接位点在第一寡核苷酸链上彼此相隔至少5个且少于40个碱基(例如,约5-30个碱基、约5-20个碱基、约5-10个碱基、约10-40个碱基、约20-40个碱基、或约30-40个碱基)。在一些实施方案中,每个连接位点在第一寡核苷酸链上与鸟嘌呤或胞嘧啶相隔至少2个碱基。在一些实施方案中,每个连接位点出现在第一寡核苷酸链上的无碱基位点处。在一些实施方案中,每个连接位点出现在第一寡核苷酸链上的核苷酸的核碱基处。在一些实施方案中,核碱基选自A、T或U核碱基。

在一些实施方案中,第一寡核苷酸链形成一个或多个(例如,1、2、3、4或更多个)茎环。在一些实施方案中,每个茎环的环区域包含两个或更多个连接位点的连接位点。在一些实施方案中,每个茎环的环区域包含至少4个未配对碱基(例如,4、5、6、7、8个或更多个未配对碱基)。在一些实施方案中,环区域包含具有小于33%G/C含量的序列(例如,核苷酸序列)。

在一些方面,本公开的标记的核苷酸包含核酸接头,所述核酸接头包含在第一寡核苷酸链的末端连接至两条或更多条分支寡核苷酸链的第一寡核苷酸链。在一些实施方案中,第一寡核苷酸链通过共价偶联化合物连接至两条或多条分支寡核苷酸链。在一些实施方案中,每条分支寡核苷酸链包含至少一个发光标记。在一些实施方案中,第一寡核苷酸链与第二寡核苷酸链杂交。在一些实施方案中,第二寡核苷酸链与核苷酸(例如,核苷多磷酸)连接。在一些实施方案中,每条分支寡核苷酸链还与互补分支寡核苷酸链杂交。

在一些实施方案中,所述共价偶联化合物具有以下结构:

其中Nf是第一寡核苷酸链;Nb是分支寡核苷酸链;Rf和Rb各自彼此独立为键或选自由以下组成的组的连接基团:取代或未取代的亚烷基;取代或未取代的亚烯基;取代或未取代的亚炔基;取代或未取代的杂亚烷基;取代或未取代的杂亚烯基;取代或未取代的杂亚炔基;取代或未取代的亚杂环基(heterocyclylene);取代或未取代的亚碳环基(carbocyclylene);取代或未取代亚芳基;取代或未取代的杂亚芳基;及其组合;并且O的每个实例都是相邻寡核苷酸链的5′磷酸基团或3′羟基基团的氧原子。

在一些方面,本公开的标记的核苷酸包含核酸接头,所述核酸接头包含第一寡核苷酸组分,所述第一寡核苷酸组分包含从共价偶联化合物延伸的三个或更多个寡核苷酸链(例如,3、4、5、6或更多个寡核苷酸链)。在一些实施方案中,三个或更多个寡核苷酸链与核苷酸(例如,核苷多磷酸)连接。在一些实施方案中,第一寡核苷酸组分与第二寡核苷酸组分杂交。在一些实施方案中,第二寡核苷酸组分包含至少一条与发光标记连接的寡核苷酸链。

在一些实施方案中,本公开的标记的核苷酸用荧光染料发光标记。在一些实施方案中,荧光染料是罗丹明染料、BODIPY染料或花青染料。

在一些实施方案中,本公开的标记的核苷酸包含与两种或更多种发光标记的任一种发光标记相隔至少1nm的核苷酸(例如,核苷多磷酸)。在一些实施方案中,核苷酸与两种或更多种发光标记中的任一种发光标记相隔约1-10nm(例如,约2-10纳米、约4-10纳米、约6-10纳米或约8-10纳米)。在一些实施方案中,核苷酸与两种或更多种发光标记中的任一种发光标记相隔约2-10nm(例如,约6-20纳米、约10-20纳米、约12-20纳米或约16-20纳米)。

在一些方面,本公开提供了确定模板核酸序列的方法。在一些实施方案中,该方法包括包含将目标体积中的复合物暴露于本申请提供的多种类型的发光标记的核苷酸的步骤,该复合物包含模板核酸、引物和聚合酶。在一些实施方案中,多种类型的发光标记的核苷酸中的一种或多种(例如,一种、两种、三种、四种或更多种类型的标记的核苷酸)包含连接到FRET标记的核苷酸,所述FRET标记包含至少三个发光分子,包括至少一个供体分子和至少一个受体分子。每种类型的核苷酸的FRET标记可从多个标记的核苷酸中区分出来(例如,一种类型的FRET标记的核苷酸与所有其他类型的FRET标记的核苷酸和/或不经历FRET的标记区分开来)。在一些实施方案中,多种类型的发光标记的核苷酸中的一种或多种包含通过接头连接到两个或更多个发光标记的核苷酸(例如,核苷多磷酸)。在一些实施方案中,接头是包含至少10个单体单元的寡聚物。在一些实施方案中,每个发光标记在连接位点处与接头连接,该连接位点与任何其他连接位点相隔至少5个单体单元。例如,在一些实施方案中,连接位点与任何其他连接位点相隔约5-30个单体单元、约5-20个单体单元、约5-10个单体单元、约10-40个单体单元、约20-40个单体单元或约30-40个单体单元。在一些实施方案中,每个发光标记与任何其他发光标记相隔至少5埃。例如,在一些实施方案中,每个发光标记与任何其他发光标记相隔约5-10埃、约6-10埃、约10-15埃、约15-20埃、约20-25埃或约25-50埃。因此,在一些方面,本公开提供了利用本文所述的任何发光标记的核苷酸的核酸测序方法。

在一些实施方案中,该方法还包括将具有一个或多个激发能量的一系列脉冲导向目标体积附近的步骤。在一些实施方案中,该方法还包括在依次并入包含引物的核酸期间检测来自发光标记的核苷酸的多个发射光子的步骤。在一些实施方案中,该方法还包括通过确定发射光子的时间和任选的发光强度和/或亮度来鉴定并入的核苷酸序列的步骤。在一些实施方案中,该方法还包括基于发射光子通过确定发光强度和/或发光寿命中的至少一个来鉴定并入的核苷酸的序列的步骤。

在一些实施方案中,反应混合物中的四种不同类型的核苷酸(例如,腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶/尿嘧啶)可以各自用一种或多种发光分子标记(例如,具有两种或更多种发光标记,如本文所述)。在一些实施方案中,每种类型的核苷酸可连接至一个以上的相同发光分子(例如,连接至核苷酸的两种或更多种相同荧光染料)。在一些实施方案中,每个发光分子可以连接至一个以上的核苷酸(例如,两个或更多个相同的核苷酸)。在一些实施方案中,一个以上的核苷酸可连接(例如,通过本文所述的接头)至一个以上的发光分子。

在一些实施方案中,一组四个核苷酸中的发光标记可以选自包含芳族或杂芳族化合物的染料,并且可以是芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、噁唑、咔唑、噻唑、苯并噻唑、菲啶、吩噁嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明、或其他类似化合物。染料的实例包括呫吨染料,例如荧光素或罗丹明染料、萘染料、香豆素染料、吖啶染料、花青染料、苯并噁唑染料、二苯乙烯染料、芘染料、酞菁染料、藻胆蛋白染料、方酸染料、BODIPY染料等。

在一些方面,本申请提供了用于对模板核酸进行测序的试剂盒。在一些实施方案中,试剂盒包含如本文所述的多种类型的发光标记的核苷酸。在一些实施方案中,每种类型的标记的核苷酸包含通过接头连接到一个或多个核苷酸(例如,一个或多个核苷多磷酸)的两个或多个发光标记。在一些实施方案中,所述试剂盒还包含聚合酶。在一些实施方案中,所述试剂盒还包含与被测序的模板核酸互补的引物。

在一些方面,本申请提供核酸测序反应组合物。在一些实施方案中,所述组合物在反应混合物中包含两种或更多种(例如,2、3、4或更多种)不同类型的发光标记的核苷酸。在一些实施方案中,每种类型的发光标记的核苷酸包含根据本申请的标记的核苷酸。在一些实施方案中,所述组合物还包含聚合酶。在一些实施方案中,所述组合物还包含模板核酸。在一些实施方案中,所述组合物还包含与模板核酸互补的引物。

在一些方面,本申请提供了根据图11A中所示结构的任一种的标记的核苷酸。在一些方面,本申请提供了根据图11E中所示结构的任一种的标记的核苷酸。在一些方面,本申请提供了根据图12中所示结构的任一种的标记的核苷酸。在一些方面,本申请提供了根据图13A-13C中任一结构的标记的核苷酸。

附图说明

本领域技术人员将理解,本文所述的图仅用于说明目的。应当理解,在某些情况下,本发明的多个方面可能被夸张或放大示出以促进对本发明的理解。在附图中,相同的附图标记在各个附图通常表示相同的特征、功能相似和/或结构相似的元素。附图不一定按比例绘制,而是重点放在说明本教导的原理上。附图无意以任何方式限制本教导的范围。

本发明的特征和优点将从以下结合附图进行的详细描述中变得更加明显。

当参考附图描述实施方案时,可以使用方向参照(“上方”、“下方”、“顶部”、“底部”、“左”、“右”、“水平”、“垂直”等)。此类参照仅旨在帮助读者以正常方向查看附图。这些方向参照并非旨在描述具体设备的优选或唯一取向。设备可以具有其他取向。

从详细描述中可以明显看出,附图(例如图1-10)中描绘的实例以及在整个申请中出于说明目的进一步描述的实例描述了非限制性实施方案,并且在某些情况下可以为了更清楚说明的目的简化某些过程或省略特征或步骤。

图1A是一般地描绘明亮标记反应物上的发光标记分离的图。

图1B描绘了具有不同发光标记连接构型的通用接头结构。

图2A是一般地描绘与两个发光标记连接的核酸接头的图。

图2B描绘了具有不同链构型的通用核酸(顶部)和一般地描绘发光标记空间占用的图(底部)。

图2C描绘了具有不同相对标记连接位点(顶部)和不同反应物连接性(底部)的通用核酸。

图3A描绘了通过相同(左)或相反(右)寡核苷酸链连接性将标记连接到反应物的通用核酸。

图3B描绘了具有可用于设计明亮标记的反应物的近似尺寸限制的实例的通用核酸。

图3C是通过相同链连接将两个发光标记与核苷多磷酸连接的核酸的实例结构。

图3D描绘了测序反应的实例,其证实杆状核酸接头(例如如图3C所示)可用于检测标记的核苷多磷酸的并入。

图3E是通过相反链连接将两个发光标记与核苷多磷酸连接的核酸的实例结构。

图3F是具有并入到寡核苷酸链中的发光标记的核酸接头的实例结构。

图3G描绘了使用所示四种不同核酸接头构建体进行的测序反应的实例。

图4A描绘了具有单个茎环二级结构的通用核酸接头。

图4B描绘了具有多个茎环二级结构的通用核酸接头。

图4C是具有连接在单独茎环二级结构的环处的发光标记的核酸接头的实例结构。

图4D描绘了测序反应的实例,其证实了具有茎环核酸接头(例如,如图4C所示)的标记的核苷多磷酸可用于检测核苷多磷酸的并入。

图5A一般地描绘了具有连接到发光标记的分支寡核苷酸链的树状核酸接头。

图5B是具有连接在单独分支寡核苷酸链的末端的发光标记的树状核酸接头的实例。

图6A一般地描绘了星形核酸接头并提供了可用于设计星形核酸接头的近似尺寸限制的实例。

图6B是星形核酸接头的实例结构。

图6C是具有四面体核心的核酸接头的实例结构。

图6D描绘了可用于合成具有四面体核心的核酸接头的反应方案的实例。

图6E一般地描绘了基于四面体的核酸接头结构,其具有在三向连接点处连接的发光标记。

图6F一般地描绘了星形核酸接头并提供了可用于设计星形核酸接头的近似尺寸限制的实例。

图7一般地描绘了产生基于环糊精的核酸接头的方法,所述核酸接头具有在三向连接点处连接的发光标记。

图8描绘了在评估间隔物长度对荧光寿命测量的影响的一组实验中所用的核酸接头结构的实例。

图9描绘了在评估接头限制对荧光寿命测量的影响的一组实验中所用的核酸接头结构的实例。

图10描绘了在评估间隔物长度对受限接头中荧光寿命的影响的一组实验中所用的核酸接头结构的实例。

图11A描绘了具有常规发光标记(上图)与大斯托克斯位移(Stokes shift)发光标记(下图)的FRET核酸接头结构的实例。如图所示,由于用于激光抑制的光谱滤波器,大斯托克斯位移伴随着亮度损失的减少。供体分子显示为浅灰色太阳,受体分子显示为黑色太阳。核苷酸(例如,核苷多磷酸)显示为灰色圆圈。

图11B描绘了使用FRET核酸接头结构进行的实例测序反应。供体分子显示为浅灰色太阳,受体分子显示为黑色太阳。核苷酸(例如,核苷多磷酸)显示为灰色圆圈。

图11C描绘了具有常规发光标记(顶部)与大斯托克斯位移发光标记(底部)的FRET核酸接头结构的发光寿命和发光强度簇的实例。

图11D描绘了光谱滤波器对FRET核酸接头结构的不同影响的实例。

图11E描绘了FRET核酸接头结构的不同构型。供体分子显示为浅灰色太阳,受体分子显示为黑色太阳。核苷酸(例如,核苷多磷酸)显示为灰色圆圈。

图11F描绘了使用具有多个供体发光标记的FRET核酸接头结构进行的实例测序反应。供体分子显示为浅灰色太阳,受体分子显示为黑色太阳。核苷酸(例如,核苷多磷酸)显示为灰色圆圈。

图12描绘了具有线性核酸的FRET核酸接头结构的实例,其中受体分子在中心(A)并且在两侧有两个供体分子(D)。

图13A-13C描绘了具有间隔物的FRET核酸接头结构,间隔物包含不同数量的AT对以分离和GC对以稳定供体(D)和受体分子(A)之间以及标记周围的核酸部分。

图14描绘了确定ATRho6GC3-BODIPY576对之间的最佳距离的研究结果,其中ATRho6GC3作为供体(浅灰色圆圈)和BODIPY576作为受体(深灰色圆圈)。

图15描绘了线性DNA核酸构型和三向DNA连接点构型中发光分子与核苷酸之间的距离的比较。

图16描绘了供体分子:受体分子比例对FRET效率的影响,其中Cy3作为供体并且Cy5作为受体。

图17描绘了不同FRET核酸接头结构对FRET效率的影响的实例。

具体实施方式

在其他方面,本公开提供了包含两个或更多个标记的发光标记的反应物,其中标记被配置为提供高强度和/或一致的发射特性(例如,一致的发射寿命)。在一些实施方案中,两个或更多个标记被配置为避免可能降低发射强度或其他发射特性的标记-标记相互作用。在一些实施方案中,两个或更多个标记被配置为a)避免与接头的相互作用,和/或b)各自与接头具有相似的相互作用。

在一些方面,本公开提供了与具有高发射强度的发光标记的反应物相关的方法和组合物。在一些方面,本公开提供了与具有高发射亮度的发光标记的反应物相关的方法和组合物。在一些方面,本公开涉及具有一致的发射寿命的亮标记反应物。如本文所用,在一些实施方案中,“亮度”(及其变体,例如“明亮的”、“明亮地”等)是指报告每个标记反应物分子的平均发射强度的参数。因此,在一些实施方案中,“发射强度”可用于一般指包含亮标记反应物的组合物的亮度。在一些实施方案中,标记反应物的亮度等于其量子产率和消光系数的乘积。在一些实施方案中,本公开的标记反应物被设计成最大化量子产率和/或最小化消光系数值以促进增加的亮度。

在一些实施方案中,本公开的亮标记反应物被设计成具有增加的发射亮度和一致的发射寿命。在一些实施方案中,反应物的两个标记可以彼此和/或与周围环境相互作用,使得两个标记之间的一种或多种发射特性不一致。在一些实施方案中,不一致的发射特性可能是有问题的,其中单分子检测方法依赖于这些特性来识别某种类型的分子。例如,在一些实施方案中,不一致的发射寿命会导致寿命读数报告两个单独的信息集群,而不是一致的发射寿命下观察到的单个信息分组。

在一些实施方案中,一致的发射寿命可以涉及保持发射寿命,例如,相对于具有少一个标记的标记反应物,具有大致不变的发射寿命。在一些实施方案中,多重标记反应物中标记的发射寿命相对于单一标记反应物中的相同标记没有改变。如本文所述,在一些实施方案中,增加单个构建体上的发光标记的数量以增加亮度可导致发射寿命减少。在一些实施方案中,本公开提供了使用特定结构限制设计的组合物,以将相邻标记分开一定的最小距离,这增加了亮度而不影响发射寿命。在一些实施方案中,将多重标记构建体的发射寿命与具有至少少一个发光标记(例如至少少一个相同类型的荧光团染料)的构建体的发射寿命进行比较。在一些实施方案中,发射寿命改变了约30%或更少(例如,增加或减少了少于30%、少于25%、少于20%、少于15%、少于10%、少于5%、少于4%、少于3%、少于2%、少于1%或约0%)。

在一些方面,本公开涉及对测序反应中的可检测组合物可以被开发以消除对某些仪器组件的需要的认识和理解,从而将技术推向更紧凑的系统。例如,测序仪器通常需要滤光器来过滤激发光,以免在传感器处引起不希望的检测事件。用于传输所需发光并充分阻挡激发光的滤光片可能很厚、体积大、价格昂贵且不允许光入射角的变化,从而阻碍了小型化。然而,发明人认识到并理解使用具有持久寿命(preserved lifetime)的亮标记反应物可以减少对这种过滤的需要,或者在一些情况下,完全消除对这种过滤器的需要。本文所述的亮反应物允许使用较少的光功率(例如,激发能量),因此减少了散射和过滤的需要。

本申请的多个方面提供了根据图1A中所示的非限制性图配置的亮标记反应物,该非限制性图描绘了通过接头100连接到反应物180的两个发光标记。如图所示,每个发光标记通过间隔物连接到接头100。在一些实施方案中,间隔物在标记和接头之间形成共价桥。因此,在一些实施方案中,间隔物既不是发光分子的一部分,也不是接头组合物的间隔物部分(例如,间隔物不包含聚合物接头或寡聚物接头的单体单元)。间隔物的第一端连接到接头连接位点102,并且间隔物的第二端连接到标记连接位点122。在一些实施方案中,接头连接位点102可以通过将间隔物的原子与接头100的原子连接的共价键的位置来近似。在一些实施方案中,接头连接位点102出现在接头100的连续链内的原子处。在一些实施方案中,标记连接位点122可以通过将间隔物的原子与标记的原子连接的共价键的位置来近似。在一些实施方案中,标记连接位点122出现在与间隔物原子共价结合的标记的原子处。在一些实施方案中,标记连接位点122出现在与标记的原子共价结合的间隔物的原子处。

如本文别处所述,在一些实施方案中,本申请的接头构建体包含两个或更多个发光标记,其中相邻的发光标记被描述为具有相隔最小距离dA的连接位点。在一些实施方案中,每个发光标记与下一个相隔最小距离dL。如图1A所示,在一些实施方案中,dL是标记连接位点之间的距离。在一些实施方案中,标记-标记间隔可以进一步由每个标记分子的尺寸决定。因此,在一些实施方案中,可以通过近似的或计算的椭球体或球体的空间体积112来描述发光标记以获得空间半径r1的测量值。在一些实施方案中,可以通过近似的或计算的椭圆或圆的空间周长来描述发光标记以获得空间半径r1的测量值。在一些实施方案中,空间半径(例如,r1、r2)可以被计算或近似为发光标记最长维度的一半。例如,在一些实施方案中,使用本领域已知的软件或合适方法将发光标记的化学结构评估为二维或三维结构(例如,基于热力学有利的分子构象),并且空间半径(例如,r1、r2)是通过计算二维或三维空间中结构最长维度的一半来确定的。在一些实施方案中,标记以最小距离dL分隔,前提是总的标记半径(r1+r2)使得标记不重叠。

在一些实施方案中,如图1B所示,接头构型和/或间隔物刚性使得连接位点之间的距离dA可以与dL(例如,构建体150中)大致相同。在一些实施方案中,接头构型和/或间隔物刚性使得连接位点之间的距离dA可以小于最小距离dL(例如,构建体152中)。在一些实施方案中,接头构型和/或间隔物刚性使得连接位点之间的距离dA可以大于最小距离dL(例如,构建体154中)。

应当理解,在一些实施方案中,可以使用任何合适的分子骨架作为接头100来实施本文所述的概念。在一些实施方案中,所述接头是有机化合物。适合用作接头100的有机化合物的实例包括但不限于聚苯基、聚炔烃、α螺旋模拟物和肽模拟物。

在一些实施方案中,接头100是寡聚物,例如,由单体单元组成的寡聚物接头。在一些实施方案中,寡聚物包含一种或多种类型的单体单元。单体单元的类型可以包括但不限于例如核苷酸(例如核糖核苷酸、脱氧核糖核苷酸及其类似物和衍生物)、氨基酸(例如天然和非天然氨基酸)、单糖和有机化合物,例如含苯基和炔基的化合物。在一些实施方案中,寡聚物包含包含一种或多种相同类型的单体单元。在一些实施方案中,由一种类型的单体单元构成的寡聚物可称为聚合物(例如,聚合物接头)。在一些实施方案中,寡聚物包含两种或更多种不同类型的单体单元(例如,单体单元的混合物)。

在一些实施方案中,寡聚物(例如,寡聚物接头或聚合物接头)包含至少5个单体单元。在一些实施方案中,寡聚物含有至少10个单体单元。在一些实施方案中,寡聚物含有至少10个且少于200个单体单元(例如,至少10个且少于150个单体单元、至少10个且少于100个单体单元、至少10个且少于50个单体单元、至少10个且少于40个单体单元,至少10个且少于30个单体单元,或至少10个且少于20个单体单元)。

在一些实施方案中,接头(例如,聚合物接头、寡聚物接头)是多糖。适合用作接头100的多糖的实例是本领域已知的(例如,如Solid Support Oligosaccharide Synthesisand Combinatorial Carbohydrate Libraries,Wiley 2001中所述)。

在一些实施方案中,接头(例如,聚合物接头、寡聚物接头)是肽。适合用作接头100的肽的非限制性实例包括但不限于寡肽、环肽和小蛋白质(例如,基于禽胰肽的微型蛋白质,如Hodges,A.M.and Schepartz,A.(2007)J.Am.Chem.Soc.129:11024-11025中所述)。将几何限制工程化到肽结构中的方法在本领域中是众所周知的,并且被认为是特别有用的,例如,用于赋予刚性和促进标记分离。例如,可以修改肽氨基酸序列的脯氨酸含量以控制肽形状(参见,例如,Kritzer,J.A.,等人(2006)ChemBioChem 7:29-31)。有用的肽工程技术的其他非限制性例子包括肽环化(参见,例如,Maltsev,O.V.,等人(2016)Angewandte Chemie55(4):1535-1539)、通过装订和/或H键替代物的α-螺旋肽限制(参见,例如,Douse,C.H.,等人(2014)ACS Chem.Biol.9:2204-2209)、通过环状β-折叠和β-发夹模拟物的肽限制(参见,例如,Gibbs,A.C.,等人(1998)Nat.Struc.Biol.5:284-288)。

在一些实施方案中,接头(例如,聚合物接头、寡聚物接头)是核酸。在一些方面,可根据图2A中所示的图设计亮标记的反应物,该图一般地描绘了连接至核心核酸构建体的两个发光标记。如图所示,在一些实施方案中,至少一个发光标记210在连接位点202处通过间隔物220连接到核酸接头200。在一些实施方案中,核酸接头200包含至少两条杂交的寡核苷酸链。在一些实施方案中,核酸接头200包含至少两个发光标记,其中每个发光标记与下一个相隔最小距离dL。在一些实施方案中,至少两个发光标记连接到相同的寡核苷酸链,其中每个连接位点与下一个相隔最小距离dA。在一些实施方案中,发光标记通过间隔物连接到寡核苷酸链,其中每个间隔物将给定的发光标记与其连接位点分隔最小距离dAL

在一些实施方案中,最小距离dL、dA和dAL可以例如使用本领域已知的理论方法(例如,通过计算或其他方式)获得。在一些实施方案中,理论方法可以包括解释分子结构的任何方法,例如键长、键角和旋转、静电、核酸螺旋度和可能代表溶液中的分子的其他物理因素。在一些实施方案中,距离测量可以通过实验获得,例如通过晶体学或光谱学手段。

本公开的方面至少部分地涉及以下发现,即具有核酸接头的亮标记的反应物(例如,标记的核苷酸)可以根据等式1进行设计:

等式1

其中2(dAL)-dA可以为负。在一些实施方案中,dA大于17埃在一些实施方案中,dA为至少但不大于(例如,dA为约或约)。

在其他方面,本公开的标记的核苷酸可以根据等式2设计:

等式2:2(dAL)/dA<1。

在一些实施方案中,2(dAL)/dA小于1,优选小于0.5。在一些实施方案中,2(dAL)/dA小于0.1。

在一些实施方案中,本公开的标记的核苷酸可以根据等式3设计:

等式3:[2(dAL)+LLD]/dA<1,

其中LLD是表示最长标记维度(LLD)的距离。在一些实施方案中,[2(dAL)+LLD]/dA小于0.5。在一些实施方案中,[2(dAL)+LLD]/dA小于0.2。在一些实施方案中,[2(dAL)+LLD]/dA小于0.1。

在一些实施方案中,最小距离dAL是从发光标记210的近似中心的原子到间隔物220所连接的寡核苷酸链上的原子测量的。在一些实施方案中,最小距离dAL是从发光标记210的中心(例如基于发光分子的质心或本领域已知的或本文别处描述的一些其他方法近似)到间隔物220所连接的寡核苷酸链上的原子测量的。在一些实施方案中,最小距离dAL被测量为间隔物220的长度(例如,从连接发光标记210的间隔物220的原子到连接核酸200的间隔物220的原子所测量的)。在一些实施方案中,最小距离dA被测量为间隔物共价结合的寡核苷酸骨架上的原子之间的距离(例如,在无碱基连接位点的碳原子之间)。在一些实施方案中,最小距离dA被测量为寡核苷酸链上标记碱基之间的距离(例如,在碱基连接位点的核碱基上的原子之间)。

在一些实施方案中,最小距离dL被测量为相邻发光标记的近似中心原子之间的距离。在一些实施方案中,相邻的发光标记相隔的距离dL为约6埃。在一些实施方案中,距离dL为至少6埃(例如、至少6、至少7、至少8、至少9、至少10、至少11或至少12埃)。在一些实施方案中,最小距离dL被测量为近似值,其可能会或可能不会影响间隔物构型、间隔物柔性或核酸柔性。

在其他方面,本公开提供了用于延长(developing)发光标记之间的距离dL的一般策略,使得多重标记的反应物可以被设计成具有最大化的亮度而不损害发射寿命。在一些实施方案中,足够接近的相邻发光标记可以相互作用,从而发生淬灭效应,导致发射寿命值减小和/或不一致。因此,在一些实施方案中,本文提供的一般设计策略可涉及限制相邻发光标记之间相互作用程度的结构限制。

在一些实施方案中,发光标记可以通过辐射和/或非辐射衰变与核酸接头的鸟嘌呤核碱基相互作用,以实现减少和/或不一致的发射寿命。在一些实施方案中,发光标记连接位点是通过使连接位点周围区域中的G/C含量最小化来开发的。因此,在一些实施方案中,连接位点位于寡核苷酸链的富含A/T的区域。在一些实施方案中,每个连接位点与寡核苷酸链上的G或C核苷酸相隔至少2个核苷酸(例如,与G或C核苷酸相隔2、3、4、5、6、7、8、9或超过10个核苷酸)。因此,在一些实施方案中,每个连接位点的侧接选自A或T的至少2个连续核苷酸。

在某些实施方案中,寡核苷酸链的连接位点之间的距离可以通过其间的未标记碱基(例如,其间的核苷酸)的数量来描述。在一些实施方案中,寡核苷酸链上的连接位点相隔至少5个未标记的碱基(例如至少5个、至少6个、至少7个、至少8个、至少9个或至少10个未标记的碱基)。在一些实施方案中,连接位点相隔6、7、8或9个未标记的碱基。在一些实施方案中,连接位点在寡核苷酸链上相隔5-100个未标记的碱基(例如,5-80、5-60、5-40、5-20或5-10个未标记的碱基)。

在一些实施方案中,本文所述的设计原理允许将连续的发光标记添加到标记的反应组分以增加亮度和/或发光强度。在一些实施方案中,本申请的技术提供具有根据式Ln(x)的亮度和/或发光强度的多重标记的反应组分,其中Ln等于标记反应物上发光标记的总数,x等于相应单标记反应物的测量亮度或荧光强度。因此,在一些实施方案中,双染料标记的反应组分与单染料标记的类似物相比具有两倍的亮度和/或发光强度。在一些实施方案中,三或四染料标记的反应组分与单染料标记的类似物相比分别具有三倍或四倍的亮度和/或发光强度。在一些实施方案中,本文所述的亮标记反应物表现出的亮度和/或发光强度为通过Ln(x)预测的值的至少70%、至少80%、至少90%、至少95%、至少98%或至少99%。

在一些实施方案中,本文提供的核酸接头包含具有至少两个发光标记的寡核苷酸链。图2B一般地描绘了连接到两个发光标记的单链核酸接头250。如图所示,单链接头可以具有相对高度的柔性,可以促进标记之间的相互作用。在一些实施方案中,可以使用单链接头构建体产生具有一致和/或持久寿命的亮标记反应物,例如,通过使用不相互作用产生淬灭效应的某些标记,例如基于花青的染料。然而,对于多类染料,由于接头柔性而促进标记-标记接近可能会导致发射寿命减少和/或不一致。因此,在一些实施方案中,标记的寡核苷酸链与一条或多条寡核苷酸链杂交以降低总体核酸接头柔性。

在一些实施方案中,链杂交用作通用设计策略以在核酸接头上的发光标记之间形成合适的距离dL。在一些实施方案中,链杂交用于增加核酸特定区域的刚性(例如,在标记区域内和/或在将标记区域与反应物分隔的区域中)。图2B一般地描绘了双链核酸接头252,其包括杂交的寡核苷酸链以将标记区域刚性化并由此降低可能促进标记-标记相互作用的链柔性。

如核酸接头252所示,在一些实施方案中,围绕连接点的发光标记移动可促进标记-标记接近。同样如图所示,在一些实施方案中,标记围绕连接位点的移动可导致标记更接近核酸接头的寡核苷酸链。在一些实施方案中,寡核苷酸链可以与发光标记相互作用以产生不一致和/或减少的发射寿命测量值。因此,在一些实施方案中,本文所述的核酸接头包含具有特定长度、刚性、连接位点和/或限制标记-标记和/或接头-标记相互作用程度的构型的间隔物。

在一些实施方案中,发光标记之间的间隔距离可以根据标记相对于彼此存在的空间体积的背景下定义。例如,图2B描绘了图254,该图说明了如何测量距离dL的实例。在一些实施方案中,每个发光标记可由空间体积212定义。在一些实施方案中,空间体积212近似为半径212-r的球体或另外近似为椭圆体形状。在一些实施方案中,每个发光标记包括空间体积212,其具有与任何其他标记的中心点相隔至少5埃的中心点(例如,相邻标记的中心点相隔至少5埃)。发光标记的中心点可以是标记的任何合适的中心,包括例如标记的质心或几何中心。在一些实施方案中,发光标记的中心点可以通过计算或近似半径212-r来确定,如图2B所示。在一些实施方案中,发光标记的中心点可以计算为或近似为发光标记最长维度的一半(例如,如本文别处对图1A的r1和r2所述)。

在一些实施方案中,相邻发光标记之间的距离(dL)可被测量为相邻发光标记的质心之间的距离。在一些实施方案中,质心是指发光标记中所有原子根据它们的质量加权的平均位置。计算质量中心的方法是本领域已知的(参见,例如,Leach,A.R.MolecularModelling:Principles and Applications(第二版),Prentice-Hall 2001;Guenza,M.(2002)Macromolecules 35(7):2714-2722)。

在一些实施方案中,相邻发光标记之间的距离(dL)可被测量为相邻发光标记的几何中心之间的距离。在一些实施方案中,分子的几何中心是指分子的所有原子(例如,发光标记中的所有原子)的平均位置,其中原子没有加权。因此,在一些实施方案中,分子的几何中心是指空间中的点,该点是分子中所有原子坐标的平均值。

在一些实施方案中,空间体积212可以使用本领域已知的任何合适的方法更精确地计算。例如,包括极化率在内的属性中的摩尔折射率因子可以根据以下公式计算:

摩尔折射率=[(n2-1)/(n2+2)]x(MW/d),

其中n=折射率;MW=分子量;d=密度。

在一些实施方案中,标记的空间体积212可以通过计算算出以包括额外的和/或更复杂的因素。例如,Verloop空间因子基于键角、范德华半径、键长和可能的构象提供分子的空间维度(参见,例如,Harper,K.C.,等人(2012)Nature Chemistry 4,366-374)。

在一些实施方案中,可以将发光标记围绕连接位点的移动作为因子计入分隔距离dL。如图2B所示,在一些实施方案中,标记围绕每个连接位点移动的范围可以基于标记的间隔物长度和空间体积来定义。该理论运动范围用虚线表示。应当理解,在一些实施方案中,本文所述的多种组成和设计策略可以有利地限制移动范围接近所示重叠区域的程度。例如,在一些实施方案中,可以根据本公开分别解决间隔物刚性、间隔物长度和连接部位分隔,以限制标记可能接近重叠区域的程度。还应当理解,图254旨在用于说明性目的,例如,标记不一定需要物理接触以发生辐射和/或非辐射衰减。

在一些实施方案中,图254中描绘的标记的运动范围通常可以称为空间体积,例如,具有标记在给定时间点出现在空间点的不同概率的区域的空间区域。在一些实施方案中,每个标记占据与任何其他发光标记的空间体积基本不重叠的空间体积。在一些实施方案中,每个标记占据基本上没有任何其他标记的空间体积。

在一些实施方案中,可以根据双链接头的螺旋结构来设计发光标记的相对连接位点。图2C描绘了具有间隔距离x的两个标记的核酸260的实例。核酸262(大致按比例绘制)在间隔约核酸260的一半碱基的连接位点与两个发光标记相连,但沿螺旋的相对连接位点位置导致标记间隔距离约为2x。如图所示,在一些实施方案中,核酸接头可以通过充当标记之间的空间屏障来进一步限制标记之间的辐射和/或非辐射衰减的程度。

在一些实施方案中,术语“空间屏障”是指位于连接到接头的发光标记和接头的一些其他连接之间的接头或接头的一部分(例如,核酸接头或其部分)。不希望受理论束缚,据认为空间屏障可以吸收、偏转或阻止由发光标记发射的辐射和/或非辐射衰减。在一些实施方案中,空间屏障防止或限制一种或多种发光标记与一种或多种其他发光标记相互作用的程度。在一些实施方案中,空间屏障防止或限制一种或多种发光标记与一种或多种反应物相互作用的程度。在一些实施方案中,空间屏障防止或限制一种或多种发光标记与一种或多种与反应物相关的分子(例如,与反应物结合的聚合酶)相互作用的程度。因此,在一些实施方案中,术语空间屏障通常可以指由核酸接头的某些部分提供的保护或屏蔽作用。

在一些实施方案中,一个或多个结构基序起到空间屏障的作用。例如,在一些实施方案中,由双链核酸接头形成的螺旋起到空间屏障的作用。在一些实施方案中,茎环或其一部分(例如茎、环)起到空间屏障的作用。在一些实施方案中,三向连接点(例如,在具有两个或更多个茎环的核酸中)起到空间屏障的作用。在一些实施方案中,没有连接的杂交链(例如,支持链)起到空间屏障的作用。在一些实施方案中,间隔物起到空间屏障的作用。

在一些实施方案中,本文所述的亮标记反应物提供发光标记和反应物之间的间隔。在一些实施方案中,核酸264包含核苷多磷酸280反应物,其在合成反应中充当聚合酶290的底物。在一些实施方案中,紧邻聚合酶活性位点的标记可诱导聚合酶光损伤(例如,通过非辐射衰变或其他方式),这可能对聚合酶活性有害。如图所示,核酸266与反应物连接,使得接头的至少一部分位于标记和反应物之间的中间区域中。因此,在一些实施方案中,核酸接头可用作空间屏障以进一步保护聚合酶免受标记诱导的光损伤。在一些实施方案中,聚合酶保护的这种效果可以通过标记-反应物空间分离和/或标记和反应物之间空间屏障的存在而发生。聚合酶保护在共同待审的美国专利申请号15/600,979中有更详细的描述,其内容通过引用整体并入本文。

在一些实施方案中,核酸接头的大小和构型(核酸接头的一个或多个寡核苷酸链和/或一个或多个间隔物)决定了发光标记和核苷多磷酸之间的距离。在一些实施方案中,该距离为约1nm或2nm至约20nm。例如,大于2nm、大于5nm、5-10nm、大于10nm、10-15nm、大于15nm、15-20nm、大于20nm。然而,发光标记和核苷多磷酸之间的距离不能太长,因为某些检测技术要求发光标记在限定的照明体积内被激发(例如,当核苷多磷酸被固定在聚合酶的活性位点内时)。因此,在一些实施方案中,总距离小于30nm、小于25nm、约20nm或小于20nm。

在一些实施方案中,可以实施本文所述的组合物的其他特征以促进标记-反应物分离以最小化标记诱导的光损伤的可能性,例如间隔物长度、间隔物刚性、连接位点位置。在一些实施方案中,可相对于发光标记改变与本文所述的核酸接头的反应物连接以促进标记-反应物分离。图3A一般地描绘了具有相同链或相反链标记-反应物连接的核酸接头。在一些实施方案中,核酸300包含连接至相同寡核苷酸链的两个或更多个发光标记和反应物。在一些实施方案中,同链连接导致标记和反应物之间的共价连接。

在一些实施方案中,核酸302包含连接至不同寡核苷酸链的两个或更多个发光标记和反应物。在一些实施方案中,相反链连接导致标记和反应物之间的共价连接。在一些实施方案中,标记和反应物的相反链连接通过标记连接的寡核苷酸链和反应物连接的寡核苷酸链的杂交而发生。如图所示,在一些实施方案中,本公开的核酸接头包含标记-反应物分隔距离dLR。在一些实施方案中,dLR是反应物与最近的发光标记之间的距离。在一些实施方案中,dLR是从标记连接位点到反应物连接位点测量的。在一些实施方案中,dLR是从标记的发光分子到反应物测量的。在一些实施方案中,dLR小于1nm。在一些实施方案中,dLR为约1nm-约10nm(例如,约1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm或大于10nm)。在一些实施方案中,dLR为约2nm-约30nm(例如,约2-25nm、约2-20nm、约2-15nm、约2-10nm、约2-5nm、约5-10nm、约10-20nm、约5-30nm、约15-30nm或约20-30nm)。

图3B描绘了在亮标记反应物的设计中使用的非限制性距离规范的例子。在一些实施方案中,核酸接头304通过同链连接连接到两个发光标记和六磷酸核苷(例如,反应物)。在一些实施方案中,如图所示,dL约为1nm,dLR约为7nm。在一些实施方案中,本公开的亮标记反应物包含两个以上的发光标记。例如,在一些实施方案中,核酸接头306通过同链连接连接到三个发光标记和六磷酸核苷(例如,反应物)。如图所示,在一些实施方案中,具有在两个以上连接位点连接两个以上发光标记的构建体将必然具有一个以上间隔距离dL。在一些实施方案中,单个构建体上的每个间隔距离dL可以根据本文的描述独立地设计。在一些实施方案中,每个标记间隔距离dL可以设计为大致相同。例如,在一些实施方案中,每次出现的间隔距离dL约为3.5nm,dLR约为7nm。

在一些实施方案中,本申请的亮标记反应物包括通过不同的寡核苷酸链连接的两个或更多个发光标记。例如,在一些实施方案中,核酸接头308包含通过单独的寡核苷酸链连接的四个发光标记。在一些实施方案中,核酸接头308的未标记寡核苷酸链包含与连接到两个发光标记和核苷多磷酸的第一寡核苷酸链互补的第一部分。未标记的寡核苷酸链还包含与连接到两个发光标记的第二寡核苷酸链互补的第二部分。如图所示,在一些实施方案中,每条标记链内的发光标记连接位点被9个核苷酸分隔。在一些实施方案中,非连续标记链上最近连接位点之间的间隔可以相同或不同(例如,如所示出的10个核苷酸间隔)。

具有相同链标记-反应物连接的非限制性通用核酸接头304用作产生图3C中所示的标记核苷多磷酸的基础。如图所示,图3C的核酸接头包含两条杂交的寡核苷酸链。根据本公开的某些实施方案,两个发光标记连接在接头的第一寡核苷酸链内的无碱基位点处。点击化学技术,如本文别处所述作为通用连接策略,用于将核苷多磷酸连接至相同的寡核苷酸链。根据本文所述的理论,将第二条寡核苷酸链与第一条链杂交以促进连接组分的受限空间构象。图3C的构建体与其他标记的核苷多磷酸一起成功地用于单分子测序运行中(图3D)。产生了具有相反链连接的类似设计的构建体,并显示在图3E中。

图3E描绘了将核苷多磷酸(例如,反应物)与发光标记非共价连接的核酸接头的实例结构。如图所示,在无碱基连接位点连接到两个发光标记的第一寡核苷酸链与在末端连接位点连接到六磷酸核苷的第二寡核苷酸链杂交。在一些实施方案中,本公开中提供的用于产生亮标记反应物的设计策略被预期包括替代标记缀合策略,例如并入接头中的标记(并入寡聚物接头或聚合物接头中,例如寡核苷酸链)。例如,图3F描绘了具有连接在寡核苷酸链内的两个标记的核酸接头的实例。

如图3F所示,在一些实施方案中,亮标记的反应物包含连接在寡核苷酸链内(例如整合到链中)的两个发光标记。在一些实施方案中,此类缀合策略可用不经由辐射和/或非辐射衰变相互作用的发光分子实施,例如基于花青的染料(例如,如图3F中的方框区域所示)。在一些实施方案中,连接在寡核苷酸链内的发光分子的数量可以仅受寡核苷酸链的大小限制。因此,在一些实施方案中,亮标记的反应物包含连接在寡核苷酸链内的两个以上的发光标记(例如,2、3、4、5、6或6个以上的发光标记)。图3F中描绘的构建体成功地用于与其他三种亮标记的核苷多磷酸(图3G)的测序运行中。

在一些方面,本公开涉及发现核酸接头可以被设计成具有结构受限的构象,其为具有一致和/或持久的发射寿命的亮标记反应物提供骨架。如本文所述,在一些实施方案中,寡核苷酸链杂交是为了标记分隔的目的促进受限构象的一种通用策略。在一些实施方案中,寡核苷酸链杂交涉及不同寡核苷酸链的杂交。在一些实施方案中,寡核苷酸链杂交涉及自链杂交(例如,在单链内自杂交)。在一些实施方案中,自链杂交可能限制核酸接头的柔性,如本文别处关于单独链杂交所述。在一些实施方案中,自链杂交用于在核酸接头中形成一个或多个茎环结构。

茎环或发夹环是寡核苷酸链上未配对的核苷酸环,当寡核苷酸链折叠并与同一链的另一部分形成碱基对时,就会形成该环。在一些实施方案中,茎环的未配对环包含3-10个核苷酸。因此,茎环可以由寡核苷酸链的两个区域形成,所述寡核苷酸链具有杂交形成茎的反向互补序列,其中两个区域被形成未配对环的3-10个核苷酸隔开。在一些实施方案中,茎可以设计为具有一个或多个G/C核苷酸,与A/T核苷酸相比,其可以通过形成的额外氢键相互作用提供额外的稳定性。在一些实施方案中,茎包含紧邻未配对环序列的G/C核苷酸。在一些实施方案中,茎在与未配对环序列相邻的前2、3、4或5个核苷酸内包含G/C核苷酸。

在一些实施方案中,茎环核酸接头的未配对环包含一个或多个发光标记。因此,在一些实施方案中,一个或多个标记连接位点存在于未配对的环中。在一些实施方案中,连接位点出现在未配对环中的无碱基位点。在一些实施方案中,连接位点出现在未配对环的基部。在一些实施方案中,环包含富含A/T/U的序列,例如,由于用鸟嘌呤观察到的淬灭效应,如本文别处所述。在一些实施方案中,连接位点出现在未配对环中的A、T或U核苷酸处。在一些实施方案中,至少四个连续的A、T或U核苷酸出现在连接位点的任一侧。在一些实施方案中,未配对环包含小于33%的G/C含量(例如,小于30%、小于20%、小于10%、或0%的G/C含量)。

在一些实施方案中,发光标记连接到茎环的未配对环上(例如,标记连接位点出现在环内)。例如,图4A一般地描绘了具有茎环核酸接头400的标记反应物的实例。如图所示,在一些实施方案中,第一寡核苷酸链410自杂交以形成茎环。在一些实施方案中,寡核苷酸链的自杂交部分形成茎环的茎412。在一些实施方案中,自链杂交导致形成茎环的环414(例如,未配对环)。在一些实施方案中,第一寡核苷酸链410还与连接至反应物的第二寡核苷酸链420杂交。因此,在一些实施方案中,茎环核酸接头经由相反链连接将发光标记非共价连接至反应物。应当理解,在一些实施方案中,连接到发光标记的自杂交寡核苷酸链(例如,具有茎环的链)可以通过相同链连接连接到一种或多种反应物。

在一些实施方案中,两个或更多个发光标记连接至茎环核酸接头。例如,在一些实施方案中,茎环核酸接头402连接至两个发光标记。如图所示,在一些实施方案中,两个发光标记的连接位点出现在茎环的环内。在一些实施方案中,由自杂交茎区域提供的稳定性导致环区域具有相对低水平的柔性。在一些实施方案中,未配对环内的发光标记连接位点可被设计成促进有利的标记-标记空间分离和/或有利的标记-反应物空间分离。由非限制性茎-环核酸接头402提供的实例描绘了以近似环直径的距离彼此分隔的标记连接位点。在一些实施方案中,这种设计可以通过空间最大化标记-标记分离。在一些实施方案中,该设计通过环提供的空间屏障效应进一步限制了标记-标记相互作用的程度,如本文别处所述。在一些实施方案中,茎环核酸接头包含两个或更多个茎环(图4B)。

如图4B所示,在一些实施方案中,茎环核酸接头404包含两个茎环。在一些实施方案中,两个茎环的形成导致具有Y形的核酸接头,从而形成三向接头410。在一些实施方案中,由于由这些特征产生的相对稳定性和几何限制构象,三向连接点被设想为一般设计策略。在一些实施方案中,茎环核酸接头404包含一个连接到每个环的发光标记。在一些实施方案中,茎环核酸404通过相反链连接非共价连接发光标记和反应物,例如,一个或多个连接到第一寡核苷酸链的标记与连接到一个或多个反应物的第二寡核苷酸链杂交。在一些实施方案中,茎环核酸406通过同链连接连接发光标记和反应物(例如,一种或多种标记和一种或多种反应物连接至同一寡核苷酸链)。茎环核酸406描述了用于设计具有三向连接点的亮标记反应物的非限制性距离规范的实例。例如,这些近似距离被用作产生如图4C中所示的标记的核苷多磷酸的基础。图4C的构建体与其他标记的核苷多磷酸一起成功地用于单分子测序运行中(图4D)。

在一些实施方案中,一种或多种发光标记被连接到茎环的茎上。在一些实施方案中,核酸接头的茎环不包含发光标记。在一些实施方案中,核酸接头的茎环包含茎内的未配对区域(例如,“凸环”)。在一些实施方案中,核酸接头中包括一个或多个未标记的结构基序,例如茎环(例如,在核酸接头上的某个位置,例如连接在一个或多个与一个或多个核苷多磷酸之间)。在此类实施方案中,一个或多个未标记的结构基序可提供空间屏障效应,如本文别处所述。

在一些实施方案中,茎环核酸接头包含连接到发光标记的第一寡核苷酸链。在一些实施方案中,发光标记通过间隔物连接在第一寡核苷酸链上的连接位点。在一些实施方案中,第一寡核苷酸链形成具有茎和环(例如,未配对环)的茎环二级结构。在一些实施方案中,环包括连接部位。在一些实施方案中,核酸接头包含与第一寡核苷酸链杂交的第二寡核苷酸链。在一些实施方案中,第二寡核苷酸链与核苷多磷酸连接。在一些实施方案中,核苷多磷酸通过间隔物连接至第二寡核苷酸链。在一些实施方案中,第一条寡核苷酸链具有以下结构:

其中NA和NB各自是独立地选自A、U、T、G和C的5-40个核苷酸的连续序列,其中第二寡核苷酸链与NA的5′部分或NB的3′部分杂交;括号表示形成y茎环的区域,每个茎环具有茎和环,其中y为1至3;N1和N2各自是独立地选自A、U、T、G和C的5-20个核苷酸的连续序列,其中:N1(S1)的5′部分和N2(S2)的3′部分反向互补或部分反向互补并且能够彼此杂交形成茎基序;当S1和S2杂交形成茎基序时,N1(L1)的3′部分、N2(L2)的5′部分和中间区域形成环基序;(A/T)是选自A、T和U的核苷酸;X1是第二寡核苷酸链上的连接位点;Y1是第一接头;以及Z1是发光标记。

如本文所述,本公开的方面涉及用于将一种或多种发光标记与一种或多种反应物(例如,一种或多种核苷多磷酸)连接的几何受限的接头构型。在一些实施方案中,几何受限构型是指具有两个或更多个发光标记的核酸接头,其中发光标记通过对称构型在空间上分开。在一些方面,本公开的亮标记的反应物包含类似于图5A中所描绘的树形构型的核酸接头。在一些实施方案中,树形接头500包含与反应物(例如,核苷多磷酸)连接的三标记的核酸接头。如图所示,在一些实施方案中,树形接头500包括三个主要的寡核苷酸组分。在一些实施方案中,第一寡核苷酸组分510包含通过分支接头共价连接的四个寡核苷酸链。在一些实施方案中,组分510的三个寡核苷酸链各自连接至发光标记(例如,通过本文所述的末端连接或其他缀合策略)。因此,在一些实施方案中,组分510的三个标记的寡核苷酸链通常被称为组分510的标记部分。在一些实施方案中,组分510的第四寡核苷酸链是未标记的。在一些实施方案中,第四寡核苷酸组分与第二寡核苷酸组分520杂交。在一些实施方案中,核酸接头500的第二寡核苷酸组分520连接至反应物(例如,通过本文所述的末端连接或其他缀合策略)。在一些实施方案中,第三寡核苷酸组分530与组分510的标记部分的三个寡核苷酸链杂交。在一些实施方案中,第三寡核苷酸组分530被称为支撑链,因为它与组分510的杂交在标记区域提供结构刚性以促进发光标记的空间分离。

应当理解,本文所述的任何接头设计策略均可应用于本公开所涵盖的树形核酸接头或任何其他核酸接头构型(例如,链连接、间隔特性和间隔配置、标记-标记分离、标记-反应物分离、三向连接点等)。树状核酸502描绘了用于设计具有树状核酸接头的亮标记反应物的非限制性距离规范的实例。作为说明性实例,这些近似距离用作产生图5B中所示的标记的核苷多磷酸的基础。如图所示,在一些实施方案中,树状核酸可包含一种以上的反应物(例如,两种核苷多磷酸,或两种以上的核苷多磷酸)。

在一些实施方案中,树状核酸接头根据包含具有反应物的杂交部分的第一和第二寡核苷酸链描述。例如,在一些实施方案中,树状核酸接头包含第一寡核苷酸链,其通过偶联化合物(例如,分支偶联物)在第一寡核苷酸的末端与两条或多条分支寡核苷酸链连接。在一些实施方案中,每条分支寡核苷酸链都与发光标记相连。在一些实施方案中,第一寡核苷酸链与连接至反应物(例如核苷多磷酸)的第二寡核苷酸链杂交。在一些实施方案中,第三寡核苷酸链(例如,第三寡核苷酸组分)与两条或多条分支寡核苷酸链杂交。在一些实施方案中,所述偶联化合物具有以下结构:

其中Nf是第一寡核苷酸链;Nb是分支寡核苷酸链;Rf和Rb各自彼此独立为键或选自由以下组成的组的连接基团:取代或未取代的亚烷基;取代或未取代的亚烯基;取代或未取代的亚炔基;取代或未取代的杂亚烷基;取代或未取代的杂亚烯基;取代或未取代的杂亚炔基;取代或未取代的亚杂环基(heterocyclylene);取代或未取代的亚碳环基(carbocyclylene);取代或未取代亚芳基;取代或未取代的杂亚芳基;及其组合;并且O的每个实例都是相邻寡核苷酸链的5′磷酸基团或3′羟基基团的氧原子。

在一些方面,本公开提供具有星形核酸接头的亮标记反应物。如图6A所示,星形核酸接头可在接头的外部区域提供对称排列的反应物和更靠近构型核心区域的一种或多种发光标记。这样,在一些实施方案中,反应物可能更容易与例如聚合酶反应。在一些实施方案中,核心区域附近的发光标记连接位点周围的核苷酸含量是根据本文所述的规范选择的(例如,低G/C含量,以避免标记和接头之间的淬灭效应)。在一些实施方案中,星形核酸接头600包含Y形寡核苷酸组分,该组分具有通过分支接头连接的三条寡核苷酸链。在一些实施方案中,Y形寡核苷酸组分的三条寡核苷酸链中的每一条连接(例如,通过末端)至反应物。在一些实施方案中,Y形寡核苷酸组分的三条寡核苷酸链中的每一条都与寡核苷酸链杂交。在一些实施方案中,杂交的寡核苷酸链之一与发光标记相连。然而,在一些实施方案中,两条或三条杂交的寡核苷酸链各自连接至发光标记(601)。

在一些实施方案中,星形核酸接头的Y形寡核苷酸组分连接至三个以上的反应物。例如,在一些实施方案中,具有星形核酸接头602的亮标记反应物在Y形寡核苷酸组分的两条寡核苷酸链的每条上包含两种反应物。在一些实施方案中,如图所示,两种反应物连接到与未标记的链杂交的Y形寡核苷酸组分的链。在一些实施方案中,两种反应物连接至与标记链(603)杂交的Y形寡核苷酸组分的链。

在一些实施方案中,星形核酸接头包含标记的寡核苷酸组分和反应物寡核苷酸组分,其中每个寡核苷酸组分包含Y形寡核苷酸。例如,在一些实施方案中,星形核酸接头604包含连接到三个发光标记的第一Y形寡核苷酸组分。在一些实施方案中,每个发光标记都与第一Y形组分的每个寡核苷酸链相连。在一些实施方案中,如图所示,每个发光标记都连接在第一Y形寡核苷酸组分的核心区域附近。在一些实施方案中,星形核酸接头604与连接至三个反应物的第二个Y形寡核苷酸组分杂交。在一些实施方案中,每个反应物都与第二Y形组分的每个寡核苷酸链相连。在一些实施方案中,如图所示,每个反应物连接在第一Y形寡核苷酸组分的外部区域(例如,通过末端连接位点)。星形核酸606描绘了用于设计具有星形核酸接头的亮标记反应物的非限制性距离规范的实例。具有根据本公开产生的星形核酸接头的亮标记反应物的实例结构示于图6B中。

在一些实施方案中,星形核酸接头可以根据在接头的Y形寡核苷酸组分中使用的共价偶联化合物来描述。例如,在一些实施方案中,具有星形核酸接头的亮标记反应物包含第一寡核苷酸组分,其包含从共价偶联化合物延伸的三个或更多个寡核苷酸链。在一些实施方案中,至少一条寡核苷酸链连接至反应物(例如,核苷多磷酸)。在一些实施方案中,第一寡核苷酸组分的两条或更多条(例如,2、3、4、5条或更多条)寡核苷酸链各自连接至一个或多个反应物。在一些实施方案中,第一寡核苷酸组分与第二寡核苷酸组分杂交。在一些实施方案中,第二寡核苷酸组分包含至少一条与发光标记连接的寡核苷酸链。在一些实施方案中,第二寡核苷酸组分包含从共价偶联化合物延伸的三个或更多个寡核苷酸链。在一些实施方案中,第二寡核苷酸组分的两条或更多条(例如,2、3、4、5条或更多条)寡核苷酸链各自连接至发光标记。

在一些方面,本公开的亮标记反应物包含具有四面体核心的核酸接头。如图6C的实例结构所示,四面体核心是指四向共价偶联化合物,其促进一种或多种发光标记和一种或多种核苷多磷酸的对称受限空间排列。图6D描绘了可用于合成图6C中所示的实例结构的反应方案的实例。在一些实施方案中,考虑将四面体核心与本文所述的一种或多种亮标记反应物设计策略中的任一种组合使用。作为一个实例,四面体核心提供的对称受限的好处是用本文描述的三向连接点实现的,以生成图6E中所示的亮标记的反应物。如图所示,在一些实施方案中,发光标记在三向连接点处或附近的连接可有利地提供空间效应,如本文别处所述。

在一些实施方案中,本公开考虑使用允许对称连接的核心化学偶联物的其他对称受限构型。在一些实施方案中,例如,亮标记的反应物包含基于环糊精的核心。用于生成具有三向连接的基于环糊精的核酸接头的实例合成方案示于图7中。表1中提供了环糊精偶联化合物的实例结构以及可用于根据本文描述的实施方案的三个或更多个寡核苷酸链的共价连接的其他偶联化合物的实例。

表1.用于连接寡核苷酸链的偶联化合物的实例

间隔物

如本文所述,在一些实施方案中,发光标记和/或反应物可通过间隔物连接至核酸接头。在一些实施方案中,间隔物在连接位点连接至核酸接头的寡核苷酸链。在一些实施方案中,连接位点出现在寡核苷酸链上的末端位点(例如,在5’或3'端)。本申请中提供了末端连接位点的实例,例如,如图3C、3E、4C、6B、6C、8、9和10(核苷酸的末端连接)和图5B、9和10所示(发光标记的末端连接)。在一些实施方案中,连接位点出现在寡核苷酸链内的无碱基位点处(例如,在缺少核苷酸但与核苷酸相邻的位点处)。在本申请中提供了无碱基连接位点的实例,例如,如图3C、3E、6B、6C和8所示(发光标记的无碱基连接)。在一些实施方案中,连接位点出现在寡核苷酸链上的碱基位点处(例如,连接至核苷酸,例如链上核苷酸的核碱基、糖或磷酸)。在本申请中提供了碱基连接位点的实例,例如,如图4C和8所示(发光标记的碱基连接)。

在一些实施方案中,间隔物包含多个胸腺嘧啶核苷酸。在一些实施方案中,间隔物包括分支的间隔物,例如,分支的胸腺嘧啶间隔物。在一些实施方案中,分支的间隔物物包含分支的胸腺嘧啶间隔物。例如,在一些实施方案中,每个核苷多磷酸都包含一个式Nu–T(T)nT–R的胸腺嘧啶间隔物,其中Nu表示核苷多磷酸,T表示胸腺嘧啶核苷酸,n是1到30之间的整数,R表示连接一个或多个其他核苷多磷酸的会聚点(point of convergence)。在一些实施方案中,会聚点进一步直接连接至核酸的寡核苷酸链。在一些实施方案中,会聚点进一步间接连接至寡核苷酸链,例如通过其他胸腺嘧啶接头和/或其他的会聚点。分支胸腺嘧啶间隔物的一个例子示于图5B中,其描绘了具有胸腺嘧啶间隔物和会聚点的两种核苷多磷酸,该会聚点进一步直接连接至寡核苷酸链。

在一些实施方案中,间隔物包含一个或多个发散点(points of divergence),以便两个或更多个(例如,2、3、4、5、6、7、8、9、10个或更多个)核苷多磷酸连接至每个发光标记,两个或更多个(例如,2、3、4、5、6、7、8、9、10个或更多个)发光标记连接至每个核苷多磷酸,或两个或更多个(例如,2、3、4、5、6、7、8、9、10个或更多个)核苷多磷酸连接到两个或更多个(例如,2、3、4、5、6、7、8、9、10个或更多个)发光标记。

在一些实施方案中,间隔物连接在核酸接头的寡核苷酸链上的末端位点。在一些实施方案中,发光标记和/或反应物通过如下所示的通用间隔物连接在寡核苷酸链的5'或3'端:

其中是发光标记(或者,在替代实施方案中,是反应物);m>1;n>1;并且m+n<10。

在一些实施方案中,间隔物连接在核酸接头的寡核苷酸链内的内部无碱基位点处。在一些实施方案中,发光标记和/或反应物通过如下所示的通用间隔物连接在寡核苷酸链的内部无碱基位点上:

其中是发光标记(或者,在替代实施方案中,是反应物);n>1;并且X=CH2或O。

用于发光标记连接(例如,通过末端、内部无碱基或碱基连接位点)的间隔物的实例在表2中提供并显示如下。尽管可以证明间隔物结构具有发光标记,但是应当理解,在一些实施方案中,可以替换反应物,使得本文提供的任何间隔物结构可以用于将反应物(例如,核苷多磷酸)连接至核酸接头。

在一些实施方案中,发光标记和/或反应物通过如下所示的醇胺间隔物连接在寡核苷酸链的内部无碱基位点上:

其中是发光标记(或者,在替代实施方案中,是反应物)。

在一些实施方案中,发光标记和/或反应物通过如下所示的丝氨醇胺间隔物连接在寡核苷酸链的内部无碱基位点上:

其中是发光标记(或者,在替代实施方案中,是反应物)。

在一些实施方案中,发光标记和/或反应物通过如下所示的C6-氨基-T间隔物连接在寡核苷酸链的内部碱基位点上:

其中是发光标记(或者,在替代实施方案中,是反应物)。

在一些实施方案中,发光标记和/或反应物通过如下所示的C2-氨基-T间隔物连接在寡核苷酸链的内部碱基位点上:

其中是发光标记(或者,在替代实施方案中,是反应物)。

在一些实施方案中,发光标记和/或反应物通过如下所示的C8-炔烃-dT间隔物连接在寡核苷酸链的内部碱基位点上:

其中是发光标记(或者,在替代实施方案中,是反应物)。

在一些实施方案中,可使用本领域已知的化学偶联技术将一种或多种发光标记和/或一种或多种反应物(例如,一种或多种核苷多磷酸)连接至核酸接头。任何共价键形成反应都可用于将发光标记(例如供体和/或受体发色团)与核苷酸结合。实例性反应包括但不限于烷基化反应、复分解反应、加成反应、取代反应、环加成反应等。

例如,在一些实施方案中,“点击化学”技术(例如,铜催化、应变促进、无铜点击化学等)可用于将一种或多种发光标记物和一种或多种核苷多磷酸连接到核酸。在某些实施方案中,用于将发光标记(例如,供体和/或受体发色团)与核苷酸缀合的反应是“点击化学”反应。为此可以使用本领域已知的任何“点击化学”反应。点击化学是Sharpless在2001年引入的一种化学方法,描述了通过将离散的反应单元连接在一起来快速可靠地生成物质的化学方法。参见,例如,Kolb,Finn和Sharpless Angewandte Chemie International Edition(2001)40:2004–2021;Evans,Australian Journal of Chemistry(2007)60:384–395)。实例性偶联反应(其中一些可归类为“点击化学”)包括但不限于,从活化的酸或酰卤形成酯、硫酯、酰胺(例如,如肽偶联、胺-NHS化学);亲核置换反应(例如,卤化物的亲核置换或应变环系统的开环);叠氮化物-炔烃Huisgen环加成反应;硫醇-炔加成;亚胺形成;Michael加成(例如,马来酰亚胺加成);和Diels-Alder反应(例如,四嗪[4+2]环加成反应)。

在某些实施方案中,用于将核苷酸与发光标记缀合的反应是环加成反应。在某些实施方案中,环加成是[4+2]环加成。在某些实施方案中,环加成是1,3-偶极环加成。在某些实施方案中,反应是叠氮化物-炔环加成反应(即,Huisgen环加成反应)。在某些实施方案中,环加成在催化剂存在下进行。在某些实施方案中,催化剂是铜催化剂。在某些实施方案中,环加成反应是无铜反应。在某些实施方案中,叠氮化物-炔烃环加成涉及环状炔烃(例如,环辛炔)并且是应变促进的。在某些实施方案中,这些反应将发光标记与核苷酸缀合以形成本文所述的“点击间隔物”。

在某些实施方案中,核苷酸用叠氮化物官能化,发光标记用炔烃官能化,并且核苷酸通过本文所述的叠氮化物-炔环加成(即,Huisgen环加成)与发光标记缀合。在另一实施方案中,核苷酸用炔烃官能化,发光标记用叠氮化物官能化,并且核苷酸通过本文所述的叠氮化物-炔环加成(即,Huisgen环加成)与发光标记缀合。该反应方案的实例如下所示,其中“Nuc”是核苷酸(例如,在3'或5'位置连接到R1);并且R1、R3以及如本文所定义。

例如,在某些实施方案中,通过使核苷酸骨架上的C1-炔基-脱氧核糖与用叠氮化物官能化的发光标记反应来缀合发光标记(参见以下方案)。

在一些实施方案中,根据如下所示的通用结构,核苷多磷酸通过叠氮化物缀合的dN6P(例如,dN6P-N3)与核酸接头偶联:

其中碱基是选自腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶及其衍生物的核碱基;—Y—Z—=—CH2CH2—、—CONH—或—NHCO—;以及X=NH或O。例如,在一些实施方案中,通过在合适的反应条件下使dN6P-N3或染料-N3的叠氮化物与炔烃缀合的核酸接头的末端炔烃接触以在核酸接头和dN6P或染料之间形成三唑键,在铜催化反应中将叠氮化物缀合的dN6P(例如dN6P-N3)和/或叠氮化物缀合的发光标记(例如染料-N3)连接至核酸接头。在一些实施方案中,通过在合适的反应条件下使dN6P-N3或染料-N3的叠氮化物与环辛炔缀合的核酸接头的内部炔烃接触以在核酸接头和dN6P或染料之间形成多环键,在无铜反应中将叠氮化物缀合的dN6P(例如dN6P-N3)和/或叠氮化物缀合的发光标记(例如染料-N3)连接至核酸接头。核酸接头的环辛炔修饰可以使用本领域已知的适用于产生无铜点击化学部分的环辛炔试剂来完成。例如,通过使合适的环辛炔试剂(例如,(1R,8S,9s)-双环[6.1.0]壬-4-炔-9-基甲基N-琥珀酰亚胺碳酸酯)与核酸接头的末端胺接触来制备环辛炔修饰的核酸接头。

在某些实施方案中,用于将发光标记(例如供体和/或受体发色团)与核苷酸缀合的反应是酯键或酰胺键形成反应。在某些实施方案中,使用胺-N-羟基琥珀酰亚胺(胺-NHS)化学。在某些实施方案中,核苷酸用NHS酯官能化,发光标记用胺官能化,并且核苷酸通过胺-NHS偶联反应与发光标记缀合。在另一实施方案中,核苷酸用胺官能化,发光标记用NHS酯官能化,并且核苷酸通过胺-NHS偶联反应与发光标记缀合。该反应方案的一个例子如下所示。在某些实施方案中,这些反应将发光标记与核苷酸缀合以形成本文所述的“点击间隔物”。

在本文所述的FRET系统的情况下,供体和受体发色团可以通过不同的点击化学反应与核苷酸缀合(例如,允许它们受控/选择性并入)。在某些实施方案中,一个或多个供体通过本文所述的叠氮化物-炔烃环加成(即,Huisgen环加成)缀合;而一个或多个受体通过不同的反应缀合。在某些实施方案中,一个或多个供体发色团通过本文所述的叠氮化物-炔烃环加成(即,Huisgen环加成)缀合;而一个或多个受体通过本文所述的胺-NHS反应缀合。在某些实施方案中,所采用的反应是相反的。例如,在某些实施方案中,一个或多个供体通过本文所述的胺-NHS反应缀合;而一个或多个受体通过本文所述的叠氮化物-炔烃环加成(即,Huisgen环加成)缀合。

本文所述的缀合反应形成将核苷酸与发光标记(或,在其他实施方式中,反应物)连接的“间隔物”。因此,在一些实施方案中,间隔物包括偶联基团(例如,BCN、四嗪、四唑、三唑、酰胺或通过适用于点击反应和类似偶联技术的反应性部分的偶联产生的其他产物)。在一些实施方案中,所述间隔物具有下式:

其中R1是第一连接基团并且连接至第一寡核苷酸链上的连接位点;R2是第二连接基团并且包含在偶联反应中形成的偶联部分(例如,三唑、酰胺)以共价连接R1和R3;并且R3是第三连接基团且与发光标记相连。

在一些实施方案中,所述间隔物具有选自以下的化学式:

其中,R1和R3各自独立地为键或连接基团,所述连接基团选自由以下组成的组:取代或未取代的亚烷基;取代或未取代的亚烯基;取代或未取代的亚炔基;取代或未取代的杂亚烷基;取代或未取代的杂亚烯基;取代或未取代的杂亚炔基;取代或未取代的亚杂环基(heterocyclylene);取代或未取代的亚碳环基(carbocyclylene);取代或未取代亚芳基;取代或未取代的杂亚芳基;及其组合。

在一些实施方案中,所述间隔物具有选自以下的化学式:

在一些实施方案中,表2中提供了使用点击化学产生的间隔物的实例,其中是发光标记(或者,在替代实施方案中,是反应物)。

表2.点击间隔物的实例

如本文所用,“核酸接头”通常是指将一种或多种发光标记连接至一种或多种核苷多磷酸的核酸。在一些实施方案中,核酸接头通常可以指具有通过共价连接或通过碱基配对(例如,杂交)连接的任意数量的寡核苷酸链的构建体。在一些实施方案中,接头可替代地被称为“核心”或“基础”构建体(例如,一种或多种发光标记、一种或多种核苷多磷酸),不同的功能组件可连接至该构建体。在一些实施方案中,术语“构建体”在各种语境中始终用于一般地指接头,并且可能包括或可能不包括本文所述的多种其他组分(例如,间隔物、标记物、核苷多磷酸等)。

在一些实施方案中,本文所述的核酸接头未连接至材料颗粒(例如,未连接至金属、磁性、聚合物或其他材料的颗粒)。在一些实施方案中,核酸接头是线性分子(例如,“杆状”核酸)。在一些实施方案中,核酸接头是环状分子。在一些实施方案中,核酸接头是单链的(例如,具有或不具有茎环结构)。在一些实施方案中,核酸接头是双链的(例如,具有或不具有茎环结构)。在一些实施方案中,双链核酸接头的两条链是杂交的(由于互补序列)并且未共价连接。然而,在一些实施方案中,可引入一个或多个共价键(例如,使用一种或多种化学接头)以共价连接双链接头的两条链。在一些实施方案中,核酸接头可包括一个或多个如本文所述的额外部分。在一些实施方案中,核酸接头包括i)糖磷酸骨架内或末端的一个或多个额外部分、ii)一种或多种修饰(例如,一种或多种修饰的碱基或糖)、或i)和ii)的组合。然而,在一些实施方案中,核酸接头不包括i)、ii)或i)或ii)中的任一个。

应当理解,在核酸接头的情况下,与其连接的“核苷酸”或“核苷多磷酸”是指一种或多种核苷酸(例如核苷多磷酸),其被配置为并入到正在生长的核酸链(例如,在测序反应期间)中。在一些实施方案中,一种或多种核苷酸包含一种或多种单磷酸核苷或核苷多磷酸。在一些实施方案中,核苷多磷酸的实例包括二磷酸或三磷酸核苷,或具有三个以上的5'磷酸的核苷,例如六磷酸核苷。因此,在一些实施方案中,“标记的核苷酸”是指通过本申请的接头连接至一个或多个发光标记的核苷多磷酸,其中核苷多磷酸在核酸合成反应条件下充当聚合酶的底物。在一些实施方案中,核苷多磷酸至少包含二磷酸基团或三磷酸基团,其可在磷酰基转移反应(例如核苷多磷酸的α-磷酸从其β-磷酸转移到正在生长的核酸链的3′羟基)中被合适的聚合酶作用。

在一些实施方案中,一种或多种磷酸核苷(例如核苷多磷酸)可以通过末端磷酸连接至形成本申请的接头的一部分的寡核苷酸(例如,标记或未标记的寡核苷酸链),所述接头可用作保护聚合酶免受标记诱导的光损伤的保护分子(例如,如本申请其他地方所述)。在本申请中描述的任何组合物或方法的一些实施方案中,磷酸核苷(例如,核苷多磷酸)的磷酸部分(例如,多磷酸部分)包括一个或多个磷酸(例如,1、2、3、4、5、6、7、8、9、10或更多个磷酸基团)或其变体。例如,在一些实施方案中,磷酸核苷(例如,核苷多磷酸)的磷酸部分(例如,多磷酸部分)可以包括磷酸酯、硫酯、氨基磷酸酯、烷基膦酸酯键、其他合适的键、或一种以上的此类修饰、或其两种或更多种的组合。在一些实施方案中,核酸接头的标记和未标记链基本上彼此互补(例如,在二聚化结构域的长度上,其中二聚化结构域内的链可以彼此具有例如至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的互补性)。

核苷多磷酸可具有n个磷酸酯基团,其中n是大于或等于2、3、4、5、6、7、8、9或10的数字。核苷多磷酸的实例包括二磷酸核苷和三磷酸核苷。标记的核苷酸可以是末端磷酸标记的核苷多磷酸,使得核苷多磷酸的末端磷酸与包含一个或多个发光标记的接头(例如核酸接头)连接,从而形成标记的核苷多磷酸。这种标记可以是发光(例如荧光或化学发光)标记、荧光标记、有色标记、显色标记、质量标签、静电标记或电化学标记。标记(或标记物)可以通过如本文所述的接头(如间隔物)与末端磷酸偶联。接头(例如,间隔物)可以包括,例如,至少一个或多个羟基、巯基、氨基或卤代烷基,其可能适合在天然或修饰核苷酸的末端磷酸上形成,例如,磷酸酯、硫酯、氨基磷酸酯或烷基膦酸酯键。接头(例如,间隔物)可以是可切割的,以便例如在聚合酶的帮助下将标记与末端磷酸分开。美国专利号7,041,812中提供了核苷酸和接头(例如,间隔物)的实例,该专利通过引用整体并入本文。

核苷酸(例如,核苷多磷酸)可以包括腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)中的任一种,或其变体。核苷酸(例如,核苷多磷酸)可以包含甲基化的核碱基。例如,甲基化核苷酸可以是包含一个或多个与核碱基相连的甲基的核苷酸(例如,直接与核碱基环相连,与核碱基环的取代基相连)。实例性的甲基化核碱基包括1-甲基胸腺嘧啶、1-甲基尿嘧啶、3-甲基尿嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、1-甲基腺嘌呤、2-甲基腺嘌呤、7-甲基腺嘌呤、N6-甲基腺嘌呤、N6,N6-二甲基腺嘌呤、1-甲基鸟嘌呤、7-甲基鸟嘌呤、N2-甲基鸟嘌呤和N2,N2-二甲基鸟嘌呤。

如本文所用,术语“核酸”通常是指包含一个或多个核酸亚基的分子。核酸可包括一种或多种选自腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)亚基,或其变体。在一些实例中,核酸是脱氧核糖核酸(DNA)或核糖核酸(RNA),或其衍生物。在一些实施方案中,核酸是修饰的核酸,其包括但不限于,锁核酸(LNA)、肽核酸(PNA)、三唑连接的核酸、2'-F-修饰的核酸及其衍生物和类似物。核酸可以是单链或双链的。在一些实施方案中,核酸通常是指任何核苷酸聚合物。

在一些实施方案中,本公开提供用于基于单个分子的一种或多种发光特性来识别这些分子的新组合物。在一些实施方案中,分子(例如,发光标记的核苷多磷酸)基于其亮度、发光寿命、吸收光谱、发射光谱、发光量子产率、发光强度或其两种或多种的组合进行识别。识别可能意味着指定分子的确切分子身份,或者可能意味着从可能的分子的集合中区别或区分特定分子。在一些实施方案中,多个单分子可以基于不同的亮度、发光寿命、吸收光谱、发射光谱、发光量子产率、发光强度或其两种或多种的组合相互区分。在一些实施方案中,通过将分子暴露于一系列单独的光脉冲并评估从该分子发射的每个光子的时间或其他特性来识别单个分子(例如,区别于其他分子)。在一些实施方案中,从单个分子顺序发射的多个光子的信息被聚集和评估以识别该分子。在一些实施方案中,分子的发光寿命由从分子顺序发射的多个光子确定,并且发光寿命可用于识别分子。在一些实施方案中,分子的发光强度由从分子顺序发射的多个光子确定,并且发光强度可用于识别分子。在一些实施方案中,分子的发光寿命和发光强度由从分子顺序发射的多个光子确定,并且发光寿命和发光强度可用于识别分子。

因此,在本申请的一些方面,将反应样品暴露于多个单独的光脉冲并且检测和分析一系列发射的光子。在一些实施方案中,一系列发射的光子提供关于单个分子的信息,该信息在实验期间存在于反应样品中且不改变。然而,在一些实施方案中,一系列发射的光子提供关于一系列不同分子的信息,该信息在不同时间(例如,随着反应或过程的进行)出现在反应样品中。

发光标记

如本文所用,“发光标记”是吸收一个或多个光子并且随后可在一个或多个持续时间后发射一个或多个光子的分子。在一些实施方案中,该术语可用于一般地指标记的反应物的非反应物部分(例如,发光标记可包括荧光团和至少一部分间隔物)。在一些实施方案中,该术语特指吸收和/或发射光子的分子(例如,荧光团)。在一些实施方案中,该术语根据语境可与“发光分子”互换使用。在一些实施方案中,发光标记或发光分子是荧光团(例如,“染料”或“荧光团染料”,如本文可互换使用的)。在一些实施方案中,发光标记或发光分子是基于罗丹明的分子。在一些实施方案中,发光标记或发光分子是基于花青的分子。在一些实施方案中,发光标记或发光分子是基于BODIPY的分子。

通常,发光标记或发光分子包括芳族或杂芳族化合物,并且可以是芘、蒽、萘、吖啶、芪、吲哚、苯并吲哚、噁唑、咔唑、噻唑、苯并噻唑、菲啶、吩噁嗪、卟啉、喹啉、乙锭、苯甲酰胺、花青、羰花青、水杨酸盐、邻氨基苯甲酸盐、香豆素、荧光素、罗丹明或其他类似化合物。染料的例子包括呫吨染料,例如荧光素或罗丹明染料,包括5-羧基荧光素(FAM)、2'7'-二甲氧基-4'5'-二氯-6-羧基荧光素(JOE)、四氯荧光素(TET)、6-羧基罗丹明(R6G)、N,N,N',N'-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)。染料的实例还包括在α或β位具有氨基的萘胺染料。例如,萘氨基化合物包括1-二甲氨基萘基-5-磺酸盐、1-苯胺基-8-萘磺酸盐和2-对甲苯胺基-6-萘磺酸盐、5-(2'-氨基乙基)氨基萘-1-磺酸(EDANS)。染料的其他实例包括香豆素,如3-苯基-7-异氰酸基香豆素;吖啶,如9-异硫氰酸根合吖啶、吖啶橙;N-(对(2-苯并噁唑基)苯基)马来酰亚胺;花青,如吲哚二羰花青(2Z)-2-[(E)-3-[3-(5-羧基戊基)-1,1-二甲基-6,8-二磺基苯并[e]吲哚-3-鎓-2-基]丙-2-亚乙烯基]-3-乙基-1,1-二甲基-8-(三氧化烷基硫烷基)苯并[e]吲哚-6-磺酸盐2-{2-[(2,5-二氧代吡咯烷-1-基)氧基]-2-氧乙基}-16,16,18,18-四甲基-6,7,7a,8a,9,10,16,18-八氢苯并[2”,3”]吲哚嗪并[8”,7”:5',6']吡喃并[3',2':3,4]吡啶并[1,2-a]吲哚-5-鎓-14-磺酸盐吲哚二羰花青吲哚二羰花青3-(-羧基-戊基)-3'-乙基-5,5'-二甲基氧杂羰花青(CyA);1H,5H,11H,15H-呫吨并[2,3,4-ij:5,6,7-i'j']二喹嗪-18-鎓,9-[2(或4)-[[[6-[2,5-二氧-1-吡咯烷基)氧]-6-氧己基]氨基]磺酰基]-4(或2)-磺苯基]-2,3,6,7,12,13,16,17-八氢-内盐(TR或Texas);染料;苯并噁唑;芪;芘等。

在某些实施方案中,发光标记或发光分子是选自表3的染料。表3所列染料是非限制性的,本申请的发光标记或发光分子可包括表3中未列出的染料。在某些实施方案中,一种或多种发光标记的核苷酸的发光标记或发光分子选自表3。在某些实施方案中,四种或更多种发光标记的核苷酸的发光标记或发光分子选自表3。在一些实施方案中,本申请的发光标记或发光分子包括源自表3中所列染料的染料。在一些实施方案中,发光标记或发光分子源自ATTO Rho6G。在一些实施方案中,ATRho6G的叔酰胺侧链(羧丁基)可以变成叠氮丙基部分。不希望受理论束缚,这种修饰导致染料更短且更硬。在一些实施方案中,发光标记或发光分子具有以下结构:

表3.荧光团的实例

染料也可以根据最大吸光度或发射的发光的波长进行分类。表4提供了根据最大吸光度的近似波长分组到列中的实例性荧光团。表4所列染料是非限制性的,本申请的发光标记或发光分子可包括表4中未列出的染料。确切的最大吸光度或发射波长可能与指示的光谱范围不符。在某些实施方案中,一种或多种发光标记的核苷酸的发光标记或发光分子选自表4中列出的“红色”组。在某些实施方案中,一种或多种发光标记的核苷酸的发光标记或发光分子选自表4中列出的“绿色”组。在某些实施方案中,一种或多种发光标记的核苷酸的发光标记或发光分子选自表4中列出的“黄色/橙色”组。在某些实施方案中,选择四种核苷酸的发光标记或发光分子,使得全部选自表4中列出的“红色”、“黄色/橙色”或“绿色”组之一。在某些实施方案中,选择四种核苷酸的发光标记或发光分子,使得三种选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第一组,而第四种选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第二组。在某些实施方案中,选择四种核苷酸的发光标记或发光分子,使得两种选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第一组,而第三和第四种选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第二组。在某些实施方案中,选择四种核苷酸的发光标记或发光分子,使得两选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第一组,并且第三种选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第二组,而第四种选自表4中列出的“红色”、“黄色/橙色”和“绿色”组的第三组。

表4.根据光谱范围的荧光团的实例

在某些实施方案中,发光标记可包含第一和第二生色团。在一些实施方案中,第一生色团(例如,供体发光分子,在本文中也称为供体标记或供体分子)的激发态能够通过能量转移到第二生色团(例如,受体发光分子,在本文中也称为受体标记或受体分子)而发生弛豫。在一些实施方案中,能量转移是共振能量转移(FRET)。这种FRET对可用于提供具有使标记更容易从多个发光标记中区分的特性的发光标记。在某些实施方案中,FRET对可以吸收第一光谱范围内的激发能量并发射第二光谱范围内的发光。

在一些实施方案中,发光标记或发光分子连接在本文所述的接头分子内(例如,整合到寡聚物接头或聚合物接头中)。表5提供了在寡核苷酸链的情况下与这种缀合策略相容的荧光团的多个实例。如表中所示,表5中的基于花青的荧光团与第一链部分的3'端和第二链部分的5'端缀合,使得荧光团本身形成寡核苷酸链内共价连接的一部分(例如,发光标记或发光标记是在不使用间隔物的情况下连接的)。应当理解,在一些实施方案中,这些和类似类型的荧光团可以连接在任何种类的寡聚或聚合结构内。例如,在一些实施方案中,荧光团通过缀合到第一肽部分的C-末端和第二肽部分的N-末端而连接在肽内。在一些实施方案中,单个接头分子包含连接在接头内的两个或更多个荧光团(例如,连接在单个接头内的两个、三个、四个、五个、六个或多于六个染料)。在一些实施方案中,接头包含在接头内连接的一种或多种荧光团和通过间隔物连接的一种或多种荧光团。例如,在一些实施方案中,本文所述的亮标记反应物包含一种或多种(例如,一、二、三、四、五、六种或多于六种)连接在接头内且没有间隔物的荧光团,以及一种或多种(例如,一、二、三、四、五、六种或多于六种)通过间隔物与接头连接的荧光团。

表5.用于在接头内连接的荧光团的实例

对于一组发光标记的分子(例如,发光标记的核苷酸),发光标记的FRET对的特性可以允许选择多个可区分的分子(例如,核苷酸)。在一些实施方案中,FRET对的第二生色团(例如,FRET标记的受体分子)具有不同于多个其他发光标记分子的发光寿命。在一些实施方案中,FRET对的第二生色团(例如,FRET标记的受体分子)具有不同于多个其他发光标记分子的发光强度。在一些实施方案中,FRET对的第二生色团(例如,FRET标记的受体分子)具有体发光强度不同于多个其他发光标记分子的发光寿命和发光强度。在一些实施方案中,FRET对的第二生色团(例如,FRET标记的受体分子)在不同于多个其他发光标记分子的光谱范围内发射光子。在一些实施方案中,FRET对的第一生色团(例如,FRET标记的供体体分子)具有不同于多个发光标记分子的发光寿命。在一些实施方案中,FRET对(例如,FRET标记的供体分子和受体分子)可以吸收在不同于多个其他发光标记分子的光谱范围内的激发能量。在一些实施方案中,FRET对(例如,FRET标记的供体分子和受体分子)可以吸收与多种其他发光标记分子中的一种或多种相同的光谱范围内的激发能量。

对于测序反应,可以优选某些亮标记反应物的组合。在一些实施方案中,亮标记反应物的至少一种包含花青染料或其类似物。在一些实施方案中,亮标记反应物的至少一种包含罗丹明染料或其类似物。在一些实施方案中,亮标记反应物的至少两种各自包含花青染料或其类似物。在一些实施方案中,亮标记反应物的至少两种各自包含罗丹明染料或其类似物。在一些实施方案中,亮标记反应物的至少三种各自包含花青染料或其类似物。在一些实施方案中,亮标记反应物的至少三种各自包含罗丹明染料或其类似物。在一些实施方案中,亮标记反应物的至少四种各自包含花青染料或其类似物。在一些实施方案中,亮标记反应物的至少四种各自包含罗丹明染料或其类似物。在一些实施方案中,亮标记反应物的三种各自包含花青染料或其类似物,并且第四种亮标记反应物包含罗丹明染料或其类似物。在一些实施方案中,亮标记反应物的两种各自包含花青染料或其类似物,并且第三种,以及任选地,第四种亮标记反应物包含罗丹明染料或其类似物。在一些实施方案中,亮标记反应物的三种各自包含罗丹明染料或其类似物,并且第三种,以及任选地,第四种亮标记反应物包含花青染料或其类似物。

如本文所述,发光标记或发光分子是吸收一个或多个光子并且随后可在一个或多个持续时间后发射一个或多个光子的分子。分子的发光由多个参数描述,包括但不限于发光寿命、吸收光谱、发射光谱、发光量子产率和发光强度。术语吸收和激发在整个申请中可互换使用。在一些实施方案中,术语发光和发射可互换使用。典型的发光分子可以吸收多种波长的光或被其激发。某些波长或某些光谱范围内的激发可能会因发光发射事件而弛豫,而某些其他波长或光谱范围内的激发可能不会因发光发射事件而弛豫。在一些实施方案中,发光分子仅被适当地激发以在单一波长或单一光谱范围内发光。在一些实施方案中,发光分子被适当地激发以在两个或多个波长或在两个或多个光谱范围内发光。在一些实施方案中,通过测量激发光子的波长或吸收光谱来识别分子。

来自发光发射事件的发射光子将以可能波长的光谱范围内的波长发射。通常,与激发光子的波长相比,发射的光子具有更长的波长(例如,具有更少的能量或红移)。在一些实施方案中,通过测量发射光子的波长来识别分子。在一些实施方案中,通过测量多个发射光子的波长来识别分子。在一些实施方案中,通过测量发射光谱来识别分子。

发光寿命是指激发事件和发射事件之间的持续时间。在一些实施方案中,发光寿命表示为指数衰减方程中的常数。在一些实施方案中,其中存在一个或多个传递激发能量的脉冲事件,持续时间是脉冲和后续发射事件之间的时间。

分子的发光寿命可以使用任何合适的方法(例如,通过使用合适的技术测量寿命或通过确定发射的时间相关特性)来确定。在一些实施方案中,确定分子的发光寿命包括确定相对于一种或多种分子(例如,测序反应中不同的发光标记的核苷多磷酸)的寿命。在一些实施方案中,确定分子的发光寿命包括确定相对于参照的寿命。在一些实施方案中,确定分子的发光寿命包括测量寿命(例如,荧光寿命)。在一些实施方案中,确定分子的发光寿命包括确定一个或多个指示寿命的时间特征。在一些实施方案中,分子的发光寿命可以基于相对于激发脉冲跨越一个或多个时间门控窗口发生的多个发射事件(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100或更多个发射事件)的分布来确定。例如,基于有关激发脉冲测量的光子到达时间的分布,可以将单个分子的发光寿命与具有不同发光寿命的多个分子区分开来。

应当理解,单个分子的发光寿命表示在单个分子达到激发态之后发射的光子的时间,并且可以通过表示光子时间的信息来区分单个分子。一些实施方案可以包括通过测量与分子发射的光子相关的时间,基于分子的发光寿命将分子与多个分子区分。时间分布可以提供可以从分布确定的发光寿命的指示。在一些实施方案中,基于时间分布,例如通过将时间分布与对应于已知分子的参考分布进行比较,可以将单个分子与多个分子区分开来。在一些实施方案中,发光寿命的值由时间分布确定。

发光量子产率是指在给定波长或在给定光谱范围内导致发射事件的激发事件的分数,通常小于1。在一些实施方案中,本文所述的分子的发光量子产率为0-约0.001、约0.001-约0.01、约0.01-约0.1、约0.1-约0.5、约0.5-0.9、或约0.9-1。在一些实施方案中,通过确定或估计发光量子产率来识别分子。

如本文中对于单个分子所使用的,发光强度是指每单位时间由通过脉冲激发能量的递送而被激发的分子发射的发射光子的数量。在一些实施方案中,发光强度是每单位时间检测到的发射光子的数量,所述发射光子由通过脉冲激发能量的递送而被激发的分子发射,并由特定传感器或一组传感器检测到。

发光寿命、发光量子产率和发光强度在不同条件下对于给定分子可能各不相同。在一些实施方案中,与分子集合相比,单个分子将具有不同的观察到的发光寿命、发光量子产率或发光强度。在一些实施方案中,与未限制在样品孔中的分子相比,限制在样品孔中的分子将具有不同的观察到的发光寿命、发光量子产率或发光强度。在一些实施方案中,与未连接到另一分子的发光标记或发光分子相比,与另一分子连接的发光标记或发光分子将具有不同的发光寿命、发光量子产率或发光强度。在一些实施方案中,与不与大分子复合物相互作用的分子相比,与大分子复合物相互作用的分子将具有不同的发光寿命、发光量子产率或发光强度。

在一些实施方案中,本申请中所述的发光分子吸收一个光子并在持续时间后发射一个光子。在一些实施方案中,分子的发光寿命可以通过测量持续时间来确定或估计。在一些实施方案中,分子的发光寿命可以通过测量多个脉冲事件和发射事件的多个持续时间来确定或估计。在一些实施方案中,通过测量持续时间可以在多种类型分子的发光寿命中区分分子的发光寿命。在一些实施方案中,通过测量多个脉冲事件和发射事件的多个持续时间,可以在多种类型分子的发光寿命中区分分子的发光寿命。在某些实施方案中,通过确定或估计分子的发光寿命,可以在多种类型的分子中识别或区分分子。在某些实施方案中,通过在多种类型的分子的多种发光寿命中区分分子的发光寿命,可以在多种类型的分子中识别或区分分子。

在某些实施方案中,发光发射事件是荧光。在某些实施方案中,发光发射事件是磷光。如本文所用,术语发光涵盖所有发光事件,包括荧光和磷光。

测序

本申请的某些方面可用于对生物聚合物,例如核酸和蛋白质,进行测序。在一些方面,本申请中所述的组合物和技术可用于识别并入到核酸或蛋白质中的一系列核苷酸或氨基酸单体(例如,通过检测一系列标记的核苷酸或氨基酸单体的并入时间过程)。在一些实施方案中,本申请中所述的组合物和技术可用于识别一系列核苷酸,这些核苷酸并入由聚合酶合成的依赖模板的核酸测序反应产物中。在一些实施方案中,多种类型的发光标记的核苷酸中的一种或多种(例如,一种、两种、三种、四种或更多种类型的标记的核苷酸)包含连接到FRET标记的核苷酸,所述FRET标记包含至少三个发光分子,包括至少一个供体分子和至少一个受体分子。每种类型的核苷酸的FRET标记可从多个标记的核苷酸中区分出来(例如,一种类型的FRET标记的核苷酸与所有其他类型的FRET标记的核苷酸和/或不经历FRET的标记区分开来)。

在靶核酸的核碱基与互补的核苷多磷酸(例如,dNTP)之间进行碱基配对时,聚合酶通过在新合成链的3'羟基端和dNTP的α磷酸之间形成磷酸二酯键,将dNTP并入新合成的核酸链中。在(例如,通过本申请的接头)与dNTP缀合的发光标记是荧光团的实例中,它的存在通过激发发出信号,并且在并入步骤期间和/或之后检测到发射脉冲。对于通过本申请的接头与dNTP的末端(γ)磷酸缀合的检测标记(例如,发光标记),将dNTP并入新合成的链导致释放β和γ磷酸以及包含检测标记的接头,其在样品孔中自由扩散,导致从荧光团检测到的发射减少。

在某些实施方案中,依赖模板的核酸测序反应产物在由天然存在的核酸聚合酶进行的测序反应中合成。在一些实施方案中,聚合酶是天然存在的聚合酶的突变体或修饰变体。在一些实施方案中,依赖模板的核酸测序产物将包含一个或多个与模板核酸链互补的核苷酸片段。在一个方面,本申请提供了一种通过确定其互补核酸链的序列来确定模板(或靶标)核酸链序列的方法。

如本文所用,术语“聚合酶”通常是指能够催化聚合反应的任何酶(或聚合酶)。聚合酶的实例包括但不限于核酸聚合酶、转录酶或连接酶。聚合酶可以是聚合作用(polymerization)酶。涉及单分子核酸延伸(例如,用于核酸测序)的实施方案可以使用能够合成与靶核酸分子互补的核酸的任何聚合酶。在一些实施方案中,聚合酶可以是DNA聚合酶、RNA聚合酶、逆转录酶和/或其一种或多种的突变或改变形式。

聚合酶的实例包括但不限于,DNA聚合酶、RNA聚合酶、热稳定聚合酶、野生型聚合酶、修饰聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶、噬菌体T4 DNA聚合酶、(phi29)DNA聚合酶、Taq聚合酶、Tth聚合酶、Tli聚合酶、Pfu聚合酶、Pwo聚合酶、VENT聚合酶、DEEPVENT聚合酶、EX-Taq聚合酶、LA-Taq聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、ES4聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tca聚合酶、Tih聚合酶、Tfi聚合酶、Platinum Taq聚合酶、Tbr聚合酶、Tfl聚合酶、Tth聚合酶、Pfuturbo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Bst聚合酶、Sac聚合酶、Klenow片段、具有3'到5'核酸外切酶活性的聚合酶,以及它们的变体、修饰产物和衍生物。在一些实施方案中,聚合酶是单亚基聚合酶。DNA聚合酶的非限制性实例及其特性详细描述于,尤其是,DNAReplication第二版,Kornberg和Baker,W.H.Freeman,New York,N.Y.(1991)。

在一些实施方案中,聚合酶是具有高持续合成能力(processivity)的聚合酶。然而,在一些实施方案中,聚合酶是具有降低的持续合成能力的聚合酶聚合酶持续合成能力通常是指聚合酶将dNTP连续并入核酸模板而不释放核酸模板的能力。在一些实施方案中,聚合酶是具有低5'-3'核酸外切酶活性和/或3'-5'核酸外切酶活性的聚合酶。在一些实施方案中,聚合酶被修饰(例如,通过氨基酸取代)以相对于相应的野生型聚合酶具有降低的5'-3'核酸外切酶活性和/或3'-5'活性。DNA聚合酶的其他非限制性实例包括9°NmTMDNA聚合酶(New England Biolabs)和Klenow外切聚合酶的P680G突变体(Tuske等人(2000)JBC275(31):23759-23768)。在一些实施方案中,具有降低的持续合成能力的聚合酶为包含一个或多个核苷酸重复序列(例如,两个或更多个相同类型的连续碱基)的测序模板提供了更高的准确度。在一些实施方案中,聚合酶是对标记的核苷酸具有比对未标记的核酸更高的亲和力的聚合酶。

在另一方面,本申请提供了通过对多个核酸片段进行测序来对靶核酸进行测序的方法,其中所述靶核酸包含所述片段。在某些实施方案中,该方法包括组合多个片段序列以提供亲本靶核酸的序列或部分序列。在一些实施方案中,组合步骤由计算机硬件和软件执行。本文所述的方法可以允许对相关的靶核酸的集合,例如整个染色体或基因组进行测序。

在测序期间,聚合酶可以偶联(例如,连接)到靶核酸分子的引发位置。引发位置可以是与靶核酸分子的一部分互补的引物。作为替代方案,引发位置是在靶核酸分子的双链片段内提供的间隙(gap)或缺口(nick)。间隙或缺口的长度可为0至至少1、2、3、4、5、6、7、8、9、10、20、30或40个核苷酸。缺口可以在双链序列的一条链中提供断裂,这可以为聚合酶(例如链置换聚合酶)提供引发位置。

在一些情况下,测序引物可以与靶核酸分子退火,该靶核酸分子可以或可以不固定到固体支持物上。固体支持物可以包括例如用于核酸测序的芯片上的样品孔(例如,纳米孔、反应室)。在一些实施方案中,测序引物可以固定到固体支持物上,并且靶核酸分子的杂交也将靶核酸分子固定到固体支持物上。在一些实施方案中,聚合酶被固定在固体支持物上并且可溶性引物和靶核酸与聚合酶接触。然而,在一些实施方案中,包含聚合酶、靶核酸和引物的复合物在溶液中形成并且该复合物被固定到固体支持物上(例如,通过聚合酶、引物和/或靶核酸的固定)。在一些实施方案中,样品孔(例如,纳米孔、反应室)中的任何组件都没有被固定到固体支持物上。例如,在一些实施方案中,包含聚合酶、靶核酸和引物的复合物在溶液中形成并且该复合物不被固定于固体支持物。

在适当的条件下,与退火的引物/靶核酸接触的聚合酶可以将一个或多个核苷酸添加或并入到引物上,并且核苷酸可以以5'到3'、模板依赖的方式被添加至引物。这种将核苷酸并入引物(例如,通过聚合酶的作用)通常可以称为引物延伸反应。每个核苷酸可与可检测标记相关联,该标记可在核酸延伸反应期间被检测和识别(例如,基于其发光寿命和/或其他特征),并用于确定并入延伸引物的每个核苷酸,从而确定新合成的核酸分子的序列。通过新合成的核酸分子的序列互补性,也可以确定靶核酸分子的序列。在一些情况下,测序引物与靶核酸分子的退火和核苷酸并入测序引物可以在相似的反应条件(例如,相同或相似的反应温度)或不同的反应条件(例如,不同的反应温度)下发生。在一些实施方案中,通过合成方法测序可包括存在靶核酸分子群(例如靶核酸的拷贝)和/或扩增靶核酸以获得靶核酸群的步骤。然而,在一些实施方案中,通过合成测序用于确定每个被评估的反应中单个分子的序列(并且不需要核酸扩增来制备用于测序的靶模板)。在一些实施方案中,根据本申请的方面,多个单分子测序反应并行进行(例如,在单个芯片上)。例如,在一些实施方案中,多个单分子测序反应各自在单个芯片上的独立反应室(例如,纳米孔、样品孔)中进行。

实施方案能够以高准确度和长读长(read length)对单个核酸分子进行测序,例如至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%或99.9999%的准确度和/或大于或等于约10个碱基对(bp)、50bp、100bp、200bp、300bp、400bp、500bp、1000bp、10,000bp、20,000bp、30,000bp、40000bp、50000bp或100000bp的读长。在一些实施方案中,单分子测序中使用的靶核酸分子是单链靶核酸(例如,脱氧核糖核酸(DNA)、DNA衍生物、核糖核酸(RNA)、RNA衍生物)模板,该模板被添加或固定到样品孔(例如,纳米孔)中,该样品孔包含固定或连接到固体支持物(例如样品孔的底部或侧壁)的测序反应的至少一种额外组分(例如,聚合酶(如DNA聚合酶)、测序引物)。靶核酸分子或聚合酶可以直接或通过接头连接至样品壁,例如在样品孔的底部或侧壁。样品孔(例如,纳米孔)还可以包含经由引物延伸反应合成核酸所需的任何其他试剂,例如,合适的缓冲液、辅助因子、酶(例如聚合酶)和脱氧核糖核苷多磷酸,如脱氧核糖核苷三磷酸,其包括脱氧腺苷三磷酸(dATP)、脱氧胞苷三磷酸(dCTP)、脱氧鸟苷三磷酸(dGTP)、脱氧尿苷三磷酸(dUTP)和脱氧胸苷三磷酸(dTTP)dNTP,其包括发光标记(例如荧光团),所述发光标记可以通过本发明的接头连接到dNTP。在一些实施方案中,每一类dNTP(例如,含腺嘌呤的dNTP(例如dATP)、含胞嘧啶的dNTP(例如dCTP)、含鸟嘌呤的dNTP(例如dGTP)、含尿嘧啶的dNTP(例如dUTP)和含胸腺嘧啶的dNTP(例如dTTP))都与不同的发光标记缀合(例如,通过本申请的接头),以便检测从标记发出的光表明并入新合成核酸中的dNTP的身份。在一些实施方案中,“不同的发光标记”可以指包含与另一种dNTP不同的发光标记(例如,不同的荧光团)的一种dNTP。在一些实施方案中,不同的发光标记是指包含不同数量的与另一种dNTP相同或相似的发光标记的dNTP。在一些实施方案中,不同的发光标记是指包含不同数量的与另一种dNTP相同或相似的发光标记的dNTP。在一些实施方案中,不同的发光标记是指包含一种或多种可检测地不同于另一种dNTP的发光特性的dNTP。发光标记可以在任何位置与dNTP缀合(例如,通过本申请的接头),使得发光标记的存在不会抑制dNTP并入新合成的核酸链或抑制聚合酶的活性。在一些实施方案中,发光标记(例如,通过本申请的接头)缀合至dNTP的末端磷酸(例如,γ磷酸)。

在一些实施方案中,单链靶核酸模板可以与核酸合成所需的测序引物、dNTP、聚合酶和其他试剂接触。在一些实施方案中,所有合适的dNTP可以同时与单链靶核酸模板接触(例如,所有dNTP同时存在),使得dNTP的并入可以连续发生。在其他实施方案中,dNTP可以顺序与单链靶核酸模板接触,其中单链靶核酸模板分别与每个合适的dNTP接触,并且在单链靶核酸模板与不同dNTP的接触之间进行洗涤步骤。对于待识别的单链靶核酸模板的每个连续碱基位置,将单链靶核酸模板与每个dNTP分别接触然后洗涤的这种循环可以重复。

在一些实施方案中,测序引物与单链靶核酸模板退火,并且聚合酶根据单链靶核酸模板将dNTP(或其他核苷多磷酸)连续并入引物。在将dNTP并入引物期间或之后,可以用适当的激发光激发与每个并入的dNTP相关的独特发光标记,随后可以使用任何合适的装置和/或方法检测其发射。特定光发射(例如,具有特定发射寿命、强度、光谱和/或其组合)的检测可归因于并入的特定dNTP。从收集的检测到的发光标记获得的序列然后可用于通过序列互补性来确定单链靶核酸模板的序列。

在一些实施方案中,本公开提供了可有利地用于以下共同待审美国专利申请号中所述的技术中的方法和组合物:14/543,865、14/543,867、14/543,888、14/821,656、14/821,686、14/821,688、15/161,067、15/161,088、15/161,125、15/255,245、15/255,303、15/255,624、15/261,697、15/261,724、15/600,979、15/846,967、15/847,001、15/971,493、62/289,019、62/296,546、62/310,398、62/339,790、62/343,997、62/344,123、以及62/426,144,其中每一个的内容均通过引用并入本文。

试剂盒

在其他方面,本申请提供了用于对模板核酸进行测序的试剂盒。在一些实施方案中,试剂盒包含如本文所述的多种类型的发光标记的核苷酸。在一些实施方案中,每种类型的标记的核苷酸都包含两个或多个发光标记,其通过根据本申请的接头与一个或多个核苷多磷酸连接。在一些实施方案中,每种类型的标记的核苷酸包含与FRET标记连接的核苷多磷酸,所述标记包含至少三个发光分子,包括根据本申请的至少一个供体分子和至少一个受体分子。在一些实施方案中,多个核苷酸选自图3A-3C、3E-3G、4A-4C、5A-5B、6A-6C和8-10中所述的标记的核苷酸。例如,在一些实施方案中,多个核苷酸根据图3G所示的结构设计。在一些实施方案中,多个核苷酸根据图3B(306)、图3B(308)和图5A(502)中所示的结构设计。在一些实施方案中,多个核苷酸根据图11A、图11E、图12、图13A、图13B、图13C、图14、图15和图16中所示的结构设计。在一些实施方案中,所述试剂盒还包含聚合酶(例如,DNA聚合酶,如本文别处所述)。在一些实施方案中,所述试剂盒还包含与被测序的模板核酸互补的引物。

在一些方面,本申请提供了包含一种或多种本文所述的亮标记反应物的反应混合物。在一些实施方案中,所述反应混合物包括加入到测序反应中的混合物。在一些实施方案中,所述反应混合物包括聚合酶。在一些实施方案中,所述聚合酶被配置为固定在固体支持物上(例如,样品孔的底部,如本文别处所述)。在一些实施方案中,所述反应混合物包含待测序的模板核酸。在一些实施方案中,所述反应混合物包含与模板核酸的一部分互补的引物。在一些实施方案中,所述反应混合物包含引发测序反应所需的一种或多种组分(例如,二价金属离子,例如镁或铁)。在一些实施方案中,所述反应混合物包含稳定测序反应所需的一种或多种组分(例如,一种或多种缓冲剂、一种或多种还原剂等)。

FRET核酸接头

在一些实施方案中,本申请提供了标记的核苷酸,其包含经由如本文所述的核酸接头与包含FRET对的至少两个发光标记或发光分子连接的核苷酸(例如,核苷多磷酸)。在一些实施方案中,所述至少两个发光标记或发光分子包含至少一个供体标记(本文也称为供体分子)和至少一个受体标记(本文也称为受体分子),其中供体标记发射光谱与受体标记吸收光谱重叠以形成FRET对。术语“FRET标记”是指发光标记,其包含能够进行FRET的至少一个供体分子和至少一个受体分子。在一些实施方案中,包含FRET对或FRET标记的核酸接头在本文中可称为FRET核酸接头。

在一些实施方案中,FRET核酸接头包含一个供体标记和一个受体标记。在一些实施方案中,FRET核酸接头包含一个供体标记和一个以上的受体标记(例如,2、3、4、5、6、7、8、9、10或更多个受体标记)。在一些实施方案中,FRET核酸接头包含一个以上的供体标记(例如,2、3、4、5、6、7、8、9、10或更多个供体标记)和一个受体标记。在一些实施方案中,FRET核酸接头包含至少三个发光分子,包括至少一个供体分子和至少一个受体分子。在一些实施方案中,供体分子与受体分子的比例为1:1。在一些实施方案中,供体分子与受体分子的比例大于1:1(如1.5:1、2:1、3:1、3.5:1、4:1或更高)。在一些实施方案中,与在1:1比例下观察到的亮度相比,供体分子与受体分子的比例大于1:1会导致FRET标记的亮度增加。在一些实施方案中,所述增加大于5%、10%、15%、20%或更多。在一些实施方案中,所述增加为约5-10%、10-15%、15-20%、20%-25%或更多。在一些实施方案中,受体分子与供体分子的比例大于1:1(如1.5:1、2:1、3:1、3.5:1、4:1或更高)。在一些实施方案中,与在1:1比例下观察到FRET功效相比,受体分子与供体分子的比例大于1:1会导致FRET功效的增加。在一些实施方案中,所述增加大于5%、10%、15%、20%或更多。在一些实施方案中,所述增加为约5-10%、10-15%、15-20%、20%-25%或更多。

在一些实施方案中,FRET核酸接头包含至少两个供体分子和至少一个受体分子。在一些实施方案中,FRET核酸接头包含两个供体分子和一个受体分子。在一些实施方案中,FRET核酸接头包含三个供体分子和一个受体分子。在一些实施方案中,FRET核酸接头包含四个供体分子和一个受体分子。在一些实施方案中,FRET核酸接头包含两个供体分子和两个受体分子。在一些实施方案中,与在1:1比例下观察到的亮度相比,增加供体分子的数量超过受体分子的数量会导致FRET标记的亮度增加。在一些实施方案中,所述增加大于5%、10%、15%、20%或更多。在一些实施方案中,所述增加为约5-10%、10-15%、15-20%、20%-25%或更多。在一些实施方案中,FRET核酸接头包含至少两个受体分子和至少一个供体分子。在一些实施方案中,FRET核酸接头包含两个受体分子和一个供体分子。在一些实施方案中,FRET核酸接头包含三个受体分子和一个供体分子。在一些实施方案中,FRET核酸接头包含四个受体分子和一个供体分子。在一些实施方案中,与在1:1比例下观察到的FRET功效相比,增加受体分子的数量超过供体分子的数量会导致FRET功效增加。在一些实施方案中,所述增加大于5%、10%、15%、20%或更多。在一些实施方案中,所述增加为约5-10%、10-15%、15-20%、20%-25%或更多。

在一些实施方案中,FRET核酸接头包含一个或多个茎环(例如,1、2、3、4、5或更多个茎环)。在一些实施方案中,包含一个或多个茎环的FRET核酸接头在茎环结构的环中包括供体和/或受体标记或分子中的至少一个。在一些实施方案中,每个供体分子位于茎环结构的环中。在一些实施方案中,每个供体和受体分子位于茎环结构的环中。在一些实施方案中,一个或多个受体分子位于两个或更多个茎环交汇处。在一些实施方案中,FRET核酸接头包含两个或更多个茎环。在一些实施方案中,FRET核酸接头包含三个或更多个茎环。在一些实施方案中,FRET核酸接头包含四个或更多个茎环。

在一些实施方案中,FRET核酸接头是线性接头。在一些实施方案中,FRET核酸接头是分支接头。在一些实施方案中,FRET核酸接头具有3向DNA连接点。

在一些实施方案中,所述核酸包含第一寡核苷酸链和与第一寡核苷酸链杂交的第二寡核苷酸。在一些实施方案中,供体分子和受体分子位于同一条链上。在一些实施方案中,受体分子与供体分子位于不同的链上。在一些实施方案中,一个或多个供体分子和一个或多个受体分子位于相同或不同的链上。

在一些实施方案中,一个或多个受体分子位于一个或多个供体分子的5'。在一些实施方案中,一个或多个受体分子位于一个或多个供体分子的3'。在一些实施方案中,受体分子可以在两个供体分子之间。

在一些实施方案中,一个或多个供体分子(例如,1、2、3、4、5或更多个)和/或一个或多个受体分子(例如,1、2、3、4、5或更多个)被并入核酸接头中。

在一些实施方案中,供体分子和受体分子相隔3个碱基(或碱基对或核苷酸)。在一些实施方案中,供体分子和受体分子相隔4个碱基。在一些实施方案中,供体分子和受体分子相隔5个碱基。在一些实施方案中,供体分子和受体分子相隔6个碱基。在一些实施方案中,供体分子和受体分子相隔7个碱基。在一些实施方案中,供体分子和受体分子相隔8个碱基。在一些实施方案中,供体分子和受体分子相隔9个碱基。在一些实施方案中,供体分子和受体分子相隔10个碱基。在一些实施方案中,供体分子和受体分子相隔11个碱基。在一些实施方案中,供体分子和受体分子相隔12个碱基。在一些实施方案中,供体分子和受体分子相隔13个碱基。在一些实施方案中,供体分子和受体分子相隔3个或更多个碱基。在一些实施方案中,供体分子和受体分子相隔4个或更多个碱基。在一些实施方案中,供体分子和受体分子相隔5个或更多个碱基。在一些实施方案中,供体分子和受体分子相隔6个或更多个碱基。在一些实施方案中,供体分子和受体分子相隔3-4、4-5、5-6、3-6、3-10或5-10个碱基。在一些实施方案中,每个供体-受体分子对相隔相同数量的碱基。在一些实施方案中,不同的供体-受体分子对相隔相同或不同数量的碱基。通常,更长的距离可以用于供体和受体分子对,其中供体分子发射光谱和受体标记吸收光谱之间的重叠更大。

在一些实施方案中,供体分子和受体分子之间的距离为1-3nm。在一些实施方案中,供体分子和受体分子之间的距离为1-4nm、1-5nm、1-6nm、1-7nm、1-8nm、1-9nm或1-10nm。在一些实施方案中,供体分子和受体分子之间的距离为2-4nm、2-5nm、2-8nm或2-10nm。在一些实施方案中,供体分子和受体分子之间的距离为3-5nm、3-8nm或3-10nm。通常,更长的距离可以用于供体和受体分子对,其中供体分子发射光谱和受体标记吸收光谱之间的重叠更大。

在一些实施方案中,供体-受体分子对之间的FRET功效为约65%-约100%。在一些实施方案中,供体-受体分子对之间的FRET功效为约75%-约95%。在一些实施方案中,供体-受体分子对之间的FRET功效为约80%-约90%。在一些实施方案中,供体-受体分子对之间的FRET功效为约85%。在一些实施方案中,供体-受体分子对之间的FRET功效为大于约65%、大于约70%、大于约75%、大于约80%、大于约85%或大于约90%。

在一些实施方案中,FRET核酸接头包含DNA、RNA、PNA、LNA或其衍生物。在一些实施方案中,FRET核酸接头包含LNA。不希望受理论束缚,用LNA代替GC对将导致亮度和/或效率的提高,因为GC对淬灭了信号。

FRET核酸接头的实例配置和使用包含FRET核酸接头的标记的核苷酸的测序实验的结果示于图11A-11F和图12-17中。在一些实施方案中,本申请的FRET核酸接头表现出大的斯托克斯位移。例如,在一些实施方案中,供体标记的532nm的激发波长和受体标记的590nm的发射波提供了一个大的斯托克斯位移,其使用约570nm的光谱滤波器增强检测。在一些实施方案中,本申请的FRET核酸接头有利于更红的发射和/或更红的光谱滤波器的激光抑制。在一些实施方案中,本申请的FRET核酸接头允许使用更蓝(例如457、488、515nm)的激发波长。

因此,在一些实施方案中,FRET核酸接头可以与本申请所述的一种或多种其他接头或标记的核苷酸组合。

实施例

实施例1:使用核酸接头的染料连接策略

多种新一代测序技术实施标记的反应成分。例如,基于检测或观察与每种碱基类型对应的独特发光特性,染料标记的核苷酸可用于在并入事件期间进行特定的碱基调用(specific base call)。因此,对于集合中的每个碱基,这些属性(例如寿命和强度)必须易于识别。增强标记的核苷酸荧光强度的初步努力表明,当将第二个染料分子添加到构建体时,染料标记的核苷酸的亮度会增加。然而,相对于单标记变体,荧光寿命显著降低。在开发改进的标记的核苷酸时,核酸被研究为将荧光染料连接至核苷酸的核心结构。

多重标记的核苷酸中荧光寿命改变的一个潜在来源是同一构建体的染料分子之间的相互作用程度,这可能导致淬灭效应。通过生成图8中所示的染料标记的核苷酸进一步探索了这种可能性。两个染料分子(DyLight 530R2)通过核酸接头连接到核苷多磷酸上。未标记的寡核苷酸链与标记的寡核苷酸链杂交以赋予核酸接头刚性。第一构建体800是使用用于将染料连接至核酸的C6-氨基-T间隔物制成的,而第二构建体802是使用用于染料连接的醇胺间隔物制成的。

第一构建体的分析显示荧光寿命约为1.4ns,而第二构建体的荧光寿命约为3.5ns。与第一构建体相比,使用第二构建体测得的寿命增加归因于使用相对较短的用于染料连接的间隔物。如图8所示,第一构建体的C6-氨基-T间隔物的长度大于第二构建体的醇胺间隔物的长度。第二构建体寿命延长的一种可能解释是,缩短的间隔物长度通过限制连接的染料的移动范围的重叠的程度来减少染料-染料的相互作用。

实施例2:增加的接头刚性延长荧光寿命

根据间隔物长度可能影响荧光寿命的观察结果,可能是由于染料的空间重叠,认为多标记分子中染料的对称排列可能具有类似的效果。产生了Y形核酸接头并示于图9中。初始构建体具有通过所示的分支接头共价连接的三个寡核苷酸链。两条链各自末端连接至染料分子(Chromis 530N),而第三条链末端连接至核苷多磷酸。第三条链与未标记的链进一步杂交,以赋予核苷多磷酸和标记区域之间的刚性。该构建体的第二个版本是通过与寡核苷酸组分902杂交产生的,该寡核苷酸组分与第一和第二条链杂交。

初始构建体的分析显示了大约2.3ns的荧光寿命,而具有附加寡核苷酸组分902的构建体显示出大约4.2ns的寿命。对于后一种构建体测得的寿命增加的一种可能解释是寡核苷酸组分902赋予标记区域刚性。可以想象,增加的刚度可以通过将每种染料限制在更有限的运动范围内来促进染料分离。

实施例3:染料间隔物长度对受限接头配置的影响

通过生成图10中所示的三染料标记的构建体,进一步开发了几何受限的接头构型。如图所示,核酸接头部分包括三个主要的寡核苷酸成分。第一组分包括通过所示的四向分支接头共价连接的四个寡核苷酸链。这些链中的三条各自末端连接至染料分子(AttoRho6G),而第四条链与第二寡核苷酸组分杂交。第二寡核苷酸组分通过所示的分支接头末端连接至两个核苷多磷酸。第三寡核苷酸组分,其包括通过所示的分支接头共价连接的三条寡核苷酸链,与第一组分的三个染料标记的链杂交以赋予标记区域的刚性。根据图10中所示的方框区域产生了具有不同间隔物长度的两个单独的三-染料构建体。

具有较长间隔物的第一个三-染料标记的核苷酸构建体(参见图10,方框区域,顶部)相对于单染料标记的核苷酸构建体显示出三倍的荧光强度。此外,注意到与具有相同染料分子的两个染料、一个核苷酸构建体(未显示)相比,寿命略有缩短。对具有较短间隔物的第二个三-染料标记的核苷酸构建体(参见图10,方框区域,底部)获得的测量结果显示相对于第一个三-染料标记的构建体荧光寿命略有增加。

早期的三-染料标记的核苷酸在测序反应中产生多个寿命,这被认为是相互作用的两种染料产生第一个寿命,而非相互作用的染料产生第二个寿命的结果。重要的是,在测序反应期间,对于图10中所示的任一三-染料标记的分子仅观察到单一寿命。

实施例4:FRET核酸接头的表征

图12描绘了具有线性核酸的FRET核酸接头结构的实例,其中受体分子在中心(A)并且在两侧有两个供体分子(D)。在这个实例中,每个供体分子与受体分子相距9个碱基。两个供体-受体分子距离相似但不一定相同。观察到83%的FRET功效。

开发了在供体和受体分子之间以及供体和受体分子周围具有不同数量的AT和GC对的FRET核酸接头。这些FRET核酸接头示于图13A-13C中。ATRho6G被修饰以生成更短和更刚性的分子,ATRho6G-C3。具体地,ATRho6G的叔酰胺侧链(羧丁基)变为叠氮丙基。使用ATRho6G-C3,可以将供体-受体距离减少1个碱基对(图13A)。使用内部花青染料和/或用与C2-氨基-T(一种不会破坏双链结构的修饰物)缀合的BODIPY染料代替无碱基氨基缀合位点,也可以减少供体-受体距离(图13B)。对于图13B中所示的花青-BODIPY FRET对,观察到90%的FRET功效。具有6-碱基对间隔物的另外的FRET核酸接头示于图13C中。

在ATRho6GC3-BODIPY对上进行了供体和受体分子的相对位置如何影响FRET功效和亮度的系统研究。受体分子的最佳位置与供体分子相距5个碱基,其具有90%的FRET功效(图14)。

接下来,测试发光分子与标记的核苷酸(或聚合酶-模板复合物)之间的距离对测序信号强度的影响。距离标记的核苷酸(或聚合酶-模板复合物)超过15-16nm的发光分子没有有效地发光。与三向DNA连接点结构相比的线性结构中发光分子和标记的核苷酸之间的距离显示在图15中。

还测试了受体分子数量对FRET功效的影响。比较了Cy3-Cy5对在1-受体-1-供体或1-供体-2-受体排列中的FRET功效。当添加额外的受体分子时,FRET功效从约60-70%提高到约90%(图16)。因此,使用受体的多个拷贝发出供体发射导致更有效的能量转移。

图17提供了对于不同供体和受体分子对、比例和方向获得的FRET功效的总结。

等同物及范畴

虽然本文已经描述和说明了多个创造性实施方案,但是本领域普通技术人员将容易想到用于执行这里描述的功能和/或获得结果和/或一个或多个优点的各种其他手段和/或结构,并且这些变化和/或修改中的每一个都被认为在本文所述的创造性实施方案的范围内。更一般地,本领域技术人员将容易理解,本文描述的所有参数、尺寸、材料和配置都是实例性的,并且实际的参数、尺寸、材料和/或配置将取决于本发明教导所用于的一个或多个特定应用。本领域技术人员将认识到,或者能够仅使用常规实验来确定本文所述的具体创造性实施方案的许多等同物。因此,应该理解的是,前述实施方案仅通过实例的方式呈现,并且在所附权利要求及其等同物的范围内,创造性实施方案可以以不同于具体描述和要求的方式实施。本公开的创造性实施方案涉及本文所述的每个单独的特征、系统、物品、材料、试剂盒和/或方法。此外,如果两个或更多个这样的特征、系统、物品、材料、试剂盒和/或方法不相互矛盾,则两个或更多个这样的特征、系统、物品、材料、试剂盒和/或方法的任何组合都包括在本公开的发明范围内。

本文定义和使用的所有定义应该理解为控制字典定义、通过引用并入的文件中的定义和/或定义术语的普通含义。

本文公开的所有参考文献、专利和专利申请都通过引用的方式并入每个被引用的主题,在一些情况下,其可以涵盖整个文件。

在说明书和权利要求书中使用的不定冠词“一”和“一个”,除非有明确的相反指示,否则应理解为“至少一个”。

说明书和权利要求书中使用的短语“和/或”应理解为表示如此结合的元素中的“任一种或两者”,即在某些情况下结合存在而在其他情况下未结合存在的元素。用“和/或”列出的多个元素应该以相同的方式解释,即“一个或多个”这样结合的元素。除了“和/或”条款中明确指出的元素之外,还可能存在其他元素,无论这些元素是否与这些明确指出的元素相关。因此,作为非限制性实例,当与诸如“包括”之类的开放式语言结合使用时,在一个实施方案中,对“A和/或B”的引用可以仅指A(任选地包括除B之外的元素);在另一个实施方案中,仅指B(任选地包括除A之外的元素);在又一个实施方案中,指A和B两者(任选地包括其他元素);等。

如在说明书和权利要求书中所使用的,“或”应该理解为具有与上面定义的“和/或”相同的含义。例如,当分隔列表中的项目时,“或”或“和/或”应被解释为包含性的,即包括至少一个,但也包括多于一个的元素的数量或列表,以及任选地,其他的未列出的项目。只有明确指出与此相反的术语,例如“仅一个”或“恰好一个”,或者当在权利要求书中使用时,“由......组成”将指包括多个或一系列元素中的恰好一个元素。通常,本文中使用的术语“或”仅应被解释为表示排他性的替代(即“一个或另一个,但不是两个”),当前面有排他性的术语时,例如“任一”、“其中之一”、“仅其中之一”或“恰好其中之一”“基本上由……组成”在权利要求书中使用时,应具有专利法领域中使用的通常含义。

如本文在说明书和权利要求书中所使用的,有关一个或多个元素的列表的短语“至少一个”应被理解为表示从元素列表中的任何一个或多个元素中选择的至少一个元素,但不一定包括元素列表中具体列出的每个元素中的至少一个,并且不排除元素列表中的元素的任何组合。该定义还允许任选地存在除了在短语“至少一个”所指的元素列表中具体标识的元素之外的元素,无论与那些具体标识的元素相关还是不相关。因此,作为非限制性实例,“A和B中的至少一个”(或等效地,“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)可以指,在一个实施方案中,至少一个,可选地包括多于一个A而不存在B(以及任选地包括除B之外的元素);在另一个实施方案中,指至少一个,可选地包括多于一个B而不存在A(以及任选地包括除A之外的元素);在又一个实施方案中,指至少一个,可选地包括多于一个A,以及至少一个,可选地包括多于一个B(以及任选地包括其他元素);等

还应当理解,除非明确指出相反的情况,否则在这里要求保护的包括多于一个步骤或动作的任何方法中,该方法的步骤或动作的顺序不必限于叙述该方法的步骤或动作的顺序。

在权利要求书以及上述说明书中,诸如“包括”、“包含”、“携带”、“具有”、“含有”、“涉及”、“保持”、“包括(composed of)”等的所有连接词应被理解为开放式的,即意味着包括但不限于。按照美国专利局《专利审查程序手册》第2111.03节的规定,只有连接词“由……组成”和“基本上由……组成”才分别是封闭或半封闭的连接词。应当理解,在本文件中使用开放式连接词(例如,“包括”)描述的实施方案也涵盖,在替代实施方案中,由开放式连接词描述的特征组成和基本上由其组成。例如,若本申请描述“包括A及B的组合物”,则本申请亦涵盖替代实施方案“由A及B组成的组合物”及“主要由A及B组成的组合物”。

SEQUENCE LISTING

<110> 宽腾矽公司

<120> 高强度标记的反应物组合物和测序方法

<130> R0708.70059WO00

<140> Not Yet Assigned

<141> 2020-01-23

<150> US 62/795,932

<151> 2019-01-23

<160> 19

<170> PatentIn version 3.5

<210> 1

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (21)..(22)

<223> 由接头修饰

<220>

<221> misc_feature

<222> (30)..(31)

<223> 由接头修饰

<400> 1

cacgcgtgga accctcgatt aattgcctta attgc 35

<210> 2

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 2

gcaatttaag gcaatttaat cgagggttcc acgcgtg 37

<210> 3

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (17)..(18)

<223> 由iCy3修饰

<400> 3

ccacgcgtgg aacccttttg ggatttcca 29

<210> 4

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 4

tggatcccaa gggttccacg cgtgg 25

<210> 5

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (30)..(30)

<223> 由接头修饰

<220>

<221> misc_feature

<222> (50)..(50)

<223> 由接头修饰

<400> 5

cgctagtccg tgagtaccca caaatgtttt ttacatttga gtatacattt tttgtataca 60

ggg 63

<210> 6

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 6

tactcacgga ctagcg 16

<210> 7

<211> 9

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 7

tatgggtag 9

<210> 8

<211> 9

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 8

ctacccata 9

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 9

ccacgcgtgg tagggatcca 20

<210> 10

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 10

tggatcccta ccacgcgtgg 20

<210> 11

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 11

agcttgggca actgtta 17

<210> 12

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 12

taacagttgc ccaagct 17

<210> 13

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 13

gcaatttaac gatggttcca cgcgtg 26

<210> 14

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (20)..(21)

<223> 由接头修饰

<400> 14

cacgcgtgga accatcgtta attgc 25

<210> 15

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 15

gtgcgctacc ttgggaatat tgcttacg 28

<210> 16

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (5)..(6)

<223> 由接头修饰

<400> 16

cgttaattgc tttttgcaat gcaatattcc caaggtagcg cac 43

<210> 17

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (22)..(22)

<223> 由接头修饰

<220>

<221> misc_feature

<222> (32)..(32)

<223> 由接头修饰

<400> 17

cacgcgtgga accctcgatt atattgcctt atattgc 37

<210> 18

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (5)..(6)

<223> 由接头修饰

<220>

<221> misc_feature

<222> (14)..(15)

<223> 由接头修饰

<400> 18

cgttaattcc gttaattagc tcccaaggtg cgcac 35

<210> 19

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 19

gtgcgcacct tgggagctaa tttaacggaa tttaacg 37

123页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:罗汉果苷生物催化方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!