用于光学检测和测序的接头和方法

文档序号:1894605 发布日期:2021-11-26 浏览:35次 >En<

阅读说明:本技术 用于光学检测和测序的接头和方法 (Linker and method for optical detection and sequencing ) 是由 琳达·G·李 吉拉德·阿莫吉 史蒂文·孟肯 于 2020-02-18 设计创作,主要内容包括:本公开提供用于标记底物例如核苷酸、蛋白质、抗体、脂质和细胞的标记试剂。本文提供的标记试剂可包括荧光标记和半刚性接头。本文还提供了用于使用包含此类标记试剂的材料进行核酸测序的方法。(The present disclosure provides labeling reagents for labeling substrates such as nucleotides, proteins, antibodies, lipids, and cells. The labeling reagents provided herein can include a fluorescent label and a semi-rigid linker. Also provided herein are methods for nucleic acid sequencing using materials comprising such labeling reagents.)

用于光学检测和测序的接头和方法

交叉引用

本申请要求2019年2月19日提交的美国临时申请号62/807,550的权益,该申请的全部内容通过引用并入本文。

背景技术

细胞和生物分子的检测、定量和测序对于分子生物学和医学应用(例如,诊断)可能很重要。基因检测可能对许多诊断方法有用。例如,由罕见的遗传学改变(例如,序列变异)或表观遗传标志物的变化(例如癌症和部分或完全非整倍体)引起的病症可以用脱氧核糖核酸(DNA)或核糖核酸(RNA)序列信息检测或更准确地表征。

核酸测序是可用于为核酸样本提供序列信息的过程。这样的序列信息可能有助于诊断和/或治疗患有病况的受试者。例如,受试者的核酸序列可用于鉴定、诊断和潜在地开发用于遗传疾病的治疗。作为另一个实例,对病原体的研究可能导致接触传染病的治疗。

核酸测序可以包括荧光标记的部分的使用。此类部分可以用有机荧光染料标记。检测方案的灵敏度可以通过使用具有高消光系数和量子产率的染料来提高,这些特性的乘积可以称为染料的“亮度”。染料亮度可能会因猝灭现象而减弱,包括通过生物材料猝灭、通过与其他染料的邻近猝灭和通过溶剂猝灭。亮度损失的其他途径包括光漂白、对分子氧的反应性和化学分解。

发明内容

本公开提供了改进的光学(例如,荧光)标记试剂和核酸加工方法,包括使用光学(例如,荧光)标记的部分。本文提供的材料和方法可包括有机荧光染料的使用。本文提供的材料可允许优化的分子猝灭以促进有效的核酸加工和检测。分子猝灭机制可包括光诱导电子转移、光诱导空穴转移、Forster能量转移、Dexter猝灭等。许多类型的猝灭的通用解决方案需要将染料与猝灭剂部分的物理分离,但现有解决方案在易用性、成本、溶剂依赖性和多分散性方面各有优缺点。因此,本公开认识到需要解决这些限制的材料和方法并提供了包含改进的接头部分的材料。

在一个方面,本公开提供了一种荧光标记试剂,其包括:(a)荧光染料;(b)接头,所述接头连接至荧光染料并配置为偶联至底物以对底物进行荧光标记,其中所述接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不多于两个原子彼此连接,并且其中接头包含非蛋白氨基酸,该非蛋白氨基酸包含所述两个或更多个环体系的环体系。

在一些实施方案中,偶联至底物的荧光标记试剂被配置为发射荧光信号。

在一些实施方案中,接头被配置为在接头和底物相关联时在荧光染料和底物之间建立至少约0.5纳米(nm)的功能长度。在一些实施方案中,功能长度基于一个或多个选自温度、溶剂、pH和包含荧光标记试剂的溶液的盐浓度的成员而变化。在一些实施方案中,功能长度为约0.5纳米(nm)至50nm。

在一些实施方案中,接头被配置为与多种荧光染料或底物形成键。

在一些实施方案中,接头包含多个氨基酸。在一些实施方案中,多个氨基酸包括多个非蛋白氨基酸。在一些实施方案中,多个氨基酸包含多个羟脯氨酸。在一些实施方案中,多个氨基酸包含三个或更多个羟脯氨酸。在一些实施方案中,多个氨基酸包含十个或更多个羟脯氨酸。

在一些实施方案中,多个氨基酸包括均聚物。在一些实施方案中,均聚物包含重复单元,该重复单元是氨基酸的。在一些实施方案中,重复单元是羟脯氨酸。在一些实施方案中,接头的均聚物包含三个或更多个羟脯氨酸。在一些实施方案中,接头的均聚物包含十个或更多个羟脯氨酸。

在一些实施方案中,接头包括共聚物。在一些实施方案中,共聚物包含两个或更多个重复单元,其中两个或更多个重复单元中的至少一个是氨基酸。在一些实施方案中,氨基酸是非蛋白氨基酸。

在一些实施方案中,两个或更多个环体系包含芳族环或脂族环。在一些实施方案中,两个或更多个环体系包括具有5个或6个成员的环。

在一些实施方案中,两个或更多个环体系中的至少两个通过一个或两个sp3碳原子彼此连接。在一些实施方案中,两个或更多个环体系中的至少两个通过sp2碳原子彼此连接。在一些实施方案中,两个或更多个环体系中的至少两个在没有中间碳原子的情况下彼此直接连接。

在一些实施方案中,两个或更多个环体系中的至少两个包含一个或多个水溶性基团中的水溶性基团。在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团附加到两个或更多个环体系的环体系上。在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团是两个或更多个环体系的环体系的组成部分。在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团带正电荷。在一些实施方案中,一个或多个水溶性基团选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。在一些实施方案中,一个或多个水溶性基团降低荧光标记试剂的logP。在一些实施方案中,荧光标记试剂包含比水溶性基团更多的环体系。

在一些实施方案中,接头被配置为与底物形成共价键。在一些实施方案中,接头被配置为与底物形成非共价键。

在一些实施方案中,荧光标记试剂进一步包含可切割基团,该可切割基团被配置为被切割以将荧光标记试剂或其部分与底物分离。在一些实施方案中,可切割基团被配置为被切割以将包含荧光染料的荧光标记试剂的第一部分和接头的第一部分与包含接头的第二部分的荧光标记试剂的第二部分分离。在一些实施方案中,可切割基团选自叠氮甲基基团、二硫键、烃基二硫代甲基基团和2-硝基苄氧基基团。在一些实施方案中,通过应用下组中的一个或多个成员可切割基团是可切割的:三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)、四氢吡喃基(THP)、紫外(UV)光及其组合。在一些实施方案中,接头包含选自的部分。

在一些实施方案中,荧光标记试剂被配置为发射约625纳米(nm)-740nm的信号。在一些实施方案中,荧光标记试剂被配置为发射约500纳米(nm)-565nm的信号。

在一些实施方案中,底物是蛋白质、脂质、细胞或抗体。在一些实施方案中,底物是核苷酸。在一些实施方案中,接头通过核苷酸的核碱基与核苷酸附接。在一些实施方案中,底物是荧光猝灭剂、荧光供体或荧光受体。

在另一方面,本公开提供了包含溶液的组合物,所述溶液包含荧光标记的核苷酸,其中所述荧光标记的核苷酸包含通过接头与核苷酸连接的荧光染料,其中所述接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不多于两个原子彼此连接,并且其中接头包含非蛋白氨基酸,该非蛋白氨基酸包含所述两个或更多个环体系的环体系。

在一些实施方案中,荧光标记的核苷酸被配置为发射荧光信号。

在一些实施方案中,接头包含多个氨基酸。在一些实施方案中,多个氨基酸包括多个非蛋白氨基酸。在一些实施方案中,接头包含多个羟脯氨酸。

在一些实施方案中,两个或更多个环体系中的至少两个环体系通过sp2碳原子彼此连接。在一些实施方案中,两个或更多个环体系中的至少两个环体系在没有中间碳原子的情况下彼此直接连接。

在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团附加到两个或更多个环体系的环体系上。在一些实施方案中,一个或多个水溶性基团选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。

在一些实施方案中,接头进一步包含可切割基团,该可切割基团被配置为被切割以将荧光染料与核苷酸分离。在一些实施方案中,可切割基团选自叠氮甲基基团、二硫键、烃基二硫代甲基基团和2-硝基苄氧基基团。

在一些实施方案中,溶液包含多个荧光标记的核苷酸,其中所述多个荧光标记的核苷酸中的每个荧光标记的核苷酸包含相同类型的荧光染料、相同类型的接头和相同类型的核苷酸。在一些实施方案中,多个荧光标记的核苷酸中的每个荧光标记的核苷酸的每个接头具有相同的分子量。在一些实施方案中,溶液还包含多个未标记的核苷酸,其中多个未标记的核苷酸中的每个核苷酸与多个荧光标记的核苷酸中的每个核苷酸的类型相同。在一些实施方案中,溶液中多个荧光标记的核苷酸与多个未标记的核苷酸的比例为至少约1:4。在一些实施方案中,该比例为至少约1:1。

本公开还提供了一种方法,该方法包括将本文所述的组合物提供给与核酸链偶联的模板核酸分子。

在一些实施方案中,该方法进一步包括使模板核酸分子和组合物经受足以将荧光标记的核苷酸掺入与模板核酸分子偶联的核酸链的条件。在一些实施方案中,组合物进一步包含聚合酶,其中聚合酶将荧光标记的核苷酸掺入核酸链中。

在一些实施方案中,该方法进一步包括检测来自荧光标记的核苷酸的信号。

在一些实施方案中,该方法进一步包括使荧光标记的核苷酸与被配置为从核苷酸切割荧光染料的切割试剂接触。在一些实施方案中,切割试剂被配置为切割接头以提供与接头的一部分附接的核苷酸。在一些实施方案中,附接至核苷酸的接头部分包含硫醇部分、芳族部分或其组合。

在一些实施方案中,该方法进一步包括,在使荧光标记的核苷酸与切割试剂接触之后,使模板核酸分子和组合物经受足以将另外的荧光标记的核苷酸掺入与模板核酸分子偶联的核酸链的条件。

在一些实施方案中,模板核酸分子被固定在支持物上。

在另一方面,本公开提供了包括提供荧光标记试剂的方法,其中所述荧光标记试剂包含荧光染料和连接至所述荧光染料的接头,其中所述接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不多于两个原子彼此连接,并且其中接头包含非蛋白氨基酸,该非蛋白氨基酸包含所述两个或更多个环体系的环体系。

在一些实施方案中,该方法进一步包括使荧光标记试剂与底物接触以产生荧光标记的底物,其中连接到荧光染料的接头与底物偶联。在一些实施方案中,底物是核苷酸。在一些实施方案中,底物是蛋白质、脂质、细胞或抗体。在一些实施方案中,荧光标记的底物被配置为发射荧光信号。

在一些实施方案中,该方法进一步包括使荧光标记的底物与切割试剂接触,其中切割试剂被配置为从荧光标记的底物切割荧光标记试剂或其一部分以产生带疤痕的底物(scarred substrate)。在一些实施方案中,切割试剂被配置为切割接头的可切割基团,其中可切割基团选自叠氮甲基基团、二硫键、烃基二硫代甲基基团和2-硝基苄氧基基团。在一些实施方案中,带疤痕的底物包含硫醇部分、芳族部分或其组合。

在一些实施方案中,该方法进一步包括,在产生带疤痕的底物之前,使荧光标记的底物和核酸分子经受足以将荧光标记的底物掺入核酸分子中的条件。在一些实施方案中,使用聚合酶将荧光标记的底物掺入核酸分子中。

在一些实施方案中,该方法进一步包括,在产生带疤痕的底物之前,使另外的底物和核酸分子经受足以在邻近荧光标记的底物的位置处将另外的底物掺入核酸分子中的条件。在一些实施方案中,另外的底物不包含荧光标记试剂。在一些实施方案中,另外的底物包含荧光标记试剂。

在一些实施方案中,该方法进一步包括,在产生带疤痕的底物之后,使另外的底物和核酸分子经受足以在邻近带疤痕的底物的位置处将另外的底物掺入核酸分子中的条件。在一些实施方案中,另外的底物不包含荧光标记试剂。在一些实施方案中,另外的底物包含荧光标记试剂。

在一些实施方案中,核酸分子被固定在支持物上。

在一些实施方案中,接头包含多个氨基酸。在一些实施方案中,多个氨基酸包括多个非蛋白氨基酸。在一些实施方案中,接头包含多个羟脯氨酸。

在一些实施方案中,两个或更多个环体系中的至少两个环体系通过sp2碳原子彼此连接。在一些实施方案中,两个或更多个环体系中的至少两个环体系在没有中间碳原子的情况下彼此直接连接。

在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团附加到两个或更多个环体系的环体系上。在一些实施方案中,一个或多个水溶性基团选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。

在另一方面,本公开提供了一种试剂盒,其包含:多个接头,其中所述多个接头中的接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不大于两个sp3碳原子彼此连接,并且其中接头包含非蛋白氨基酸,该非蛋白氨基酸包含所述两个或更多个环体系的环体系。

在一些实施方案中,接头包含多个氨基酸。在一些实施方案中,多个氨基酸包括多个非蛋白氨基酸。在一些实施方案中,接头包含多个羟脯氨酸。

在一些实施方案中,两个或更多个环体系中的至少两个环体系通过sp2碳原子彼此连接。在一些实施方案中,两个或更多个环体系中的至少两个环体系在没有中间碳原子的情况下彼此直接连接。

在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团附加到两个或更多个环体系的环体系上。在一些实施方案中,一个或多个水溶性基团选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。

在一些实施方案中,接头进一步包含可切割基团,该可切割基团被配置为被切割以将接头的第一部分与接头的第二部分分离。在一些实施方案中,可切割基团选自叠氮甲基基团、二硫键、烃基二硫代甲基基团和2-硝基苄氧基基团。在一些实施方案中,通过应用下组中的一个或多个成员可切割基团是可切割的:三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)、四氢吡喃基(THP)、紫外(UV)光及其组合。在一些实施方案中,接头包含选自 的部分。

在一些实施方案中,接头连接至荧光染料。

在一些实施方案中,接头与底物相关联。在一些实施方案中,底物包含蛋白质、脂质、细胞或抗体。在一些实施方案中,底物包含核苷酸。

在一些实施方案中,多个接头包含与第一底物相关联的第一接头和与第二底物相关联的第二接头,其中第一底物和第二底物是不同类型的。在一些实施方案中,第一接头和第二接头包含相同的化学结构。在一些实施方案中,第一底物和第二底物是包含不同类型的核碱基的核苷酸。在一些实施方案中,该试剂盒进一步包含与第三底物相关联的第三接头和与第四底物相关联的第四接头,其中第一底物、第二底物、第三底物和第四底物是不同类型的。在一些实施方案中,第一底物、第二底物、第三底物和第四底物是包含不同类型的核碱基的核苷酸。在一些实施方案中,第一接头和第三接头包含不同的化学结构。在一些实施方案中,第一接头和第三接头包含相同的化学基团。在一些实施方案中,相同的化学基团包含二硫键。

在另一方面,本公开提供了包含本文所述的荧光标记试剂的寡核苷酸分子或其衍生物。

在一些实施方案中,寡核苷酸分子进一步包含一种或多种另外的荧光标记试剂。在一些实施方案中,荧光标记试剂和一种或多种另外的荧光标记试剂包含具有相同化学结构的接头。在一些实施方案中,荧光标记试剂和一种或多种另外的荧光标记试剂包含具有相同化学结构的荧光染料。在一些实施方案中,荧光标记试剂和一种或多种另外的荧光标记试剂与相同类型的底物相关联,其中底物是核苷酸。在一些实施方案中,荧光标记试剂和一种或多种另外的荧光标记试剂与核苷酸的核碱基连接。在一些实施方案中,荧光标记试剂和一种或多种另外的荧光标记试剂与寡核苷酸分子的相邻核苷酸连接。在一些实施方案中,荧光标记试剂和一种或多种另外的荧光标记试剂与寡核苷酸分子的核苷酸相连,所述核苷酸被一个或多个不与荧光标记试剂相连的核苷酸分隔。在一些实施方案中,荧光标记试剂的接头包含可切割基团,该可切割基团被配置为被切割以将荧光染料和与其相关联的底物分离。在一些实施方案中,荧光标记试剂被配置为发射荧光信号。

在一个方面,本公开提供了一种方法,其包括:(a)在足以将多个核苷酸中的第一标记的核苷酸和第二标记的核苷酸掺入与核酸分子互补的生长链中的条件下,使核酸分子与包含多个核苷酸的溶液接触,其中多个核苷酸中的至少约20%是标记的核苷酸;(b)检测来自第一标记的核苷酸和第二标记的核苷酸的一个或多个信号或信号变化,其中一个或多个信号或信号变化指示第一标记的核苷酸和第二标记的核苷酸的掺入;以及(c)解析一个或多个信号或信号变化以确定核酸分子的序列。

在一些实施方案中,第一标记的核苷酸和第二标记的核苷酸是相同的规范碱基类型。在一些实施方案中,第一标记的核苷酸包含荧光染料。在一些实施方案中,第二标记的核苷酸包含荧光染料。在一些实施方案中,荧光染料是可切割的。在一些实施方案中,该方法进一步包括(i)切割荧光染料;(ii)在足以将第二多个核苷酸的第三标记的核苷酸掺入生长链的条件下,使核酸分子与包含第二多个核苷酸的第二溶液接触,其中第二多个核苷酸中的至少约20%是标记的核苷酸;(iii)检测来自第三标记的核苷酸的一个或多个第二信号或信号变化;以及(iv)解析一个或多个第二信号或信号变化以确定核酸分子的第二序列。在一些实施方案中,第一标记的核苷酸和第三标记的核苷酸是不同的规范碱基类型。在一些实施方案中,第三标记的核苷酸包含荧光染料。

在一些实施方案中,该方法进一步包括(i)在足以将第二多个核苷酸的第三标记的核苷酸掺入生长链的条件下,使核酸分子与包含第二多个核苷酸的第二溶液接触,其中第二多个核苷酸中的至少约20%是标记的核苷酸;(ii)检测来自第三标记的核苷酸的一个或多个第二信号或信号变化;以及(iii)解析一个或多个第二信号或信号变化以确定核酸分子的第二序列。在一些实施方案中,第一标记的核苷酸和第三标记的核苷酸是不同的规范碱基类型。在一些实施方案中,第三标记的核苷酸包含荧光染料。在一些实施方案中,(i)中的接触在没有从第一标记的核苷酸或第二标记的核苷酸切割荧光染料的情况下进行。在一些实施方案中,该方法进一步包括重复(i)-(iii)至少5次,每次使用包含至少20%的标记的核苷酸的不同核苷酸溶液,在没有从第一标记的核苷酸或第二标记的核苷酸切割荧光染料的情况下。

在一些实施方案中,多个核苷酸中的至少约50%、70%、80%、90%、95%或99%是标记的核苷酸。在一些实施方案中,基本上所有的多个核苷酸都是标记的核苷酸。在一些实施方案中,(c)中的解析包括确定来自溶液的掺入生长链中的连续核苷酸的数量。在一些实施方案中,该数量选自2、3、4、5、6、7或8个核苷酸。在一些实施方案中,(c)中的解析包括处理溶液公差。

在一些实施方案中,在(a)之后,多个核苷酸中的第三核苷酸已掺入生长链中。在一些实施方案中,第三核苷酸是未标记的。在一些实施方案中,第三核苷酸是标记的。在一些实施方案中,第一标记的核苷酸和第三标记的核苷酸是相同的规范碱基类型。在一些实施方案中,第一标记的核苷酸和第三核苷酸是不同的规范碱基类型。

在一个方面,本公开提供了一种方法,其包括:(a)在足以将多个非终止核苷酸中的第一核苷酸和第二核苷酸掺入与核酸分子互补的生长链中的条件下,使核酸分子与包含多个非终止核苷酸的溶液接触,其中第一个核苷酸是标记的,并且其中多个核苷酸中的至少约20%是标记的核苷酸;(b)检测来自第一核苷酸的一个或多个信号或信号变化,其中一个或多个信号或信号变化指示第一核苷酸的掺入;以及(c)解析一个或多个信号或信号变化以确定核酸分子的序列。

在一些实施方案中,多个非终止核苷酸包含相同规范碱基类型的核苷酸。在一些实施方案中,第一核苷酸包含荧光染料。在一些实施方案中,荧光染料是可切割的。在一些实施方案中,该方法进一步包括:(i)切割荧光染料;(ii)在足以将第二多个非终止核苷酸的第三核苷酸掺入生长链的条件下,使核酸分子与包含第二多个非终止核苷酸的第二溶液接触,其中至少约20%的第二多个非终止核苷酸是标记的核苷酸,其中第三核苷酸是标记的核苷酸;(iii)检测来自第三核苷酸的一个或多个第二信号或信号变化;以及(iv)解析一个或多个第二信号或信号变化以确定核酸分子的第二序列。在一些实施方案中,第一核苷酸和第三核苷酸是不同的规范碱基类型。在一些实施方案中,第三核苷酸包含荧光染料。

在一些实施方案中,该方法进一步包括:(i)在足以将第二多个非终止核苷酸的第三核苷酸掺入生长链的条件下,使核酸分子与包含第二多个非终止核苷酸的第二溶液接触,其中第二多个核苷酸中的至少约20%是标记的核苷酸,其中第三核苷酸是标记的核苷酸;(ii)检测来自第三核苷酸的一个或多个第二信号或信号变化;以及(iii)解析一个或多个第二信号或信号变化以确定核酸分子的第二序列。在一些实施方案中,第一核苷酸和第三核苷酸是不同的规范碱基类型。在一些实施方案中,第三核苷酸包含荧光染料。在一些实施方案中,(i)中的接触在没有从第一核苷酸切割荧光染料的情况下进行。在一些实施方案中,该方法进一步包括重复(i)-(iii)至少5次,每次在没有从第一核苷酸切割荧光染料的情况下使用包含至少20%的标记的核苷酸的不同非终止核苷酸溶液。

在一些实施方案中,多个非终止核苷酸中的至少约50%、70%、80%、90%、95%或99%是标记的核苷酸。在一些实施方案中,基本上所有的多个非终止核苷酸都是标记的核苷酸。在一些实施方案中,(c)中的解析包括确定来自溶液的掺入生长链中的连续核苷酸的数量。在一些实施方案中,该数量选自2、3、4、5、6、7或8个核苷酸。在一些实施方案中,(c)中的解析包括处理溶液公差。

在一些实施方案中,第二核苷酸是未标记的。在一些实施方案中,第二核苷酸是标记的。在一些实施方案中,第一核苷酸和第二核苷酸是相同的规范碱基类型。在一些实施方案中,第一核苷酸和第二核苷酸是不同的规范碱基类型。

在一个方面,本公开提供了一种荧光标记试剂,其包括:(a)荧光染料;和(b)连接至荧光染料和能够与底物相关联以对底物进行荧光标记的接头,其中所述接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接。在一些实施方案中,接头被配置为在接头和底物相关联时在荧光染料和底物之间建立至少约0.5纳米(nm)的功能长度。

在一些实施方案中,功能长度是在溶液中测量的。在一些实施方案中,偶联至底物的荧光标记试剂能够在溶液中发射荧光信号。在一些实施方案中,功能长度基于溶液的温度、溶剂、pH或盐浓度而变化。

在一些实施方案中,功能长度为约0.5至50nm。

在一些实施方案中,接头能够与多种荧光染料和/或底物形成键。

在一些实施方案中,接头具有确定的分子量。

在一些实施方案中,接头包含具有规则重复单元的聚合物。在一些实施方案中,接头是没有规则重复单元的共聚物。

在一些实施方案中,两个或更多个环体系包含芳族环或脂族环。在一些实施方案中,两个或更多个环体系包括具有5个或6个成员的环。在一些实施方案中,两个或更多个环体系中的至少一个包含羟脯氨酸。

在一些实施方案中,两个或更多个环体系通过一个或两个sp3碳原子彼此连接。在一些实施方案中,两个或更多个环体系在没有中间碳原子的情况下彼此直接连接。

在一些实施方案中,两个或更多个环体系中的每一个都包含水溶性基团。在一些实施方案中,荧光标记试剂包含比水溶性基团更多的环体系。在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团附加到两个或更多个环体系的环体系上。在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团是两个或更多个环体系的环体系的组成部分。在一些实施方案中,一个或多个水溶性基团中的至少一个水溶性基团带正电荷。在一些实施方案中,一个或多个水溶性基团选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。在一些实施方案中,一个或多个水溶性基团降低荧光标记试剂的logP。

在一些实施方案中,底物能够与荧光标记试剂的一个或多个不同部分相关联。

在一些实施方案中,接头能够与底物形成共价键。

在一些实施方案中,接头能够与底物形成非共价键。在一些实施方案中,非共价键是生物素-链霉亲和素键。

在一些实施方案中,与底物偶联的荧光标记试剂能够发出荧光信号,该荧光信号与底物相关联的荧光标记试剂的数量成比例。

在一些实施方案中,荧光标记试剂进一步包含可切割基团,该可切割基团能够被切割以将荧光标记试剂或其部分与底物分离。在一些实施方案中,可切割基团的切割留下与底物相关联的疤痕基团。在一些实施方案中,可切割基团是能够被三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)或四氢吡喃基(THP)切割以留下羟基疤痕基团的叠氮甲基基团。在一些实施方案中,可切割基团是能够被三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)或四氢吡喃基(THP)切割以留下硫醇疤痕基团的二硫键。在一些实施方案中,可切割基团是能够被三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)或四氢吡喃基(THP)切割以留下羟基疤痕基团的烃基二硫代甲基基团。在一些实施方案中,可切割基团是能够被紫外(UV)光切割以留下羟基疤痕基团的2-硝基苄氧基基团。

在一些实施方案中,荧光染料是Atto633。

在一些实施方案中,待标记的底物是蛋白质、脂质、细胞或抗体。在一些实施方案中,底物是核苷酸。在一些实施方案中,接头附接至核苷酸的核碱基。在一些实施方案中,底物是荧光猝灭剂、荧光供体或荧光受体。

在一些实施方案中,接头能够通过肽合成化学制备。

在一些实施方案中,接头包含多个氨基酸。在一些实施方案中,多个氨基酸包括多个非蛋白(例如,非天然)氨基酸。在一些实施方案中,接头包含两个半单体的聚合产物。在一些实施方案中,两个半单体具有水溶性基团。在一些实施方案中,两个或更多个环体系中的至少一个包含羟脯氨酸。

在另一方面,本公开提供了一种对核酸分子进行测序的方法,该方法包括:(a)在足以使引物与核酸分子杂交的条件下使核酸分子与引物接触,从而产生测序模板;(b)使测序模板与聚合酶和包含多个荧光标记的核苷酸的溶液接触,其中多个荧光标记的核苷酸中的每个荧光标记的核苷酸是相同类型的,并且其中多个荧光标记的核苷酸中的荧光标记的核苷酸在与核酸分子杂交的引物相邻的多个位置处与核酸分子互补,从而将多个荧光标记的核苷酸中的两个或更多个荧光标记的核苷酸掺入测序模板中;(c)将包含多个荧光标记的核苷酸的溶液从测序模板洗掉;以及(d)测量由测序模板发射的荧光信号,其中所测量的荧光信号的强度大于如果多个荧光标记的核苷酸中的单个荧光标记的核苷酸已掺入到测序模板中可以测量的荧光信号,其中多个荧光标记的核苷酸中的荧光标记的核苷酸包含荧光染料和连接至所述荧光染料和核苷酸的接头,其中所述接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中接头在荧光染料和核苷酸之间建立至少约0.5纳米的功能长度。

在一些实施方案中,荧光标记的核苷酸包括本文所述的任何光学(例如,荧光)标记试剂。

在一些实施方案中,测量的荧光信号的强度与掺入到测序模板中的荧光标记的核苷酸的数量成比例。在一些实施方案中,测量的荧光信号的强度与掺入到测序模板中的荧光标记的核苷酸的数量成线性比例。在一些实施方案中,当相对于掺入测序模板中的荧光标记的核苷酸的数量作图时,测量的荧光信号的强度与大约1.0的斜率成线性比例。

在一些实施方案中,包含多个荧光标记的核苷酸的溶液还包含未标记的核苷酸。在一些实施方案中,溶液中至少约20%的核苷酸是荧光标记的。

在一些实施方案中,将多个荧光标记的核苷酸中的三个或更多个荧光标记的核苷酸掺入测序模板中。

在一些实施方案中,多个荧光标记的核苷酸中的第一荧光标记的核苷酸掺入多个荧光标记的核苷酸的第二荧光标记的核苷酸的四个位置内。

在一些实施方案中,该方法进一步包括,在(d)之后,切割掺入测序模板中的两个或更多个荧光标记的核苷酸的荧光标记。

在另外的方面,本公开提供了一种对核酸分子进行测序的方法,该方法包括:(a)在足以使引物与核酸分子杂交的条件下使核酸分子与引物接触,从而产生测序模板;(b)使测序模板与聚合酶和包含多个第一荧光标记的核苷酸的第一溶液接触,其中多个第一荧光标记的核苷酸中的每个第一荧光标记的核苷酸是相同类型的,并且其中多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸在与核酸分子杂交的引物邻近的位置处与核酸分子互补,从而将多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸掺入测序模板以产生延伸引物;(c)将包含多个第一荧光标记的核苷酸的第一溶液从测序模板洗掉;(d)测量由测序模板发射的第一荧光信号;(e)使测序模板与聚合酶和包含多个第二荧光标记的核苷酸的第二溶液接触,其中多个第二荧光标记的核苷酸中的每个第二荧光标记的核苷酸是相同类型的,并且其中多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸在与核酸分子杂交的延伸引物相邻的位置处与核酸分子互补,从而将多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸掺入测序模板以产生进一步延伸的引物;(f)将包含多个第二荧光标记的核苷酸的第二溶液从测序模板洗掉;以及(g)测量由测序模板发射的第二荧光信号,其中第二荧光信号的强度大于第一荧光信号的强度,其中多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸包含第一荧光染料和与第一荧光染料和第一核苷酸连接的第一接头,并且多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸包含第二荧光染料和与第二荧光染料和第二核苷酸连接的第二接头;并且其中(I)第一接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中第一接头在第一荧光染料和第一核苷酸之间建立至少约0.5纳米的功能长度;和/或(II)第二接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中第二接头在第二荧光染料和第二核苷酸之间建立至少约0.5纳米的功能长度。

在一些实施方案中,第一荧光标记的核苷酸和/或第二荧光标记的核苷酸包含本文所述的任何光学(例如,荧光)标记试剂。

在一些实施方案中,第一接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中第一接头在第一荧光染料和第一核苷酸之间建立至少约0.5纳米的功能长度。

在一些实施方案中,第二接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中第二接头在第二荧光染料和第二核苷酸之间建立至少约0.5纳米的功能长度。

在一些实施方案中,包含多个第一荧光标记的核苷酸的第一溶液还包含第一未标记的核苷酸。

在一些实施方案中,包含多个第二荧光标记的核苷酸的第二溶液还包含第二未标记的核苷酸。

在一些实施方案中,多个第一荧光标记的核苷酸与多个第二荧光标记的核苷酸不同。在一些实施方案中,多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一荧光染料和多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二荧光染料相同,并且多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一核苷酸和多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二核苷酸是不同的多个第二荧光标记的核苷酸。在一些实施方案中,多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一荧光染料和多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二荧光染料不同,并且多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一核苷酸和多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二核苷酸是相同的多个第二荧光标记的核苷酸。在一些实施方案中,多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一荧光染料和多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二荧光染料不同,并且多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一核苷酸和多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二核苷酸是不同的多个第二荧光标记的核苷酸。

在一些实施方案中,将两个或更多个第一荧光标记的核苷酸掺入测序模板。在一些实施方案中,将两个或更多个第二荧光标记的核苷酸掺入测序模板。

在一些实施方案中,该方法进一步包括:(h)使测序模板与聚合酶和包含多个第三荧光标记的核苷酸的第三溶液接触,其中多个第三荧光标记的核苷酸中的每一个第三荧光标记的核苷酸是相同类型的,并且其中多个第三荧光标记的核苷酸中的第三荧光标记的核苷酸在与核酸分子杂交的进一步延伸的引物邻近的位置处与核酸分子互补,从而将多个第三荧光标记的核苷酸中的第三荧光标记的核苷酸掺入测序模板;(i)将包含多个第三荧光标记的核苷酸的第三溶液从测序模板洗掉;以及(j)测量由测序模板发射的第三荧光信号,其中第三荧光信号的强度大于第一荧光信号的强度和第二荧光信号的强度,其中多个第三荧光标记的核苷酸的第三荧光标记的核苷酸包含第三荧光染料和与第三荧光染料和第三核苷酸连接的第三接头。

在一些实施方案中,第三接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中第三接头在第三荧光染料和第三核苷酸之间建立至少约0.5纳米的功能长度。

在一些实施方案中,多个第三荧光标记的核苷酸中的第三荧光标记的核苷酸的第三荧光染料与多个第一荧光标记的核苷酸中的第一荧光标记的核苷酸的第一荧光染料不同。在一些实施方案中,多个第三荧光标记的核苷酸中的第三荧光标记的核苷酸的第三荧光染料与多个第二荧光标记的核苷酸中的第二荧光标记的核苷酸的第二荧光染料不同。在一些实施方案中,多个第三荧光标记的核苷酸的第三荧光标记的核苷酸的第三核苷酸与多个第一荧光标记的核苷酸的第一荧光标记的核苷酸的第一核苷酸不同。在一些实施方案中,多个第三荧光标记的核苷酸的第三荧光标记的核苷酸的第三核苷酸与多个第二荧光标记的核苷酸的第二荧光标记的核苷酸的第二核苷酸不同。

在一些实施方案中,该方法进一步包括在(d)之后,切割掺入测序模板的第一荧光标记的核苷酸的第一荧光染料。

在一些实施方案中,该方法进一步包括在(g)之后,切割掺入测序模板的第二荧光标记的核苷酸的第二荧光染料。

在又一方面,本公开提供了一种对核酸分子进行测序的方法,该方法包括:(a)提供包含多个荧光标记的核苷酸的溶液,其中多个荧光标记的核苷酸中的每个荧光标记的核苷酸是相同类型的,并且其中多个荧光标记的核苷酸中的给定的荧光标记的核苷酸包含通过具有定义的分子量和至少约0.5纳米(nm)的长度的半刚性水溶性接头连接至核苷酸的荧光染料;(b)在足以使引物与核酸分子杂交的条件下使核酸分子与引物接触,从而产生测序模板;(c)使测序模板与聚合酶和包含多个荧光标记的核苷酸的溶液接触,其中多个荧光标记的核苷酸中的荧光标记的核苷酸在与核酸分子杂交的引物的相邻的位置处与核酸分子互补,从而将多个荧光标记的核苷酸中的一个或多个荧光标记的核苷酸掺入测序模板中;(d)将包含多个荧光标记的核苷酸的溶液从测序模板洗掉;以及(e)测量由测序模板发射的荧光信号。

在一些实施方案中,核苷酸是鸟嘌呤(G)。

在一些实施方案中,接头减少核苷酸和荧光染料之间的猝灭。

在一些实施方案中,一个或多个荧光标记的核苷酸中的荧光标记的核苷酸比包含相同核苷酸和荧光染料但不包括接头的另一荧光标记的核苷酸更有效地掺入测序模板中。

在一些实施方案中,一个或多个荧光标记的核苷酸中的荧光标记的核苷酸以比包含相同核苷酸和荧光染料但不包括接头的另一荧光标记的核苷酸更高的保真度掺入测序模板中。

在一些实施方案中,聚合酶是选自Taq聚合酶、Klenow聚合酶和Bst聚合酶的家族A聚合酶。

在一些实施方案中,聚合酶是选自Vent(exo-)聚合酶和TherminatorTM聚合酶的家族B聚合酶。

在一些实施方案中,接头包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系通过不大于两个sp3碳原子彼此连接;并且其中接头在荧光染料和核苷酸之间建立至少约0.5纳米的功能长度。

本公开内容的另一方面提供了包含一个或多个计算机处理器和与之耦合的计算机存储器的系统。所述计算机存储器包含机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现上述或本文其他地方的任何方法。

本公开内容的另一方面提供了包含一个或多个计算机处理器和与之耦合的计算机存储器的系统。所述计算机存储器包含机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实现上述或本文其他地方的任何方法。

通过以下在其中仅示出和描述了本公开内容的说明性实施方案的详细描述,本公开内容的其他方面和优点对于本领域技术人员将变得显而易见。将会认识到,本公开内容能够具有其他和不同的实施方案,并且其若干细节能够在各个明显的方面进行修改,所有这些都不偏离本公开内容。因此,附图和说明书在本质上将被认为是说明性而非限制性的。

援引并入

本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。在通过引用并入的出版物和专利或专利申请与本说明书中包含的公开内容相抵触的程度下,本说明书旨在取代和/或优先于任何此类矛盾的材料。

附图说明

本发明的新颖特征在所附权利要求中具体阐述。通过参考以下对其中利用到本发明原理的说明性实施方案加以阐述的详细描述以及附图(本文也称为“图”),将会获得对本发明特征和优点的更好理解,在这些附图中:

图1A示出了本公开的接头的实例;

图1B示出了本公开的接头的实例;

图1C示出了本公开的接头的实例,其中R是水溶性基团;

图2A示出了用于合成本公开的具有约2纳米的有效长度的接头的方法的实例;

图2B示出了可用于图2A的用于合成本公开的接头的方法中的试剂以及一些三官能试剂的实例;

图2C示出了用于合成本公开的接头的方法的实例,该接头是具有定义的分子量和连接基团的聚合物;和

图3示出了被编程或以其他方式配置为实现本文提供的方法的计算机系统;

图4示出了用于构建包含炔丙基衍生的核苷酸、接头和染料的经标记的核苷酸的方法的实例。

图5A和5B示出了用于制备包含dGTP类似物的经标记的核苷酸的示例性方法。

图6示出了用于制备包含dCTP的经标记的核苷酸的示例性方法。

图7示出了用于构建染料标记的核苷酸以在约530nm下激发的组分。

图8示出了用于制备包含鸟嘌呤类似物的经标记的核苷酸的示例性方法。

图9示出了用于评估标记的核苷酸的基于珠的测定的示意图。

图10示出了不同的经标记的dUTP的基于珠的测定的结果。

图11示出了不同的经标记的dATP的基于珠的测定的结果。

图12示出了不同的经标记的dGTP的基于珠的测定的结果。

图13A-13C示出了用于制备包含鸟嘌呤类似物的经标记的核苷酸的示例性方法。

图14A和14B示出了用于制备包含氨基酸重复单元的经标记的核苷酸的示例性方法。

图15示出了用于评估猝灭的测定的示意图。

图16示出了红色染料接头的猝灭结果。

图17示出了绿色染料接头的猝灭结果。

图18示出了示例性测序程序。

图19示出了不同的经标记的核苷酸的容差(Tolerance)。

图20A和20B示出了包括均聚区域的构建体的实例。

图20C示出了使用标记的核苷酸对具有均聚区域的模板进行测序而检测到的信号。

图21A示出了利用包含20%荧光团标记的dNTP的核苷酸群进行测序分析的示例性结果。

图21B示出了作为均聚物长度的函数的荧光信号强度。

图22示出了利用包含100%荧光团标记的dNTP的核苷酸群进行测序分析的示例性结果。

具体实施方式

虽然本文已经示出和描述了本公开内容的各种实施方案,但对于本领域技术人员显而易见的是,这样的实施方案仅以示例的方式提供。本领域技术人员可在不偏离本发明的情况下想到许多变化、改变和替代。应当理解,可以使用本文中所述的本发明的实施方案的各种替代方案。

在值被描述为范围的情况下,应当理解,此类公开包括此类范围内所有可能的子范围的公开,以及落入此类范围内的特定数值,无论是特定数值还是特定子范围是明确规定的。

术语“约”和“大约”通常应表示对于给定值或值范围可接受的误差或变化程度,例如,在给定值或值范围的百分之20(%)以内、15%以内、10%以内或5%以内的误差或变化程度。

如本文所用,术语“受试者”通常是指可以从中衍生出生物样本(例如,正在进行或将进行加工或分析的生物样本)的个体或实体。受试者可以是动物(例如,哺乳动物或非哺乳动物)或植物。受试者可以是人、狗、猫、马、猪、鸟、非人灵长类动物、猿猴、农场动物、伴侣动物、运动动物或啮齿动物。受试者可以是患者。受试者可能患有或怀疑患有疾病或病症,例如癌症(例如,乳腺癌、结直肠癌、脑癌、白血病、肺癌、皮肤癌、肝癌、胰腺癌、淋巴瘤、食道癌或宫颈癌)或传染病。可替代地或另外地,可能已知受试者先前患有疾病或病症。受试者可以是患者。受试者患有或疑似患有遗传病症,诸如软骨发育不全、α-1抗胰蛋白酶缺乏症、抗磷脂综合征、孤独症、常染色体显性多囊肾病、进行性神经性腓骨肌萎缩征(Charcot-Marie-tooth)、猫叫综合征、克罗恩病、囊性纤维化、痛性脂肪病(Dercum disease)、唐氏综合征、杜安综合征(Duane syndrome)、杜氏肌营养不良、莱顿第五因子血栓形成倾向、家族性高胆固醇血症、家族性地中海热、脆性x综合征、戈谢病、血色素沉着症、血友病、前脑无裂畸形、亨廷顿病、克林费尔特综合征、马方综合征、强直性肌营养不良、神经纤维瘤病、努南综合征、成骨不全、帕金森病、苯丙酮尿症、波伦异常、卟啉症、早衰、色素性视网膜炎、重度联合免疫缺陷、镰状细胞病、脊髓性肌萎缩、泰-萨克斯病(Tay-Sachs)、地中海贫血、三甲基胺尿症、特纳综合征、腭帆心脏面部综合征、WAGR综合征或威尔逊病。受试者可能正在接受疾病或病症的治疗。受试者可能对给定的疾病或病症有症状或无症状。受试者可以是健康的(例如,没有怀疑患有疾病或病症)。受试者可能具有一种或多种给定疾病的风险因素。受试者可能具有给定的体重、身高、体重指数或其他身体特征。受试者可能具有给定的民族或种族遗产、出生地或居住地、国籍、疾病或缓解状态、家族病史或其他特征。

如本文所用,术语“生物样本”通常是指从受试者获得的样本。生物样本可以直接或间接地从受试者获得。可以通过任何合适的方法从受试者获得样本,包括但不限于吐痰、擦拭、抽血、活检、获得排泄物(例如,尿液、粪便、痰液、呕吐物或唾液)、切除、刮擦、和穿刺。样本可以通过例如静脉内或动脉内进入循环体系、收集分泌的生物样本(例如,粪便、尿液、唾液、痰液等)、呼吸或手术提取组织(例如,活检)从受试者获得。样本可以通过非侵入性方法获得,包括但不限于:刮擦皮肤或子宫颈、擦拭脸颊或收集唾液、尿液、粪便、月经、泪液或精液。或者,样本可以通过侵入性程序获得,例如活检、针吸或静脉切开术。样本可以包括体液,例如但不限于血液(例如,全血、红细胞、白血球或白细胞、血小板)、血浆、血清、汗液、泪液、唾液、痰液、尿液、精液、粘液、滑膜液、母乳、初乳、羊水、胆汁、骨髓、组织液或细胞外液或脑脊液。例如,可以通过穿刺方法获得样本以获得包含血液和/或血浆的体液。此类样本可以包含细胞和无细胞核酸材料。或者,样本可以从任何其他来源获得,包括但不限于血液、汗液、毛囊、颊组织、泪液、月经、粪便或唾液。生物样本可以是组织样本,例如肿瘤活检。样本可以从本文提供的任何组织获得,包括但不限于皮肤、心脏、肺、肾、乳腺、胰腺、肝脏、肠、脑、前列腺、食管、肌肉、平滑肌、膀胱、胆囊、结肠或甲状腺。本文提供的获得方法包括活组织检查方法,包括细针抽吸、芯针活组织检查、真空辅助活组织检查、粗针吸取芯活组织检查、切口活组织检查、切除活组织检查、钻取活组织检查、刮取活组织检查或皮肤活组织检查。生物样本可包括一种或多种细胞。生物样本可包含一种或多种核酸分子,例如一种或多种脱氧核糖核酸(DNA)和/或核糖核酸(RNA)分子(例如,包括在细胞内或不包括在细胞内)。核酸分子可包括在细胞内。可替代地或另外地,核酸分子可以不包括在细胞内(例如,无细胞核酸分子)。生物样本可以是无细胞样本。

如本文所用,术语“无细胞样本”通常是指基本上无细胞的样本(例如,基于体积少于10%的细胞)。无细胞样本可以衍生自任何来源(例如,如本文所述的)。例如,无细胞样本可以衍生自血液、汗液、尿液或唾液。例如,无细胞样本可以衍生自组织或体液。无细胞样本可以衍生自多种组织或体液。例如,来自第一组织或流体的样本可以与来自第二组织或流体的样本组合(例如,在获得样本时或获得样本之后)。在一个实例中,可以从受试者收集第一流体和第二流体(例如,在相同或不同时间)并且可以将第一流体和第二流体组合以提供样本。无细胞样本可包含一种或多种核酸分子,例如一种或多种DNA或RNA分子。

可以处理不是无细胞样本的样本(例如,包含一种或多种细胞的样本)以提供无细胞样本。例如,可以从受试者获得包括一种或多种细胞以及不包括在细胞内的一种或多种核酸分子(例如,DNA和/或RNA分子)的样本(例如,无细胞核酸分子)。可以对样本进行处理(例如,如本文所述的)以将细胞和其他材料与不包括在细胞内的核酸分子分离,从而提供无细胞样本(例如,包括不包括在细胞内的核酸分子)。然后可以对无细胞样本进行进一步分析和处理(例如,如本文提供的)。不包括在细胞内的核酸分子(例如,无细胞核酸分子)可以衍生自细胞和组织。例如,无细胞核酸分子可衍生自肿瘤组织或降解细胞(例如,身体组织的)。无细胞核酸分子可包含任何类型的核酸分子(例如,如本文所述的)。无细胞核酸分子可以是双链的、单链的或其组合。无细胞核酸分子可以通过分泌或细胞死亡过程,例如细胞坏死、细胞凋亡等释放到体液中。无细胞核酸分子可以从癌细胞(例如,循环肿瘤DNA(ctDNA))释放到体液中。无细胞核酸分子也可以是在母体血流中自由循环的胎儿DNA(例如,无细胞胎儿核酸分子,例如cffDNA)。可替代地或另外地,无细胞核酸分子可以从健康细胞释放到体液中。

生物样本可直接从受试者获得并分析而无需任何干预处理,诸如例如样本纯化或提取。例如,可以通过进入受试者的循环系统、从受试者取出血液(例如,通过针)并将取出的血液转移到容器中来直接从受试者获得血液样本。容器可包含试剂(例如抗凝剂),使得血液样本可用于进一步分析。此类试剂可用于在分析之前处理容器或另一容器中的样本或衍生自样本的分析物。在另一个实例中,可以使用拭子接近受试者口咽表面上的上皮细胞。在从受试者获得生物样本之后,包含生物样本的拭子可以与流体(例如,缓冲液)接触以从拭子收集生物流体。

可以从受试者获得包含一种或多种核酸分子的任何合适的生物样本。适合根据本文提供的方法使用的样本(例如,生物样本或无细胞生物样本)可以是任何材料,包括组织、细胞、降解的细胞、核酸、基因、基因片段、表达产物、基因表达产物和/或待测试个体的基因表达产物片段。生物样本可以是固体物质(例如,生物组织)或可以是流体(例如,生物流体)。通常,生物流体可包括与活生物体相关联的任何流体。生物样本的非限制性实例包括从受试者的任何解剖学定位(例如,组织、循环系统、骨髓)获得的血液(或血液组分——例如,白细胞、红细胞、血小板)、从受试者的任何解剖学定位获得的细胞、皮肤、心脏、肺、肾、呼吸、骨髓、粪便、精液、阴道分泌物、衍生自肿瘤组织的组织液、乳房、胰腺、脑脊液、组织、咽拭子、活检,胎盘液、羊水、肝脏、肌肉、平滑肌、膀胱、胆囊、结肠、肠、脑、宫腔积液、痰液、脓、微生物群、胎粪、母乳、前列腺、食管、甲状腺、血清、唾液、尿液、胃液和消化液、泪液、眼液、汗液、粘液、耳垢、油、腺体分泌物、脊髓液、头发、指甲、皮肤细胞、血浆、鼻拭子或鼻咽冲洗液、脊髓液、脐血、强液和/或其他排泄物或身体组织。提供了用于确定样本适用性和/或充分性的方法。样本可包括但不限于血液、血浆、组织、细胞、降解细胞、无细胞核酸分子和/或来自细胞或衍生自个体细胞的生物材料,例如无细胞核酸分子。样本可以是细胞、组织或无细胞生物材料的异质或同质群体。可以使用能够提供适用于本文所述的分析方法的样本的任何方法来获得生物样本。

样本(例如,生物样本或无细胞生物样本)可以经历一个或多个过程以准备用于分析,包括但不限于过滤、离心、选择性沉淀、透化、分离、搅拌、加热、纯化、和/或其他过程。例如,可以过滤样本以去除污染物或其他材料。在一个实例中,可以处理包含细胞的样本以将细胞与样本中的其他材料分离。此类过程可用于制备仅包含无细胞核酸分子的样本。此类过程可以由多步离心过程组成。可以获得多个样本,例如来自同一受试者的多个样本(例如,以相同或不同方式从相同或不同身体位置获得的,和/或在相同或不同时间(例如,秒、分钟、小时、天、数周、数月或数年)或来自不同受试者的多个样本获得的)用于如本文所述的分析。在一个实例中,第一样本在受试者经历治疗方案或程序之前从受试者获得,且第二样本在受试者经历治疗方案或程序之后从受试者获得。可替代地或另外地,可同时或大约同时从同一受试者获得多个样本。从同一受试者获得的不同样本可以相同或不同的方式获得。例如,第一样本可以通过活检获得,且第二样本可以通过抽血获得。以不同方式获得的样本可以由不同的医疗专业人员、使用不同的技术、在不同的时间和/或在不同的位置获得。从同一受试者获得的不同样本可以从身体的不同部位获得。例如,第一样本可以从身体的第一区域(例如,第一组织)获得并且第二样本可以从身体的第二区域(例如,第二组织)获得。

当在反应容器中提供时,如本文所用的生物样本(例如,包含一种或多种核酸分子的生物样本)可能不被纯化。此外,对于包含一种或多种核酸分子的生物样本,当将生物样本提供给反应容器时可能不会提取一种或多种核酸分子。例如,当将生物样本提供给反应容器时,生物样本的核糖核酸(RNA)和/或脱氧核糖核酸(DNA)分子可能不会从生物样本中提取。此外,当将生物样本提供给反应容器时,生物样本中存在的靶核酸(例如,靶RNA或靶DNA分子)可能不被浓缩。或者,可以纯化生物样本和/或可以从生物样本中的其他材料中分离核酸分子。

如本文所述的生物样本可包含靶核酸。如本文所用,术语“模板核酸”、“靶核酸”、“核酸分子”、“核酸序列”、“核酸片段”、“寡核苷酸”、“多核苷酸”和“核酸”通常是指任何长度的核苷酸的聚合形式,例如脱氧核糖核苷酸(dNTP)或核糖核苷酸(rNTP)或其类似物,并且可以互换使用。核酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。核酸分子可具有至少约10个核酸碱基(“碱基”)、20个碱基、30个碱基、40个碱基、50个碱基、100个碱基、200个碱基、300个碱基、400个碱基、500个碱基、1千碱基(kb)、2kb、3kb、4kb、5kb、10kb、50kb或更多。寡核苷酸通常由四个核苷酸碱基的特定序列组成:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);和胸腺嘧啶(T)(当多核苷酸是RNA时,尿嘧啶(U)代表胸腺嘧啶(T))。寡核苷酸可包括一种或多种非标准核苷酸、核苷酸类似物和/或修饰的核苷酸。核酸的非限制性实例包括DNA、RNA、基因组DNA(例如,gDNA,例如剪切的gDNA)、无细胞DNA(例如,cfDNA)、合成DNA/RNA、基因或基因片段的编码或非编码区、由连锁分析定义的位点(基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微-RNA(miRNA)、核酶、互补DNA(cDNA)、重组核酸、分支核酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。核酸可以包含一种或多种修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,可以在核酸组装之前或之后对核苷酸结构进行修饰。核酸的核苷酸序列可能被非核苷酸组分中断。核酸可以在聚合后进一步修饰,例如通过与报道剂缀合或结合。

可扩增如本文所述的靶核酸或样本核酸以产生扩增产物。靶核酸可以是靶RNA或靶DNA。当靶核酸是靶RNA时,靶RNA可以是任何类型的RNA,包括本文别处描述的RNA类型。靶RNA可以是病毒RNA和/或肿瘤RNA。病毒RNA可能对受试者具有致病性。致病病毒RNA的非限制性实例包括人类免疫缺陷病毒I(HIV I)、人类免疫缺陷病毒n(HIV 11)、正粘病毒、埃博拉病毒、登革病毒、流感病毒(例如,H1N1、H3N2、H7N9或H5N1)、疱疹病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎(例如,装甲RNA-HCV病毒)病毒、丁型肝炎病毒、戊型肝炎病毒、庚型肝炎病毒、爱泼斯坦-巴尔病毒、单核细胞增多症病毒、巨细胞病毒、SARS病毒、西尼罗河热病毒、脊髓灰质炎病毒和麻疹病毒。

生物样本可包含多个靶核酸分子。例如,生物样本可以包含来自单个受试者的多个靶核酸分子。在另一个实例中,生物样本可以包含来自第一受试者的第一靶核酸分子和来自第二受试者的第二靶核酸分子。

如本文所用,术语“核苷酸”通常是指包括碱基(例如核碱基)、糖部分和磷酸部分的物质。核苷酸可包含具有附接的磷酸基团的游离碱。包括具有三个附接的磷酸基团的碱基的物质可被称为核苷三磷酸。当核苷酸被添加到生长核酸分子链中时,核苷酸的近端磷酸酯与生长链之间的磷酸二酯键的形成可能伴随着高能磷酸键的水解和作为焦磷酸酯的两个远端磷酸酯的释放。核苷酸可以是天然存在的或非天然存在的(例如,修饰的或工程化的核苷酸)。

如本文所用,术语“核苷酸类似物”可以包括但不限于可以是或可以不是天然存在的核苷酸的核苷酸。例如,核苷酸类似物可以衍生自规范核苷酸和/或包括与规范核苷酸的结构相似性,例如包括腺嘌呤-(A)、胸腺嘧啶-(T)、胞嘧啶-(C)、尿嘧啶-(U)或鸟嘌呤-(G)的核苷酸。核苷酸类似物可包含相对于天然核苷酸的一个或多个差异或修饰。核苷酸类似物的实例包括肌苷、二氨基嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、脱氮黄嘌呤、脱氮鸟嘌呤、异胞嘧啶、异鸟嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基辫苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辫苷、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸酸(v)、怀丁氧苷(wybutoxosine)、假尿嘧啶、辫苷、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫脲嘧啶、5-甲基硫脲嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v),5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤、乙炔基核苷酸碱基、1-丙炔基核苷酸碱基、叠氮基核苷酸碱基、膦硒酸酯核酸及其修饰形式(例如,通过氧化、还原和/或添加取代基,例如烷基、羟烷基、羟基或卤素部分)。核酸分子(例如,多核苷酸、双链核酸分子、单链核酸分子、引物、衔接子等)可以在碱基部分(例如,在通常可用于与互补核苷酸形成氢键的一个或多个原子处和/或在通常不能与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸骨架处进行修饰。在一些情况下,核苷酸可包括在其磷酸部分中的修饰,包括对三磷酸部分的修饰。此外,修饰的非限制性实例包括更长长度的磷酸链(例如,具有4、5、6、7、8、9、10个或多个磷酸部分的磷酸链)、具有硫醇部分的修饰(例如,α-硫代三磷酸和β-硫代三磷酸),以及具有硒部分的修饰(例如膦硒酸酯核酸)。核苷酸或核苷酸类似物可包含选自核糖、脱氧核糖及其修饰形式的糖(例如,通过氧化、还原和/或添加取代基,例如烷基、羟烷基、羟基或卤素部分)。核苷酸类似物还可包含修饰的接头部分(例如,代替磷酸部分)。核苷酸类似物还可以包含胺修饰的基团,例如氨基烯丙基-dUTP(aa-dUTP)和氨基己基丙烯酰胺-dCTP(aha-dCTP),以允许胺反应性部分的共价附接,例如N-羟基琥珀酰亚胺酯(NHS)。本公开的寡核苷酸中标准DNA碱基对或RNA碱基对的替代物可以提供例如,以比特/立方毫米计的更高密度、更高的安全性(抵抗天然毒素的意外或有意的合成)、更容易区分光-程序化聚合酶和/或较低的二级结构。核苷酸类似物可能能够与用于核苷酸检测的可检测部分反应或结合。

如本文所用,术语“均聚物”通常是指包含相同单体单元的聚合物或聚合物的部分。均聚物可具有均聚物序列。核酸均聚物可以指包含相同核苷酸或其任何核苷酸变体的连续重复的多核苷酸或寡核苷酸。例如,均聚物可以是聚(dA)、聚(dT)、聚(dG)、聚(dC)、聚(rA)、聚(U)、聚(rG)或聚(rC)。均聚物可以是任何长度。例如,均聚物可具有至少2、3、4、5、10、20、30、40、50、100、200、300、400、500或多个核酸碱基的长度。均聚物可具有10至500、或15至200、或20至150个核酸碱基。均聚物可具有至多500、400、300、200、100、50、40、30、20、10、5、4、3或2个核酸碱基的长度。分子,例如核酸分子,可以包括一个或多个均聚物部分和一个或多个非均聚物部分。分子可以完全由均聚物、多种均聚物或均聚物和非均聚物的组合形成。在核酸测序中,可以将多个核苷酸掺入核酸链的均聚物区。此类核苷酸可以是非终止的以允许掺入连续的核苷酸(例如,在单核苷酸流期间)。

术语“扩增(amplifying)”、“扩增(amplification)”和“核酸扩增”可互换使用,并且通常是指生成核酸或模板的一个或多个拷贝。例如,DNA的“扩增”通常是指生成DNA分子的一个或多个拷贝。扩增子可以是通过扩增程序从起始模板核酸分子产生的单链或双链核酸分子。此类扩增程序可以包括一个或多个延伸循环或连接程序。扩增子可包含核酸链,其至少一部分可与起始模板的至少一部分基本相同或基本互补。当起始模板是双链核酸分子时,扩增子可包含与一条链的至少一部分基本相同并且与任一链的至少一部分基本互补的核酸链。无论初始模板是单链的还是双链的,扩增子都可以是单链的或双链的。核酸的扩增可以是线性的、指数的或其组合。扩增可以基于乳液或可以基于非乳液。核酸扩增方法的非限制性实例包括逆转录、引物延伸、聚合酶链反应(PCR)、连接酶链反应(LCR)、解旋酶依赖性扩增、不对称扩增、滚环扩增、和多重置换扩增(MDA)。在使用PCR的情况下,可以使用任何形式的PCR,非限制性实例包括实时PCR、等位基因特异性PCR、组装PCR、不对称PCR、数字PCR、乳液PCR、拨出(dial-out)PCR、解旋酶依赖性PCR、嵌套式PCR、热启动PCR、反向PCR、甲基化特异性PCR、微型引物PCR、多重PCR、嵌套式PCR、重叠延伸PCR、热不对称交错PCR和降落(touchdown)PCR。此外,扩增可以在包括参与或促进扩增的各种组分(例如,引物、模板、核苷酸、聚合酶、缓冲剂组分、辅因子,等等)的反应混合物中进行。在一些情况下,反应混合物包括允许核苷酸进行不依赖于环境的并入的缓冲剂。非限制性实例包括镁离子、锰离子和异柠檬酸盐缓冲剂。这样的缓冲剂的其他实例在Tabor,S.等人,C.C.PNAS,1989,86,4076-4080和美国专利号5,409,811和5,674,716中描述,其各自通过引用整体并入本文。

扩增可以是克隆扩增。如本文所用,术语“克隆”通常指核酸的群体,其中大部分(例如,大于约50%、60%、70%、80%、90%、95%或99%)的其成员具有彼此为至少约50%、60%、70%、80%、90%、95%或99%相同的序列。核酸分子克隆群体的成员可彼此具有序列同源性。此类成员可与模板核酸分子具有序列同源性。克隆群体的成员可以是双链的或单链的。一个群体的成员可能不是100%相同或互补的,例如,在合成过程期间可能发生“错误”,使得给定群体的少数可能与群体的大多数不具有序列同源性。例如,群体中至少50%的成员可以彼此或与参考核酸分子(即,用作序列比较的基础的确定序列的分子)基本相同。至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或更多的群体成员可以与参考核酸分子基本相同。如果两个分子之间的同一性百分比为至少60%、70%、75%、80%、85%、90%、95%、98%、99%、99.9%或更大,则可以认为两个分子基本上相同(或同源)。如果两个分子之间的互补百分比为至少60%、70%、75%、80%、85%、90%、95%、98%、99%、99.9%或更大,则可以认为两个分子基本上互补。可能发生非同源核酸的低水平或非显著水平的混合,因此克隆群体可能包含少数不同的核酸(例如,少于30%,例如,少于10%)。

从单个分子进行克隆扩增的有用方法包括滚环扩增(RCA)(Lizardi等人,Nat.Genet.19:225-232(1998),其通过引用并入本文)、桥PCR(Adams和Kron,Method forPerforming Amplification of Nucleic Acid with Two Primers Bound to a SingleSolid Support,Mosaic Technologies,Inc.(Winter Hill,Mass.);Whitehead Institutefor Biomedical Research,Cambridge,Mass.,(1997);Adessi等人,Nucl.Acids Res.28:E87(2000);Pemov等人,Nucl.Acids Res.33:e11(2005);或美国专利号5,641,658,其各自通过引用并入本文)、聚合酶克隆传代(Mitra等人,Proc.Natl.Acad.Sci.USA 100:5926-5931(2003);Mitra等人,Anal.Biochem.320:55-65(2003),其各自通过引用并入本文)以及使用乳液在珠上的克隆扩增(Dressman等人,Proc.Natl.Acad.Sci.USA 100:8817-8822(2003),其通过引用并入本文)或连接到基于珠的衔接子库(Brenner等人,Nat.Biotechnol.18:630-634(2000);Brenner等人,Proc.Natl.Acad.Sci.USA 97:1665-1670(2000));Reinartz等人,Brief Funct.Genomic Proteomic 1:95-104(2002),其各自通过引用并入本文)。.

如本文所用,术语“聚合酶(polymerizing enzyme)”或“聚合酶(polymerase)”通常是指能够催化聚合反应的任何酶。聚合酶可用于通过掺入核苷酸或核苷酸类似物来延伸与模板链配对的核酸引物。聚合酶可以通过延伸现有核苷酸链的3'端来添加新的DNA链,通过创建磷酸二酯键一次一个地添加与模板链匹配的新核苷酸。本文使用的聚合酶可具有链置换活性或非链置换活性。聚合酶的实例包括但不限于核酸聚合酶。示例性聚合酶是Φ29DNA聚合酶或其衍生物。聚合酶可以是聚合酶(polymerization enzyme)。在一些情况下,使用转录酶或连接酶(即,催化键的形成的酶)。聚合酶的实例包括DNA聚合酶、RNA聚合酶、热稳定聚合酶、野生型聚合酶、修饰聚合酶、大肠杆菌(E.coli)DNA聚合酶I、T7 DNA聚合酶、噬菌体T4 DNA聚合酶Φ29(phi29)DNA聚合酶、Taq聚合酶、Tth聚合酶、Tli聚合酶、Pfu聚合酶、Pwo聚合酶、VENT聚合酶、DEEPVENT聚合酶、EX-Taq聚合酶、LA-Taq聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、ES4聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tea聚合酶、Tih聚合酶、Tfi聚合酶、铂Taq聚合酶、Tbr聚合酶、Tfl聚合酶、Pfu-turbo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Bst聚合酶、Sac聚合酶、Klenow片段、具有3’至5'核酸外切酶活性的聚合酶及其变体、修饰产物及衍生物。在一些情况下,聚合酶是单亚基聚合酶。聚合酶可具有高持续合成能力,即聚合酶将核苷酸连续掺入核酸模板而不释放核酸模板的能力。在一些情况下,聚合酶是经修饰以接受三磷酸双脱氧核苷酸的聚合酶,诸如例如具有667Y突变的Taq聚合酶(参见例如,Tabor等人,PNAS,1995,92,6339-6343,其全部内容通过引用掺入本文用于所有目的)。在一些情况下,聚合酶是具有修饰的核苷酸结合的聚合酶,其可用于核酸测序,非限制性实例包括ThermoSequenas聚合酶(GE LifeSciences)、AmpliTaq FS(ThermoFisher)聚合酶和测序Pol聚合酶(Jena Bioscience)。在一些情况下,聚合酶经过基因工程改造以区分双脱氧核苷酸,诸如例如测序酶DNA聚合酶(ThermoFisher)。

聚合酶可以是家族A聚合酶或家族B DNA聚合酶。家族A聚合酶包括例如,Taq、Klenow和Bst聚合酶。家族B聚合酶包括,例如,Vent(exo-)和Therminator聚合酶。已知家族B聚合酶比家族A聚合酶接受更多不同的核苷酸底物。家族A聚合酶广泛用于通过合成方法测序,可能是由于它们的高持续合成能力和保真度。

如本文所用,术语“互补序列”通常是指与另一序列杂交的序列。两条单链核酸分子之间的杂交可能涉及形成在某些条件下稳定的双链结构。如果两条单链多核苷酸通过两个或更多个顺序相邻的碱基配对彼此结合,则可以认为它们是杂交的。双链结构的一条链中的很大一部分核苷酸可以与另一条链上的核苷进行沃森-克里克碱基配对。杂交还可包括核苷类似物的配对,例如脱氧肌苷、具有2-氨基嘌呤碱基的核苷等,其可用于降低探针的简并性,无论这种配对是否涉及氢键的形成。

如本文所用,术语“变性”通常是指将双链分子(例如,DNA)分离成单链分子。变性可以是完全的或部分变性。在部分变性中,通过DNA中双链区域两侧的两条脱氧核糖核酸(DNA)链的变性,可以在双链分子中形成单链区域。

如本文所用,术语“解链温度”或“熔点”通常是指样本中核酸分子链的至少一部分与互补链的至少一部分分离时的温度。解链温度可以是双链核酸分子部分或完全变性时的温度。解链温度可以指给定核酸分子的多个序列中的序列的温度,或多个序列的温度。双链核酸分子的不同区域可具有不同的解链温度。例如,双链核酸分子可以包括具有第一熔点的第一区域和具有高于第一熔点的第二熔点的第二区域。因此,双链核酸分子的不同区域可以在不同温度下解链(例如,部分变性)。核酸分子或其区域(例如,核酸序列)的熔点可以通过实验确定(例如,通过解链分析或其他程序)或可以基于核酸分子的序列和长度来估计。例如,可以使用诸如MELTING的软件程序来估计核酸序列的解链温度(Dumousseau M,Rodriguez N,Juty N,Le Novère N,MELTING,a flexible platform to predict themelting temperatures of nucleic acids.BMC Bioinformatics.2012May 16;13:101.doi:10.1186/1471-2105-13-101)。因此,如本文所述的熔点可以是估计的熔点。核酸序列的真实解链点可基于与感兴趣的核酸序列相邻的序列或缺乏序列以及其他因素而变化。

如本文所用,术语“测序”通常是指产生或鉴定生物分子如核酸分子或多肽的序列的过程。此类序列可以是核酸序列,其可以包括核酸碱基(例如,核碱基)的序列。测序可以是例如,单分子测序、合成测序、杂交测序或连接测序。可以使用固定在支持物(例如,流动池或一个或多个珠)上的模板核酸分子进行测序。测序测定可产生对应于一种或多种模板核酸分子的一种或多种测序读段。

如本文所用,术语“读段”通常是指核酸序列,例如测序读段。测序读段可以是通过核酸测序测定获得的核酸碱基(例如,核苷酸)或碱基对的推断序列。测序读段可以由核酸测序仪生成,例如大规模平行阵列测序仪(例如,Illumina或Pacific Biosciences ofCalifornia)。测序读段可对应于受试者基因组的一部分,或在一些情况下全部。测序读段可以是测序读段集合的一部分,其可以通过例如比对(例如,与参考基因组)组合以产生受试者的基因组序列。

如本文所用,术语“检测器”通常是指能够检测或测量信号例如指示掺入的核苷酸或核苷酸类似物的存在或不存在的信号的装置。检测器可以包括可以检测和/或测量信号的光学和/或电子组件。涉及检测器的检测方法的非限制性实例包括光学检测、光谱检测、静电检测和电化学检测。光学检测方法包括但不限于荧光测定法和紫外-可见光吸光度。光学检测方法包括但不限于光吸收、紫外可见(UV-vis)光吸收、红外光吸收、光散射、瑞利散射、拉曼散射、表面增强拉曼散射、米氏散射、荧光、发光和磷光。光谱检测方法包括但不限于质谱、核磁共振(NMR)波谱和红外光谱。静电检测方法包括但不限于基于凝胶的技术,例如凝胶电泳。电化学检测方法包括但不限于在对扩增产物进行高效液相色谱分离后对扩增产物的电化学检测。

如本文所用,术语“支持物”通常是指其上可固定诸如核酸分子的试剂的任何固体或半固体制品。核酸分子可以被合成、附接、连接或以其他方式固定。核酸分子可以通过任何方法固定在支持物上,包括但不限于物理吸附、通过离子键或共价键形成或其组合。支持物可以是二维的(例如,平面的2D支持物)或3维的。在一些情况下,支持物可以是流动池的组件和/或可以被包括在测序仪器内或适于被测序仪器接收。支持物可以包括聚合物、玻璃或金属材料。支持物的实例包括膜、平面支持物、微量滴定板、珠(例如,磁珠)、过滤器、测试条、载玻片、盖玻片和试管。支持物可以包括有机聚合物,例如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯和聚丙烯酰胺(例如,聚丙烯酰胺凝胶),以及其共聚物和接枝物。支持物可包括胶乳或葡聚糖。支持物也可以是无机物,例如玻璃、二氧化硅、金、可控孔度玻璃(CPG)或反相二氧化硅。支持物的构造可以是例如,珠、球、粒子、颗粒、凝胶、多孔基质或支持物的形式。在一些情况下,支持物可以是单个固体或半固体制品(例如,单粒子),而在其他情况下,支持物可以包含多个固体或半固体制品(例如,粒子的集合)。支持物可以是平面的、基本上平面的或非平面的。支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特性。支持物可成形为包括一个或多个孔、凹陷或其他容器、器皿、特征或位置。多个支持物可以在不同位置配置成阵列。支持物可以是可寻址的(例如,用于试剂的机器人递送),或通过检测方法,例如通过激光照射和共焦或偏转光聚集进行扫描。例如,支持物可以与检测器进行光学和/或物理通信。或者,支持物可以与检测器物理地分开一段距离。扩增支持物(例如,珠)可以放置在另一个支持物内或上(例如,在第二支持物的孔内)。

如本文所用,术语“标记”通常是指能够与种类诸如例如核苷酸类似物偶联的部分。标记可以包括亲和部分。在一些情况下,标记可以是发射可被检测的信号(或减少已发射的信号)的可检测标记。在一些情况下,此类信号可以指示一种或多种核苷酸或核苷酸类似物的掺入。在一些情况下,标记可与核苷酸或核苷酸类似物偶联,该核苷酸或核苷酸类似物可用于引物延伸反应。在一些情况下,标记可在引物延伸反应后与核苷酸类似物偶联。在一些情况下,标记可以与核苷酸或核苷酸类似物特异性反应。偶联可以是共价的或非共价的(例如,通过离子相互作用、范德华力等)。在一些情况下,偶联可以通过接头进行,接头可以是可切割的,例如光可切割的(例如,在紫外光下可切割的),化学可切割的(例如,通过还原剂,例如二硫苏糖醇(DTT)、三(2-羧乙基)膦(TCEP)、三(羟丙基)膦(THP)或酶可切割的(例如,通过酯酶、脂肪酶、肽酶或蛋白酶)。在一些情况下,标记可以是发光的;即荧光或磷光。例如,标记可以是或包含荧光部分(例如,染料)。染料和标记可以掺入核酸序列中。染料和标记也可以掺入或附接到接头,例如用于将一个或多个珠彼此连接的接头。例如,标记如荧光部分可以通过接头(例如,如本文所述)与核苷酸或核苷酸类似物连接。染料的非限制性例子包括SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄素、荧光香豆素(fluorcoumanin)、椭圆玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶(homidium)、光神霉素、多吡啶钌、氨茴霉素、菲啶和吖啶、碘化丙锭、碘化己锭、二氢乙锭、乙锭同型二聚体-1和乙锭同型二聚体-2、单叠氮化乙锭和ACMA、Hoechst33258、Hoechst 33342、Hoechst 34580、DAPI、吖啶橙、7-AAD、放线菌素D、LDS751、羟脒(hydroxystilbamidine)、SYTOX Blue、SYTOX Green、SYTOX Orange、POPO-1、POPO-3、YOYO-1、YOYO-3、TOTO-1、TOTO-3、JOJO-1、LOLO-1、BOBO-1、BOBO-3、PO-PRO-1、PO-PRO-3、BO-PRO-1、BO-PRO-3、TO-PRO-1、TO-PRO-3、TO-PRO-5、JO-PRO-1、LO-PRO-1、YO-PRO-1、YO-PRO-3、PicoGreen、OliGreen、RiboGreen、SYBR Gold、SYBR Green I、SYBR Green II、SYBR DX、SYTO标记(例如SYTO-40、SYTO-41、SYTO-42、SYTO-43、SYTO-44、和SYTO-45(蓝色)、SYTO-13、SYTO-16、SYTO-24、SYTO-21、SYTO-23、SYTO-12、SYTO-11、SYTO-20、SYTO-22、SYTO-15、SYTO-14、和SYTO-25(绿色)、SYTO-81、SYTO-80、SYTO-82、SYTO-83、SYTO-84、和SYTO-85(橙色)、SYTO-64、SYTO-17、SYTO-59、SYTO-61、SYTO-62、SYTO-60、和SYTO-63(红色))、荧光素、异硫氰酸荧光素(FITC)、四甲基异硫氰酸罗丹明(TRITC)、罗丹明、四甲基罗丹明、R-藻红蛋白、Cy-2、Cy-3、Cy-3.5、Cy-5、Cy5.5、Cy-7、德克萨斯红(Texas Red)、Phar-Red、别藻蓝蛋白(APC)、Sybr Green I、Sybr Green II、Sybr Gold、CellTracker Green、7-AAD、乙锭同型二聚体I、乙锭同型二聚体II、乙锭同型二聚体III、溴化乙锭、伞形酮、曙红、绿色荧光蛋白、赤藓红、香豆素、甲基香豆素、芘、孔雀绿、茋、萤光黄、级联蓝(cascade blue)、二氯三嗪胺荧光素、丹磺酰氯、荧光镧系络合物(如包含铕和铽的那些络合物)、羧基四氯荧光素、5-羧基荧光素和/或6-羧基荧光素(FAM)、VIC、5-碘乙酰胺基荧光素或6-碘乙酰胺基荧光素、5-{[2-5-(乙酰基巯基)-琥珀酰基]氨基}荧光素和5-{[3-5-(乙酰基巯基)-琥珀酰基]氨基}荧光素(SAMSA-荧光素)、丽丝胺罗丹明B磺酰氯、5-羧基罗丹明和/或6-羧基罗丹明(ROX)、7-氨基-甲基-香豆素、7-氨基-4-甲基香豆素-3-乙酸(AMCA)、BODIPY荧光团、8-甲氧基芘-1,3,6-三磺酸三钠盐、3,6-二磺酸-4-氨基-萘二甲酰亚胺、藻胆蛋白、AlexaFluor标记(例如AlexaFluor 750和AlexaFluor 790染料、DyLight 350、DyLight 405、DyLight 488、DyLight 550、DyLight 594、DyLight 633、DyLight 650、DyLight 680、DyLight 755和DyLight 800染料),或者其他荧光团、Black Hole猝灭剂染料(Biosearch Technologies),诸如BH1-0、BHQ-1、BHQ-3、BHQ-10;QSY染料荧光猝灭剂(来自分子探针/Invitrogen),诸如QSY7、QSY9、QSY21、QSY35和其他猝灭剂诸如Dabcyl和Dabsyl;Cy5Q和Cy7Q以及暗花菁染料(GE Healthcare);Dy-猝灭剂(Dyomics),诸如DYQ-660和DYQ-661;以及ATTO荧光猝灭剂(ATTO-TEC GmbH),诸如ATTO 540Q、580Q、612Q。Atto532[例如Atto 532琥珀酰亚胺酯]和Atto633),以及其他荧光团和/或猝灭剂。另外的实例包括在本文提供的结构中。包括在本文提供的结构中的染料预期与本文所述的任何接头和底物组合使用。可以通过施加对应于电磁光谱的可见区域(例如,约430-770纳米(nm))的能量来激发荧光染料。可以使用任何有用的设备进行激发,例如激光器和/或发光二极管。包括但不限于反射镜、波片、滤光器、单色器、光栅、分束器和透镜的光学元件可用于将光引导至荧光染料或从荧光染料引导光。荧光染料可发射在电磁波谱的可见区域(例如,约430-770nm)中的光(例如,荧光)。荧光染料可以在单一波长或波长范围内被激发。荧光染料可被电磁波谱的可见部分的红色区域(约625-740nm)的光激发(例如,在电磁波谱的可见部分的红色区域中具有激发最大值)。可替代地或另外地,荧光染料可被电磁波谱的可见部分的绿色区域(约500-565nm)的光激发(例如,在电磁波谱的可见部分的绿色区域中具有激发最大值)。荧光染料可在电磁波谱的可见部分的红色区域(约625-740nm)中发射信号(例如,在电磁波谱的可见部分的红色区域中具有发射最大值)。可替代地或另外地,荧光染料可在电磁波谱的可见部分的绿色区域(约500-565nm)中发射信号(例如,在电磁波谱的可见部分的绿色区域中具有发射最大值)。

标记可以是猝灭剂分子。如本文所用,术语“猝灭剂”通常是指可以是能量受体的分子。猝灭剂可以是可以减少发射信号的分子。例如,模板核酸分子可被设计为发射可检测信号。包含猝灭剂的核苷酸或核苷酸类似物的掺入可以减少或消除信号,然后检测该减少或消除。来自标记(例如,荧光部分,例如与核苷酸或核苷酸类似物连接的荧光部分)的发光也可以被猝灭(例如,通过掺入可能包含或不包含标记的其他核苷酸)。在一些情况下,如本文别处所述,用猝灭剂标记可在核苷酸或核苷酸类似物掺入之后发生(例如,在掺入包含荧光部分的核苷酸或核苷酸类似物之后)。在一些情况下,标记可以是带有接头的标记。例如,标记可以具有附接至该标记的二硫键接头。这样的标记的非限制性实例包括Cy5-叠氮化物、Cy-2-叠氮化物、Cy-3-叠氮化物、Cy-3.5叠氮化物、Cy5.5-叠氮化物和Cy-7-叠氮化物。在一些情况下,接头可以是可切割的接头。在一些情况下,标记可能是不自淬灭且不表现邻近淬灭的类型。不自淬灭且不表现邻近猝灭的标记类型的非限制性实例包括双满(Bimane)衍生物,诸如溴代双满。如本文所用,术语“邻近猝灭”通常是指一种现象,其中一种或多种彼此靠近的染料与它们单独表现出的荧光相比可能表现出较低的荧光。在一些情况下,染料可经受邻近猝灭,其中供体染料和受体染料彼此在1nm至50nm之内。猝灭剂的实例包括但不限于,黑洞猝灭剂染料(Biosearch Technologies)(例如,BH1-0、BHQ-1、BHQ-3和BHQ-10)、QSY染料荧光猝灭剂(Molecular Probes/Invitrogen)(例如,QSY7、QSY9、QSY21和QSY35)、Dabcyl、Dabsyl、Cy5Q、Cy7Q、黑花青染料(GE Healthcare)、Dy-猝灭剂(Dyomics)(例如,DYQ-660和DYQ-661)和ATTO荧光猝灭剂(ATTO-TEC GmbH)(例如,ATTO 540Q、ATTO580Q和ATTO 612Q)。荧光团供体分子可以与猝灭剂结合使用。可与猝灭剂结合使用的荧光团供体分子的实例包括但不限于诸如Cy3B、Cy3或Cy5的荧光团;Dy-猝灭剂(Dyomics)(例如,DYQ-660和DYQ-661);和ATTO荧光猝灭剂(ATTO-TEC GmbH)(例如ATTO 540Q、580Q和612Q)。

如本文所用,术语“标记分数”通常是指流动溶液中染料标记的核苷酸或核苷酸类似物与单一规范类型的天然/未标记的核苷酸或核苷酸类似物的比例。标记分数可以表示为标记的核苷酸或核苷酸类似物的浓度除以标记的和未标记的核苷酸或核苷酸类似物的浓度总和。标记分数可以表示为溶液(例如,核苷酸流)中包含的标记的核苷酸的百分比。标记分数可以是至少约0.5%、1%、2%、3%、4%、5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%或更高。例如,标记分数可以是至少约20%。标记分数可为约100%。标记分数也可以表示为溶液中包含的标记的核苷酸与未标记的核苷酸的比例。例如,标记的核苷酸与未标记的核苷酸的比例可为至少约1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1,或更高。例如,标记的核苷酸与未标记的核苷酸的比例可为至少约1:4。例如,标记的核苷酸与未标记的核苷酸的比例可为至少约1:1。例如,标记的核苷酸与未标记的核苷酸的比例可为至少约5:1。

如本文所用,术语“标记的分数”通常是指用染料标记的核苷酸或核苷酸类似物和天然核苷酸或核苷酸类似物的混合物处理引物模板后产生的标记的核酸(例如,DNA)的实际分数。标记的分数可以与标记分数大致相同。例如,如果核苷酸流中20%的核苷酸被标记,则掺入到生长核酸链中(例如,在核酸测序期间)的约20%的核苷酸可以被标记。可替代地,标记的分数可以大于标记分数。例如,如果核苷酸流中20%的核苷酸被标记,则掺入到生长核酸链中(例如,在核酸测序期间)的多于20%的核苷酸可以被标记。可替代地,标记的分数可以小于标记分数。例如,如果核苷酸流中20%的核苷酸被标记,则掺入到生长核酸链中(例如,在核酸测序期间)的少于20%的核苷酸可以被标记。

当包含少于100%的标记的核苷酸或核苷酸类似物的溶液用于掺入过程如测序过程(例如,如本文所述)时,标记的(“亮”)和未标记的(“暗”)核苷酸或核苷酸类似物可以掺入生长的核酸链中。如本文所用,术语“容差”通常是指标记的分数(例如,“亮”掺入分数)与标记分数(例如,溶液中的“亮”分数)的比例。例如,如果使用0.2的标记分数导致标记的分数为0.4,则容差为2。类似地,如果使用溶液中的2.5%标记的分数(bf,亮溶液分数)进行诸如测序过程的掺入过程且5%是标记的(bi,亮掺入分数),则容差可以是2(例如,容差)。对于低标记分数(例如,10%或更低的标记分数),该模型可能是线性的。对于更高的标记分数,容差(Tolerance)可能会考虑竞争性暗掺入。容差可指亮掺入分数与暗掺入分数的比例(bi/di)与亮溶液分数与暗溶液分数的比例(bf/df)的比较:

其中di=1-bi(例如,假设100%亮分数归一化为1,暗掺入分数和亮掺入分数总和为1)

尽管di不容易测量,但可以测量(例如,如本文所述)bi亮掺入分数,并通过拟合亮溶液分数(bf)与亮掺入分数(bi)的曲线用于测定容差:

“正”容差数(>1)表示在50%的标记分数下,多于50%被标记。“负”容差数(<1)表示在50%的标记分数下,少于50%被标记。

如本文所用,术语“上下文”通常是指相邻核苷酸的序列或上下文已被观察到影响掺入反应中的容差。酶的性质、pH和其他因素也可能影响容差。将上下文影响减少到最低限度极大地简化了基本测定。

如本文所用,术语“疤痕(scar)”通常是指在切割光学(例如,荧光)染料和任选地附接光学染料到核苷酸或核苷酸类似物的接头的全部或部分后留在先前标记的核苷酸或核苷酸类似物上的残基。疤痕的实例包括但不限于羟基部分(例如,由叠氮甲基基团、烃基二硫甲基键或2-硝基苄氧基键的切割产生)、硫醇部分(例如,由二硫键的切割产生)和苄基部分。例如,疤痕可包含芳族基团,例如苯基或苄基。疤痕的大小和性质可能影响后续掺入。

如本文所用,术语“错误掺入”通常指当DNA聚合酶掺入标记的或未标记的核苷酸时发生的情况,该核苷酸不是模板碱基的正确沃森克里克伴侣。在掺入事件中缺乏所有四个碱基竞争的方法中,错误掺入可能更频繁地发生,并导致链丢失,从而限制测序方法的读段长度。

如本文所用,术语“错配延伸”通常指当DNA聚合酶掺入标记的或未标记的核苷酸时发生的情况,该核苷酸不是模板碱基的正确沃森克里克的伴侣,然后随后为以下碱基掺入正确的沃森克里克伴侣。错配延伸通常会导致先导定相并限制测序方法的读段长度。

关于猝灭,与不同核苷酸(例如,生长核酸链中的相邻核苷酸,或被一个或多个其他核苷酸隔开的核酸链中的核苷酸)连接的两个染料部分之间的染料-染料猝灭可能强烈依赖于两个染料部分之间的距离。两个染料部分之间的距离可以至少部分地取决于将两个染料部分连接到各自的核苷酸或核苷酸类似物的接头的性质,包括接头组成和功能长度。接头的特征,包括组成和功能长度,可能受温度、溶剂、pH和盐浓度(例如,在溶液中)的影响。猝灭也可能基于所用染料的性质而变化。猝灭也可以发生在染料部分和核碱基部分之间(例如,在荧光染料和与其关联的核苷酸的核碱基之间)。控制猝灭现象可能是本文所述方法的关键特征。

关于流,核苷酸流可以由标记的和未标记的核苷酸或核苷酸类似物(例如,单一规范类型的核苷酸或核苷酸类似物)的混合物组成。例如,包含多个光学(例如,荧光)标记的核苷酸和多个未标记的核苷酸的溶液可以与例如测序模板(如本文所述)接触。多个光学标记的核苷酸和多个未标记的核苷酸可各自包含相同的规范核苷酸或核苷酸类似物。流可以仅包括标记的核苷酸或核苷酸类似物。可替代地,流可以仅包括未标记的核苷酸或核苷酸类似物。流可以包括不同类型(例如,A和G)的核苷酸或核苷酸类似物的混合物。

洗涤流(例如,包含缓冲液的溶液)可用于去除未掺入核酸复合物(例如,测序模板,如本文所述)中的任何核苷酸。切割流(例如,包含切割试剂的溶液)可用于从光学(例如,荧光)标记的核苷酸或核苷酸类似物去除染料部分(例如,荧光染料部分)。在一些情况下,可以使用不同的切割试剂去除不同的染料(例如,荧光染料)。在其他情况下,可以使用相同的切割试剂去除不同的染料(例如,荧光染料)。从光学标记的核苷酸或核苷酸类似物上切割染料部分可以包括切割将核苷酸或核苷酸类似物连接到染料部分的接头的全部或部分。

如本文所用,术语“循环”通常是指其中使用对应于每个规范核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP,或其修饰形式)的核苷酸流、洗涤流和切割流的过程(例如,提供给测序模板,如本文所述)。多个循环可用于测序和/或扩增核酸分子。核苷酸流的顺序可以变化。

定相可以是先导或滞后定相。先导定相通常是指这样一种现象,其中链的群体显示核苷酸掺入在预期的循环之前的流(例如,由于系统中的污染)。滞后定相是指这样一种现象,其中链的群体显示核苷酸掺入在预期的循环之后的流(例如,由于在较早的循环中未完成的延伸)。

本文所述的化合物和化学部分,包括接头,可包含一个或多个不对称中心,因此产生对映异构体、非对映异构体和其他立体异构形式,根据绝对立体化学定义为(R)或(S),和,根据相对立体化学定义为(D)-或(L)-。D/L体系将分子与手性分子甘油醛联系起来,且通常用于描述包括氨基酸在内的生物分子。除非另有说明,本公开旨在涵盖本文公开的化合物的所有立体异构形式。当本文所述的化合物包含烯烃双键时,除非另有说明,否则本公开旨在包括E和Z几何异构体(例如,顺式或反式)。同样,所有可能的异构体,以及它们的外消旋和旋光纯形式,以及所有互变异构形式也旨在包括在内。术语“几何异构体”是指烯烃双键的E和Z几何异构体(例如,顺式或反式)。术语“位置异构体”是指围绕中心环的结构异构体,例如围绕苯环的邻位异构体、间位异构体和对位异构体。立体异构体的分离可通过色谱法或通过形成非对映异构体并通过重结晶或色谱法或其任何组合进行分离来进行。(Jean Jacques,Andre Collet,Samuel H.Wilen,“Enantiomers,Racemates andResolutions”,John Wiley and Sons,Inc.,1981,通过引用并入本文用于本公开)。立体异构体也可以通过立体选择性合成获得。

本文所述的化合物和化学部分,包括接头,可以作为互变异构体存在。“互变异构体”是指质子可能从分子的一个原子转移到同一分子的另一个原子的分子。在可能发生互变异构化的情况中,将存在互变异构体的化学平衡。除非另有说明,否则本文所述的化学结构旨在包括作为所述结构的不同互变异构体的结构。例如,用烯醇部分描述的化学结构还包括烯醇部分的酮互变异构形式。互变异构体的确切比例取决于几个因素,包括物理状态、温度、溶剂和pH。互变异构平衡的一些实例包括:

本文所述的化合物和化学部分,包括接头和染料,可以不同的富集同位素形式提供。例如,化合物可以富含2H、3H、11C、13C和/或14C的含量。例如,接头、底物(例如,核苷酸或核苷酸类似物)或染料可在至少一个位置被氘化。在一些实例中,接头、底物(例如,核苷酸或核苷酸类似物)或染料可被完全氘化。此类氘代形式可以通过美国专利号5,846,514和6,334,997中描述的程序制备,这些专利中的每一个的全部内容均通过引用并入本文。如美国专利号5,846,514和6,334,997所述,氘化可以提高代谢稳定性和或功效,从而增加药物的作用持续时间。

除非另有说明,否则本文描绘和描述的结构旨在包括仅在存在一个或多个同位素富集原子时不同的化合物。例如,除了氢被氘或氚置换或碳被富集13C-或14C-的碳置换之外,具有本结构的化合物和化学部分都在本公开的范围内。

本公开的化合物和化学部分可在构成此类化合物的一个或多个原子处包含非天然比例的原子同位素。例如,化合物或化学部分如接头、底物(例如,核苷酸或核苷酸类似物)或染料或其组合可以用一种或多种同位素如氘(2H),氚(3H)、碘-125(125I)或碳14(14C)标记。用2H、11C、13C、14C、15C、12N、13N、15N、16N、16O、17O、14F、15F、16F、17F、18F、33S、34S、35S、36S、35Cl、37Cl、79Br、81Br和125I的同位素取代都涵盖。本文所述的化合物和化学部分的所有同位素变体,无论是否具有放射性,都包含在本公开的范围内。

用于光学检测的接头

本公开提供了一种光学(例如,荧光)标记试剂,其包含染料(例如,荧光染料)和连接到染料并能够与待光学(例如,荧光)标记的底物相关联的接头。底物可以是任何合适的分子、分析物、细胞、组织或将被光学标记的表面。实例包括细胞,包括真核细胞、原核细胞、健康细胞和患病细胞;细胞受体;抗体;蛋白质;脂质;代谢物;探针;试剂;核苷酸和核苷酸类似物;和核酸分子。接头和底物之间的相关联可以是任何合适的相关联,包括共价键或非共价键,例如核酸分子中含嘌呤的核苷酸和含嘧啶的核苷酸之间的相关联。在一些情况下,此类相关联可能是生物素-亲和素相互作用。在其他情况下,接头和底物之间的相关联可以通过炔丙氨基部分。在一些情况下,接头和底物之间的相关联可以通过酰胺键(例如,肽键)。

接头可以是半刚性的。通过使用包含一系列环体系(例如,脂族和芳族环)的结构可以最容易地实现接头的半刚性性质。如本文所用,环(例如,环结构)是包含以闭合的、基本上环状的方式连接的任何数量的原子的环状部分,如有机化学领域中所使用的。环可以由任何数量的原子定义。例如,环可以包括3-12个原子,例如3-12个碳原子。在某些实例中,环可以是五元环(即,五边形)或六元环(即,六边形)。环可以是芳族的或非芳族的。环可以是脂族的。环可包含一个或多个双键。

环(例如,环结构)可以是可以包含一个或多个环结构(例如,多环体系)的环体系的组分。例如,环体系可包含单环。在另一个实例中,环体系可以是双环或桥接体系。环结构可以是由碳原子形成的碳环或其组分。碳环可以是饱和的、不饱和的或芳族环,其中环的每个原子都是碳。碳环包括3至10元单环、4至12元双环(例如,6至12元双环)和5至12元桥环。双环碳环的每个环可选自饱和的、不饱和的和芳族环。例如,双环碳环可包括稠合至饱和的或不饱和的环(例如环己烷、环戊烷或环己烯)的芳环(例如,苯基)。双环碳环可包括饱和的、不饱和的和芳族双环的任何组合,只要价态允许。双环碳环可包括环大小的任何组合,例如4-5个稠环体系、5-5稠环体系、5-6稠环体系和6-6稠环体系。碳环可以是例如,环丙基、环丁基、环戊基、环己基、环己烯基、金刚烷基、苯基、茚满基或萘基。饱和碳环不包括多重键(例如,双键或三键)。饱和碳环可以是例如,环丙烷、环丁烷、环戊烷或环己烷。不饱和碳环包括至少一个多重键(例如,双键或三键)但不是芳族碳环。不饱和碳环可以是例如,环己二烯、环己烯或环戊烯。碳环的其他实例包括但不限于,环丙烷、环丁烷、环戊烷、环戊二烯、环己烷、环庚烷、环庚烯、萘和金刚烷。芳族碳环(例如,芳基部分)可以是例如,苯基、萘基或二氢萘基。

在一些情况下,环可包括一个或多个杂原子,例如一个或多个氧、氮、硅、磷、硼或硫原子。环可以是包含一个或多个杂原子的杂环或其组分。杂环可以是饱和的、不饱和的或芳族环,其中至少一个原子是杂原子。杂原子包括3至10元单环、6至12元双环和6至12元桥环。双环杂环可包括饱和的、不饱和的和芳族双环的任何组合,只要价态允许。例如,杂芳环(例如,吡啶基)可以与饱和或不饱和环(例如,环己烷、环戊烷、吗啉、哌啶或环己烯)稠合。双环杂环可包括环大小的任何组合,例如4-5个稠环体系、5-5稠环体系、5-6稠环体系和6-6稠环体系。不饱和杂环包括至少一个多重键(例如,双键或三键)但不是芳族杂环。不饱和杂环可以是例如,二氢吡咯、二氢呋喃、噁唑啉、吡唑啉或二氢吡啶。杂环的其他实例包括但不限于,吲哚、苯并噻吩、苯并噻唑、苯并噁唑、苯并咪唑、噁唑并吡啶、咪唑并吡啶、噻唑并吡啶、呋喃、噁唑、吡咯、吡唑、咪唑、噻吩、噻唑、异噻唑和异噁唑。杂芳基部分可以是芳族单环结构,例如5至7元环,包括至少一个杂原子,例如1至4个杂原子。可替代地,杂芳基部分可以是具有两个或更多个环状环的多环环体系,其中两个或更多个原子是两个相邻环共有的,其中至少一个环是杂芳族的。杂芳基包括例如,吡咯、呋喃、噻吩、咪唑、噁唑、噻唑、吡唑、吡啶、吡嗪、哒嗪和嘧啶等。

环可以是取代的或未取代的。取代基取代环的一个或多个原子上的氢原子或环的可取代杂原子(例如NH或NH2)。取代根据环体系的各种组分的允许价态并提供稳定的化合物(例如,不会通过例如重排、消除或环化进行自发转化的化合物)。取代基可以取代单个氢原子或多个氢原子(例如,在相同环原子或不同环原子上)。环上的取代基可以是例如,卤素、羟基、氧代、硫酮基、硫醇基、酰胺基、氨基、羧基、次氮基、氰基、硝基、亚氨基、肟基、肼基、烷氧基、烯基、炔基、芳基、芳烷基、芳烯基、芳炔基、环烷基、环烷基烷基、烷基环烷基、杂环烷基、杂环基、烷基杂环基或任何其他有用的取代基。取代基可以是水溶性的。水溶性取代基的实例包括但不限于,吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。

接头可以具有任何数量的环,包括至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多环。在一些情况下,环可以共享一条边(例如,是双环环体系的组分)。通常,接头的环部分可为接头提供一定程度的物理刚性和/或可用于将接头一端上的染料(例如,荧光染料)与待标记的底物和/或来自与底物相关联和/或与接头相关联的第二染料(例如,荧光染料)物理分离。环可以是氨基酸(例如,非蛋白氨基酸,如本文所述)的组分。

在一些情况下,接头可以是“完全刚性的”(例如,基本上不灵活)。例如,接头的环体系可能不被任何sp2或sp3碳原子分隔。通常,sp2和sp3碳原子(例如,在环体系之间)为接头提供一定程度的物理灵活性。特别地sp3碳原子可以赋予显著的灵活性。非限制性地,灵活性可以允许聚合酶接受用接头和染料(例如,荧光染料)修饰的底物(例如,核苷酸或核苷酸类似物),或以其他方式改善标记系统的性能。然而,在多染料体系中(例如,包含多种荧光标记试剂的体系,例如包含与两种或多种荧光标记试剂偶联的两种或多种核苷酸的多核苷酸),过于灵活的接头可能破坏刚性特征并允许两种染料(例如,荧光染料)紧密相关联并被猝灭。因此,接头的环体系可以通过有限数量的sp3键彼此连接,例如通过不大于两个sp3键(例如,0、1或2个sp3键)。例如,接头的至少两个环体系可以通过不大于两个sp3键(例如,通过0、1或2个sp3键)彼此连接。例如,接头的至少两个环体系可以通过不大于两个sp2键,例如通过不大于1个sp2键彼此连接。接头的环体系可以通过有限数量的原子彼此连接,例如通过不大于2个原子。例如,接头的至少两个环体系可以通过不大于2个原子彼此连接,例如仅通过1个原子或没有原子(例如,直接连接)。

接头的一系列环体系可包含芳族环和/或脂族环。接头的至少两个环体系可以在没有中间碳原子的情况下彼此直接连接。接头可包含至少一个可包含环体系的氨基酸。例如,接头可以包含至少一种非蛋白氨基酸(例如,如本文所述),例如羟脯氨酸。

光学(例如,荧光)标记试剂(例如,核酸测序反应)的许多应用可以在水溶液中进行。在一些情况下,具有过高比例的碳和氢原子和/或缺乏带电化学基团的接头可能水溶性不足而不能用于水性溶液中。因此,本文所述的接头可具有一个或多个水溶性基团。

接头可以在任何有用的位置包括水溶性基团。例如,接头可以在与标记(例如,染料,如本文所述)的附接点处或附近包含水溶性基团。可替代地或另外地,接头可以在与底物(例如,蛋白质或核苷酸或核苷酸类似物)的附接点处或附近包含水溶性基团。可替代地或另外地,接头可在与标记(例如,染料,如本文所述)和底物(例如,蛋白质或核苷酸或核苷酸类似物)的连接点之间包含水溶性基团。接头的一个或多个环可包含水溶性基团。例如,每个环可包含水溶性基团,两个或更多个环可包含水溶性基团,仅一个环可包含水溶性基团,或两者之间的任何位置。给定的环可包含一个或多个水溶性部分。例如,接头的环可包含两个水溶性部分。水溶性基团(多个)可以是接头的环的主链的组成部分或可以附加到接头的环上(例如,作为取代基)。接头的每个水溶性部分可以不同。或者,接头的一个或多个水溶性部分可以相同。例如,接头的每个水溶性部分可以相同。在一些情况下,水溶性基团带正电荷。合适的水溶性基团的实例包括但不限于,吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛和硼酸或硼酸酯。

水溶性基团可以是降低(包括使其更负)光学(例如,荧光)标记试剂的logP的任何官能团。LogP是分子在水和正辛醇之间的分配系数。多脂分子更有可能分配到辛醇中,给出正值和大的logP值。LogP的式可以表示为log P辛醇/水=log([溶质]辛醇/[溶质]),其中[溶质]辛醇是辛醇中的溶质(即,标记试剂)的浓度且[溶质]是水中的溶质的浓度。因此,与辛醇相比,化合物分配到水中越多,logP越负。LogP可以通过实验测量或使用软件算法预测。水溶性基团可以具有任何合适的LogP值。在一些情况下,LogP小于约2、小于约1.5、小于约1、小于约0.5、小于约0、小于约-0.5、小于约-1、小于约-1.5、小于约-2或更低。在一些情况下,LogP为约2.0至约-2.0。

接头可包括一个或多个不对称(例如,手性)中心(例如,如本文所述)。预期接头的所有立体化学异构体,包括外消旋体和对映体纯接头。

接头和/或它可以与之附接的底物(例如,蛋白质或核苷酸或核苷酸类似物)或染料,可以包括一种或多种同位素(例如,放射性)标记(例如,如本文所述)。预期接头的所有同位素变体。

接头的结构特征,包括环的数量、接头的刚性等,可以组合以建立由接头连接的染料(例如,荧光)染料和底物(例如,蛋白质或核苷酸或核苷酸类似物)之间的功能距离。在一些情况下,距离对应于接头的长度(和/或功能长度)。在一些情况下,功能长度基于在其中测量或估计长度的溶液的温度、溶剂、pH和/或盐浓度而变化。可以在溶液中测量功能长度,在其中测量来自底物的光学(例如,荧光)信号。功能长度可以是功能长度分布的平均值或整体值(例如,在旋转、振动和平移运动上)并且可以基于例如温度、溶剂、pH和/或盐浓度而不同。功能长度可以被估计(例如,基于键长和空间考虑,例如通过使用化学绘图或建模程序)和/或测量(例如,使用分子成像和/或晶体学技术)。

接头可以在染料(例如,荧光染料)和底物(例如,蛋白质或核苷酸或核苷酸类似物)之间建立任何合适的功能长度。在一些情况下,功能长度至多为约500纳米(nm)、约200nm、约100nm、约75nm、约50nm、约40nm、约30nm、约20nm、约10nm、约5nm、约2nm、约1.0nm、约0.5nm、约0.3nm、约0.2nm或更小。在一些情况下,功能长度至少为约0.2纳米(nm)、至少约0.3nm、至少约0.5nm、至少约1.0nm、至少约2nm、至少约5nm、至少约10nm、至少约20nm、至少约30nm、至少约40nm、至少约50nm、至少约75nm、至少约100nm、至少约200nm、至少约500nm或更大。在一些情况下,功能长度为约0.5nm至约50nm。

在一些情况下,接头形成直链和/或连续链。在一些情况下,接头是支链的。接头可能能够与多种染料(例如,荧光染料)和/或底物(例如,核苷酸和/或核苷酸类似物)形成键。

接头可以是具有规则重复单元的聚合物。可替代地,接头可以是没有规则重复单元的共聚物。在一些情况下,接头不是聚合过程的结果。通常,聚合过程可产生具有多种聚合度和分子量的产物。相反,在一些情况下,本文所述的接头具有确定的(即,已知的)分子量。

接头可由一个或多个氨基酸构建。例如,接头可由两个或更多个氨基酸构建。氨基酸可以是天然氨基酸或非天然氨基酸。氨基酸可以是蛋白氨基酸或非蛋白氨基酸。如本文所用,“蛋白氨基酸”通常是指可在翻译过程中掺入蛋白质中的遗传编码的氨基酸。蛋白氨基酸包括精氨酸、组氨酸、赖氨酸、天冬氨酸、谷氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、硒代半胱氨酸、甘氨酸、脯氨酸、丙氨酸、异亮氨酸、亮氨酸、蛋氨酸、苯丙氨酸、色氨酸、酪氨酸、缬氨酸、硒代半胱氨酸和吡咯赖氨酸。如本文所用,“非蛋白氨基酸”是一种氨基酸,其不是蛋白氨基酸。非蛋白氨基酸可以是天然氨基酸或非天然氨基酸。非蛋白氨基酸包括在蛋白质中没有发现和/或在生物体的遗传密码中未被天然编码或发现的氨基酸。非蛋白氨基酸的实例包括但不限于,羟脯氨酸、硒代蛋氨酸、羟丁赖氨酸、2-氨基异丁酸、αγ-氨基丁酸、鸟氨酸、瓜氨酸、β-丙氨酸(3-氨基丙酸)、δ-氨基乙酰丙酸、4-氨基苯甲酸、脱氢丙氨酸、羧基谷氨酸、焦谷氨酸、正缬氨酸、正亮氨酸、别异亮氨酸、酪亮氨酸、哌啶酸、别苏氨酸、同型半胱氨酸、高丝氨酸、α-氨基-正庚酸、α,β-二氨基丙酸、α,γ-二氨基丁酸、β-氨基-正丁酸、β-氨基异丁酸、异缬氨酸、肌氨酸、N-乙基甘氨酸、N-丙基甘氨酸、N-异丙基甘氨酸、N-甲基丙氨酸、N-乙基丙氨酸、N-甲基β-丙氨酸、N-乙基β-丙氨酸、异丝氨酸和α-羟基-γ-氨基丁酸。非蛋白氨基酸的其他实例包括本文所述的非天然氨基酸。非蛋白氨基酸可包含环结构。例如,非蛋白氨基酸可以是反式-4-氨基甲基环己烷羧酸或4-肼基苯甲酸。此类化合物可以用FMOC(芴基甲氧基碳酰氯)进行FMOC保护并用于固相肽合成。这些化合物的结构如下所示:

在接头包含多个氨基酸,例如多个非蛋白氨基酸的情况下,与环部分相邻的胺部分(例如,肼部分中的胺部分)可用作水溶性基团。为了合成水溶性肽,可以制备包含交替的非水溶性氨基酸和水溶性氨基酸(例如羟脯氨酸)的混合接头。其他部分可用于增加水溶性。例如,将氨基酸与草氨酸酯部分连接可以通过额外的氢键提供水溶性,而无需添加任何sp3键。草氨酸酯前体2-氨基-2-氧代乙酸的结构如下所示:

在一些情况下,接头的组分(例如,单体单元)可具有氨基、羧基和水溶性部分。在一些情况下,单体可能被解构为两个“半单体”。即,通过使用两个不同的单元,一个包含两个氨基,另一个包含两个羧基,可以构建氨基酸部分,该氨基酸部分可以是接头的单元(例如,重复单元)。一个或两个单元可以包括一个或多个水溶性部分。例如,至少一个单元可以包括水溶性基团(例如,如本文所述)。例如,2,5-二氨基对苯二酚可以是一种半单体(A),且2,5-二羟基对苯二甲酸可以是另一种半单体(B)。这样的方案如下所示:

如上所示,A是二胺,且B是二酸。因此,非蛋白(例如,非天然)氨基酸可由二胺和二酸构建。此类结构的另外实例如下所示:

基于两个半单体的聚合物(例如,如上所示)可以通过固相合成来构建。因为半单体在连接部分可以是同双官能的,在一些情况下不需要FMOC保护。例如,可以将二羧酸附加到固体支持物上,然后与适当的偶联剂(HBTU/HOBT/三甲吡啶)一起加入过量的二胺。在洗掉过量试剂后,可以将过量的二羧酸与偶联剂一起加入。由一分子液相试剂与两种固相附接试剂反应组成的副产物可能导致合成的截断。这些副产物可以在从支持物上切割并通过HPLC纯化后与产物分离。

半单体方法的一个优点可以是生成的聚合物的灵活性增加。二胺(A)可以在后续步骤中被不同的二胺(A')替代,以重复或非重复的方式改变聚合物的性能。此类方案可以促进诸如ABA’BABA’B的聚合物的构建。

根据上述方案使用的半单体的另外实例包括2,5-二氨基吡啶和2,5-二羧基吡啶,其两者均如下所示,以及如下所示的其他部分:

二胺:

二羧酸:

如上所述,氨基酸(例如,可以是非天然氨基酸的非蛋白氨基酸)可由二胺和二羧酸构建。氨基酸(例如,可以是非天然氨基酸的非蛋白氨基酸)也可由氨基硫醇和硫醇羧酸构建。氨基硫醇和硫醇羧酸的实例如下所示:

由氨基硫醇和硫醇羧酸构建的氨基酸(例如,非天然氨基酸)的实例如下所示:

如上所示,使用氨基硫醇和硫醇羧酸构建的氨基酸可以包括二硫键。如本文别处所述,二硫键可使用切割试剂(例如,如本文所述)切割。因此,由氨基硫醇和硫醇羧酸构建的氨基酸可用作接头的可切割部分。由氨基硫醇和羧酸构建的氨基酸可以是接头(例如,如本文所述)的组分,其可以将标记部分(例如,荧光染料)偶联至底物(例如,核苷酸或核苷酸类似物)。各种结构允许用于掺入的不同疏水性并且在与切割试剂相互作用后可提供不同的“疤痕”部分(例如,如本文所述)。两个或更多个氨基酸,例如由氨基硫醇和硫醇羧酸构建的两个或更多个氨基酸,可以包括在接头中。例如,两个或更多个氨基酸可以包括在接头中并且被不大于2个sp3碳原子隔开,例如被不大于2个sp2碳原子或不大于2个原子隔开。在由氨基硫醇和硫醇羧酸形成的两个或更多个氨基酸在接头内彼此连接的情况下,切割可能更快,因为将有多个可能的切割位点。包含此类组件的接头的一部分的实例如下所示:

如上所述,两个半单体可以组合以提供氨基酸(例如,非蛋白氨基酸,例如非天然氨基酸)。因此,非天然氨基酸可包括任何已知的非天然氨基酸,以及可如本文所述构建的任何非天然氨基酸。

可以将诸如本文所述的那些半单体构建成多肽聚合物。用氨基酸的两个重复单元构建的核苷酸的实例如下所示:

在一些情况下,在肽偶联之前或之后,含氮环中的氮可以被季铵化以提供吡啶鎓部分,从而提高最终产物的水溶性。以这种方式生成的示例性接头序列如下所示:

可以与半单体方法一起使用的水溶性键包括,例如,具有对称官能团的那些,例如仲酰胺、双酰肼和脲。此类部分的实例如下所示:

氨基酸接头亚基可以通过肽合成方法组装成聚合物。例如,称为SPPS(固相肽合成)或通过液相合成的固体支持方法可用于将氨基酸组装成接头。SPPS方法可以使用固相珠,其中初始步骤是通过其羧酸部分附接C端氨基酸,使其游离胺准备好偶联。肽合成可以通过让FMOC胺保护的单体与肽偶联试剂(如HBTU和有机碱)一起流动来启动。可以洗掉多余的试剂并引入下一个单体。在附加了一个或多个氨基酸后,最终的肽可以从珠上切割下来并通过HPLC纯化。液相合成可以使用相同的试剂(珠除外),但在每个步骤之后进行纯化。任一逐步聚合过程的优点在于所得接头可具有可通过质谱法确认的确定的分子量。

接头可包括一种或多种组分。例如,接头可以包括包含聚合物区域(例如,包含重复单元)的第一组分和不包含聚合物区域的第二单元。第二组分可包括可切割组分(例如,如本文所述)。可切割接头的实例包括但不限于,如下所示的结构E和B:

在以上所示的结构中,二硫化物部分可以被切割(例如,如本文所述)以提供硫醇疤痕。在接头部分的羧基部分与附接到底物(例如,蛋白质或核苷酸或核苷酸类似物)的胺部分之间反应时,可切割接头可附接到底物以提供通过酰胺部分附接到可切割接头的底物。例如,底物可以是包括炔丙氨基部分的核苷酸或核苷酸类似物,并且可以配置包含本文所述的染料和接头的荧光标记试剂以通过炔丙氨基部分与底物相关联。此类底物的实例如下所示:

包括第一和第二组分的接头的第一组分可包括重复单元。例如,接头可以包括含有一个或多个羟脯氨酸部分的第一组分。此类接头组分的实例如下所示:

上面示出的接头包括10个羟脯氨酸部分和一个甘氨酸部分,并且在本文中称为“H”或“hyp10”。上述接头的替代形式包括20个羟脯氨酸部分和一个甘氨酸部分,并且在本文中称为“hyp20”。如本文所述,hyp10和hyp20的所有立体异构体及其组合都被考虑在内。接头组分例如hyp10可以通过接头组分的游离羧基部分与可切割接头的氨基部分之间的反应连接至可切割接头。接头组分例如hyp10可以通过接头组分的游离氨基部分连接到染料。包括含有重复单元(例如,hyp10)的第一接头组分和含有可切割接头的第二接头组分的光学标记试剂的实例在本文别处提供。

接头可以提供荧光部分(例如,染料,如本文所述)和底物(例如,蛋白质或核苷酸或核苷酸类似物)之间的连接。例如,光学(例如,荧光)标记试剂可以包含附接至接头(例如,如本文所述)的光学染料(例如,荧光染料)。染料(例如,荧光染料)的非限制性实例包括SYBR绿、SYBR蓝、DAPI、碘化丙啶、Hoechst、SYBR金、溴化乙啶、吖啶、原黄素、吖啶橙、吖啶黄、荧光香豆素、玫瑰树碱、柔红霉素、氯喹、偏端霉素D、色霉素、乙菲啶、光辉霉素、多吡啶钌、氨茴霉素、菲啶和吖啶、碘化丙锭、碘化己锭(hexidium iodide)、二氢乙锭、乙锭二聚体-1和-2、单叠氮化乙锭、ACMA、Hoechst 33258、Hoechst 33342、Hoechst34580、DAPI、吖啶橙、7-AAD、放线菌素D,LDS751、羟芪巴脒、SYTOX蓝、SYTOX绿、SYTOX橙、POPO-1、POPO-3、YOYO-1、YOYO-3、TOTO-1、TOTO-3、JOJO-1、LOLO-1、BOBO-1、BOBO-3、PO-PRO-1、PO-PRO-3、BO-PRO-1、BO-PRO-3、TO-PRO-1、TO-PRO-3、TO-PRO-5、JO-PRO-1、LO-PRO-1、YO-PRO-1、YO-PRO-3、PicoGreen、OliGreen、RiboGreen、SYBR金、SYBR绿I、SYBR绿II、SYBR DX、SYTO染料(例如,SYTO-40、-41、-42、-43、-44和-45(蓝);SYTO-13、-16、-24、-21、-23、-12、-11、-20、-22、-15、-14和-25(绿);SYTO-81、-80、-82、-83、-84和-85(橙);SYTO-64、-17、-59、-61、-62、-60和-63(红))、荧光素、异硫氰酸荧光素(FITC)、四甲基异硫氰酸罗丹明(TRITC)、罗丹明、四甲基罗丹明、R-藻红蛋白、Cy-2、Cy-3、Cy-3.5、Cy-5、Cy5.5、Cy-7、德克萨斯红、Phar-红、别藻蓝蛋白(APC)、Sybr绿I、Sybr绿II、Sybr金、CellTracker绿、7-AAD、乙锭同二聚体I、乙锭同二聚体II、乙锭同二聚体III、溴化乙锭、伞形酮、曙红、绿色荧光蛋白、赤藓红、香豆素、甲基香豆素、芘、孔雀石绿、芪、萤光黄、级联蓝、二氯三嗪基氨基荧光素、丹磺酰氯,荧光镧系配合物如包括铕和铽的那些、羧基四氯荧光素,5和/或6-羧基荧光素(FAM)、VIC、5-(或6-)碘乙酰胺基荧光素、5-{[2(和3)-5-(乙酰巯基)-琥珀酰基]氨基}荧光素(SAMSA-荧光素)、丽丝胺罗丹明B磺酰氯、5和/或6羧基罗丹明(ROX)、7-氨基-甲基-香豆素、7-氨基-4-甲基香豆素-3-乙酸(AMCA)、BODIPY荧光团、8-甲氧基芘-1,3,6-三磺酸三钠盐、3,6-二磺酸-4-氨基-萘二甲酰亚胺、藻胆蛋白、AlexaFluor染料(例如,AlexaFluor350、405、430、488、532、546、555、568、594、610、633、635、647、660、680、700、/750、和790染料)、DyLight染料(例如,DyLight 350、405、488、550、594、633、650、680、755和800染料)、黑洞猝灭染料(BiosearchTechnologies)(例如,BH1-0、BHQ-1、BHQ-3和BHQ-10)、QSY染料荧光猝灭剂(来自MolecularProbes/Invitrogen)(例如QSY7、QSY9、QSY21和QSY35)、Dabcyl、Dabsyl。Cy5Q、Cy7Q、黑花青染料(GE Healthcare)、Dy-猝灭剂(Dyomics)(例如,DYQ-660和DYQ-661)、ATTO荧光猝灭剂(ATTO-TEC GmbH)(例如,ATTO540Q、580Q、612Q、532和633),以及其他荧光团和猝灭剂(例如,如本文所述)。在一些情况下,标签可以是不自猝灭或表现出邻近猝灭的类型。不自猝灭或表现出邻近猝灭的标记类型的非限制性实例包括双满衍生物,例如单溴双满(Monobromobimane)。包括在本文提供的结构中的另外的染料也可以与本文提供的任何接头和本文所述的任何底物组合使用,而不管它们的公开内容的上下文如何。

包含光学染料(例如,荧光染料)和接头的光学(例如,荧光)标记试剂可以进一步包含能够被切割以将光学染料与光学标记试剂与之相关联的底物分离的可切割基团。接头的全部或部分可以是可切割基团的一部分。在一些情况下,切割可切割基团可能留下与底物相关联的疤痕基团。可切割基团可以是例如,能够被三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)或四氢吡喃基(THP)切割以留下羟基疤痕基团的叠氮甲基基团。可切割基团可以是例如,能够被TCEP、DTT或THP切割以留下硫醇疤痕基团的二硫键。可切割基团可以是例如,能够被TCEP、DTT或THP切割以留下羟基疤痕基团的烃基二硫甲基。可切割基团可以是例如,能够被紫外(UV)光切割以留下羟基疤痕基团的2-硝基苄氧基基团。疤痕也可以是例如,芳族基团,例如苯基或苄基部分。

光学(例如,荧光)标记试剂可被配置为与底物例如核苷酸或核苷酸类似物(例如,如本文所述)相关联。替代地或除此之外,光学(例如,荧光)标记试剂可被配置为与底物例如蛋白质、细胞、脂质或抗体相关联。例如,光学标记试剂可被配置为与蛋白质相关联。蛋白质底物可以是任何蛋白质,并且可以包括任何有用的修饰、突变或标记,包括任何同位素标记。例如,蛋白质可以是抗体,例如单克隆抗体。与一种或多种光学(例如,荧光)标记试剂(例如,如本文所述)相关联的蛋白质可以是例如,用于标记细胞的抗体(例如,单克隆抗体),该标记的细胞可被分析和使用流式细胞仪分选。

光学(例如,荧光)标记试剂(例如,如本文所述)可以减少猝灭(例如,偶联到掺入到生长核酸链中的核苷酸或核苷酸类似物的染料之间,例如在核酸测序过程中)。例如,由底物(例如,可以掺入生长核酸链中的核苷酸或核苷酸类似物)发射的光学(例如,荧光)信号可以与底物(例如,与底物相邻或接近掺入的光学标记的数量)相关联的光学(例如,荧光)标记的数量成比例。例如,包括相同或不同类型的底物(例如,相同或不同类型的核苷酸或核苷酸类似物)的多种光学标记试剂可以彼此接近地掺入生长核酸链中(例如,在核酸测序过程中)。在此类系统中,由集体底物发射的信号可以与掺入的染料标记底物的数量大致成比例(例如,成线性比例)。换句话说,猝灭可能不会显著影响发射的信号。这在其中使用100%标记分数的系统中是可以观察到的。在少于100%的底物被标记(例如,核苷酸流中少于100%的核苷酸被标记)的情况下,由掺入多个生长核酸链(例如,如本文所述,偶联到与支持物偶联的测序模板的多条生长核酸链)中的底物(例如,核苷酸或核苷酸类似物)发射的光学(例如,荧光)信号可以与生长核酸链的均聚物区域的长度成比例。类似地,在少于100%的底物被标记(例如,连续核苷酸流的每一个中少于100%的核苷酸被标记)的情况下,由掺入多个生长核酸链(例如,如本文所述,偶联到与支持物偶联的测序模板的多条生长核酸链)中的底物(例如,核苷酸或核苷酸类似物)发射的光学(例如,荧光)信号可以与生长核酸链的杂聚物和/或均聚物区域的长度成比例。在一些此类情况下,测量的光学(例如,荧光)信号的强度可以与底物已经掺入其中的杂聚和/或均聚区域的长度成线性比例。例如,当将光学(例如,荧光)信号相对于底物已掺入其中的杂聚和/或均聚区域的底物中的长度作图时,测量的光学(例如,荧光)信号可以与大约1.0的斜率成线性比例。

光学(例如,荧光)标记试剂(例如,如本文所述)可以减少蛋白质系统中的猝灭。标记蛋白质时,荧光团与蛋白质之比(F/P)为约3时可能开始发生猝灭。使用本文提供的光学标记试剂,可以获得更高的F/P比,从而获得更亮的试剂。这可用于分析蛋白质(例如,使用成像)和/或用于分析用与一种或多种光学(例如,荧光)标记试剂相关联的蛋白质(例如,抗体)标记的细胞。

在本文描述的接头的实例可见于,例如,图1A-1C、2A、4、5A、5B、6、7、8、13A-13C、14A、14B、16和17。在一些情况下,包括在这些接头中的R基团(例如,如在图1C中)赋予标记试剂上足够的水溶性。另外的实例包括在本文别处,包括在下面的实施例中。

在一方面,本公开提供了包含荧光标记试剂或其衍生物(例如,如本文所述)的寡核苷酸分子。寡核苷酸分子可包含一种或多种另外的相同类型的荧光标记试剂(例如,包含具有相同化学结构的接头、包含相同化学结构的染料,和/或与相同类型的底物(例如,核苷酸)相关联)。寡核苷酸分子的荧光标记试剂和一种或多种另外的荧光标记试剂可以与核苷酸相关联。例如,荧光标记试剂可以连接到寡核苷酸分子的核苷酸的核碱基上。荧光标记试剂和一种或多种另外的荧光标记试剂可与寡核苷酸分子的相邻核苷酸连接。可替代地或另外地,荧光标记试剂和一种或多种另外的荧光标记试剂可与寡核苷酸分子的核苷酸相连,所述核苷酸被一个或多个不与荧光标记试剂相连的核苷酸分隔。寡核苷酸分子可以是单链分子。可替代地,寡核苷酸分子可以是双链或部分双链的分子。双链或部分双链分子可包含与单链或双链相关联的荧光标记试剂。寡核苷酸分子可以是脱氧核糖核酸分子。寡核苷酸分子可以是核糖核酸分子。可以通过核酸测序过程(例如,如本文所述)产生和/或修饰寡核苷酸分子。

荧光标记试剂的接头可包含可切割基团,该可切割基团被配置为被切割以将荧光标记试剂的荧光染料与跟其相关联的底物(例如,核苷酸)分离。例如,接头可包含可切割基团,该可切割基团包括叠氮甲基基团、二硫键、烃基二硫甲基或2-硝基苄氧基基团。可将可切割基团配置为通过应用下组中的一个或多个成员来切割:由三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)、四氢吡喃基(THP)、紫外(UV)光及其组合。包含荧光标记试剂的寡核苷酸分子可被配置为发射荧光信号(例如,在适当范围的能量下激发时,如本文所述)。

在另一方面,本公开提供了包含多个接头(例如,如本文所述)的试剂盒。多个接头中的接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系。两个或更多个环体系中的至少两个可以通过不大于两个sp3碳原子彼此连接。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。两个或更多个环体系中的至少两个可以通过不多于两个原子彼此连接。接头可包含非蛋白氨基酸(例如,如本文所述),其包含两个或更多个环体系的环体系。例如,接头可包含羟脯氨酸或由例如二胺和二羧酸或氨基硫醇和硫醇羧酸构成的氨基酸。接头可连接至荧光染料(例如,如本文所述)和/或与底物相关联。例如,接头可连接至荧光染料并偶联至选自核苷酸、蛋白质、脂质、细胞和抗体的底物。例如,接头可以连接到荧光染料和核苷酸。

接头可包含多个氨基酸,例如多个非蛋白(例如,非天然)氨基酸。例如,接头可以包含多个羟脯氨酸(例如,hyp10部分)。一个或多个水溶性基团中的至少一个水溶性基团可以附加到两个或更多个环体系的环结构上。一个或多个水溶性基团可选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。接头可包含可切割基团,该可切割基团被配置为被切割以将接头的第一部分与接头的第二部分分离。可切割基团可选自叠氮甲基基团、二硫键、烃基二硫代甲基基团和2-硝基苄氧基基团。通过应用下组中的一个或多个成员可切割基团是可切割的:三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)、四氢吡喃基(THP)、紫外(UV)光及其组合。接头可包含选自 的部分。这些部分都包含二硫化物基团,因此可被认为是可切割的基团。

试剂盒的多个接头可包含与第一底物(例如,第一核苷酸)相关联的第一接头和与第二底物(例如,第二核苷酸)相关联的第二接头。第一底物和第二底物可以是不同类型的(例如,不同的规范核苷酸)。第一底物和第二底物可以是包含不同类型(例如,A、C、G、U和T)核碱基的核苷酸。第一接头和第二接头可包含相同的化学结构。类似地,第一接头可连接至第一荧光染料且第二接头可连接至第二荧光染料。第一荧光染料和第二荧光染料可以是不同类型的。例如,第一和第二荧光染料可以在不同的波长发荧光和/或具有不同的最大激发波长。第一和第二荧光染料可以在相似的波长发荧光和/或具有相似的最大激发波长,而不管它们是否共享相同的化学结构。

试剂盒的多个接头可进一步包括与第三底物相关联的第三接头和与第四底物相关联的第四接头。第一底物、第二底物、第三底物和第四底物可以是不同类型的。例如,第一底物、第二底物、第三底物和第四底物可以是包含不同类型(例如,A、C、G和U/T)核碱基的核苷酸。第一接头和第三接头可包含不同的化学结构。第一和第三接头可包含相同的化学基团,例如相同的可切割基团(例如,如本文所述)。例如,第一接头和第三接头可各自包含包括二硫键的部分。类似地,第一接头和第四接头可包含不同的化学结构。第一和第四接头可包含相同的化学基团,例如相同的可切割基团(例如,如本文所述)。例如,第一接头和第四接头可各自包含包括二硫键的部分。

在一个实例中,第一接头包含hyp10部分和第一可切割部分,第二接头包含hyp10部分和第二可切割部分,第三接头包含第三可切割部分但不包含hyp10部分,且第四接头包含第四可切割部分并且不包含hyp10部分。第二可切割部分可具有不同于第一可切割部分的化学结构。或者,第二可切割部分和第一可切割部分可具有相同的化学结构。第三可切割部分和第四可切割部分可具有相同的化学结构。或者,第三可切割部分和第四可切割部分可具有不同的化学结构。在一个实例中,第一接头和第二接头各自具有第一化学结构并且第三接头和第四接头各自具有第二化学结构,该第二结构不同于第一化学结构。在另一个实例中,第一接头、第二接头、第三接头和第四接头都具有相同的化学结构。在另一个实例中,第一接头、第二接头、第三接头和第四接头都具有不同的化学结构。

光学标记试剂的使用方法

有几种不同类型的猝灭可以减少,不同类型的应用可以使用本文所述的光学(例如,荧光)标记试剂进行。

本文描述的方法可用于减少猝灭,包括G-猝灭。染料(例如,荧光染料)与核苷酸的附接(例如,通过本文提供的接头)可导致许多染料的染料猝灭,特别是当染料与鸟苷核苷酸附接时。染料猝灭可发生在染料与其相关的核苷酸之间,以及染料部分之间,例如偶联至不同核苷酸(例如,相邻核苷酸或被一个或多个其他核苷酸隔开的核苷酸)的染料部分之间。使用本文提供的接头可以减轻猝灭,从而允许更灵敏地检测含有G的序列。此外,结晶G-均聚物区域的染料标记的核苷酸可以显示降低的荧光。任何需要将染料附接到dGTP的核酸测序方法都可以从这些接头中受益,包括单分子检测、使用3'封闭核苷酸的测序和通过杂交测序。

本文所述的方法可用于减少对相同DNA链上相邻或邻近核苷酸(例如,被一个、两个或更多个其他核苷酸隔开的核苷酸)上的染料-染料猝灭。需要在相邻或邻近核苷酸上的染料的方法可能导致邻近猝灭;也就是说,相邻的两种染料的亮度比一种染料的亮度低两倍,或者通常甚至比单一染料亮度低。使用本文提供的接头可以减轻猝灭,从而允许多种染料的定量检测。例如,在诸如大多数天然核苷酸流测序的测序方法中,标记的染料的分数通常小于5%,因为由于猝灭问题,均聚物在较高分数处的信号与均聚物长度不是线性的。本文所述的试剂可以允许更多(例如,大于5%,在一些情况下高达100%)的核苷酸被标记,同时促进对掺入的核苷酸的灵敏和准确检测。

与缺少接头的染料-核苷酸(例如,在核酸测序期间)相比,本文提供的染料-接头-核苷酸的使用可导致通过聚合酶(例如,如本文所述)更有效地掺入生长核酸链中(例如,增加的容差)。结果可能是使用较少量的经染料标记的核苷酸来获得相同的信号。

使用本文提供的染料-接头-核苷酸可导致较少的聚合酶错误掺入(例如,如本文所述)(例如,在核酸测序期间)。结果可能是模板链的更少损失,因此更长的测序读段。

使用本文提供的染料-接头-核苷酸可导致更少的错配延伸(例如,在核酸测序期间),并因此减少先导定相。

本文所述的方法可用于减少多染料应用中的染料-染料猝灭。杂交测定也可以从防止猝灭的接头中受益。猝灭效应可能导致靶标与信号的非线性。

本文所述的方法可与寡聚体和树枝状聚合物组合使用以进行信号放大。非猝灭接头可允许合成用于抗体标记的非常明亮的聚合物。这些明亮的抗体可用于流式细胞术中的细胞表面标记或用于抗原检测方法,例如侧面流动测试和荧光免疫测定。

本公开的光学(例如,荧光)标记试剂可以用作分子标尺。底物可以是荧光猝灭剂、荧光供体或荧光受体。在一些情况下,底物是核苷酸。接头可以附接到核碱基上的核苷酸,如下所示,其中染料是Atto633:

上述显示的结构是光学(例如,荧光)标记试剂,包含可切割(通过二硫键)部分和通过吡啶鎓接头附接到dGTP类似物(dGTP-SS-py-Atto633)的荧光染料。在整个公开内容中提供了光学标记试剂的其他实例。

本文所述的染料标记的核苷酸可用于在基于流动的方案中使用染料标记的和天然核苷酸的混合物的通过合成测序的方法中。与天然核苷酸相比,此类方法通常使用低百分比的标记的核苷酸。然而,与流动混合物中的天然核苷酸相比,使用低百分比的标记的核苷酸(例如,少于20%)可能有多个缺点:(a)由于模板的一小部分提供了序列信息,该方法需要较高的模板拷贝数;(b)标记的和未标记的核苷酸之间DNA聚合酶延伸率的可变性可能导致上下文相关的标记分数,从而增加区分单碱基掺入和多碱基掺入的难度;和(c)标记部分的低比例可导致标记的产品群体中的高二项式噪声。主要使用天然核苷酸的基于流的测序方法进一步描述于美国专利号8,772,473中,其全部内容通过引用并入本文用于所有目的。

本文提供的半刚性接头可允许每个流中染料标记的核苷酸与天然核苷酸的标记分数足够高(例如,20-100%标记)以避免或减少此类方案的前述缺点的影响。这种更高百分比的标记可以产生更大的光学(例如,荧光)信号,从而降低模板需求。如果使用100%标记,则可以基本上消除二项式噪声和上下文变化。本文描述的解决方案克服的关键技术障碍是相邻或附近核苷酸上的染料标记的核苷酸必须表现出最小的猝灭。综合优势的总体结果可能是更准确的DNA测序。

本公开提供了一种用于对核酸分子进行测序的方法。该方法可以包括在足以使引物与核酸分子杂交的条件下使核酸分子与引物接触,从而产生测序模板。然后可以使测序模板与聚合酶(例如,如本文所述)和包含多个光学(例如,荧光)标记的核苷酸(例如,如本文所述)的溶液(例如,核苷酸流)接触。多个光学(例如,荧光)标记的核苷酸中的每个光学(例如,荧光)标记的核苷酸可以包含相同的化学结构(例如,每个标记的核苷酸可以包含相同类型的染料、相同类型的接头,以及相同类型的核苷酸或核苷酸类似物)。多个光学标记的核苷酸中的光学标记的核苷酸可以在与与核酸分子杂交的引物相邻的多个位置处与核酸分子互补。因此,可以将多个光学标记的核苷酸中的一个或多个光学标记的核苷酸掺入测序模板中。在核酸分子包括同聚区域的情况下,可以掺入多个核苷酸(例如,标记的和未标记的核苷酸)。可以通过使用非终止的核苷酸来促进彼此相邻的多个核苷酸的掺入。然后可以将包含多个光学标记的核苷酸的溶液从测序模板洗掉(例如,使用洗涤流,如本文所述)。可以测量来自测序模板的光学(例如,荧光)信号。当两个或更多个标记的核苷酸掺入同聚区域时,测量的光学(例如,荧光)信号的强度可能大于如果多个光学(例如,荧光)标记的核苷酸中的单个光学(例如,荧光)标记的核苷酸已被掺入测序模板中可测量的光学(例如,荧光)信号。此类方法对于均聚物或均聚物的核酸部分(即,在一行中具有多个相同碱基)的测序可能特别有用。多个光学标记的核苷酸中的光学标记的核苷酸可包含染料(例如,荧光染料)和连接至染料和核苷酸的接头(例如,如本文所述)。接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不大于两个sp3碳原子彼此连接,例如通过不多于两个原子。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。例如,接头可包含羟脯氨酸或由例如二胺和二羧酸或氨基硫醇和硫醇羧酸构成的氨基酸。接头可被配置为在染料和核苷酸之间建立至少约0.5纳米的功能长度。

测量的光学(例如,荧光)信号的强度可以与掺入测序模板中的光学(例如,荧光)标记的核苷酸的数量成比例(例如,其中使用100%标记分数)。换句话说,猝灭可能不会显著影响发射的信号。例如,强度可以与掺入测序模板的光学(例如,荧光)标记的核苷酸的数量成线性比例。当相对于掺入到测序模板中的光学(例如,荧光)标记的核苷酸数量作图时,测量的光学(例如,荧光)信号的强度可以与大约1.0的斜率成线性比例。在少于100%的底物被标记(例如,核苷酸流中少于100%的核苷酸被标记)的情况下,由掺入多个生长核酸链(例如,如本文所述,偶联到与支持物偶联的测序模板的多条生长核酸链)中的底物(例如,核苷酸或核苷酸类似物)发射的光学(例如,荧光)信号可以与生长核酸链的均聚物区域的长度成比例。类似地,在少于100%的底物被标记(例如,连续核苷酸流的每一个中少于100%的核苷酸被标记)的情况下,由掺入多个生长核酸链(例如,如本文所述,偶联到与支持物偶联的测序模板的多条生长核酸链)中的底物(例如,核苷酸或核苷酸类似物)发射的光学(例如,荧光)信号可以与生长核酸链的杂聚物和/或均聚物区域的长度成比例。在一些此类情况下,测量的光学(例如,荧光)信号的强度可以与底物已经掺入其中的杂聚和/或均聚区域的长度成线性比例。例如,当将光学(例如,荧光)信号相对于底物已掺入其中的杂聚和/或均聚区域的底物中的长度作图时,测量的光学(例如,荧光)信号可以与大约1.0的斜率成线性比例。

包含多个光学(例如,荧光)标记的核苷酸的溶液也可以包含未标记的核苷酸(例如,标记分数可小于100%)。例如,溶液中至少约20%的核苷酸可以被光学标记,并且溶液中至少约80%的核苷酸可以不被光学标记。在一些情况下,溶液中的大部分核苷酸可以被光学标记(例如,约50-100%)。

在一些情况下,多个光学(例如,荧光)标记的核苷酸中的两个或更多个光学(例如,荧光)标记的核苷酸被掺入到测序模板(例如,到同聚区域)中。在一些情况下,多个光学(例如,荧光)标记的核苷酸中的三个或更多个光学(例如,荧光)标记的核苷酸被掺入到测序模板中。在给定核苷酸流期间掺入到测序模板的光学标记的核苷酸的数量可能取决于核酸分子的均聚性质。在一些情况下,多个光学(例如,荧光)标记的核苷酸中的第一光学(例如,荧光)标记的核苷酸掺入多个光学(例如,荧光)标记的核苷酸的第二光学(例如,荧光)标记的核苷酸的四个位置内。

光学(例如,荧光)标记的核苷酸可包含可切割的基团以促进光学(例如,荧光)标记(例如,如本文所述)的切割。在一些情况下,方法可以进一步包括,在掺入一种或多种光学(例如,荧光)标记的核苷酸并洗掉残留溶液之后,切割一种或多种光学(例如,荧光)标记的核苷酸的光学(例如,荧光)标记掺入到测序模板(例如,如本文所述)中。切割流之后可以是另外的洗涤流。

在一些情况下,核苷酸流和洗涤流之后可以是包含未标记的核苷酸和无标记的核苷酸的“追踪”流。追踪流可用于完成测序模板的给定核苷酸位置或多个位置的测序反应(例如,跨越固定到支持物的多个此类模板)。追踪流可以先于来自模板的光学信号的检测。或者,追踪流可以跟随来自模板的光学信号的检测。追踪流可以先于切割流。可替代地,追踪流之后可以是切割流。追踪流之后可以是洗涤流。

本文提供的方法还可用于对核酸分子的杂聚物和/或杂聚物区域(即,非均聚物的部分)测序。因此,本文所述的方法可用于对具有任何程度的杂聚或均聚性质的核酸分子测序。

关于均聚物,均聚物区域处的核苷酸流可以将几个核苷酸掺入一行。使包含含有均聚物区域的核酸分子(例如,与未延伸引物杂交的核酸分子)的测序模板与含有多个核苷酸(例如,标记的和未标记的核苷酸)的溶液接触,其中多个核苷酸中的每个核苷酸是相同类型的,可能导致多个核苷酸中的多个核苷酸被掺入测序模板中。在一些情况下,掺入至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个核苷酸(即,在核酸分子的同聚区域中)。掺入到测序模板中的多个核苷酸可包含多个标记的核苷酸(例如,光学标记的,例如荧光标记的),如本文所述。在这种情况下,掺入到均聚物区域中的一个或多个所述核苷酸可以被标记,并且可以占据与掺入到均聚物区域中的其他标记的核苷酸相邻或不相邻的位置。从核酸分子获得的信号强度可以与掺入的标记的核苷酸的数量成比例(例如,使用100%的标记分数)。例如,从包含两个标记的核苷酸的核酸分子获得的光学信号(例如,荧光信号)的强度可能具有比从包含一个标记的核苷酸的核酸分子获得的光学信号更大的强度。此外,从核酸分子获得的信号强度可能取决于核酸分子内标记的核苷酸的相对位置。例如,在非相邻位置中包含两个标记的核苷酸的核酸分子可以提供与在相邻位置中包含两个标记的核苷酸的核酸分子不同的信号强度。可以通过仔细选择接头和染料(例如,荧光染料)来优化此类系统中的猝灭。在一些情况下,光学信号(例如,荧光)与均聚物长度的关系图可以是线性的。例如,对于包括掺入标记的核苷酸的均聚物区域的生长核酸链的集合,测量的光学信号可以与均聚物区域的核苷酸长度大致成线性比例。

在另一方面,本公开提供了一种对核酸分子进行测序的方法。该方法可以包括在足以使引物与核酸分子杂交的条件下使核酸分子与引物接触,从而产生测序模板。然后,可以将其与聚合酶和包含多个第一光学(例如,荧光)标记的核苷酸(和任选地,多个第一未标记的核苷酸)的第一溶液接触。多个第一光学(例如,荧光)标记的核苷酸中的每个第一光学(例如,荧光)标记的核苷酸是相同类型的。多个第一光学(例如,荧光)标记的核苷酸中的第一光学(例如,荧光)标记的核苷酸可以在邻近引物的位置与待测序的核酸分子互补。多个第一光学(例如,荧光)标记的核苷酸中的第一光学(例如,荧光)标记的核苷酸因此可以掺入到测序模板中以产生延伸的引物。然后可以将包含多个第一光学(例如,荧光)标记的核苷酸的第一溶液从测序模板洗掉(例如,使用洗涤溶液)。然后可以测量由测序模板发射的第一光学(例如,荧光)信号(例如,如本文所述)。然后可以使测序模板与聚合酶和包含多个第二光学(例如,荧光)标记的核苷酸(以及,任选地,多个第二未标记的核苷酸)的第二溶液接触。多个第二光学(例如,荧光)标记的核苷酸中的每个第二光学(例如,荧光)标记的核苷酸可以是相同类型的。多个第二光学(例如,荧光)标记的核苷酸中的第二光学(例如,荧光)标记的核苷酸可以在邻近延伸的引物的位置与待测序的核酸分子互补。多个第二光学(例如,荧光)标记的核苷酸中的第二光学(例如,荧光)标记的核苷酸因此可以掺入到测序模板中。然后可以将包含多个第二光学(例如,荧光)标记的核苷酸的第二溶液从测序模板洗掉。然后可以测量由测序模板发射的第二光学(例如,荧光)信号。在一些情况下,第二光学(例如,荧光)信号的强度可以大于第一光学(例如,荧光)信号的强度。

多个第一光学标记的核苷酸中的第一光学标记的核苷酸可包含第一染料(例如,荧光染料)和连接至第一染料和第一核苷酸的第一接头(例如,如本文所述)。类似地,多个第二光学标记的核苷酸中的第二光学标记的核苷酸可包含第二染料(例如,荧光染料)和连接至第二染料和第二核苷酸的第二接头(例如,如本文所述)。第一接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不大于两个sp3碳原子彼此连接,例如通过不多于两个原子。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。例如,第一接头可包含一个或多个羟脯氨酸部分(例如,如本文所述)。第一接头可被配置为在第一染料和第一核苷酸之间建立至少约0.5纳米的功能长度。类似地,第二接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不大于两个sp3碳原子彼此连接,例如通过不多于两个原子。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。例如,第二接头可包含一个或多个羟脯氨酸部分(例如,如本文所述)。第二接头可被配置为在第二染料和第二核苷酸之间建立至少约0.5纳米的功能长度。第一接头和第二接头可具有相同的结构。或者,第一接头和第二接头可具有不同的结构。第一接头和第二接头可包含共享的结构基序,例如共享的可切割组分(例如,如本文所述)。第一接头和/或第二接头可包含被配置为用切割试剂(例如,如本文所述)切割的可切割基团。

包含多个第一光学(例如,荧光)标记的核苷酸的第一溶液也可以包含第一未标记的核苷酸。例如,第一溶液中约20%的核苷酸可能未被标记。在一些情况下,第一溶液中的至少20%的核苷酸可以被光学标记,例如至少50%或至少80%。未标记的核苷酸可包含与光学标记的核苷酸相同的核苷酸部分(例如,规范核苷酸部分)。类似地,包含多个第一光学标记的核苷酸的第二溶液也可包含第二未标记的核苷酸。例如,第二溶液中约20%的核苷酸可能未被标记。在一些情况下,第二溶液的至少20%的核苷酸可以被光学标记,例如至少50%或至少80%。未标记的核苷酸可包含与光学标记的核苷酸相同的核苷酸部分(例如,规范核苷酸部分)。

多个第一光学(例如,荧光)标记的核苷酸可以不同于多个第二光学(例如,荧光)标记的核苷酸。例如,多个第一光学(例如,荧光)标记的核苷酸和多个第二光学(例如,荧光)标记的核苷酸可以包含相同的光学(例如,荧光)标记(例如,相同的染料)和不同的核苷酸。或者,多个第一光学(例如,荧光)标记的核苷酸和多个第二光学(例如,荧光)标记的核苷酸可以包含不同的光学(例如,荧光)标记(例如,不同的染料)和相同的核苷酸。在一些情况下,多个第一光学(例如,荧光)标记的核苷酸和多个第二光学(例如,荧光)标记的核苷酸可以包含不同的光学(例如,荧光)标记(例如,不同的染料)和不同的核苷酸。第一多个光学标记的核苷酸中的第一染料和第二多个光学标记的核苷酸中的第二染料可以在大致相同的波长或波长范围内发射信号(例如,无论第一染料和第二染料是否具有相同或不同的化学结构)。例如,第一染料和第二染料都可以在电磁光谱的可见部分的绿色区域中发射信号。

在一些情况下,可以将两个或更多个第一光学(例如,荧光)标记的核苷酸掺入测序模板中(例如,在核酸分子的同聚区域中)。在一些情况下,可以将两个或更多个第二光学(例如,荧光)标记的核苷酸掺入测序模板中。

还可以提供另外的光学(例如,荧光)标记的核苷酸并将其掺入测序模板中(例如,在连续的核苷酸流中,如本文所述)。例如,该方法可以进一步包括使测序模板与聚合酶和包含多个第三光学(例如,荧光)标记的核苷酸的第三溶液接触,其中多个第三光学(例如,荧光)标记的核苷酸的每一个第三光学(例如,荧光)标记的核苷酸是相同类型的,并且其中多个第三光学(例如,荧光)标记的核苷酸中的第三光学(例如,荧光)标记的核苷酸与在与核酸分子杂交的进一步延伸的引物相邻的位置处与核酸分子互补,从而将多个第三光学(例如,荧光)标记的核苷酸中的第三光学(例如,荧光)标记的核苷酸掺入测序模板中;将包含多个第三光学(例如,荧光)标记的核苷酸的第三溶液从测序模板洗掉;和测量由测序模板发射的第三光学(例如,荧光)信号。在一些情况下,第三光学信号的强度可以大于第一光学(例如,荧光)信号的强度和第二光学(例如,荧光)信号的强度。该过程可以用第四溶液等重复。第三和第四溶液可以包含光学(例如,荧光)标记的核苷酸,其具有与第一和第二溶液不同的核苷酸,使得每个规范核苷酸(A、C、G和U/T)可以按顺序提供给测序模板。可以将其中每个规范核苷酸提供给测序模板的循环重复一次或多次以测序和/或扩增核酸分子。

多个第三光学标记的核苷酸中的第三光学标记的核苷酸可包含第三染料(例如,荧光染料)和连接至第三染料和第三核苷酸的第三接头(例如,如本文所述)。第三接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不大于两个sp3碳原子彼此连接,例如通过不多于两个原子。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。例如,第三接头可包含一个或多个羟脯氨酸部分(例如,如本文所述)。第三接头可被配置为在第三染料和第三核苷酸之间建立至少约0.5纳米的功能长度。第三接头和第一接头可以具有相同或不同的结构。类似地,第三接头和第二接头可以具有相同或不同的结构。第三染料可具有与第一染料相同或不同的结构。类似地,第三染料可以具有与第二染料相同或不同的结构。第三染料和第一和/或第二染料可以大致相同的波长或波长范围(例如,这些染料是否具有相同或不同的化学结构)发射。此外,第三核苷酸可以与第一核苷酸的类型相同或不同,或者第三核苷酸可以与第二核苷酸的类型相同或不同。

该方法可以进一步包括,在将给定溶液(例如,核苷酸流)洗掉(例如,使用洗涤溶液)之后,切割其相应核苷酸的光学(例如,荧光)标记。例如,在洗掉第一溶液后,可以切割掺入测序模板的第一光学(例如荧光)标记的核苷酸的光学(例如,荧光)标记(例如,使用切割试剂切割第一光学标记的核苷酸的接头的可切割基团,如本文所述)。例如,掺入测序模板中的第一光学标记的核苷酸(多个)的荧光染料(多个)可在测序模板与第二光学标记的核苷酸接触之前被切割(例如,在第二核苷酸流中,如本文所述)。因此,可以在将一个或多个第二光学标记的核苷酸掺入测序模板之前从一个或多个第一光学标记的核苷酸检测信号。掺入测序模板中的第一光学标记的核苷酸(多个)的荧光染料(多个)的分离可提供包含第一光学标记的核苷酸或其衍生物的接头的一部分的疤痕核苷酸(多个)。类似地,在洗掉第二溶液(例如,第二核苷酸流)之后,可以切割掺入到测序模板的第二光学(例如,荧光)标记的核苷酸的光学(例如,荧光)标记。第一和第二接头的所有部分可以在各自的切割过程中被切割。

在另一方面,本文提供了一种对核酸分子进行测序的方法。该方法可以包括提供包含多个光学(例如,荧光)标记的核苷酸的溶液,其中该多个光学(例如,荧光)标记的核苷酸中的每个光学(例如,荧光)标记的核苷酸是相同类型的。多个荧光标记的核苷酸中给定的光学(例如,荧光)标记的核苷酸可以包含通过具有确定分子量的半刚性水溶性接头连接到核苷酸的光学(例如,荧光)染料。连接染料和核苷酸的接头可以在染料和核苷酸之间提供至少约0.5纳米(nm)的功能长度。然后可以在足以使引物与待测序的核酸分子杂交以产生测序模板的条件下使核酸分子与引物接触。然后可以使测序模板与聚合酶和含有多个光学(例如,荧光)标记的核苷酸的溶液接触,其中多个光学(例如,荧光)标记的核苷酸中的光学(例如,荧光)标记的核苷酸在与引物相邻的位置处与待测序的核酸分子互补。多个光学(例如,荧光)标记的核苷酸中的一个或多个光学(例如,荧光)标记的核苷酸因此可以掺入到测序模板中。可以将包含多个光学(例如,荧光)标记的核苷酸的溶液从测序模板洗掉(例如,使用洗涤溶液)。然后可以测量由测序模板发射的光学(例如,荧光)信号。

接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系,其中两个或更多个环体系中的至少两个通过不大于两个sp3碳原子彼此连接,例如通过不多于两个原子(例如,如本文所述)。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。例如,接头可包含一个或多个羟脯氨酸部分(例如,如本文所述)。接头可以在荧光染料和核苷酸之间建立至少约0.5纳米的功能长度(例如,如本文所述)。

测量的光学(例如,荧光)信号可以与掺入测序模板中的光学(例如,荧光)标记的核苷酸的数量成比例。例如,在使用100%标记分数的情况下(例如,溶液中的所有核苷酸都被标记),猝灭可能不会减少发射的信号。在此类系统中,测量的光学(例如,荧光)信号可以与掺入测序模板中的光学(例如,荧光)标记的核苷酸的数量成线性比例。当相对于掺入到测序模板中的光学(例如,荧光)标记的核苷酸数量作图时,测量的光学(例如,荧光)信号可以与大约1.0的斜率成线性比例。在少于100%的核苷酸被标记(例如,溶液中少于100%的核苷酸被标记)的情况下,由掺入多个生长核酸链(例如,如本文所述,偶联到与支持物偶联的测序模板的多条生长核酸链)中的核苷酸发射的光学(例如,荧光)信号可以与生长核酸链的均聚物区域的长度成比例。类似地,在少于100%的核苷酸被标记的情况下,由掺入多个生长核酸链(例如,如本文所述,偶联到与支持物偶联的测序模板的多条生长核酸链)中的核苷酸发射的光学(例如,荧光)信号可以与生长核酸链的杂聚物和/或均聚物区域的长度成比例。在一些此类情况下,测量的光学(例如,荧光)信号的强度可以与核甘酸已经掺入其中的杂聚和/或均聚区域的长度成线性比例。例如,当将光学(例如,荧光)信号相对于核甘酸已掺入其中的杂聚和/或均聚区域的核甘酸中的长度作图时,测量的光学(例如,荧光)信号可以与大约1.0的斜率成线性比例。

在一些情况下,含有光学(例如,荧光)标记的核苷酸的溶液也含有未标记的核苷酸。未标记的核苷酸可包含相同的核苷酸部分(例如,相同的规范核苷酸)。在一些实施方案中,溶液中约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约100%的核苷酸被荧光标记。在一些情况下,溶液中至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或更多的核苷酸被荧光标记。在一些情况下,溶液中至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或更多的核苷酸未被荧光标记。

多个标记的核苷酸可沿核酸分子掺入彼此邻近的位置。在一些情况下,第一光学(例如,荧光)标记的核苷酸掺入在4个位置内、3个位置内、2个位置内或邻近第二光学(例如,荧光)标记的核苷酸(例如,相同或不同的核苷酸类型的第二光学标记的核苷酸)。在一些情况下,该方法进一步包括在测量光学(例如,荧光)信号(例如,如本文所述)之后从核苷酸切割光学(例如,荧光)标记。切割光学(例如,荧光)标记可能会留下疤痕(例如,如本文所述)。核酸测序测定可用于评估染料标记的核苷酸。该测定可以使用具有已知序列的核酸模板,该序列可以包括一个或多个均聚区域。模板可以通过衔接子固定在支持物上(例如,如本文所述)。具有与衔接子或其一部分至少部分互补的序列的引物可以与衔接子或其一部分杂交,并通过掺入标记的和未标记的核苷酸(例如,如本文所述)提供用于产生具有与模板的序列互补的序列的核酸链的起点。测序测定可以使用四种不同的四核苷酸流,包括可以循环方式重复的不同规范核碱基(例如,循环1:A、G、C、U;循环2A、G、C、U等)。每个核苷酸流可包括包含单一规范类型的核碱基的核苷酸(或其类似物),其中一些可包括本文提供的光学标记试剂。标记分数(例如,附接到光学标记试剂的流中包括的核苷酸的百分比)可以在例如0.5%至100%之间变化。不同的核苷酸流的标记分数可能不同。可以不终止核苷酸以促进掺入均聚物区域。模板可以与核苷酸流接触,然后是一个或多个洗涤流(例如,如本文所述)。模板还可以与包括切割试剂的切割流(例如,如本文所述)接触,所述切割试剂被配置为切割与掺入到生长核酸链中的标记的核苷酸附接的光学标记试剂的一部分。洗涤流可用于去除切割试剂并制备模板以与随后的核苷酸流接触。在每次核苷酸流之后,可以从掺入生长核酸链中的标记的核苷酸检测发射。

示例测序程序1800在图18中提供。在过程1802中,提供了配置用于核苷酸掺入的模板和引物。随后进行第一测序循环1804。第一测序循环1804包括四个流程过程1804a、1804b、1804c和1804d,每个流程有多个流程。核苷酸1、2、3和4可各自包括不同规范类型(例如,A、G、C和U)的核碱基。给定的核苷酸流可以包括标记的核苷酸(例如,用本文提供的光学标记试剂标记的核苷酸)和未标记的核苷酸。每个核苷酸流的标记分数可能不同。即,图18中的A、B、C和D可以相同或不同并且可以在0%至100%的范围内(例如,如本文所述)。用于标记核苷酸1、2、3和4的标记和接头可以是相同的或不同的类型。例如,核苷酸1可以具有包括可切割接头和hyp10接头的接头以及第一绿色染料,并且核苷酸2可以具有包括可切割接头但不包括hyp10接头的接头和第二绿色染料。第一绿色染料可以与第一绿色染料相同或不同。与不同核苷酸相关的可切割接头可以相同或不同。流过程1804a可以包括核苷酸流程(例如,包括多个核苷酸1类型的核苷酸的流,其中的A%可以被标记)。在该流中,标记的和未标记的核苷酸可被掺入生长链中(例如,使用聚合酶)。第一洗涤流(“洗涤流1”)可用于去除未掺入的核苷酸和相关试剂。可以向与掺入的核苷酸附接的所有或部分光学标记试剂提供包括切割试剂的切割流。例如,标记的核苷酸可包括可切割的接头部分,其可在与切割试剂接触时被切割以提供带疤痕的核苷酸。第二洗涤流(“洗涤流2”)可用于去除切割试剂和切割的材料。核苷酸流过程1804a还可包括“追踪”过程,其中可流过仅包括核苷酸类型1的未标记的核苷酸的核苷酸流。此类追踪过程之后可以是洗涤流。追踪过程及其伴随的清洗流可能发生在初始核苷酸流和清洗流1之后,或在切割流和清洗流2之后。下一个核苷酸流过程1804b然后可以类似的方式开始和进行。在完成过程1804b、1804c和1804d之后,可以完成第一流循环1804。可以开始第二流循环1806。循环1806可以包括相同或不同顺序的相同流过程。可以进行另外的循环直到模板的全部或部分已被测序。可以在对于每个核苷酸流过程的核苷酸流和初始洗涤流之后和切割流之前进行经由发射检测的掺入的核苷酸的检测(例如,流过程1804a可以包括在洗涤流1和切割流之间的检测过程等)。通过此类测序过程询问的模板可以被固定到支持物上(例如,如本文所述)。多个此类模板(例如,至少约100、200、500、1000、10000、100,000、500,000、1,000,000或更多模板)可以这种方式(例如,以克隆方式)同时被询问。在此类系统中,核苷酸的掺入可以被检测为多个模板的平均值,这可以允许使用小于100%的标记分数。

在一些情况下,对于任何前述方法,核苷酸是鸟嘌呤(G)并且接头减少核苷酸和染料(例如,荧光)染料之间的猝灭。

在一些情况下,对于任何前述方法,包含本文提供的接头的光学(例如,荧光)标记的核苷酸比包含相同核苷酸和光学(例如,荧光)染料但不包括接头的另一种光学(例如,荧光)标记的核苷酸更有效地掺入到测序模板中。在一些情况下,对于任何前述方法,包含本文提供的接头的光学(例如,荧光)标记的核苷酸以比包含相同核苷酸和光学(例如,荧光)染料但不包括接头的另一种光学(例如,荧光)标记的核苷酸更高的保真度掺入到测序模板中。

对于本文提供的任何测序方法,所使用的聚合酶可以是家族A聚合酶,例如Taq、Klenow或Bst聚合酶。或者,对于本文提供的任何测序方法,聚合酶可以是家族B聚合酶,例如Vent(外-)或TherminatorTM聚合酶。

在一方面,本公开提供了使用本文所述的光学(例如,荧光)标记的核苷酸对核酸分子进行测序的方法。一种方法可以包括提供多个核酸分子,该多个核酸分子可以包含一个或多个集落或作为其一部分。多个核酸分子可以与模板序列具有序列同源性。该方法可以包括在足以将多个核苷酸的子集掺入与多个核酸分子互补的多个生长核酸链中的条件下,使多个核酸分子与包含多个核苷酸的溶液(例如,包含多个光学标记的核苷酸的溶液)接触。在一些情况下,多个核苷酸的子集的至少约20%是光学(例如,荧光)标记的核苷酸(例如,如本文所述)。该方法可以包括检测来自掺入多个生长核酸链中的标记的核苷酸的一个或多个信号或信号变化,其中该一个或多个信号或信号变化指示已掺入多个生长核酸链中的标记的核苷酸。

多个核苷酸中的光学(例如,荧光)标记的核苷酸可以是非终止的。在此类情况下,生长链可在期间掺入一个或多个连续核苷酸(例如,溶液中多个核苷酸的互补碱基不存在于与核酸分子杂交的引物相邻的多个位置处)。从光学(例如,荧光)标记的核苷酸检测到的一个或多个信号或信号变化可指示连续核苷酸已掺入多个生长核酸链中。从检测到的信号或信号变化确定多个荧光团的方法在本文别处描述。

可替代地,可以终止光学(例如,荧光)标记的核苷酸。在这种情况下,每个生长链中在每个流循环中可以掺入不大于一个核苷酸直到合成终止。从光学(例如,荧光)标记的核苷酸检测到的一个或多个信号或信号变化可指示核苷酸已掺入多个生长核酸链中。在检测之前、期间或之后,可以切割标记的核苷酸的终止基团(例如,以促进均聚物的测序,和/或减少潜在的背景和/或猝灭问题)。

可替代地或另外地,光学(例如,荧光)标记的核苷酸可以包括终止的和非终止的核苷酸的混合物。在这种情况下,生长链中可以掺入一个或多个产生延伸的引物的连续的核苷酸。然后可以将包含多个终止的和非终止的核苷酸的溶液从测序模板洗掉。多个核苷酸的未标记的核苷酸可包含与多个核苷酸的标记的核苷酸相同类型的核苷酸部分(例如,相同的规范核苷酸)。

在一方面,本公开提供包含一种或多种荧光标记的核苷酸的组合物及其使用方法。组合物可包含含有荧光标记的核苷酸(例如,如本文所述)的溶液。荧光标记的核苷酸可包含通过接头(例如,如本文所述)连接至核苷酸或核苷酸类似物(例如,如本文所述)的荧光染料。接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系。两个或更多个环体系中的至少两个可以通过不大于两个sp3碳原子,例如不通过sp3碳原子彼此连接。例如,两个或更多个环体系中的至少两个可以通过不多于两个原子彼此连接。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。荧光标记的核苷酸可被配置为发射荧光信号。荧光标记的核苷酸可包含多个氨基酸,例如多个非蛋白(例如,非天然)氨基酸。例如,接头可包含多个羟脯氨酸。一个或多个水溶性基团中的至少一个水溶性基团可以附加到两个或更多个环体系的环结构上。一个或多个水溶性基团可选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。接头可包含可切割的基团(例如,叠氮甲基基团、二硫键、烃基二硫甲基基团和2-硝基苄氧基基团),其被配置为被切割以将荧光染料与核苷酸分离。

溶液(例如,核苷酸流)可以包含多个荧光标记的核苷酸,其中的每个可以包含相同类型的荧光染料、相同类型的接头和相同类型的核苷酸。多个荧光标记的核苷酸中的每个荧光标记的核苷酸的每个接头可以具有相同的分子量(例如,它们可能不包含具有一定分子量范围的聚合物)。该溶液还可以包含多个未标记的核苷酸,其中多个未标记的核苷酸中的每个核苷酸与多个荧光标记的核苷酸中的每个核苷酸的类型相同。溶液中多个荧光标记的核苷酸与多个未标记的核苷酸的比例可为至少约1:4(例如,标记分数可为至少20%)。例如,该比例可为至少1:1(例如,标记分数可为至少50%)。或者,该溶液可以不包含任何未标记的核苷酸并且标记分数可为100%。

可以将溶液(例如,核苷酸流)提供给与核酸链偶联的模板核酸分子。模板核酸分子可以固定在支持物上(例如,如本文所述)。例如,模板核酸分子可以通过衔接子固定在支持物上。例如,模板核酸分子可以通过与其杂交的引物固定在支持物上。核酸链可以与模板核酸分子的一部分至少部分互补。模板核酸分子和与其偶联的核酸链可以经受足以将溶液的荧光标记的核苷酸掺入与模板核酸分子偶联的核酸链的条件。荧光标记的核苷酸的掺入可以使用聚合酶(例如,如本文所述)来完成。溶液的多于一种荧光标记的核苷酸可被掺入,例如掺入到模板核酸分子的同聚区域。可替代地或另外地,未标记的核苷酸可被掺入(例如,与荧光标记的核苷酸相邻),例如掺入到模板核酸分子的同聚区域中。信号(例如,荧光信号)可以从掺入到核酸链中的荧光标记的核苷酸检测到。在检测信号之前,可以使用洗涤溶液来去除未掺入到核酸链中的荧光标记的核苷酸。在检测信号之后,可将掺入到核酸链中的荧光标记的核苷酸与配置为从核苷酸切割荧光染料的切割试剂接触。切割试剂可被配置为切割接头以提供附接到接头的一部分的核苷酸,该部分可以包含硫醇部分、芳族部分或其组合。核酸链,例如与多个模板核酸分子偶联的多个核酸链的核酸链,可以与仅包含相同核苷酸类型的未标记的核苷酸(例如,在检测信号之前或之后)的追踪流接触。与模板核酸分子偶联的核酸链也可以与一种或多种另外的洗涤流接触。与模板核酸分子偶联的核酸链可以与包含另外的荧光标记的核苷酸的另外的溶液接触,例如包括不同类型的核苷酸的另外的荧光标记的核苷酸。另外的荧光标记的核苷酸的染料可以与荧光标记的核苷酸的染料为同一类型。类似地,另外的荧光标记的核苷酸的接头可以与荧光标记的核苷酸的接头为同一类型。

在另一方面,本公开提供了一种方法,其包括提供荧光标记试剂(例如,如本文所述)。荧光标记试剂可包含荧光染料和与荧光染料连接的接头。接头可包含(i)一个或多个水溶性基团和(ii)两个或更多个环体系。两个或更多个环体系中的至少两个可以通过不大于两个sp3碳原子,例如通过不多于两个原子彼此连接。例如,两个或更多个环结构中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。荧光标记试剂可被配置为发射荧光信号。荧光标记试剂可包含多个氨基酸,例如多个非蛋白(例如,非天然)氨基酸。例如,接头可包含多个羟脯氨酸。一个或多个水溶性基团中的至少一个水溶性基团可以附加到两个或更多个环体系的环结构上。一个或多个水溶性基团可选自吡啶鎓、咪唑鎓、季铵基团、磺酸盐、磷酸盐、醇、胺、亚胺、腈、酰胺、硫醇、羧酸、聚醚、醛、硼酸和硼酸酯。

底物可与荧光标记试剂接触以产生荧光标记的底物,其中与荧光染料连接的接头与底物相关联。底物可以是核苷酸或核苷酸类似物(例如,如本文所述)。或者,底物可以是蛋白质、脂质、细胞或抗体。荧光标记的底物可被配置为发射荧光信号(例如,在合适的能量范围激发时),该信号可以被检测(例如,使用基于成像的检测)。接头可包含可切割的基团(例如,叠氮甲基基团、二硫键、烃基二硫甲基基团和2-硝基苄氧基基团),其被配置为被切割以将荧光染料与底物分离。荧光标记的底物可以与切割试剂接触,该切割试剂被配置为从荧光标记的底物切割荧光标记试剂或其一部分以产生带疤痕的底物。带疤痕的底物可包含硫醇部分、芳族部分或其组合。在产生带疤痕的底物之前,荧光标记的底物和核酸分子可以经受足以将荧光标记的底物掺入核酸分子的条件。掺入可以使用聚合酶(例如,如本文所述)来完成。可以掺入多于一种荧光标记的底物,例如掺入到核酸分子的均聚区域中。例如,可以将另外的荧光标记的底物掺入到与荧光标记底物掺入位置相邻的位置。可替代地或另外地,未标记的底物(例如,与荧光标记的核苷酸的核苷酸相同类型的核苷酸)也可以掺入到核酸分子中,例如掺入到核酸分子的相邻位置。可以在产生带疤痕的底物之前或之后进行另外的荧光标记的底物的掺入。类似地,可以在带疤痕的底物产生之前或之后进行未标记的底物的掺入。

核酸分子,例如多个核酸分子的核酸分子,可以与仅包含相同类型的未标记的底物的追踪流接触(例如,在检测来自核酸分子的信号之前或之后)。核酸分子也可以与一种或多种另外的洗涤流接触。核酸分子可以与包含另外的荧光标记的底物的另外的溶液接触,例如包括不同类型的核苷酸的另外的荧光标记的底物。另外的荧光标记的底物的染料可以与荧光标记的底物的染料为同一类型。类似地,另外的荧光标记的底物的接头可以与荧光标记的底物的接头为同一类型。

核酸分子可以固定在支持物上(例如,如本文所述)。例如,核酸分子可以通过衔接子固定在支持物上。例如,核酸分子可以通过与其杂交的引物固定在支持物上。核酸分子可包含与第二核酸链的一部分至少部分互补的第一核酸链。第二核酸链可包含模板核酸序列或其互补序列。

本公开的标记的核苷酸可在涉及高分数的经标记的核苷酸的测序操作期间使用。例如,本公开提供了一种方法,该方法包括在足以将多个核苷酸中的第一标记的核苷酸和第二标记的核苷酸掺入到与核酸分子至少部分互补的生长链中的条件下使核酸分子(例如,模板核酸分子)与包含多个核苷酸的溶液接触。第一标记的核苷酸和第二标记的核苷酸可以是相同的规范碱基类型。第一核苷酸可包含荧光染料(例如,如本文所述),该荧光染料可通过接头(例如,如本文所述)与第一核苷酸相关联。第二核苷酸可包含相同的荧光染料(例如,通过具有与关联第一核苷酸和荧光染料的接头相同的化学结构的接头与第二核苷酸相关联)。与核苷酸(例如,第一和/或第二核苷酸)偶联的荧光染料可以是可切割的(例如,在应用切割试剂时)。多个核苷酸中的至少约20%可以是标记的核苷酸。例如,多个核苷酸的至少20%可以与荧光标记试剂(例如,如本文所述)相关联。例如,多个核苷酸的至少约50%、70%、80%、90%、95%或99%可以是标记的核苷酸。例如,多个核苷酸的所有核苷酸都可以是标记的核苷酸(例如,标记分数可为100%)。可以从第一标记的核苷酸和第二标记的核苷酸(例如,如本文所述)检测一个或多个信号或信号变化。一个或多个信号或信号变化可包括荧光信号或信号变化。一个或多个信号或信号变化可以指示第一标记的核苷酸和第二标记的核苷酸的掺入。可以解析一个或多个信号或信号变化以确定核酸分子的序列或其部分。解析一个或多个信号或信号变化可以包括确定来自掺入生长链中的溶液的连续核苷酸的数量。连续核苷酸的数量可选自2、3、4、5、6、7或8个核苷酸。解析一个或多个信号或信号变化可包括处理溶液的容差。第三核苷酸也可掺入生长链中(例如,在检测一个或多个信号或信号变化之前或之后)。第三核苷酸可以是溶液的多个核苷酸中的一个核苷酸。或者,第三核苷酸可以在单独的溶液中提供,例如在“追踪”流中(例如,如本文所述)。第三核苷酸可以是未标记的。或者,可以标记第三核苷酸。第一标记的核苷酸和第三核苷酸可以是相同的规范碱基类型。或者,第一标记的核苷酸和第三核苷酸可以是不同的规范碱基类型。

该方法还可包括切割与第一标记的核苷酸偶联的荧光染料。荧光染料可以通过应用切割试剂来切割,该切割试剂被配置为切割关联第一标记的核苷酸和荧光染料的接头。核酸分子可以在足以将第二多个核苷酸中的第三标记的核苷酸掺入生长链中的条件下与包含第二多个核苷酸的第二溶液接触。第二多个核苷酸中的至少约20%可以是标记的核苷酸(例如,如本文所述)。一个或多个第二信号或信号变化可从第三标记的核苷酸(例如,如本文所述)检测。可以解析一个或多个第二信号或信号变化以确定核酸分子的第二序列或其部分。第一标记的核苷酸和第三标记的核苷酸可以是不同的规范碱基类型(例如,A、C、U/T或G)。第三标记的核苷酸可包含荧光染料。荧光染料可以通过接头(例如,如本文所述)与第三标记的核苷酸偶联,该接头可以具有与将荧光染料连接到第一标记的核苷酸的接头相同的化学结构或不同的化学结构。

可替代地,该方法可包括在足以将第二多个核苷酸中的第三标记的核苷酸掺入生长链中的条件下,使核酸分子与包含第二多个核苷酸的第二溶液接触。第二多个核苷酸中的至少约20%可以是标记的核苷酸(例如,如本文所述)。一个或多个第二信号或信号变化可从第三标记的核苷酸(例如,如本文所述)检测。可以解析一个或多个第二信号或信号变化以确定核酸分子的第二序列或其部分。第一标记的核苷酸和第三标记的核苷酸可以是不同的规范碱基类型(例如,A、C、U/T或G)。第三标记的核苷酸可包含荧光染料。荧光染料可以通过接头(例如,如本文所述)与第三标记的核苷酸偶联,该接头可以具有与将荧光染料连接到第一标记的核苷酸的接头相同的化学结构或不同的化学结构。可以在没有从第一标记的核苷酸或第二标记的核苷酸切割荧光染料的情况下进行核酸分子与第二溶液接触。在没有从第一标记的核苷酸或第二标记的核苷酸切割荧光染料的情况下,该过程可以重复一次或多次,例如1、2、3、4、5次或更多次,每次使用不同的核苷酸溶液。这些不同的核苷酸溶液中的一种或多种可以包含至少20%的标记的核苷酸。

本公开还提供了一种方法,该方法包括在足以将标记的核苷酸和多个非终止的核苷酸中的第二核苷酸掺入与核酸分子或其一部分至少部分地互补的生长链中的条件下,使核酸分子与包含多个非终止的核苷酸的溶液接触。标记的核苷酸和第二核苷酸可以是相同的规范碱基类型。可替代地,标记的核苷酸和第二核苷酸可以是不同的规范碱基类型。标记的核苷酸可包含荧光染料(例如,如本文所述),该荧光染料可通过接头(例如,如本文所述)与标记的核苷酸相关联。第二核苷酸可以是标记的核苷酸。例如,第二核苷酸可包含相同的荧光染料(例如,通过具有与关联第一核苷酸和荧光染料的接头相同的化学结构的接头与第二核苷酸相关联)。可替代地,第二核苷酸可能不与荧光染料偶联(例如,第二核苷酸可能未被标记)。与核苷酸(例如,第一和/或第二核苷酸)偶联的荧光染料可以是可切割的(例如,在应用切割试剂时)。多个非终止的核苷酸可包含相同规范碱基类型的核苷酸。所述多个核苷酸中的至少约20%可以是标记的核苷酸。例如,多个核苷酸的至少20%可以与荧光标记试剂(例如,如本文所述)相关联。例如,多个非终止的核苷酸的至少约50%、70%、80%、90%、95%或99%可以是标记的核苷酸。例如,基本上所有的多个非终止的核苷酸都可以是标记的核苷酸。例如,多个非终止的核苷酸的所有核苷酸都可以是标记的核苷酸(例如,标记分数可为100%)。一个或多个信号或信号变化可从标记的核苷酸(例如,如本文所述)检测。一个或多个信号或信号变化可包括荧光信号或信号变化。一个或多个信号或信号变化可以指示标记的核苷酸的掺入。可以解析一个或多个信号或信号变化以确定核酸分子的序列或其部分。解析一个或多个信号或信号变化可以包括确定来自掺入生长链中的溶液的连续核苷酸的数量。连续核苷酸的数量可选自2、3、4、5、6、7或8个核苷酸。解析一个或多个信号或信号变化可包括处理溶液的容差。第三核苷酸也可掺入生长链中(例如,在检测一个或多个信号或信号变化之前或之后)。第三核苷酸可以是溶液的多个非终止的核苷酸中的一个核苷酸。可替代地,第三核苷酸可以在单独的溶液中提供,例如在“追踪”流中(例如,如本文所述)。第三核苷酸可以是未标记的。可替代地,可以标记第三核苷酸。标记的核苷酸和第三核苷酸可以是相同的规范碱基类型。可替代地,标记的核苷酸和第三核苷酸可以是不同的规范碱基类型。

该方法还可包括切割与标记的核苷酸偶联的荧光染料。荧光染料可以通过应用切割试剂来切割,该切割试剂被配置为切割关联标记的核苷酸和荧光染料的接头。核酸分子可以在足以将第二多个非终止的核苷酸中的第三标记的核苷酸掺入生长链中的条件下与包含第二多个非终止的核苷酸的第二溶液接触。第二多个非终止的核苷酸的至少约20%可以是标记的核苷酸(例如,如本文所述)。一个或多个第二信号或信号变化可从第三标记的核苷酸(例如,如本文所述)检测。可以解析一个或多个第二信号或信号变化以确定核酸分子的第二序列或其部分。第一标记的核苷酸和第三标记的核苷酸可以是不同的规范碱基类型(例如,A、C、U/T或G)。第三标记的核苷酸可包含荧光染料。荧光染料可以通过接头(例如,如本文所述)与第三标记的核苷酸偶联,该接头可以具有与将荧光染料连接到第一标记的核苷酸的接头相同的化学结构或不同的化学结构。

可替代地,该方法可包括在足以将第二多个非终止的核苷酸中的第三标记的核苷酸掺入生长链中的条件下,使核酸分子与包含第二多个非终止的核苷酸的第二溶液接触。第二多个核苷酸中的至少约20%可以是标记的核苷酸(例如,如本文所述)。一个或多个第二信号或信号变化可从第三标记的核苷酸(例如,如本文所述)检测。可以解析一个或多个第二信号或信号变化以确定核酸分子的第二序列或其部分。第一标记的核苷酸和第三标记的核苷酸可以是不同的规范碱基类型(例如,A、C、U/T或G)。第三标记的核苷酸可包含荧光染料。荧光染料可以通过接头(例如,如本文所述)与第三标记的核苷酸偶联,该接头可以具有与将荧光染料连接到第一标记的核苷酸的接头相同的化学结构或不同的化学结构。可以在没有从第一标记的核苷酸或第二标记的核苷酸切割荧光染料的情况下进行核酸分子与第二溶液接触。在没有从第一标记的核苷酸或第二标记的核苷酸切割荧光染料的情况下,该过程可以重复一次或多次,例如1、2、3、4、5次或更多次,每次使用不同的核苷酸溶液。这些不同的核苷酸溶液中的一种或多种可以包含至少20%的标记的核苷酸。

光学标记试剂的合成方法

在一些情况下,本文提供的接头可以使用肽合成化学制备。

例如,可以使用肽合成化学制备包含吡啶鎓部分的接头。此类方法可以使用四种双官能试剂来制作接头,即:(a)R1A、(b)BB、(c)AA和(d)AR2。试剂A与B反应生成吡啶鎓基团;R1和R2是异双官能附接基团。合成从基团R1A(或R2A)开始。将过量的BB加入到R1A以形成R1A-BB。将产物沉淀并在极性较小的溶剂(例如,乙酸乙酯或四氢呋喃)中洗涤以除去过量的BB。伴随在N-甲基吡咯烷酮(NMP)中加热,加入过量的AA以产生R1A-BB-AA。产物在极性较小的溶剂中沉淀并洗涤。合成继续进行,直到形成特定长度的接头。在最后步骤中附加基团AR2

1)R1A+10BB→R1A-BB(洗掉过量的BB)

2)R1A-BB+10AA→R1A-BB-AA(洗掉过量的AA)

3)R1A-BB-AA+10BB→R1A-BB-AA-BB(洗掉过量的BB)

4)R1A-BB-AA-BB+AR2→R1A-BB-AA-BB-AR2(使用终止试剂)

图2A示出了用于合成本公开的具有约2纳米的有效长度的接头的方法的实例。

图2B示出了可用于图2A的用于合成本公开的接头的方法中的试剂以及一些三官能试剂的实例。

图2C示出了用于合成本公开的接头的方法的实例,该接头是具有定义的分子量和连接基团的聚合物。

用于制备光学标记试剂(例如,如本文所述)的另外合成方法在别处和以下实施例中描述。

构建标记的核苷酸的方法

在一方面,本公开提供了用于构建标记的核苷酸(例如,光学标记的核苷酸)的方法。

可以使用模块化化学结构单元构建标记的核苷酸。核苷酸或核苷酸类似物可以用例如炔丙基氨基部分衍生化以提供用于附接到接头或可检测标记(例如,染料)的柄。一种或多种可检测标记,例如一种或多种染料,可以通过共价键附接至核苷酸或核苷酸类似物。可替代地或另外地,一种或多种可检测标记可通过非共价键附接至核苷酸或核苷酸类似物。可检测标记可通过接头(例如,如本文所述)附接至核苷酸或核苷酸类似物。接头可包括一个或多个部分。例如,接头可包括第一部分,其内包含二硫键以促进切割接头和释放可检测标记(例如,在测序过程期间)。可以使用顺序肽键添加另外的接头部分。接头部分可以具有各种长度和电荷。接头部分可以包括一种或多种不同的组分,例如一种或多种不同的环体系,和/或重复单元(例如,如本文所述)。接头的实例包括但不限于,氨基乙基-SS-丙酸(epSS)、氨基乙基-SS-苯甲酸、氨基己基-SS-丙酸、hyp10和hyp20。

用于构建标记的核苷酸的方法的实例显示在图4、图5A和图5B中。如图4所示,标记的核苷酸可由核苷酸、染料和一个或多个接头部分构建。一个或多个接头部分一起包含如本文所述的接头。用炔丙基氨基部分官能化的核苷酸可以通过肽键附接到第一接头部分。该第一接头部分可包含可切割部分,例如二硫键部分。第一接头部分也可以线性或支化方式附接到一个或多个另外的接头部分。例如,第二接头部分可包括两个或更多个环体系,其中两个或更多个环体系中的至少两个被不大于两个sp3碳原子隔开,例如被不多于两个原子隔开。例如,两个或更多个环体系中的至少两个可以通过sp2碳原子彼此连接。接头可包含非蛋白氨基酸,其包含两个或更多个环体系的环体系。例如,第二接头部分可包含两个或更多个羟脯氨酸部分。接头部分上的胺柄可用于附接接头和染料,例如在可见电磁波谱的红色或绿色部分发荧光的染料。图4中产生的标记的核苷酸包含修饰的脱氧腺苷三磷酸部分、包括包含二硫化物部分的第一接头部分和包含至少两个环体系的第二接头部分的接头,以及染料。

标记的核苷酸的构建可以从核苷酸末端或染料末端开始。从染料末端构建允许使用未标记的、未活化的氨基酸部分,而从核苷酸末端构建可能需要胺保护、羧基活化的氨基酸部分。

图5A和5B示出了包括炔丙基氨基官能化dGTP部分、包括二硫化物基团的第一接头部分、为hyp10的第二接头部分和染料部分Atto633的标记的核苷酸的示例性合成。该合成的细节在下面的实施例3中提供。

标记的核苷酸的核苷酸或核苷酸类似物可包括一个或多个修饰,例如对核碱基的一个或多个修饰。或者,标记的核苷酸的核苷酸或核苷酸类似物可包括一个或多个不在核碱基上的修饰。修饰可包括但不限于,一个或多个接头或标记部分的共价附接、烷基化、胺化、酰胺化、酯化、羟基化、卤化、磺化和/或磷酸化。

标记的核苷酸的核苷酸或核苷酸类似物可以包括一个或多个修饰,这些修饰被配置成在标记的核苷酸掺入到生长核酸链中时防止随后的核苷酸添加到与标记的核苷酸相邻的位置。例如,标记的核苷酸可包括终止或封闭基团(例如,二甲氧基三苯甲基、亚磷酰胺或硝基苄基分子)。在一些情况下,终止或封闭基团可以是可切割的。

计算机系统

本公开提供了被编程为实现本公开的方法的计算机系统。图3示出了被编程或以其他方式配置以进行核酸测序的计算机系统301。计算机系统301可以至少部分地基于检测到的光学信号的强度来确定序列读段。计算机系统301可以调节本公开的各个方面,诸如例如进行核酸测序、序列分析,以及调节核苷酸的瞬时结合和非瞬时结合(例如,掺入)的条件。计算机系统301可以是用户的电子设备或相对于电子设备远程定位的计算机系统。电子设备可以是移动电子设备。

计算机系统301包括中央处理单元(CPU,在本文也称为“处理器”和“计算机处理器”)305,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统301还包括存储器或存储器位置310(例如,随机存取存储器、只读存储器、闪存)、电子存储单元315(例如,硬盘)、用于与一个或多个其他系统通信的通信接口320(例如,网络适配器)以及外围设备325,诸如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器310、存储单元315、接口320和外围设备325通过诸如主板等通信总线(实线)与CPU 305通信。存储单元315可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统301借助于通信接口320可操作地耦合到计算机网络(“网络”)330。网络330可以是因特网、互联网和/或外联网,或者与因特网通信的内联网和/或外联网。在一些情况下,网络330是电信和/或数据网络。网络330可以包括一个或多个计算机服务器,其可以实现分布式计算,诸如云计算。在一些情况下,网络330可以借助于计算机系统301实现对等网络,这可以使得耦合到计算机系统301的设备能够起到客户端或服务器的作用。

CPU 305可以执行一系列机器可读指令,该机器可读指令可以体现在程序或软件中。指令可以存储在存储位置如存储器310中。指令可以针对CPU 305,该指令随后可以编程或以其他方式配置CPU 305以实现本公开内容的方法。由CPU 305执行的操作的实例可以包括提取、解码、执行和回写。

CPU 305可以是电路如集成电路的一部分。电路中可以包括系统301的一个或多个其他组件。在一些情况下,该电路是专用集成电路(ASIC)。

存储单元315可以存储文件,诸如驱动程序、库和保存的程序。存储单元315可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统301可以包括一个或多个附加数据存储单元,所述附加数据存储单元位于计算机系统301外部,诸如位于通过内联网或因特网与计算机系统301通信的远程服务器上。

计算机系统301可通过网络330与一个或多个远程计算机系统通信。例如,计算机系统301可以与用户的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、平板或平板型PC(例如,iPad、Galaxy Tab)、电话、智能手机(例如,iPhone、支持Android的设备、)或个人数字助理。用户可以经由网络330访问计算机系统301。

本文所述的方法可通过机器(例如,计算机处理器)可执行代码的方式来实现,该机器可执行代码存储在计算机系统301的电子存储位置上,例如存储器310或电子存储单元315上。机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,该代码可由处理器305执行。在一些情况下,可从存储单元315检索代码并将其存储在存储器310上,以供处理器305迅速存取。在一些情况下,可排除电子存储单元315,并且将机器可执行指令存储在存储器310上。

该代码可以被预编译并配置用于由具有适于执行代码的处理器的机器使用,或者可以在运行期间被编译。代码可以用编程语言提供,可以选择编程语言以使代码能够以预编译或即时编译(as-compiled)的方式执行。

本文提供的系统和方法的各个方面,诸如计算机系统301,可以在编程中体现。该技术的各个方面可以被认为是“产品”或“制品”,其一般为在一种类型的机器可读介质上携带或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储在电子存储单元如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”型介质可以包括计算机的任何或全部有形存储器、处理器等,或其相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以在任何时间为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如,这样的通信可以使软件从能够一台计算机或处理器加载到另一台计算机或处理器中,例如从管理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一类型的介质包括光波、电波和电磁波,诸如跨本地设备之间的物理接口、通过有线和光学陆线网络以及各种空中链路而使用的。携载此类波的物理元件,诸如有线或无线链路、光学链路等,也可以被视为承载软件的介质。如本文所用,除非仅限于非暂时性有形的“存储”介质,否则计算机或机器“可读介质”等术语是指参与向处理器提供指令以供执行的任何介质。

因此,机器可读介质如计算机可执行代码可采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如可用于实现如附图中所示的数据库等。易失性存储介质包括动态存储器,诸如这样的计算机平台的主存储器。有形传输介质包括同轴缆线、铜线和光纤,包括构成计算机系统内的总线的线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,计算机可读介质的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡片纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或匣盒、传送数据或指令的载波、传送此类载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中的许多介质可以参与将一个或多个指令的一个或多个序列携载到处理器以供执行。

计算机系统301可以包括或与电子显示器335通信,该电子显示器335包括用户接口(UI)340用于提供例如,核酸序列和光学信号检测的结果(例如,序列读段、强度图等)。UI的实例包括但不限于图形用户接口(GUI)和基于网络的用户接口。

本公开内容的方法和系统可通过一种或多种算法来实现。算法可以在由中央处理单元305执行时通过软件的方式来实现。该算法可以例如,实施本公开的方法和系统,例如至少部分地基于检测的光学信号的强度来确定序列读段。

实施例

实施例1:一般合成原理

以下实施例的某些实施例说明了制备本文所述的接头和标记的底物的各种方法。应当理解,本领域技术人员能够通过类似方法或通过结合本领域技术人员已知的其他方法来制备这些化合物。还应理解,本领域技术人员将能够通过使用合适的起始材料并根据需要修改合成路线以如下所述的类似方式制备其他化合物。通常,起始材料和试剂可从商业供应商获得或根据本领域技术人员已知的来源合成或如本文所述制备。

除非另有说明,本文所述的合成方法中使用的试剂和溶剂均从商业供应商获得。无水溶剂和烘箱干燥的玻璃器皿可用于对水分和/或氧气敏感的合成转化。产量可能未优化。反应时间可能是近似的并且可能未优化。合成过程中使用的材料和仪器可以用适当的替代品代替。除非另有说明,柱层析和薄层层析(TLC)可以在反相硅胶上进行。可以获得核磁共振(NMR)和质谱来表征反应产物和/或监测反应进程。

实施例2:标记试剂的结构

本文描述的是具有确定分子量的半刚性、水溶性接头的实例,其可以有效地实现染料-染料或染料-猝灭剂分离。半刚性结构可以通过由零个或一个具有sp3键和零个或多个sp或sp2键的键连接的一系列连接的、芳族环体系或非芳族环体系来实现。水溶性可以通过包含(例如,在每个亚单元中)选自以下组中的至少一个部分来实现:羟基、吡啶鎓、咪唑鎓、磺酸盐、氨基、硫醇、羧基和季铵。接头可以是异或同双(或三)官能试剂,其允许在一端附接染料(例如,荧光染料)而在另一端附接生物配体(例如,核苷酸)。此类接头的通式的实例如下所示:

其中p是选自1-100的重复单元的数量;每个R3是独立地选自例如吡啶鎓和磺酸盐的水溶性部分;R1和R2是附接基团,例如氨基和羧基部分;每个n独立地为1或2;每个m独立地选自1和2;且每个q独立地选自4-8。在上述结构中,m表示将环部分彼此连接的sp3碳的数量。环部分可以是脂族环或芳族环。

多个此类子单元可以彼此连接。例如,接头可以由下式表示:

其中p和r各自是独立地选自1-100的重复单元的数量;每个R3和R4是独立地选自例如吡啶鎓和磺酸盐的水溶性部分;R1和R2是附接基团,例如氨基和羧基部分;每个n和i独立地为1或2;每个m和k独立地选自1和2;且每个q和j独立地选自4-8。在上述结构中,m和k表示将环部分彼此连接的sp3碳的数量。环部分可以是脂族环或芳族环。在一些情况下,结构左侧部分的环部分是脂族的,且结构右侧部分的环部分是芳族的,反之亦然。

请注意,上述结构并未涵盖本公开的所有实施方案。例如,接头不必是“P-重复”单元的聚合物。类似地,水溶性官能团可以是环的组成组分而不是附接到环上。

实施例3:dGTP-AP-SS-hyp10-Atto633的合成

本文描述了一种构建标记的核苷酸dGTP-AP-SS-hyp10-Atto633的方法。图5A图示了用于合成荧光标记的dGTP试剂的示例性方法。图5B图示了具有染料和接头的完整结构的相同合成。该方法包括在Gly-Hyp10和荧光团Atto633之间形成共价键(过程(a)),酯化以将Atto633-Gly-Hyp10与五氟苯酚偶联(过程(b)),用接头分子epSS取代(过程(c)),酯化以形成Atto633-Gly-Hyp10-epSS-PFP(过程(d)),和用dGTP取代以提供荧光标记的核苷酸(过程(e))。下面提供了合成的细节。

Atto633-Gly-Hyp10的制备。(图5过程(a))通过在1.5毫升(mL)微量离心管中将25毫克(mg)的11氨基酸肽溶解在500微升(μL)的0.2摩尔(M)的碳酸氢钠中制备Gly-Hyp10(本文也称为“hyp10”)在碳酸氢盐中的储备溶液。将7mg的Atto633-NHS称重到另一个微量离心管中并溶解在200μL的二甲基甲酰胺(DMF)中。将体积为300μL的肽溶液加到含有Atto633-NHS的溶液中。将所得溶液混合并加热至50℃时间为20分钟(min)。反应程度用反相薄层色谱法(TLC)跟踪。取出1μL等分的反应溶液并溶解在40μL的水中,然后在反相TLC上点样。包括与Atto633酸的共点样,并且Atto633也单独运行。该板用乙腈0.1M醋酸三乙基铵(TEAA)的2:1溶液洗脱。Atto633酸和Atto633-NHS两者具有零的Rf,而Gly-Hyp10具有的0.4的Rf。通过使用梯度20%→50%乙腈对比0.1M TEAA在16分钟内以2.5mL/min将溶液注射到C18反相柱上来纯化产物。期望的产物是主要产物Atto633-Gly-Hyp10,在15.2分钟时洗脱。将含有期望材料的级分收集在微量离心管中并干燥,产生蓝色固体。在ESI质谱上观察到主要峰:针对C87H115N14O24 +计算的m/z,[M]+=1739.8;求得值:1740.6。

Atto633-Gly-Hyp10-PFP的制备。(图5过程(b))在1.5mL的微量离心管中将Atto633-Gly-Hyp10悬浮在100μL的DMF中。将吡啶(20μL)和五氟苯基三氟乙酸酯(PFP-TFA,20μL)添加到管中。将反应混合物在加热块中加热至50℃持续20分钟。通过取出1μL的等分试样并加入到1mL的稀HCl(0.4%)来监测反应。当反应完成时,水溶液是无色的。10分钟后,稀HCl溶液呈淡蓝色。加入另外的PFP-TFA(30μL)。在50℃下另外100分钟后,重新测试沉淀,得到无色溶液。将剩余的反应混合物以20μL的份量沉淀到1mL的稀盐酸中。将20μL加入到1mL稀盐酸中,将管向下旋转并丢弃水溶液。重复该过程直至所有产物沉淀。将残余物彻底干燥。干燥后,固体用1mL甲基叔丁基醚(MTBE)洗涤两次。产品为深蓝色粉末。该产品在电喷雾电离(ESI)-质谱(MS)上产生一个主峰:针对C93H115F5N14O24 2+计算的m/z,[M+H]2+=1906.8/2=953.4;求得值:953.4。

Atto633-Gly-Hyp10-epSS的制备。(图5过程(c))在微量离心管中将Atto633-Gly-Hyp10-PFP(1.6微摩尔(μmol))溶解在100μL的DMF中。将氨乙基-SS-丙酸溶液(Broadpharm;6mg,在200μL的0.1M碳酸氢盐中)与Atto633-gly-hyp10-PFP混合,并在加热块中加热至50℃持续20分钟。Atto633-Gly-Hyp10-epSS通过反相HPLC使用20%→50%乙腈的梯度在16分钟内从所得反应混合物中纯化。Atto633-Gly-Hyp10在15分钟时洗脱,且Atto633-Gly-Hyp10-epSS在15.6分钟时洗脱。将含有产物Atto633-Gly-Hyp10-epSS的级分合并和干燥。产物在ESI-MS上有一个主峰:针对C92H124N15O25S2 +计算的m/z,[M]+=1902.8;求得值:1902.6。

Atto633-Gly-Hyp10-epSS-PFP的制备。(图5过程(d))在微量离心管中将Atto633-Gly-Hyp10-epSS溶解在100μL的DMF中。添加吡啶(20μL)和PFP-TFA(20μL),并将混合物在加热块中加热至50℃持续20分钟。稀HCl中的测试等分试样(1μL)产生无色溶液和蓝色沉淀。反应以在1mL稀HCl中的20μL等分试样沉淀,将管向下旋转并丢弃水溶液。重复该过程直到所有PFP酯沉淀。残余物在真空下彻底干燥并用MTBE洗涤。

dGTP-AP-SS-Atto633的制备。(图5过程(e))将氨基炔丙基dGTP(Trilink;在100μL的0.2M碳酸氢盐中1μmol)的溶液添加到50μL的包含Atto633-gly-hyp10-epSS-PFP的DMF溶液中。将混合物加热至50℃持续10分钟。产物dGTP-AP-epSS-Atto633通过反相HPLC使用20%→50%乙腈的梯度纯化16分钟。产物在15.3分钟时洗脱。制备型HPLC提供0.65μmol。产物在ESI-MS上产生一个主峰:针对C106H139N20O37P3S2 2–计算的m/z,[M-H]2-,1220.4;求得值:1220.6。

虽然描述了dGTP-Atto633-Gly-Hyp0-epSS-PFP的合成,但熟练的从业者会认识到,可以使用合适的起始材料以类似方式生产其他荧光标记的核苷酸。

实施例4:dCTP-epSS-Atto633的合成

dCTP-SS12-Atto633可以与实施例3中概述的方法类似的方式制备。简言之,通过将包含11mg的Atto633-NHS的200μL的DMF溶液与包含0.2M的碳酸氢钠和24mg的epSS的200μL的水溶液混合,将所得混合物加热至50℃持续15分钟,通过反相HPLC使用40%→60%乙腈对比0.1MTEAA的梯度在16分钟内以4.5mL/min从混合物中纯化Atto633-epSS,并用ESI-MS确认产品身份来制备Atto633-epSS(图6方法(a))。产物在7.3分钟时洗脱,且游离染料在6.4分钟时洗脱。产率为约80%。该产物在ESI-MS上产生一个主峰:针对C40H51N4O4S2 +计算的,[M]+=715.3;求得值[M]+=715.3。

然后通过混合溶解在100μL的DMF、20μL的吡啶和20μL的PFP-TFA中的Atto633-epSS溶液;将溶液在50℃下加热5分钟,然后添加另外20-40μL的PFP-TFA;加热回到50℃持续5分钟;并在1mL的稀HCl中沉淀产物将Atto633-epSS转化为Atto-epSS-PFP(图6过程(b))。产物用另外的1mL的稀HCl洗涤,通过移液管和蒸发除去上清液,产生蓝色固体。

dCTP-epSS-Atto633是通过Atto-epSS-PFP与氨基炔丙基dCTP(AP-dCTP)反应形成的(图6过程(c))。将AP-dCTP储备溶液(Trilink;1μmol)添加到包含0.2M的碳酸氢钠的100μL的DMF溶液中,并与溶解在100μL的DMF中的Atto-epSS-PFP溶液合并。将混合物静置过夜。在C18反相柱上使用梯度20%→100%乙腈对比0.1M的TEAA在16分钟内以2.5mL/min从混合物中纯化dCTP-epSS-Atto633。产物在10.7分钟时洗脱。收集并干燥包含产物的级分。该产物在ESI-MS上产生一个主峰:针对C52H66N8O16P3S2 的m/z计算值,[M]-=1215.3;求得值:1215.5。

实施例5:染料标记的核苷酸的制备

制备了一组设计用于在约530nm处激发的染料标记的核苷酸。可以使用绿色激光器实现在530nm的激发,该激光器可能容易获得、高功率且稳定。有许多可在530nm或附近激发的市售荧光染料价格低廉且具有多种特性(疏水、亲水、带正电、带负电)。此类染料的合成路线可能比更长波长染料的合成路线更短且更便宜。此外,某些绿色染料可能比红色染料具有明显更少的自猝灭,可能允许使用更高的标记分数(例如,如本文所述)。

用于例如,测序应用的可行试剂组由四种规范核苷酸中的每一种或其类似物与在测序中表现良好的可切割绿色染料组成。可以通过改变标记的核苷酸结构的每个组分以获得具有不同特性的候选标记的核苷酸的阵列来制备最佳组。评估所得核苷酸(例如,如下所述),并且针对浓度和标记分数(流中标记的核苷酸与未标记的核苷酸的比例)优化某些标记的核苷酸。

图7示出了用于构建候选标记的核苷酸的多种组分。四个炔丙基氨基官能化的核苷酸(A、C、G和U)中的每一个都可以用两个可切割的接头E和B之一修饰;羟脯氨酸接头(hyp10)或不是;以及三种荧光染料中的一种,*、#和$。使用这些组分,有48个可能的核苷酸变异。标记的核苷酸可根据本文所述的合成路线和原理制备。G*-B-H标记的核苷酸的示例性合成在实施例6中描述。

实施例6:G*-B-H标记的核苷酸的合成

用于制备G*-B-H(参见实施例5)的合成方法示出在图8中。类似的方法可用于制备实施例5和本文其他地方所述的其他标记的核苷酸。由于所使用的成分包括氨基酸,因此有多种途径获得最终产品。合成考虑因素包括在加热或酸性条件下三磷酸酯的水解趋势(以生成二磷酸酯和单磷酸酯),二硫化物在三乙胺和氨存在下分解的趋势,防止使用酸不稳定保护基团,和防止使用三氟乙酰胺或FMOC保护基团。

PN 40142的制备。在1.5mL微量离心管中将Atto 532琥珀酰亚胺酯(Atto-tec,PN40183;5mg=4.6μmol)在100μL DMF中的溶液与gly-hyp-hyp-hyp-hyp-hyp-hyp-hyp-hyp-hyp-hyp(来自Genscript的定制合成,PN 40035;8.5mg=7μmol)在170μL的0.1M碳酸氢盐中的溶液混合。在Phenomenex反相C18半制备柱(Gemini 5μM C18,250x10mm)上使用10%→40%乙腈对比0.1M的醋酸三乙铵的梯度在16分钟内纯化反应。合并含有产物40142的级分并浓缩至干。通过稀释级分并测量633nm下的光密度(OD)并使用130,000cm-1M-1的染料的消光系数来确定产量。产率为50%。结构由负离子模式下的质谱确认:针对C81H103N14O31S2 计算的m/z,1831.6;求得值:1831.8。

PN 40143的制备。在1.5mL微量离心管中将PN 40142(4μmol)悬浮在100μL的DMF中。将吡啶(20μL)和五氟苯基三氟乙酸酯(20μL)添加到DMF溶液中并加热至50℃持续5分钟。将一部分(1μL)反应混合物沉淀到0.4%HCl中;水溶液保持无色,表明完全转化为活性五氟苯基酯。反应的剩余部分沉淀到稀酸性溶液中,并用移液管吸出水性溶液。残留物用己烷洗涤并干燥成高度着色的固体(PN40143)。

PN 40146的制备。将PN 40143溶解在100μL的DMF中,并与二硫化物PN 40113(5mg,20μmol)在DMF中混合。将二异丙基乙胺(5μL)加入到混合物中。在反相HPLC上使用20%→50%乙腈对比0.1M TEAA的梯度在16分钟内纯化混合物。在8.8分钟和9.5分钟时获得两种染料着色的级分。9.5分钟时的级分通过质谱鉴定为期望产物:针对C90H111N15O32S4 2-计算的m/z,1020.84;求得值:1021.1。

PN 40147的制备。在1.5mL微量离心管中将PN 40146悬浮在100μL的DMF中。将吡啶(20μL)和五氟苯基三氟乙酸酯(20μL)添加到DMF溶液中并加热至50℃持续5分钟。将一部分(1μL)反应混合物沉淀到0.4%的HCl中;水溶液保持无色,表明完全转化为活性五氟苯基酯。反应的剩余部分沉淀到稀酸性溶液中,并用移液管吸出水性溶液。残留物用己烷洗涤并干燥成高度着色的固体(PN 40147)。

PN 40150的制备。在1.5mL微量离心管中将PN 40147溶解在50μL的DMF中。制备0.5μmol的7-脱氮-7-炔丙基氨基-2’-脱氧鸟苷-5’-三磷酸酯在50μL的1M碳酸氢酯中的溶液并将其加入管中。在4℃下保持过夜后,产物在HPLC上纯化;使用20%→50%乙腈对比0.1MTEAA梯度在16分钟内在12分钟时的级分包含期望产物:针对C104H129N20O44P3S4 2–计算的m/z,[M-H]2-,1291.33;求得值:1292.4。

实施例7:染料标记的核苷酸的评估

使用基于珠的测定来评估实施例5的染料标记的核苷酸。链霉亲和素珠是用与引物链退火的5'-生物素化模板链制备的。设计引物链使得通过DNA聚合酶掺入的下一个同源碱基是胸苷。DNA聚合酶与珠复合物结合。然后将含有不同比例的染料标记的核苷酸(dUTP*)和天然碱基(TTP)的各种混合物提供给珠。洗掉过量的试剂后,使用PE通道(激发=488nm,发射=580nm)在流式细胞仪上读取珠的荧光。该测定的示意图显示在图9中。

不同标记的dUTP的珠测定结果显示在图10中。核苷酸总和的总浓度维持在2μM;10%的标记分数意味着0.2μM的dUTP*和1.8μM的TTP。两种核苷酸的行为明显不同:U#-E的“容差”为约1,这意味着在所有测试的比例中,染料标记的核苷酸相比于天然核苷酸的掺入没有差异;即,50%的标记分数导致50%的珠被标记。另一方面,U*-E具有负容差,这意味着在每个比例下,它都低于零和标记为100%时的信号之间的线。负容差表明染料标记使核苷酸成为比天然底物更差的底物。该结果与以下观察结果一致:诸如Atto532(由U*-E表示的染料)的带负电荷的染料抑制通过许多聚合酶的掺入,而诸如5-羧罗丹明-6G(由U#-E表示的染料)的染料是两性离子的并且被认为是良好的底物。

使用类似的测定法评估其他标记的核苷酸。图11示出了标记的dATP的珠测定的结果。图12示出了标记的dGTP的珠测定的结果。对于标记的dATP,与A*-B-H和A*-E-H相比,在针对A*-B的100%标记时观察到非常低的荧光。这表明羟脯氨酸接头(H)减轻了核苷酸对染料的猝灭。对于标记的dGTP,观察到类似的结果。这个结果对于标记的dGTP是预期的,因为通过光诱导电子转移的G猝灭是众所周知的。来自二硫化物接头B的猝灭效应也可能促成针对标记的dATP和dGTP观察到的较低的荧光。

实施例8:使用染料标记的核苷酸的测序

核酸测序测定可用于评估染料标记的核苷酸(例如,如本文所述)。示例性程序示于图18中。

可以使用配备有发光器件(LED)和/或激光器的仪器进行测序。评估的每个核苷酸可包括配置用于在相似波长上激发和发射的染料(例如,全红光或全绿光发射)。一种或多种不同的核苷酸类型可以与不同的染料偶联。测序性能可以基于碱基识别质量、相位滞后、相位超前和均聚物完成来评估。

带有扩增模板的珠已准备好,固定在支持物上,并与紧密结合的DNA聚合酶一起孵育。然后对珠进行多次测序循环。每个测序循环可包括与U*/T(染料标记的TTP和天然TTP的固定比例)一起孵育、“追踪”过程(仅TTP)、成像和切割过程(10mM的三(羟丙基)膦(THP)))以释放染料。每个过程之间可能有洗涤过程。可以对包括A、C和G的核苷酸或核苷酸类似物重复该过程。该测序程序可以有效地鉴定至少2、3、4、5、6、7、8或多个核苷酸的均聚区域。

还针对全hyp接头组评估测序,其中染料标记的核苷酸(包括每个规范核苷酸)包括hyp10或hyp20接头。进行该评估以鉴定其中使用较高分数且猝灭最少的组。更高的猝灭可能导致更高的疤痕化(例如,如本文所述),这可能降低聚合酶的掺入效率。然而,家族B酶如PolD可能在疤痕的情况下表现良好。可以用2.5%和20%的标记分数与染料(例如Atto633)评估测序。

测序可用于评估对各种标记的核苷酸的容差。图19示出了用发红光染料标记的核苷酸的归一化珠数据。亮溶液分数(bf)相对于亮掺入分数(bi)作图。曲线符合以下等式:

其中df是暗溶液分数。在图19中,G*的计算容差为10.6,A*为2.8,U*为2.0,且C*为1.2。正容差数字表示在50%的标记分数时,大于50%被标记。容差为1的试剂在测序中可能具有最少的“上下文”。具有非常负的容差(例如,容差<<1)的试剂可能具有在与支持物偶联的多个模板之间均匀掺入方面的问题,因为它们必须以如此低的浓度使用,以至于它们可能低于饱和度并以不均匀速率消耗。

实施例9:包括鸟嘌呤或其类似物的经染料标记的核苷酸

包括鸟嘌呤或其类似物的核苷酸在测序应用中(例如,如本文所述)在碱基调用准确度方面可能表现更差。这可能与光诱导电子从核碱基转移到与核碱基相连的染料有关,这可能猝灭由染料发射的信号,从而降低信号的动态范围。因此,如本文所提供的,制备和评估各种染料标记的核苷酸,包括鸟嘌呤或其类似物。此类染料标记的核苷酸的实例包括:

G1

G2

G3

G4

G5(Hyp10接头,Cya染料)

G6(Hyp10接头,Cya2染料)

上面显示的几个结构包括hyp10接头,该接头包括自N末端的序列Gly-Hyp-Hyp-Hyp-Hyp-Hyp-Hyp-Hyp-Hyp-Hyp-Hyp。缺乏hyp10接头的G4被高度猝灭。如本文所述,在测序测定中评估剩余的染料标记的核苷酸。在所示结构中,G6提供了最高的准确度。制备G6的合成路线如图13A-13C所示。

实施例10:染料标记的核苷酸的制备

染料标记的核苷酸可包括一个或多个氨基酸。如上所述,二胺和二酸可用于构建氨基酸。染料标记的核苷酸可以包括两个或更多个给定氨基酸作为重复单元。包含氨基酸的两个重复单元的染料标记的核苷酸的实例如下所示:

图14A和14B示出了用于制备上述染料标记的核苷酸的合成路线。每个中间体的组成通过质谱法确认。如实施例7中所述,在珠测定中评估染料标记的核苷酸。该接头提供的G*不如带有聚羟脯氨酸接头的G*亮,但在减少猝灭方面比没有接头的G*更有效。

实施例11:猝灭的评估

本文提供的染料标记的核苷酸可以改善核碱基与其所附接的染料之间和/或核酸分子(例如,生长核酸链)中染料之间的猝灭,例如在核酸分子的同聚区域中。猝灭可以不依赖酶的方式进行评估。

图15示出了用于评估猝灭的示意图。合成寡核苷酸用一个或两个“接头臂核苷酸”构建。接头臂核苷酸是胸苷类似物,接头臂含有伯胺。含有接头臂核苷酸的寡核苷酸可以用接头和染料标记并进行HPLC纯化。使用珠标记的测定的优点是不需要对试剂进行精确定量;在每个步骤中都可以使用大量过量并进行珠洗涤,确保只有化学计量的寡核苷酸与模板结合。每个染料接头都放在两个寡核苷酸上。在APC(红色)通道中的流式细胞仪上测量珠。猝灭百分比由下式确定:%猝灭=100×(1-Flbis/(2*Flmono)).。

图16和17示出了红色染料接头(图16)和绿色染料接头(图17)的猝灭结果。结果表明染料的性质影响猝灭。负电荷(参见Atto532与AttoRho6G)可以改善猝灭,但如果染料非常大且平坦(参见Cy5,Alexa647),猝灭可能不会得到改善。hyp10或hyp20接头改善猝灭。如图16所示,hyp10在Atto633情况下改善猝灭,且花青染料即使在四个磺酸基团情况下也能猝灭。如图17所示,Atto532上的磺酸基团改善猝灭,Atto532和hyp10的组合也改善猝灭。

实施例12:均聚物的询问

提供了核酸模板,其具有不同长度的包含胞嘧啶(1C、2C、3C、4C、5C)的均聚物区域。将模板与用Atto532荧光团(例如,如本文所述;本文表示为G*)标记的含鸟苷的核苷酸接触。标记的核苷酸可以核苷酸流的形式在溶液中提供(例如,如本文所述)。核苷酸流可以包括100%标记的核苷酸(例如,核苷酸流可以仅包括标记的核苷酸而没有未标记的核苷酸)或可以包括标记的的核苷酸和未标记的核苷酸两者(例如,如本文所述)。标记的的核苷酸和(如果存在的)未标记的核苷酸可以不终止,使得多个核苷酸可以连续掺入与模板中出现的胞嘧啶一样多的位置。可以使用酶(例如聚合酶,例如Bst 3.0)将标记的核苷酸和/或未标记的核苷酸掺入使用具有多胞嘧啶序列的核酸作为模板的延伸引物中。模板的多个拷贝可以固定在珠或其他支持物上(例如,如本文所述)。该程序示意性地示于图20A和20B。

在一些情况下,标记的核苷酸连续掺入与模板中出现的胞嘧啶一样多的位置。在其他情况下,少于所有潜在的G*被掺入。当未标记的核苷酸包括在核苷酸流中时,未标记的核苷酸和标记的核苷酸都可被掺入。例如,对于包括含有三个胞嘧啶的均聚区域的模板,掺入的核苷酸可以具有序列GGG、GG*G、GGG*、G*GG、G*G*G、G*GG*、GG*G*或G*G*G*,其中G*表示标记的核苷酸且G表示未标记的核苷酸。掺入的核苷酸的序列可基于例如核苷酸流的标记分数(例如,流中标记的核苷酸与未标记的核苷酸的比例)和用于标记核苷酸的光学(例如,荧光)标记试剂而变化。

标记的多核苷酸产物在Biorad变性丙烯酰胺凝胶上分离,并使用蓝色和绿色LED成像以检测掺入的标记的核苷酸。如图20C所示,使用该方法可以检测1、2、3、4和5个连续的胞嘧啶。

实施例13:使用高分数的经标记的核苷酸通过合成进行测序

使用本文所述的程序和标记的核苷酸对长度为至少30个核苷酸的模板核酸进行测序。待测序的模板可以固定在支持物上(例如,如本文所述)。模板通过合成反应进行测序,其中模板依次与包含PolD聚合酶(New England Biolabs)和多个单一规范类型的核苷酸(例如T、A、C或G)的溶液(例如,核苷酸流)接触。在每个核苷酸流中,核苷酸群体中的大约20%被如本文上述所述的Atto633标记以提供约20%的标记分数。剩余的核苷酸未被标记。核苷酸流中包含的核苷酸不会终止,以允许对模板的均聚区域进行有效测序。在将模板与包括第一规范类型的核苷酸的第一核苷酸流接触后,将模板与洗涤流接触以去除未掺入的核苷酸。收集荧光图像。将与掺入的标记的核苷酸相关联的荧光标记试剂的接头与包含切割试剂的切割流接触,该切割试剂被配置为切割接头的可切割基团以将荧光标记试剂的荧光染料(例如,Atto633)与掺入的核苷酸分离。另外的洗涤流可用于去除切割流。在一些情况下,包括第一规范类型的未标记的核苷酸的追踪流可以跟随初始核苷酸流并且在成像过程之前或之后。连续地对第二、第三和第四种核苷酸类型重复该过程,然后重复整个循环。

图21A示出了将该方法应用于样本模板的结果。黑色圆圈表示掺入了核苷酸,灰色圆圈表示在特定流循环中没有掺入核苷酸。如图所示,可以高准确度确定流循环中一个或多个核苷酸的掺入。此外,如图21B所示,信号强度和标记的核苷酸均聚物长度之间的关系在多个模板中可以是基本上线性的(例如,如本文所述)。例如,信号强度可以与模板的均聚区域的长度成比例。这种比例表明猝灭效应已被充分克服。在图21B中,G的斜率是0.96,C是0.80,A是079,且T是0.70。虚线表示实际信号,而实线表示相位校正后的信号。

实施例14:使用100%标记的核苷酸通过合成进行测序

具有至少30个核苷酸长度的模板核酸如实施例13中所述进行测序,但使用其中100%核苷酸被标记的溶液。在图22中,黑色圆圈表示在给定的流循环中掺入碱基,而灰色圆圈表示在给定的流循环中未掺入碱基。如从图22中可以看出,测序方法可用于通过50个流循环来检测碱基掺入。

实施例15:标记的蛋白质

用多种光学(例如,荧光)标记试剂(例如,如本文所述)标记蛋白质。例如,可以用三种或多种光学标记试剂标记蛋白质。与蛋白质相关联的光学标记试剂可以全部包含相同类型的荧光染料。与蛋白质相关联的光学标记试剂可以全部包含相同类型的接头。蛋白质可以是抗体,例如单克隆抗体。

蛋白质用于标记细胞。细胞可以是样本的组分,该样本可以包括多个细胞。可以使用流式细胞术分析和分选样本的细胞。流式细胞术分析可将细胞鉴定为被与多种光学标记试剂相关联的蛋白质标记。在一些情况下,样本的多个细胞可用光学标记试剂(例如,如本文所述)标记。例如,包含被配置为与蛋白质(例如,用多种光学标记试剂标记的蛋白质,例如用多种光学标记试剂标记的抗体)相关联的特定细胞表面特征(例如,抗原)的细胞可以用标记的蛋白质标记并使用流式细胞术进行分析和/或分选。分析和/或分选的细胞可以进行进一步的下游分析和处理,包括例如核酸测序、染色、成像、功能测定、免疫测定、分离/扩增、附加标记、免疫沉淀等。

尽管本文已经示出并描述了本发明的优选实施方案,但对本领域技术人员而言显而易见的是:这些实施方案仅以示例的方式提供。本发明不意在受说明书中提供的具体实例的限制。虽然本文已经示出和描述了本公开内容的优选实施方案,但是对于本领域技术人员而言显而易见的是,这些实施方案仅以示例的方式提供。在不偏离本公开内容的情况下,本领域技术人员现将想到许多变化、改变和替代。此外,应当理解,本发明的所有方面不限于本文阐述的特定描述、配置或相对比例,而是取决于各种条件和变量。应当理解,本文所述的本发明实施方案的各种替代方案可用于实践本发明。因此,考虑到本发明还应涵盖任何此类替代、修改、变化或等同物。以下权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。

101页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于治疗血液癌症和实体瘤癌症的嵌合抗原受体修饰的T细胞(CAR-T)

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类