用于数字聚合酶链反应的组合物和方法

文档序号:704492 发布日期:2021-04-13 浏览:71次 >En<

阅读说明:本技术 用于数字聚合酶链反应的组合物和方法 (Compositions and methods for digital polymerase chain reaction ) 是由 翁莉 马利克·法哈姆 邓凌锋 林盛榕 于 2019-07-03 设计创作,主要内容包括:在一些方面,本公开提供了用于鉴定核酸样品中的序列变体的方法。在一些实施方案中,方法包括区分多核苷酸中的真正突变与在扩增步骤过程中引入的随机错误。在一些实施方案中,该方法减少由数字PCR测定报告的假阳性的数目。在一些实施方案中,该方法提高数字PCR测定的准确性。(In some aspects, the present disclosure provides methods for identifying sequence variants in a nucleic acid sample. In some embodiments, the method comprises distinguishing true mutations in the polynucleotide from random errors introduced during the amplification step. In some embodiments, the method reduces the number of false positives reported by a digital PCR assay. In some embodiments, the method improves the accuracy of digital PCR assays.)

用于数字聚合酶链反应的组合物和方法

交叉引用

本申请要求2018年7月5日提交的第62/694,324号美国临时申请的权益,该美国临时申请通过引用整体并入本文。

背景技术

数字聚合酶链反应(PCR)是对传统聚合酶链反应方法的改进,其允许用户直接对样品中的核酸进行定量。数字PCR方法通常包括将样品分配到多个离散的分区中,使得每个分区可以被单独探询。数字PCR非常灵敏,但是由于可以在一个反应中测定的通路(plex)有限,因此可能难以规模化。对于使用无细胞DNA(cfDNA)作为输入的液体活检,该问题可能更成问题,因为起始材料通常很少。解决此问题的一种方法可能是在进行数字PCR之前扩增cfDNA,以便提供足够的起始材料以分成不同的测定。然而,在扩增步骤过程中引入的错误可通过数字PCR产生假阳性。这对于低等位基因频率变体检测可能具有挑战性。因此,本文提供了用于对具有少量核酸的样品进行数字聚合酶链反应的组合物和方法。所述组合物和方法可以通过减少假阳性判定的数目来提供对数字PCR技术的改进。

发明内容

在一方面,提供了一种鉴定包含多个多核苷酸的核酸样品中的序列变体的方法,所述方法包括:(a)使所述多个多核苷酸环化以形成多个环化的多核苷酸;(b)扩增所述多个环化的多核苷酸以生成多个多联体,每个多联体包含多个序列重复;(c)将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,其中所述多个分区中的单独分区含有第一探针和第二探针中的至少一个,其中所述第一探针与缺乏所述序列变体的所述靶序列结合并产生第一信号,并且所述第二探针与含有所述序列变体的所述靶序列结合并产生第二信号;(d)检测来自所述单独分区的所述第一信号和所述第二信号;以及(e)仅当所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第一信号的水平低于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为存在于所述靶序列中。在一些情况下,所述方法进一步包括,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平低于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为不存在。在一些情况下,所述方法进一步包括,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平时,鉴定为假阳性。在一些情况下,所述方法进一步包括基于所述鉴定来输出结果。在一些情况下,从所述结果中忽略假阳性。在一些情况下,所述多个多核苷酸包含单链多核苷酸。在一些情况下,所述多个多核苷酸包含无细胞DNA。在一些情况下,所述环化包括将所述多个多核苷酸中的至少一个多核苷酸的5'端和3'端连接。在一些情况下,所述环化包括将衔接子连接至所述多个多核苷酸中的至少一个多核苷酸的5’端、3’端或5’端和3’端两者。在一些情况下,所述扩增包括使用具有链置换活性的聚合酶进行扩增。在一些情况下,所述扩增包括使用滚环扩增来扩增所述多个环化的多核苷酸。在一些情况下,所述扩增包括使所述多个环状多核苷酸经受包含随机引物的扩增反应混合物。在一些情况下,所述扩增包括使所述多个环状多核苷酸经受包含一种或多种引物的扩增反应混合物,每种引物通过序列互补性与不同的靶序列特异性杂交。在一些情况下,所述多个多联体在所述分配之前不富集。在一些情况下,所述方法进一步包括,在所述分配之前,对所述多个多联体进行片段化以生成多个片段化的多联体。在一些情况下,所述方法进一步包括,在所述片段化之后且在所述分配之前,基于大小选择多个所述片段化的多联体。在一些情况下,所述多个分区包含基于乳液的小液滴。在一些情况下,所述基于乳液的小液滴包含皮升或纳升大小的小液滴。在一些情况下,所述多个分区包含孔或管。在一些情况下,所述第一探针包含第一可检测标记,并且所述第二探针包含第二可检测标记。在一些情况下,所述第一可检测标记包含第一荧光标记,并且所述第二可检测标记包含第二荧光标记。在一些情况下,所述第一荧光标记和所述第二荧光标记的发射光谱不同。在一些情况下,所述检测进一步包括测量所述第一信号和所述第二信号的强度。在一些情况下,所述序列变体是单核苷酸多态性。在一些情况下,所述第一探针和所述第二探针是基于Taqman测定的探针。在一些情况下,所述方法进一步包括,在所述分配之后且在所述检测之前,对所述多联体进行聚合酶链反应,以扩增所述多个序列重复的区域。

在另一方面,提供了一种减少包含少于50ng多核苷酸的核酸样品上数字聚合酶链反应中的错误的方法,该方法包括:(a)使所述核酸样品中的单独多核苷酸环化,以生成多个环化的多核苷酸;(b)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复;(c)将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,其中所述多个分区中的单独分区含有第一探针和第二探针中的至少一个,其中所述第一探针与缺乏所述序列变体的所述多个序列重复结合并产生第一信号,并且所述第二探针与含有所述序列变体的所述多个序列重复结合并产生第二信号;(d)检测来自所述单独分区的所述第一信号和所述第二信号;以及(e)当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平时,鉴定为假阳性。在一些情况下,所述方法进一步包括输出结果。在一些情况下,所述结果排除所述假阳性。在一些情况下,所述方法将假阳性减少至少20%。在一些情况下,所述核酸样品包含无细胞多核苷酸。在一些情况下,所述无细胞多核苷酸包含循环肿瘤DNA。在一些情况下,所述核酸样品来自受试者。在一些情况下,所述核酸样品是尿液、血液、粪便、唾液、组织或体液。

在另一方面,提供了一种用于检测序列变体的系统,该系统包括:(a)计算机,其被配置用于接收关于对样品进行检测反应的用户请求;(b)扩增系统,其响应于所述用户请求对所述样品或其部分进行核酸扩增反应,其中该扩增反应包括:(i)使所述样品的单独多核苷酸环化以形成多个环化的多核苷酸;以及(ii)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复;(c)分配系统,其将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体;以及(d)检测系统,其检测来自单独分区的第一信号的水平和第二信号的水平,其中当第一探针与缺乏所述序列变体的所述多个序列重复结合时生成所述第一信号,并且当第二探针与含有所述序列变体的所述多个序列重复结合时生成所述第二信号;以及(e)报告生成器,其向接收者发送报告,其中所述报告包含所述序列变体的检测结果。在一些情况下,当所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第一信号的水平低于指示靶序列的一个拷贝的阈值水平时,所述报告鉴定所述序列变体存在。在一些情况下,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平低于指示靶序列的一个拷贝的阈值水平时,所述报告鉴定所述序列变体不存在。在一些情况下,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平时,所述报告鉴定为假阳性。

在另一方面,提供了一种包含代码的计算机可读介质,该代码在被一个或多个处理器执行时实施检测序列变体的方法,该方法包括:(a)接收关于对样品进行检测反应的用户请求;(b)响应于所述用户请求对所述样品或其部分进行核酸扩增反应,其中该扩增反应包括:(i)使所述样品的单独多核苷酸环化以形成多个环化的多核苷酸;以及(ii)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复;(c)将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,其中所述多个分区中的单独分区含有第一探针和第二探针中的至少一个,其中所述第一探针与缺乏所述序列变体的所述多个序列重复结合并产生第一信号,并且所述第二探针与含有所述序列变体的所述多个序列重复结合并产生第二信号;(d)检测来自所述单独分区的所述第一信号和所述第二信号;以及(e)仅当所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第一信号的水平低于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为存在;以及(f)生成报告,该报告包含所述序列变体的检测结果。在一些情况下,所述方法进一步包括,当所述第一信号的水平超过指示序列变体的一个拷贝的阈值水平并且所述第二信号的水平低于指示序列变体的一个拷贝的阈值水平时,将所述序列变体鉴定为不存在。在一些情况下,所述方法进一步包括,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平时,鉴定为假阳性。

援引并入

本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考以下对利用本发明原理的说明性实施方案加以阐述的详细描述以及附图,将会对本发明的特征和优点获得更好的理解,在这些附图中:

图1描绘了根据本公开的实施方案,用于进行数字PCR的示例方法。

图2描绘了与环化cDNA的形成相关的三个实施方案。在顶部,单链DNA(ssDNA)在不存在衔接子的情况下环化,中间的方案描绘了衔接子的使用,而底部的方案利用两个衔接子寡核苷酸(在每一端产生不同的序列)并且可以进一步包括与这两个衔接子杂交以使两端接近的夹板寡核苷酸。

图3A和3B描绘了使用核酸的封闭末端添加衔接子的两种方案。

图4描绘了通过使用“分子钳”以使单链DNA的两端在空间上接近以供连接,而将特定靶标环化的实施方案。

图5A、图5B和图5C描绘了引发滚环扩增(RCA)反应的三种不同方式。图5A显示了使用靶标特异性引物,例如感兴趣的特定靶基因或靶序列。这通常导致仅扩增靶序列。图5B描绘了使用随机引物进行全基因组扩增(WGA),这通常将扩增所有样品序列,然后在加工过程中对其进行生物信息学分选。图5C描绘了在使用衔接子时衔接子引物的使用,这也导致总体上的非靶标特异性扩增。

图6显示了根据实施方案的PCR方法,该方法使用在靶序列的单体内比对时彼此呈远离取向的一对引物(也称为“背靠背”,例如在两个方向上取向,但不处于待扩增的结构域的末端上),促进含有至少两个拷贝的靶核酸序列的环状多核苷酸或链的测序。在一些实施方案中,在形成多联体后,使用这些引物组来促进扩增子成为靶序列的更高级的多聚体,例如,二聚体、三聚体等。任选地,该方法可进一步包括大小选择,以去除比二聚体小的扩增子。

图7A、图7B、图7C和图7D描绘了实施方案,其中背靠背(B2B)引物与“递升(touchup)”PCR步骤一起使用,使得不大利于短产物(如单体)的扩增。在这种情况下,引物具有两个结构域;第一结构域与靶序列杂交(灰色或黑色箭头),第二结构域是“通用引物”结合域(弯曲矩形;有时也称为衔接子),其不与原始靶序列杂交。在一些实施方案中,第一轮PCR通过低温退火步骤完成,使得基因特异性序列结合。低温运行产生各种长度的PCR产物,包括短产物。在少量轮次之后,升高退火温度,使得有利于整个引物(两个结构域)的杂交;如图所示,在模板的末端可见这些杂交,而内部结合则不太稳定。因此,相比于较低温度或仅单个结构域,较高温度和两个结构域较不利于产生较短的产物。

图8是根据实施方案的系统的图示。

图9A、图9B、图9C和图9D描绘了在使用根据本公开的方法检测序列变体EGFRL858R的数字PCR测定中获得的结果的示例。

图10A、图10B、图10C和图10D描绘了在使用根据本公开的方法检测序列变体EGFRG719S的数字PCR测定中获得的结果的示例。

图11A、图11B、图11C和图11D描绘了在使用根据本公开的方法检测序列变体EGFR_T790M的数字PCR测定中获得的结果的示例。

具体实施方式

本文提供的系统和方法通常涉及数字PCR技术及其改进。在一些情况下,该系统和方法可以适用于包含少量起始材料(例如,无细胞DNA)的核酸样品。在一些情况下,该系统和方法可以通过减少数字PCR测定中的假阳性判定的数目来提供对传统数字PCR技术的改进。在一些情况下,该系统和方法可以通过提高数字PCR测定中的序列变体判定的准确性来提供对传统数字PCR技术的改进。图1描绘了根据本公开的实施方案,数字PCR测定的示例方法。通常,该方法可包括使核酸样品中的单独多核苷酸环化,并扩增所述环化的多核苷酸以生成多个多联体。在一些情况下,所述多联体各自含有多个序列重复。在一些情况下,所述多个多联体中的至少一个可包含靶序列,并且该靶序列可以在该多联体中多次重复。在一些情况下,靶序列可包含序列变体。在一些情况下,靶序列可包含通过扩增步骤引入靶序列中的错误。在一些情况下,该方法可用来区分靶序列中的随机错误和真正突变。如图1所示,所述多个多联体可以被分配到多个分区中。在一些情况下,可以将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,该方法可以进一步包括使探针与靶序列杂交。在一些情况下,该探针可包括能够与靶序列中的野生型序列结合并产生第一信号(野生型信号)的野生型探针。在一些情况下,该探针可包括能够与靶序列中的突变序列(例如,包含序列变体)结合并产生第二信号(突变信号)的突变探针。不希望被理论所束缚,如果起始多核苷酸包含真正的突变,则预期所述多个序列重复中的每个靶序列将包含序列变体。相反,如果突变是由于扩增步骤过程中的随机错误引起的,则预期所述多个序列重复中的大多数靶序列将包含野生型序列,其中少量(1个或更多个)靶序列包含该错误。可以探询单独分区,并且预期具有真正突变的分区会生成突变信号(而不是野生型信号),而可以预期具有随机错误的单独分区既生成突变信号又生成野生型信号。

除非另有说明,否则本文公开的一些实施方案的实践采用在本领域技术范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术。参见,例如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012);Current Protocols in Molecular Biology系列(F.M.Ausubel等人编著);Methods In Enzymology系列(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编著(1995)),Harlow和Lane编著(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of BasicTechnique and Specialized Applications,第6版(R.I.Freshney编著(2010))。

术语“约”或“大约”意指在本领域普通技术人员测定的特定值的可接受误差范围内,该可接受误差范围将部分取决于该值如何测量或测定,即,测量系统的局限性。例如,根据本领域中的实践,“约”可指在1个或大于1个标准偏差内。或者,“约”可指给定值的最多20%、最多10%、最多5%或最多1%的范围。或者,特别是关于生物系统或过程,该术语可表示在某个值的一个数量级内,优选5倍以内,更优选2倍以内。在本申请和权利要求书中描述特定值的情况下,除非另有说明,否则应推定术语“约”意指在该特定值的可接受误差范围内。

术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可以互换使用。它们是指任何长度的核苷酸(无论是脱氧核糖核苷酸还是核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任何三维结构,并且可以行使已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、从连锁分析定义的基因座(多个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针以及引物。多核苷酸可包含一个或多个修饰的核苷酸,如甲基化核苷酸和核苷酸类似物。如果存在的话,对核苷酸结构的修饰可以在聚合物装配之前或之后赋予。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后进一步修饰,例如通过与标记组分缀合。

通常,术语“靶多核苷酸”是指具有靶序列的核酸分子起始群体中的核酸分子或多核苷酸,需要确定其存在、量和/或核苷酸序列,或其中一项或多项的变化。通常,术语“靶序列”是指在核酸的单链上的核酸序列。靶序列可以是基因的一部分、调节序列、基因组DNA、cDNA、RNA(包括mRNA、miRNA、rRNA)或其他。靶序列可以是来自样品或二级靶标如扩增反应产物的靶序列。

通常,“核苷酸探针”、“探针”或“标记寡核苷酸”是指用于在杂交反应中通过与相应的靶序列杂交来检测或鉴定其相应的靶多核苷酸的多核苷酸。因此,寡核苷酸探针可与一个或多个靶多核苷酸杂交。标记寡核苷酸可与样品中的一种或多种靶多核苷酸完全互补,或含有不与样品中的一种或多种靶多核苷酸中的相应核苷酸互补的一种或多种核苷酸。

“杂交”是指是指这样的反应:其中一个或多个多核苷酸发生反应以形成复合物,该复合物通过核苷酸残基的碱基之间的氢键键合而得到稳定。该氢键键合可通过Watson-Crick碱基配对、Hoogstein结合或根据碱基互补性以其他任何序列特异性方式发生。该复合物可包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、自杂交的单链或其任意组合。杂交反应可构成更广泛的过程中的步骤,如PCR的启动,或者内切核酸酶对多核苷酸的酶切。与第一序列互补的第二序列被称为第一序列的“互补序列”。应用于多核苷酸的术语“可杂交的”是指多核苷酸形成复合物的能力,该复合体通过杂交反应中核苷酸残基的碱基之间的氢键键合而得到稳定。

“互补性”是指核酸通过传统Watson-Crick或其他非传统类型与另一种核酸序列形成氢键的能力。互补性百分比表示核酸分子中可以与第二核酸序列形成氢键(例如,Watson-Crick碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个分别为50%、60%、70%、80%、90%和100%互补)。“完全互补”是指核酸序列的所有连续残基将与第二核酸序列中相同数目的连续残基发生氢键键合。如本文所用的“基本上互补”是指在具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互补性程度,或指在严格条件下杂交的两个核酸。例如为了评估互补性百分比,序列同一性可以通过任何合适的比对算法来测量,包括但不限于Needleman-Wunsch算法(参见,例如,可以在www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html获得的EMBOSSNeedle比对器(aligner),任选地采用默认设置)、BLAST算法(参见,例如,可以在blast.ncbi.nlm.nih.gov/Blast.cgi获得的BLAST比对工具,任选地采用默认设置)或Smith-Waterman算法(参见,例如,可以在www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html获得的EMBOSS Water比对器,任选地采用默认设置)。可以使用所选算法的任何合适的参数(包括默认参数)来评估最佳比对。

通常,用于杂交的“严格条件”是指这样的条件,在该条件下与靶序列具有互补性的核酸主要与靶序列杂交,而基本上不与非靶序列杂交。严格条件通常是序列依赖性的,并且根据许多因素而变化。通常,序列越长,该序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例在Tijssen(1993),Laboratory Techniques In Biochemistry AndMolecular Biology-Hybridization With Nucleic Acid Probes,第I部分,第二章“Overview of principles of hybridization and the strategy of nucleic acidprobe assay”,Elsevier,N.Y.中有详细描述。

在一方面,本公开提供了一种鉴定例如核酸样品中的序列变体的方法。在一些实施方案中,该方法包括:a)使所述多个多核苷酸环化以形成多个环化的多核苷酸;b)扩增所述多个环化的多核苷酸以生成多个多联体,每个多联体包含多个序列重复;将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,其中所述多个分区中的单独分区含有第一探针和第二探针中的至少一个,其中所述第一探针与缺乏所述序列变体的所述靶序列结合并产生第一信号,并且所述第二探针与含有所述序列变体的所述靶序列结合并产生第二信号;c)检测来自所述单独分区的所述第一信号和所述第二信号;以及d)仅当所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第一信号的水平低于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为存在于所述靶序列中。在一些情况下,所述方法进一步包括,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平不高于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为不存在。

通常,术语“序列变体”是指序列中相对于一个或多个参考序列的任何变异。一般而言,对于参考序列已知的个体的给定群体,序列变体以比参考序列更低的频率发生。例如,特定细菌属可具有16S rRNA基因的共有参考序列,但该属内的单独的种可在基因(或其部分)内具有一个或多个序列变体,该变体可用于在细菌群体中鉴定出该种。作为进一步的实例,同一物种的多个个体的序列(或同一个体的多个测序读取)在最佳比对时可以产生共有序列,并且相对于该共有序列的序列变体可用来鉴定指示危险污染的群体中的突变体。通常,“共有序列”是指反映序列中每个位置处的最常见碱基选择的核苷酸序列,其中这一系列相关核酸已经历大量的数学和/或序列分析,例如根据多种序列比对算法中的任一种的最佳序列比对。有多种比对算法可以使用,其中一些在本文中进行了描述。在一些实施方案中,参考序列是单个已知的参考序列,如单个个体的基因组序列。在一些实施方案中,参考序列是通过对多个已知序列,如作为参考群体的多个个体的基因组序列,或来自同一个体的多核苷酸的多个测序读取进行比对而形成的共有序列。在一些实施方案中,参考序列是通过最佳地比对来自分析中的样品的序列,以使得序列变体表示相对于同一样品中的相应序列的变异而形成的共有序列。在一些实施方案中,序列变体在群体中以低频率发生(也称为“罕见”序列变体)。例如,序列变体可以以约为或低于约5%、4%、3%、2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%或更低的频率发生。在一些实施方案中,序列变体以约为或低于约0.1%的频率发生。

序列变体可以是相对于参考序列的任何变异。序列变异可由一个核苷酸或多个核苷酸(例如2、3、4、5、6、7、8、9、10个或更多个核苷酸)的变化、插入或缺失组成。当序列变体包含两个或更多个核苷酸差异时,不同的核苷酸可以是彼此连续的,或不连续的。序列变体类型的非限制性实例包括单核苷酸多态性(SNP)、缺失/插入多态性(DIP)、拷贝数变体(CNV)、短串联重复(STR)、简单序列重复(SSR)、可变数目串联重复(VNTR)、扩增片段长度多态性(AFLP)、基于反转录转座子的插入多态性、序列特异性扩增多态性和可被检测为序列变体的表观遗传标记的差异(例如,甲基化差异)。

可经历本文所述方法的核酸样品可来源于任何合适的来源。在一些实施方案中,使用的样品是环境样品。环境样品可以来自任何环境来源,例如,天然存在的或人造的大气、水系、土壤或其他任何感兴趣的样品。在一些实施方案中,环境样品可以从例如大气病原体收集系统、地下沉积物、地下水、地下深处的古代水、草地的植物根-土界面、沿海水和污水处理厂获得。

来自样品的多核苷酸可以是多个多核苷酸中的任意多核苷酸,包括但不限于DNA、RNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、信使RNA(mRNA)、无细胞DNA(cfDNA)、循环肿瘤DNA(ctDNA),其中任意一种的片段,或其中任意两种或更多种的组合。在一些实施方案中,样品包含DNA。在一些实施方案中,样品包含基因组DNA。在一些实施方案中,样品可包含少量的多核苷酸(<50ng)。在一些实施方案中,样品包含线粒体DNA、叶绿体DNA、质粒DNA、细菌人工染色体、酵母人工染色体、寡核苷酸标签或其组合。在一些实施方案中,样品包含通过扩增生成的DNA,例如通过使用引物和DNA聚合酶的任何合适的组合的引物延伸反应,包括但不限于聚合酶链反应(PCR)、逆转录及其组合。当引物延伸反应的模板是RNA时,逆转录的产物称为互补DNA(cDNA)。可用于引物延伸反应的引物可包含对一种或多种靶标具有特异性的序列、随机序列、部分随机序列及其组合。通常,样品多核苷酸包含样品中存在的任何多核苷酸,其可以包括或者可以不包括靶多核苷酸。多核苷酸可以是单链的、双链的或其组合。在一些实施方案中,经历本公开的方法的多核苷酸是单链多核苷酸,其可以存在或者可以不存在双链多核苷酸。在一些实施方案中,多核苷酸是单链DNA。单链DNA(ssDNA)可以是以单链形式分离的ssDNA,或以双链形式分离并随后为了本公开的方法中的一个或多个步骤而制成单链的DNA。

在一些实施方案中,在不进行提取步骤和/或不进行纯化步骤的情况下,使多核苷酸经历后续步骤(例如环化和扩增)。例如,可以在不进行提取步骤的情况下处理流体样品以除去细胞,以产生纯化的液体样品和细胞样品,随后从纯化的流体样品中分离DNA。有多种分离多核苷酸的程序是可用的,例如通过沉淀,或者与基底非特异性结合并随后洗涤该基底以释放结合的多核苷酸。在不进行细胞提取步骤的情况下从样品中分离多核苷酸时,多核苷酸将主要是细胞外或“无细胞”多核苷酸,其可以对应于死亡或受损的细胞。这些细胞的特性可用来表征其所源自的细胞或细胞群体,如肿瘤细胞(例如癌症检测时)、胎儿细胞(例如产前诊断时)、来自移植组织的细胞(例如移植失败的早期检测时)或微生物群落的成员。

如果处理样品以便例如从样品中的细胞提取多核苷酸,则可使用多种提取方法。例如,可以通过用苯酚、苯酚/氯仿/异戊醇或类似的制剂(包括TRIzol和TriReagent)进行有机萃取来纯化核酸。提取技术的其他非限制性实例包括:(1)有机萃取后乙醇沉淀,例如,使用苯酚/氯仿有机试剂(Ausubel等人,1993),采用或不采用自动化的核酸提取器,例如,可从Applied Biosystems(Foster City,Calif.)获得的341型DNA提取器;(2)固定相吸附法(美国专利5,234,809;Walsh等人,1991);以及(3)盐诱导的核酸沉淀法(Miller等人,(1988)),这类沉淀方法通常被称为“盐析”法。核酸分离和/或纯化的另一个实例包括使用核酸能够特异性或非特异性结合的磁性颗粒,随后使用磁体分离珠子,并且洗涤并从珠子上洗脱核酸(参见,例如,美国专利5,705,628)。在一些实施方案中,上述分离方法之前可先进行酶消化步骤,以帮助从样品中除去不想要的蛋白质,例如用蛋白酶K或其他类似的蛋白酶进行消化。参见,例如,美国专利7,001,724。如果需要,可将RNA酶抑制剂加入到裂解缓冲液中。对于某些细胞或样品类型,可能希望在该方案中增加蛋白质变性/消化步骤。纯化方法可涉及分离DNA、RNA或两者。当在提取过程中或之后将DNA和RNA两者一起分离时,可以采用进一步的步骤与另一种分开地纯化一种或两者。还可生成提取的核酸的亚级分,例如,根据大小、序列或其他物理或化学特性进行纯化。除了初始核酸分离步骤外,核酸的纯化还可以在所公开的方法的任意步骤之后进行,例如用于去除过量的或不需要的试剂、反应物或产物。多种用于确定样品中的核酸量和/或核酸纯度的方法是可获得的,例如通过吸光度(例如,在260nm、280nm处的光吸收,和它们的比值)和标记物的检测(例如,荧光染料和嵌入剂,如SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoechst染色剂、SYBR金、溴化乙锭)。

如果需要,可以在进一步处理之前对来自样品的多核苷酸进行片段化。片段化可通过多种方法中的任何方法来完成,包括化学、酶促和机械片段化。在一些实施方案中,片段的平均长度或中值长度为约10个至约1,000个核苷酸,如10-800、10-500、50-500、90-200或50-150个核苷酸。在一些实施方案中,片段的平均长度或中值长度约为或少于约100、200、300、500、600、800、1000或1500个核苷酸。在一些实施方案中,片段为约90-200个核苷酸,并且/或者具有约150个核苷酸的平均长度。在一些实施方案中,片段化是以机械方式完成的,包括使样品多核苷酸经历声学超声处理。在一些实施方案中,片段化包括在适合于一种或多种酶的条件下,用一种或多种酶处理样品多核苷酸,以生成双链核酸断裂。可用于生成多核苷酸片段的酶的实例包括序列特异性核酸酶和非序列特异性核酸酶。核酸酶的非限制性实例包括DNA酶I、片段化酶、限制性内切核酸酶、其变体及其组合。例如,在不存在Mg++且存在Mn++的情况下,用DNA酶I消化可以诱导DNA中的随机双链断裂。在一些实施方案中,片段化包括用一种或多种限制性内切核酸酶处理样品多核苷酸。片段化可产生具有5’突出端、3'突出端、平端或其组合的片段。在一些实施方案中,如当片段化包括使用一种或多种限制性内切核酸酶时,对样品多核苷酸的切割留下具有可预测序列的突出端。可以通过标准方法,如柱纯化或从琼脂糖凝胶中分离,使片段化的多核苷酸经历对片段进行大小选择的步骤。

根据一些实施方案,来自样品的多个多核苷酸中的多核苷酸被环化。环化可包括将多核苷酸的5’端接合至同一多核苷酸的3’端,接合至该样品中的另一多核苷酸的3’端,或接合至来自不同来源的多核苷酸(例如,人工多核苷酸,如寡核苷酸衔接子)的3’端。在一些实施方案中,多核苷酸的5’端接合至同一多核苷酸的3’端(也称为“自接合”)。在一些实施方案中,选择环化反应的条件,以利于在特定长度范围内的多核苷酸的自接合,以便产生具有特定平均长度的环化多核苷酸群体。例如,可以选择环化反应条件,以利于长度短于约5000、2500、1000、750、500、400、300、200、150、100、50个或更少的核苷酸的多核苷酸的自接合。在一些实施方案中,偏向于长度为50-5000个核苷酸、100-2500个核苷酸或150-500个核苷酸的片段,以使得环化多核苷酸的平均长度落入各自的范围内。在一些实施方案中,80%或更多的环化片段的长度为50-500个核苷酸,例如长度为50-200个核苷酸。可以优化的反应条件包括分配给接合反应的时间长度、各种试剂的浓度和待接合的多核苷酸的浓度。在一些实施方案中,环化反应保持在环化前存在于样品中的片段长度的分布。例如,环化前样品中的片段长度以及环化多核苷酸的平均值、中值、众数(mode)和标准偏差中的一个或多个彼此在75%、80%、90%、95%或更高的百分比以内。

可以使用一个或多个衔接子寡核苷酸,使得样品中多核苷酸的5’端和3’端通过一个或多个间插衔接子寡核苷酸接合形成环状多核苷酸,而不是优先形成自接合环化产物。例如,多核苷酸的5’端可以接合至衔接子的3’端,而同一衔接子的5’端可以接合至同一多核苷酸的3’端。衔接子寡核苷酸包括具有某种序列的任意寡核苷酸,该序列的至少一部分是已知的,它能够接合至样品多核苷酸。衔接子寡核苷酸可包含DNA、RNA、核苷酸类似物、非规范核苷酸、标记的核苷酸、修饰的核苷酸或其组合。衔接子寡核苷酸可以是单链的、双链的或部分双链体。通常,部分双链体衔接子包含一个或多个单链区和一个或多个双链区。双链衔接子可包含彼此杂交的两个单独的寡核苷酸(也称为“寡核苷酸双链体”),并且杂交可留下一个或多个平端、一个或多个3’突出端、一个或多个5’突出端、一个或多个由错配的和/或未配对的核苷酸所导致的凸起,或其任意组合。当衔接子的两个杂交区被非杂交区彼此隔开时,会产生“气泡”结构。不同种类的衔接子,例如具有不同序列的衔接子,可以组合使用。不同的衔接子可以在顺序的反应中或同时地接合至样品多核苷酸。在一些实施方案中,将相同的衔接子添加至靶多核苷酸的两端。例如,可以将第一和第二衔接子添加至同一反应中。可以在与样品多核苷酸组合之前操作衔接子。例如,可以添加或去除末端磷酸。

在使用衔接子寡核苷酸的情况下,衔接子寡核苷酸可包含多种序列元件中的一种或多种,包括但不限于一个或多个扩增引物退火序列或其互补序列、一个或多个测序引物退火序列或其互补序列、一个或多个条形码序列、一个或多个在多个不同衔接子或不同衔接子的子集之间共有的共同序列、一个或多个限制酶识别位点、一个或多个与一个或多个靶多核苷酸突出端互补的突出端、一个或多个探针结合位点(例如,用于附接至测序平台,如用于大规模平行测序的流动池,如Illumina,Inc.开发的流动池)、一个或多个随机的或接近随机的序列(例如,在一个或多个位置处从一组两个或更多个不同核苷酸中随机选择的一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个均呈现在包含随机序列的一组衔接子中),及其组合。在一些情况下,可以使用衔接子纯化这些含有衔接子的环,例如通过使用以包含衔接子的互补序列的寡核苷酸涂覆的珠子(为了易于处理,特别是磁珠),该珠子可以通过与之杂交而“捕获”具有正确衔接子的闭合环,洗掉那些不包含衔接子和任何未连接的组分的环,然后从珠子上释放所捕获的环。另外,在一些情况下,杂交的捕获探针与目标环的复合物可直接用来生成多联体,例如通过直接滚环扩增(RCA)。在一些实施方案中,环中的衔接子还可用作测序引物。两个或更多个序列元件可以是彼此不相邻的(例如被一个或多个核苷酸隔开)、彼此相邻的、部分重叠的或完全重叠的。例如,扩增引物退火序列还可充当测序引物退火序列。序列元件可位于或靠近3’端,位于或靠近5’端,或在衔接子寡核苷酸的内部。序列元件可以是任何合适的长度,例如约为或少于约3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或更多个核苷酸的长度。衔接子寡核苷酸可具有任何合适的长度,至少足以容纳其所包含的一个或多个序列元件。在一些实施方案中,衔接子的长度约为或少于约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200个或更多个核苷酸。在一些实施方案中,衔接子寡核苷酸的长度在约12至40个核苷酸的范围内,例如长度为约15至35个核苷酸。

在一些实施方案中,与来自一个样品的片段化多核苷酸接合的衔接子寡核苷酸包含一个或多个所有衔接子寡核苷酸所共有的序列和对于与该特定样品的多核苷酸接合的衔接子而言独特的条形码,以使得该条形码序列可用来区分来源于一个样品或衔接子接合反应的多核苷酸与来源于另一个样品或衔接子接合反应的多核苷酸。在一些实施方案中,衔接子寡核苷酸包含与一个或多个靶多核苷酸突出端互补的5’突出端、3’突出端或此两者。互补突出端的长度可以是一个或多个核苷酸,包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个核苷酸的长度。互补突出端可包含固定的序列。衔接子寡核苷酸的互补突出端可包含一个或多个核苷酸的随机序列,以使得在一个或多个位置处从一组两个或更多个不同核苷酸中随机选择一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个都呈现在包含该随机序列的一组具有互补突出端的衔接子中。在一些实施方案中,衔接子突出端与通过限制性内切核酸酶消化产生的靶多核苷酸突出端互补。在一些实施方案中,衔接子突出端由腺嘌呤或胸腺嘧啶组成。

多种环化多核苷酸的方法是可用的。在一些实施方案中,环化包括酶促反应,如使用连接酶(例如RNA或DNA连接酶)。多种连接酶是可用的,包括但不限于CircligaseTM(Epicentre;Madison,WI)、RNA连接酶、T4 RNA连接酶1(ssRNA连接酶,其作用于DNA和RNA两者)。另外,如果不存在dsDNA模板,T4 DNA连接酶也可以连接ssDNA,尽管这通常是缓慢的反应。连接酶的其他非限制性实例包括:NAD-依赖性连接酶,包括Taq DNA连接酶、丝状栖热菌(Thermus filiformis)DNA连接酶、大肠杆菌(E.coli)DNA连接酶、Tth DNA连接酶、水管致黑栖热菌(Thermus scotoductus)DNA连接酶(I和II)、热稳定的连接酶、Ampligase热稳定的DNA连接酶、VanC-型连接酶、9°N DNA连接酶、Tsp DNA连接酶和通过生物勘探发现的新型连接酶;ATP依赖性连接酶,包括T4 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、Pfu DNA连接酶、DNA连接酶1、DNA连接酶III、DNA连接酶IV和通过生物勘探发现的新型连接酶;以及野生型、突变同工型,及其遗传工程变体。当需要自接合时,可调节多核苷酸和酶的浓度以促进分子内环而非分子间结构的形成。反应温度和时间也可调整。在一些实施方案中,使用60℃来促进分子内环的形成。在一些实施方案中,反应时间为12-16小时。反应条件可以是所选择的酶的制造商所规定的条件。在一些实施方案中,可以包括外切核酸酶步骤,以在环化反应后消化任何未连接的核酸。即,闭环不含游离的5’或3'端,因此5’或3'外切核酸酶的引入不会消化闭环,但会消化未连接的组分。这尤其可用于多路系统中。

图2示出了环化多核苷酸的方法的三个非限制性实例。在顶部,多核苷酸在不存在衔接子的情况下环化,而中间的方案描绘了衔接子的使用,而底部的方案使用了两种衔接子。当使用两种衔接子时,一种可以接合到多核苷酸的5’端,而第二衔接子可以接合到同一多核苷酸的3’端。在一些实施方案中,衔接子连接可包括使用两种不同的衔接子以及与两种衔接子互补以促进连接的“夹板”核酸。也可以使用叉形或“Y”形衔接子。在使用两种衔接子的情况下,由于自退火,在后续步骤中可以除去两端具有相同衔接子的多核苷酸。

图3A和图3B示出了多核苷酸(如单链DNA)环化的其他非限制性示例方法。衔接子可以不对称地添加到多核苷酸的5’或3’端。如图3A所示,单链DNA(ssDNA)在3’端具有游离羟基,并且衔接子具有封闭的3’端,使得在连接酶的存在下,优选的反应将ssDNA的3’端与衔接子的5’端接合。在该实施方案中,在分子内连接形成环之前,使用诸如聚乙二醇(PEG)等试剂来驱动单个ssDNA片段和单个衔接子的分子间连接可能是有用的。也可以实现相反的末端顺序(封闭的3’,游离的5’等)。一旦完成线性连接,即可以用酶处理经连接的段,以除去封闭部分,例如通过使用激酶或其他合适的酶或化学法。一旦除去封闭部分,诸如CircLigase等环化酶的添加即允许发生分子内反应以形成环化的多核苷酸。如图3B所示,通过使用一条链具有封闭5’或3’端的双链衔接子,可以形成双链结构,该结构在连接后产生具有切口的双链片段。然后可以分离这两条链,除去封闭部分,并对单链片段进行环化以形成环化的多核苷酸。

在一些实施方案中,使用分子钳将多核苷酸(例如单链DNA)的两个末端靠在一起,以增强分子内环化的速率。图4示出了一个这样的过程的示例说明。这可以使用或不使用衔接子来完成。在平均多核苷酸片段长度大于约100个核苷酸的情况下,分子钳的使用可能特别有用。在一些实施方案中,分子钳探针包含三个结构域:第一结构域、间插结构域和第二结构域。第一和第二结构域将通过序列互补性与靶多核苷酸中的相应序列杂交。分子钳探针的间插结构域不与靶序列显著杂交。因此,分子钳与靶多核苷酸的杂交使靶序列的两端更为接近,这有利于在环化酶的存在下靶序列的分子内环化。在一些实施方案中,这还有额外的用途,因为分子钳还可充当扩增引物。

环化后,反应产物可在扩增或测序之前进行纯化,以提高可参与后续步骤的环化多核苷酸的相对浓度或纯度(例如,通过环状多核苷酸的分离或反应中一种或多种其他分子的去除)。例如,可处理环化反应或其组分,以去除单链(未环化的)多核苷酸,如通过用外切核酸酶处理。作为进一步的实例,环化反应或其部分可进行大小排阻色谱法,借此保留及丢弃小试剂(例如未反应的衔接子),或在单独的体积中保留并释放环化产物。多种用于清理连接反应的试剂盒是可用的,例如由Zymo Reaserch制造的Zymo寡核苷酸纯化试剂盒所提供的试剂盒。在一些实施方案中,纯化包括用于去除或降解在环化反应中使用的连接酶和/或将环化的多核苷酸从该连接酶中纯化的处理。在一些实施方案中,降解连接酶的处理包括用蛋白酶如蛋白酶K进行处理。蛋白酶K处理可遵循制造商方案或标准方案(例如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012)中提供的)。蛋白酶处理之后还可进行提取和沉淀。在一个实例中,环化的多核苷酸如下纯化:在0.1%SDS和20mM EDTA的存在下进行蛋白酶K(Qiagen)处理,用1:1苯酚/氯仿和氯仿提取,并用乙醇或异丙醇沉淀。在一些实施方案中,沉淀在乙醇中进行。

在一些情况下,可以在根据本文提供的方法进行数字聚合酶链反应(dPCR)之前,对环状多核苷酸进行扩增反应(例如,预扩增)。通常,“扩增”是指由靶多核苷酸或其部分形成一个或多个拷贝的过程。有多种扩增多核苷酸(例如DNA和/或RNA)的方法是可获得的。扩增可以是线性的、指数式的,或在多阶段扩增过程中既涉及线性阶段又涉及指数阶段。扩增方法可涉及温度的变化,如热变性步骤,或者可以是不需要热变性的等温过程。聚合酶链反应(PCR)采用多个循环的变性、引物对与相反链的退火以及引物延伸,以使靶序列的拷贝数呈指数式增加。退火的核酸链的变性可以通过施加热、提高局部金属离子浓度(例如,美国专利6,277,605)、超声辐射(例如,WO/2000/049176)、施加电压(例如,美国专利5,527,670、美国专利6,033,850、美国专利5,939,291和美国专利6,333,157)和与结合到磁响应性材料上的引物相组合地施加电磁场(例如,美国专利5,545,540)来实现。在被称为RT-PCR的变化形式中,使用逆转录酶(RT)从RNA制备互补DNA(cDNA),然后通过PCR扩增cDNA,以产生多拷贝的DNA(例如美国专利5,322,770和美国专利5,310,652)。等温扩增方法的一个实例是链置换扩增,通常称为SDA,其使用以下过程的循环:引物序列对与靶序列的相反链的退火,在dNTP存在下的引物延伸以产生双链体半硫代磷酸化的引物延伸产物,内切核酸酶介导的半修饰限制性内切核酸酶识别位点的切口形成,以及聚合酶介导的从切口3’端的引物延伸以置换已存在的链,并产生用于下一轮引物退火、切口形成和链置换的链,从而导致产物的几何扩增(例如美国专利5,270,184和美国专利5,455,166)。嗜热SDA(tSDA)在基本相同的方法中在更高的温度下使用嗜热内切核酸酶和聚合酶(欧洲专利0 684 315)。其他扩增方法包括滚环扩增(RCA)(例如Lizardi,“Rolling Circle Replication Reporter Systems”,美国专利5,854,033);解旋酶依赖性扩增(HDA)(例如,Kong等人,“Helicase DependentAmplification Nucleic Acids”,公开号为US 2004-0058378A1的美国专利申请);和环介导的等温扩增(LAMP)(例如Notomi等人,“Process for Synthesizing Nucleic Acid”,美国专利6,410,278)。在一些情况下,等温扩增采用由RNA聚合酶从启动子序列开始的转录,诸如可并入寡核苷酸引物中。基于转录的扩增方法包括基于核酸序列的扩增,也称为NASBA(例如美国专利5,130,238);依赖于使用RNA复制酶(通常称为Qβ复制酶)扩增探针分子本身的方法(例如,Lizardi,P.等人(1988)BioTechnol.6,1197-1202);自动维持序列复制(例如,Guatelli,J.等人(1990)Proc.Natl.Acad.Sci.USA 87,1874-1878;Landgren(1993)Trends in Genetics 9,199-202;和HELEN H.LEE等人,NUCLEIC ACID AMPLIFICATIONTECHNOLOGIES(1997));以及生成额外的转录模板的方法(例如,美国专利5,480,784和美国专利5,399,491)。另外的等温核酸扩增方法包括使用含有非规范核苷酸(例如尿嘧啶或RNA核苷酸)的引物与在非规范核苷酸处切割核酸的酶(例如DNA糖基化酶或RNA酶H)相组合,以暴露针对额外的引物的结合位点(例如,美国专利6,251,639、美国专利6,946,251和美国专利7,824,890)。等温扩增过程可以是线性的或指数式的。

在一些实施方案中,扩增包括滚环扩增(RCA)。典型的RCA反应混合物包含一种或多种引物、聚合酶和dNTP,并且产生多联体。一般来说,RCA反应中的聚合酶是具有链置换活性的聚合酶。多种这样的聚合酶是可用的,其非限制性实例包括外切核酸酶-DNA聚合酶I大(Klenow)片段、Phi29 DNA聚合酶、Taq DNA聚合酶等。通常,多联体是多核苷酸扩增产物,其包含来自模板多核苷酸的两个或更多个拷贝的靶序列(例如,大约或超过约2、3、4、5、6、7、8、9、10个或更多个拷贝的靶序列;在一些实施方案中,大约或超过约2个拷贝)。扩增引物可具有任何合适的长度,诸如大约或至少约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100个或更多个核苷酸,其任何部分或全部可与该引物所杂交的相应靶序列互补(例如,大约或至少约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸)。图5A、图5B和图5C描绘了合适的引物的三个非限制性实例。图5A显示了不使用衔接子且使用靶标特异性引物,其可用于检测特定靶序列内是否存在序列变体。在一些实施方案中,在同一反应中使用针对多个靶标的多个靶标特异性引物。例如,可以在一个扩增反应中使用针对大约或至少约10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000个或更多个不同靶序列的靶标特异性引物,以便平行地扩增相应数目的靶序列(如果存在的话)。多个靶序列可以对应于同一基因的不同部分、不同基因或非基因序列。当多个引物以单一基因中的多个靶序列为目标时,引物可以沿着基因序列间隔(例如,间隔开大约或至少约50个核苷酸,每50-150个核苷酸,或每50-100个核苷酸),以便覆盖靶基因的全部或指定部分。图5C示出了与衔接子序列杂交的引物(在一些情况下可以是衔接子寡核苷酸本身)的使用。

图5B示出了通过随机引物进行扩增的实例。通常,随机引物包含一个或多个随机或近随机的序列(例如,在一个或多个位置处从一组两个或更多个不同核苷酸中随机选择的一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个均呈现在包含随机序列的一组衔接子中)。通过这种方法,多核苷酸(例如,所有或基本上所有环化的多核苷酸)可以以序列非特异性的方式扩增。这样的程序可被称为“全基因组扩增”(WGA);然而,典型的WGA方案(其不涉及环化步骤)不能有效扩增短多核苷酸,如本公开设想的多核苷酸片段。关于WGA程序的进一步说明性讨论,参见例如Li等人(2006)J Mol.Diagn.8(1):22-30。

在dPCR之前扩增环化的多核苷酸的情况下,可以在未富集的情况下直接使扩增产物经历dPCR,或者在一个或多个富集步骤之后使其经历dPCR。富集可包括纯化一种或多种反应组分,例如通过保留扩增产物或除去一种或多种试剂。例如,扩增产物可以通过与附着于基底的多个探针杂交,然后例如通过洗涤步骤释放捕获的多核苷酸来纯化。或者,扩增产物可以用结合对中的成员来标记,然后与附着于基底的结合对中的另一成员结合,并洗涤,以释放扩增产物。可能的基底包括但不限于玻璃和改性或功能化玻璃、塑料(包括丙烯酸类塑料、聚苯乙烯,和苯乙烯与其他材料的共聚物,聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM等)、多糖、尼龙或硝酸纤维素、陶瓷、树脂、二氧化硅或基于二氧化硅的材料,包括硅和改性硅、碳、金属、无机玻璃、塑料、光纤束和各种其他聚合物。在一些实施方案中,基底是珠子或其他小的离散颗粒的形式,它们可以是磁珠或顺磁珠,以便通过施加磁场来促进分离。通常,“结合对”是指第一和第二部分之一,其中第一和第二部分对彼此具有特异性结合亲和力。合适的结合对包括但不限于抗原/抗体(例如,洋地黄毒苷/抗洋地黄毒苷、二硝基苯基(DNP)/抗DNP、丹磺酰基-X-抗丹磺酰基、荧光素/抗荧光素、荧光黄/抗荧光黄,和罗丹明/抗罗丹明);生物素/抗生物素蛋白(或生物素/链霉亲和素);钙调蛋白结合蛋白(CBP)/钙调蛋白;激素/激素受体;凝集素/碳水化合物;肽/细胞膜受体;蛋白A/抗体;半抗原/抗半抗原;酶/辅因子;以及酶/底物。

在一些实施方案中,环化多核苷酸扩增后的富集包括一个或多个额外的扩增反应。在一些实施方案中,富集包括扩增在扩增反应混合物中包含序列A和序列B(以5’至3’方向取向)的靶序列,该混合物包含(a)扩增的多核苷酸;(b)包含序列A’的第一引物,其中第一引物通过序列A与序列A’之间的序列互补性与靶序列的序列A特异性杂交;(c)包含序列B的第二引物,其中第二引物通过B与B’之间的序列互补性与包含靶序列的互补序列的互补多核苷酸中存在的序列B’特异性杂交;以及(d)延伸第一引物和第二引物以产生扩增的多核苷酸的聚合酶;其中靶序列中序列A的5’端与序列B的3’端之间的距离为75nt或更小。图6示出了在单重复(除非为环状,否则通常不会被扩增)和包含多个拷贝的靶序列的多联体的情况下,第一和第二引物相对于靶序列的示例性排列。考虑到引物相对于靶序列单体的取向,该排列可以被称为“背对背”(B2B)或“倒置”引物。用B2B引物扩增有助于富集环状和/或多联体扩增产物。此外,这种取向与相对较小的足迹(由一对引物跨越的总距离)组合允许在靶序列周围的更多种片段化事件的扩增,因为与在典型的扩增反应中发现的引物排列(彼此面对,跨越靶序列)相比,接合在引物之间发生的可能性更低。在一些实施方案中,序列A的5’端与序列B的3’端之间的距离为约或小于约200、150、100、75、50、40、30、25、20、15个或更少的核苷酸。在一些实施方案中,序列A是序列B的互补序列。在一些实施方案中,针对多个不同靶序列的多对B2B引物在同一反应中使用,以平行扩增多个不同的靶序列(例如,大约或至少约10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000个或更多不同的靶序列)。引物可具有任何合适的长度,如本文其他地方所述。扩增可以包括在适当条件下的任何合适的扩增反应,如本文所述的扩增反应。在一些实施方案中,扩增是聚合酶链反应。

在一些实施方案中,B2B引物包含至少两个序列元件:通过序列互补性与靶序列杂交的第一元件,和在第一元件进行杂交的第一杂交温度下的第一扩增阶段期间不与靶序列杂交的5’“尾”(例如,由于尾与紧邻第一元件所结合的位置的3'侧的靶序列部分之间缺少序列互补性)。例如,第一引物包含在序列A’的5’侧的序列C,第二引物包含在序列B的5’侧的序列D,并且在第一杂交温度下的第一扩增阶段期间,序列C和序列D都不与多个多联体杂交。在使用这类有尾引物的一些实施方案中,扩增可包括第一阶段和第二阶段;第一阶段包括在第一温度下的杂交步骤,在此期间第一和第二引物与多联体(或环化的多核苷酸)杂交,以及引物延伸;第二阶段包括在高于第一温度的第二温度下的杂交步骤,在此期间第一和第二引物与包含延伸的第一或第二引物或其互补序列的扩增产物杂交,以及引物延伸。较高的温度有利于引物延伸产物中引物的第一元件与尾元件之间的杂交,而不利于引物中的仅第一元件与多联体内部靶序列之间的杂交形成的较短片段。因此,可以使用两阶段扩增来减少可能对短扩增产物有利的程度,从而保持相对较高比例的具有两个或更多个靶序列拷贝的扩增产物。例如,在5个循环(例如,至少5、6、7、8、9、10、15、20个或更多个循环)的第二温度下的杂交和引物延伸后,反应混合物中至少5%(例如至少5%、6%、7%、8%、9%、10%、15%、20%、25%、30%或更多)的扩增多核苷酸包含两个或更多个拷贝的靶序列。根据这种两阶段有尾B2B引物扩增过程的实施方案的图示在图7A、图7B、图7C和图7D中呈现。

在一些实施方案中,富集包括在倾向于增加来自多联体的扩增子长度的条件下的扩增。例如,可以降低引物浓度,使得不是每个引发位点都与引物杂交,从而延长PCR产物。类似地,在循环过程中缩短引物杂交时间也会使更少的引物杂交,从而增加平均PCR扩增子大小。此外,增加循环的温度和/或延伸时间将类似地增加PCR扩增子的平均长度。可以使用这些技术的任何组合。

在一些实施方案中,处理扩增产物,以基于大小过滤所得的扩增子,从而减少和/或消除包含多联体的混合物中的单体数目。这可以使用多种可用的技术来完成,包括但不限于从凝胶上切下片段和凝胶过滤(例如,以富集长度大于约300、400、500个或更多个核苷酸的片段);以及通过微调结合缓冲液浓度用SPRI珠子(Agencourt AMPure XP)进行大小选择。例如,在与DNA片段混合过程中使用0.6x结合缓冲液可用于优先结合大于约500个碱基对(bp)的DNA片段。

在一些方面,所述方法可以进一步包括将所述多个多联体分配到多个分区中。“分配”通常是指将包含多个分子的混合物在空间上分离到至少一个分区中的过程。如本文所用的“分区”可指用于在空间上分离多个分子的任何容器或器皿。在一些情况下,分区可以是孔,例如微孔板上的孔。在其他情况下,分区可以是小液滴,例如,在小液滴数字PCR(ddPCR)方法中使用的小液滴。小液滴可包括油包水乳液小液滴或水包油乳液小液滴。可以根据本文提供的方法使用的基于小液滴的PCR系统的非限制性实例包括可从Bio-Rad、Raindance Technologies等商购的那些系统。通常,分配后单独分区中存在的单独多联体的数目取决于混合物中多联体的浓度,以及混合物被分配至的分区的数目。在一些情况下,该方法包括将多个多联体分配到多个分区中,使得任何单独分区平均包含不超过一个具有靶序列的多联体。在这样的情况下,单独分区可包括包含多个序列重复的多联体,其中所述多个序列重复中的每一个都包含靶序列。因此,单独分区可包含在同一多联体分子上以串联重复排列的多个靶序列。在一些情况下,单独分区还可以包含一个或多个不包含靶序列的多联体。在一些情况下,单独分区包含平均不超过10、9、8、7、6、5、4、3、2或1个多联体。在一些情况下,多个单独分区可包含零个多联体。

在一些方面,单独分区可包含一个或多个用于检测序列变体的存在或不存在的探针。在一些情况下,所述一个或多个探针包含与野生型靶序列(即,缺乏序列变体的靶序列)结合的野生型探针。野生型探针可包含与野生型靶序列互补并能够与其杂交的寡核苷酸序列。在一些情况下,野生型探针可包含与靶序列的区域杂交的寡核苷酸序列,该区域在所研究的核苷酸位置处包含野生型核苷酸。在一些情况下,所述一个或多个探针包含与突变靶序列(即,含有序列变体的靶序列)结合的突变探针。突变探针可包含与突变靶序列互补并能够与其杂交的寡核苷酸序列。在一些情况下,野生型探针和突变探针可以在严格条件下与靶序列杂交,使得野生型探针将仅结合野生型靶序列,而突变探针仅结合突变探针。在一些情况下,单独分区可包含野生型探针、突变探针或两者。

在一些方面,野生型探针包含当存在野生型靶序列时产生第一信号的第一可检测标记。在一些方面,突变探针包含当存在突变靶序列时产生第二信号的第二可检测标记。在一些情况下,第一可检测标记和第二可检测标记是不同的,使得它们产生可以被区分的不同信号。第一可检测标记、第二可检测标记或两者可以是任何类型的可检测标记,包括但不限于荧光团、酶、猝灭剂、酶抑制剂、放射性标记、结合对的一个成员或其任意组合。在一些情况下,第一和/或第二可检测标记是荧光分子,例如荧光团。荧光团的非限制性实例可包括:荧光素(FITC)和荧光素衍生物,如FAM、VIC和JOE,5-(2'-氨基乙基)氨基萘-1-磺酸(EDANS)、香豆素和香豆素衍生物、荧光黄、NED、德克萨斯红、四甲基罗丹明、四氯-6-羧基氟乙烯、5-羧基罗丹明、花青染料、Alexa Fluor350、Alexa Fluor 647、Oregon Green、AlexaFluor 405、Alexa Fluor 680、Alexa Fluor 488、Alexa Fluor 750、Cy3、Alexa Fluor532、Pacific Blue、Pacific Orange、Alexa Fluor 546、四甲基罗丹明(TRITC)、AlexaFluor555、BODIPY FL、Texas Red、Alexa Fluor 568、Pacific Green、Cy5、Alexa Fluor594、Super Bright 436、Super Bright 600、Super Bright 645、Super Bright 702、DAPI、SYTOX Green、SYTO 9、TO-PRO-3、碘化丙锭、Qdot525、Qdot 565、Qdot 605、Qdot 655、Qdot705、Qdot 800、R-藻红蛋白(R-PE)、别藻蓝蛋白(APC)、青色荧光蛋白(CFP)及其衍生物、绿色荧光蛋白(GFP)及其衍生物、红色荧光蛋白(RFP)及其衍生物,等等。本文设想了激发波长在约300nm至约900nm之间的任何荧光团。

在一些方面,所述方法可以进一步包括在多个分区之上或之内进行反应。在一些情况下,所述方法可以进一步包括在多个分区上进行PCR测定。在这类情况下,野生型探针和突变探针可以是探针。PCR测定和探针是本领域已知的。野生型探针和突变探针的5'端可以与不同的荧光标记(例如,VIC、FAM)缀合。另外,野生型探针和突变探针的3'端可以与猝灭剂缀合。当紧邻荧光标记时(例如,当猝灭剂和荧光标记缀合至探针的相对末端时),猝灭剂可以猝灭来自荧光标记的信号。单独分区可以进一步包含与多联体上位于靶序列侧翼的序列杂交的正向和反向引物。在一些情况下,正向和反向引物可以是未标记的。多个分区可以在使得正向引物、反向引物以及突变和/或野生型探针与它们的互补序列(如果存在于多联体上)杂交的条件下孵育。在一些情况下,所述方法进一步包括在聚合酶的存在下并在一定条件下孵育所述多个分区,使得聚合酶通过沿着模板分子延伸正向和反向引物来合成新的寡核苷酸链。聚合酶可具有内源性5'核酸酶活性,使得当聚合酶到达标记的探针时,它可以切割探针,从而分离荧光标记和猝灭剂。然后,荧光标记可以生成可被检测到的信号。在一些情况下,在所述多个分区上进行多个循环的Taqman PCR,使得对于每个循环,荧光信号的强度与合成的扩增子的量成比例地增加。

在一些情况下,所述方法可以进一步包括在所述多个分区上进行除PCR测定之外的测定。非基于的方法可以包括但不限于化学检测、基于的检测、基于FAM的检测等。

在进一步的方面,所述方法可包括检测来自单独分区的第一信号和第二信号的水平。该检测可包括用于检测信号的任何方法,并且应该基于探针上存在的可检测标记的类型来选择。在使用荧光探针的情况下,该方法可包括用荧光光源(例如,发光二极管(LED))照射所述多个分区,并测量由其生成的光信号。应当理解,由光源提供的光的波长应该基于可检测标记的激发波长来选择,并且可由本领域技术人员容易地选择。

在进一步的方面,所述方法可包括鉴定序列变体的存在或不存在。在一些情况下,鉴定序列变体的存在或不存在可包括测量与野生型序列的存在相对应的第一信号的强度水平,以及与突变序列相对应的第二信号的强度水平。该方法可以进一步包括将第一信号的强度水平和第二信号的强度水平与阈值水平进行比较。在一些情况下,阈值水平表示截断值,超过该阈值水平的信号被确定为存在或为阳性,而低于该阈值水平的信号被确定为不存在或为阴性。在一些情况下,阈值水平由测定的使用者来确定。在一些情况下,阈值水平指示靶序列的一个拷贝的存在。换句话说,超过阈值水平的信号可以被确定为包含靶序列的至少一个拷贝,而低于阈值水平的信号可以被确定为包含靶序列的少于一个拷贝。

在一些情况下,仅当所述突变信号的水平超过阈值水平并且所述第一信号的水平低于阈值水平时,才将序列变体鉴定为存在于所述靶序列中。例如,如果序列变体存在于原始样品中,它将在单个多联体分子中多次呈现。在这样的情况下,突变探针可以与含有序列变体的靶序列结合,但是野生型探针可能无法与靶序列结合。因此,包含序列变体的单独分区可从突变探针生成信号,但不从野生型探针生成信号。

在一些情况下,当野生型信号的水平超过阈值水平并且所述突变体信号的水平低于野生型水平时,将序列变体鉴定为不存在(即,靶序列是野生型序列)。例如,如果原始多核苷酸分子中不存在序列变体,则单个多联体分子的每个序列重复中都可能不存在该序列变体。在这样的情况下,野生型探针可以与缺乏序列变体的靶序列结合,但是突变探针可能无法与靶序列结合。因此,包含野生型序列的单独分区可从野生型探针生成信号,但不从突变探针生成信号。

在一些情况下,所述方法可用来鉴定假阳性。在一个这样的实施方案中,当野生型信号的水平超过阈值水平并且突变体信号的水平也超过阈值水平时,鉴定为假阳性。例如,可能在例如扩增期间将随机错误引入靶序列中。在一些情况下,靶序列可以是野生型序列,但是在滚环扩增过程中可能引入错误,该错误在多联体的串联重复的至少一个中产生突变。在这样的情况下,单独分区可包括包含靶序列的串联重复的多联体分子,其中大多数重复包含野生型序列,但是至少一个重复包含序列变体(例如,由于随机错误)。在这样的情况下,野生型探针可以与野生型靶序列结合,而突变探针可以与突变靶序列结合,从而在同一分区中产生野生型信号和突变体信号。在一些方面,当野生型信号和突变体信号均存在时,所述方法可以将这样的分区鉴定为包含假阳性。

在进一步的方面,所述方法可包括基于上述鉴定步骤输出结果。例如,所述方法可包括生成显示或报告鉴定步骤的结果的报告。在一些情况下,被鉴定为包含假阳性的分区可以从报告中排除。在其他情况下,可以将被鉴定为包含假阳性的分区标记或报告为包含假阳性。

在另一方面,本公开提供了一种减少数字聚合酶链反应中的错误的方法。在一些情况下,该方法可以对包含少于约50ng多核苷酸的核酸样品进行,并且进一步包括:a)使所述核酸样品中的单独多核苷酸环化,以生成多个环化的多核苷酸;b)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复;c)将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,其中所述多个分区中的单独分区含有第一探针和第二探针中的至少一个,其中所述第一探针与缺乏所述序列变体的靶序列结合并产生第一信号,并且所述第二探针与含有所述序列变体的靶序列结合并产生第二信号;d)检测来自所述单独分区的所述第一信号和所述第二信号;以及e)当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平时,鉴定为假阳性。

在一些情况下,所述方法可能适用于具有低起始量的多核苷酸的样品。在这样的情况下,多核苷酸的起始量通常可能太低而不能用于数字PCR测定中,并且在进行数字PCR测定之前可能需要一个或多个扩增步骤。然而,这样的扩增步骤可能容易出错,从而增加数字PCR测定所报告的假阳性的数目。在一些情况下,所述方法可减少由数字PCR测定报告的假阳性的数目。例如,所述方法可将由数字PCR测定所报告的假阳性的数目减少至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%或大于约50%。

样品中多核苷酸的起始量可能很少。在一些实施方案中,起始多核苷酸的量低于50ng,如低于45ng、40ng、35ng、30ng、25ng、20ng、15ng、10ng、5ng、4ng、3ng、2ng、1ng、0.5ng、0.1ng或更低。在一些实施方案中,起始多核苷酸的量在0.1-100ng的范围内,如1-75ng、5-50ng或10-20ng。

多核苷酸可以来自任何合适的样品,如本文关于本公开的多个方面描述的样品。来自样品的多核苷酸可以是多个多核苷酸中的任意多核苷酸,包括但不限于DNA、RNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、信使RNA(mRNA)、无细胞DNA(cfDNA)、循环肿瘤DNA(ctDNA),其中任意一种的片段,或其中任意两种或更多种的组合。在一些实施方案中,样品包含DNA。在一些实施方案中,多核苷酸在获得时是单链的,或者通过处理(例如变性)成为单链的。本文描述了合适的多核苷酸的其他实例,如关于本公开的多个方面中的任一方面所述。在一些实施方案中,在不进行提取步骤和/或不进行纯化步骤的情况下,使多核苷酸经历后续步骤(例如环化和扩增)。例如,可以在不进行提取步骤的情况下处理流体样品以除去细胞,以产生纯化的液体样品和细胞样品,随后从纯化的流体样品中分离DNA。有多种分离多核苷酸的程序是可用的,例如通过沉淀,或者与基底非特异性结合并随后洗涤该基底以释放结合的多核苷酸。在不进行细胞提取步骤的情况下从样品中分离多核苷酸时,多核苷酸将主要是细胞外或“无细胞”多核苷酸,其可以对应于死亡或受损的细胞。这类细胞的特性可用来表征其所源自的细胞或细胞群体,如在微生物群落中。如果处理样品以提取多核苷酸,例如从样品中的细胞提取多核苷酸,有多种提取方法可用,本文提供了其实例(例如关于本公开的多个方面中的任一方面所述)。

在一方面,本公开提供了一种用于检测序列变体的系统。在一些实施方案中,系统可包括:a)计算机,其被配置用于接收关于对样品进行检测反应的用户请求;b)扩增系统,其响应于所述用户请求对所述样品或其部分进行核酸扩增反应,其中该扩增反应包括:(i)使所述样品的单独多核苷酸环化以形成多个环化的多核苷酸;以及(ii)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复;c)分配系统,其将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体;以及d)检测系统,其检测来自单独分区的第一信号的水平和第二信号的水平,其中当第一探针与缺乏所述序列变体的靶序列结合时生成所述第一信号,并且当第二探针与含有所述序列变体的靶序列结合时生成所述第二信号;以及e)报告生成器,其向接收者发送报告,其中所述报告包含所述序列变体的检测结果。在一些实施方案中,接收者是用户。图8示出了可用于本公开的方法的系统的非限制性实例。

系统中使用的计算机可包含一个或多个处理器。处理器可与一个或多个控制器、计算单元和/或计算机系统的其他单元相关联,或者根据需要植入到固件中。如果在软件中实现,则例程可以存储在任何计算机可读存储器如RAM、ROM、闪速存储器、磁盘、光盘或其他合适的存储介质中。同样,该软件可以通过任何已知的传送方法传送到计算设备中,该传送方法包括,例如,通过诸如电话线、因特网、无线连接等通信信道,或经由诸如计算机可读磁盘、闪存驱动器等可移动介质。各个步骤可以作为各个区块、操作、工具、模块或技术来实现,后者又可以以硬件、固件、软件或者硬件、固件和/或软件的任意组合来实现。当以硬件实现时,一些或所有区块、操作、技术等可以在例如定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、可编程逻辑阵列(PLA)等中实现。可以在系统的实施方案中使用客户端-服务器关系数据库架构。客户端-服务器架构是网络架构,其中网络上的每个计算机或进程都是客户端或服务器。服务器计算机通常是用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络流量(网络服务器)的强力计算机。客户端计算机包括用户运行应用程序的PC(个人计算机)或工作站,以及如本文公开的示例输出设备。客户端计算机依赖服务器计算机来获取资源,如文件、设备甚至处理能力。在一些实施方案中,服务器计算机处理所有数据库功能。客户端计算机可具有处理所有前端数据管理的软件,并且还可以接收来自用户的数据输入。

可以将系统配置用于接收关于对样品进行检测反应的用户请求。用户请求可以是直接的或间接的。直接请求的实例包括通过输入设备如键盘、鼠标或触摸屏传输的请求。间接请求的实例包括通过通信介质的传输,如通过因特网(有线或无线)的传输。

所述系统可以进一步包括扩增系统,该扩增系统响应于用户请求,对样品或其部分进行核酸扩增反应。有多种扩增多核苷酸(例如DNA和/或RNA)的方法是可获得的。扩增可以是线性的、指数式的,或在多阶段扩增过程中既涉及线性阶段又涉及指数阶段。扩增方法可涉及温度的变化,如热变性步骤,或者可以是不需要热变性的等温过程。本文描述了合适的扩增过程的非限制性实例,如关于本公开的多个方面中的任一方面所述。在一些实施方案中,扩增包括滚环扩增(RCA)。用于扩增多核苷酸的多种系统是可用的,并且可以基于待进行的扩增反应的类型而不同。例如,对于包含温度变化循环的扩增方法,扩增系统可包括热循环仪。扩增系统可包括实时扩增和检测仪器,如Applied Biosystems、Roche和Strategene制造的系统。在一些实施方案中,扩增反应包括以下步骤:(i)使所述样品的单独多核苷酸环化以形成多个环化的多核苷酸;以及(ii)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复。样品、多核苷酸、引物、聚合酶和其他试剂可以是本文所述的那些,如关于多个方面中的任一方面所述。本文提供了环化过程(例如,使用和不使用衔接子寡核苷酸)、试剂(例如,衔接子的类型、连接酶的使用)、反应条件(例如,有利于自接合)和可选的额外加工(例如,反应后纯化)的非限制性实例,如关于本公开的多个方面中的任一方面所述。可以选择和/或设计系统来执行任何这样的方法。

系统可进一步包括分配系统,该分配系统将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体。分配系统可包括可以将包含多个多核苷酸的混合物分离到单独分区中的任何数目的系统。在一些情况下,分配系统是基于小液滴的分配系统,包括基于微流体的小液滴系统,例如可从Bio-Rad、RaindanceTechnologies、10X Genomics等商购的系统。在一些情况下,分配系统是基于微孔板的分配系统,例如可从Becton、Dickinson and Company(Cellular Research)、Mission Bio、Takara(WaferGen)等商购的系统。

所述系统可进一步包括检测系统,该检测系统检测来自单独分区的第一信号的水平和第二信号的水平。在一些情况下,当第一探针与缺乏序列变体的靶序列结合时生成第一信号,并且当第二探针与含有序列变体的靶序列结合时生成第二信号。该检测系统可包括任何数目的光学配置,包括例如光源(例如,用于照射单独分区的发光二极管(LED))、透镜、滤光器、二向色镜或其任意组合。该检测系统可进一步包括用于检测来自多个分区的光信号的光检测器。

所述系统可进一步包括报告生成器,后者向接收者发送报告,其中该报告包含序列变体的检测结果。例如,报告生成器可以生成鉴定样品中存在序列变体的报告。另外或备选地,该报告可以鉴定样品中不存在序列变体。另外或备选地,该报告可以鉴定由数字PCR测定生成的假阳性。在一些情况下,假阳性可以从报告中排除。在其他情况下,假阳性可以在报告上被标记或标识为假阳性。报告可以实时生成,并随着过程的进展而定期更新。另外或备选地,可以在分析结束时生成报告。该报告可以自动生成,例如当系统完成鉴定序列变体的存在与否的步骤时。在一些实施方案中,该报告响应于来自用户的指令而生成。除了检测序列变体的结果之外,报告还可包含基于一个或多个序列变体的分析。例如,在一个或多个序列变体与特定污染物或表型相关联的情况下,该报告可以包含关于该关联的信息,如存在污染物或表型的可能性,存在的水平,以及可选的基于这些信息的建议(例如,额外的测试、监测或补救措施)。报告可以采用多种形式。可以设想,与本公开相关的数据可以通过这样的网络或连接(或用于传输信息的其他任何合适的手段,包括但不限于邮寄实物报告,如打印的报告)进行传输,以供接收者接收和/或查看。接收者可以是但不限于个体或电子系统(例如,一个或多个计算机,和/或一个或多个服务器)。

在另一方面,本公开提供了一种包含代码的计算机可读介质,该代码在被一个或多个处理器执行时,实现检测序列变体的方法。在一些实施方案中,该实施的方法包括:a)接收关于对样品进行检测反应的用户请求;b)响应于所述用户请求对所述样品或其部分进行核酸扩增反应,其中该扩增反应包括:(i)使所述样品的单独多核苷酸环化以形成多个环化的多核苷酸;以及(ii)扩增所述多个环化的多核苷酸以形成多个多联体,每个多联体包含多个序列重复;c)将所述多个多联体分配到多个分区中,使得单独分区中存在平均不超过一个包含靶序列的多联体,其中所述多个分区中的单独分区含有第一探针和第二探针中的至少一个,其中所述第一探针与缺乏所述序列变体的所述多个序列重复结合并产生第一信号,并且所述第二探针与含有所述序列变体的所述多个序列重复结合并产生第二信号;d)检测来自所述单独分区的所述第一信号和所述第二信号;以及e)仅当所述第二信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第一信号的水平低于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为存在;以及(f)生成报告,该报告包含所述序列变体的检测结果。

在一些实施方案中,所实施的方法进一步包括,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平低于指示靶序列的一个拷贝的阈值水平时,将所述序列变体鉴定为不存在。在一些实施方案中,所实施的方法进一步包括,当所述第一信号的水平超过指示靶序列的一个拷贝的阈值水平并且所述第二信号的水平超过靶序列的一个拷贝的阈值水平时,鉴定为假阳性。

包含计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,如任何计算机中的任何存储设备等,例如可用来实现数据库等。易失性存储介质包括动态存储器,如这样的计算机平台的主存储器。有形传输介质包括同轴电缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(RF)和红外线(IR)数据通信期间生成的那些信号或波。因此,计算机可读介质的常见形式包括,例如:软盘、柔性盘、硬盘、磁带、其他任何磁性介质、CD-ROM、DVD或DVD-ROM、其他任何光学介质、穿孔卡片纸带、其他任何具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、其他任何存储器芯片或匣盒、传输数据或指令的载波、传输这类载波的线缆或链路,或者计算机可以从中读取编程代码和/或数据的其他任何介质。这些计算机可读介质形式中的许多形式可以参与将一个或多个指令的一个或多个序列运载到处理器以供执行。

本计算机可执行代码可以在包含处理器的任何合适的设备上执行,该设备包括服务器、PC或移动设备,如智能手机或平板计算机。任何控制器或计算机任选地包括监视器,该监视器可以是阴极射线管(“CRT”)显示器、平板显示器(例如,有源矩阵液晶显示器、液晶显示器等)或其他监视器。计算机电路通常放置在盒子中,该盒子包含许多集成电路芯片,如微处理器、存储器、接口电路等。该盒子还任选地包含硬盘驱动器、软盘驱动器、高容量可移动驱动器如可写CD-ROM以及其他常见外围元件。输入设备,如键盘、鼠标或触摸敏感屏幕,任选地提供来自用户的输入。计算机可包括用于接收用户指令的适当软件,该指令可以是用户输入成一组参数字段的形式,例如GUI的形式,或者是预编程指令的形式,例如,针对多种不同的具体操作预编程的指令形式。

在本公开的各个方面中的任何方面的一些实施方案中,所述方法、组合物和系统具有治疗应用,例如表征患者样品和任选地诊断受试者的状况。治疗应用还可以包括基于本文所述方法的结果来告知患者可能具有最佳反应的疗法的选择(也称为“诊疗”),以及对有需要的受试者的实际治疗。特别是,本文公开的方法和组合物可用来诊断肿瘤的存在、进展和/或肿瘤转移,尤其是当分析的多核苷酸包含cfDNA、ctDNA或片段化肿瘤DNA或由它们组成时。在一些实施方案中,监测对受试者的治疗功效。例如,通过随时间监测ctDNA,ctDNA的减少可以用作有效治疗的指示,而ctDNA的增加可以促使选择不同的治疗或不同的剂量。其他用途包括评价移植接受者的器官排斥(与移植供体基因组相对应的循环DNA的量的增加被用作移植排斥的早期指标),以及病原体感染如病毒或细菌感染的基因型分型/同种型分型(isotyping)。检测循环胎儿DNA中的序列变体可用来诊断胎儿的状况。

如本文所用的,“治疗”或“处理”或“减轻”或“改善”可互换使用。这些术语是指获得有益的或期望的结果(包括但不限于治疗益处和/或预防益处)的途径。所谓治疗益处是指对治疗中的一种或多种疾病、状况或症状的任何治疗相关的改善或效果。对于预防益处,可将组合物施用于存在发展出特定疾病、状况或症状的风险的受试者,或施用于报告了疾病的一种或多种生理症状的受试者,即使疾病、状况或症状可能尚未表现出来。通常,预防益处包括降低治疗中的一种或多种疾病、状况或症状的发生率和/或减缓其恶化(例如在经治疗群体与未治疗群体之间,或在受试者的治疗状态与未治疗状态之间)。改善治疗结果可包括诊断受试者的状况,以便鉴定受试者是否将受益于采用一种或多种治疗剂的治疗,或其他治疗干预(如手术)。在这样的诊断应用中,相对于未根据本公开的方法进行诊断而分组的患者中的有效性,采用一种或多种治疗剂的总体成功治疗率可以改善(例如,治疗功效的测量值改善至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多)。

术语“受试者”、“个体”和“患者”在本文中可互换使用,是指脊椎动物,优选哺乳动物,更优选人。哺乳动物包括但不限于鼠、猿猴、人、农场动物、竞技动物和宠物。还包括在体内获得或在体外培养的生物实体的组织、细胞及其后代。

术语“治疗剂”、“能够治疗的药剂”或“处理剂”可互换使用,是指在向受试者施用后带来一定的有益效果的分子或化合物。有益效果包括实现确诊;疾病、症状、病症或病理状况减轻;减少或预防疾病、症状、病症或状况的发作;以及通常对抗疾病、症状、病症或病理状况。

在本文所述的各种方法的一些实施方案中,样品来自受试者。受试者可以是任何生物体,其非限制性实例包括植物、动物、真菌、原生生物、无核原生物、病毒、线粒体和叶绿体。样品多核苷酸可以从受试者分离,如细胞样品、组织样品、体液样品或器官样品(或来自其中任何一种的细胞培养物),包括,例如,培养的细胞系、活检物、血液样品、颊拭子或含有细胞的流体样品(例如唾液)。在一些情况下,样品不包含完整细胞,被处理以除去细胞,或在不进行细胞提取步骤的情况下分离多核苷酸(例如分离无细胞多核苷酸,如无细胞DNA)。样品来源的其他实例包括来自血液、尿液、粪便、鼻孔、肺、肠、其他体液或排泄物,由此衍生的物质或其组合的样品。受试者可以是动物,包括但不限于牛、猪、小鼠、大鼠、鸡、猫、狗等,并且通常是哺乳动物,如人。在一些实施方案中,样品包含肿瘤细胞,如来自受试者的肿瘤组织样品。在一些实施方案中,样品是血液样品或其部分(例如血浆或血清)。血清和血浆可能是特别感兴趣的,因为与此类组织中较高恶性细胞死亡率相关的肿瘤DNA的相对富集。样品可以是新鲜样品,或经历一个或多个储存过程的样品(例如石蜡包埋的样品,特别是福尔马林固定、石蜡包埋的(FFPE)样品)。在一些实施方案中,来自单个个体的样品被分成多个单独的样品(例如,2、3、4、5、6、7、8、9、10个或更多个单独的样品),该单独的样品独立地经历本公开的方法,如一式两份、一式三份、一式四份或一式更多份的分析。当样品来自受试者时,参考序列也可以来源于受试者,如来自分析样品的共有序列或来自相同受试者的另一样品或组织的多核苷酸的序列。例如,可以分析血液样品的ctDNA突变,同时分析来自另一个样品(例如颊或皮肤样品)的细胞DNA,以确定参考序列。

可以根据任何合适的方法,在进行或不进行从样品中的细胞中提取的情况下从样品中提取多核苷酸。有多种试剂盒可用于提取多核苷酸,其选择可取决于样品的类型或待分离的核酸的类型。本文提供了提取方法的实例,如关于本文公开的多个方面中的任一方面所述。在一个实例中,样品可以是血液样品,例如在EDTA管(例如BD Vacutainer)中收集的样品。可以通过离心(例如在4℃下以1900xg离心10分钟)将血浆与外周血细胞分离。以该方式在6mL血液样品上进行的血浆分离通常将产生2.5至3mL血浆。可以从血浆样品中提取循环无细胞DNA,如通过使用QIAmp Circulating Nucleic Acid Kit(Qiagene),根据制造商的方案进行提取。然后可以对DNA进行定量(例如,采用高灵敏度DNA试剂盒(Agilent)在Agilent 2100生物分析仪上)。例如,来自健康人的这类血浆样品的循环DNA的产量可以是每毫升血浆1ng至10ng,在癌症患者样品中明显更高。

多核苷酸还可以源自储存的样品,如冷冻或存档的样品。用于储存样品的一种常用方法是将其福尔马林固定并石蜡包埋。然而,该过程还与核酸的降解相关。从FFPE样品加工并分析的多核苷酸可包括短多核苷酸,如50-200个碱基对或更短的片段。有很多技术可用于从固定的石蜡包埋样品中纯化核酸,如WO2007133703中描述的方法,以及Foss等人,Diagnostic Molecular Pathology,(1994)3:148-155和Paska,C等人,DiagnosticMolecular Pathology,(2004)13:234-240所描述的方法。可商购获得的试剂盒可用于从FFPE样品中纯化多核苷酸,如Ambion的Recoverall Total Nucleic acid Isolation试剂盒。典型的方法开始于通过用二甲苯或其他有机溶剂提取而从组织中除去石蜡的步骤,随后用热和蛋白酶如蛋白酶K处理,该蛋白酶切割组织和蛋白质,并帮助从组织中释放基因组物质。然后可以将释放的核酸捕获在膜上,或从溶液中沉淀,洗涤以除去杂质,并且对于mRNA分离的情况,有时增加DNA酶处理步骤以降解不需要的DNA。其他提取FFPE DNA的方法是可用的,并且可以在本公开的方法中使用。

在一些实施方案中,所述多个多核苷酸包含无细胞多核苷酸,如无细胞DNA(cfDNA)或循环肿瘤DNA(ctDNA)。无细胞DNA在健康和患病个体中循环。来自肿瘤的cfDNA(ctDNA)不限于任何特定的癌症类型,但似乎是不同恶性肿瘤中常见的发现。根据一些测量,血浆中的游离循环DNA浓度在对照受试者中约为14-18ng/ml,在瘤形成患者中约为180-318ng/ml。凋亡和坏死的细胞死亡造成体液中的无细胞循环DNA。例如,在前列腺癌患者和其他前列腺疾病如良性前列腺增生和前列腺炎的血浆中观察到循环DNA水平显著升高。另外,循环肿瘤DNA存在于源自发生原发性肿瘤的器官的体液中。因此,乳腺癌检测可以在导管灌洗液中实现;结直肠癌检测在大便中实现;肺癌检测在痰中实现,并且前列腺癌检测在尿液或精液中检测。无细胞DNA可以从多种来源获得。一个常见的来源是受试者的血液样品。然而,cfDNA或其他片段化DNA可以来自多种其他来源。例如,尿液和粪便样品可以是包括ctDNA在内的cfDNA的来源。

在一些实施方案中,在不进行提取步骤和/或不进行纯化步骤的情况下,使多核苷酸经历后续步骤(例如环化和扩增)。例如,可以在不进行提取步骤的情况下处理流体样品以除去细胞,以产生纯化的液体样品和细胞样品,随后从纯化的流体样品中分离DNA。有多种分离多核苷酸的程序是可用的,例如通过沉淀,或者与基底非特异性结合并随后洗涤该基底以释放结合的多核苷酸。在不进行细胞提取步骤的情况下从样品中分离多核苷酸时,多核苷酸将主要是细胞外或“无细胞”多核苷酸。例如,无细胞多核苷酸可包括无细胞DNA(也称为“循环”DNA)。在一些实施方案中,循环DNA是来自肿瘤细胞的,例如来自体液或排泄物(例如血液样品)的循环肿瘤DNA(ctDNA)。肿瘤经常显示出凋亡或坏死,使得肿瘤核酸通过各种机制,以不同形式和不同水平释放到体内,包括受试者的血流中。通常,ctDNA的大小可以在较高浓度的较小片段(通常长度为70至200个核苷酸)至较低浓度的高达数千个千碱基的大片段之间。

在本文所述的各个方面中的任一方面的一些实施方案中,检测序列变体包括检测相对于参考序列的突变(例如罕见的体细胞突变)或无突变的背景中的突变,其中序列变体与疾病相关。通常,有统计学、生物学和/或功能证据表明与疾病或性状相关的序列变体被称为“因果遗传变体”。单一因果遗传变体可与超过一种疾病或性状相关。在一些实施方案中,因果遗传变体可与孟德尔性状、非孟德尔性状或两者相关。因果遗传变体可以表现为多核苷酸的变异,如1、2、3、4、5、6、7、8、9、10、20、50个或更多个序列差异(例如,在包含因果遗传变体的多核苷酸与在相同的相对基因组位置处缺少该因果遗传变体的多核苷酸之间)。因果遗传变体类型的非限制性实例包括单核苷酸多态性(SNP)、缺失/插入多态性(DIP)、拷贝数变体(CNV)、短串联重复(STR)、限制片段长度多态性(RFLP)、简单序列重复(SSR)、可变数目串联重复(VNTR)、随机扩增多态性DNA(RAPD)、扩增片段长度多态性(AFLP)、反转录转座子间扩增多态性(IRAP)、长短穿插元件(LINE/SINE)、长串联重复(LTR)、移动元件、反转录转座子微卫星扩增多态性、基于反转录转座子的插入多态性、序列特异性扩增多态性以及可遗传表观遗传修饰(例如,DNA甲基化)。因果遗传变体也可以是一组密切相关的因果遗传变体。一些因果遗传变体可作为RNA多核苷酸中的序列变异发挥作用。在该水平上,一些因果遗传变体还通过某种RNA多核苷酸是否存在来指示。此外,一些因果遗传变体导致蛋白质多肽的序列变异。已经报道了许多因果遗传变体。导致镰状细胞贫血的血红蛋白的Hb S变体是SNP因果遗传变体的一个实例。引起囊性纤维化的CFTR基因的delta508突变是DIP因果遗传变体的一个实例。引起唐氏综合征的21三体是CNV因果遗传变体的一个实例。引起亨廷顿病的串联重复是STR因果遗传变体的一个实例。表1提供了因果遗传变体以及与其相关的疾病的非限制性实例。在WO2014015084中描述了因果遗传变体的其他非限制性实例。表2提供了基因的其他实例,该基因中的突变与疾病相关,并且其中的序列变体可以根据本公开的方法来检测。

表1.因果遗传变体以及与其相关的疾病

表2.其突变可能与疾病相关的基因

在一些实施方案中,方法进一步包括基于鉴定序列变体来诊断受试者的步骤,例如诊断患有与检测到的因果遗传变体相关的疾病的受试者,或报告患者已患或将患此类疾病的可能性。本文提供了疾病、相关基因和相关序列变体的实例。在一些实施方案中,如本文所述,通过报告生成器报告结果。

在一些实施方案中,一种或多种因果遗传变体是与癌症的特定类型或阶段相关的序列变体,或是具有特定特性(例如转移潜力、抗药性、药物反应性)的癌症的序列变体。在一些实施方案中,本公开提供了确定预后的方法,例如在已知某些突变与患者结果相关的情况下。例如,已表明ctDNA是比传统癌抗原53(CA-53)和循环肿瘤细胞计数(参见,例如,Dawson等人,N Engl J Med 368:1199(2013))更好的乳腺癌预后生物标志物。另外,本公开的方法可用于治疗决策、指导和监测,以及癌症疗法的开发和临床试验。例如,可以通过将采用特定疗法治疗之前、期间和之后得到的患者ctDNA样品进行比较来监测治疗功效,该特定疗法例如是分子靶向疗法(单克隆药物)、化疗药物、放疗方案等或其组合。例如,可以监测ctDNA以确定某些突变在治疗后是否增加或减少,是否出现新突变等,与跟踪患者症状的监测方法相比,这可以允许医生在更短时间内改变治疗(例如,继续、停止或改变治疗)。在一些实施方案中,方法进一步包括基于鉴定步骤来诊断受试者的步骤,例如诊断具有与检测到的序列变体相关的特定阶段或类型的癌症的受试者,或报告患者已患或将患此类癌症的可能性。

例如,对于基于分子标志物(例如赫赛汀(Herceptin)和her2/neu状态)的特异性靶向患者的疗法,对患者进行测试,以确定他们的肿瘤中是否存在某些突变,并且这些突变可以用来预测对治疗的反应或抗性,并指导是否使用该疗法的决定。因此,在治疗过程中检测和监测ctDNA对指导治疗选择可能非常有用。发现一些原发性(治疗前)或继发性(治疗后)的癌症突变是癌症对某些疗法的抗性的原因(Misale等人,Nature486(7404):532(2012))。

与一种或多种癌症相关并且可用于诊断、预后或治疗决策的多种序列变体是已知的。在本公开的方法中可用的具有肿瘤学意义的合适靶序列包括但不限于TP53基因、ALK基因、KRAS基因、PIK3CA基因、BRAF基因、EGFR基因和KIT基因的改变。可以被特异性扩增和/或针对序列变体进行特异性分析的靶序列可以是癌症相关基因的全部或部分。在一些实施方案中,在TP53基因中鉴定了一种或多种序列变体。TP53是人类癌症中最常见的突变基因之一,例如,TP53突变可见于45%的卵巢癌、43%的大肠癌和42%的上呼吸消化道癌中(参见,例如,M.Olivier等人,TP53 Mutations in Human Cancers:Origins,Consequences,andClinical Use.Cold Spring Harb Perspect Biol.2010年1月;2(1))。表征TP53的突变状态可有助于临床诊断,提供预后价值,并影响对癌症患者的治疗。例如,TP53突变可用作患有源自神经胶质细胞的CNS肿瘤的患者的预后不良的预测因子,以及慢性淋巴细胞白血病患者的疾病快速进展的预测因子(参见,例如,McLendon RE等人,Cancer.2005年10月15日;1 04(8):1693-9;Dicker F等人.Leukemia.2009年1月;23(1):117-24)。序列变异可以发生在基因内的任何地方。因此,在此可以评价全部或部分TP53基因。即,如本文其他地方所述,当使用靶标特异性组分(例如,靶标特异性引物)时,可以使用多个TP53特异性序列,例如以扩增并检测跨该基因的片段,而不仅是可用于选定靶标的一个或多个选定子序列(如突变“热点”)。或者,可以设计与一个或多个选定子序列(例如与一类受试者中突变率增加相关的核苷酸或核苷酸区域,也包括在术语“热点”中)的上游或下游杂交的靶标特异性引物。可以设计跨这样的子序列的标准引物,并且/或者可以设计与这样的子序列的上游或下游杂交的B2B引物。

在一些实施方案中,在ALK基因的全部或部分中鉴定一个或多个序列变体。已经报道,在多达7%的肺肿瘤中存在ALK融合,其中一些与EGFR酪氨酸激酶抑制剂(TKI)抗性相关(参见,例如,Shaw等人,J Clin Oncol.2009年9月10日;27(26):4247–4253)。截止到2013年,在对ALK酪氨酸激酶抑制剂(TKI)具有继发性抗性的患者中发现了跨整个ALK酪氨酸激酶结构域的几个不同的点突变(Katayama R 2012Sci Transl Med.2012年2月8日;4(120))。因此,ALK基因中的突变检测可用来辅助癌症疗法决策。

在一些实施方案中,在KRAS基因的全部或部分中鉴定一个或多个序列变体。已经报道,大约15-25%的肺腺癌患者和40%的结直肠癌患者携带肿瘤相关的KRAS突变(参见,例如,Neuman 2009,Pathol Res Pract.2009;205(12):858-62)。大多数突变位于KRAS基因的密码子12、13和61处。这些突变激活KRAS信号传导途径,从而触发肿瘤细胞的生长和增殖。一些研究表明,具有携带KRAS突变的肿瘤的患者不可能受益于单独或与化疗联合的抗EGFR抗体疗法(参见,例如,Amado等人,2008J Clin On col.2008年4月1日;26(1 0):1626-34,Bokemeyer等人,2009J Clin Oncol.2009年2月10日;27(5):663-71))。可以为了鉴定序列变异而靶向的一个特定的序列变异“热点”在该基因的位置35处。KRAS序列变体的鉴定可用于治疗选择,如结直肠癌受试者的治疗选择。

在一些实施方案中,在PIK3CA基因的全部或部分中鉴定一个或多个序列变体。PIK3CA的体细胞突变经常出现在各种类型的癌症中,例如,在10-30%的结直肠癌中(参见,例如,Samuels等人,2004Science.2004年4月23日;304(5670):554.)。这些突变最常位于外显子9(螺旋结构域)和外显子20(激酶结构域)内的两个“热点”区域内,其可以被特异性地靶向用于扩增和/或分析以供序列变体检测。位置3140也可以被特异性地靶向。

在一些实施方案中,在BRAF基因的全部或部分中鉴定一个或多个序列变体。已经报道,在所有恶性黑素瘤中有近50%携带BRAF中的体细胞突变(参见,例如,Maldonado等人,J Natl Cancer Inst.2003年12月17日;95(24):1878-90)。BRAF突变可见于所有黑素瘤亚型中,但最常见于源自没有慢性阳光诱发的损伤的皮肤的黑素瘤中。在黑素瘤中最常见的BRAF突变是错义突变V600E,其将位置600处的缬氨酸置换为谷氨酰胺。BRAF V600E突变与BRAF抑制剂疗法的临床益处相关。BRAF突变的检测可在黑素瘤治疗的选择和对靶向疗法的抗性的研究中使用。

在一些实施方案中,在EGFR基因的全部或部分中鉴定一个或多个序列变体。EGFR突变通常与非小细胞肺癌相关(在美国约为10%,在东亚约为35%;参见,例如,Pao等人,Proc Natl Acad Sci USA.2004年9月7日;101(36):13306-11)。这些突变通常发生在EGFR外显子18-21内,并且通常是杂合的。这些突变中大约90%是外显子19缺失或外显子21L858R点突变。

在一些实施方案中,在KIT基因的全部或部分中鉴定一个或多个序列变体。已经报道,近85%的胃肠道间质瘤(GIST)携带KIT突变(参见,例如,Heinrich等人,2003J ClinOncol.2003年12月1日;21(23):4342-9)。大多数KIT突变可见于近膜结构域(外显子11,70%)、细胞外二聚化基序(外显子9,10-15%)、酪氨酸激酶I(TKI)结构域(外显子13,1-3%)和酪氨酸激酶2(TK2)结构域和激活环(外显子17,1-3%)中。在靶向疗法伊马替尼后和患者对疗法产生抗性后,通常会鉴定出继发性KIT突变。

可根据本文所述的方法来分析其全部或部分的序列变体的癌症相关基因的其他非限制性实例包括但不限于PTEN;ATM;ATR;EGFR;ERBB2;ERBB3;ERBB4;Notch1;Notch2;Notch3;Notch4;AKT;AKT2;AKT3;HIF;HIF1a;HIF3a;Met;HRG;Bcl2;PPARα;PPARγ;WT1(维尔姆斯瘤);FGF受体家族成员(5个成员:1、2、3、4、5);CDKN2a;APC;RB(视网膜母细胞瘤);MEN1;VHL;BRCA1;BRCA2;AR(雄激素受体);TSG101;IGF;IGF受体;Igf1(4种变体);Igf2(3种变体);Igf 1受体;Igf 2受体;Bax;Bcl2;胱天蛋白酶家族(9个成员:1、2、3、4、6、7、8、9、12);Kras;和Apc。其他实例在本文其他地方提供。可以基于根据本文公开的方法鉴定一个或多个序列变体来诊断的癌症的实例包括但不限于棘皮瘤、腺泡细胞癌、听神经瘤、肢端着色斑性黑素瘤、顶端螺旋瘤、急性嗜酸性细胞白血病、急性淋巴母细胞白血病、急性巨核母细胞白血病、急性单核细胞白血病、伴成熟的急性成髓细胞白血病、急性髓样树突细胞白血病、急性髓样白血病、急性早幼粒细胞白血病、釉质瘤、腺癌、腺样囊性癌、腺瘤、牙源性腺瘤样瘤、肾上腺皮质癌、成人T-细胞白血病、侵袭性NK细胞白血病、AIDS相关癌症、AIDS相关淋巴瘤、软组织腺泡状肉瘤、成釉细胞纤维瘤、肛门癌、间变性大细胞淋巴瘤、甲状腺未分化癌、血管免疫母细胞性T细胞淋巴瘤、血管肌脂瘤、血管肉瘤、阑尾癌、星形细胞瘤、非典型性畸胎样横纹肌样瘤、基底细胞癌、基底细胞样癌、B细胞白血病、B细胞淋巴瘤、Bellini管癌、胆道癌、膀胱癌、母细胞瘤、骨癌、骨瘤、脑干胶质瘤、脑瘤、乳腺癌、Brenner瘤、支气管瘤、细支气管肺泡癌、Brown瘤、伯基特淋巴瘤、原发灶不明的癌症、类癌瘤、癌、原位癌、阴茎癌、原发灶不明癌、癌肉瘤、Castleman病、中枢神经系统胚胎瘤、小脑星形细胞瘤、大脑星形细胞瘤、宫颈癌、胆管细胞癌、软骨瘤、软骨肉瘤、脊索瘤、绒毛膜癌、脉络丛乳头状瘤、慢性淋巴细胞白血病、慢性单核细胞白血病、慢性髓性白血病、慢性骨髓增生性疾病、慢性嗜中性粒细胞白血病、透明细胞肿瘤、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、Degos病、隆凸性皮肤纤维肉瘤、皮样囊肿、结缔组织增生性小圆细胞瘤、弥漫性大B细胞淋巴瘤、胚胎发育不良神经上皮瘤、胚胎癌、内胚窦瘤、子宫内膜癌、子宫内膜子宫癌、子宫内膜样肿瘤、肠病相关的T细胞淋巴瘤、室管膜母细胞瘤、室管膜瘤、上皮样肉瘤、红白血病、食管癌、鼻腔神经胶质瘤、尤因家族肿瘤、尤因家族肉瘤、尤因肉瘤、颅外生殖细胞瘤、性腺外生殖细胞瘤、肝外胆管癌、非乳腺性佩吉特病、输卵管癌、胎中胎、纤维瘤、纤维肉瘤、滤泡性淋巴瘤、滤泡性甲状腺癌、胆囊癌、胆囊癌、神经节胶质瘤、神经节瘤、胃癌、胃淋巴瘤、胃肠癌、胃肠类癌瘤、胃肠间质瘤、胃肠间质瘤、生殖细胞肿瘤、生殖细胞瘤、妊娠性绒毛膜癌、妊娠滋养细胞瘤、骨巨细胞瘤、多形性胶质母细胞瘤、胶质瘤、大脑胶质瘤病、血管球瘤、胰高血糖素瘤、成性腺细胞瘤、粒层细胞瘤、毛细胞白血病、多毛细胞白血病、头颈癌、头颈癌症、心脏癌、血管母细胞瘤、血管外皮细胞瘤、血管肉瘤、恶性血液肿瘤、肝细胞癌、肝脾T细胞淋巴瘤、遗传性乳腺癌-卵巢癌综合征、霍奇金淋巴瘤、何杰金淋巴瘤、下咽癌、下丘脑胶质瘤、炎性乳腺癌、眼内黑素瘤、胰岛细胞癌、胰岛细胞瘤、幼年型粒单核细胞白血病、卡波西肉瘤、卡波济肉瘤、肾癌、Klatskin瘤、Krukenberg瘤、喉癌、喉癌、恶性雀斑样痣黑素瘤、白血病、白血病、唇癌和口腔癌、脂肪肉瘤、肺癌、黄体瘤、淋巴管瘤、淋巴管肉瘤、淋巴上皮瘤、淋巴样白血病、淋巴瘤、巨球蛋白血症、恶性纤维组织细胞瘤、恶性纤维组织细胞瘤、骨恶性纤维组织细胞瘤、恶性胶质瘤、恶性间皮瘤、恶性外周神经鞘瘤、恶性棒状瘤、恶性特里顿瘤、MALT淋巴瘤、套细胞淋巴瘤、肥大细胞淋巴瘤、纵膈生殖细胞瘤、纵膈肿瘤、甲状腺髓样癌、髓母细胞瘤、成髓细胞瘤、髓上皮瘤、黑素瘤、黑色素瘤、脑膜瘤、Merkel细胞癌、间皮瘤、间皮细胞瘤、原发灶隐匿转移性鳞状颈癌、转移性尿路上皮癌、混合Mullerian瘤、单核细胞性白血病、口腔癌、粘液瘤、多发性内分泌瘤综合征、多发性骨髓瘤、多发性骨髓瘤、蕈样肉芽肿、蕈样肉芽肿、骨髓增生异常疾病、骨髓增生异常综合征、髓样白血病、髓样肉瘤、骨髓增生性疾病、粘液瘤、鼻腔癌、鼻咽癌症、鼻咽癌、赘生物、神经鞘瘤、神经母细胞瘤、成神经细胞瘤、神经纤维瘤、神经瘤、结节型黑素瘤、非霍奇金淋巴瘤、非何杰金淋巴瘤、非黑素瘤皮肤癌、非小细胞肺癌、眼肿瘤、少突星形细胞瘤、少突神经胶质瘤、嗜酸性粒细胞腺瘤、视神经鞘脑膜瘤、口癌、口腔癌、口咽癌、骨肉瘤、骨肉瘤、卵巢癌、卵巢癌症、卵巢上皮癌、卵巢生殖细胞瘤、卵巢低恶性潜能肿瘤、乳腺Paget病、Pancoast瘤、胰腺癌、胰腺癌、乳头状甲状腺癌、乳头状瘤病、副神经节瘤、副鼻窦癌、甲状旁腺癌、阴茎癌、血管周上皮样细胞瘤、咽癌、嗜铬细胞瘤、中度分化的松果体实质瘤、成松果体细胞瘤、垂体细胞瘤、垂体腺瘤、垂体瘤、浆细胞瘤、胸膜肺母细胞瘤、多胚瘤、前体T成淋巴细胞淋巴瘤、原发性中枢神经系统淋巴瘤、原发性渗出性淋巴瘤、原发性肝细胞癌、原发性肝癌、原发性腹膜癌、原始神经外胚层瘤、前列腺癌、腹膜假粘液瘤、直肠癌、肾细胞癌、涉及染色体15上NUT基因的呼吸道癌、视网膜母细胞瘤、横纹肌瘤、横纹肌肉瘤、Richter转化、骶尾部畸胎瘤、唾腺癌、肉瘤、施万鞘瘤神经鞘瘤病(Schwannomatosis)、皮脂腺癌、继发性肿瘤、精原细胞瘤、浆液性肿瘤、Sertoli-Leydig细胞瘤、性索间质瘤、Sezary综合征、Signet细胞癌、皮肤癌、小蓝圆细胞瘤、小细胞癌、小细胞肺癌、小细胞淋巴瘤、小肠癌、软组织肉瘤、生长抑素瘤、煤烟疣、脊髓瘤、脊髓肿瘤、脾边缘区淋巴瘤、鳞状细胞癌、胃癌、表浅扩散性黑素瘤、幕上原始神经外胚层瘤、表面上皮-间质瘤、滑膜肉瘤、T细胞急性淋巴母细胞性白血病、T细胞大颗粒淋巴细胞白血病、T细胞白血病、T细胞淋巴瘤、T细胞幼淋巴细胞白血病、畸胎瘤、晚期淋巴癌、睾丸癌、泡膜细胞瘤、喉癌、胸腺癌、胸腺瘤、甲状腺癌、肾盂和输尿管移行细胞癌、移行细胞癌、脐尿管癌、尿道癌、泌尿生殖系统肿瘤、子宫肉瘤、葡萄膜黑素瘤、阴道癌、Verner Morrison综合征、疣状癌、视通路胶质瘤、外阴癌、瓦尔登斯特伦巨球蛋白血症、Warthin瘤、维尔姆斯瘤,及其组合。与癌症相关的特定序列变体的非限制性实例在表3中提供。

表3.可能与癌症相关的特定序列变体

另外,本文公开的方法和组合物可用于发现与一种或多种癌症类型、阶段或癌症特性相关的新的罕见突变。例如,可以使共有所分析的特性(例如特定疾病、癌症类型、癌症阶段等)的个体群体经历根据本公开的检测序列变体的方法,以鉴定序列变体或序列变体的类型(例如,特定基因或基因部分的突变)。相比于没有该特性的个体,在共有该特性的一组个体中被鉴定为以统计学上显著更高的频率出现的序列变体可被指定与该特性的相关性程度。如此鉴定的序列变体或序列变体类型然后可用于诊断或治疗被发现携带它们的个体。

其他治疗应用包括在非侵入性胎儿诊断中的应用。胎儿DNA可以在孕妇的血液中发现。本文所述的方法和组合物可用来鉴定循环胎儿DNA中的序列变体,因此可用来诊断胎儿中的一种或多种遗传病,如与一种或多种因果遗传变体相关的遗传病。本文描述了因果遗传变体的非限制性实例,包括三体性、囊性纤维化、镰状细胞贫血和Tay-Saks病。在该实施方案中,母亲可以提供对照样品和用于比较的血液样品。对照样品可以是任何合适的组织,并且通常进行处理以提取细胞DNA,然后可以对该DNA进行测序以提供参考序列。然后可以将对应于胎儿基因组DNA的cfDNA序列鉴定为相对于母体参考的序列变体。父亲也可以提供参考样品,以帮助鉴定胎儿序列和序列变体。

更进一步的治疗应用包括检测外源多核苷酸,如来自病原体(例如细菌、病毒、真菌和微生物)的外源多核苷酸,该信息可告知诊断和治疗选择。例如,一些HIV亚型与抗药性相关(参见,例如,hivdb.stanford.edu/pages/genotype-rx)。类似地,HCV分型、亚型分型和同种型突变也可以使用本公开的方法和组合物来实现。此外,在HPV亚型与宫颈癌风险相关的情况下,这样的诊断可以进一步告知癌症风险的评估。可检测的病毒的进一步非限制性实例包括乙型肝炎病毒(HBV)、土拨鼠肝炎病毒、地松鼠(肝脱氧核糖核酸病毒科)肝炎病毒、鸭乙型肝炎病毒、苍鹭乙型肝炎病毒、疱疹病毒属单纯疱疹病毒(HSV)1型和2型、水痘-带状疱疹病毒、巨细胞病毒(CMV)、人巨细胞病毒(HCMV)、小鼠巨细胞病毒(MCMV)、豚鼠巨细胞病毒(GPCMV)、EB病毒(EBV)、人疱疹病毒6(HHV变体A和B)、人疱疹病毒7(HHV-7)、人疱疹病毒8(HHV-8)、卡波西肉瘤相关疱疹病毒(KSHV)、B病毒痘病毒痘苗病毒、天花病毒(variola virus)、天花病毒(smallpox virus)、猴痘病毒、牛痘病毒、骆驼痘病毒、鼠痘病毒、小鼠痘病毒、兔痘病毒、浣熊痘病毒、传染性软疣病毒、口疮病毒、副痘苗病毒、牛丘疹性口炎病毒、绵羊痘病毒、山羊痘病毒、结节性皮肤病病毒、禽痘病毒、金丝雀痘病毒、鸽痘病毒、麻雀痘病毒、粘液瘤病毒、野兔纤维瘤病毒、兔纤维瘤病毒、松鼠纤维瘤病毒、猪痘病毒、塔纳痘病毒、亚巴猴痘病毒、黄病毒登革病毒、丙型肝炎病毒(HCV)、GB肝炎病毒(GBV-A、GBV-B和GBV-C)、西尼罗河病毒、黄热病病毒、圣路易斯脑炎病毒、日本脑炎病毒、波瓦生病毒、蜱传脑炎病毒、夸赛纳森林病病毒、披膜病毒、委内瑞拉马脑炎(VEE)病毒、基孔肯雅病毒、罗斯河病毒、马亚罗病毒、辛德毕斯病毒、风疹病毒、逆转录病毒人类免疫缺陷病毒(HIV)1型和2型、人类T细胞白血病病毒(HTLV)1型、2型和5型、小鼠乳腺肿瘤病毒(MMTV)、劳斯肉瘤病毒(RSV)、慢病毒、冠状病毒、严重急性呼吸综合征(SARS)病毒、纤丝病毒埃博拉病毒、马尔堡病毒、偏肺病毒(MPV)如人类偏肺病毒(HMPV)、弹状病毒狂犬病病毒、水疱性口膜炎病毒、布尼亚病毒、克里米亚-刚果出血热病毒、裂谷热病毒、拉克罗斯病毒、汉坦病毒、正粘病毒、流感病毒(A、B和C型)、副粘病毒、副流感病毒(PIV 1、2和3型)、呼吸道合胞病毒(A型和B型)、麻疹病毒、腮腺炎病毒、砂砾样病毒、淋巴细胞性脉络丛脑膜炎病毒、胡宁病毒、马丘坡病毒、瓜纳瑞托病毒、拉沙病毒、Ampari病毒、弗莱克索尔病毒、伊派病毒、Mobala病毒、Mopeia病毒、拉丁美洲病毒、巴拉那病毒、皮秦德病毒、庞塔托鲁病毒(PTV)、塔卡里伯病毒和塔米阿米病毒。

可通过本公开的方法检测的细菌病原体的具体实例包括但不限于以下任何一种或多种(或任何组合):鲍氏不动杆菌(Acinetobacter baumanii)、放线杆菌属的种(Actinobacillus sp.)、放线菌属(Actinomycetes)、放线菌属的种(Actinomyces sp.)(如衣氏放线菌(Actinomyces israelii)和内氏放线菌(Actinomyces naeslundii))、气单胞菌属的种(Aeromonas sp.)(如嗜水气单胞菌(Aeromonas hydrophila)、维氏气单胞菌温和生物变种(Aeromonas veronii biovar sobria)(温和气单胞菌(Aeromonas sobria))和豚鼠气单胞菌(Aeromonas caviae))、嗜吞噬细胞无形体(Anaplasma phagocytophilum)、木糖氧化产碱菌(Alcaligenes xylosoxidans)、鲍氏不动杆菌、伴放线放线杆菌(Actinobacillus actinomycetemcomitans)、芽孢杆菌属的种(Bacillus sp.)(如炭疽芽孢杆菌(Bacillus anthracis)、蜡状芽孢杆菌(Bacillus cereus)、枯草芽胞杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)和嗜热脂肪芽孢杆菌(Bacillus stearothermophilus))、拟杆菌属的种(Bacteroides sp.)(如脆弱拟杆菌(Bacteroides fragilis))、巴尔通氏体属的种(Bartonella sp.)(如杆状巴尔通氏体(Bartonella bacilliformis)和汉氏巴尔通氏体(Bartonella henselae))、双歧杆菌属的种(Bifidobacterium sp.)、博德特氏菌属的种(Bordetella sp.)(如百日咳博德特氏菌(Bordetella pertussis)、副百日咳博德特氏菌(Bordetella parapertussis)和支气管炎博德特氏菌(Bordetella bronchiseptica))、疏螺旋体属的种(Borrelia sp.)(如回归热疏螺旋体(Borrelia recurrentis)和布氏疏螺旋体(Borrelia burgdorferi))、布鲁氏菌属的种(Brucella sp.)(如流产布鲁氏菌(Brucella abortus)、狗布鲁氏菌(Brucellacanis)、马尔他布鲁氏菌(Brucella melintensis)和猪布鲁氏菌(Brucella suis))、伯克霍尔德氏菌属的种(Burkholderia sp.)(如类鼻疽伯克霍尔德氏菌(Burkholderiapseudomallei)和洋葱伯克霍尔德氏菌(Burkholderia cepacia))、弯曲杆菌属的种(Campylobacter sp.)(如空肠弯曲杆菌空肠亚种(Campylobacter jejuni)、大肠弯曲杆菌(Campylobacter coli)、红嘴鸥弯曲杆菌(Campylobacter lari)和胚胎弯曲杆菌(Campylobacter fetus))、二氧化碳嗜纤维菌属的种(Capnocytophaga sp.)、人心杆菌(Cardiobacterium hominis)、砂眼衣原体(Chlamydia trachomatis)、肺炎嗜衣原体(Chlamydophila pneumoniae)、鹦鹉热嗜衣原体(Chlamydophila psittaci)、柠檬酸杆菌属的种(Citrobacter sp.)、伯氏考克斯氏体(Coxiella burnetii)、棒杆菌属的种(Corynebacterium sp.)(如白喉棒杆菌(Corynebacterium diphtheriae)、杰氏棒杆菌(Corynebacterium jeikeum)和棒杆菌(Corynebacterium))、梭菌属的种(Clostridiumsp.)(如产气荚膜梭菌(Clostridium perfringens)、艰难梭菌(Clostridium difficile)、肉毒梭菌(Clostridium botulinum)和破伤风梭菌(Clostridium tetani))、啮蚀艾肯氏菌(Eikenella corrodens)、肠杆菌属的种(Enterobacter sp.)(如产气肠杆菌(Enterobacter aerogenes)、成团肠杆菌(Enterobacter agglomerans)、阴沟肠杆菌(Enterobacter cloacae)和大肠杆菌(Escherichia coli),包括机会性大肠杆菌,如肠毒性大肠杆菌,肠侵袭性大肠杆菌,肠致病性大肠杆菌,肠出血性大肠杆菌,肠聚集性大肠杆菌和尿路致病大肠杆菌)、肠球菌属的种(Enterococcus sp.)(如粪肠球菌(Enterococcusfaecalis)和屎肠球菌(Enterococcus faecium))、埃里希氏体属的种(Ehrlichia sp.)(如恰菲埃里希氏体(Ehrlichia chafeensia)和犬埃里希氏体(Ehrlichia canis))、猪红斑丹毒丝菌(Erysipelothrix rhusiopathiae)、真杆菌属的种(Eubacterium sp.)、土拉热弗朗西丝氏菌(Francisella tularensis)、具核梭杆菌(Fusobacterium nucleatum)、阴道加德纳氏菌(Gardnerella vaginalis)、麻疹孪生球菌(Gemella morbillorum)、嗜血菌属的种(Haemophilus sp.)(如流感嗜血菌(Haemophilus influenzae)、杜氏嗜血菌(Haemophilusducreyi)、埃及嗜血菌(Haemophilus aegyptius)、副流感嗜血菌(Haemophilusparainfluenzae)、溶血嗜血菌(Haemophilus haemolyticus)和副溶血嗜血菌(Haemophilus parahaemolyticus))、螺杆菌属的种(Helicobacter sp.)(如幽门螺杆菌(Helicobacterpylori)、同性恋螺杆菌(Helicobacter cinaedi)和芬纳尔螺杆菌(Helicobacter fennelliae))、金氏金氏杆菌(Kingella kingii)、克雷伯氏菌属的种(Klebsiella sp.)(如肺炎克雷伯氏菌(Klebsiella pneumoniae)、肉芽肿克雷伯氏菌(Klebsiella granulomatis)和产酸克雷伯氏菌(Klebsiella oxytoca))、乳杆菌属的种(Lactobacillus sp.)、单核细胞增生利斯特氏菌、问号钩端螺旋体(Leptospirainterrogans)、侵肺军团菌(Legionella pneumophila)、问号钩端螺旋体、消化链球菌属的种(Peptostreptococcus sp.)、粘膜炎莫拉氏菌(Moraxella catarrhalis)、摩根氏菌属的种(Morganella sp.)、动弯杆菌属的种(Mobiluncus sp.)、微球菌属的种(Micrococcussp.)、分枝杆菌属的种(Mycobacterium sp.)(如麻风分枝杆菌(Mycobacterium leprae)、结核分枝杆菌(Mycobacterium tuberculosis)、胞内分枝杆菌(Mycobacteriumintracellulare)、鸟分枝杆菌(Mycobacterium avium)、牛分支杆菌(Mycobacteriumbovis)和瘰疬分枝杆菌(Mycobacterium marinum))、支原体属的种(Mycoplasma sp.)(如肺炎支原体(Mycoplasma pneumoniae)、人型支原体(Mycoplasma hominis)和生殖道支原体(Mycoplasma genitalium))、诺卡氏菌属的种(Nocardia sp.)(如星状诺卡氏菌(Nocardia asteroides)、盖尔森基兴诺卡氏菌(Nocardia cyriacigeorgica)和巴西诺卡氏菌(Nocardia brasiliensis))、奈瑟氏球菌属的种(Neisseria sp.)(如淋病奈瑟氏球菌(Neisseria gonorrhoeae)和脑膜炎奈瑟氏球菌(Neisseria meningitidis))、多杀巴斯德氏菌(Pasteurella multocida)、类志贺邻单胞菌(Plesiomonas shigelloides).普雷沃氏菌属的种(Prevotella sp.)、卟啉单胞菌属的种(Porphyromonas sp.)、产黑素普雷沃氏菌(Prevotella melaminogenica)、变形菌属的种(Proteus sp.)(如普通变形菌(Proteusvulgaris)和奇异变形菌(Proteus mirabilis))、普罗维登斯菌属的种(Providencia sp.)(如产碱普罗维登斯菌(Providencia alcalifaciens)、雷氏普罗维登斯菌(Providenciarettgeri)和斯氏普罗维登斯菌(Providencia stuartii))、铜绿假单胞菌(Pseudomonasaeruginosa)、疮疱丙酸杆菌(Propionibacterium acnes)、马红球菌(Rhodococcus equi)、立克次氏体属的种(Rickettsia sp.)(如立氏立克次氏体(Rickettsia rickettsii)、螨立克次氏体(Rickettsia akari)和普氏立克次氏体(Rickettsia prowazekii))、恙虫病东方体(Orientia tsutsugamushi)(以前称为:恙虫热立克次氏体(Rickettsiatsutsugamushi))和斑疹伤寒立克次氏体(Rickettsia typhi))、红球菌属的种(Rhodococcus sp.)、粘质沙雷氏菌(Serratia marcescens)、嗜麦芽糖寡养单胞菌(Stenotrophomonas maltophilia)、沙门氏菌属的种(Salmonella sp.)(如肠沙门氏菌(Salmonella enterica)、伤寒沙门氏菌(Salmonella typhi)、副伤寒沙门氏菌(Salmonella paratyphi)、肠炎沙门氏菌(Salmonella enteritidis)、猪霍乱沙门氏菌(Salmonella cholerasuis)和鼠伤寒沙门氏菌(Salmonella typhimurium))、沙雷氏菌属的种(Serratia sp.)(如粘质沙雷氏菌和液化沙雷氏菌(Serratia liquifaciens))、志贺氏菌属的种(Shigella sp.)(如痢疾志贺氏菌(Shigella dysenteriae)、弗氏志贺氏菌(Shigella flexneri)、鲍氏志贺氏菌(Shigella boydii)和索氏志贺氏菌(Shigellasonnei))、葡萄球菌属的种(Staphylococcus sp.)(如金黄色葡萄球菌(Staphylococcusaureus)、表皮葡萄球菌(Staphylococcus epidermidis)、溶血葡萄球菌(Staphylococcushemolyticus)、腐生葡萄球菌(Staphylococcus saprophyticus))、链球菌属的种(Streptococcus sp.)(如肺炎链球菌(Streptococcus pneumoniae)(如氯霉素抗性血清型4的肺炎链球菌,奇霉素抗性血清型6B的肺炎链球菌,链霉素抗性血清型9V的肺炎链球菌,红霉素抗性血清型14的肺炎链球菌,奥普托欣抗性血清型14的肺炎链球菌,利福平抗性血清型18C的肺炎链球菌,四环素抗性血清型19F的肺炎链球菌,青霉素抗性血清型19F的肺炎链球菌,以及甲氧苄氨嘧啶抗性血清型23F的肺炎链球菌,氯霉素抗性血清型4的肺炎链球菌,奇霉素抗性血清型6B的肺炎链球菌,链霉素抗性血清型9V的肺炎链球菌,奥普托欣抗性血清型14肺的炎链球菌,利福平抗性血清型18C肺炎链球菌,青霉素抗性血清型19F的肺炎链球菌,或甲氧苄氨嘧啶抗性血清型23F的肺炎链球菌)、无乳链球菌(Streptococcusagalactiae)、变异链球菌(Streptococcus mutans)、酿脓链球菌(Streptococcuspyogenes),A群链球菌,酿脓链球菌,B群链球菌,无乳链球菌,C群链球菌,咽峡炎链球菌(Streptococcus anginosus),似马链球菌(Streptococcus equismilis),D群链球菌,牛链球菌(Streptococcus bovis),F群链球菌,以及咽峡炎链球菌G群链球菌、减少螺菌(Spirillum minus)、念珠状链杆菌(Streptobacillus moniliformis)、密螺旋体属的种(Treponema sp.)(如品他病密螺旋体(Treponema carateum)、极细密螺旋体(Treponemapetenue)、彻白密螺旋体(Treponema pallidum)和Treponema endemicum)、Tropherymawhippelii、解脲支原体(Ureaplasma urealyticum)、韦荣氏球菌属的种(Veillonellasp.)、弧菌属的种(Vibrio sp.)(如霍乱弧菌(Vibrio cholerae)、副溶血弧菌(Vibrioparahemolyticus)、创伤弧菌(Vibrio vulnificus)、副溶血弧菌(Vibrioparahaemolyticus)、创伤弧菌、溶藻弧菌(Vibrio alginolyticus)、模拟弧菌(Vibriomimicus)、霍利斯弧菌(Vibrio hollisae)、河流弧菌(Vibrio fluvialis)、麦奇尼科夫氏弧菌(Vibrio metchnikovii)、海鱼弧菌(Vibrio damsela)和弗尼斯弧菌(Vibriofurnisii))、耶尔森氏菌属的种(Yersinia sp.)(如小肠结肠炎耶尔森氏菌(Yersiniaenterocolitica)、鼠疫耶尔森氏菌(Yersinia pestis)和假结核耶尔森氏菌(Yersiniapseudotuberculosis))和嗜麦芽黄单胞菌(Xanthomonas maltophilia)等。

在一些实施方案中,本公开的方法和组合物在监测器官移植接受者中使用。通常将会发现,来自供体细胞的多核苷酸在来自接受者细胞的多核苷酸的背景下循环。如果器官被良好地接受,则供体循环DNA的水平通常是稳定的,而供体DNA的快速增加(例如,作为给定样品中的频率)可以用作移植排斥的早期迹象。在此阶段可以给予治疗以防止移植失败。对供体器官的排斥已被证明会导致血液中供体DNA增加;参见Snyder等人,PNAS 108(15):6629(2011)。本公开相对于该领域中的现有技术提供了显著的灵敏度改进。在该实施方案中,接受者对照样品(例如颊拭子等)和供体对照样品可用于比较。接受者样品可用来提供参考序列,而对应于供体基因组的序列可被鉴定为相对于该参考序列的序列变体。监测可包括在一段时间内从接受者获得样品(例如血液样品)。早期样品(例如在最初几周内的样品)可用来建立供体cfDNA的分数的基线。后续样品可以与基线进行比较。在一些实施方案中,供体cfDNA的分数增加约或至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、100%、250%、500%、1000%或更多可以作为接受者正在排斥供体组织的指示。

实施例:

给出以下实施例是为了说明本发明的各个实施方案的目的,而并非意味着以任何方式限制本发明。这些实施例以及目前代表优选实施方案的本文所述方法是示例性的,而非旨在限制本发明的范围。本领域技术人员将会想到包含在由权利要求范围所限定的本发明精神之内的其变化以及其他用途。

实施例1:使用WGA扩增的短片段化cfDNA参考标准样品对癌症变体的ddPCR分析

通过以不同比例混合来自不同癌细胞系的大小约为150bp的短片段化DNA与NA12878,制成cfDNA参考标准品。在本研究中使用了四种不同的cfDNA参考标准品:5ng0.25%参考标准品;10ng 0.25%参考标准品;20ng 0.1%参考标准品;和20ng 0%参考标准品。

每个样品具有3个重复品。将DNA样品在96℃下变性30秒,并在冰块上冷却2分钟。在冷块上建立连接混合物(2μL 10x CircLigase缓冲液,4μL SM甜菜碱,1μL 50mM MnCh,1μL Circligase II(Epicentre#CL9025K))的添加,并且在60℃下进行连接3小时。将连接DNA混合物在PCR仪上于80℃孵育45秒,随后进行外切核酸酶处理。将1μL外切核酸酶混合物(Exol 20U/μL:ExoIII 100U/μL=1:2)添加至每个管中,并且将反应在37℃下孵育30分钟。将连接混合物在95℃下变性2分钟,并在冰上冷却至4℃,之后添加Ready-To-Go GenomiPhiV3饼(WGA)。WGA反应在30℃下孵育4.5小时,随后在65℃下加热灭活10分钟。

使用AmpureXP磁珠对WGA产物进行珠纯化,并超声处理至平均大小为800bp。然后使用超声处理的DNA样品的等份作为以下变体的ddPCR分析的输入:EGFRL858R;EGFR719S;和EGFRT790M。表4中提供了用于该测定的Taqman引物和探针序列。根据制造商的说明进行小液滴数字PCR反应。(QX200TM Droplet DigitalTM PCR系统,Bio-Rad Laboratories)

表4.用来按照本文提供的方法检测EGFR序列变体的Taqman引物和探针序列。

图9A-9D、图10A-10D和图11A-11D描绘了从数字PCR测定获得的结果。图9A、图9B、图9C和图9D描绘了鉴定序列变体EGFRL858R的数字PCR测定所获得的结果。图10A、图10B、图10C和图10D描绘了鉴定序列变体EGFRG719S的数字PCR测定所获得的结果。图11A、图11B、图11C和图11D描绘了鉴定序列变体EGFR_T790M的数字PCR测定所获得的结果。图中的各个点对应于各个小液滴分区,每个小液滴分区平均含有一个包含靶序列的多联体。Y轴对应于在通道1(FAM)中测得的信号水平,该水平与在单独分区中生成的突变扩增子的量成比例。X轴对应于在通道2(HEX)中测得的信号水平,该水平与在单独分区中生成的野生型扩增子的量成比例。用户根据制造商的说明(QX200TM Droplet DigitalTM PCR系统,Bio-RadLaboratories)设置每个通道的阈值水平。

在通道2(野生型探针)中产生超过阈值水平的信号(例如为阳性)并且未能在通道1(突变探针)中产生超过阈值水平的信号(例如为阴性)的小液滴被认为含有野生型拷贝。在通道1(突变探针)中产生超过阈值水平的信号(例如为阳性)并且未能在通道2(突变探针)中产生超过阈值水平的信号(例如为阴性)的小液滴被认为含有突变体拷贝(在图9A-9D、图10A-10D和图11A-11D中描绘为围绕各个点绘制的正方形)。在通道2(野生型探针)中产生超过阈值水平的信号

(即为阳性)并且在通道1(突变探针)中产生超过阈值水平的信号(例如为阳性)的小液滴被认为含有假阳性并被排除在分析之外(在图9A-9D、图10A-10D和图11A-11D中描绘为围绕各个点绘制的圆圈)。针对每个输入量和等位基因频率计算平均检出率,如表5所示。在任何空白样品中均未检测到假阳性判定。

表5.

可以使用实施例1中描述的方法检测其他序列变体。突变和野生型探针以及可用来检测其他序列变体的正向和反向引物的非限制性实例提供于表6中。

表6.可用来按照本文提供的方法检测序列变体的Taqman引物和探针序列。

虽然本文已经显示并描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现将想到许多变化、改变和替换。应当理解,在实施本发明的过程中可以采用本文所述的本发明实施方案的各种替代方案。旨在以所附权利要求书限定本发明的范围,由此涵盖在这些权利要求范围内的方法和结构及其等同物。

87页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于测序的引物寡核苷酸

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类