用于制造用于基于序列的遗传检验的对照的组合物和方法

文档序号:1471753 发布日期:2020-02-21 浏览:15次 >En<

阅读说明:本技术 用于制造用于基于序列的遗传检验的对照的组合物和方法 (Compositions and methods for making controls for sequence-based genetic testing ) 是由 D·康斯托克 于 2019-04-02 设计创作,主要内容包括:本文提供了包括从双链模板核酸,例如无细胞DNA产生的核酸片段的组合物。所述组合物可以用作针对文库制备方法的质量的阳性或阴性对照、仪器例如测序仪器的校准、和/或用于核酸测序检验的验证。还提供了用于制造核酸片段的方法。(Provided herein are compositions comprising nucleic acid fragments generated from a double-stranded template nucleic acid, e.g., cell-free DNA. The compositions can be used as positive or negative controls for the quality of library preparation methods, calibration of instruments such as sequencing instruments, and/or validation for nucleic acid sequencing assays. Methods for making nucleic acid fragments are also provided.)

用于制造用于基于序列的遗传检验的对照的组合物和方法

相关申请的交叉引用

本申请要求2018年4月2日提交的美国临时申请序列号62/651,453的权益,该申请通过引用以其全文结合在此。

技术领域

除了其他方面,本披露涉及制造核酸文库(这些核酸文库可以用作阳性或阴性对照,并且有助于测序方法的验证),以及用于鉴定文库中过度表现的和表现不足的诊断学。

背景技术

产前筛查和诊断是产前保健的例行部分。对于遗传和染色体病症的产前诊断,存在侵入性检验;然而,羊膜穿刺或绒膜绒毛采样具有大约1%的流产的风险。基于母体血液中存在循环无细胞DNA的非侵入性检验使用来自母体外周血样品的胎儿核酸,从而确定胎儿染色体异常。非侵入性方法提供了胎儿遗传物质的替代性的并且更安全的来源,用于产前诊断。

在下一代测序(NGS)技术中的改善已经大大提高了测序速度和数据输出,导致当前测序平台的大样品通量。这些改善已经导致在临床实验室中,诊断技术中的NGS的快速进步。对于比较源自一个染色体的遗传物质与另一个染色体的遗传物质,允许在较短时间内对整个基因组测序的NGS技术提供了机会,而没有与侵入性采样方法相关联的风险。

NGS技术的测序平台得益于在其预期用途的背景下用来确认平台将产生可靠结果的验证。以下有助于验证:伴随每个测定包括使用阳性和阴性对照,证明系统安装资格、平台周期性能鉴定、以及证明结果有资格用于临床测定。可以用作阴性对照的生物样品是相对丰富的并且易于获得。例如,如果运行针对唐氏综合症的产前测定,则阴性对照可以是来自怀有未患唐氏综合症的胎儿的孕妇的血液样品。与阴性对照相反,可以用作阳性对照的生物样品并不易于获得。

模拟生物样品的合成的阳性对照是可商购的;然而,它们典型地具有一个或多个缺陷。旨在替代无细胞DNA的合成的阳性对照中的DNA通常在大小方面均匀,而在生物样品中的无细胞DNA在大小方面不均匀。合成的阳性对照中的DNA通常具有用作旨在替代无细胞DNA的DNA来源的基因组的均匀覆盖度,但是生物样品中的无细胞DNA并不必须具有来源的基因组的均匀覆盖度。用来产生大量DNA的当前方法并不模拟无细胞DNA片段长度,并且甚至在加工后,在覆盖度和长度两者方面,存在严重偏差。在合成的阳性对照中的这些缺陷对于来自NGS技术的数据的统计分析有影响并且引入偏差。

本文提供了用于制造和使用核酸片段的集合(例如文库)的方法,这些集合在很多应用中可以用作阳性或阴性对照。在一个实施例中,方法包括:提供包括获得自受试者的多个双链模板核酸的样品,并且将通用衔接子连接至模板核酸的两端,从而形成包括侧翼是通用衔接子的模板核酸的多个衔接子-模板-衔接子分子。在一个实施例中,通用衔接子包括双链核酸的区域。该方法进一步包括:用第一通用引物和第二通用引物扩增多个衔接子-模板-衔接子分子,从而生成扩增的衔接子-模板-衔接子分子,并且从扩增的衔接子-模板-衔接子分子的两端除去至少一部分的通用衔接子,从而导致除去的通用衔接子和多个再生的模板核酸(reDNA)。在一个实施例中,样品包括血液、尿液、痰液、或粪便。

在一个实施例中,怀疑受试者具有病原体感染,例如由细菌病原体或病毒病原体引起的感染。在一个实施例中,样品包括病毒DNA或细菌DNA。

在一个实施例中,双链模板核酸是DNA中,并且在一些实施例中可以包括无细胞DNA(cfDNA)。在一个实施例中,受试者是孕妇,并且双链模板核酸包括胎儿和母体核酸的混合物。在一个实施例中,胎儿并不包括遗传病症,并且在另一个实施例中,胎儿包括遗传病症。遗传病症的实例是非整倍性,例如三体性。三体性的实例包括但不限于21三体性、18三体性、13三体性、9三体性、8三体性、22三体性、XXX、XXY、或XYY。在一个实施例中,遗传病症包括核苷酸序列的表现不足。在另一个实施例中,怀疑受试者具有赘生物。在这样一个受试者中,样品可以包括循环肿瘤DNA和无细胞正常DNA。

在一个实施例中,该方法进一步包括在连接前,处理多个双链模板核酸,从而将端部修饰为平端。在一个实施例中,该方法进一步包括在连接前,处理多个双链模板核酸,从而将模板的3’端修饰为作为3’突出结构终止。通用衔接子可以进一步包括单链非互补核酸链的区域,该区域包括至少一个通用引物结合位点,并且其中连接将通用衔接子的双链核酸的区域共价附接至模板核酸的各端。

在一个实施例中,扩增包括指数式扩增反应,例如聚合酶链式反应(PCR)。在一个实施例中,扩增包括具有低错误率的DNA聚合酶。

在一个实施例中,通用衔接子包括限制性内切核酸酶识别位点,并且除去包括将扩增的衔接子-模板-衔接子分子暴露于限制性内切核酸酶,并且切割衔接子-模板-衔接子分子,从而生成除去的通用衔接子和多个reDNA。限制性内切核酸酶的切割位点和识别位点可以是分离的,并且有用的限制性内切核酸酶的实例包括SapI、MlyI、或BpuEI。在一个实施例中,reDNA在模板的各端保留了通用衔接子的部分,在另一个实施例中,在模板的各端,reDNA并不保留通用衔接子的部分。在一个实施例中,第一通用引物和第二通用引物包括捕获剂,例如生物素。

在其中通用衔接子包括限制性内切核酸酶识别位点的一个实施例中,除去可以包括使衔接子-模板-衔接子分子与具有结合捕获剂的化合物的表面接触,从而生成结合的扩增的衔接子-模板-衔接子分子,并且将结合的扩增的衔接子-模板-衔接子分子暴露于切割结合的扩增的衔接子-模板-衔接子分子的限制性内切核酸酶,从而生成除去的通用衔接子和多个reDNA,其中除去的通用衔接子结合至表面。在另一个实施例中,分离可以包括使包括除去的通用衔接子和reDNA的混合物与结合捕获剂的化合物接触,其中该化合物附接至表面,并且其中除去的通用衔接子结合至表面。表面的实例是珠粒。该方法进一步包括除去具有结合的除去的通用衔接子的表面,从而导致除去的通用衔接子与reDNA的分离。除去可以进一步包括落在预定大小范围内的reDNA的选择。

在一个实施例中,方法包括提供源自获得自受试者的样品的多个reDNA,其中每个reDNA是模板。该方法可以包括将通用衔接子连接至模板核酸的两端,从而形成包括侧翼是通用衔接子的模板核酸的多个衔接子-模板-衔接子分子。在一个实施例中,通用衔接物包括(i)双链核酸的区域,以及(ii)单链非互补核酸链的区域,该单链非互补核酸链的区域包括至少一个通用引物结合位点,生成测序文库,用于确定模板的至少一部分的序列。

在一个实施例中,单链非互补核酸链的区域进一步包括至少一个通用延伸引物结合位点。在一个实施例中,在单链非互补核酸链的区域的远端的双链核酸的区域作为平端结构终止。在一个实施例中,多个模板包括平端结构。在一个实施例中,在单链非互补核酸链的区域的远端的双链核酸的区域作为3’突出结构终止。在一个实施例中,3’突出结构包括例如具有1至4个核苷酸的突出结构。在一个实施例中,3’突出结构包括T核苷酸的突出。在一个实施例中,模板包括与双链核酸的区域的3’突出结构互补的3’突出结构。

该方法可以进一步包括提供包括多个扩增位点的表面,其中这些扩增位点包括具有游离3’端的附接的单链核酸的至少两个群体,并且在适合产生各自包括来自单个衔接子-模板-衔接子分子的扩增子的克隆群体的多个扩增位点的条件下,使具有扩增位点的表面与多个衔接子-模板-衔接子分子接触。在一个实施例中,多个衔接子-模板-衔接子分子的数量超过了扩增位点的数量,其中衔接子-模板-衔接子分子具有至扩增位点的流体通路,并且其中每个扩增位点包括针对若干个衔接子-模板-衔接子分子的容量。在一个实施例中,接触包括同时进行以下:(i)以平均运输速度,将衔接子-模板-衔接子分子运输至扩增位点,以及(ii)以平均扩增速度,扩增位于扩增位点的衔接子-模板-衔接子分子,其中平均扩增速度超过了平均运输速度。

本文还提供了组合物。在一个实施例中,组合物包括本文所述的衔接子-模板-衔接子分子,其中通用衔接子包括限制性内切核酸酶识别位点,例如SapI、MlyI、或BpuEI。在一个实施例中,组合物包括通过本文所述的方法产生的多个reDNA,并且进一步包括人工生物流体。在一个实施例中,人工生物流体包括人工血浆。

本文进一步提供了在核酸检测检验中使用对照的方法。该方法可以包括:提供多个本文所述的reDNA,对检验样品和reDNA进行核酸检测检验,以及分析来自使用reDNA作为对照的核酸检测检验的结果。核酸检测检验可以包括例如测序或微阵列分析。在一个实施例中,核酸检测检验包括酶解过程。

本文还提供了一种方法,该方法包括:对使用本文所述的方法获得的多个reDNA进行核酸检测检验。例如,reDNA可以是(i)针对文库制备方法的质量的对照,(ii)针对测序仪器的校准对照,(iii)针对阵列仪器的校准对照,(iv)针对核酸测序检验的验证对照,例如针对基于测序的非侵入性产前检验,或基于测序的肿瘤检测检验,或(v)针对基于测序的伴随诊断检验的验证对照。在一个实施例中,伴随诊断检验可以用于确定在样品中的目的遗传性变体和/或序列的存在或身份,从而确定在治疗方案中,治疗性治疗是否适合。

本文所用的术语应当被理解为在相关领域中取其普通含义,除非另有说明。以下阐述了本文所用的若干术语及其含义。

如本文所用的,术语“核酸”旨在与其在本领域的用途一致,并且包括天然存在的核酸或其功能类似物。特别有用的功能类似物能够以序列特异性方式与核酸杂交,或能够用作模板用于具体核苷酸序列的复制。天然存在的核酸通常具有含有磷酸二酯键的主链。类似物结构可以具有替代性主链键,包括多种本领域已知的那些键中的任一者。天然存在的核酸通常具有脱氧核糖(例如发现于脱氧核糖核酸(DNA)中),或核糖(例如发现于核糖核酸(RNA))中。核酸可以含有本领域已知的这些糖的多种类似物中的任一者。核酸可以包括天然的和非天然的碱基。在这方面,天然脱氧核糖核酸可以具有选自由以下组成的组的一个或多个碱基:腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤,并且核糖核酸可以具有选自由以下组成的组的一个或多个碱基:尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤。可以包括在核酸中的有用的非天然碱基是本领域已知的。在本文阐述的方法或组合物的背景下,当关于核酸使用时,术语“模板”和“靶标”旨在作为核酸的语义标识符,并且并不必须超出其另外明确指示,限制核酸的结构或功能。

如本文所用的,术语“模板片段”和相关术语(例如“模板核酸片段”、“模板分子”、和“模板核酸分子”)可互换地使用,是指希望最终用于测序的核酸分子,例如在阵列上,或用来产生组合物。

如本文所用的,术语“衔接子”及其衍生物,例如通用衔接子,通常是指就可以连接至本文所述的核酸分子的任何线性寡核苷酸。在一些实施例中,衔接物基本上不与样品中存在的任何模板序列的3’端或5’端互补。在一些实施例中,适合的衔接物长度是在以下范围内:长度约10-100个核苷酸、约12-60个核苷酸和约15-50个核苷酸。通常,衔接物可以包括核苷酸和/或核酸的任何组合。在一些实施例中,衔接物可以在一个或多个位置处包括一个或多个可切割基团。在一些实施例中,衔接物可以包括一个或多个通用序列。在另一个实施例中,衔接物可以包括与引物(例如通用引物)的至少一部分基本上相同或基本上互补的序列。在一些实施例中,衔接物可以包括指数,本文也称为条形码,从而有助于下游错误校正、鉴定或测序。术语“衔接子”和“衔接物”可互换地使用。

如本文所用的,术语“通用序列”是指两个或更多个核酸分子(例如衔接子-模板-衔接子分子)共有的序列区域,其中这些分子还具有彼此不同的序列区域。在分子的集合的不同成员中存在的通用序列可以允许使用与通用序列的一部分(例如通用延伸引物结合位点)互补的通用捕获核酸的群体来捕获多个不同的核酸。通用延伸引物结合位点的非限制性实例包括与P5和P7引物相同或互补的序列。类似地,在分子的集合的不同成员中存在的通用序列可以允许使用与通用序列的一部分(例如通用引物结合位点)互补的通用引物的群体来复制或扩增多个不同的核酸。因此,通用捕获核酸或通用引物包括可以与通用序列特异性杂交的序列。可以将模板核酸分子修饰为例如如本文所述在不同模板序列的一端或两端处附接通用衔接子(本文也称为衔接子)。在另一个实施例中,在分子的集合的不同成员中存在的通用序列可以允许从其附接的模板分子除去通用衔接子的一部分,例如通用除去序列。

当提及扩增引物例如通用引物延伸引物时,可以使用术语“P5”和“P7”。术语“P5”(P5引物)和“P7”(P7引物)分别是指P5和P7的互补序列。应理解的是,任何适合的扩增引物可以用于本文提出的方法中,并且P5和P7的用途仅是示例性实施例。在流动池上的扩增引物(例如P5和P7)的用途是本领域已知的,如以下文献的披露内容所示例:WO 2007/010251、WO 2006/064199、WO 2005/065814、WO 2015/106941、WO 1998/044151、和WO 2000/018957。例如,任何适合的正向扩增引物,无论是固定的或在溶液中,可以用于本文提出的方法,用于与互补序列杂交和扩增序列。类似地,任何适合的反向扩增引物,无论是固定的或在溶液中,可以用于本文提出的方法,用于与互补序列杂交和扩增序列。本领域普通技术人员应理解,如何设计并且使用适合捕获以及扩增本文提出的核酸的引物序列。

如本文所用的,“扩增(amplify或amplifying)”或“扩增反应”及其衍生用语通常是指任何动作或方法,由此核酸分子的至少一个部分被复制或拷贝成至少一个另外的核酸分子。另外的核酸分子任选地包括与靶核酸分子的至少一些部分基本上相同或基本上互补的序列。靶核酸分子可以是单链或双链的,并且另外的核酸分子可以独立地是单链的或双链的。扩增任选地包括核酸分子的线性的或指数的复制。在一些实施例中,可以使用等温条件进行此类复制;在一些实施例中,此类复制可以包括热循环。在一些实施例中,扩增是多路扩增,包括在单个扩增反应中多个靶序列的同时扩增。在一些实施例中,“扩增”包括单独地或组合地、基于DNA和RNA的核酸的至少一些部分的扩增。扩增反应可以包括本领域普通技术人员已知的任何扩增方法。在一些实施例中,扩增反应包括聚合酶链式反应(PCR)。

如本文所用的,“扩增条件”及其衍生用语,通常是指适合扩增一个或多个核酸序列的条件。此类扩增可以是线性的或指数的。在一些实施例中,扩增条件可以包括等温条件,或可替代地,可以包括热循环条件,或等温条件和热循环条件的组合。在一些实施例中,适合扩增一个或多个核酸序列的条件包括聚合酶链式反应(PCR)条件。典型地,扩增条件是指一种反应混合物,其足以扩增核酸(例如一个或多个靶序列),或用来扩增连接至一个或多个衔接物的扩增的靶序列(例如衔接物连接的扩增的靶序列)。通常,扩增条件包括用于扩增或用于核酸合成的催化剂,例如聚合酶;具有与待扩增的核酸一定程度的互补性的引物;以及核苷酸,例如脱氧核糖核苷三磷酸(dNTP),用来在一旦与核酸杂交的情况下,促进引物的延伸。扩增条件会需要引物与核酸的杂交或退火、引物的延伸、以及其中延伸的引物与经历扩增的核酸序列分离的变性步骤。典型地,但不必须地,扩增条件可以包括热循环;在一些实施例中,扩增条件包括多个循环,其中重复退火、延伸和分离的步骤。典型地,扩增条件包括阳离子,例如Mg++或Mn++,并且还包括离子强度的不同修饰剂。

如本文所用的,“再扩增”及其衍生用语通常是指任何方法,由此经由适合的扩增方法(在一些实施例中,称为“第二”扩增),进一步扩增至少一部分的扩增的核酸分子,由此产生再扩增的核酸分子。第二扩增不需要与由此产生扩增的核酸分子的原始扩增方法相同;也不需要再扩增的核酸分子与扩增的核酸分子完全相同或完全互补;全部所要求的情况就是,再扩增的核酸分子包括至少一部分的扩增的核酸分子或其互补序列。例如,再扩增会涉及与初级扩增相比,使用不同扩增条件和/或不同引物,包括不同靶特异性引物。

如本文所用的,术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis的美国专利号4,683,195和4,683,202的方法,其描述了用于在基因组DNA的混合物中在不克隆或纯化情况下增加目的多核苷酸的区段的浓度的方法。此用于扩增目的多核苷酸的方法由以下组成:向含有所需目的多核苷酸的DNA混合物中引入大大过量的两种寡核苷酸引物,随后在DNA聚合酶的存在下,进行一系列的热循环。两种引物与其对应的目的双链多核苷酸的链互补。首先在更高的温度下使混合物变性,然后将引物退火至目的分子的多核苷酸内的互补序列。退火后,用聚合酶延伸引物,从而形成新配对的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(称为热循环),从而获得所需目的多核苷酸的高浓度的扩增的区段。所需目的多核苷酸的扩增的区段(扩增子)的长度由引物相对于彼此的相对位置决定,并且因此此长度是可控参数。凭借重复该过程,该方法被称为“聚合酶链式反应”(下文的“PCR”)。因为在混合物中,目的多核苷酸的所需扩增的区段变成了主要的核酸序列(在浓度方面),所以它们被称为“PCR扩增的”。在以上讨论的方法的修改中,靶核酸分子可以是使用多个不同引物对(在有些情况下,一个或多个引物对/目的靶核酸分子)的PCR扩增的,由此形成多路PCR反应。

是如本文所定义的,“多路扩增”是指使用至少一种靶特异性引物在样品内的两种或更多种靶序列的选择性的和非随机的扩增。在一些实施例中,进行多路扩增,使得在单个反应容器内扩增靶序列的一些或全部。给定多路扩增的“路(plexy或plex)”通常是指在单个多路扩增期间,扩增的不同靶特异性序列的数量。在一些实施例中,路可以是约12-路、24-路、48-路、96-路、192-路、384-路、768-路、1536-路、3072-路、6144-路或更高。还可能通过若干不同方法(例如凝胶电泳然后是光密度测定法,用生物分析器或定量PCR进行定量,与标记的探针杂交;生物素酰化的引物的掺入然后是亲和素-酶缀合物检测;将32P-标记的脱氧核苷酸三磷酸掺入扩增的靶序列),检测扩增的靶序列。

如本文所用的,术语“引物”及其衍生用语通常是指可以与目的靶序列杂交的任何多核苷酸。典型地,引物功能为可以由聚合酶在其上聚合核苷酸的底物;然而,在一些实施例中,引物可以掺入合成的核酸链,并且提供可以与另一引物杂交的位点,从而启动与合成的核酸分子互补的新链的合成。引物可以包括核苷酸或其类似物的任何组合。在一些实施例中,引物是单链的寡核苷酸或多核苷酸。术语“多核苷酸”和“寡核苷酸”在本文可互换地使用,用来指任何长度的核苷酸的聚合形式,并且可以包括核糖核苷酸、脱氧核糖核苷酸、其类似物、或其混合物。应理解这些术语包括任一种DNA,例如无细胞DNA(cfDNA)、或从核苷酸类似物制造的RNA的等效物、类似物,并且适用于单链的(例如正义链或反义链)和双链的多核苷酸。如本文所用的术语还涵盖cDNA,其是例如通过逆转录酶的作用,从RNA模板产生的互补的或拷贝的DNA。此术语仅指分子的一级结构。因此,术语包括三链的、双链的和单链的脱氧核糖核酸(“DNA”),以及三链的、双链的和单链的核糖核酸(“RNA”)。

如本文所用的,“无细胞DNA”(“cfDNA”)和无细胞循环DNA“cffDNA”可互换地使用,并且是指DNA,当其存在于受试者体内时,与细胞无关联。cfDNA可以源自受试者的不同来源,包括但不限于生物流体,例如血液、血浆、血清、尿液和唾液。

如本文所用的,术语“受试者”是指人类受试者和非人类受试者,例如哺乳动物。尽管本文的实例涉及人类,并且语言是主要针对人类关注点,但是本披露的概念适用于任何动物,并且用于以下领域:兽医学、畜牧学、研究实验室等。

如本文所用的,“样品”及其衍生物是以其最广义使用,并且包括:怀疑包括用于本文所述的方法的模板的任何标本、培养物等。样品可以包括任何生物的(例如临床的或外科的)样品,其含有一种或多种核酸。在一些实施例中,样品是“液体活组织检查”,例如生物流体(例如血液、血浆、血清、尿液、唾液、痰液、灌洗液、脑脊髓液、***、汗液、眼泪、唾液、粪便)的结果。如本文所用的,术语“血液”、“血浆”和“血清”明确地涵盖其级分或处理的部分。类似地,在样品取自活组织检查、拭子、涂片等的情况下,“样品”明确地涵盖源自活组织检查、拭子、涂片等的处理的级分或部分。

术语“母体样品”在本文是指获得自怀孕受试者的生物样品。

如本文所用的,术语“文库”和“测序文库”是指在其5’端共享共有序列,并且在其3’端共享共有序列的模板分子的集合或多个这些模板分子。在其3’端和5’端含有已知共有序列的模板分子的集合还可以称为3’和5’修饰文库。

术语“目的序列”在本文是指在健康个体对比具有本文所述的病症,例如遗传病症或赘生物的个体的情况下,与序列表现中的差异相关联的核酸序列。目的序列可以是在病症中错误表现的,即过度表现的和表现不足的(包括检测到的)染色体上的序列。目的序列可以是已知或怀疑在病症的发展和/或进展中起作用的序列。目的序列还可以是染色体的一部分,或染色体。例如,目的序列可以是在非整倍性病症中,过度表现的染色体或其一部分,或在癌症中表现不足的编码肿瘤抑制因子的基因或其一部分。目的序列可以是病原体基因组例如病毒基因组或微生物基因组的一部分。目的序列可以是遗传性变体,例如单核苷酸多态性。

术语“非整倍性”在本文是指由整个染色体,或染色体的一部分的损失或获得引起的遗传物质的不平衡。

术语“染色体非整倍性”在本文是指由整个染色体的损失或获得引起的遗传物质的不平衡,并且包括种系非整倍性和嵌合性非整倍性。

术语“部分非整倍性”在本文是指由染色体的一部分的损失或获得引起的遗传物质的不平衡,例如部分单体性和部分三体性,并且涵盖源自易位、缺失、和***的不平衡。

如本文所用的术语“赘生物”是指组织的异常生长,如果其形成块,典型地被称为肿瘤。赘生物可以是恶性的(癌症),或良性的(不是癌症)。

如本文所用的,“扩增的衔接子-模板-衔接子分子”及其衍生用语通常是指通过使用靶特异性引物和本文提供的方法扩增衔接子-模板-衔接子序列产生的核酸序列。相对于模板序列,扩增的衔接子-模板-衔接子序列可以是同义的(即正链)或反义的(即负链)中的任一者。

如本文所用的,术语“连接(ligating和ligation)”及其衍生用语通常是指将两个或更多个分子共价连接在一起的方法,例如将两个或更多个核酸分子彼此共价连接在一起。在一些实施例中,连接包括连接核酸的相邻核苷酸之间的切口。在一些实施例中,连接包括在第一核酸分子的一端和第二核酸分子的一端之间形成共价键。在一些实施例中,连接可以包括在一个核酸的5’磷酸基团和第二核酸的3’羟基之间形成共价键,由此形成连接的核酸分子。通常,出于本披露的目的,可以将扩增的靶序列连接至衔接物,从而产生衔接物连接的扩增的把序列。

如本文所用的,术语“平端的”和“末端修复的”可互换地是指生成双链DNA分子的以碱基对终止的两个链的酶解过程,并且并不包括纯化来自平端酶的平端产物。

如本文所用的,术语“加尾”是指将至少一个核苷酸,典型地是腺嘌呤添加至DNA的3’端的酶解过程,并且并不包括纯化来自加尾酶的加尾产物。

如本文所用的,“连接酶”及其衍生用语通常是指能够催化两个底物分子的连接的任何试剂。在一些实施例中,连接酶包括催化核酸的相邻核苷酸之间的切口的连接的酶。在一些实施例中,连接酶包括能够催化一个核酸分子的5’磷酸与另一个核酸分子的3’羟基之间形成共价键由此形成连接的核酸分子的酶。适合的连接酶可以包括但不限于T4DNA连接酶、T4 RNA连接酶、大肠杆菌DNA连接酶。

如本文所用的,“连接条件”及其衍生用语通常是指适合将两个分子彼此连接的条件。在一些实施例中,连接条件适合密封核酸之间的切口或缺口。如本文所用的,术语切口或缺口与本领域中的术语的用途一致。典型地,可以在适当的温度和pH下,在酶,例如连接酶存在下,连接切口或缺口。T4 DNA连接酶可以在约70℃-72℃的温度下,连接核酸之间的切口。

如本文所用的术语“流动池”是指包含一种或多种流体试剂可以流过的固体表面的室。描述了可以容易地用于本披露的方法的流动池和相关流体系统与检测平台的实例,例如在以下文献中:Bentley等人,Nature[自然]456:53-59(2008)、WO 04/018497;US 7,057,026;WO 91/06678;WO 07/123744;US 7,329,492;US 7,211,414;US 7,315,019;US 7,405,281,和US 2008/0108082。

如本文所用的,当关于核酸使用时,术语“扩增子”意指拷贝核酸的产物,其中该产物具有与核酸的核苷酸序列的至少一部分相同或互补的核苷酸序列。可以通过使用核酸、或其扩增子作为模板的任何多种扩增方法,包括例如PCR、滚环扩增(RCA)、连接延伸、或连接链式反应,产生扩增子。扩增子可以是核酸分子,其具有具体核苷酸序列的单个拷贝(例如PCR产物),或者核苷酸序列的多个拷贝(例如RCA的尾尾相接产物)。典型地,靶核酸的第一扩增子是互补拷贝。后续的扩增子是在产生第一扩增子后从靶核酸或者从第一扩增子产生的拷贝。后续的扩增子可以具有与靶核酸基本上互补、或与靶核酸基本上相同的序列。

如本文所用的,术语“扩增位点”是指阵列中或阵列上的位点,该处可以产生一个或多个扩增子。可以将扩增位点进一步配置为含有、持有或附接该位点处产生的至少一个扩增子。

如本文所用的,术语“阵列”是指可以根据相对位置,彼此区别的位点的群体。位于阵列不同位点的不同分子可以根据阵列中位点的位置彼此区分开。阵列的单个位点可以包括具体类型的一个或多个分子。例如,位点可以包括具有具体序列的单个靶核酸分子,或位点可以包括具有相同序列(和/或其互补序列)的若干个核酸分子。阵列的位点可以具有位于同一基底上的不同特征。示例性特征包括但不限于:基底中的孔、基底中或基底上的珠粒(或其他颗粒)、来自基底的突出、基底上的脊或基底中的通道。阵列的位点可以是各自荷载不同分子的分开的基底。可以根据与基底相关联的表面上的基底的位置,或根据液体或凝胶中基底的位置,鉴定附接至分开的基底的不同分子。其中分开的基底位于表面上的示例性阵列包括但不限于在孔中具有珠粒的那些。

如本文所用的,当关于位点和核酸材料使用时,术语“容量”意指能占据位点的核酸材料的最大量。例如,该术语可以指在具体条件下,能占据位点的核酸分子的总数。例如,可以使用的其他度量还包括核酸材料的总质量,或在具体条件下,能占据位点的具体核酸序列的拷贝的总数。典型地,靶核酸的位点的容量将基本上等同于靶核酸的扩增子的位点的容量。

如本文所用的,术语“捕获剂”是指能够附接、保留或结合靶分子(例如靶核酸)的材料、化学物质、分子或其部分。示例性捕获剂包括但不限于与靶核酸的至少一部分互补的捕获核酸、受体-配体结合对的成员(例如亲和素、链霉亲和素、生物素、凝集素、碳水化合物、核酸结合蛋白、表位、抗体等)(其能够结合靶核酸(或与其附接的连接部分)),或能够与靶核酸(或与其附接的连接部分)形成共价键的化学试剂。

如本文所用的,术语“克隆群体”是指相对于具体核苷酸序列为同源的核酸的群体。同源序列典型地是至少10个核苷酸长,但是可以甚至更长,包括例如至少50、100、250、500或1000个核苷酸长。克隆群体可以源自单个靶核酸或模板核酸。典型地,克隆群体中的所有核酸将具有相同的核苷酸序列。应理解的是,在克隆群体中,在不偏离克隆性的情况下会存在少量突变(例如由于扩增假象)。

如本文所用的,术语“运输”是指分子穿过流体的移动。术语可以包括被动运输,例如沿着其浓度梯度,分子的移动(例如被动扩散)。术语还包括主动运输,由此分子可以沿着其浓度梯度移动,或逆其浓度梯度移动。因此,运输可以包括在所需方向,应用能量来移动一个或多个分子,或移动至所需位置,例如扩增位点。

如本文所用的,当关于对象的集合使用时,术语“各自”旨在鉴定集合中的单个对象,但是并不必须指集合中的每个对象,除非上下文另外清楚地指明。

如本文所用的,在组合物制品、核酸、或核的背景下,“提供”意指制造组合物、制品、核酸或核,购买组合物、制品、核酸、或核,或以其他方式获得化合物、组合物、制品、或核。

术语“和/或”意指所列举的要素的一个或所有或所列举的要素的任何两个或更多个的组合。

词语“优选的”和“优选地”是指本披露的在某些情况下可以提供某些益处的实施例。然而,在相同或其他环境下,其他实施例也可以是优选的。另外,对一个或多个优选实施例的描述不暗示其他实施例是无用的,并且不意图从本披露的范围中排除其他实施例。

术语“包含”及其变体,在这些术语在本说明书和权利要求书中出现的情况下,不具有限制性含义。

应当理解,当用语言“包括(include、includes、或including等)”来说明实施例时,还提供了就“由……组成”和/或“主要由……组成”而言所说明的其他类似实施例。

除非另外说明,“一个(a)”、“一种(an)”、“该(the)”、和“至少一个(at leastone)”可互换地使用并且意指一个或多于一个。

并且在此,通过端点详述的数值范围包括该范围内所归纳的所有数值(例如1至5包括1、1.5、2、2.75、3、3.80、4、5等)。

在本说明书中提及“一个实施例”或“实施例”、“某些实施例”或“一些实施例”等意味着结合该实施例描述的具体特征、构型、构成或特性包括在本披露的至少一个实施例中。因此,在本说明书中不同位置处此类短语并不必须提及本披露的相同实施例。此外,特定的特征、构型、构成、或特性可以在一个或多个实施例中以任何合适的方式组合。

对于本文中披露的、包括分离步骤的任何方法,这些步骤可以按任何可行顺序实施。并且,如果适宜,两个或更多个步骤的任何组合可以同时实施。

本披露的以上概述不意在描述本披露的每个所披露的实施例或每一个实施方式。以下本说明书更加具体地示例了示意性实施例。贯穿本申请,在几个地方中,通过一系列实例提供指导,这些实例能以多种组合形式使用。在每种情况下,所述系列仅作为代表性群组发挥作用并且不应当解释为排他性系列。

附图说明

当结合以下附图阅读时,可以最好地理解以下详细描述的本披露的说明性实施例。

图1显示了根据本披露的一般说明性方法的总体框图。

图2显示了在图1的方法中总体上说明的用于添加通用衔接子、扩增、以及除去衔接子的一个实施例的更详细图。

图3显示了可以根据本文所述的不同实施,产生的衔接子-模板-衔接子分子30的示意图。描绘的分子30包括双链模板区域31和在各端附接的通用衔接子32。在描绘的实施例中,通用衔接子32包括通用除去序列33和通用引物结合位点34。

图4显示了可以根据本文所述的不同实施例产生的衔接子-模板-衔接子分子40的示意图。描绘的分子40包括双链模板区域41和在各端附接的通用衔接子42。通用衔接子包括单链区域43和双链区域44,在描绘的实施例中,通用衔接子42包括通用除去序列45、通用延伸引物结合位点46、和样品特异性索引47。

图5显示了可以根据本文所述的不同实施例产生的衔接子-模板-衔接子分子50的示意图。描绘的分子50包括双链模板区域51和在各端附接的通用衔接子52。在描绘的实施例中,通用衔接子52包括通用引物结合位点53。

图6显示了可以根据本文所述的不同实施例产生的衔接子-模板-衔接子分子60的示意图。描绘的分子60包括双链模板区域61和在各端附接的通用衔接子62。在描绘的实施例中,通用衔接子62包括通用引物结合位点63。结合通用引物结合位点63的通用引物64也显示在描绘的实施例中。在描绘的实施例中,通用引物64包括样品特异性索引65和通用延伸引物结合位点66。

示意图不一定是按比例绘制的。附图中使用的相同标号可以是指相同的部件。然而,应理解的是,在一个给定附图中使用一个标号来指代一个部件并非意图限制该部件在另一个附图中被相同标号标记。此外,使用不同标号来指代部件并非意图表示不同标号的部件不能与其他标号的部件相同或类似。

说明性实施例的详细说明

本文提供了用于制造文库的方法,所述文库可以用作阳性或阴性对照来确定重复性、证明系统安装资格、进行平台周期性能鉴定、证明结果有资格用于临床测定等。在一个实施例中,该方法包括提供包括片段核酸(其可以用作模板)的对照样品(图1,框图10),并且添加通用衔接子至核酸片段的各端(图1,框图11;图2,框图21)。添加的通用衔接子的结果显示在图2,框图22中。扩增侧翼是衔接子的片段(图1,框图12),从而生成扩增产物,例如PCR产物(图2,框图23);然而,与针对确定文库中片段的序列的方法相反,随后除去衔接子(图1,框图13;图2,框图24)。结果是包括最初存在于对照样品中的片段核酸的核酸的扩增文库(图2,框图25)。扩增的片段的此群体在本文也可互换地称为再生的模板核酸、再生的DNA、或reDNA。此扩增的文库可以用作标准方法中的对照,这些标准方法用于例如确定检验样品是否包括非整倍性。例如,可以获得用来测定是否存在非整倍性的检验样品(图1,框图14),并且准备该检验样品用于测序,例如添加衔接子(图1,框图15)。在同一方法中,对照还可以添加衔接子(图1,框图15),并且处理检验样品和对照样品两者,用于固定和测序(图1,框图16)。源自除去衔接子的reDNA片段,例如reDNA文库(图1,框图13),提供了很多优点,包括与原始生物样品中观察到的大小类似或相同的大小的片段的群体,以及与原始生物样品类似或相同的基因组覆盖度。进一步有利地是,与会留下附接至片段的末端的衔接物(或其部分)的其他处理方法不同,本文提出的方法并不留下任何衔接子的片段,或用来扩增材料的方法的副产物。

本文提供的文库可以用于确定样品(对照样品或检验样品)中任何目的序列的拷贝数变异(CNV),该样品包括已知或怀疑差别在于一种或多种目的序列的量的模板的混合物。目的序列包括已知或怀疑与病症相关联的、范围从数十个碱基到数百个碱基,到数千万个碱基,以及到整个染色体的基因组序列。

在一个实施例中,该方法包括提供多个双链模板核酸中的一个或多个,例如对照样品(图1,框图10)、reDNA(衔接子除去的结果,图1,框图13)、或检验样品(图1,框图14)。模板核酸可以基本上是已知或未知序列的任何核酸。例如,它可以是基因组DNA的片段。在一个实施例中,模板核酸是无细胞DNA(cfDNA)。在一个实施例中,模板可以源自生物样品。在一个实施例中,可以处理模板,使得它们适合通过在每个模板片段的末端处放置通用序列(例如存在于通用衔接子中的序列)来进行扩增。在一个实施例中,还可以将模板片段进行处理以确定序列,其中测序可以确定整个模板或其一部分的序列。还可以通过逆转录成cDNA,从RNA样品获得模板。

模板可以源自来自样品的双链DNA(dsDNA)形式(例如基因组DNA片段、cfDNA、PCR和扩增产物等),或可以已源自来自样品的单链形式,如DNA或RNA,并且已经转化成dsDNA形式。在一些实施例中,例如其中模板将用作对照的实施例中(例如图1,框图10),来自核酸样品的多核苷酸分子的序列可以是已知的。在其他实施例中,例如其中模板来自检验样品的实施例中,来自核酸样品的多核苷酸分子可以是未知的(例如图1,框图14)。

在一个实施例中,来自样品的模板是RNA分子。在此实施例的一个方面,首先使用本领域已知的技术,将分离自样品的RNA转化成双链DNA。

在一个实施例中,来自样品的模板是DNA分子。在一个实施例中,模板代表生物体的整个遗传互补序列,并且是基因组DNA分子,这些基因组DNA分子包括内含子和外显子序列两者,以及非编码调节序列,例如启动子和增强子序列。在一个实施例中,模板代表多核苷酸序列的具体子集,例如具体染色体或cfDNA。仍又更具体地,模板是人类,例如人类基因组DNA分子、人类染色体、或人类cfDNA。可以在任何随机片段化方法之前或之后,以及在通用衔接物序列的连接之前或之后,化学地或酶促地处理模板。

在一个实施例中,样品可以来自单个个体。单个个体的实例是孕妇。孕妇所怀的胎儿可以是具有或不具有目的序列,例如遗传病症的胎儿。用于确定妇女所怀的胎儿是否具有遗传病症的方法可以是使用本文披露的方法确定的,并且方法是技术人员已知的,包括羊膜穿刺和测序方法(Lo等人,WO 2009/013496;Quake等人,WO 2007/092473;Rava等人,美国专利公开2012/0270739)。单个个体的另一实例是已知具有或怀疑具有病症的人,病症例如但不限于遗传病症、遗传性障碍、遗传突变、赘生物、自身免疫性疾病、或移植。来自单个来源的样品可以含有遗传物质的两种或更多种不同形式,例如获得自母体受试者的母体的和胎儿的核酸,或获得自具有例如赘生物的受试者的正常的和赘生物的核酸。此外,来自单个来源的样品可以含有遗传物质的多种不同形式,例如怀有双胞胎、三胞胎等的怀孕受试者,或具有多个不同的赘生物的受试者。在一些实施例中,遗传物质的多种不同形式可以来自受试者和侵入性生物体,例如寄生虫、细菌或病毒感染等。

在一个实施例中,样品可以用作对照样品。对照样品是被处理而生成可以用作对照的reDNA片段的群体,例如reDNA文库(例如衔接子除去的结果,图1,框图13)的样品。用于从样品制备文库的方法是已知的(参见例如Gormley等人,US 7,741,463;Rava等人,美国专利公开2012/0270739)。典型地,在扩增的文库中目的序列的拷贝数变异是已知的,或被确定,使得该样品可以用作对照。例如,如果样品来自孕妇,则可以确定胎儿的目的序列的拷贝数变异。如果胎儿具有具体病症,例如非整倍性,则样品可以用作阳性对照。可替代地,如果胎儿不具有非整倍性,则样品可以用作阴性对照。如本文所述并且示意性地显示在图1中(参见框图10-13),对照样品被处理以生成扩增的文库。

在另一个实施例中,样品是检验样品(例如图1,框图14)。在一个实施例中,检验样品是一种样品,其被处理以确定足够数量的核苷酸的序列,从而确定检验样品中目的序列的拷贝数变异。这可以指示健康个体,或具有本文所述的遗传病症的个体。在一个实施例中,检验样品是一种样品,其被处理以确定足够数量的核苷酸的序列,从而确定目的病原体序列的存在,这可以指示例如病毒或微生物感染。在一个实施例中,检验样品是一种样品,其被处理以确定足够数量的核苷酸的序列从而确定一种或多种遗传性变体或目的序列的存在,例如单核苷酸多态性(SNP)、***、缺失、重排、或等位基因的特定突变。遗传性变体(例如SNP或突变)的鉴定可以用作伴随诊断检验,从而确定对于特定个体的疗法的适用性。

目的序列的实例包括遗传病症,例如但不限于非整倍性。在一些实施例中,非整倍性是完全的染色体三体性或单体性,或部分的三体性或单体性。部分非整倍性是由染色体的一部分的损失或获得引起的,并且涵盖源自不平衡易位、不平衡倒位、缺失和***的染色体不平衡。伴随终生的最常见的已知非整倍性是21三体性,即唐氏综合征(DS),它是由染色体21的一部分或全部的存在引起的。少见地,DS可以由遗传性或散发性缺陷引起,由此染色体21的全部或一部分的额外拷贝变得附接至另一个染色体(通常是染色体14),从而形成单畸变染色体。DS与以下相关联:智能障碍、严重的学习困难、和由长期健康问题(例如心脏病)引起的过大死亡率。具有已知临床显著性的其他非整倍体包括爱德华综合征(lS三体性)和帕塔综合征(13三体性),在生命的前几个月内,这些病经常是致命的。与性染色体的数量相关联的异常也是已知的,并且包括在女性新生儿中的X单体性,例如特纳综合征(XO)、和X三体综合征(XXX),以及在男性新生儿中的柯林菲特综合征(XXY)和XYY综合征,这些都与不同表型相关联,包括不育和智力技能方面的下降。

三体性可以是21三体性(T21;唐氏综合征)、lS三体性(TIS;爱德华氏综合征)、16三体性(Tl 6)、22三体性(T22;猫眼综合征)、15三体性(T15;普来德-威利综合征)、13三体性(T13;帕塔综合征)、S三体性(TS;瓦克尼综合征)和XXY(柯林菲特综合征)、XYY、或XXX三体性。应当理解,不同的其他三体性和部分三体性可以存在于来自单个个体的样品中。这些包括但不限于1q32-44部分三体性、具有三体性的9p三体性、4嵌合三体性、17p三体性、4q26-qter部分三体性、9三体性、部分2p三体性、部分lq三体性、和/或部分6p三体性/6q单体性。

可以存在于来自单个个体的样品中的其他遗传病症包括但不限于染色体X单体性、和部分单体性,例如13单体性、15单体性、16单体性、21单体性、和22单体性,已知这些涉及怀孕流产。1Sp单体性是少见的染色体障碍,其中染色体1S的短臂(p)的全部或一部分缺失(单体的)。典型地,该障碍特征在于身材矮小症、不同程度的智力迟钝、言语迟缓、颅骨和面部(颅面的)区域的畸形、和/或另外的身体异常。相关联的颅面缺陷可以在各病例之间,在范围和严重性方面大大变化。由染色体15的拷贝的结构或数量方面的改变引起的病症包括安格曼综合征和普来德-威利综合征,它们涉及染色体15的同一部分(15q 11-q 13区域)的基因活性的丧失。应当理解,在父母携带者中,若干易位和微缺失可以是无症状的,但是在后代中仍可以引起遗传疾病。例如,携带15q 11-q 13微缺失的健康母亲会生出具有安格曼综合征(一种严重的神经退行性障碍)的孩子。因此,本披露可以用于鉴定胎儿中的这样一种缺失。部分13q单体性是少见的染色体障碍,它是染色体13的长臂(q)的一部分失去时的结果(单体的)。具有部分13q单体性的新生儿会表现出低体重、头部和面部(颅面的区域)的畸形、骨骼异常(特别是手和足)、以及其他身体异常。智力迟钝是此病症的特性。在出生时具有此障碍的个体中,在婴儿期的死亡率非常高。由于没有明显的原因(散发性),几乎所有的部分13q单体性的病例都是随机发生的。22q 11.2缺失综合征,也称为迪乔治氏综合征,是由染色体22的小部分的缺失引起的综合征。缺失(22q 11.2)发生处接近染色体对之一的长臂上的染色体的中部。此综合征的特征广泛变化,即使在同一家族的成员之间,并且影响身体的很多部分。特性体征和症状可以包括出生缺陷,例如先天性心脏病、上颚中的缺陷,最常见涉及伴随闭合的神经肌肉问题(腭咽闭合不全)、学习困难、面部特征方面的轻微差异、以及多发性感染。染色体区域22q 11.2中的微缺失与精神***症的20至30倍的增加相关联。在一个实施例中,部分单体性可以是18p单体性、染色体15的部分单体性(15qll-q13)、部分13q单体性、以及染色体22的部分单体性。

在一个实施例中,具有非整倍性的单个个体是胎儿。在一个实施例中,具有非整倍性的单个个体是母亲。可以存在于母亲中的非整倍性的实例包括但不限于小额外标记染色体(SMC)的嵌合;t(l 1;14)(p15;p13)易位;不平衡易位t(8;11)(p23.2;pl5.5);1lq23微缺失;史密斯-马吉利综合征17pl 1.2缺失;22q13.3缺失;Xp22.3微缺失;10p14缺失;20p微缺失,迪乔治氏综合征[del(22)(qll.2qll.23)],威廉斯综合征(7qll.23和7q36缺失);lp36缺失;2p微缺失;神经纤维瘤类型1(17ql 1.2微缺失),Y q缺失;沃尔夫-赫奇霍恩综合征(WHS,4p16.3微缺失);lp36.2微缺失;llq14缺失;19q13.2微缺失;鲁宾斯坦-泰比综合征(16p13.3微缺失);7p21微缺失;米勒-迪克综合征(17p13.3),17pl 1.2缺失;以及2q37微缺失。

除了出生缺陷的早期确定,本文所述的方法可以应用于确定基因组内遗传序列的表现方面的任何异常。已经显示来自癌症患者的血浆和血清DNA含有可测量的肿瘤DNA,这些DNA可以被回收并且用作肿瘤DNA的替代来源。肿瘤特征在于非整倍性,或不当数量的基因序列或甚至整个染色体。因此,在来自个体的样品中,给定序列(即目的序列)的量方面的差异的确定可以用于诊断医学病症,例如赘生物。赘生物的实例包括但不限癌、肉瘤、淋巴瘤、白血病、生殖细胞肿瘤和母细胞瘤。具体癌症包括但不限于肺癌、乳腺癌、和***癌。在癌症患者中,循环cfDNA中可以确定的与癌症相关联的基因组不稳定性的鉴定是潜在的诊断和预后工具。目的序列包括已知或怀疑在赘生物的发展和/或进展中起作用的序列。目的序列的实例包括在如本文所述的癌性细胞中扩增或缺失的核酸序列。

据信很多实体瘤,例如乳腺癌,通过若干遗传畸变的累积,从起始进展至转移。[Sato等人,Cancer Res.[癌症研究],50:7184-7189[1990];Jongsma等人,J Clin Pathol:Mol Path[临床病理学杂志:分子病理学]55:305-309[2002])]。当它们累积时,此类遗传畸变会赋予增殖优势、遗传不稳定性和迅速产生抗药性的伴随能力、以及增强的血管发生和蛋白水解。遗传畸变会影响隐性“肿瘤抑制基因”或显性作用癌基因。据信导致杂合性丢失(LOH)的缺失和重组通过暴露突变的肿瘤抑制等位基因,在肿瘤进展中起主要作用。

已经在诊断具有恶性肿瘤(包括但不限于肺癌(Pathak,等人Clin Chem[临床化学]52:1833-1842[2006])、***癌(Schwartzenbach等人,Clin Cancer Res[临床癌症研究]15:1032-8[2009])、和乳腺癌(Schwartzenbac等人,在breast-cancer-research.com/content/11/5/R71在线可得[2009]))的患者的循环中发现了cfDNA。在癌症患者中,循环cfDNA中可以确定的与癌症相关联的基因组不稳定性的鉴定是潜在的诊断和预后工具。在一个实施例中,本披露的方法评估了样品中目的序列的CNV,该样品包括源自怀疑或已知具有癌症(例如癌、肉瘤、淋巴瘤、白血病、生殖细胞肿瘤和母细胞瘤)的受试者的模板的混合物。在一个实施例中,样品是血浆样品,该血浆样品源自(处理的)外周血并且包括源自正常的和癌性的细胞的cfDNA的混合物。在另一个实施例中,需要确定是否存在CNV的生物样品源自模板的混合物,该混合物源自来自其他生物流体的癌性的和非癌性的细胞,这些生物流体包括但不限于血清、汗液、眼泪、尿液、痰液、耳流液、淋巴、唾液、脑脊髓液、灌洗液、骨髓悬浮液、***流液、经子宫颈灌洗、脑液、腹水、乳、呼吸道、肠道和泌尿生殖道的分泌物、以及白细胞分离术样品、或在组织的活组织检查、拭子或涂片中。

典型地,与人类实体瘤相关联的显性作用基因通过过表达或改变的表达发挥其作用。基因扩增是导致基因表达上调的常见机制。来自细胞遗传学研究的证据指示在超过50%的人类乳腺癌中发生显著扩增。最值得注意的是,位于染色体17(17(17q21-q22))上的原癌基因人类表皮生长因子受体2(HER2)的扩增,导致在细胞表面上HER2受体的过表达,致使在乳腺癌和其他恶性肿瘤中的过量并且失调的信号传导(Park等人,Clinical BreastCancer[临床乳腺癌]8:392-401[2008])。在其他人类恶性肿瘤中,已经发现多种癌基因被扩增。在人类肿瘤中,细胞癌基因的扩增的实例包括以下的扩增:c-myc(在前髓细胞性白血病细胞系HL60中和在小细胞肺癌细胞系中),N-myc(在原发性成神经细胞瘤(III期和IV期)、成神经细胞瘤细胞系、视网膜母细胞瘤细胞系和原发性肿瘤、以及小细胞肺癌系和肿瘤中),L-myc(在小细胞肺癌细胞系和肿瘤中),c-myb(在急性髓细胞性白血病中和在结肠癌细胞系中),c-erbb(在鳞状细胞癌细胞、和原发性神经胶质瘤中),c-K-ras-2(在肺、结肠、膀胱、和直肠的原发癌中),N-ras(在乳腺癌细胞系中)(Varmus H.,Ann Rev Genetics[遗传学年鉴]18:553-612(1984)[cited in Watson等人,Molecular Biology of theGene[基因的分子生物学](第4版;本杰明/卡明斯出版公司(Benjamin/CummingsPublishing Co.)1987)中引用]。

涉及肿瘤抑制基因的染色体缺失可能在实体瘤的发展和进展中起重要作用。位于染色体13q14中的视网膜母细胞瘤肿瘤抑制基因(Rb-1)是最广泛地表征的肿瘤抑制基因。Rb-1基因产物,一种105kDa的核磷蛋白,明显地在细胞周期调节中起重要作用(Howe等人,Proc Natl Acad Sci(USA)[美国国家科学院院刊]87:5883-5887[1990])。由于点突变或染色体缺失,造成两个等位基因的灭活,引起Rb蛋白的改变的或损失的表达。已经发现,Rb-i基因改变不仅存在于视网膜母细胞瘤中,而且还存在于其他恶性肿瘤中,例如骨肉瘤、小细胞肺癌(Rygaard等人,Cancer Res[癌症研究]50:5312-5317[1990)])和乳腺癌。限制性片段长度多态性(RFLP)研究已经指示,此类肿瘤类型经常已经在13q丢失杂合性,表明由于总的染色体缺失,Rb-1等位基因之一已经丢失(Bowcock等人,Am J Hum Genet[美国人类遗传学杂志],46:12[1990])。包括涉及染色体6和其他同伴染色体的重复、缺失和不平衡易位的染色体1异常指示,染色体1的区域,特别是lq21-lq32和lpl 1-13,可能携带与骨髓组织增殖性赘生物的慢性期和晚期两者致病上相关的癌基因或肿瘤抑制基因(Caramazza等人,Eur J Hematol[欧洲血液学杂志]84:191-200[2010])。骨髓组织增殖性赘生物还与染色体5的缺失相关联。染色体5的完全丢失或中间缺失是骨髓增生异常综合征(MDS)中最常见的核型异常。与具有另外的核型缺陷的那些患者(其倾向于发展骨髓组织增殖性赘生物(MPN)和急性髓细胞性白血病)相比,分离的del(5q)/5q-MDS患者具有更有利的预后。不平衡的染色体5缺失的频率已经导致这样的想法,Sq携带的一种或多种肿瘤抑制基因在造血干细胞/祖细胞(HSC/HPC)的生长控制中具有基础性作用。常见缺失区域(CDR)的基因作图位于5q31和5q32鉴定的候选肿瘤抑制基因中部,这些候选肿瘤抑制基因包括核糖体亚基RPS14、转录因子Egr/Krox20和细胞骨架重塑蛋白,α-连环蛋白(Eisenmann等人,Oncogene[癌基因]28:3429-3441[2009])。新鲜肿瘤和肿瘤细胞系的细胞遗传学和等位基因分型研究已经显示,来自染色体3p上的若干不同区域的等位基因丟失(包括3p25、3p21-22、3p21.3、3pl2-13和3p14)是在肺、***、肾、头和颈部、卵巢、子宫颈、结肠、胰腺、食管、膀胱以及其他器官的广泛的主要上皮癌中涉及的最早的和最常见基因组异常。若干肿瘤抑制基因已经作图至染色体3p区域,并且被认为是在癌的发展中,中间缺失或启动子过度甲基化先于3p或整个染色体3的丢失(Angeloni D.,Briefings Functional Genomics[功能基因组学简报]6:19-39[2007])。

具有唐氏综合征新生儿和儿童通常伴随先天性一过性白血病并且具有急性髓细胞性白血病和急性淋巴母细胞性白血病的增加的风险。在白血病、淋巴瘤、和实体瘤中,在许多结构畸变,例如易位、缺失、和扩增中可能涉及携带约300个基因的染色体21。此外,已经鉴定了在肿瘤发生中起重要作用的位于染色体21上的基因。体细胞数量上和结构上的染色体21畸变与白血病相关联,并且特定基因(包括RUNXl、TMPRSS2、和TFF,其位于21q中)在肿瘤发生中起作用(Fonatsch C Gene Chromosomes Cancer[基因、染色体和癌症]49:497-508[2010])。

目的序列的其他实例包括病原体序列。病原体可以是原核病原体、真核病原体、或病毒病原体。原核病原体的是包括革兰氏阴性病原体和革兰氏阳性病原体。真核病原体的实例包括真菌、酵母、和原生动物病原体。很多病原体的基因组是已知的,并且选择特异序列作为目的序列用于鉴定病原体的存在对于本领域普通技术人员而言是常规的。

目的序列的实例还包括遗传性变体,例如单核苷酸多态性(SNP)、***、缺失、重排、或等位基因的特定突变。鉴定这样一个目的序列是否存在可以用于伴随诊断检验,例如用于预测对于特定个体而言,疗法是否会是有益的,预测治疗剂的有效剂量,用于监测和/或调节疗法,以及用于为特定个体定制疗法。

样品可以包括高分子量材料,例如基因组DNA(gDNA)。样品可以包括低分子量材料,例如cfDNA。在另一个实施例中,低分子量材料包括酶促地或机械地片段化的DNA。

在一些实施例中,将基因组DNA用作模板,并且将其片段化成可用长度,例如数百个碱基对的长度。在其他实施例中,将cfDNA用作模板,并且典型地并不需要片段化,因为cfDNA是作为短片段存在。例如,胎儿cfDNA作为<300bp的片段在血流中循环,并且已经估计母体cfDNA作为约500和1,000bp之间的片段循环(Li等人,2004,Clin Chem[临床化学],50:1002-1011)。随机片段化是指通过酶的、化学的或机械的手段以无序方式将来自样品的多核苷酸分子片段化。此类片化方法是本领域已知的,并且使用标准方法(Sambrook和Russell,Molecular Cloning,A Laboratory Manual[分子克隆实验指南],第三版)。在一个实施例中,片段化使用Gunderson等人(WO 2016/130704)中披露的方法。为了清楚起见,经由此类小片段的特异性PCR扩增产生大片的核酸的小片段并不等同于将大片的核酸片段化,因为大片的核酸序列仍保持完整(即未通过PCR扩增被片段化)。此外,设计随机片段化来产生多个片段,不考虑包括断裂包含的和/或断裂周围的核苷酸的序列同一性或位置。更具体地,通过机械手段,例如雾化或超声处理来进行随机片段化,从而产生长度约50个碱基对至长度约1500个碱基对,仍更具体地,长度50-700个碱基对,仍更具体地,长度50-400个碱基对的片段。更具体地,该方法可以用于产生长度从50-150个碱基对的更小片段。

通过机械手段(例如雾化、超声处理和/或水切)进行多核苷酸分子的片段化,生成多个片段,其是平的和3’-与5’-突出末端(包括缺乏5’磷酸的末端)的不均匀混合物。此外,cfDNA还包括平的和3’-与5’-突出末端的不均匀混合物。因此在一些实施例中,希望通过末端修复来修复待用于本文所述的方法中的模板的末端。可以使用本领域已知的方法或试剂盒完成末端修复,从而产生末端,其针对***到例如克隆载体的平端位点中优化。在一个实施例中,核酸的群体的片段末端是平端的,并且任选地,片段末端也是磷酸化的。可以例如使用多核苷酸激酶经由酶处理来引入磷酸部分。

在一个实施例中,通过加尾,将模板制备为具有单个突出核苷酸。例如,可以使用某些类型的DNA聚合酶(例如Taq聚合酶或Klenow exo minus聚合酶,其具有非模板依赖性末端转移酶活性,将单个脱氧核苷酸,例如脱氧腺苷(A)添加至DNA分子,例如PCR产物的3’端),完成加尾。此类酶可以用于添加单个核苷酸‘A’至双链靶片段的每个链的平端的3’末端。因此,可以通过用Taq或Klenow exo minus聚合酶进行反应,将‘A’添加至双链靶片段的每个末端修复的链的3’末端,同时通用衔接子可以是具有存在于通用衔接子的双链核酸的每个区域的3’末端上的兼容‘T’突出的T-构建体。此末端修饰还防止自身连接作用,使得偏向于形成组合的连接的衔接子-模板-衔接子分子。

本文所述的模板可以包括在每个末端的通用衔接子,并且这样一个分子在本文本成为衔接子-模板-衔接子分子。用于制造衔接子-模板-衔接子分子的方法包括将通用衔接子附接至双链模板分子的每个末端。双链模板分子可以来自对照样品(图1,框图10)、检验样品(图1,框图14)、或reDNA片段的群体,例如文库(图1,框图13)。可以使用连接,通过标准文库制备技术进行附接。

在一个实施例中,可以通过首先连接相同的通用衔接子分子从而形成衔接子-模板-衔接子分子来处理双链模板核酸。通用衔接子分子包括双链核酸的区域。在一个实施例中,通用衔接子还包括单链非互补核酸链的区域。具有双链的或单链的区域的通用衔接子也被称为“错配衔接子”,以下限定了其一般特征,并且进一步描述于Gormley等人(美国专利7,741,463)和Bignell等人(美国专利8,053,192)中。

通用衔接物的双链区域是短双链区域,典型地包括5个或更多个连续的碱基对。此术语是指核酸的双链区域,其中两个链被退火,并且并不意味着具体结构构象。如本文所用的,当关于核酸分子使用时,术语“双链的”意指核酸分子中基本上所有核苷酸都是与互补核苷酸形成氢键。应当理解,在双链区域内可能容忍一个或多个核苷酸错配,条件是在标准连接条件下,两个链可以形成稳定的双链体。部分地双链化的核酸的至少10%、至少25%、至少50%、至少60%、至少70%、至少80%、至少90%、或至少95%的核苷酸可以与互补核苷酸形成氢键。在一个实施例中,在双链区域中,通用衔接物的两个链是100%互补的。

通常,有利的是双链区域尽可能短,而不损失功能。在此上下文中,“功能”是指在技术读者已知的、对于酶催化的核酸连接反应而言标准反应条件(在适用于酶的连接缓冲液中,4℃至25℃的范围内的温度下孵育)下,双链区域形成稳定的双链体的能力,使得在通用衔接物连接至模板分子期间,形成通用衔接物的两个链保持部分退火。在典型地用于引物延伸或PCR反应的退火步骤的条件下,双链区域不必要是稳定的。

因为相同的通用衔接物连接至每个靶分子的两端,所以每个衔接子-模板-衔接子分子中的模板序列将侧翼是源自通用衔接物的双链区域的互补序列。双链区域越长,并且因此衔接子-模板-衔接子构建体中的源自其的互补序列越长,则在用于引物延伸和/或PCR的退火条件下,衔接子-模板-衔接子构建体在内部自身互补性的这些区域中能够折回并且与其自身碱基配对的可能性就越大。因此,通常优选的是,双链区域长度要不大于20、不大于15、或不大于10个碱基对,从而减小这一作用。在一些实施例中,通过包括与标准Watson-Crick碱基对相比表现出更强碱基配对的非天然核苷酸,双链区域的稳定性可能增加,并且因此其长度潜在地减小。

用于本文使用的通用衔接子将通常包括形成衔接子的“可连接”末端(即在连接反应中,与双链靶片段连接的末端)的双链区域。通用衔接子的可连接末端可以是平的,或者在其他实施例中,一个或多个核苷酸的短5或3’突出可以存在,从而协助/促进连接。在通用衔接物的可连接末端处的5’末端核苷酸典型地被磷酸化,从而能够与靶多核苷酸的3’羟基形成磷酸二酯键。

通用衔接子的双链区域典型地包括通用除去序列和通用引物结合位点。在一些实施例中,通用除去序列可以用作通用引物结合位点。任选地,可以存在一个或多个其他通用序列,例如通用延伸引物结合位点。

通用除去序列,也称为除去序列,是可以用于从通用衔接子结合的模板除去通用衔接子的核苷酸序列,例如使用除去序列可以帮助将衔接子-模板-衔接子分子转化成三个分开的分子:模板和两个通用衔接子。用于除去通用衔接子的其他方法包括使用非天然核苷酸,和非天然主链键。通用衔接子可以包括天然的和非天然的核苷酸的混合物,任选地由磷酸二酯的和非磷酸二酯的主链键的混合物连接。可以包括其他非核苷酸修饰,从而协助从衔接子-模板-衔接子分子切割通用衔接子。如本文详细描述,在衔接子-模板-衔接子分子的扩增期间,可以将此类非天然核苷酸和键引入通用衔接子中。

在一个实施例中,除去序列包括限制性内切核酸酶识别序列。限制性内切核酸酶识别序列是限制性内切核酸酶可以结合的核苷酸序列。可以使用任何内切核酸限制酶,并且任何有用的限制性内切核酸酶的识别序列是技术人员已知的。在一个实施例中,限制性内切核酸酶是II型、III型、或IV型酶。在一个实施例中,限制性内切核酸酶是在识别位点处切割双链DNA的限制性内切核酸酶。在另一个实施例中,限制性内切核酸酶是在距离识别位点特定距离处切割双链DNA的限制性内切核酸酶。例如,在一些实施例中,限制性内切核酸酶是切割其余片段的识别位点的限制性内切核酸酶。在识别位点附近切割双链DNA的有用的限制性内切核酸酶的实例包括但不限于MlyI、SapI、和BpuEI。

技术人员将认识到,使用在距离识别位点特定距离处进行切割的限制性内切核酸酶允许控制在除去后最终产物即模板和通用衔接子的组成。在一个实施例中,其中除去序列是在距离识别位点特定距离处进行切割的内切核酸酶的识别位点,可以将识别位点放置在双链区域中,从而导致除去所有通用衔接子序列(例如在除去通用衔接子后生成的模板分子与用于产生衔接子-模板-衔接子分子的模板相同)。在另一个实施例中,其中除去序列是在距离识别位点特定距离处进行切割的内切核酸酶的识别位点,可以将识别位点放置在双链区域中,从而导致除去一些通用衔接子序列(例如在除去通用衔接子后生成的模板分子是模板和用于产生衔接子-模板-衔接子分子的通用衔接子的一部分)。在仍另一个实施例中,其中除去序列是在距离识别位点特定距离处进行切割的内切核酸酶的识别位点,可以将识别位点放置在双链区域中,从而导致除去所有通用衔接子序列和位于每个末端处并且与通用衔接子相邻的一些模板序列(例如在除去通用衔接子后生成的模板分子是用于产生衔接子-模板-衔接子分子的模板的非天然存在的并且更短的形式)。

在一个实施例中,通用衔接子还包括单链非互补核酸链的区域。此区域,也称为“未配对区域”,是指一个区域,其中形成通用衔接子的两个多核苷酸链的序列表现出一定程度非互补性,使得在用于引物延伸或PCR反应的标准退火条件下,两个链不能够完全彼此退火。在对于酶催化的连接反应而言标准反应条件下,未配对区域可以表现出一定程度的退火,条件是在扩增反应中的退火条件下,两个链恢复至单链形式。在一个实施例中,将衔接子添加至reDNA,并且添加至来自检验样品的片段核酸(图1,框图15),导致添加了具有双链区域和单链区域两者的通用衔接子。添加可以是以一个步骤(例如具有双链区域和单链区域两者的通用衔接子的连接),或多于一个步骤(例如具有双链区域的通用衔接子的连接,随后是扩增,从而添加单链区域)。

未配对区域中的错配可以采取比另一个链更长的一个链的形式使得在链中的一个上存在单链区域,或选择序列,使得两个链并不杂交,并且因此在两个链上形成单链区域。错配还可以采取“泡”的形式,其中通用衔接物构建体的两端能够彼此杂交,并且形成双链体,而中心区域并不如此。形成未配对区域的一个或多个链的部分在一定条件下并不退火,在所述条件下相同的两个链的其他部分退火至形成一个或多个双链区域。为了避免疑问,应理解的是,在本披露的上下文中,在随后经历连接的多核苷酸双链体的3’端处的单链或单碱基突出,并不构成“未配对区域”。

单链非互补核酸链的区域典型地包括至少一个通用延伸引物结合位点。使用与通用引物延伸结合位点互补的通用捕获核酸的群体,通用引物延伸结合位点可以用于捕获多个不同的核酸,例如多个不同的衔接物-模板-衔接物分子。

任选地,可以存在一种或多种其他通用序列。在一个实施例中,单链非互补核酸链的区域还包括至少一个样品特异性索引。样品特异性索引可以用作阵列上具体模板的来源的标记特征。通常,样品特异性索引是为通用衔接物的一部分的核苷酸的合成序列,作为文库制备步骤的一部分,将其添加至模板。因此,样品特异性索引是附接至具体样品的每个模板分子的核酸序列,样品特异性索引的存在指示,或用于鉴定从其分离模板分子的样品。

优选地,样品特异性索引可以至多长度20个核苷酸,更优选地,1-10个核苷酸,并且最优选地,长度4-6个核苷酸。四核苷酸索引给出了在同一阵列上多路复用256个样品的可能性,六碱基标签使得能够在同一阵列上处理4096个样品。

将典型地由功能决定未配对区域的长度的下限,所述功能是例如需要提供适合的序列用于i)用于引物延伸、PCR和/或测序的引物的结合(例如,引物与通用引物结合位点的结合),或用于ii)用于将衔接物-模板-衔接物固定至表面的通用捕获核酸的结合(例如,通用捕获核酸与通用引物延伸结合位点的结合)。理论上,未配对区域的长度不存在上限,例外在于一般有利的是,将通用衔接物的总长度最小化,例如在连接步骤后协助未结合的通用衔接物从生衔接子-模板-衔接子构建体分离。因此,通常优选的是,未配对区域的长度应小于50、或小于40、或小于30、或小于25个连续的核苷酸。

尽管通用衔接物的精确核苷酸序列通常并不限于本披露,未配对区域中的单个链的序列应使得单个链不表现出任何内部自身互补性,该互补性会导致在标准退火条件下自退火、形成发夹结构等。应避免未配对区域中链的自退火,因为这会阻止或减少引物与此链的特异性结合。

在一个实施例中,通用衔接子包括对于随后从衔接子-模板-衔接子分子除去衔接子而言必需的所有序列(图1,框图13)。在一个实施例中,通用衔接子包括用于将衔接物-模板-衔接物固定在阵列上以便进行随后的扩增和/或测序必需的所有序列(图1,框图16)。在另一个实施例中,扩增步骤用于在固定和测序之前修饰每个衔接子-模板-衔接子分子中存在的通用衔接物(图1,框图16)。例如,在其中要确定模板的一部分的核苷酸序列的那些实施例中,可以使用其中形成与每个单个衔接物-模板-衔接物分子的两个链互补的延伸产物的通用引物结合位点,并且添加通用延伸引物位点,进行初始引物延伸反应。所得引物延伸产物,以及任选地其扩增的拷贝,共同地提供了可以被固定并且然后被测序的模板多核苷酸的文库。

可以使用连接方法,将通用衔接子连接至模板。本文中有用的连接方法是本领域已知的并且使用标准方法。在这种情况下,此类方法使用连接酶酶类,例如DNA连接酶来实现或催化通用衔接物和双链模板的两个多核苷酸链的末端的连接,使得形成共价键。通用衔接物可以含有5’磷酸部分,用来协助连接至模板上存在的3’-OH。双链模板含有5’磷酸部分(该磷酸部分是残余的或使用酶处理步骤添加的),并且已经被末端修复,并且任选地通过突出碱基或碱基延伸,从而给出适合连接的3’-OH。在此上下文中,连接意指先前未共价连接的多核苷酸链的共价键。在本披露的具体方面,通过在两个多核苷酸链之间形成磷酸二酯键,发生此类连接,但是可以使用共价键(例如非磷酸二酯主链键)的其他方式。

如本文所讨论,在一个实施例中,用于连接的通用衔接子是完整的。例如,当正添加通用衔接子从而产生reDNA文库时(图1,框图11),通用衔接子可以包括双链区域和通用序列,例如通用引物结合位点、通用除去序列、或其组合(图3)。当正添加通用衔接子至来自检验样品的reDNA片段或片段核酸的群体时(图1,框图15),通用衔接子可以包括双链区域和单链区域,这些区域例如含有通用除去序列、通用引物结合位点、通用延伸引物位点、样品特异性索引、或其组合(图4)。技术人员将容易理解,使用不同通用衔接子来添加至reDNA和检验样品DNA的优势,因为针对片段的每个群体使用不同索引将允许稍后在测序后鉴定模板分子的来源。可以使用多个衔接子-模板-衔接子分子来制备用于测序的固定样品(图1,框图16)。

还如本文所讨论,在一个实施例中,用于连接中的通用衔接子包括双链区域,该双链区域可以具有通用序列,例如通用引物结合位点(图5)。可以进一步修饰所得多个衔接物-模板-衔接物分子(图1,框图15),从而包括另外的通用序列,例如通用延伸引物结合位点和样品特异性索引(图6)。用于添加特异序列,例如通用延伸引物结合位点至与双链靶片段连接的通用引物的方法包括基于PCR的方法,并且是本领域已知的,并且描述于Bignell等人(US 8,053,192)和Gunderson等人(WO2016/130704)中。

在其中通用衔接物被修饰为包括另外的通用序列的那些实施例中,制备扩增反应。扩增反应的内容是本领域普通技术人员已知的并且包括扩增反应所需的适当的底物(例如dNTP)、酶(例如DNA聚合酶)和缓冲液组分。通常扩增反应需要至少两种扩增引物,通常称为“正向的”和“反向的”引物(引物寡核苷酸),这两种引物能够在扩增反应的每个循环的引物退火步骤中遇到的条件下,特异性退火至有待扩增的多核苷酸序列的一部分。在某些实施中,正向引物和反向引物可以是相同的。因此,通用引物包括“通用引物结合位点特异性部分”,该部分是在退火步骤期间能够退火至待扩增的多核苷酸分子(或如果模板被视为单链,为其互补序列)中的通用序列(例如通用引物结合位点)的核苷酸的序列。

取决于本披露的实施例,通用引物可以是对于所有样品而言通用的,或正向引物或反向引物之一可以携带编码样品来源的索引序列。通用引物可以跨连接的衔接子的索引区域杂交,在这种情况下,有利的是针对每个样品核酸使用独特的引物。可以用多于两种通用引物进行扩增反应。为了防止连接的衔接物-衔接物二聚体的扩增,可以将通用引物修饰为含有跨整个连接的衔接物并且进入连接的模板(或附接至其3’端的dNTP)杂交的核苷酸。可以修饰并且处理此第一通用引物,从而帮助防止链的外切核酸酶消化,并且因此会有利的是具有可以扩增所有样品而不是分开地修饰和处理每个带索引的引物的第一通用引物。在扩增反应中,可以引入带索引标的引物作为样品特异性第三引物,而不需要特异性修饰和处理来减少外切核酸酶消化。在此实施例的情况下,携带索引的第三通用引物可以含有与第一通用引物的至少一部分相同的序列,使得它可以用于扩增源自第一通用引物的延伸的双链体。

在本披露的上下文中,术语“待扩增的多核苷酸分子”是指添加至扩增反应的原始的或起始的衔接子-模板-衔接子序列。在正向的和反向的通用引物中的“通用引物结合位点特异性部分”是指能够退火至在扩增反应起始时存在的原始的或初始的衔接子-模板-衔接子的序列,并且关于“通用引物结合位点特异性部分”的长度涉及在退火至起始衔接子-模板-衔接子分子的引物中的序列的长度。应当理解,如果引物含有在第一扩增循环中并不退火至起始衔接子-模板-衔接子分子的任何核苷酸序列,则此序列可以被拷贝成扩增产物。因此,与起始衔接子-模板-衔接子分子相比,在第一和随后的循环中产生的扩增的衔接子-模板-衔接子分子会更长。

因为错配衔接物可以是不同长度的,所以添加至每个链的3’端和5’端的衔接物序列的长度可以是不同的。通用引物可以是彼此不同长度的,并且可以与不同长度的衔接物杂交,并且因此可以控制添加至每个链的末端的长度。在巢式PCR的情况下,与用于扩增先前扩增子的引物相比,可以将三种或更多种通用引物设计成更长,所以如果需要,添加的核苷酸的长度是完全可控的并且可以是数百个碱基对。在一个实施例中,第一通用引物将13个碱基添加至连接的衔接物,并且第三通用引物添加另外的27个碱基,使得扩增子的一个末端比衔接物-靶构建体的短臂长40个碱基。衔接物的短臂是长度20个碱基,意味着制备的模板包括模板加上在末端处的60个添加的碱基。,第二通用引物比衔接物的长臂长25个碱基,衔接物的长臂是长度32个碱基加上跨添加至样品的dATP核苷杂交的另外的T。因此,制备的模板包含基因组片段,加上添加的dATP,加上57个已知碱基。因此,全部地,每个模板双链体的一个链从5’端-3’端包含:60个已知碱基、T、基因组片段、A、57个已知碱基。此链与以下序列完全互补:5’-57个已知碱基、T、基因组片段、A、60个已知碱基-3’端。长度57和60是任意的,并且为明确起见进行显示,并且应不视为限制。取决于希望的实验设计,添加的序列的长度可以是20-100个碱基或更多。

正向引物和反向引物可以是足够长度的,从而与整个衔接子序列和靶序列的至少一个碱基(或作为靶链上的3’突出而添加的核苷酸dNTP)杂交。正向引物和反向引物还可以含有延伸超出衔接子构建体的区域,并且因此通用引物可以是长度至少20-100个碱基。正向引物和反向引物可以具有显著不同的长度;例如,一个可以是20-40个碱基,而另一个可以是长度40-100个碱基。选择正向引物和反向引物的通用衔接子特异性部分的核苷酸序列,从而实现在扩增反应的退火步骤的条件下与待扩增的衔接子-模板-衔接子分子的特异性杂交,同时将与存在的任何其他靶序列的非特异性杂交最小化。

技术读者应当理解,并不严格需要通用衔接子特异性部分是100%互补,因为可以用不完美的互补序列实现令人满意水平的特异性退火。特别地,在通用衔接子特异性部分中的一个或两个错配通常是可以容忍的,而不会不利地影响特异性。因此,术语“通用引物结合位点特异性部分”应不被解释为需要与衔接子-模板-衔接子分子的通用衔接子的100%互补性。然而,必须满足以下要求:引物并不非特异性地退火至除其对应的引物结合序列之外的衔接子-模板-衔接子的区域。

通用引物通常是单链多核苷酸结构。它们还可以含有天然的和非天然的碱基的混合物,以及还有天然的和非天然的主链键,条件是任何非天然修饰并不排除作为引物的功能--即具有以下能力:在扩增反应的条件下退火至多核苷酸链,以及充当用于合成新互补多核苷酸的起始点。

如本文所讨论,本披露的方法可以包括从衔接子-模板-衔接子分子除去通用衔接子(图1,框图13)。在一个实施例中,可以通过使用通用除去序列,除去通用衔接子。在另一个实施例中,可以使用化学切割方法,包括但不限于无碱基位点的切割、核糖核苷酸的切割、光化学切割、半甲基化DNA的切割、接头(例如肽接头、pH敏感性接头、热敏感性接头)的切割,或物理力来从衔接子-模板-衔接子分子除去通用衔接子。其他这些方法典型地包括使用非天然核苷酸、非天然主链键、或其组合。因此,在一个实施例中,通用引物可以包括天然的和非天然的核苷酸的混合物、磷酸二酯的和非磷酸二酯的主链键的混合物、其他非核苷酸修饰、或其组合,从而协助从衔接子-模板-衔接子分子切割通用衔接子。使用含有此类替代核苷酸、键、和/或修饰,生成含有替代核苷酸、键、和/或修饰的衔接子-模板-衔接子分子。

术语“化学切割”涵盖使用非核酸和/或非酶化学试剂来促进/实现切割双链衔接子-模板-衔接子分子的一个或两个链的任何方法。如果需要,衔接子-模板-衔接子分子的一个或两个链可以包括一个或多个非核苷酸化学部分和/或非天然核苷酸和/或非天然主链键,从而允许在预定切割位点处的化学切割反应。典型地,使用包括位点的通用引物,将适合化学切割的位点引入衔接子-模板-衔接子分子。

在一个实施例中,衔接子-模板-衔接子分子的一个链可以包括二醇键(参见例如US 2012/0270739),该二醇键允许用高碘酸盐(例如高碘酸钠)处理进行切割。二醇键可以位于预定切割位点处,可以由使用者选择其精确位置。应当理解,在切割位点处,可以包括多于一个二醇。

适合掺入多核苷酸链的基于亚磷酰胺化学法的二醇接头单元是可商购的(例如来自Fidelity systems Inc.公司,盖瑟斯堡,马里兰州,美国)。可以使用用于自动化学DNA合成的标准方法,将一个或多个二醇单元掺入用作引物的多核苷酸中。

通过用“切割剂”(它可以是促进切割二醇的任何物质)进行处理,切割二醇接头。优选的切割剂是高碘酸盐,优选地水性高碘酸钠(NaIO4)。在用切割剂(例如高碘酸盐)进行处理来切割二醇后,可以用“加帽剂”处理切割产物,从而中和在切割反应中产生的反应性物质。出于此目的的适合加帽剂包括胺,例如乙醇胺。有利地,加帽剂(例如乙醇胺)可以包括在与切割剂(例如高碘酸盐)的混合物中,使得一旦形成反应性物质,它们就立即被加帽。

“无碱基位点”被定义为多核苷酸链中的核苷位置,其中已经从其除去碱基组分。在生理条件下,通过核苷残基的水解,无碱基位点可以天然存在于DNA中,或者在人工条件下或者通过酶的作用,可以化学地形成无碱基位点。一旦形成,可以切割无碱基位点(例如通过用内切核酸酶或其他单链切割酶处理,暴露于热或碱),提供用于多核苷酸链的位点特异性切割的手段。

在优选的但非限制性的实施例中,可以在衔接子-模板-衔接子分子的通用衔接子的预定部分处产生无碱基位点。在预定切割位点处,使用的通用引物包括脱氧尿苷(U)。然后可以使用酶尿嘧啶DNA糖基化酶(UDG)来从扩增的reDNA文库的成员除去尿嘧啶碱基,在一个链上产生无碱基位点。然后可以通过用内切核酸酶(例如EndoIV内切核酸酶、AP裂解酶、FPG糖基化酶/AP裂解酶、EndoVIII糖基化酶/AP裂解酶)、热、或碱处理,在无碱基位点切割包括无碱基位点的多核苷酸链。

还可以在除脱氧尿苷之外的非天然的/修饰的脱氧核糖核苷酸处产生无碱基位点,并且用内切核酸酶、热、或碱处理,以类似方式进行切割。例如,通用引物可以包括8-氧代-鸟嘌呤或脱氧肌苷。通过暴露于FPG糖基化酶,8-氧代-鸟嘌呤可以转化成无碱基位点。通过暴露于AlkA糖基化酶,脱氧肌苷可以转化成无碱基位点。因此,然后可以典型地通过用适合的内切核酸酶(例如EndoIV、AP裂解酶)处理,切割由此产生的无碱基位点。

在一个实施例中,待切割的双链核酸分子可以暴露于混合物,该混合物含有适当的糖基化酶(用来产生无碱基位点)和一种或多种适合的内切核酸酶(用于随后的切割)。在此类混合物中,糖基化酶和内切核酸酶将典型地以至少约2:1的活性比率存在。在一个

具体实施方式

中,将可得自新英格兰实验室(New Englad Biolabs)的USER试剂(#M5505S)用于在尿嘧啶碱基处产生单核苷酸间隙。

在一个实施例中,可以使用的通用引物包括一个或多个核糖核苷酸。将一个或多个核糖核苷酸掺入另外包括脱氧核糖核苷酸的多核苷酸链(具有或不具有另外的非核苷酸化学部分、非天然碱基或非天然主链键),可以提供预定位点,用于使用能够选择性切割脱氧核糖核苷酸和核糖核苷酸之间的磷酸二酯键的化学试剂或使用核糖核酸酶(RNA酶)进行切割。在一个实施例中,待切割的链含有单个核糖核苷酸,从而提供用于化学切割的预定位点。

能够选择性切割脱氧核糖核苷酸和核糖核苷酸之间的磷酸二酯键的适合的化学切割剂包括金属离子,例如稀土金属离子(特别是La+、具体地Tm+、Yb+或Lu+(Chen等人,Biotechniques.[生物技术]2002,32:518-520;Komiyama等人,Chem.Commun.[化学通讯]1999,1443-1451))、Fe(3)或Cu(3),或暴露于升高的pH,例如用碱,例如氢氧化钠处理。“脱氧核糖核苷酸和核糖核苷酸之间的磷酸二酯键的选择性切割”意指在相同条件下,化学切割剂不能够切割两个脱氧核糖核苷酸之间的磷酸二酯键。

一种或多种核糖核苷酸的碱基组成通常不是材料,并且可以进行选择,从而优化化学的(或酶的)切割。通过举例,如果要通过暴露于金属离子、特别是稀土金属离子进行切割,则rUMP或rCMP通常是优选的。

还可以用RNA酶切割核糖核苷酸和脱氧核糖核苷酸之间的,或两个核糖核苷酸之间的磷酸二酯键。出于此目的,可以使用具有适当的底物特异性的任何内吞的核糖核酸酶。对于用核糖核酸酶切割,优选的是包括两个或更多个连续的核糖核酸酶,并且优选的是从2至10,或从5至10个连续的核糖核酸酶。核糖核苷酸的精确序列通常不是材料,例外在于某些RNA酶具有用于在某些残基后进行切割的特异性。例如,适合的RNA酶包括RNA酶A,它在C和U残基后进行切割。因此,当用RNA酶A进行切割时,切割位点必须包括为C或U的至少一个核糖核苷酸。

可以使用标准技术(这些标准技术用于使用适当核糖核苷酸前体进行寡核苷酸化学合成)容易地合成掺入一个或多个核糖核苷酸的通用引物。

术语“光化学切割”涵盖利用光能,从而实现双链核酸分子的一个或两个链的切割的任何方法。

可以通过双链分子的一个链中的非核苷酸化学间隔子单元,提供用于光化学切割的预定位点。适合的光化学可切割间隔子包括PC间隔子亚磷酰胺(4-(4,4’-二甲氧基三苯甲基氧基)丁酰胺基甲基)-1-(2-硝基苯基)-乙基]-2--氰乙基-(N,N-二异丙基)-亚磷酰胺),由格伦研究公司(Glen Research),斯特林,弗吉尼亚州,美国供应(目录号10-4913-XX),它具有以下结构:

Figure BDA0002317109880000361

可以通过暴露于UV光源,切割间隔子单元。

使用用于寡核苷酸的化学合成的标准技术,此间隔子单元可以与硫代磷酸基团一起附接至多核苷酸的5’端,该硫代磷酸基团允许附接至固体表面。方便地,可以将此间隔子单元掺入正向或反向扩增引物,这些引物用于通过固相扩增合成可光切割的双链核酸分子。

还可以通过使用掺入一个或多个甲基化核苷酸的通用引物,并且然后用特异性针对包括一个或多个甲基化核苷酸的识别序列的内切核酸酶切割扩增的reDNA文库的成员,实现双链核酸分子的一个链的位点特异性切割。

典型地,将一个或多个甲基化核苷酸并入在互补链上具有非甲基化脱氧核糖核苷酸的互补段的双链衔接子-模板-衔接子分子的一个链的区域,使得两个链的退火产生半甲基化双链体结构。然后可以通过适合的内切核酸酶作用,切割半甲基化双链体。

可以使用用于自动DNA合成的标准技术,使用适当地甲基化的核苷酸前体,制备掺入一个或多个甲基化核苷酸的通用引物。

引物可以另外包含非核苷酸化学修饰,例如具有主链修饰的磷硫酰来增加外切核酸酶抗性,再次条件是使得修饰并不阻止引物功能。例如,修饰可以协助将引物附接至固体支持物,例如生物素部分。某些修饰可以自身改善分子作为引物的功能,或可以提供一些其他有用的功能性,例如提供用于切割的位点,使得引物(或源自其的延伸的多核苷酸链)能够从固体支持物切割(参见例如美国专利US 9,085,802)。

在其中索引附接至通用衔接子的实施例中,可以在合并的或未合并的样品上进行扩增。在一个实施例中,索引是通用引物的一部分,并且因此在合并前,每个样品独立地扩增。然后处理合并的核酸样品,用于测序。

在从衔接子-模板-衔接子分子除去衔接子(图1,框图13)从而产生reDNA后,样品可以暴露于用来从模板分子分离除去的衔接子的条件下。可以通过使用捕获剂,有助于希望的reDNA与除去的衔接子的分离。在一个实施例中,在衔接子-模板-衔接子分子的扩增期间,将捕获剂添加至衔接子-模板-衔接子分子(图1,框图12)。例如,用于扩增衔接子-模板-衔接子分子的通用引物可以包括捕获剂,例如受体-配体结合对的成员。有用的受体-配体结合对的实例包括但不限于亲和素、链霉亲和素、生物素、凝集素、碳水化合物、核酸结合蛋白、以及抗体。

在一个实施例中,扩增的衔接子-模板-衔接子分子包括为配体的捕获剂。将扩增的衔接子-模板-衔接子分子暴露于除去衔接子的条件(例如当通用除去序列是限制性内切核酸酶位点时,暴露于限制性内切核酸酶)。在一个实施例中,然后在适合配体和受体的结合的条件下,将reDNA和除去的(未附接的)衔接子的混合物暴露于配体的受体,并且将结合受体的除去的衔接子与reDNA分离。在一个实施例中,受体结合表面并且进一步包括可以用于分离附接的衔接子的第二配体。在另一个实施例中,扩增的衔接子-模板-衔接子分子与包括配体的受体的表面接触,并且扩增的衔接子-模板-衔接子分子变成在分子的一端或两端处结合表面。随后结合的扩增的衔接子-模板-衔接子分子暴露于除去衔接子的条件(例如当通用除去序列是限制性内切核酸酶位点时,暴露于限制性内切核酸酶),导致除去的衔接子结合表面和游离模板,即reDNA。表面可以是具有任何适合的形状(平的,例如载片,或弯曲的,例如珠粒)的惰性的基底或基质(例如塑料、玻璃)。

在另一个实施例中,用于从模板分子分离除去的衔接子的条件包括选择预定大小范围,例如长度从150至400个核苷酸、或从150至300个核苷酸的条件。用于选择预定大小范围的方法包括但不限于凝胶电泳。可以使用任何适合的方法,例如电泳、尺寸排阻色谱法等。在一些实施例中,可以采用固相可逆固定顺磁性珠粒来从未附接的衔接物分离所需DNA分子,并且用来基于大小选择reDNA。固相可逆固定顺磁性珠粒可商购自贝克曼库尔特商贸公司(Beckman Coulter)(Agencourt AMPure XP)、赛默飞世尔公司(Thermofisher)(MagJet)、Omega Biotek公司(Mag-Bind)、普洛麦格公司(Promega)珠粒、以及Kapa生物系统公司(Kapa Biosystems)(Kapa纯珠粒)。

在除去衔接子之前或之后,可以生成多种化合物和组合物。例如,提供了包括多个衔接子-模板-衔接子分子的化合物或组合物,其中衔接子包括限制性内切核酸酶位点。本文提供的另一组合物是reDNA片段的群体,例如reDNA文库。在一个实施例中,组合物可以按以下浓度包括reDNA片段的群体:从1ng/ml至1000ng/ml,例如从10ng/ml至500ng/ml、或50ng/ml至150ng/ml。在一个实施例中,组合物可以包括具有以下范围的大小的reDNA片段的群体:长度从150至400个核苷酸、或长度从150至300个核苷酸。在一些实施例中,群体的范围是从长度40、50、60、70、80、90、100、110、120、130、140、或150个核苷酸至长度200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、或400个核苷酸。

本文提供的仍另一组合物是reDNA片段的群体,例如reDNA文库,存在于人工生物流体中。不希望被任何理论所限制,在人工生物流体中reDNA片段的群体的使用提供了模拟天然检验样品的合成的阳性对照和阴性对照。在合成的对照中的reDNA具有发现于天然检验样品中的大小分布,并且在合成的对照中的reDNA的基因组覆盖度也类似于发现于天然检验样品中的基因组覆盖度。在天然检验样品和合成的阳性对照与阴性对照之间,人工生物流体添加了另外水平的相似性。

人工生物流体是模拟天然生物流体的流体。通常,人工生物流体可以是其中片段核酸可以获得自受试者的流体。实例包括但不限于全血、血清、尿液、唾液、痰液、灌洗液、脑脊髓液、***、汗液、眼泪、唾液、粪便等。通常,人工生物流体包括水性流体和天然流体的其他组分,所以人工流体模拟了天然流体。例如,人工血浆可以包括天然血浆的一些成分,包括电解质、白蛋白、纤维蛋白原、凝血因子、缓冲液、和/或其他组分。通常通过用多种组分,例如CaCl2、柠檬酸盐、或其组合处理全血,产生血浆,因此在一些实施例中,人工血浆包括CaCl2、柠檬酸盐、或其组合。生物流体,例如全血、血清、尿液、唾液、痰液、灌洗液、脑脊髓液、***、汗液、眼泪、唾液、粪便等的组分是已知的,并且可以由本领域普通技术人员容易地重新创建。可替代地,人工血浆是可商购的(免疫化学技术公司(ImmunoChemistryTechnologies),布卢明顿,明尼苏达州)。人工生物流体还可以包括多种组分,例如但不限于抗微生物剂、稳定剂等。

可以按模拟在天然生物样品中片段核酸的浓度,将reDNA片段的群体,例如reDNA文库,添加至人工生物流体。例如,在其中检验样品是来自孕妇的血浆样品的实施例中,可以通过按类似于检验样品中cfDNA的浓度将适当的reDNA文库添加至基于血浆样品的人工生物流体来产生合成的对照。在一个实施例中,人工生物流体可以按以下浓度包括reDNA文库:从1纳克/毫升(ng/ml)至1000ng/ml,例如从10ng/ml至500ng/ml、或50ng/ml至150ng/ml。

在本文的一些实施例中,然后在测序之前固定并且扩增来自一个或多个来源的多个衔接子-模板-衔接子分子(图1,框图16)。用于将来自一个或多个来源的衔接子-模板-衔接子分子附接至基底的方法是本领域已知的。同样地,用于扩增固定的衔接子-模板-衔接子分子的方法包括但不限于桥扩增和动力学排除扩增。在例如以下文献中描述了用于在测序之前进行固定和扩增的方法:Bignell等人(US 8,053,192)、Gunderson等人(WO 2016/130704)、Shen等人(US 8,895,249)、和Pipenburg等人(US 9,309,502)。

然后可以在用于测序的制剂中,固定样品,包括合并的样品。可以做为单分子的阵列进行测序,或可以在测序之前进行扩增。可以使用一种或多种固定的引物进行扩增。一种或多种固定的引物可以铺设在平面的表面上,或在多个珠粒上。多个珠粒可以分离进乳剂中,其中单个珠粒在乳剂的每个“室”中。按每个“室”仅一个模板的浓度,在每个珠粒上仅扩增单个模板。

如本文所用的术语“固相扩增”是指与固体支持物相关联的或在固体支持物上进行的任何核酸扩增反应,使得在形成扩增产物时,所有的或一部分的扩增产物固定在固体支持物上。特别地,该术语涵盖固相聚合酶链式反应(固相PCR)和固相等温扩增,它们是与标准溶液相扩增类似的反应,不同之处在于正向和反向扩增引物中的一者或两者被固定在固体支持物上。固相PCR覆盖了多个系统,例如乳剂(其中一种引物锚定至珠粒,并且另一种引物是在游离溶液中),以及在固相凝胶基质中的集落形成(其中一种引物锚定至表面,并且一种引物在游离溶液中)。

在一些实施例中,固体支持物包括有图案的表面。“有图案的表面”是指在固体支持物的暴露的层中或暴露的层上的不同区域的排列。例如,区域中的一个或多个可以特征在于存在一种或多种通用引物。该特征可以与其中不存在通用引物的间质区域分开。在一些实施例中,图案可以是按行和列的x-y形式的特征。在一些实施例中,图案可以是特征和/或间质区域的重复排列。在一些实施例中,图案可以是特征和/或间质区域的随机排列。可以用于本文阐述的方法和组合物的示例性有图案的表面描述于以下文献中:美国专利号8,778,848、8,778,849和9,079,148,以及美国公开号2014/0243224。

在一些实施例中,固体支持物包括在表面中有孔或凹坑的阵列。可以使用多种技术制造这些,因为它们通常是本领域已知的,所述技术包括但不限于光刻法、冲压技术、成型技术和显微腐蚀技术。如本领域普通技术人员应当理解的,使用的技术将取决于阵列基底的组成和性状。

在有图案的表面中的特征可以是在具有有图案的、共价连接的凝胶(例如聚(N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共-丙烯酰胺)(PAZAM,参见例如美国公开号2013/184796、WO 2016/066586、和WO 2015/002813)的玻璃、硅、塑料或其他适合的固体支持物上的孔(例如微孔或纳米孔)的阵列中的孔。该方法产生了用于测序的凝胶垫,经具有大量循环的测序轮次,该测序会是稳定的。在多种用途期间,贯穿有结构的基底的寿命,对于维持有结构的特征中的凝胶而言,将聚合物共价连接至孔是有帮助的。然而,在很多实施例中,不需要将凝胶共价连接至孔。例如,在一些条件下,无硅烷丙烯酰胺(SFA,参见例如美国专利号8,563,477)(它并未共价附接至有结构的基底的任何部分)可以用作凝胶材料。

在一个具体实施例中,可以通过以下制造有结构的基底:在具有孔(例如微孔或纳米孔)的固体支持物材料上形成图案,用凝胶材料(例如PAZAM、SFA或其化学修饰的变体,例如SFA的叠氮基化形式(叠氮基-SFA))涂覆有图案的支持物,并且将凝胶涂覆的支持物抛光,例如经由化学的或机械的抛光,由此在孔中保留了凝胶,但是将来自孔之间的有结构的基底的表面上的间质区域的基本上所有凝胶除去或灭活。引物核酸可以附接至凝胶材料。然后可以使靶核酸(例如cfDNA)的溶液与抛光的基底接触,使得经由与附接至凝胶材料的引物相互作用,单个靶核酸将接种单个孔;然而,由于凝胶材料不存在或凝胶材料无活性,靶核酸将不占据间质区域。因为在间质区域中凝胶的不存在或凝胶无活性阻止了正在生长的核酸集落向外迁移,所以靶核酸的扩增将限制在孔中。该方法是方便地可制造的,是可缩放的,并且利用了常规的微米制造或纳米制造方法。

尽管本披露涵盖了“固相”扩增方法,其中仅固定一种扩增引物(另一种引物通常存在于游离溶液中),优选的是固体支持物配备有固定的正向引物和反向引物两者。实际上,因为扩增方法需要过量的引物来维持扩增,所以将存在固定在固体支持物上的‘多个’相同的正向引物和/或‘多个’相同的反向引物。因此,本文提及正向引物和反向引物,应解释为涵盖‘多个’此类引物,除非上下文另外说明。

如技术读者应当理解的,任何给定扩增反应需要特异性针对待扩增的模板的至少一个类型的正向引物和至少一个类型的反向引物。然而,在某些实施例中,正向引物和反向引物可以包含具有相同序列的模板特异性部分,并且可以具有完全相同的核苷酸序列和结构(包括任何非核苷酸修饰)。换言之,可能仅使用一个类型的引物来进行固相扩增,并且此类单引物方法是涵盖在本披露的范围内的。其他实施例可以使用正向引物和反向引物,这些引物含有相同的模板特异性序列,但是在一些其他结构特征方面不同。例如,一个类型的引物可以含有另一个类型的引物中不存在的非核苷酸修饰。

在本披露的所有实施例中,优选地,通过在引物的5’端处或在其附近的到固体支持物的单点共价附接,留下游离的引物的模板特异性部分用来退火至其同源模板,以及游离的3’羟基用于引物延伸,来固定用于固相扩增的引物。本领域已知的任何适合的共价附接手段可以用于此目的。选择的附接化学将取决于固体支持物的性质,以及应用于它的任何衍生化或功能化。引物自身可以包括一个部分,该部分可以是非核苷酸化学修饰,从而协助附接。在一个具体实施例中,在5’端处,引物可以包括含硫亲核物质,例如磷硫酰或硫代磷酸。在固体支持的聚丙烯酰胺水凝胶的情况下,此亲核物质可以结合水凝胶中存在的溴乙酰胺基团。将引物和模板附接至固体支持物的更具体手段是经由5’磷硫酰附接至水凝胶,该水凝胶由以下构成:聚合的丙烯酰胺和N-(5-溴乙酰胺苯基})丙烯酰胺(BRAPA),如在WO 05/065814中充分描述。

本披露的某些实施例可以利用由以下构成的固体支持物:惰性的基底或基质(例如载玻片、聚合物珠粒、等),它已经被“功能化”,例如通过包含允许共价附接至生物分子例如多核苷酸的反应性基团的中间材料的层或涂层的施用。此类支持物的实例包括但不限于在惰性基底,例如玻璃上支持的聚丙烯酰胺水凝胶。在此类实施例中,生物分子(例如多核苷酸)可以直接共价附接至中间材料(例如水凝胶),但是中间材料可以自身非共价附接至基底或基质(例如玻璃基底)。因此,术语“共价附接至固体支持物”应解释为涵盖此类型的排列。

可以在珠粒上扩增合并的样品,其中每个珠粒含有正向和反向通用引物。在一个具体实施例中,根据本披露的第一、第二、或第三方面制备的模板的文库用于制备核酸集落的簇形阵列,类似于以下文献中描述的那些:美国公开号2005/0100900、美国专利号7,115,400、WO 00/18957和WO 98/44151,其中是通过固相扩增,并且更具体地是固相等温扩增。术语“簇”和“集落”在本文可互换地使用,是指在固体支持物上的离散位点,由多个相同的固定的核酸链和多个相同的固定的互补核酸链构成。术语“簇形阵列”是指从此类簇或集落形成的阵列。在此上下文中,术语“阵列”应不被理解为需要簇的有序排列。

术语“固相”或“表面”用于意指平面阵列,其中引物被附接至平的表面,例如玻璃的、二氧化硅的、或塑料的显微镜载玻片,或类似的流动池装置;附接至珠粒,其中一种或两种引物被附接至珠粒并且扩增珠粒;或在已经扩增珠粒后,附接至表面上的珠粒的阵列。

可以使用热循环的方法,如在WO 98/44151中描述,或使用维持温度恒定的方法来制备簇形阵列,并且使用改变的试剂进行延伸和变性的循环。在专利申请号WO 02/46456和美国公开号2008/0009420中描述了此类等温扩增方法。由于在等温方法中需要更低温度,这是特别优选的。

应当理解,本文所述的或本领域通常已知的任何方法可以与通用引物或靶特异性引物一起使用,从而扩增固定的DNA片段。用于扩增的适合方法包括但不限于聚合酶链式反应(PCR)、链置换扩增(SDA)、转录介导的扩增(TMA)和基于核酸序列的扩增(NASBA),如在美国专利号8,003,354中描述。可以采用以上扩增方法来扩增一种或多种目的核酸。例如,PCR,包括多路PCR、SDA、TMA、NASBA等,可以用于扩增固定的DNA片段。在一些实施例中,特异性针对目的多核苷酸的引物包括在扩增反应中。

用于扩增多核苷酸的其他适合方法可以包括寡核苷酸延伸和连接、滚环扩增(RCA)(Lizardi等人,Nat.Genet.[自然遗传学]19:225-232(1998)),以及寡核苷酸连接测定(OLA)(通常参见美国专利号7,582,420、5,185,243、5,679,524和5,573,907;EP 0 320308 B1;EP 0 336 731 B1;EP 0 439 182 B1;WO 90/01069;WO 89/12696;和WO 89/09835)技术。应当理解,可以设计这些扩增方法来扩增固定的DNA片段。例如,在一些实施例中,扩增方法可以包括连接探针扩增或寡核苷酸连接测定(OLA)反应,它们含有特异性针对目的核酸的引物。在一些实施例中,扩增方法可以包括引物延伸连接反应,它含有特异性针对目的核酸的引物。作为可以被特异性设计来扩增目的核酸的引物延伸和连接引物的非限制性实例,扩增可以包括用于GoldenGate测定(Illumina公司(Illumina,Inc.),圣地亚哥,加利福尼亚州)的引物,如美国专利号7,582,420和7,611,869所示例。

可以用于本披露的方法的示例性等温扩增方法包括但不限于多重置换扩增(MDA)(如例如Dean等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]99:5261-66(2002)所示例),或等温链置换核酸扩增(例如美国专利号6,214,587所示例)。可以用于本披露的其他非基于PCR的方法包括例如链置换扩增(SDA)(在以下文献中描述该扩增,例如Walker等人,Molecular Methods for Virus Detection[用于病毒检测的分子方法],学术出版社公司(Academic Press,Inc.),1995;美国专利号5,455,166、和5,130,238,以及Walker等人,Nucl.Acids Res.[核酸研究]20:1691-96(1992)),或超支化链置换扩增(在以下文献中描述该扩增,例如Lage等人,Genome Res.[基因组研究]13:294-307(2003))。等温扩增方法可以与以下一起使用:链置换Phi 29聚合酶或Bst DNA聚合酶大片段、5’->3’外切核酸酶),用于基因组DNA的随机扩增。这些聚合酶的使用利用了它们的高持续合成能力和链置换活性。高持续合成能力允许聚合酶来产生长度10-20kb的片段。如以上阐述,使用具有低持续合成能力和链置换活性的聚合酶,例如Klenow聚合酶,在等温条件下,可以产生更小的片段。扩增反应、条件、和组分的另外说详细明阐述于美国专利号7,670,810的披露内容中。

用于本披露的另一多核苷酸扩增方法是标记PCR,它使用两结构域引物的群体,这些引物具有恒定5’区域,随后是随机3’区域,如描述于例如Grothues等人,Nucleic AcidsRes.[核酸研究]21(5):1321-2(1993)中。进行第一轮扩增,从而允许在热变性DNA上基于单个杂交从随机合成的3’区域的众多起始。由于3’区域的性质,起始的位点被设想成遍及基因组是随机的。在下文中,可以除去未结合的引物,并且可以使用与恒定5’区域互补的引物,发生另外的复制。

在一些实施例中,可以使用动力学排除扩增(KEA),也称为排除扩增(ExAmp),来进行等温扩增。可以使用包括以下步骤的方法,来制造本披露的核酸文库:使扩增试剂反应来产生多个扩增位点,每个扩增位点包括来自已经接种该位点的单个靶核酸的扩增子的实质性克隆群体。在一些实施例中,继续进行扩增反应,直至产生足够数量的扩增子,来填充对应的扩增位点的容量。以此方式将已经接种的位点填充至满容量,这抑制来自着陆的靶核酸,并且在该位点处扩增,由此在该位点处产生扩增子的克隆群体。在一些实施例中,即使在第二靶核酸到达该位点之前,扩增位点并未填充至满容量,也可以实现明显的克隆性。在一些条件下,可以继续进行第一靶核酸的扩增至一个点,在该点制造了足够数量的拷贝,来有效超过或压倒来自被运输至该位点的第二靶核酸的拷贝的群体。例如在一个实施例中,其中在直径小于500nm的圆形特征上使用桥扩增方法,已经确定,对于第一靶核酸在14个循环的指数式扩增后,在同一位点处来自第二靶核酸的污染将产生不足数量的污染扩增子,在Illumina测序平台上,这不能不利地影响边合成边测序。

在具体实施例中,扩增位点可以是,但不需要是完全克隆的。相反,对于一些应用而言,单个扩增位点可以主要充满来自第一靶核酸的扩增子,并且还可以具有低水平的来自第二靶核酸的污染扩增子。阵列可以具有一个或多个扩增位点,这些扩增位点具有低水平的污染扩增子,只要污染的水平对于随后使用阵列不具有不可接受的影响。例如,当阵列要用于监测应用时,污染的可接受水平将是以下水平:该水平不影响信噪比,或不以不可接受的方式影响检测技术的分辨率。因此,明显的克隆性通常将与由本文阐述的方法制造的阵列的具体用途或应用相关。对于具体应用而言,在单个扩增位点处的可以是可接受的污染的示例性水平包括但不限于至多0.1%、0.5%、1%、5%、10%或25%污染扩增子。阵列可以包括具有这些示例性水平的污染扩增子的一个或多个扩增位点。例如,在阵列中,至多5%、10%、25%、50%、75%、或甚至100%的扩增位点可以具有一些污染扩增子。应理解的是,在位点的阵列或其他集合中,至少50%、75%、80%、85%、90%、95%或99%或更多的位点可以是克隆的或明显地克隆的。

在一些实施例中,当一个过程以足够快的速度发生,从而有效排除另一事件或过程发生时,会发生动力学排除。举例来说,制造核酸阵列,其中用来自溶液的靶核酸随机接种阵列的位点,并且在扩增过程中产生靶核酸的拷贝,从而填充每个接种的位点至满容量。根据本披露的动力学排除方法,可以在其中扩增速度超过接种速度的条件下,同时进行接种和扩增过程。如此,较快速度(在该速度下,在已经接种第一靶核酸的位点处制造拷贝)将有效排除第二核酸接种该位点进行扩增。如在美国申请公开号的2013/0338042的披露内容中详细描述,进行动力学排除扩增方法。

动力学排除可以利用较慢速度用于起始扩增(制造靶核酸的第一拷贝的慢速度)对比较快速度用于制造靶核酸的随后拷贝(或靶核酸的第一拷贝的随后拷贝)。在一个示例性实施例中,由于靶核酸接种的较慢速度(例如较慢扩散或运输)对比较快速度(在该速度下,将发生用多个拷贝的核酸种子填充位点),发生动力学排除。在另一个示例性实施例中,可以由于已接种位点的靶核酸的第一拷贝的形成的延迟(例如延迟的或慢的激活)对比较快速度(在该速度下,制造随后的拷贝填充位点),发生动力学排除。在此实例中,可能已经用若干不同靶核酸接种单个位点(例如在扩增之前,若干靶核酸可以存在于每个位点处)。然而,可以随机激活任何给定靶核酸的第一拷贝形成,使得与产生随后的拷贝的速度相比,第一拷贝形成的平均速度较慢。在这种情况下,尽管可能已经用若干不同靶核酸接种单个位点,但是动力学排除将允许仅扩增那些靶核酸中的一个。更具体而言,一旦已经激活第一靶核酸用于扩增,其拷贝将快速填充位点至满容量,由此防止在该位点制造第二靶核酸的拷贝。

扩增试剂可以包括协助扩增子形成,并且在一些情况下,提高扩增子形成的速度的另外组分。实例是重组酶。通过允许重复的侵入/延伸,重组酶可以协助扩增子形成。更具体而言,重组酶可以通过聚合酶协助靶核酸的侵入以及协助使用靶核酸作为用于扩增子形成的模板经由聚合酶延伸引物。可以作为链反应重复此过程,其中将从每一轮的侵入/延伸产生的扩增子用作随后的轮的模板。因为不需要变性循环(例如经由热或化学变性),所以与标准PCR相比,该过程可以更快地发生。如此,可以等温地进行重组酶协助的扩增。通常希望在重组酶协助的扩增试剂中包括ATP、或其他核苷酸(或在一些情况下,其非可水解类似物),从而协助扩增。作为SSB特别有用的重组酶和单链结合(SSB)蛋白的混合物,可以进一步协助扩增。用于重组酶协助的扩增的示例性配制品包括作为TwistAmp试剂盒,由TwistDx公司(剑桥,英国)商业销售的那些。在US 5,223,414和US 7,399,590中阐述了重组酶协助的扩增试剂的有用组分和反应条件。

可以包括在用来协助扩增子形成,并且在一些情况下,提高扩增子形成的速度的扩增试剂中的组分的另一实例是螺旋酶。通过允许扩增子形成的链反应,螺旋酶可以协助扩增子形成。因为不需要变性循环(例如经由热或化学变性),所以与标准PCR相比,该过程可以更快地发生。如此,可以等温地进行螺旋酶协助的扩增。作为SSB特别有用的螺旋酶和单链结合(SSB)蛋白的混合物,可以进一步协助扩增。用于螺旋酶协助的扩增的示例性配制品包括作为IsoAmp试剂盒,从Biohelix公司(贝弗莉(Beverly),MA)商业销售的那些。此外,在US 7,399,590和US 7,829,284中描述了包括螺旋酶蛋白的有用配制品的实例。

可以包括在用来协助扩增子形成,并且在一些情况下,提高扩增子形成的速度的扩增试剂中的组分的仍另一实例是起始位点结合蛋白。

在衔接子-模板-衔接子分子附接至表面后,确定在固定并且扩增的衔接子-模板-衔接子分子的至少一部分处的序列。可以使用任何适合的测序技术进行测序,并且用于确定固定并且扩增的衔接子-模板-衔接子分子的序列的方法,包括链再合成,是本领域已知的,并且描述于例如Bignell等人(US 8,053,192)、Gunderson等人(WO 2016/130704)、Shen等人(US 8,895,249)、以及Pipenburg等人(US 9,309,502)中。

可以结合多种核酸测序技术,也称为核酸检测检验,使用本文所述的方法。特别可接受的技术是以下那些:其中核酸附接在阵列中的固定位置处,使得它们的相对位置不改变,并且其中阵列被重复地成像。多个实施例是特别可接受的,其中以不同颜色通道获得图像,例如符合不同标记,这些标记用来区分一个核苷酸碱基类型与另一个核苷酸碱基类型。在一些实施例中,用来确定靶核酸的核苷酸序列的过程是自动化过程。优选实施例包括边合成边测序(“SBS”)技术。还可以将核酸测序技术用于微阵列分析。

SBS技术通常涉及通过针对模板链的核苷酸的迭代添加,新生核酸链的酶促延伸。在SBS的传统方法中,在每次递送中,在聚合酶存在下,可以将单核苷酸单体提供至靶核苷酸。然而,在本文所述的方法中,在递送中,在聚合酶存在下,可以将多于一个类型的核苷酸单体提供至靶核酸。

SBS可以使用具有终止子部分的核苷酸单体,或缺乏终止子部分的那些。利用缺乏终止子单体的方法包括例如使用γ-磷酸标记的核苷酸的焦磷酸测序和测序,如本文进一步详细阐述。在使用缺乏终止子的核苷酸单体的方法中,在每个循环中添加的核苷酸的数量通常是可变的,并且取决于模板序列和核苷酸递送的模式。对于使用具有终止子部分的核苷酸单体的SBS技术而言,在使用的测序条件下,终止子可以是有效地不可逆的,与使用双脱氧核苷酸的传统桑格(Sanger)测序的情况一样,或终止子可以是可逆的,与Solexa开发的测序方法(现在是Illumina公司(Illumina,Inc.))的情况一样。

SBS可以使用具有标记部分的核苷酸单体,或缺乏标记部分的那些。因此,可以基于标记的特性检测掺入事件,例如标记的荧光;核苷酸单体的特性,例如分子量或电荷;核苷酸的掺入的副产物,例如焦磷酸的释放;等。在其中测序试剂中存在两种或更多种不同核苷酸的实施例中,在使用的检测技术下,不同核苷酸可以彼此可区分,或可替代地,两种或更多种不同标记可以是不可区分的。例如,测序试剂中存在的不同核苷酸可以具有不同标记,并且可以使用适当的光学方法区分它们,如由Solexa开发的测序方法(现在是Illumina公司(Illumina,Inc.))示例。

优选实施例包括焦磷酸测序技术。焦磷酸测序检测作为掺入新生链的具体核苷酸的无机焦磷酸(PPi)的释放(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.和Nyren,P.(1996)“Real-time DNA sequencing using detection of pyrophosphaterelease.[使用焦磷酸释放的检测的实时DNA测序]”Analytical Biochemistry[分析生物化学]242(1),84-9;Ronaghi,M.(2001)“Pyrosequencing sheds light on DNAsequencing.[阐明DNA测序的焦磷酸测序]”Genome Res.[基因组研究]11(1),3-11;Ronaghi,M.,Uhlen,M.和Nyren,P.(1998)“A sequencing method based on real-timepyrophosphate.[基于实时焦磷酸的测序方法]”Science[科学]281(5375),363;美国专利号6,210,891;6,258,568和6,274,320)。在焦磷酸测序中,可以通过由ATP硫化酶立即转化成三磷酸腺苷(ATP)检测释放的PPi,并且经由萤虫素酶产生的光子,检测产生的ATP的水平。待测序的核酸可以附接至阵列中的特征,并且将阵列成像,从而捕获由于在阵列的特征处的核苷酸的掺入而产生的化学发光信号。可以在用具体核苷酸类型(例如A、T、C或G)处理阵列后,获得图像。关于检测阵列中的图像特征,在添加每种核苷酸类型后,获得的图像将不同。图像中的这些差异反映阵列上特征的不同序列内容。然而,在图像中,每个特征的相对位置将保持不变。可以使用本文阐述的方法储存、处理和分析图像。例如,可以按与本文针对从用于基于可逆终止子的测序方法的不同检测通道获得的图像所示例的相同方式,处理在用每种不同核苷酸类型处理阵列后获得的图像。

在另一种示例性类型的SBS中,通过逐步添加例如含有如例如WO 04/018497和美国专利号7,057,026中所述的可切割的或可光漂白的染料标记的可逆终止子核苷酸,完成循环测序。此方法由Solexa商业化(现在是Illumina公司(Illumina,Inc.)),并且描述于WO91/06678和WO 07/123,744中。荧光标记的终止子(其中终止可以被逆转)和切割的荧光标记的可用性协助有效的循环可逆终止(CRT)测序。也可以将聚合酶联合共工程化,从而有效地掺入这些修饰核苷酸并且从其延伸。

优选地,在基于可逆终止子的测序实施例中,标记基本上并没有抑制SBS反应条件下的延伸。然而,检测标记可以是可除去的,例如通过切割或降解。可以在将标记掺入阵列的核酸特征后,捕获图像。在具体实施例中,每个循环涉及将四种不同核苷酸类型同时递送至阵列,并且每个核苷酸类型具有光谱不同的标记。可以各自使用针对四种不同标记中的一种具有选择性的检测通道,获得四种图像。可替代地,可以顺序地添加不同核苷酸类型,并且可以在每个另外步骤之间获得阵列的图像。在此类实施例中,每个图像将显示具有具体类型的掺入的核苷酸的核酸特征。由于每个特征的不同序列内容,在不同图形中将存在或不存在不同特征。然而,在图像中,特征的相对位置将保持不变。如本文阐述,可以储存、处理和分析获得自此类可逆终止子SBS方法的图像。在图像捕获步骤后,可以除去标记,并且可以除去可逆终止子部分,用于随后的核苷酸添加和检测循环。在具体循环中已经检测标记后,并且在随后的循环之前,除去标记可以提供以下优势:降低背景信号和循环之间的交互作用。本文阐述了有用标记和除去方法的实例。

在具体实施例中,核苷酸单体中的一些或全部可以包括可逆终止子。在此类实施例中,可逆终止子/可切割荧光团可以包括经由3’酯键,与核糖部分连接的荧光团(Metzker,Genome Res[基因组研究].15:1767-1776(2005))。其他方法已经从荧光标记的切割分离了终止子化学(Ruparel等人,Proc Natl Acad Sci USA[美国国家科学院院刊]102:5932-7(2005))。Ruparel等人描述了可逆终止子的开发,这些终止子使用小3’烯丙基来阻断延伸,但是可以通过用钯催化剂短暂处理,容易地解锁。可以经由可光切割的接头,将荧光团附接至碱基,可以通过30秒暴露于长波长UV光,容易地切割这些接头。因此,可以将二硫化物还原或光切割用作可切割接头。用于可逆终止的另一方法是在大体积染料放置在dNTP上后,加以确保的天然终止的使用。dNTP上带电荷的大体积染料的存在可以通过空间的和/或静电的位阻,充当有效终止子。一个掺入事件的存在阻止了进一步掺入,除非除去染料。染料的切割除去了荧光团并且有效地逆转了终止。美国专利号7,427,673,和7,057,026中也描述了修饰核苷酸的实例。

可以与本文所述的方法和系统一起使用的另外的示例性SBS系统和方法描述于以下文献中:美国公开号2007/0166705、2006/0188901、2006/0240439、2006/0281109、2012/0270305、和2013/0260372,美国专利号7,057,026,PCT公开号WO 05/065814,美国专利申请公开号2005/0100900,以及PCT公开号WO 06/064199和WO 07/010,251。

一些实施例可以使用以下检测,其中使用少于四种不同标记,检测四种不同核苷酸。例如,可以利用美国公开号2013/0079232的并入材料中描述的方法和系统,进行SBS。作为第一实例,可以在相同波长下检测一对核苷酸类型,但是基于与另一个核苷酸相比,该对的一个成员的强度方面的差异进行区分,或基于该对的一个成员的改变进行区分(例如经由化学修饰、光化学修饰或物理修饰),与针对该对的其他成员检测的信号相比,该改变引起明显信号出现或消失。作为第二实例,可以在具体条件下检测四种不同核苷酸类型中的三种,而第四核苷酸类型缺乏在那些条件下可检测的标记,或在那些条件下,最低限度地检测(例如由于背景荧光等,最小的检测)可以基于前三种核苷酸类型的对应信号的存在,确定它们掺入核酸中,并且可以基于任何信号不存在或最小的检测,确定第四种核苷酸类型掺入核酸中。作为第三实例,一个核苷酸类型可以包括在两个不同通道中检测的一个或多个标记,而在不多于一个通道中检测其他核苷酸类型。并不认为上述三种示例性构型是不相容的,并且它们可以按不同组合使用。组合所有三个实例的示例性实施例是基于荧光的SBS方法,该方法使用在第一通道中检测的第一核苷酸类型(例如当用第一激发波长激发时,具有在第一通道中检测的标记的dATP),在第二通道中检测的第二核苷酸类型(例如当用第二激发波长激发时,具有在第二通道中检测的标记的dCTP),在第一和第二通道两者中检测的第三核苷酸类型(例如当用第一和/或第二激发波长激发时,具有在两个通道中检测的至少一个标记的dTTP),以及缺乏在任一通道中检测不到或最低限度地检测的标记的第四核苷酸类型(例如不具有标记的dGTP)。

此外,如在美国公开号2013/0079232的并入材料中描述,可以使用单通道获得测序数据。在此类所谓一染料测序方法中,标记第一核苷酸类型,但是在产生第一图像后,除去该标记,并且仅在产生第一图像后,标记第二核苷酸类型。在第一和第二图像两者中,第三核苷酸类型保留其标记,并且在两种图像中,第四核苷酸类型保持未标记。

一些实施例可以使用通过连接技术的测序。此类技术使用DNA连接酶来掺入寡核苷酸,并且鉴定此类寡核苷酸的掺入。在与寡核苷酸杂交的序列中,寡核苷酸典型地具有与具体核甘酸的身份相关的不同标记。正如其他SBS方法,可以在用标记的测序试剂处理核酸特征的阵列后,获得图像。每个图像将显示具有具体类型的掺入的标记的核酸特征。由于每个特征的不同序列内容,所以在不同图像中将存在或不存在不同特征,但是在图像中,特征的相对位置将保持不变。如本文阐述,可以储存、处理和分析获得自基于连接的测序方法的图像。可以与本文所述的方法和系统一起使用的示例性SBS系统和方法描述于以下文献中:美国专利号6,969,488、6,172,218、和6,306,597。

一些实施例可以使用纳米孔测序(Deamer,D.W.&Akeson,M.“Nanopores andnucleic acids:prospects for ultrarapid sequencing.[纳米孔和核酸:用于超高速测序的前景]”Trends Biotechnol.[生物技术趋势]18,147-151(2000);Deamer,D.andD.Branton,“Characterization of nucleic acids by nanopore analysis[通过纳米孔分析,核酸的表征],”Acc.Chem.Res.[化学研究述评]35:817-825(2002);Li,J.,M.Gershow,D.Stein,E.Brandin,和J.A.Golovchenko,“DNA molecules andconfigurations in a solid-state nanopore microscope[在固态纳米孔显微镜中的DNA分子和构型]”Nat.Mater.[自然材料]2:611-615(2003))。在此类实施例中,靶核酸通过纳米孔。纳米孔可以是合成的孔或生物膜蛋白,例如α-溶血素。靶核酸通过纳米孔时,可以通过测量孔的电导率的波动,鉴定每个碱基对。(美国专利号7,001,792;Soni,G.V.&Meller,“A.Progress toward ultrafast DNA sequencing using solid-state nanopores.[朝向使用固态纳米孔进行超快DNA测序的进展]”Clin.Chem.[临床化学]53,1996-2001(2007);Healy,K.“Nanopore-based single-molecule DNA analysis.[基于纳米孔的单分子DNA分析]”Nanomed[纳米医学].2,459-481(2007);

Cockroft,S.L.,Chu,J.,Amorin,M.&Ghadiri,M.R.“A single-moleculenanopore device detects DNA polymerase activity with single-nucleotideresolution[单分子纳米孔装置以单核苷酸分辨率检测DNA聚合酶活性].”J.Am.Chem.Soc.[美国化学会志]130,818-820(2008))。如本文阐述,可以储存、处理和分析获得自纳米孔测序的数据。特别地,根据光学图像和本文阐述的其他图像的示例性处理,可以将数据处理为图像。

一些实施例可以使用涉及DNA聚合酶活性的实时监测的方法。可以通过荷载荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用(如描述于例如美国专利号7,329,492和7,211,414中),检测核苷酸掺入,或可以用零模式波导(如描述于例如美国专利号7,315,019中),并且使用荧光核苷酸类似物和工程化的聚合酶(如描述于例如美国专利号7,405,281和美国公开号2008/0108082中),检测核苷酸掺入。照明可以限制在表面拴系的聚合酶周围的仄升(zeptoliter)级体积,使得可以在低背景情况下观察到荧光标记的核苷酸的掺入(Levene,M.J.等人“Zero-mode waveguides for single-molecule analysis at high concentrations[用于高浓度下单分子分析的]零模式波导.”Science[科学]299,682-686(2003);Lundquist,P.M.等人“Parallel confocaldetection of single molecules in real time.[单分子的实时并行共焦检测]”Opt.Lett.[光学快报]33,1026-1028(2008);Korlach,J.等人“Selective aluminumpassivation for targeted immobilization of single DNA polymerase molecules inzero-mode waveguide nano structures[用于在零模式波导纳米结构中,单个DNA聚合酶的靶向固定的选择性铝钝化].”Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]105,1176-1181(2008))。如本文阐述,可以储存、处理和分析获得自此类方法的图像。

一些SBS实施例包括当核苷酸掺入延伸产物时检测释放的质子。例如,基于释放的质子的检测的测序可以使用电检测器和相关技术(这些都可商购自Ion Torrent公司(IonTorrent)(吉尔福德,康涅狄格州,生物技术子公司),或描述于美国公开号2009/0026082;2009/0127589;2010/0137143;和2010/0282617中的测序方法和系统。用于使用动力学排除扩增靶核酸的本文阐述的方法可以容易地应用于多种基底,这些基底用于检测质子。更具体而言,本文阐述的方法可以用于产生用于检测质子的扩增子的克隆群体。

可以有利地以多路形式进行以上SBS方法,使得同时操纵多种不同靶核酸。在具体实施例中,可以在常见反应容器中,或在具体基底的表面上,处理不同靶核酸。这允许以多路方式来方便递送测序试剂、除去未反应试剂并且检测掺入事件。在使用表面结合的靶核酸的实施例中,靶核酸可以处于阵列形式。在阵列形式中,典型地,靶核酸可以按空间上可区分的方式结合表面。靶核酸可以通过直接共价附接结合,附接至珠粒或其他颗粒,或结合聚合酶或与表面附接的其他分子。阵列可以包括在每个位点(也称为特征)处的靶核酸的单个拷贝,或在每个位点或特征处可以存在的具有相同序列的多个拷贝。如下文进一步详细描述,可以通过扩增方法,例如桥扩增或延伸PCR,产生多个拷贝。

本文阐述的方法可以按多种密度中的任一者使用具有特征的阵列,这些密度包括例如至少约10个特征/cm2、100个特征/cm2、500个特征/cm2、1,000个特征/cm2、5,000个特征/cm2、10,000个特征/cm2、50,000个特征/cm2、100,000个特征/cm2、1,000,000个特征/cm2、5,000,000个特征/cm2、或更高。

本文阐述的方法的一个优势是它们提供了多个靶核酸的平行的快速并且有效的检测。因此,本披露提供了整合系统,这些系统能够使用本领域已知的技术,例如以上示例的那些,制备并且检测核酸。因此,本披露的整合系统可以包括:流体组件(这些流体组件能够递送扩增试剂和/或测序试剂至一个或多个固定的DNA片段),包含例如泵、阀、储存器、流体线等组件的系统。流动池可以被配置和/或用于整合系统中,以便检测靶核酸。示例性流动池描述于例如美国公开号2010/0111768和美国序列号13/273,666中。作为示例的流动池,整合系统的流体组件中的一个或多个可以用于扩增方法,以及用于检测方法。以核酸测序实施例为例,整合系统的流体组件中的一个或多个可以用于本文阐述的扩增方法并且用于在测序方法例如以上示例的那些中递送测序试剂。可替代地,整合系统可以包括分开的流体系统,用来进行扩增方法,以及用来进行检测方法。能够产生扩增的核酸并且还确定核酸的序列的整合测序系统的实例包括但不限于MiSeqTM平台(Illumina公司(Illumina,Inc.),圣地亚哥,加利福尼亚州)和描述于美国序列号13/273,666中的装置。

在多种应用中,本文描述的reDNA可用作对照。例如,可以使用本领域已知的任何适合的测序技术,将reDNA测序。reDNA的组合物可以具有任何数量的已知特性,例如已知的染色体拷贝数、已知的G/C含量、跨染色体和/或基因组的已知序列分布、或其他已知特性,并且如此,在考虑实验条件改变的情况下,在测序方法中,本文提出的组合物可以用作对照。作为举例,如果已知reDNA文库具有某一G/C含量,文库可以包括在多路测序运行内,从而鉴定任何测序分析是否产生了与预期G/C含量的偏差。

在一些实施例中,reDNA组合物可以是针对文库制备方法的质量的对照。例如,测序文库的制备可以包括多个步骤,包括DNA末端修复、A-加尾、衔接子的连接、和/或扩增步骤。在任何这些步骤产生朝向任何特性的偏差的情况下,这些特性例如跨基因组或染色体的分布、序列的类型、G/C含量、片段的长度等,可以在下游分析中例如测序分析中检测该偏差。

在一些实施例中,reDNA组合物可以是用于测序仪器的对照。类似地,reDNA组合物可以是用于阵列仪器的对照。例如,测序仪器或阵列仪器可以进行多种功能,包括流体转移用于洗涤、核苷酸掺入、扩增、扫描、化学步骤(例如切割反应)、固相扩增、加热/冷却、产生激发光、检测荧光发射信号、摄像机和平台的移动、以及固体支持物上微观特征的扫描。在任何这些步骤产生朝向任何特性的偏差的情况下,这些特性例如跨基因组或染色体的分布、序列的类型、G/C含量、片段的长度等,可以在下游分析中例如测序分析或阵列分析中检测该偏差。可以校准仪器,从而调节或校正引起偏差或故障的任何过程、条件或组分。

在一些实施例中,reDNA组合物可以是用于核酸测序检验的验证对照。例如,基于测序的检验可以检测一种或多种遗传性异常,例如SNP变体、非整倍性、***、缺失、重复扩增、重排等。在一些实施例中,reDNA组合物可以用作验证对照,用于基于测序的非侵入性产前检验。在一些实施例中,reDNA组合物可以用作验证对照,用于基于测序的肿瘤检测检验。在这样一种实施例的实例中,在开发检验用于少见异常的情况下,可能难以获得足够的生物样品来进行大量验证检验确保检验的敏感性和/或特异性。因此,源自例如获得自携带少见异常的个体的cfDNA的reDNA组合物会是有用的,因为可以按足够大的量产生该组合物,从而允许在验证研究期间,检验的很多次或无限的重复运行。

在一些实施例中,reDNA组合物可以用作验证对照,用于基于测序的伴随诊断检验。伴随诊断检验可用于确定个体是否具有证明个体有资格作为用于治疗性治疗的候选者的基因特征。在一些实施例中,伴随诊断检验确定样品中遗传性变体的存在和身份,从而确定在治疗方案中,治疗性治疗是否适合。在此类实施例中,诊断检验可能需要验证多次,从而确保检验是可重复的并且具有希望的敏感性和/或特异性。因此,源自例如获得自携带基因特征的个体的cfDNA的reDNA组合物会是有用的,因为可以按足够大的量产生该组合物,从而允许在验证研究期间,检验的很多次或无限的重复运行。

示例性实施例

实施例1.一种方法,所述方法包括:

提供获得自受试者的多个双链模板核酸的样品;

将通用衔接子连接至所述模板核酸的两端,从而形成多个衔接子-模板-衔接子分子,

其中所述多个衔接子-模板-衔接子分子中的每一个包含侧翼是所述通用衔接子的模板核酸,

其中所述通用衔接子包含双链核酸的区域;并且

用第一通用引物和第二通用引物扩增所述多个衔接子-模板-衔接子分子,从而生成扩增的衔接子-模板-衔接子分子;

从所述扩增的衔接子-模板-衔接子分子的两端除去所述通用衔接子,从而生成未附接的通用衔接子和多个再生的模板核酸(reDNA)。

实施例2.如实施例1所述的方法,其中所述双链模板核酸是DNA。

实施例3.如实施例1-2中任一项所述的方法,其中所述双链模板核酸是无细胞DNA(cfDNA)。

实施例4.如实施例1-3中任一项所述的方法,其中所述受试者是孕妇,并且其中所述双链模板核酸包含胎儿和母体核酸的混合物。

实施例5.如实施例1-4中任一项所述的方法,其中所述样品包含cfDNA。

实施例6.如实施例1-5中任一项所述的方法,其中所述胎儿不包含遗传病症。

实施例7.如实施例1-6中任一项所述的方法,其中所述胎儿包含遗传病症。

实施例8.如实施例1-7中任一项所述的方法,其中所述遗传病症是非整倍性。

实施例9.如实施例1-8中任一项所述的方法,其中所述非整倍性是三体性。

实施例10.如实施例1-9中任一项所述的方法,其中所述三体性是21三体性、18三体性、13三体性、9三体性、8三体性、22三体性、XXX、XXY、或XYY。

实施例11.如实施例1-10中任一项所述的方法,其中所述遗传病症包括核苷酸序列的表现不足。

实施例12.如实施例1-11中任一项所述的方法,其中怀疑所述受试者具有赘生物。

实施例13.如实施例1-12中任一项所述的方法,其中所述样品包含循环肿瘤DNA和无细胞正常DNA。

实施例14.如实施例1-13中任一项所述的方法,其中所述样品包括血液、尿液、痰液、或粪便。

实施例15.如实施例1-14中任一项所述的方法,所述方法进一步包括在连接前,处理所述多个双链模板核酸,从而将末端修饰为平端。

实施例16.如实施例1-15中任一项所述的方法,所述方法进一步包括在连接前,处理所述多个双链模板核酸,从而将3’端修饰为作为3’突出结构终止。

实施例17.如实施例1-16中任一项所述的方法,其中所述通用衔接子进一步包括单链非互补核酸链的区域,所述区域包括至少一个通用引物结合位点,并且其中所述连接将所述通用衔接子的双链核酸的区域共价附接至所述模板核酸的各端。

实施例18.如实施例1-17中任一项所述的方法,其中所述扩增包括指数式扩增反应。

实施例19.如实施例1-18中任一项所述的方法,其中所述指数式扩增反应包括聚合酶链式反应(PCR)。

实施例20.如实施例1-19中任一项所述的方法,其中所述扩增包括具有低错误率的DNA聚合酶。

实施例21.如实施例1-20中任一项所述的方法,其中所述通用衔接子包括限制性内切核酸酶识别位点,并且所述除去包括将所述扩增的衔接子-模板-衔接子分子暴露于限制性内切核酸酶,并且切割所述衔接子-模板-衔接子分子,从而生成除去的通用衔接子和多个reDNA。

实施例22.如实施例1-21中任一项所述的方法,其中所述限制性内切核酸酶的切割位点和识别位点是分开的。

实施例23.如实施例1-22中任一项所述的方法,其中所述限制性内切核酸酶是SapI、MlyI、或BpuEI。

实施例24.如实施例1-23中任一项所述的方法,其中所述reDNA在所述模板的各端保留了所述通用衔接子的部分。

实施例25.如实施例1-24中任一项所述的方法,其中所述第一通用引物和所述第二通用引物包括捕获剂。

实施例26.如实施例1-25中任一项所述的方法,其中所述捕获剂包括生物素。

实施例27.如实施例1-26中任一项所述的方法,其中所述通用衔接子包括限制性内切核酸酶识别位点,其中所述除去包括使所述衔接子-模板-衔接子分子与包含结合配体的化合物的表面接触,从而生成结合的扩增的衔接子-模板-衔接子分子,并且将所述结合的扩增的衔接子-模板-衔接子分子暴露于切割所述结合的扩增的衔接子-模板-衔接子分子的限制性内切核酸酶,从而生成除去的通用衔接子和多个reDNA,其中所述除去的通用衔接子结合至所述表面。

实施例28.如权利要求1-27中任一项所述的方法,其中所述除去进一步包括使所述除去的通用衔接子与所述reDNA分离。

实施例29.如权利要求1-28中任一项所述的方法,其中所述分离包括使包含所述除去的通用衔接子和所述reDNA的混合物与结合配体的化合物接触,其中所述化合物附接至表面,并且其中所述除去的通用衔接子结合至所述表面。

实施例30.如实施例1-29中任一项所述的方法,其中所述表面包括珠粒。

实施例31.如实施例1-30中任一项所述的方法,所述方法进一步包括除去包含所述结合的除去的通用衔接子的表面,从而导致所述除去的通用衔接子与所述reDNA的分离。

实施例32.如实施例1-31中任一项所述的方法,其中所述除去包括落在预定大小范围内的reDNA的选择。

实施例33.一种方法,所述方法包括:

提供源自获得自一个受试者的样品的多个再生的模板核酸(reDNA),

其中每个reDNA是模板;

将通用衔接子连接至所述模板核酸的两端,从而形成多个衔接子-模板-衔接子分子,

其中所述多个衔接子-模板-衔接子分子中的每一个包含侧翼是所述通用衔接子的模板核酸,

其中所述通用衔接物包括(i)双链核酸的区域,以及(ii)单链非互补核酸链的区域,所述单链非互补核酸链的区域包括至少一个通用引物结合位点,

由此产生测序文库,用于确定模板的至少一部分的序列。

实施例34.如实施例33所述的方法,其中所述单链非互补核酸链的区域进一步包括至少一个通用延伸引物结合位点。

实施例35.如实施例33-34中任一项所述的方法,其中在所述单链非互补核酸链的区域的远端的双链核酸的区域作为平端结构终止。

实施例36.如实施例33-35中任一项所述的方法,其中所述多个模板包含平端结构。

实施例37.如实施例33-36中任一项所述的方法,其中在所述单链非互补核酸链的区域的远端的双链核酸的区域作为3’突出结构终止。

实施例38.如实施例33-37中任一项所述的方法,其中所述3’突出结构包括具有1至4个核苷酸的突出结构。

实施例39.如实施例33-38中任一项所述的方法,其中所述3’突出结构包括T核苷酸的突出。

实施例40.如实施例33-39中任一项所述的方法,其中所述模板包括与所述双链核酸的区域的3’突出结构互补的3’突出结构。

实施例41.如实施例33-40中任一项所述的方法,所述方法进一步包括:

提供包含多个扩增位点的表面,

其中所述扩增位点包括具有游离3’端的附接的单链核酸的至少两个群体,并且

在适合产生各自包括来自单个衔接子-模板-衔接子分子的扩增子的克隆群体的多个扩增位点的条件下,使包含扩增位点的表面与多个衔接子-模板-衔接子分子接触。

实施例42.如实施例33-41中任一项所述的方法,其中所述多个衔接子-模板-衔接子分子的数量超过扩增位点的数量,其中所述衔接子-模板-衔接子分子具有至所述扩增位点的流体通路,并且其中每个所述扩增位点包含针对若干个衔接子-模板-衔接子分子的容量。

实施例43.如实施例33-42中任一项所述的方法,其中所述接触包括同时进行以下:(i)以平均运输速度,将所述衔接子-模板-衔接子分子运输至所述扩增位点,以及(ii)以平均扩增速度,扩增位于所述扩增位点的所述衔接子-模板-衔接子分子,其中所述平均扩增速度超过所述平均运输速度。

实施例44.一种组合物,所述组合物包含如实施例1所述的衔接子-模板-衔接子分子,其中所述通用衔接子包含限制性内切核酸酶识别位点。

实施例45.如实施例44所述的方法,其中所述限制性内切核酸酶是SapI、MlyI、或BpuEI。

实施例46.一种组合物,所述组合物包含通过如实施例1所述的方法产生的多个reDNA,并且进一步包含人工生物流体。

实施例47.如实施例46所述的组合物,其中所述人工生物流体包括人工血浆。

实施例48.如实施例1-32中任一项所述的方法,其中怀疑所述受试者具有细菌或病毒感染。

实施例49.如实施例1-32或48中任一项所述的方法,其中所述样品包含病毒DNA或细菌DNA。

实施例50.如实施例1-32或48-49中任一项所述的方法,其中所述样品包括血液、尿液、痰液、或粪便。

实施例51.一种在核酸检测检验中使用对照的方法,所述方法包括:

a.使用如实施例1所述的方法,提供多个再生的模板核酸(reDNA);

b.针对检验样品并且针对步骤(a)中获得的reDNA,进行核酸检测检验;

c.分析来自使用所述reDNA作为对照的所述核酸检测检验的结果。

实施例52.如实施例51所述的方法,其中所述核酸检测检验包括测序。

实施例53.如实施例51-52中任一项所述的方法,其中所述核酸检测检验包括微阵列分析。

实施例54.如实施例51-53中任一项所述的方法,其中所述核酸检测检验包括酶解过程。

实施例55.一种方法,所述方法包括针对使用实施例1所述的方法获得的多个再生的模板核酸(reDNA)进行核酸检测检验。

实施例56.如实施例55所述的方法,其中所述reDNA是针对文库制备方法的质量的对照。

实施例57.如实施例55-56中任一项所述的方法,其中所述reDNA是用于测序仪器的校准对照。

实施例58.如实施例55-57中任一项所述的方法,其中所述reDNA是用于阵列仪器的校准对照。

实施例59.如实施例55-58中任一项所述的方法,其中所述reDNA是用于核酸测序检验的验证对照。

实施例60.如实施例55-59中任一项所述的方法,其中所述reDNA是用于基于测序的非侵入性产前检验的验证对照。

实施例61.如实施例55-60中任一项所述的方法,其中所述reDNA是用于基于测序的肿瘤检测检验的验证对照。

实施例62.如实施例55-61中任一项所述的方法,其中所述reDNA是用于基于测序的伴随诊断检验的验证对照。

实施例63.如实施例55-62中任一项所述的方法,其中所述伴随诊断检验确定样品中遗传性变体的存在和身份,从而确定在治疗方案中,治疗性治疗是否适合。

实例

本披露通过以下实例来阐明。应该理解地是,具体实例、材料、量和程序应根据如本文所阐述的本披露的范围和精神来宽泛地解释。

实例1

目的

此实例描述了血浆对照材料的产生,该材料可以作为使用人血浆的替代用于实验中。如本文所述,在此过程期间分离并且纯化的cfDNA输入是足够浓的,能供应数十个与材料匹配的平板,提供了大量的遗传上类似的cfDNA,所述cfDNA可以经长时段使用。另外,使用者可以将此制备的DNA样品点样到血浆稀释液中,产生人血浆的数量上类似的替代。在其中需要cfDNA的实验中,此替***稀释液可以用于模拟人血浆的质量,保留人血浆用于其中需要它的更重要的实验。

表1定义了此实例中使用的术语。

表1.定义

Figure BDA0002317109880000611

材料&设备

设计此工作流程用于与从人血浆中提取的cfDNA(无细胞DNA)一起使用。预期cfDNA具有160-170bp的中位大小。

所使用的设备描述于表2中。使用的参考和标准方案描述于表3中。使用的试剂描述于表4中。使用的引物描述于表5中。

表2.设备。

Figure BDA0002317109880000622

表3.参考和标准方案。

Figure BDA0002317109880000623

表4.试剂

Figure BDA0002317109880000632

Figure BDA0002317109880000641

模板DNA的扩增

试剂制备和处理

如所述(美国专利号No 9,323,888)制备文库,但是VeriSeq NIPT衔接子板被定制Y-衔接子替代,并且用PCR混合物洗脱板。

根据表6,在稀释缓冲液中1:100稀释SapI衔接子,并且使用涡旋混合器混合10秒。将定制衔接子混合物(30uL)转移至Eppendorf裙边Twin-Tec 96孔板中。

表6.试剂稀释用于定制衔接子混合物,48批次

Figure BDA0002317109880000651

从4℃储存除去SPRI珠粒,放置在架子上,并且在室温下旋转大约30分钟。从4℃或-20℃储存除去96孔全裙边cfDNA样品板,必要时,完全解冻,使用涡旋混合器混合20秒,并且在1000g下离心20秒。

使用增强的PCR混合物、生物素酰化的引物、和重悬浮缓冲液制备PCR混合物用于珠粒洗脱。

解冻用于英杰公司(Invitrogen)Qubit DNA 1000测定的试剂。

修饰的VeriSeq NIPT 48文库

打开Hamilton Star Run Control并且使用厂商说明书运行Veriseq NIPT方法(版本1.4或更新)。在液体检测检查后,除去在轨道47上的载体的位置5处的、含有洗脱缓冲液或HT1的20mL储存器。

在珠粒干燥步骤或并且在方法析出HT1或洗脱缓冲液之前,除去在轨道19-24上发现的3x 2多路复用载体的位置5处的SPRI珠粒板。可替代地,可以允许该方法完成,因为如果不除去含有试剂的20mL储存器,Hamilton将不析出HT1或洗脱缓冲液。

为了用每孔50uL的PCR混合物洗脱珠粒,用箔密封覆盖板,通过涡旋混合,在离心机上离心,并且放置在磁性板上至少2分钟,并且直至溶液澄清。将上清液(50uL)转移至Eppendorf全裙边Twin-tec 96孔板上。

PCR扩增

将样品板放置在热循环仪上并且选择EPM14程序。表7中概述了EPM 14程序。在EPM14完成后,从热循环仪中除去板。如果没有另外循环的PCR,则进行到下一选择:“链霉亲和素结合、消化、和纯化。”

表7.EPM 14程序

Figure BDA0002317109880000661

定量和稀释(仅用于第二PCR)

在1.5mL或2mL管仲,将PCR产物(50μL)与950μL重悬浮缓冲液(RB)合并,用于1:20稀释,总计1ml。使用涡旋混合器混合溶液并且离心。

如厂商推荐,使用Qubit读取器。按每个样品10μL样品输入,使用2个分开的管,进行Qubit读取,并且将所得读数平均。在稀释至60pg/μL后,在体积适当的管(5mL、15mL、或50mL聚丙烯管)中,用指示的体积的重悬浮缓冲液,合并希望体积的1:20EPM 14产物。混合并且离心最终稀释物,并且剩余1:20稀释物储备溶液保留在-20℃下,用于将来使用。

第二PCR扩增

在新96孔板中添加EPM 14产物(25uL的60pg/μL)。对于50uL的总体积,将PCR混合物(25uL)添加至此溶液,并且混合。将板放置在热循环仪中,并且选择表8中概述的EPM 13程序。

表8.EPM 13程序

Figure BDA0002317109880000662

Figure BDA0002317109880000671

在PCR完成后,从热循环仪中除去板。在适当大小的管(5mL、15mL、或50mL聚丙烯)中合并样品重复,并且运行生物分析仪DNA 1000芯片来验证PCR扩增。用15μL的重悬浮缓冲液稀释五微升的样品,从而产生1:4稀释,之后在生物分析仪上运行。扩增的文库的峰值大小集中接近260-270bp。

输出和储存

可以密封板并且储存在2℃至8℃下,用于稍后在同一天使用,或可以密封板并且储存在-20℃至-15℃下,或储存过夜或更长时间。

链霉亲和素结合、消化、和纯化

试剂制备和处理

将Dynabeads MyOne链霉亲和素T1放置在架子上,在室温下持续至多30分钟。可以在深孔板中,或者可以在体积适当的聚丙烯管中发生反应。对于每个消化反应,下表9用来产生足够的消化混合物。体积乘以制造足够的混合物需要的总反应。保持SapI消化混合物在冰上或在4℃下,直至需要。在黑暗中,在室温下,孵育DNA 1000生物分析仪试剂至少30min。

表9.用于每次SapI消化的体积细分

Figure BDA0002317109880000672

链霉亲和素珠粒洗涤

对于待消化的每个样品,将来自表10的链霉亲和素珠粒的体积分配到反应容器中。

表10.消化反应和灭活体积

Figure BDA0002317109880000673

将等体积的1x珠粒洗涤液添加至具有链霉亲和素珠粒的每个管中,并且混合。1x珠粒洗涤液为等体积蒸馏水和MyONE T1珠粒洗涤液。可以提前制造MyONE T1珠粒洗涤液,并且储存在2℃至8℃下。可以通过合并10mM Tris pH 7.5、1mM EDTA、和2M NaCl制造MyONET1珠粒洗涤液。可以将混合物放置在磁体上,直至溶液澄清(至少1分钟)。除去一半(1/2)的上清液,并且从磁体上除去容器。将此做法再重复两次,总计3次洗涤。从磁体上除去具有洗涤的珠粒的容器。

限制性酶切消化

将具有洗涤的珠粒的反应容器放置在磁体上,持续直至溶液澄清(至少1分钟)。除去所有上清液,使得仅珠粒保留在容器中。将表10中指示的PCR产物的体积添加至干燥的珠粒,并且混合以重悬浮珠粒。在1500RPM和20℃下,在Eppendorf ThermoMixer上混合结合混合物20分钟。在将容器短暂离心后,将容器放置在磁体上,直至溶液澄清(至少1分钟)。除去所有上清液,同时管仍在磁体上。将表10中指示的消化混合物的体积添加至容器,并且在1500RPM和37℃下,将容器放置在Eppendorf ThermoMixer上持续1小时。孵育后,将来自表10的适当体积的EDTA添加至反应容器,混合,离心,并且将容器放置在磁体上,直至溶液澄清(至少2分钟)。

小心地将上清液样品(现在称为reDNA)转移至新的体积适当的聚丙烯管中。在生物分析仪DNA高敏感芯片上运行纯化的样品池(用5μL的重悬浮缓冲液稀释的5μL的样品,以产生1:2,之后运行),从而确认消化。cfDNA的峰值大小集中接近165-170bp。重新检验和/或弃去具有异常生物分析仪谱的样品。将符合QC要求的同一样品的消化合并到体积适当的聚丙烯管中。将样品长期储存在-20℃下。

对照材料的产生

试剂制备和处理

在解冻后,通过合并10μL的reDNA与10μL的冲悬浮缓冲液,产生reDNA样品的1:2样品稀释的等分试样。使用Qubit试剂和Qubit缓冲液产生染料的1:200稀释。

灭活的DNA(deDNA)的产生

灭活的DNA(deDNA)是来自非人类170bp序列(该序列具有防止任何酶活性(包括连接)的5’反向ddt修饰)的扩增的DNA。

通过合并300uL洗脱缓冲液和50uL的每种反向引物和正向引物(总计100uL),制造用于反向ddt PCR引物混合物的引物混合物。将模板DNA稀释至50pg/uL。模板可以是先前扩增的deDNA,抑或新鲜定制的人工170bp。将二十五微升的底物DNA与25uL的反向ddt PCR引物混合物合并,放置在热循环仪上,并且使用EPM 14运行。在完成后,合并所有反应。deDNA可以储存在-20℃下。

Qubit定量

使用按reDNA和deDNA样品2个分开的管,一个管具有10μL(高)样品输入,并且一个管具有5μL(低)输入,以1:2样品稀释进行Qubit读数。

通过高浓度管的Qubit测量值(ng/mL)乘以40,并且低浓度管的Qubit测量值(ng/mL)乘以80,确定终浓度。如果高和低读数之间的差异大于两个浓度读数的更低值的30%,则重新进行Qubit定量。将高和低读数终浓度进行平均作为终浓度(现在按pg/μL计)。将Qubit定量进行任何次数,将reDNA储备溶液从-20℃解冻。

产生人工血浆

产生的每900μL人工血浆含有50%血浆稀释液(免疫化学技术公司(ImmunoChemistry Technologies),布卢明顿,MNac)、2mM EDTA、3.5ng reDNA、3.5ngdeDNA、和dPBS(用来填充)。

在体积适当的聚丙烯容器中,添加适当体积的血浆稀释液,并且混合,如果产生大体积,则使用搅拌棒。在体积适当的容器中,测量出总的所需dPBS。在两个体积适当的聚丙烯容器中(至少4x deDNA和reDNA体积):用来自测量的储备的dPBS填充容器至50%,添加适当体积的reDNA和deDNA(每个管一种),将适当体积的EDTA添加至reDNA管,并且将来自储备的剩余dPBS添加至具有血浆稀释液的混合容器中,并且使用搅拌棒或翻转进行混合。密封deDNA和reDNA管,并且剧烈地涡旋混合。将deDNA管内容物添加至混合容器,并且混合5分钟,并且然后将reDNA管内容物添加至混合容器,并且混合至少30分钟。

可以将人工血浆等分进螺纹顶管仲,用于在-80℃冰箱中长期储存,直至用作正常人类母体血浆。

实例2

reDNA的表征

此检验的目的是比较针对reDNA抑或从其衍生reDNA片段的对应cfDNA进行的非侵入性产前检验的量度。如实例1中描述,从cfDNA产生reDNA,cfDNA是从血浆提取的,血浆来自全血,全血获得自健康孕妇。血液获得自48个孕妇,包括健康男胎儿和女胎儿的混合物。在同意的情况下,血液获得自患者。

针对原始的cfDNA,并且针对源自该cfDNA的reDNA,进行基于测序的非侵入性产前检验。如美国专利号10,095,831中描述进行该检验,其内容通过引用以其全文特此结合。来自该检验的测序量度和其他NIPT检验量度包括基于片段大小和/或覆盖度的胎儿分数、NIPT检验结果统计(包括t-统计学和对数似然比(LLR))。

总结在下表中的主要NIPT量度指示reDNA与匹配的血浆样品一致地并且成比例地等同。reDNA中的任何偏差都是可再现并且一致的。例如,在血浆和reDNA样品中,维持ChrX中的短和长读数之间的关系。结果指示reDNA可用作对照,用于NIPT检验验证。

表10.NIPT量度。

Figure BDA0002317109880000701

Figure BDA0002317109880000711

在此援引的全部专利、专利申请、和出版物、和以电子方式可获得的材料(包括,例如,核苷酸序列提交,例如GenBank和RefSeq;和氨基酸序列提交,例如SwissProt、PIR、PRF、PDB;以及来自GenBank和RefSeq中经注释的编码区的翻译)的完整披露内容通过引用以其全文结合。出版物中引用的补充性材料(如补充性表、补充性图、补充性材料和方法、和/或补充性实验数据)同样地通过引用以其全文结合。在本申请的披露内容和通过引用方式结合在此的任何文献的披露内容之间存在任何不一致性的情况下,本申请的披露内容应当占据主导。仅出于清楚理解起见给出以上详细说明和实例。不应将其理解成不必要的限制。本披露不局限于所显示和描述的这些精确细节,对于本领域普通技术人员而言,变体将明显地包含在由权利要求所限定的本披露之内。

除非另外指明,所有表示组分、分子量的数字,以及在说明书和权利要求书中使用的等要理解为在所有情况下由术语“约”进行修饰。因此,除非另外相反地指明,在本说明书和权利要求书中阐述的数值参数是近似值,这些近似值可以取决于本披露所寻求获得的所希望的特性而不同。最低限度并且不试图限制等效物原则应用到本权利要求书的范围,每一个数值参数至少应该按照报告的有效数字的数量以及通过应用普通的舍入方法来解释。

虽然阐述本披露的广泛范围的数字范围和参数是近似值,但是在具体实例中阐述的数值被尽可能地精确地报道。然而,全部数值内在地含有因其相应的检验度量中存在的标准偏差而必然产生的范围。

全部标题旨在方便读者并且不应当用来限制该标题后续文本的意思,除非如此说明。

57页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于多核苷酸样品的索引的通用短衔接子

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!