基因目标区域的富集方法及体系

文档序号:1639045 发布日期:2020-01-17 浏览:20次 >En<

阅读说明:本技术 基因目标区域的富集方法及体系 (Method and system for enriching gene target region ) 是由 郭志伟 李英辉 陈倩 胡荣君 于 2019-09-20 设计创作,主要内容包括:本发明首先提供了一种基因目标区域的富集方法,包括:(1)通过特异性探针扩增包含目标区域的片段化DNA,以提供捕获延伸产物,所述的特异性探针包括与所述片段化DNA的目标区域互补的序列,且其3’末端和5’末端核苷酸均被修饰;(2)向步骤(1)所提供的捕获延伸产物中加入连接酶,以提供连接产物。本发明其次提供了一种基因目标区域的富集体系,适用于本发明提供的基因目标区域的富集方法。本发明所提供的富集方法操作简单、结果可靠,应用于短片段DNA可以最大程度的减少原始分子尤其是稀有原始分子的损失,高效地富集目标分子。(The invention firstly provides an enrichment method of a gene target region, which comprises the following steps: (1) amplifying the fragmented DNA comprising the target region by a specific probe comprising a sequence complementary to the target region of the fragmented DNA and having both its 3 &#39;and 5&#39; terminal nucleotides modified to provide capture extension products; (2) adding a ligase to the captured extension product provided in step (1) to provide a ligation product. The invention further provides an enrichment system of the gene target region, which is suitable for the enrichment method of the gene target region provided by the invention. The enrichment method provided by the invention is simple to operate and reliable in result, and can reduce the loss of original molecules, particularly rare original molecules to the maximum extent and efficiently enrich target molecules when being applied to short-fragment DNA.)

基因目标区域的富集方法及体系

技术领域

本发明涉及生物技术领域,特别是涉及一种基因目标区域的富集方法及体系。

背景技术

基因测序技术自上世纪七十年代问世以来已经历了近半个世纪,1985年PCR技术的横空出世推动了整个分子生物学领域的发展。下一代测序技术(NGS)具有准确、灵敏、通量高的优点,随着测序成本的不断降低,其应用范围不断扩大,但其应用也受到了需求多样化且费时费力的文库构建这一步骤的制约。在对临床样本比如血浆样本的建库过程中,DNA的存在形式通常是短片段的,受损的,单链或部分双链的,对于这些存在形式的尤其是片段小于200bp的DNA来说,现有的PCR技术并不能做到很好的捕获和富集。

对于微小DNA片段的富集,现有技术仍主要使用传统PCR建库方法,或先加接头连接再扩增比如杂交捕获法。但对于前者来说,由于需要双端引物,极大限制了适合扩增的片段的长度,且存在扩增中的偏好性导致产物的高不均一性,以及指数扩增累积的错误导致后续测序结果不准确的问题;而对于后者,虽然对待富集片段长度的要求没有PCR高,但需要先进行连接反应,而连接的效率通常只有20%~50%,导致捕获效率低下,还存在因连接困难容易丢失稀有分子的问题。为了解决NGS的建库问题,近期发展起来的技术还包括诸如分子倒置探针、多重PCR等。分子倒置探针与杂交捕获技术相比,特异性较好,但其口袋状探针设计复杂,也不适用于微小DNA片段的富集。多重PCR技术适合大规模样本,应用最为广泛,但要么引物设计要求极高且扩增子均一性差,要么扩增产物均一性较好但对起始样本浓度要求很高,同样不适用于起始浓度低的微小DNA片段的富集。这些现有技术构建文库时通常需要双端引物,为了去除接头二聚体污染必然引入纯化步骤,这导致小片段的双链DNA、受损伤的双链DNA和单链DNA分子的信息丢失。然而,在一些转录活跃的基因组区域恰恰是这些存在形式的DNA。综上所述,现有技术对片段化的,尤其是200bp以下的微小DNA进行富集的需求严重未能满足,而找到高效富集片段化DNA目标区域的方法,突破连接效率对富集效果的瓶颈,抑制非目的连接产物的产生,最大程度的捕获稀有分子并保持产物的均一性,是本发明要解决的主要技术问题。申请人在申请号为2019100024085的申请中,已先行确立了先用特异性探针线性扩增目标区域再连接接头实现富集的技术方案,主要的应用方向是基于二代测序的核酸检测。本发明将用另一思路解决片段化DNA靶向富集的问题。

发明内容

鉴于以上所述现有技术的缺点,本发明的一个目的在于提供一种基因目标区域的富集方法,用于解决现有技术中的问题。

为实现上述目的及其他相关目的,本发明首先提供一种基因目标区域的富集方法,包括:

(1)通过特异性探针扩增包含目标区域的片段化DNA,以提供捕获延伸产物;

所述特异性探针包括与所述片段化DNA的目标区域互补和不互补的序列,且所述特异性探针的3’末端和5’末端核苷酸均被修饰;

(2)向步骤(1)所提供的捕获延伸产物中加入连接酶,以提供连接产物,所述连接产物包括环化连接产物和线性连接产物。

本发明另一个目的在于提供一种用于富集片段化DNA目标区域的体系,包括适用于本发明提供的基因目标区域富集方法的特异性探针和连接酶。

附图说明

图1是本发明实施例中对于目标区域富集方法的流程示意图。

图2是本发明实施例中构建的分子的示意图。

具体实施方式

本发明发明人经过大量探索性研究,提供了一种基因目标区域的富集方法,所述基因目标区域的富集方法操作简单、结果可靠,尤其对于短片段核酸具有良好的富集效果,在此基础上完成了本发明。

本发明第一方面提供一种基因目标区域的富集方法,包括:

(1)通过特异性探针扩增包含目标区域的片段化DNA,以提供捕获延伸产物,所述特异性探针既包括与所述片段化DNA的目标区域互补也包括与所述目标区域不互补的序列,且所述特异性探针的3’末端和5’末端核苷酸均被修饰,用于阻止所述特异性探针结合模板前其3’末端发生连接反应,主要是和自身5’末端发生的自连反应;

(2)将步骤(1)所提供的捕获延伸产物中加入连接酶,以提供连接产物。这一步的连接产物包含两部分,其一是捕获延伸产物分子内连接形成的环化连接产物,其二是捕获延伸产物与所述特异性探针分子间连接形成的线性连接产物。不论是环化连接产物或是线性连接产物都包含需要扩增的目标区域,均适用于目标分子的文库构建。

本发明所提供的基因目标区富集方法中,通过特异性探针扩增包含目标区域的片段化DNA,包含目标区域的片段化DNA可以是一个,也可以是多个。通常来说,特异性探针与包含目标区域的片段化DNA是一一对应的,即反应体系中特异性探针的数量可以是一种,也可以多种。此步骤所述的延伸指的是对样本完整的线性预预扩增步骤,包括单轮或多轮变性、退火、延伸步骤的循环。优选的实施例中,此步骤实施多轮循环,比如2~100、2~10、10~20、20~30、30~40、40~60、60~80、80~100个循环,有效地增加包含目标区域的分子数。

所述基因目标区域的富集方法中,所述片段化DNA可以是双链DNA、单链DNA和cDNA等,所述cDNA通常可以由RNA反转录获得。对于双链DNA来说,特异性探针可以包括与所述片段化DNA其中一链的目标区域互补的序列,也包括。所以本发明的富集方法也适用于片段化RNA,本领域技术人员可以将RNA反转录成cDNA即可通过本发明所提供的富集方法进行后续操作。所述片段化DNA的长度可以是25~200bps、25~40bps、40~60bps、60~80bps、80~100bps、100~120bps、120~140bps、140~160bps、160~180bps、或180~200bps。

所述基因目标区域的富集方法中,所述步骤(1)的扩增体系中可以包括特异性探针、DNA聚合酶和dNTP。通过特异性探针扩增包含目标区域的片段化DNA的反应通常可以在DNA聚合酶存在的条件下进行。3'端封闭修饰的探针在高保真聚合酶的作用下结合模板后,封闭基团被切除,探针被活化,从而可以对目标序列进行有效延伸。所述DNA聚合酶可以具有3’-5’外切酶活性,从而可以切除结合模板后的探针3’端的取代基团,使探针能够延模板延伸,优选可以为高保真DNA聚合酶,用于进一步提高产物的扩增效率和纯度。所述DNA聚合酶也可以是普通的DNA聚合酶,即只有聚合酶活性,没有3’-5’外切酶活性。这种情况下,所述步骤(1)的扩增体系中还包括活性物质,所述活性物质可以用于切除结合目标区域后所述特异性探针的3’末端修饰基团,故可以在捕获延伸体系中与DNA聚合酶(例如,普通的DNA聚合酶)组合,以提升线性扩增体系的效率,所述活性物质优选为核酸酶。通过特异性探针扩增包含目标区域的片段化DNA的反应通常可以在dNTP存在的条件下进行,所述dNTP通常可以是耦联标记分子的dNTP,所述耦联标记分子可以是包括但不限于生物素等,所述dTNP可以是包括但不限于dCTP、dATP等。所述dNTP还可以耦联有标记分子,所述标记分子可以是生物素等,所述标记分子通常可以用于捕获延伸产物的纯化。

所述基因目标区域的富集方法中,所述的特异性探针包括与所述片段化DNA的目标区域互补的序列,从而可以实现对片段化DNA的目标区域的特异性扩增,本领域技术人员可选择合适的片段化DNA的目标区域,并根据片段化DNA的目标区域,设计合适的互补的序列,互补的序列通常靠近探针3’末端。所述的特异性探针通常还包括与所述片段化DNA不互补的序列,从而可以实现酶切位点和通用序列的引入,不互补的序列通常靠近探针5’末端。所述特异性探针可以是3’末端核苷酸被修饰的特异性探针,用于阻止所述特异性探针的3’末端与其他基团发生连接反应,从而可以避免游离探针的自连或连接其它非目的分子。本领域技术人员可选择合适的修饰基团以实现特异性探针3’末端的修饰,例如,所修饰的基团可以取代特异性探针3’末端核苷酸上的天然基团(例如,羟基、甲氧基等),以阻止所述特异性探针3’端发生连接反应,所使用的修饰基团通常可以是封闭基团。探针通过互补序列与模板上的目标区域结合后,3’端的修饰基团可以被酶切除,使得探针被活化,从而可以对目标序列进行有效延伸。特异性探针的3’末端修饰基团可以是包括但不限于氢原子、C3Spacer基团、C6 Spacer基团、磷酸基团(PO4)、氨基(NH2)等。不同取代基团的选择对于探针的捕获效果有明显差异,在本发明一优选实施例中,将探针3’端羟基取代为C3 Spacer得到的效果最佳,与其它取代基团相比具有明显优势。所述特异性探针还包括通用序列,所述通用序列通常能被测序系统识别,从而可以将后续提供的连接产物通过测序系统进行测序,例如,对于Ion Torrent测序系统,所述通用序列可以是对应的P1序列和A序列的反向互补序列。这种能被测序系统识别的序列的应用,使本发明完成建库后的文库能够通过高通量测序平台进行测序,以提供各种后续研究和临床应用所需要的信息。在本发明一优选实施方式中,所述特异性探针3’端尾部区域的碱基可以包含错配,错配的可以是探针3’端最后一个碱基,也可以是接近3’端的碱基;错配的可以是一个碱基,也可以是复数个。该错配不仅不影响探针的特异性和结合效率,还更有利于提高高保真DNA聚合酶的切割效率和保真度。

所述基因目标区域的富集方法中,所述步骤(1)中,还可以包括纯化捕获延伸产物。本领域技术人员可选择合适的方法对捕获延伸产物进行纯化,例如,捕获延伸产物的纯化方法可以是包括硅胶柱纯化、加热处理、磁珠纯化等。在本发明一具体实施例中,可以针对dNTP耦联的标记分子对捕获延伸产物进行纯化,纯化过程可以使用亲和素或者链霉亲和素包被的磁珠纯化等。

本发明所提供的基因目标区富集方法中,还可以包括:向步骤(1)所提供的捕获延伸产物中加入连接酶,以提供连接产物。所述连接酶是单链连接酶,优选为T4 RNA连接酶或热稳定性RNA连接酶等。所述连接产物可以是包括捕获延伸产物分子内连接形成的环化连接产物,也可以是捕获延伸产物与特异性探针分子间连接形成的线性连接产物。

所述基因目标区域的富集方法中,所述特异性探针可以是5’末端核苷酸被修饰的、且在步骤(2)的反应温度下为单链结构,从而可以在单链连接酶的催化下,通过捕获延伸产物的3’端羟基与其自身或特异性探针的5’末端的修饰基团生成共价键,得到连接产物。在本发明一具体实施方式中,特异性探针的5’末端核苷酸(例如,具体可以为的5’末端核苷酸的5位羟基)被磷酸基团取代,从而形成磷酸化修饰,在单链连接酶的催化下,捕获延伸产物的3’端羟基与与磷酸化的5’末端生成共价键,得到连接产物。此时特异性探针有两种状态,一种是结合上模板形成了捕获延伸产物的具有磷酸化的5’末端的特异性探针,另一种游离的特异性探针。所以对应的连接反应也可以是两种情况,既可以是捕获延伸产物的3’端羟基连接自身的5’端磷酸基团,分子内首尾连接成环;也可以是捕获延伸产物的3’端羟基连接游离探针的5’端磷酸基团,连接产物仍然是线性产物。在本发明另一具体实施方式中,特异性探针的5’末端核苷酸(例如,具体可以为的5’末端核苷酸的5位羟基)被腺苷基团取代,从而形成腺苷酸化修饰,在5′App DNA/RNA热稳定连接酶的催化下,捕获延伸产物也可以分子内环化连接,或者游离探针的5’末端腺苷基团可以与捕获延伸产物的3’端相连接。在本发明另一具体实施方式中,特异性探针的5’末端核苷酸(例如,具体可以为5’末端核苷酸的5位羟基)被磷酸基团取代,从而形成磷酸化修饰,在热稳定RNA连接酶的催化下,特异性探针的5’末端可以与捕获延伸产物的3’端发生连接反应,也产生分子内环化的和分子间线性的两种连接产物。所述特异性探针也可以是5’端区域具有黏性末端的部分双链结构,其5’端区域的黏性末端具有单链性质,从而可以通过如上所述的方法对5’端进行修饰,在合适的单链连接酶催化下,与捕获延伸产物连接。所述基因目标区域的富集方法中,所述步骤(2)还可以包括纯化连接产物。本领域技术人员可选择合适的方法对连接产物进行纯化,例如,连接产物的纯化方法可以是包括但不限于硅胶柱纯化、加热处理、磁珠纯化等。

本发明所提供的基因目标区域的富集方法,还可以包括:(3)在所述特异性探针与所述目标区域不互补的序列中,通常可以是靠近5’端的序列中设置酶切位点,并在所述步骤(2)之后加入内切酶,用于在所述酶切位点切割所述步骤(2)形成的连接产物中的环化连接产物,使环化连接产物转变为线性连接产物,有利于后续的PCR扩增和PCR检测反应的进行。在本发明一具体实施方式中,所述酶切位点是替换了原胸腺嘧啶T的尿嘧啶U,所述内切酶是USER酶或SSDNA内切酶。在本发明另一具体实施例中,特异性探针5’端附近有酶切位点U,当捕获延伸产物首尾相连形成环化产物后,USER酶或SSDNA内切酶在酶切位点U切开环化产物使之成为线性连接产物,后续可以使用PCR扩增引物通过互补序列结合上酶切后的线性连接产物实现指数扩增。

本发明所提供的基因目标区域的富集方法,还可以包括:(4)PCR扩增步骤(2)提供的连接产物。所述PCR扩增引物具有与所述特异性探针互补的序列,所述互补的序列与所述目标区域的序列不互补。本发明所提供的基因目标区域的富集方法,还可以包括:(5)在所述步骤(3)后,PCR扩增所述步骤(2)和(3)提供的连接产物,所述PCR扩增引物具有与所述酶切位点两侧的序列互补的序列;优选的,所述酶切位点两侧的序列为测序通用序列通常可以通过DNA聚合酶和PCR扩增引物对连接产物进行PCR扩增,通过扩增连接产物,可以进一步富集含有目标区域的DNA的产物。本领域技术人员可选择合适的方法和体系对步骤(2)或步骤(3)所提供的连接产物进行扩增,例如,在本发明一实施例中,PCR扩增引物具有与所述特异性探针5’端附近未结合模板的序列中互补和反向互补的序列,可以将或步骤(2)产生的环化和线性连接产物一起扩增。在本发明另一实施例中,特异性探针5’端附近有酶切位点U,PCR扩增的前后引物分别与特异性探针上的酶切位点U两侧的序列互补和反向互补。当USER酶或ssDNA内切酶在酶切位点U切开环化连接产物使之成为线性连接产物后,PCR扩增引物可通过互补序列结合上酶切后的线性连接产物的两端实现指数扩增,如图1所示。所述基因目标区域的富集方法中,所述步骤(4)或(5)还可以包括纯化扩增产物。本领域技术人员可选择合适的方法对扩增产物进行纯化,例如可以是包括但不限于硅胶柱纯化、加热处理、磁珠纯化等。

本发明所提供的基因目标区域富集方法,还可以包括:(6)用检测引物1、检测引物2和探针3检测步骤(4)或(5)提供的连接产物,以非二代测序而是PCR检测的手段快速提供目标区域的检测结果。所述的检测引物1、检测引物2和探针3中,至少其一包含基因特异性序列,也即是说,对于不同的基因目标区域,三种引物/探针有关特异性序列的组合可以是单特异性、双特异性或三特异性。在本发明一个实施例中,所述检测引物1包含基因特异性序列,检测引物2和探针3包含通用序列,或检测引物1和检测引物2包含基因特异性序列;或检测引物1和探针3包含基因特异性序列,或检测引物1、检测引物2和探针3均包含基因特异性序列。探针3还可以包含标记分子,比如可以是荧光分子,且探针3的序列与检测引物1或2不互补。

本发明所提供的基因目标区域的富集方法,可以用于核酸检测。通过扩增后的连接产物进一步进行检测的方法对于本领域技术人员来说是已知的。本发明目标区域富集的方法可以应用于基于PCR的基因序列检测中,例如,所述的目标区域包括:序列发生变异的位点,更具体可以是单碱基突变位点区域,碱基缺失位点区域,碱基***位点区域,融合突变位点区域,表观遗传变异或基因特异性序列等。在本发明一实施例中,本发明所提供的基因目标区域的富集方法应用于EGFR SNP-Q787位点突变和男性特有SRY基因的检测,取得了理想的效果。

本发明第二方面提供一种用于富集片段化DNA目标区域的体系,包括适用于本发明第一方面所提供的基因目标区域的富集方法的特异性探针和连接酶。其中,连接酶可以是热稳定性RNA连接酶、T4 RNA连接酶、或5′App DNA/RNA热稳定连接酶等。所述特异性探针的结构在本发明第一方面已经详细描述,在此不作赘述。

本发明所提供的体系中,还可以包括以下组分的一种或多种:耦联标记分子的dNTP、DNA聚合酶、核酸酶、内切酶等。其中,dTNP可以是dCTP,也可以是dATP。耦联的标记分子可以是生物素。所述DNA聚合酶可以是具有3’-5’外切酶活性的DNA聚合酶,优选高保真DNA聚合酶。所述核酸酶具有3’-5’外切酶活性。所述内切酶可以是USER酶或者ssDNA内切酶。

本发明所提供的体系中,还可以包括PCR扩增引物,其序列通常与特异性探针的通用序列和环化酶切位点两侧的序列相配合,具体的可以是与位于环化酶切位点两侧的序列互补,并与所述特异性探针的通用序列至少部分互补的序列。

本发明所提供的体系中,还可以包括用于PCR检测的检测引物1、检测引物2和探针3,三者中至少其一含有基因特异性序列,具体的可以是单特异性、双特异性或三特异性的引物/探针组合。优选的实施例中,仅检测引物1包含基因特异性序列。其应用于非二代测序而是PCR检测的场景。

在本发明一优选实施例中,通过本发明的方法或体系进行文库构建后,文库分子在结构上依次包含以下序列:5’端测序通用序列、基因特异性探针序列、富集到的目标区域序列、3’端测序通用序列,如图2所示。其中富集到的目标区域包含富集前样本DNA的序列信息,其特点是:5’端在基因组上的位置是固定的,由特异性探针决定;而3’端位置不固定,由建库初始的DNA片段化状态决定。因此,在富集后的数据分析中,该序列的3’端在基因组上的位置也可以起到分子标签的作用。

本发明的有益效果在于,首先,在连接前先对所有片段化DNA样本的目标区域通过捕获延伸的手段进行预扩增,避免在连接阶段因连接酶连接效率不足所致的原始目标分子的损失或漏检,特别是小片段和稀有分子;预扩增阶段的延伸反应属于线性扩增,没有PCR扩增的偏好性,也不会累积PCR扩增所引入的错误,与常规PCR建库技术相比,产物均一性好;其次,预扩增阶段,只需为每个目标基因设计一条长约30bp的单链探针,避开了为短片段如cfDNA设计双端引物的困难,既提高了建库成功率还提升了建库便利性;而封闭探针3’端,可以阻断探针与模板之外的非目的连接,有效降低游离探针引起的背景噪声,辅以耦联有标记分子的dNTP及其纯化系统,进一步提高目的产物纯度,使样本DNA分子达到最高转化率;再次,将特异性探针的5’端修饰后,在单链连接酶催化下能很好地连接到延伸产物的3’端但不会连接到游离探针经过封闭修饰的的3’端,避免游离探针的自连和错连,提高目的连接产物在终产物中的比例。最后,本发明的富集方法与申请人在申请号为2019100024085中公开的富集方法相比,省去了接头DNA,原料准备上更具便利性,不同组分之间相互干扰生成非目的产物的几率更低,且进一步降低了成本。综上所述,本发明的富集方法及体系,操作简单,结果可靠,针对片段长度小于200bp的DNA使用,可以最大程度的减少原始分子尤其是稀有分子的损失,最高效地富集目标分子,且其保真性、特异性和灵敏度高,可检出突变率低至0.01%的稀有突变分子。

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。

实施例1

实施例中所用寡聚核苷酸如表1所示:

表1

Figure BDA0002209173780000081

Figure BDA0002209173780000091

此实施例中的探针都包含通用序列(下划线部分)。所有寡聚核苷酸由上海百力格生物有限公司合成。探针经HPLC两次纯化后,达到99%以上的纯度。表中SEQ ID NO.1-11的探针的特异性序列都针对EGFR基因的第20外显子区域。

各探针5’端核苷酸与3’端核苷酸的修饰如表1中所示。其中,probe 6(SEQ IDNO.6)3’端核苷酸的3位羟基被替换为氢原子,变成了双脱氧核苷酸;probe 8(SEQ IDNO.8)3’端核苷酸的2位氢原子被甲氧基取代;probe9(SEQ ID NO.9)5’端核苷酸的5位羟基被腺苷替代;probe10(SEQ ID NO.10)序列中靠近3’端的脱氧核糖核苷酸G被替换成核糖核苷酸rG;probe10和probe11和(SEQ ID NO.10,SEQ ID NO.11)的最后一个碱基均为错配碱基。

UF和UR(SEQ ID NO12,SEQ ID NO.13)是用于PCR扩增环化产物的前后引物,F1(SEQ ID NO.17)是用于检测EGFR基因第20外显子区域的前引物,RX1和MX1(SEQ ID NO.19和SEQ ID NO.20)分别是用于检测EGFR基因第20外显子区域的后引物和MGB探针。

主要试剂与材料

细胞DNA提取试剂盒和用于纯化单链扩增产物的RNA Clean Kit试剂盒购自天根生化科技(北京)有限公司。rTaq DNA聚合酶、KOD plus高保真DNA聚合酶和用于PCR检测的反应预混液(QPK-101)购自日本TOYOBO公司;RNAse H2热稳定性核酸酶购自美国IDT公司。APG ssDNA连接酶、APG Enchant高保真DNA聚合酶购自上海羿鸣生物科技有限公司。USER酶、Q5高保真DNA聚合酶、T4 RNA连接酶与5′App DNA/RNA热稳定连接酶购自美国NEB公司;Agencourt AMPure磁珠购自美国Beckman公司;相关过程中定量检测使用的校准品按照REF序列由上海百力格生物技术有限公司合成,按照一定浓度梯度配置于20%的甘油TE缓冲液中。

实验方法

步骤1、样本准备

使用细胞DNA提取试剂盒提取健康人志愿者血细胞样本中gDNA,超声打断成平均长度为150bp左右的片段,使用qubit定量后备用。使用去离子水作为对照样本NC。

步骤2、样本的定量检测

按照表2配制样本的PCR定量检测体系,并用表3的扩增条件,使用针对EGFR20外显子区域的检测体系定量检测样本的拷贝数浓度。

Figure BDA0002209173780000101

步骤3、线性扩增

3.1按表4、表5、表6分别配制线性扩增反应体系。线性扩增的PCR程序如表7所示。

Figure BDA0002209173780000111

Figure BDA0002209173780000112

Figure BDA0002209173780000113

Figure BDA0002209173780000121

3.2线性扩增程序完成后,用RNA Clean Kit试剂盒对单链扩增产物进行纯化,去除未延伸的探针,用30μL洗脱缓冲液洗脱。

3.3线性扩增效率检测

线性扩增产物的PCR检测体系如表2,检测线性扩增的PCR程序如表3所示。

步骤4、环化连接

根据步骤3的结果,选择步骤2得到的部分线性扩增产物与对照样本QC分别按表8、表9和表10进行环化反应。

Figure BDA0002209173780000122

Figure BDA0002209173780000123

Figure BDA0002209173780000124

Figure BDA0002209173780000131

步骤5、环化产物得率检测

使用TE缓冲液将环化产物稀释10倍,按照表11配制PCR检测体系对步骤4的中的目标环化产物进行得率检测,同时检测不加模板的对照样本NC。PCR程序如表12所示。使用校准品对目标环化产物分子进行定量,评价目标环化产物得率。

Figure BDA0002209173780000132

Figure BDA0002209173780000133

步骤6、扩增环化产物

按表13的反应体系和表14的程序对步骤4得到的环化产物进行PCR扩增。

Figure BDA0002209173780000134

Figure BDA0002209173780000141

Figure BDA0002209173780000142

反应结束后,取80μL AMPure XP磁珠对扩增后文库进行纯化,参照操作说明,最终将纯化产物于20μL洗脱缓冲液(10mM Tris-HCl,0.1mM EDTA,pH8.0)中洗脱,在磁力架上取上清转移到新的微量离心管。至此,包含通用序列的靶向文库分子扩库完成。

将扩增后的文库产物用TE缓冲液稀释100倍后,使用表11和表12的检测体系和条件检测文库产物。

实验结果及分析

本实施例用线性扩增倍数、环化连接效率、分子转化率与扩库倍数这四个参数评价本发明的方法和体系对目标区域扩增和连接的技术效果。具体计算方式如下:

线性扩增倍率=目的基因线性扩增后输出拷贝数/目的基因线性扩增前输入拷贝数

环化分子得率=目的基因环化产物输出拷贝数/目的基因线性扩增产物输入拷贝数×100%

分子转化率=目的基因环化产物输出拷贝数/扩增前输入拷贝数×100%

扩库倍数=扩库纯化后拷贝数/环化产物输出拷贝数×100%

结果1、不同类型的聚合酶对不同修饰探针的线性扩增效率影响如表15所示

Figure BDA0002209173780000143

对于所有对照样本,均没有检测到信号。

表15中所涉及的线性扩增反应体系和条件参见表4至表7,其中,高保真聚合酶反应体系中使用的是APG Enchant高保真DNA聚合酶,具有3’-5’外切酶活性,而普通聚合酶反应体系中使用的rTaq酶,具有5’-3’外切酶活性,但不具有3’-5’外切酶活性。为了实现外切酶的功能,我们在普通聚合酶反应体系中添加了热稳定性核酸酶后,也能切除修饰后封闭的3’末端,达到与使用高保真DNA聚合酶类似的技术效果。

从测试结果可知:1)3'端核苷酸封闭修饰的探针在高保真聚合酶的作用下结合模板后,封闭基团被切除,探针被活化,从而可以对目标序列进行有效扩增;2)热稳定性核酸酶与普通聚合酶rTaq合用,对核糖核苷酸基团修饰的探针也能起到活化效果,增强了本发明富集方法的适用性;3)不同取代基团的选择对于线性扩增效果有明显差异,将探针3’端羟基取代为C3 Spacer得到的效果理想,与其它取代基团相比具有明显优势。本实施例从结果2开始的数据主要是针对将3’端羟基取代为C3 Spacer的探针得到的结果数据。4)3’端核苷酸封闭修饰的探针的3’端附近出现错配时(Probe 11),对于具有proofreading功能的高保真聚合酶驱动的线性扩增反应没有显著影响,或还有帮助。

结果2、不同扩增循环数对线性扩增效率的影响如表16所示。

表16中所涉及的线性扩增反应体系和条件参见步骤2,线性扩增效率检测方法参见步骤3。

Figure BDA0002209173780000161

测试结果表明,无论是高保真聚合酶体系还是普通聚合酶加核酸酶的体系,都可通过循环数的增加可以有效提高3’端封闭探针的线性扩增倍率。

结果3、封闭探针对环化结果的影响如表17所示

表17中所涉及的环化反应体系见步骤4,连接效率检测的方法见步骤5。

Figure BDA0002209173780000162

Figure BDA0002209173780000171

结果表明:1)使用将3’端核苷酸羟基替换为C3 Spacer的探针,能够获得理想的目标环化分子得率和分子转化率,后者可超过100%,表明用本发明的富集方法可以做到从原始分子到两端配置有测序通用序列的文库分子的完全无损;2)未经修饰的探针体系反应后,只能检出极少量目标环化分子;3)探针的5’端核苷酸只有被磷酸化修饰后,在APGssDNA连接酶作用下,才能实现自身环化;4)对于3’端附近被核糖核苷酸封闭修饰的探针,使用普通聚合酶加核酸酶的体系,也能取得较高的目标环化分子得率。

结果4、不同5’端修饰的探针和不同连接酶对环化效率的影响如表18所示。

表18中所涉及的连接反应体系参见表8、表9和表10,环化效率检测方法参见步骤5。

Figure BDA0002209173780000172

结果表明,使用5’端磷酸化修饰的封闭探针配合APG ssDNA连接酶环化效果理想,优于腺苷修饰的封闭探针配合其他连接酶的体系。

结果5、连接产物扩库效率检测如表19所示。

Figure BDA0002209173780000173

表19中所涉及的扩库反应体系与程序参见步骤6。

结果表明,封闭探针的目标环化分子可以得到较好的扩增。扩库倍数达到100倍左右,显著优于未封闭探针。

结论:

探针3'端核苷酸羟基的封闭修饰至关重要,可以防止探针自连,大幅提高目标分子的连接效率,而结合模板后的探针被DNA聚合酶切除修饰基团后还能进行多个循环的线性扩增。另外,热稳定性APG ssDNA连接酶的选用,环化后的纯化处理,以及环化后使用通用引物扩增也都能起到提高建库产物纯度和检测灵敏度的作用。

实施例2

实施例中所用寡聚核苷酸如表20所示:

表20.

Figure BDA0002209173780000181

同实施例1,本实施例中的探针也包含通用序列。探针经HPLC两次纯化后,保证99%以上的纯度。

其中,probe 12(SEQ ID NO.18)两端的修饰与probe4相同,通用序列部分有一个碱基T被替代为U。其余检测引物与探针与实施例1相同。

主要试剂与材料

APG ssDNA内切酶购自上海羿鸣生物科技有限公司,USER酶购自美国NEB公司,其余与实施例1相同。

实验方法

本实施例的样本准备,样本的定量检测,线性扩增与环化连接均与实施例1相同,其中初始模板为20000拷贝,线性扩增选用APG Enchant高保真聚合酶,80个循环,环化连接选用APG ssDNA连接酶。

取环化产物加入USER酶或APG ssDNA内切酶,37度酶切1小时,并以未酶切的环化产物作为对照。APG ssDNA内切酶可以特异性酶切序列中包含5’GGCC 3’的单链DNA。酶切后用RNA Clean Kit纯化酶切产物,用35μL洗脱缓冲液洗脱。

取5μL洗脱产物使用TE缓冲液将洗脱产物稀释10倍,采用实施例1中表11 PCR检测体系检测目标环化产物得率,PCR程序如表12所示。

按照实施例1步骤6的方案,按表13的反应体系和表14的程序对步骤4得到的环化后洗脱产物进行PCR扩增。

反应结束后,取80μL AMPure XP磁珠对扩增后文库进行纯化,参照操作说明,最终将纯化产物于20μL洗脱缓冲液(10mM TrisCl,0.1mM EDTA,pH8.0)中洗脱,在磁力架上取上清转移到新的微量离心管。至此,包含通用序列的靶向文库分子扩库完成。

扩增后的文库产物,TE缓冲液稀释100倍后,使用上文表11和表12检测体系和条件检测文库产物。

实验结果及分析

同实施例1,本实施例也用线性扩增倍数、环化分子得率、分子转化率与扩库倍数这四个参数以评价本方法对目标区域扩增和连接的技术效果,具体计算方法见实施例1。

结果2.1环化后酶切对检测的影响如表21所示。

Figure BDA0002209173780000191

结果表明,环化产物在酶切之后,检测出的环化分子得率与分子转化率均有显著提升。

结果2.2环化后酶切对扩库效率的影响如表22所示。

Figure BDA0002209173780000201

结果表明,环化产物在酶切之后,扩库效率得到了显著的提升。

实施例3

本实施例评估用本发明的富集方法和体系对真实样本进行线性扩增-环化建库后,针对微小片段的稀有分子和稀有变异分子的检出能力。

本实施例所用寡聚核苷酸序列如表23所示:

表23

Figure BDA0002209173780000211

其中探针13(SEQ ID NO.19)特异性序列针对性染色体Y上的SRY基因。FX1(SEQ IDNO.20)为用来特异检测EGFR基因第20外显子区域SNP-Q787(2361 G>A)的前引物,前实施例中RX1和MX1配对组成特异性检测SNP-Q787的PCR检测体系。FX2、RX2和MX2(SEQ ID NO.21-23)分别是用于检测SRY探针扩增产物的前引物,后引物和MGB探针。UM(SEQ ID NO.24)是用来检测通用序列的MGB探针。

主要试剂与材料

游离DNA提取试剂盒购自上海臻迪基因科技有限公司,其他同实施例1和2。

实验方法

步骤1、靶向文库制备

使用游离DNA提取试剂盒提取健康人血浆样本中的cfDNA,使用Qubit定量后备用。通过F1和RX1扩增EGFR-20外显子区域的片段。使用一代测序方法检测其中SNP-Q787的状态。将SNP纯合子的男性cfDNA样本,按照1%,0.1%,0.03%,0.01%的质量比掺入到女性野生型cfDNA样本中,同时以未掺入的女性野生型cfDNA样本作为空白对照(QC)。以50ng(约15000拷贝,共15ul)作为单个样本总起始模板量进行后续靶向建库。每种梯度设置两个复孔,最后以复孔结果的平均值作为该种样本的检测结果。

使用APG ssDNA内切酶对样本进行靶向建库。探针选用probe4和probe13,浓度为50nM。线性扩增循环数为80,环化使用APG ssDNA连接酶,酶切纯化后扩增12个循环,再用AMPure XP磁珠纯化后获得20uL文库产物。

步骤2、不同特异性引物/探针组合的qPCR检测

对原始样本和靶向建库样本分别进行三特异性PCR检测体系检测,再对靶向建库样本进行双特异性、单特异性PCR检测。取检测样本的平均CT值,以QC样本的平均CT值为检测背景,以两者之间的差值ΔCT,作为评价标准。当ΔCT≥2.5时认为具备显著性差异。

EGFR基因20外显子Q787Q位点三特异性、双特异性、单特异性检测体系分别如表24-26所示。SRY基因三特异性、双特异性、单特异性检测体系分别如表27-29所示。qPCR检测程序如表30所示。

表24.Q787Q位点三特异性检测体系:

Figure BDA0002209173780000212

表25.Q787Q位点双特异性检测体系:

试剂 用量(μL) 终浓度
2×Taqman master Mix 10
FX1(10μM) 0.6 300nM
UR(10μM) 0.6 300nM
MX1(10μM) 0.2 100nM
H2O 6.6 /
待测样本 2 /
Total 20 /

表26.Q787Q位点单特异性检测体系:

试剂 用量(μL) 终浓度
2×Taqman master Mix 10
FX1(10μM) 0.6 300nM
UR(10μM) 0.6 300nM
UM(10μM) 0.2 100nM
H<sub>2</sub>O 6.6 /
待测样本 2 /
Total 20 /

表27.SRY基因三特异性检测体系:

试剂 用量(μL) 终浓度
2×Taqman master Mix 10
FX2(10μM) 0.6 300nM
RX2(10μM) 0.6 300nM
MX2(10μM) 0.2 100nM
H<sub>2</sub>O 6.6 /
待测样本 2 /
Total 20 /

表28.SRY基因双特异性检测体系:

试剂 用量(μL) 终浓度
2×Taqman master Mix 10
FX2(10μM) 0.6 300nM
UR(10μM) 0.6 300nM
MX2(10μM) 0.2 100nM
H<sub>2</sub>O 6.6 /
待测样本 2 /
Total 20 /

表29.SRY基因单特异性检测体系:

试剂 用量(μL) 终浓度
2×Taqman master Mix 10
FX2(10μM) 0.6 300nM
UR(10μM) 0.6 300nM
UM(10μM) 0.2 100nM
H<sub>2</sub>O 6.6 /
待测样本 2 /
Total 20 /

表30.

Figure BDA0002209173780000231

实验结果及分析

针对原始样本和靶向建库后的样本使用不同特异性体系检测EGFR SNP-Q787位点和SRY基因的检测结果分别如表31,32所示。

表31、不同掺入比下的EGFR SNP-Q787位点检测结果

Figure BDA0002209173780000241

表32.不同掺入比下的SRY基因检测结果

结论:

实验结果表明,封闭探针对于本发明的环化富集方法至关重要,能够显著提高cfDNA中稀有分子的检出率,可将文库分子的检出率提升10倍以上,原始样本的检出率一般在0.1%,而文库样本的检出率可达到0.01%。

本实施例比较了传统基因三特异体系检测方案,和双特异性体系及单特异性两种引物/探针的体系。对单一碱基变异的Q787位点,单特异性体系和双特异性体系相比三特异性体系而言,ΔCT值更大,具有更高的有效分辨率。对于特异性基因SRY,不同特异性引物/探针体系的检测灵敏度都较高,三种体系都能达到0.01%。

综上所述,探针3'端核苷酸中3位羟基的封闭修饰至关重要,可以防止探针自连,大幅提高环化效率。结合上模板的探针被切除修饰基团后,还能进行多个循环的线性扩增,最大程度的降低了原始分子的损失。另外,APG ssDNA连接酶的选用,环化后的酶切处理,以及环化后使用通用引物扩增也都能起到提高建库产物纯度和检测灵敏度的作用,分别/共同组成了本发明的技术方案。

序列表

<110> 上海臻迪基因科技有限公司

<120> 基因目标区域富集方法及体系

<160> 23

<170> SIPOSequenceListing 1.0

<210> 1

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 2

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 3

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 4

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 5

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 6

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 7

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 9

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 9

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 10

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccag 95

<210> 11

<211> 96

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

ccaatattgt ctttgtgttc ccggacatag tccagt 96

<210> 12

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ccttcaggct ctcgctgtgc 20

<210> 13

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

cctgttgtgg cgtctcatcc 20

<210> 14

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

tcccggacat agtccaggag gc 22

<210> 15

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

cgtgtgccgc ctgctggg 18

<210> 16

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

cacggtggag gtgaggc 17

<210> 17

<211> 185

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

gatccttcag gctctcgctg tgcccaatat tgtctttgtg ttcccggaca tagtccagga 60

ggcagccgaa gggcatgagc tgcgtgatga gctgcacggt ggaggtgagg cagatgccca 120

gcaggcggca cacgtggggg ttgctgagtc ggagacacgc agggatgaga cgccacaaca 180

ggatc 185

<210> 18

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

gctgagtcgg agacacgcag ggatgagacg ccacaacagg ccttcaggct ctcgctgtgc 60

gctgccgaag aattgcagtt tgcttcccgc 90

<210> 19

<211> 11

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

gcgtgatgag t 11

<210> 20

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

cgcttcggta ctctgc 16

<210> 21

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

gtcatccctg tacaacctg 19

<210> 22

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

gcgaagtgca actggacaa 19

<210> 23

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tgcgtgtctc cgactcagc 19

32页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基因目标区域富集方法及试剂盒

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!