利用核酸内切酶介导的移动平衡(EM-SEq)进行核酸扩增的方法

文档序号:914157 发布日期:2021-02-26 浏览:22次 >En<

阅读说明:本技术 利用核酸内切酶介导的移动平衡(EM-SEq)进行核酸扩增的方法 (Method for nucleic acid amplification using endonuclease-mediated mobile equilibrium (EM-SEq) ) 是由 卡米尔·安杰伊·利平斯基 于 2019-03-22 设计创作,主要内容包括:本发明涉及基于利用链置换扩增(SDA)进行核酸的等温扩增的分子生物学试验的设计及其各种实施方案和方法改进。本发明描述了一种用于SDA的新方法,称为核酸内切酶介导的移动平衡扩增(EM-SEq),该方法改进了反应的指数动力学和特异性,并且使得能够在固体表面上进行扩增。(The present invention relates to the design of molecular biology assays based on isothermal amplification of nucleic acids using Strand Displacement Amplification (SDA) and various embodiments and method improvements thereof. The present invention describes a new method for SDA, called endonuclease-mediated mobile equilibrium amplification (EM-SEq), which improves the exponential kinetics and specificity of the reaction and enables amplification on solid surfaces.)

利用核酸内切酶介导的移动平衡(EM-SEq)进行核酸扩增的 方法

技术领域

本发明涉及基于利用链置换扩增(SDA)进行核酸的等温扩增的分子生物学试验的设计及其各种实施方案和方法改进。本发明描述了一种用于SDA的新方法,称为核酸内切酶介导的移动平衡扩增(EM-SEq),该方法改进了反应的指数动力学和特异性,并且使得能够在固体表面上进行扩增。

背景技术

链置换扩增(SDA)

SDA是快速且有效的等温核酸扩增方法,SDA使用诸如限制性酶或切口酶之类的序列特异性DNA核酸内切酶与缺乏5′-3′外切核酸酶活性的DNA聚合酶进行组合,并且能够置换(而不是降解)下游遇到的互补DNA链,同时在模板链上使游离3′末端延伸。由于在当时可获得的酶的温度分布图,最初记录了SDA在37摄氏度至40摄氏度的温度下操作,这造成了高水平的脱靶扩增。然而,已经记录了使用热稳定酶并且允许在50℃及以上进行反应的嗜热SDA(tSDA)。

SDA的机理

当对缺乏核酸内切酶识别位点的靶序列(如自然界中发现的许多序列)进行扩增时,反应通常通过起始温度变性步骤开始,该步骤允许两个单链引发寡核苷酸(下文称为引物)特异性地结合至靶DNA序列的两个末端。两种引物在它们的5′末端携带短的(通常6个和8个之间的核苷酸长)识别序列,该识别序列用作反应中使用的给定DNA核酸内切酶的结合位点。在由DNA聚合酶进行引物延伸后,产生了一种双链DNA,该双链DNA包含靶DNA序列,在两端的侧翼为选定的DNA核酸内切酶识别序列。然后该分子作为底物用于随后的SDA反应(图1A)。

SDA的扩增循环是通过DNA核酸内切酶结合至其识别位点并优选使DNA双链体的仅一条骨架链(具有近端5′末端的链)中的磷酸二酯键切割而进行的。可以至少两种方式实现产生这样的单链切割(以下称为“切口”)而不是使两条链上的DNA切割。首先,可以使用对某些经修饰的核苷酸表现出敏感性的非回文限制性酶。例如,在SDA的第一个记录的申请中,已经通过限制性酶HincII证明了SDA,HincII具有非回文识别序列GTT*GAC,其中星号表示切割位点。为了避免使携带GTCAAG序列的互补链切割,在引物合成和扩增反应中,使用脱氧腺苷5′-[α-硫代]三磷酸(dATPαS)代替标准腺苷5′-三磷酸(dATP)。作为结果,HincII限制性酶不能切割在互补GTCAAG序列中的C和第一个A之间形成的硫酯键,同时保留了在第一条链上的靶GTTGAC序列中的第二个T和G之间引入切口的能力。

作为使用经修饰的核苷酸的供替代的选择,可以使用天然发现的或人工设计的仅使一条DNA链切割的限制性酶(也称为切口酶)来代替标准限制性酶。这种SDA实施方案也称为切口酶扩增反应(NEAR)或切口核酸内切酶依赖性扩增(NDA)。已经记录了许多合适的切口酶,包括Nt.BspQI、Nt.BbvCI、Nb.BbvCI、Nt.BstNBI以及更多。

使DNA双链体的一条链产生切口会在新形成的游离3′末端留下羟基,然后在SDA期间通过具有链置换活性的上述DNA聚合酶(如Bst聚合酶)使该羟基延伸。作为结果,切口下游的链被释放到溶液中。当合成新的互补链时,核酸内切酶识别位点再生,从而允许切口形成和延伸的循环,该循环线性地产生所引入切口下游的单个互补链。由于靶序列的侧翼为两端的核酸内切酶识别位点,因而反应从两种类型的“扩增单元”同时产生两条链(图1B)。

然而,在该过程中产生的DNA链的侧翼为截短的(切割的)核酸内切酶识别位点,因此不能进一步扩增(图1C)。为了实现指数扩增,需要使识别位点再生。最常见地,由于存在两种引物而实现再生,这两种引物以它们的互补3′末端结合至产物链(图1E、图1F)。当引物结合时,从产物链的3′末端使产物链延伸可再生一个可切割的核酸内切酶识别位点,从而将切割的产物转变为“扩增单元”。

重要的是,由于线性地产生的具有可切割的识别位点的两条DNA链完全互补,而不是结合至游离引物,因而这两条DNA链也可以容易地彼此退火(复性),从而产生不能扩增的“死端”双链产物分子(图1D)。需要高的引物浓度以克服产物复性。此外,与聚合酶链式反应(PCR)相比,反应在等温下发生,因而不能通过在各循环中的热变性而重新设置系统以重新尝试引物结合。作为结果,SDA产生了至少三种不同类型的产物分子,其中当产物-引物比率变高时,死端产物通常在反应的后期阶段占主导地位。这种死端产物也缺少存在于5′引物末端的任何序列或化学部分。这对SDA产量造成了显著的限制,例如当试图使用固定化的引物在表面上进扩增时即是如此。

典型的产生切口和延伸反应例如可参见US2009/0017453。在这样的条件下,产生的扩增子是短的(所有实例的长度为约25个碱基对),并且大多数扩增子不包含起始扩增适配体,这是后续分析所需的,因此该方法可以进行扩增,使得可以检测扩增物质的存在,该方法不能用于制备进一步测序用扩增子。

在Analyst(2015)第140卷第22期,第7540页至7549页中描述了一种称为真等温SDA(iSDA)的SDA版本,其能够省略起始热变性步骤并具有两种引物对,其中一种引物对充当“瓣状物(flap)”。该方法首先需要样品的呼吸(breathing),以便使准指数(pre-exponential)引物插入基因组序列并延伸。这避免了为了使起始延伸引物杂交而进行热变性的需要。一旦起始准指数产物形成并通过缓冲引物的延伸进行置换,以置换延伸链而不使用限制性位点,则通过标准SDA对该双链产物进行扩增。因此,由于缺少进一步扩增用的适配末端,使得不能够对大多数扩增物质进行进一步测序,因此没有克服所述SDA的问题。

与使用诸如限制酶或切口酶之类的序列特异性DNA核酸内切酶、结合缺乏5'-3'外切核酸酶活性的链置换DNA聚合酶的SDA相比,已经报道了其他等温扩增技术。实例包括US2007/0054301,其描述了一种方法,其中模板具有可呼吸末端,使得新引物可以被链侵入(strand invade)并因此得到延伸。这与SDA形成对照,SDA使用序列特异性DNA核酸内切酶使引物产生切口,以得到用于延伸的游离3'末端。链侵入完整引物并延伸而不是对已杂交的引物进行切割和延伸的要求使得该方法不同于SDA,并且效率低于SDA。

本文描述了一种用于嗜热SDA的方法,称为核内酶介导的移动平衡扩增(EM-SEq),该方法通过引物设计的方式限制了死端产物的产生,从而改进了反应的指数动力学,减少了所产生的产物类型的数目,并使产物之间的平衡移动至包含5'末端引物序列的产物。

发明内容

本发明描述了一种用于核酸的等温扩增的改进方法。该方法使产物的平衡从完全互补的具有死端的双链产物向适合于进一步使用的具有正确的适配末端的产物移动。该方法依赖于引入可呼吸末端区域,该可呼吸末端区域在等温扩增温度下足以瞬时呈单链,以与引物杂交并进行快速(snap)延伸。可以将这种低熔点、可呼吸的末端区域看作翻口末端(frayed end),并在扩增开始之前引入到链中。然后,可以通过重复的产生切口和延伸步骤,其中延伸使用链置换聚合酶,以与链置换扩增的其他方式相同的方式进行延伸。然而,在模板上引入的低熔点末端防止了死端扩增子的积累。

本发明描述了一种用于双链核酸序列群体的链置换扩增的方法,该方法包括:

a.修饰群体中的链的末端,使得至少一个末端包含序列的低熔点区域,该低熔点区域在高于37℃且低于80℃的温度下至少瞬时呈单链;

b.使用一种或以上与低熔点末端杂交的扩增引物复制具有低熔点末端的核酸分子群体,其中引物具有核酸分子模板群体的3'末端之外的5'单链段,使得模板的3'末端延伸形成核酸内切酶的完整识别位点,并且通过链置换使引物的3'末端延伸以复制模板;

c.使用核酸内切酶的完整识别位点来使延伸的链产生切口,从而释放引物内的游离3'-OH基团;以及

d.通过链置换使游离3'-OH基团延伸以再复制模板,

其中在等温下进行步骤b、c和d,从而产生双链核酸序列群体的链置换扩增。

可以使用单一扩增引物进行该方法,从而复制双链核酸序列群体的一条链。可供选择地,可以使用两种扩增引物进行该方法,从而复制双链核酸序列群体的两条链。可以将扩增引物固定在固体支持物上。

可以通过合适的阻断部分将称为扩增引物的分子在其3'末端进行阻断,从而在核酸内切酶使引物产生切口之前防止引物的3'末端延伸,以缩短经阻断的引物从而能够扩增。

可以使用任何链置换方法。例如,可以使用链置换聚合酶进行延伸步骤b和d。聚合酶可以是Bst聚合酶或Klenow片段聚合酶。为了发生双链样品的扩增,除了低熔点末端之外,样品必须为双链,低熔点末端在等温扩增温度下足以呈单链以用于发生引物杂交。

可以使用任何合适的方法来修饰链的末端。例如,可以通过适配体连接来修饰群体中的链的末端。可供选择地,可以使用具有所述修饰的引物的延伸来获得群体中的链的经修饰的末端。

可以使用合适的核酸序列来制备低熔点区域。可以多种方式实现两种区域类型的熔解温度的所需差异。例如,(i)通过显着不同的GC%含量,(ii)使用改变DNA双链体热稳定性的经修饰的碱基,例如但不限于锁核酸(LNA)、非锁核酸(UNA)或8-氮杂-7-脱氮鸟苷,以及(iii)引物分子中存在的LL区域和LR区域与模板DNA中的LL区域和LR区域之间的部分互补。例如,低熔点区域可包含错配的碱基对,使得序列不完全互补。例如,低熔点末端可具有小于30%的GC含量。例如,末端可为20个核苷酸长的DNA序列,其GC含量小于30%。

该方法依赖于足够量的在扩增温度下呈单链的低熔点末端区域,使得可以发生引物的杂交。扩增温度通常高于37℃且低于80℃。使末端至少瞬时呈单链的温度可以与扩增温度相同。低熔点区域在等温扩增温度下可以呈单链。该温度可以为37℃至65℃。等温扩增温度可以为50℃至65℃。低熔点区域可以为自然界中不存在的序列。

为了促进引物分子与模板的瞬时单链低熔点区域的有效杂交,可以由具有使双链体构造稳定的经修饰的碱基的核苷酸组成互补引物序列。引物具有5'突出端。一旦引物瞬时杂交,就会发生快速延伸,使得模板的3'末端延伸,从而通过增加杂交区域的长度来提高杂交引物的稳定性。

延伸的引物产生双链限制性核酸内切酶位点的全序列。双链限制性核酸内切酶位点的部分序列可以在经修饰的低熔点末端中。可供选择地,全序列可以在引物中。例如,如果选择六碱基双链识别位点,则三个碱基可以来自群体的经修饰的低熔点末端,并且三个碱基可以在单链引物中。从低熔点区域的3'末端开始的链延伸使模板延伸,前三个碱基形成完整的识别位点。可供选择地,所有六个碱基都可以在单链引物中。从低熔点区域的3'末端开始的链延伸使模板延伸,前六个碱基形成完整的识别位点。

如果全双链识别位点不与模板分子的末端连接,则是有益的,否则,可能在无需延伸模板的3'末端以使突出的引物成为双链的步骤的情况下发生链延伸。该方法依赖于通过模板的3'末端的延伸而产生的全双链识别位点。相对于引物的模板延伸产生了在整个等温扩增中保持双链的序列区域。

可以使用酶来产生延伸的链中的切口。可以使用切口内切酶来产生延伸的链中的切口。切口核酸内切酶可以选自Nt.BspQI、Nt.CviPII、Nt.BstNBI、Nb.BsrDI、Nb.BtsI、Nt.AlwI、Nb.BbvCI、Nt.BbvCl或Nb.BsmI。

可以在一条链能够被切割而一条链耐切割的地方产生切口。当使用产生不可切割的核酸骨架的非天然dNTP进行延伸时,可以产生耐切割链。这种非天然dNTP包括5'-[α-硫代]三磷酸,其产生了耐切割的硫酯键。

核酸内切酶识别序列可以为

3'-CAGTTG-5'

5'-GTCAAC-3'

核酸内切酶识别序列可以为

3'-CAG*TTG-5'

5'-GTCsAAC-3'

其中,*为切割位点,并且s为硫代磷酸酯。

当核酸内切酶识别序列如上所示时,经修饰的链的5'末端的序列可以为5'-GAC。经修饰的链的3'末端的序列可以为3'-CTG。

在这种方案中的各引物需要内部序列3'-CAGTTG-5'。经修饰的链的5'末端的序列可以在3'-CAGTTG-5'序列之前,使得该序列是完全单链的,直到通过模板延伸而被复制。可供选择地,只要3'-CAGTTG-5'不是完全双链的,引物就可以在序列内的某一点杂交。

可以例如通过测序进一步分析扩增物质。因此,在所公开的方法中,随后可以对固定化的延伸产物进行测序。当使用两种固定化的引物进行扩增时,复制了两条链。因此,可以对两条链进行测序。可以产生一对读长,第一个测序读长来自第一条链,并且第二个读长来自另一条链,从而产生一对读长,一个读长来自双链核酸序列群体的各链。

本发明还公开了用于实施该方法的试剂盒。本发明公开了用于修饰核酸序列的试剂盒,该试剂盒包括:

a.用于修饰双链核酸序列群体的末端第一对核酸适配体分子,其中适配体对的第一条链的5'末端包含核酸内切酶识别位点的一部分,适配体对的中心部分包含序列的低熔点区域,该低熔点区域在高于37℃且低于80℃的温度下至少瞬时呈单链,并且适配体对的第一条链的3'末端和适配体对的第二条链的5'末端能够与双链核酸序列群体的两条链进行连接;以及

b.连接酶。

试剂盒可包括另外的组件,例如一种或以上扩增引物或者一种或以上酶。试剂盒可包括链置换聚合酶。可将一种或以上试剂固定,例如可以将扩增引物固定。

附图说明

图1:标准指数链置换扩增(SDA)的操作方法。垂直线表示成对碱基之间的氢键。(A)在其最基本的形式中,SDA反应以起始变性步骤开始,该步骤允许模板DNA与两个引物分子结合,两个引物分子在它们的5末端包含核酸内切酶识别位点,如非回文限制性酶或切口酶的结合位点(作为实例示出了HincII限制性酶位点GTT*GAC,其中星号表示切割位点)。通过DNA聚合酶的链延伸将识别位点引入靶DNA双链体的互补链中。(B)对反应进行设计,使得核酸内切酶仅能够切割DNA链中的一条链。这可以通过例如使用非回文限制性酶和经修饰的核苷酸或切口酶来实现。核酸内切酶使DNA双链体的一条链切割。当在两端存在相同的限制性位点时,在相对的两端对两条链进行切割。切口具有游离3'末端,可以通过诸如Bst之类的链置换聚合酶使游离3'末端延伸。(C)切割和延伸的连续循环以线性方式产生两条互补链,这两条互补链包含靶序列、两个引物序列和在两个末端上的截短的(切割的)核酸内切酶识别位点。(D)这些单链产物可容易地复性,以形成不再能扩增的双链产物。(E、F)可供选择地,如果产物替代性地结合互补引物,则可再生一个切割的核酸内切酶识别位点。产物分子中的识别位点再生对于实现指数扩增是必要的。因为产物复性(D中所示)为死端,反应动力学是亚指数的,并且反应产生至少三种不同类型的双链产物分子和单链产物。

图2:设计用于核酸内切酶介导的迁移平衡扩增(EM-SEq)的模板DNA和引物。垂直线表示成对碱基之间的氢键。(A)模板DNA在EM-SEq扩增中用作底物。白框:靶序列;斜纹框:低Tm左侧(LL)区域;棋格框;低Tm右侧(LR)区域。作为实例示出了HincII限制性酶位点GTT*GAC,其中星号表示切割位点。(B)在一些实施方案中,最初在DNA中可能没有识别位点的部分(顶部),并且可随着EM-SEq的进行而可能会发生识别位点的引入。在其他实施方案中,模板DNA中可能已经存在部分或完整的识别位点(底部)。图示出了模板DNA为双链。然而,在一些实施方案中,可以使用单链模板DNA。(C)EM-SEq反应中使用的引物。实心暗灰色框:高Tm左侧(HL)区域;实心浅灰色框:高TM右(HR)区域。

图3:EM-SEq中的移动平衡动力学原理。(A)靶序列侧翼的低熔解温度区域LL和LR允许在模板DNA的两端瞬时打开DNA双链体的末端(DNA呼吸)。(B)模板DNA分子和扩增引物之间的动态结合平衡。(C)根据勒夏特列原理的EM-SEq动力学。A:自结合状态,B:引物结合状态,C:快速延伸的产物

图4:EM-SEq的扩增循环。(A)与标准SDA相似,连续切割和链置换产生两个互补的单链DNA分子,单链DNA分子在EM-SEq中包含侧翼为低熔解区域LL和LR以及两端为截短的(切割的)核酸内切酶识别位点的靶序列。(B)与标准SDA不同,复性产物通过快速延伸转化成具有再生核酸内切酶识别位点的产物。这使所产生的产物之间的平衡向能够进行指数扩增的分子移动。

图4b示出了使用通过使用核酸内切酶的切割产生的引物的延伸。

图5:利用热稳定DNA聚合酶完成EM-SEq产生的扩增子。链置换聚合酶和限制性酶的热失活同时激活了热启动热稳定聚合酶,其随后通过切口平移来填补DNA切口(星号)。活性酶以粗体示出。

图6:具有表面结合引物的EM-Seq可以产生用于配对末端下一代测序的扩增子。(A)模板DNA和表面结合引物中存在的互补低熔解温度区域LL/LR之间的瞬时退火允许快速延伸和链置换(如图3所示),从而产生两种类型的扩增单位(如图4所示)。图示出了双链模板DNA,然而其他实施方案可使用单链模板DNA作为输入。(B)在扩增完成并填补DNA切口后,将互补DNA链与表面结合DNA链去杂交,并使第一测序引物杂交,从而允许正向链测序。(C)在完成正向读数后,将第二次测序的第二测序引物杂交,从而允许反向链测序。图示出了用作测序引物的低熔解区域LL和LR,然而在其他实施方案中,测序引物结合位点可位于所产生的扩增子边界内的任何位置。

图7示出了使用两个温度的固相EM-SEq的版本。

图8示出了十六种不同的20个核苷酸长的DNA序列,它们的GC含量为20%、30%、40%或50%。

图9A示出了如何成对地将图8的十六种不同序列添加到85个核苷酸长的靶上,以作为修饰靶末端GC含量的侧翼基序(LL和LR)。

图9B示出了在含有70mM单阳离子盐和2mM双阳离子盐的缓冲液以及荧光双链DNA结合染料EvaGreen的存在下测试所产生的构建体的熔解曲线。

图10示出了通过将各自的引物序列连接至80个核苷酸长的大肠杆菌(E.coli)ydfU基因片段的两端而设计的两个全长扩增模板序列。T^表示反向dT阻断剂部分。

图11A示出了来自使用引物和模板设计包含20%GC低熔点温度区域进行的原始试验(naive assay)的产物的实时荧光数据和凝胶电泳。

图11B示出了来自使用引物和模板设计包含50%GC侧翼区域的进行原始试验的产物的实时荧光数据和凝胶电泳。

图12A示出了来自使用引物和模板设计包含20%GC低熔点温度区域进行的优化试验的产物的实时荧光数据和凝胶电泳。

图12B示出了来自使用引物和模板设计包含50%GC侧翼区域进行的优化试验的产物的实时荧光数据和凝胶电泳。

图13示出了全长模板,其包含位于5'末端的30个核苷酸长的66%GC含量的高熔点区域(HL和HR,以粗体表示)、Nt.BstNBI切口酶识别位点、靶序列侧翼的20个核苷酸长的20%GC含量的低熔点区域,并且图13示出了死端产物分子的序列,其仅包含靶序列侧翼的20个核苷酸长的20%GC含量的低熔点区域。

图14示出了实时荧光数据,该数据示出了死端产物可以在EM-SEq反应中作为模板,从而证明EM-SEq引物侵入了分子的瞬时单链末端。

图15示出了未经修饰的正向和反向引物以及杂交侵入正向和反向引物的序列。

图16A示出了产物的凝胶电泳,其示出了与使用未经修饰的引物运行的反应相比,包含杂交侵入引物的反应产生了产物条带的图案,其中高分子量产物过多出现,而低分子量产物出现不足。

图16B示出了预测的可能的产物形式。

图17A示出了对载玻片上的EM-SEq反应产物的观察结果。

图17B示出了对半导体芯片表面上的EM-SEq反应产物的观察结果。

具体实施方式

核酸内切酶介导的迁移平衡扩增(EM-SEq)的一个实例是用一对引物和根据特定方法设计的输入DNA实现的(图2)。

在扩增之前,将靶DNA序列修饰,使得靶DNA序列两端侧翼为由下列两个区域组成的适配体序列:(i)位于近端的低熔解温度区域LL和LR(低Tm左侧和低Tm右侧)和(ii)截短的核酸内切酶识别位点,如非回文限制性内切酶或切口酶的结合位点(图2A)。在一些实施方案中,模板DNA中最初可能不存在识别位点的任何部分,并且可随着EM-SEq反应进行而发生识别位点的引入。在其他实施方案中,模板DNA中可能已经存在完整的识别位点(图2B)。模板DNA可为双链或单链的。

EM-SEq使用引物,各引物由三个区域组成:(i)5'末端高熔解温度区域HL或HR(高Tm左侧和高Tm右侧);(ii)位于中央的核酸内切酶识别位点,从而与模板DNA中存在的截短的识别位点相匹配;和(iii)3'末端低熔解温度区域LL或LR,其与模板DNA中存在的那些区域完全或部分互补(图2C)。

由于待扩增的链的末端已经修饰有瞬时单链(可呼吸)末端,所以可以将引物杂交而不必加热使样品变性。一旦杂交,则引物和模板的适配3'末端都可进行延伸。一旦延伸,则端部不再可呼吸,因为可呼吸区域现在在序列内部。

低熔解温度区域LL、LR和高熔解温度区域HL、HR可以选自自然界中发现的序列,或者可以是部分或完全人工的。作为修饰靶序列以包含低熔解温度区域LL和LR区域的替代,也可以选择靶序列,使得LL和LR是自然界中发现的靶序列的一部分。

可以多种方式实现两种区域类型的熔解温度的所需差异。例如,(i)通过显着不同的GC%含量,(ii)使用改变DNA双链体热稳定性的经修饰的碱基,例如但不限于锁核酸(LNA)、非锁核酸(UNA)或8-氮杂-7-脱氮鸟苷,以及(iii)引物分子中存在的LL区域和LR区域与模板DNA中的LL区域和LR区域之间的部分互补。

在嗜热SDA的反应温度时(通常为50摄氏度和65摄氏度之间),靶序列侧翼的低熔解温度区域LL和LR允许模板DNA两端的DNA双链体的瞬时打开(“DNA呼吸”)(图3A)。在EM-SEq引物(其包含与LL和LR互补的序列)的存在下,模板DNA末端中的每一者可以两种可选择的状态存在:与自身或与其匹配引物退火(图3B)。由于这些相互作用的瞬时和不稳定性质,系统由非常动态的动力学平衡控制,其中LL和LR区连续结合和解离。由于模板DNA的两条互补链上的LL和LR区域的直接物理邻近,因而这种结合平衡的动力学强烈地有利于自身退火状态。

然而,在DNA聚合酶的存在下,一些模板分子与相匹配的引物上的LL和LR区域的瞬时且罕见的退火可促进“快速延伸”事件,其中这些模板分子的3'末端在高熔解温度区域HL和HR上延伸。相比于产生动态结合平衡的缔合和解离事件,此类延伸事件是不可逆的。在3'末端延伸时,由于分子一侧被高熔解温度区域HL或HR包围,而另一侧被靶序列包围,因而分子保持初步退火。

根据勒夏特列原理,快速延伸产生了移动平衡效应,由此,处于平衡的任何系统经过变化(例如系统的反应物浓度的变化),重新调整自身以抵消所施加的变化的效应,并且建立了新的平衡。移动平衡效应促进了大多数模板分子转化为限制性位点再生状态(图3C)。

当应用于SDA的扩增循环时,由低熔解温度区域和高熔解温度区域的差异亲和力所产生的移动平衡效应作用于死端自身退火的产物,从而使切割的核酸内切酶识别位点再生(图4)。这使所产生的产物之间的平衡向能够进行指数扩增的分子移动,因此提高了反应速度并且将所产生的扩增子分子类型的数目减少至两种主要产物,这两种主要产物均包含存在于所用引物的5'末端的序列或部分。

引物之间的相互作用的瞬时且罕见的性质以及低熔点温度限制了引物转化成包含再生的核酸内切酶识别位点和位于5'末端的全长引物序列的产物的速率。该方法的低效率是由于以下事实:包含引物-模板双链体的序列的标称熔点温度与包含由双链产物中的互补末端低熔点区域(LL和LR)的自身退火链形成的双链体的序列相同。为了促进引物分子与模板的瞬时单链低熔点区域的更有效的杂交,与LL或LR区域互补的引物序列可以由具有经修饰的碱基的核苷酸组成,经修饰的碱基使引物-模板双链体结构稳定并且将其熔点温度提高至超过等效的G/C或A/T碱基对。

在某些实施方案中,可以通过较长序列的链切割来产生引物上的可延伸3'羟基。较长序列可以具有不可延伸的阻断3'末端。较长序列包含核酸内切酶的完整识别序列,并且可以通过核酸内切酶进行切割,在释放的3末端已经延伸之后,核酸内切酶使引物切割(图4b)。

由于EM-Seq使所产生的产物之间的平衡向具有再生核酸内切酶识别位点的分子移动,因此当扩增试剂耗尽时,反应中主要存在具有经切割的分子的反应平台。为了避免产生经切割的扩增子分子,必须在聚合酶活性丧失和试剂完全耗尽之前使核酸内切酶失活(如通过热失活)。

为了实现这一点,可以使用热稳定链置换DNA聚合酶。可供选择地,如果在反应中使用热敏聚合酶,则EM-SEq可通过添加热启动热稳定DNA聚合酶进行制备,而不需要链置换活性(例如Taq聚合酶)。在这样的实施方案中,链置换聚合酶和限制性酶的热失活同时激活了热启动热稳定聚合酶,其随后通过称为“切口平移”的过程填补DNA切口(图5)。

用于下一代DNA测序装置的固相扩增中的EM-SEq

当产生的扩增子分子中的DNA切口被填补时,大部分EM-SEq产物是双链的,并且包含所用的两个EM-SEq引物之一的5'末端序列。当反应中存在固定化的引物时,这使得EM-SEq能够用于产生表面结合的扩增子(图6)。

重要的是,相比于其他等温扩增方法,通过切割和链置换的连续循环以线性方式产生扩增子不需要引物在结合的扩增子分子的远端进行退火。因此,可以将两个EM-SEq引物都固定在表面上,并且反应中不需要存在溶液引物。如果由于体积限制而限制了可溶性引物的量,则是特别有益的。而且,预期从溶液中除去引物将大大减少由于引物二聚体而发生的脱靶扩增。

在下一代DNA测序装置的情况下,两个EM-SEq引物的固定化使得能够在同一反应中同时进行靶序列的两条链的固相扩增。扩增使溶液中的链的数目增加,每条链都可以被固定化的引物捕获。在填补DNA切口和互补链变性之后,各固定化的引物可以转变成用于测序的模板链。使用具有两种不同序列的固定化引物,可以在两条链上进行连续的配对末端读数(图6)。

在上述EM-SEq反应中,引物与自身退火的死端产物的低熔点区域的结合以及所引起的这些产物向具有再生核酸内切酶识别位点的延伸产物和完整引物序列的转化与产生这些死端产物的更多复制品的切割和链延伸过程同时发生。为了克服在反应温度下瞬时打开低熔点温度区域之间的非特异性相互作用,在一个EM-SEq实施方案中,反应可分为两个阶段,切割和链延伸过程发生在第一阶段,随后是发生在反应的第二阶段的产物转化,使得第二阶段发生在比第一阶段高的温度下。在这样的实施方案中,将低熔点温度区域设计成使得这些区域在第一阶段期间保持大部分自身退火,而在反应的第二阶段中升高反应温度使得引物的结合和产物转化成为可能。在另一个EM-SEq实施方案中,可通过切口酶失活步骤和空隙填补-聚合酶活化步骤将两个阶段隔开,使得空隙填补和死端产物转化都发生在第二阶段中,由空隙填补-聚合酶的活性驱动(图7)。

本文公开的方法能够产生NGS(下一代测序)“序列就绪”DNA片段。片段可代表来自样品的整个群体、或者可为原始模板DNA样品中存在的总DNA的靶向子集。通过(例如)聚合酶链式反应仅扩增那些目标基因座,使得所产生的扩增子具有侧翼为已知序列末端的目标模板DNA。这些已知的末端序列在由给定基因座产生的所有扩增子上是相同的或基本上相同的,并且可以是有意且可控地不对称的,其中将不同的序列施加到扩增片段的两个末端中的每一者。第一已知末端来源于第一引物或“正向”引物的5'区域,并且第二已知末端来源于第二引物或“反向”引物的5'区域。由此产生的扩增子可以在功能上等同于在常规NGS方法中产生的适配体连接的片段,但是在生产的容易性、时间和成本以及随后产生的测序数据的质量方面提供了明显的优势。在随后的操作如克隆扩增和DNA测序期间,扩增子的末端可以适应一般的“通用型”生物化学过程,而不管它们来源的基因座。

来源核酸可为基因组多核苷酸。来源物质可为真核生物、原核生物或古细菌。可提供一种或以上来源物质。来源核酸可代表基因组的片段;例如单个染色体或单个基因组基因座(例如,用于等位基因多态性的快速测序)。在特定的实例中,扩增可能对样品中的致病物质具有特异性。例如,扩增可选择存在于人类样品中的细菌或病毒核酸。模板可为DNA、RNA或它们的cDNA复制物。

方法和引物对于生成克隆扩增产物的集合(适合于在表面上、在珠粒上或在溶液中生成克隆群体)的后续操作是不可知的。该技术也不可知随后用于生成NGS数据的技术,并且可以(例如)与下列技术一起使用:Illumina SBS技术、Ion Torrent或Roche454“一次一个碱基”技术、或其他NGS技术,如纳米孔测序。通常,当需要将确定的序列引入到特定扩增产物的一个或多个末端时,本文所述的方法可能是有利的。

本发明还公开了用于实施该方法的试剂盒。本发明公开了用于修饰核酸序列的试剂盒,该试剂盒包括:

a.用于修饰双链核酸序列群体的末端第一对核酸适配体分子,其中适配体对的第一条链的5'末端包含核酸内切酶识别位点的一部分,适配体对的中心部分包含序列的低熔点区域,该低熔点区域在高于37℃且低于80℃的温度下至少瞬时呈单链,并且适配体对的第一条链的3'末端和适配体对的第二条链的5'末端能够与双链核酸序列群体的两条链进行连接;以及

b.连接酶。

试剂盒可包括另外的组件,例如一种或以上扩增引物或者一种或以上酶。试剂盒可包括链置换聚合酶。可将一种或以上试剂固定,例如可以将扩增引物固定。

可以在固体支持物上或在固体支持物的孔中进行扩增。

本发明公开了具有两种引物序列的阵列,各引物序列由三个区域组成:(i)5'末端高熔解温度区域HL或HR(高Tm左侧和高Tm右侧);(ii)位于中央的核酸内切酶识别位点,从而与模板DNA中存在的截短的识别位点相匹配;和(iii)3'末端低熔解温度区域LL或LR,其与模板DNA中存在的那些区域完全或部分互补(图2C)。

任选地,固定化的引物在低熔解区域中可以具有经修饰的碱基,当与原始碱基相比时,经修饰的碱基提高了稳定性。任选地,引物可以具有3'阻断。任选地,引物可以在延伸之前在中心核酸内切酶识别位点处切割。

还公开了根据本发明制备的扩增的多核苷酸阵列。离散孔中产物的扩增允许每孔由单个模板克隆扩增。孔可以是传感器系统的一部分,例如ISFET传感器,以检测质子释放。传感器系统可以检测pH变化,如在核苷三磷酸引入反应期间所见的。

在操作中使用该方法的实例可包括以下步骤:

获取核酸样品。如本文所述,对样品进行修饰以包含可呼吸的低熔解末端。获取具有本文公开的两种引物序列的阵列,该阵列为具有ISFET传感器的孔的集合。将样品置于阵列上,使得样品中分子的浓度产生每孔小于一个分子的平均占有率。对分子进行扩增,以在具有分子的孔中产生链的多个复制体,其中两条链都可以进行扩增。对阵列进行处理以通过链延伸去除任何切口。除去杂交链,以使固定化的链成为单链。将第一测序引物杂交到第一条固定化的链上,并获得第一测序读长。除去第一读长。将第二测序引物与第二条固定化的链杂交,并获得第二测序读长,这两个读长来自原始双链模板的相对末端。

实施例

为了测试靶分子末端瞬时打开的原理,制备了十六种不同的20个核苷酸长的DNA序列,它们的GC含量为20%、30%、40%或50%(图8)。将序列成对地添加到85个核苷酸长的靶上,以作为修饰靶末端GC含量的侧翼基序(LL和LR)(图9A)。在含有70mM单阳离子盐和2mM双阳离子盐的缓冲液以及荧光双链DNA结合染料EvaGreen的存在下测试所产生的构建体的熔解曲线。对于各构建体,将记录的荧光强度的负差值(-dF)对于30℃和90℃范围内的培育温度作图。所得的曲线显示,对于用低GC%含量的序列修饰的构建体,在50℃和70℃之间的-dF增大,表明了构建体末端瞬时打开(图9B)。

设计了一对EM-SEq引物,它们包含位于5'末端的30个核苷酸长的66%GC含量的高熔点区域(HL和HR,以粗体表示)、Nt.BstNBI切口酶识别位点和位于3'末端的20个核苷酸长的20%GC含量的低熔点区域(LL和LR,下划线)。还设计了一对对照引物,它们包含位于3'末端的20个核苷酸长的50%GC含量的区域。此外,通过将各自的引物序列连接到80个核苷酸长的大肠杆菌(E.coli)ydfU基因片段的两个末端来设计两种全长扩增模板序列。T^表示反向dT阻断剂部分(图10)。

在1X等温扩增缓冲液(NEB)、0.32SYBR Green、6mM MgSO4、1.4mM dNTPs、0.32U/μlBst 2.0WarmStart(NEB)和0.4U/μl Nt.BstNBI(NEB)的存在下,在溶液中用具有20%GC LL的正向引物、具有20%GC LR的反向引物和具有20%GC LL和LR的全长模板或者用具有50%GC LL的正向引物、具有50%GC LR的反向引物和具有50%GC LL和LR的全长模板进行原始扩增试验。将25μl含有指定量的模板复制物的反应或无模板对照反应(NTC)在qPCR热循环仪中于60℃培育15分钟。产物的实时荧光数据和凝胶电泳证明,用包含20%GC低熔点温度区域的引物和模板设计进行的试验(图11A)示出了比用包含50%GC侧翼区域的引物和模板设计进行的对照试验(图11B)高至少10倍的灵敏度和改进的特异性。

在1X等温扩增缓冲液(NEB)、0.32SYBR Green、3mM MgSO4、0.7mM dNTPs、35mMKCl、5%PEG 8000k、0.37U/μl Bst 2.0WarmStart(NEB)和0.4U/μl Nt.BstNBI(NEB)的存在下,在溶液中用具有20%GC LL的正向引物、具有20%GC LR的反向引物和具有20%GC LL和LR的全长模板或者用具有50%GC LL的正向引物、具有50%GC LR的反向引物和具有50%GCLL和LR的全长模板进行优化EM-Seq试验。将25μl含有指定量的模板复制物的反应或无模板对照反应(NTC)在qPCR热循环仪中于60℃培育15分钟。产物的实时荧光数据和凝胶电泳示出了用包含20%GC低熔点温度区域的引物和模板设计进行的试验(图12A),从而证明与用包含50%GC侧翼区域的引物和模板设计进行的对照试验(图12B)相比具有非常不同的性能。

在存在全长模板的情况下,或者在存在死端产物分子的情况下,如上所述在溶液中进行EM-SEq反应,其中全长模板包含位于5'末端的30个核苷酸长的66%GC含量的高熔点区域(HL和HR,以粗体表示,图13)、Nt.BstNBI切口酶识别位点以及靶序列侧翼的20个核苷酸长的20%GC含量的低熔点区域,而死端产物分仅包含序列侧翼的20个核苷酸长的20%GC含量的低熔点区域。实时荧光数据示出了死端产物可以在EM-SEq反应中用作模板,从而证明了EM-SEq引物侵入分子的瞬时单链末端(图14)。

在存在未经修饰的EM-SEq引物的情况下,或者在存在杂交侵入引物的情况下,如上所述在溶液中进行EM-SEq反应,其中未经修饰的EM-SEq引物包含位于5'末端的30个核苷酸长的66%GC含量的高熔点区域(HL和HR,以粗体表示,图15)、Nt.BstNBI切口酶识别位点和位于3'末端的20个核苷酸长的20%GC含量的低熔点区域(LL和LR,下划线),而杂交侵入引物中在20%GC含量的低熔点区域中的六个胸苷碱基被SuperT碱基(5-羟丁基-2'-脱氧尿苷,表示为T*)替代。产物的凝胶电泳示出了与用未经修饰的引物运行的反应相比,包含杂交侵入引物的反应产生了产物条带的图案,其中高分子量产物过多出现,而低分子量产物出现不足(图16A)。这表明杂交侵入EM-SEq反应促进了具有再生末端的分子的产生。图16B列出了预测的产物形式。

在以1:1比例点样于表面上的两种EM-SEq引物的存在下,如上所述在载玻片上进行EM-SEq反应(图17A)。包含两种EM-SEq引物的混合的点不同于将寡核苷酸固定到表面上所需的接头部分的不同设计。反应后,洗涤载玻片,用NaOH使互补DNA链解杂交,并且通过与对扩增的靶具有特异性的荧光探针进行杂交来观察扩增的DNA。

如上所述,还在能够通过检测质子释放而支持DNA测序的半导体芯片的表面上进行EM-SEq反应(图17B)。箭头指示了固定有EM-SEq引物的4×5点阵列。除了EM-SEq引物、阳性对照寡核苷酸或基准之外的所有区域都包含无关引物。反应后,洗涤载玻片,用NaOH使互补DNA链解杂交,并且通过与对扩增的靶具有特异性的荧光探针进行杂交来观察扩增的DNA。

33页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:改进的多核苷酸序列检测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!