对核酸的目标区域进行扩增的方法、建库和测序方法及试剂盒

文档序号:574313 发布日期:2021-05-21 浏览:11次 >En<

阅读说明:本技术 对核酸的目标区域进行扩增的方法、建库和测序方法及试剂盒 (Method for amplifying target region of nucleic acid, library construction and sequencing method and kit ) 是由 黄标 周荣芳 白寅琪 黄金 陈智超 唐冲 田志坚 于 2019-11-20 设计创作,主要内容包括:本发明涉及基因测序领域,具体涉及一种对核酸的目标区域进行扩增的方法、建库和测序方法。所提供的对核酸的目标区域进行扩增的方法包括:(1)利用转座酶将UMI序列插入到所述核酸上,以便获得融合产物,所述融合产物含有所述UMI序列和所述目标区域序列;(2)利用引物对所述融合产物进行扩增,以便获得含有目标区域序列和UMI序列的扩增产物。还提供了对核酸的目标区域建库的方法和测序方法。通过本发明所提供的方法可以缩短建库测序的时间;还可以降低生产成本,有效提高数据利用率。(The invention relates to the field of gene sequencing, in particular to a method for amplifying a target region of nucleic acid, a library building method and a sequencing method. Provided methods of amplifying a target region of a nucleic acid include: (1) inserting a UMI sequence onto the nucleic acid using a transposase so as to obtain a fusion product containing the UMI sequence and the target region sequence; (2) and amplifying the fusion product by using the primer so as to obtain an amplification product containing the target region sequence and the UMI sequence. Methods of pooling target regions of nucleic acids and sequencing methods are also provided. The method provided by the invention can shorten the time of library construction and sequencing; and the production cost can be reduced, and the data utilization rate is effectively improved.)

对核酸的目标区域进行扩增的方法、建库和测序方法及试 剂盒

技术领域

本发明涉及基因测序领域,具体涉及一种对核酸的目标区域进行扩增的方法、建库和测序方法及试剂盒。

背景技术

Pacbio第三代测序基于边合成边测序的原理,以SMRT(单分子实时荧光测序技术)芯片为载体进行测序反应,测序时将基因组DNA打断成许多小的片段,制成液滴后将其分散到不同的ZMW纳米孔中。当ZMW孔底部聚合反应发生时,被不同荧光标记的核苷酸会在小孔的荧光探测区域中被聚合酶滞留,根据荧光的种类和荧光持续时间就可以判定模板DNA碱基组成的种类。

Pacbio平台一个SMRT芯片有100万个ZMW测序孔,每一个测序孔可以产生一条序列信息(大概长度为20-30Kb),平均每张芯片可以产出5-15G的数据。

宏基因组学(Metagenomics)又叫微生物环境基因组学,通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。

目前传统的方法是测定微生物基因组上的16S rDNA基因,这些基因的长度通常在1500个碱基左右,广泛分布于原核生物,既能提供足够的信息,而且具有相对缓慢的进化过程;该区域序列同时具有保守型和高变性,通过保守区和特异区来区别微生物的种属。基于这些特性,科学家们通过选择这些基因区域,方便地研究环境中物种的组成多样性,但是还不能全面分析环境中的基因功能。而现在,新一代高通量低成本测序技术的广泛应用,科学家们可以对环境中的全基因组进行测序,在获得海量的数据后,全面地分析微生物群落结构以及基因功能组成等。

目前16S扩增子建库测序技术虽然其具有高通量,低花费,可客观还原菌群结构及相对丰度比例的巨大优势,但是其是通过某一OTU分类单元的序列数所占总序列数的比值来获得某个细菌的相对丰度比例信息,然而相对丰度信息不能反映样本中物种真实的绝对丰度情况,因此通过此技术得到的结果说X菌在A组相对于B组增多是错误的,应该是X菌在A组中的丰度比例相对于B组增多。

如何实现目标区域序列,例如16S rDNA的定量,还需要进一步改进。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种对核酸的目标区域进行扩增的方法、建库和测序方法及试剂盒。

在通过对基因组的目标区域核酸进行扩增、建库、测序,来获得相应的测序信息时,一般需要通过PCR扩增的方式,将融合引物标记到目标区域核酸上,然后通过利用特异性引物对含有目标区域核酸和融合引物的序列进行扩增,建库,获得测序文库,上机测序获得目标区域核酸的信息。以对微生物基因组上的16s rDNA基因为例,在对16s rDNA进行扩增的过程中,一般利用融合引物(Barcode+UMI+primer),通过PCR的方式扩增2个循环数,将UMI标记到16S rDNA全长上面。然后利用磁珠纯化,去除融合引物,再利用特异性引物,进行二轮PCR扩增,富集获得含有16s rDNA、UMI序列以及barcode等序列的产物。针对所获得的产物可以利用Pacbio平台进行建库,例如对所获得的产物进行损伤修复、末端修复、连接接头,并最终进行片段分选,获得长度为1-2Kb的测序文库。对所获得的测序文库进行上机测序。

但是上述处理方法存在一些缺点,表现为:(1)在第一次通过PCR扩增的方式,将UMI标记到16s rDNA上时,所标记的UMI序列通常较短,例如为4bp的随机引物,扩增特异性较差,当UMI序列碱基成分与基因组上面(非16S区域)同源性较高的时候,UMI会随机的结合到除了16S以外的区域,从而造成非特异性扩增;(2)一般单端UMI的长度一般只有4个碱基,UMI的种类大概只有44(大概只有256种),而环境中微生物种类往往超过1000多种,因此如果仅仅使用单端封堵无法满足需求。同时为了提高扩增的特异性,通常在目标区域的两端同时标记UMI序列,例如在目标区域的两端同时标记上4bp的UMI序列,选择两端都连接上了UMI的数据用做下游分析。但是事实上双端都连接上UMI的概率较低,数据利用率较低;(3)在第一次PCR扩增之后,为了避免带有不同UMI序列的融合引物在后续PCR扩增的过程中,会被标记到同一个16s rDNA模板上,造成UMI失真,所以在进行第二次PCR扩增之前,需要进行磁珠纯化,这就会浪费时间损耗样本。

发明人在研究过程中发现,可以利用转座酶,例如Tn5转座酶将UMI序列标记到目标区域上,而不是采用通过PCR扩增的方式将UMI序列标记到目标区域上,这样一方面可以降低非特异性扩增,另一方面也不需要在进行第二次扩增之前专门去除第一次扩增的引物,简化了工艺,可以快速准确获得针对基因组的目标区域的扩增引物。例如,可以运用Tn5转座酶将条形码分子标签序列,插入到原始基因组DNA分子中进行分子标记,然后采用PCR扩增的方式,将16S区域和条形码扩增富集出来,然后进行Pacbio平台建库和测序,从而对原始基因组DNA模板进行标记和筛选的过程,测序后,根据唯一的条码标签对序列进行定量和其他高级分析,能够显著的提高三代测序平台多种产品的基因定量水平和组装情况。同时,也可以运用Tn5转座酶将条形码分子标签序列直接插入到基因组DNA分子中进行分子标记,所获得的产物可以不经过PCR扩增,直接用于文库的构建和测序,例如可以采用Pacbio平台进行建库和测序,实现基因组DNA的定量和分析。

具体而言,本发明提供了如下技术方案:

在本发明的第一方面,本发明提供了一种对核酸的目标区域进行扩增的方法,包括:利用转座酶将UMI序列插入到所述核酸上,以便获得融合产物,所述融合产物含有所述UMI序列和所述目标区域序列;利用扩增引物对所述融合产物进行扩增,以便获得含有所述UMI序列和所述目标区域序列的扩增产物。应用该方法可以实现核酸的目标区域的快速扩增。而且所获得的扩增产物应用于建库和测序,不仅不会影响测序质量,而且还能够实现目标区域核酸的定量。

根据本发明的实施例,以上所述对核酸的目标区域进行扩增的方法可以进一步包括如下技术特征:

在本发明的一些实施例中,所述转座酶为Tn5转座酶。

在本发明的一些实施例中,所述UMI序列为长度为5~25bp的随机序列,例如为长度为5~20bp的随机序列,优选为长度为8~15bp的随机序列,更优选为长度为10bp的随机序列。

在本发明的一些实施例中,所述目标区域为16S rDNA、18SrDNA或者ITS区域。

在本发明的一些实施例中,所述目标区域的长度为1~10kb。应用该方法可以扩增较长的目标区域序列,例如长度为1~10kb的目标区域,长度为1~8kb的目标区域,长度为1~6kb的目标区域,或者是长度为1~4kb的目标区域,长度为1~2kb的目标区域。

在本发明的一些实施例中,所述核酸为微生物的基因组DNA。由于所提供的扩增方法,通过转座酶的方式引入UMI序列,特异性强,可以适用于对微生物的基因组DNA上的目标区域进行扩增。例如适用于对微生物基因组上的16S rDNA基因进行扩增,通过对扩增结果进行建库、测序,来分析微生物物种的多样性,以及相应基因的功能。

在本发明的一些实施例中,所述UMI序列位于所述目标区域序列之间。利用转座酶将UMI序列插入到所述核酸上时,UMI序列的插入位置不做特殊限制,可以插入到目标区域序列之间,也可以插入到目标区域的上游或者下游。当UMI序列插入到目标区域之间时,在后续扩增时,可以只针对性地对目标区域和UMI序列进行扩增,而不必对一些无关区域进行扩增,从而避免测序数据的浪费,降低成本。

在本发明的一些实施例中,每隔1~2kb长度的目标区域含有1个UMI序列。由此可以避免引入过多UMI序列,造成测序数据的浪费,降低成本。

在本发明的一些实施例中,步骤(1)中进一步包括:(1-1)获得含有识别序列和所述UMI序列的核酸片段;(1-2)将所述核酸片段、Tn5转座酶和所述核酸混合,在32~40摄氏度条件下反应25~50分钟,优选在37摄氏度条件下反应30分钟。在应用Tn5转座酶将UMI序列插入到核酸上时,如果不控制反应条件和反应体系,可能会使得大概每隔100-200bp就会插入一段Tn5酶携带的序列;将其直接应用于16S rDNA的扩增时,会导致1.5kb的16S rDNA全长大概会插入10个左右的UMI标签序列,这会是对数据的一个大大的浪费。实际分析过程只需要一个UMI就可以进行决定定量分析,所以可以控制在32~40摄氏度条件下反应25~50分钟,优选在37摄氏度条件下反应30分钟,使得每隔1~2kb长度的目标区域含有1个UMI序列,避免浪费测序数据。

在本发明的第二方面,本发明提供了一种对核酸的目标区域建库的方法,包括:利用本发明第一方面任一实施例所述的方法对所述核酸的目标区域进行扩增,获得扩增产物;基于所述扩增产物,建库,以便获得测序文库。应用该方法,一方面可以缩短建库测序的时间;还可以降低生产成本,有效提高数据利用率。

根据本发明的实施例,以上所述对核酸的目标区域建库的方法可以进一步包括如下技术特征:

在本发明的一些实施例中,利用Pacbio平台进行所述建库。

在本发明的一些实施例中,所述建库包括:将所述扩增产物进行损伤修复和末端修复,以便获得修复产物;将所述修复产物和接头进行连接,以便获得连接产物;对所述连接产物进行酶切消化,所获得的酶切片段经过片段分选,获得含有目标区域和UMI序列的片段。

在本发明的一些实施例中,在将所述修复产物和所述接头进行连接之前,或者在对所获得的酶切片段经片段分选之前,分别利用磁珠对所述修复产物进行纯化。

在本发明的第三方面,本发明提供了一种构建测序文库的方法,包括:利用转座酶将UMI序列插入到基因组DNA上,以便获得融合产物;基于所述融合产物,建库,以便获得测序文库。利用转座酶将UMI插入到基因组DNA上,然后进行建库,对所获得的测序文库进行测序,能够实现基因组DNA的定量分析和检测。

在本发明的一些实施例中,利用Pacbio平台进行所述建库。

在本发明的一些实施例中,所述建库包括:将所述融合产物进行损伤修复和末端修复,以便获得修复产物;将所述修复产物和接头进行连接,以便获得连接产物;对所述连接产物进行酶切消化,所获得的酶切片段经过片段分选,以便获得所述测序文库。

在本发明的第四方面,本发明提供了一种测序方法,包括:利用本发明第二方面或者本发明第三方面任一实施例所述的方法获得测序文库;基于所述测序文库,上机测序,以便获得测序结果。

在本发明的一些实施例中,利用Pacbio平台进行所述上机测序。

在本发明的第五方面,本发明提供了一种试剂盒,包括:Tn5转座酶,和SEQ ID NO:1、SEQ ID NO:2所示序列。

根据本发明的实施例,所述试剂盒可以进一步包括:适用于Pacibo平台建库测序的试剂。

在本发明的第六方面,本发明提供了一种对核酸进行修饰的方法,其特征在于,利用转座酶将UMI序列插入到所述核酸上,获得融合产物。通过利用转座酶将UMI序列插入到核酸上,使得核酸标记上UMI序列,利用该UMI序列可以追溯每一个文库片段,准确还原核酸样本的原始状态,实现绝对化、数字化的精确定量。

根据本发明的实施例,以上所述对核酸进行修饰的方法可以进一步包括如下技术特征:

在本发明的一些实施例中,所述转座酶为Tn5转座酶。

在本发明的一些实施例中,所述UMI序列为长度为5~25bp的随机序列,优选为长度为8~15bp的随机序列,更优选为长度为10bp的随机序列。

在本发明的一些实施例中,每隔1~2kb长度的核酸序列含有1个UMI序列。每隔1~2kb长度的核酸序列含有1个UMI序列,可以避免引入过多的UMI序列,以便在后续对核酸进行测序时,造成测序数据的浪费。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是根据本发明的实施例提供的利用Tn5转座酶对核酸的目标区域(16s DNA)进行扩增的方法的示意图;

图2是根据本发明的实施例1所提供的菌种分类定量结果图;

图3是根据本发明的对比例1所提供的菌种分类定量结果图。

具体实施方式

下面参考实施例详细描述本发明的实施例,需要说明的是,这些实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

本文中,如无特别说明,当表示核酸序列时,“N”代表任意碱基A、T、C或者G。

在本发明的一个方面,本发明提供了一种对核酸的目标区域建库的方法,包括:(1)利用转座酶将UMI序列插入到所述核酸上,以便获得融合产物,所述融合产物含有所述UMI序列和所述目标区域序列;(2)利用扩增引物对所述融合产物进行扩增,以便获得含有所述UMI序列和所述目标区域序列的扩增产物;(3)基于所述扩增产物,建库,以便获得测序文库。

通常在将UMI序列引入到核酸分子上时,是通过连接酶,将UMI序列通过PCR的方式连接到核酸分子,例如DNA分子的两端。本发明利用转座酶,优选利用Tn5转座酶将UMI序列插入到所述核酸上时,可以避免通过PCR的方式标记UMI序列所带来的非特异性扩增。在通过转座酶引入UMI序列的过程中,所述UMI序列的插入位置是随机的,可以在所述核酸的目标区域的两端,也可以在所述目标区域之间。当然,根据目标区域长度的大小,UMI序列的插入个数也有一定的要求。通常来说,每1~2kb长度的目标区域,可以插入一个UMI序列,如果插入的UMI序列太少,可能标记上UMI序列。如果插入过多的UMI序列的情况下,会造成测序数据的浪费。以Tn5转座酶为例,所含有的识别序列以及UMI序列,长度大约在50bp左右,如果在1~2kb长度的目标区域就插入5段,就会造成250bp左右的数据的浪费。当然,利用Tn5转座酶插入到核酸上时,可能会在插入到核酸上后,切割核酸,但是只是会形成几个碱基的缺口,所形成的缺口可以在后续建库的过程中进行修复补平。

每隔1~2kb长度的目标区域,例如每隔1~1.5kb长度的目标区域插入一个UMI序列,可以通过反应体系的温度和时间来实现。在本发明的至少一些实施方式中,步骤(1)进一步包括:(1-1)获得含有识别序列和所述UMI序列的核酸片段;(1-2)将所述核酸片段、Tn5转座酶和所述核酸混合反应,所述反应条件为32~40摄氏度条件下反应25~50分钟,优选为37摄氏度条件下反应30分钟;所述反应体系中含有镁离子和缓冲液。由此可以使得每个1~2kb长度的目标区域插入一个UMI序列。

在本发明的至少一些实施方式中,可以利用Pacbio平台进行建库。例如可以利用市面上已有的Pacbio平台适用的商购试剂盒进行建库。

下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

实施例1采用Tn5转座酶进行建库和测序的方法

实施例1提供了一种采用T5转座酶对微生物菌株的16s DNA进行建库和测序的方法,包括如下步骤:

(1)样本准备:使用如下四种菌株(后续简称A\B\C\D),提取每种菌株的DNA,然后根据每种菌株的16S rDNA拷贝数,混合,使得每微升溶液中含有50000拷贝数的各菌株DNA。

菌种简称 菌种全称 GC含量% 每μl拷贝数
A Rhodobacter sphaeroides 69.01 50000
B Escherichia coli 50.79 50000
C Acinetobacter baumannii 38.94 50000
D Bacillus cereus 35.58 50000

(2)Tn5处理标记:

A、合成含有识别序列和UMI序列的核酸片段(详细序列如下述SEQ ID NO:1和SEQIDNO:2所示),稀释到100μM按照比例混合(Tn5:Me=1:2),按照如下反应条件退火,命名为Adapter MIX:

热盖on 105℃
75℃ 10min
60℃ 10min
50℃ 10min
40℃ 10min
25℃ 10min

所用到的核酸片段为:

其中,SEQ ID NO:1中下划线部分是Me序列,后面的NNNNNNNN碱基是UMI序列,UMI序列后面为Me序列。Tn5转座酶以二聚体的形式发挥转座功能,在UMI序列两端的Me序列分别结合到一个Tn5转座酶的亚基上,使得Tn5转座酶二聚体行使相应的转座功能。

B、Tn5单酶和序列的结合组装:

配置如下反应体系,30℃反应1小时,使得通过步骤A退火后的Tn5/Me序列包埋组装到Tn5单酶上,形成Tn5-UMI复合体。

C、配制Tn5转座酶反应体系,37℃反应30min:

试剂 体积(μl)
5X tagment buffer L 4
DNA 1
步骤B制备的Tn5-UMI复合体 1
Mg离子(2.0mmol/L) 1
13
总体积 20

D、终止反应:按照如下反应体系配置中止反应缓冲液,加入4μl到上一步反应试剂中,混匀离心在冰上放置10min。

试剂 体积(μl)
TrisHCI(PH=8),10mM 1
EDTA(PH=8),20mM 1
48

E、修补Nick:每个样本加入10ulHigh-Fidelity 2X PCR Master Mix(NEB M0541L),然后在72℃孵育10min。

(3)16S全长扩增:使用在上海生工生物技术有限公司合成16S引物扩增经过Tn5处理的DNA(所用到的引物如下表所示),同一个做四组重复,依次将命名为PCR-1、PCR-2、PCR-3、PCR-4。

引物名称 引物序列((5'to3'))
16S-F1 TCAGACGATGCGTCAT AGAGTTTGATCCTGGCTCAG(SEQ ID NO:3)
16S-F2 CTATACATGACTCTGC AGAGTTTGATCCTGGCTCAG(SEQ ID NO:4)
16S-F3 TACTAGAGTAGCACTC AGAGTTTGATCCTGGCTCAG(SEQ ID NO:5)
16S-F4 TGTGTATCAGTACATG AGAGTTTGATCCTGGCTCAG(SEQ ID NO:6)
16S-R1 ATGACGCATCGTCTGA GGYTACCTTGTTACGACTT(SEQ ID NO:7)
16S-R2 GCAGAGTCATGTATAG GGYTACCTTGTTACGACTT(SEQ ID NO:8)
16S-R3 GAGTGCTACTCTAGTA GGYTACCTTGTTACGACTT(SEQ ID NO:9)
16S-R4 CATGTACTGATACACA GGYTACCTTGTTACGACTT(SEQ ID NO:10)

(4)将4个PCR扩增产物(PCR-1和PCR-2,PCR-3和PCR-4)等量混合。

(5)利用Pacbio建库试剂盒SMRTbell Template Prep Kit 1.0(货号为:100-259-100),进行Pacbio建库测序操作,具体如下:

A、损伤修复反应:配置如下反应体系,37℃反应60min:

试剂 用量(μL)
DNA Damage Repair Buffer(DNA损伤修复缓冲液) 5
NAD+ 0.5
ATP high(ATP高) 5
dNTP 0.5
DNA Damage Repair Mix(DNA损伤修复混合液) 1
DNA 37

B、末端修复反应:配置如下反应体系,25℃反应10min:

试剂 用量(μL)
DNA 50
DNA Damage Repair Mix(DNA损伤修复混合液) 2

C、磁珠纯化:加入50μL磁珠与样本结合10min后,使用75%的无水乙醇清洗两次,然后用24μL的水将DNA从磁珠上面溶解下来。

所用到的磁珠购自于诺唯赞VAHTSTM DNA Clean Beads(lot:N411)。

D、加接头:配置如下反应体系,25℃过夜反应(12-16小时)

试剂 用量(μL)
DNA 20
Annealed Blunt Adapter(退火平端接头)(20μM) 10
Template Prep Buffer(模板制备缓冲液) 4
ATP low(ATP低) 2
Ligase(连接酶) 1
3

E、双酶消化:配置如下反应体系,37℃反应60min.

试剂 用量(μL)
DNA 40
ExoIII 1
ExoVII 1

F、磁珠纯化:加入50ul磁珠与样本结合10min后,使用75%的无水乙醇清洗两次,然后用30ul的水将DNA从磁珠上面溶解下来。

G、片段分选:分选1-2Kb之间的片段。

(6)制备上机:加primer+加测序聚合酶。

按照Pacbio建库试剂盒SMRTbell Template Prep Kit 1.0(货号为:100-259-100)中的说明,按照如下步骤对分选后的片段制备上机,测序。

A、引物连接:配置如下反应体系,20℃反应60min。

试剂 用量(μL)
6.1
10×Primer Buffer(引物缓冲液) 1
Sample Volume(样本量) 1.9
Diluted Sequencing Primer(稀释的测序引物) 1

B、聚合酶连接:30℃反应60min。

试剂 用量(μL)
dNTP 1.6
DTT 1.6
Binding Buffer V2(结合缓冲液V2) 1.6
Sample Volume(样本量) 9.2
Polymerase Diluted(稀释的聚合酶) 1

C、磁珠纯化:使用0.6倍磁珠纯化产物。

(7)数据分析处理

其结果如下:

优化前后Agilent2100片段大小结果:

表1本发明扩增建库结果数据

表1中未经Tn5处理是指:利用上述步骤处理时,不使用Tn5转座酶,所扩增出来的片段长度。重复1~重复4代表4个重复实验,四个重复实验所获得的结果存在一定的差异,可能的原因主要在于:在利用Agilent2100检测时,Agilent2100仪器本身比较灵敏,带来一些检测结果上的差异;另外基因组gDNA本身为多个细菌的混合物,可能也存在一定的扩增效率差异。

通过片段大小验证,Tn5携带的标签序列是否插入到16S rDNA区域。从表1可以看出使用Tn5处理前后的扩增片段大小结果显示,Tn5处理之后的扩增产物长于未经Tn5处理的扩增产物。将多长出来的序列长度与Tn5包裹的序列比较,证明该方法成功的将UMI及其两端的Me序列成功的插入到16S中间。

另外,由于16S rDNA全长为1500bp左右,考虑到个体差异和检测差异,所以也基本都在1-2Kb之间。表1中所计算的1-2Kb,是为了说明非特异性扩增的比例;1-2Kb之外的比例就是由于非特异性扩增所造成。

表2本发明测试结果数据

其中表2中,tag数代表比对到该样本上面的reads数,即序列条数,长度(bp)代表去除了UMI、扩增引物和接头序列的纯插入insert序列,即为本发明中的16S rDNA全长,RQ质量值代表质量值,数值约接近1表示质量越好。

实施例1的结果表明,根据参考序列比对出来的16S长度接近,且RQ质量值接近,表明整个实验过程中没有对16S序列识别造成错判,优化前后碱基质量值接近。

其中菌种分类定量结果如图2所示,其中图2中黑色横线表示的实际投入量,柱状图中为数据处理计算得到的菌种比例,实验结果表明通过这种实施例1所提供的方法,菌种实际投入和测序数据处理结果趋于一致,表明实施例1所提供的方法定量结果更加准确可靠。

实施例2Tn5反应条件摸索

参照实施例1的方法,实施例2对步骤(2)Tn处理标记时的步骤C的反应条件进行了摸索,分别在55摄氏度条件下,45摄氏度条件下,37摄氏度条件下,以及20摄氏度条件下反应30分钟,如下表3所示:

表3反应条件摸索的扩增结果和数据

表3中,Tn5-UMI处理前长度代表:未使用Tn5转座酶,所扩增出来的片段长度。在不同的反应条件下所获得的Tn5-UMI处理前的长度本身存在一定的差异,可能的原因主要在于:在利用Agilent2100检测时,Agilent2100仪器本身比较灵敏,带来一些检测结果上的差异;另外基因组gDNA本身为多个细菌的混合物,可能也存在一定的扩增效率差异。

从表3给出的结果可以看出,在37℃,反应30min,插入的UMI序列更加适合。

对比例1现有Pacbio平台文献记载的16S UMI建库测序方法

对比例1提供了一种对于16S rDNA建库和测序的方法,该方法是基于现有Pacbio平台,参考文献中的记载的方法,包括如下步骤:

(1)样本准备:使用如下四种菌株(后续简称A\B\C\D),提取每种菌株的DNA,然后根据每种菌株的16S rDNA拷贝数,混合,使得每微升溶液中含有50000拷贝数的各菌株DNA。

(2)首先在上海生工生物技术有限公司合成16S第一轮扩增用融合引物(如SEQ IDNO:11~SEQ ID NO:18所示),扩增16S全长,做四组重复,依次将命名为PCR-1、PCR-2、PCR-3和PCR-4.

所用到的扩增引物如下表所示:

Pacbio 16S全长第一轮扩增引物序列。

引物名称 引物序列((5'to3'))
16S-UMI-F1 TCAGACGATGCGTCATNNNNNNNNNNAGAGTTTGATCCTGGCTCAG(SEQ ID NO:11)
16S-UMI-F2 CTATACATGACTCTGCNNNNNNNNNNAGAGTTTGATCCTGGCTCAG(SEQ ID NO:12)
16S-UMI-F3 TACTAGAGTAGCACTCNNNNNNNNNNAGAGTTTGATCCTGGCTCAG(SEQ ID NO:13)
16S-UMI-F4 TGTGTATCAGTACATGNNNNNNNNNNAGAGTTTGATCCTGGCTCAG(SEQ ID NO:14)
16S-UMI-R1 ATGACGCATCGTCTGANNNNNNNNNNGGYTACCTTGTTACGACTT(SEQ ID NO:15)
16S-UMI-R2 GCAGAGTCATGTATAGNNNNNNNNNNGGYTACCTTGTTACGACTT(SEQ ID NO:16)
16S-UMI-R3 GAGTGCTACTCTAGTANNNNNNNNNNGGYTACCTTGTTACGACTT(SEQ ID NO:17)
16S-UMI-R4 CATGTACTGATACACANNNNNNNNNNGGYTACCTTGTTACGACTT(SEQ ID NO:18)

(3)将PCR-1、PCR-2、PCR-3和PCR-4.进行磁珠纯化(加入50μl的磁珠结合10min,用75%的无水乙醇清洗两次后,回融在10μl NF水)。

(4)在上海生工生物技术有限公司合成16S第二轮扩增用融合引物(如SEQ ID NO:19~SEQ ID NO:26所示),分别将PCR-1、PCR-2、PCR-3和PCR-4进行第二轮扩增,第二轮扩增反应体系和条件如下:

试剂 体积(μl)
酶/polymerase 总量
2X KAPA HIFI Mix 25
Primer Mix 4
Template DNA(50ng) X
NF-H<sub>2</sub>O 21-X

所用到的引物如下:

Pacbio 16S全长第二轮扩增引物序列

引物名称 引物序列((5'to3'))
16S-F1 TCAGACGATGCGTCAT(SEQ ID NO:19)
16S-F2 CTATACATGACTCTGC(SEQ ID NO:20)
16S-F3 TACTAGAGTAGCACTC(SEQ ID NO:21)
16S-F4 TGTGTATCAGTACATG(SEQ ID NO:22)
16S-R1 ATGACGCATCGTCTGA(SEQ ID NO:23)
16S-R2 GCAGAGTCATGTATAG(SEQ ID NO:24)
16S-R3 GAGTGCTACTCTAGTA(SEQ ID NO:25)
16S-R4 CATGTACTGATACACA(SEQ ID NO:26)

(5)将4个PCR扩增产物(PCR-1和PCR-2,PCR-3和PCR-4)等量混合。

(6)Pacbio建库测序操作,具体如下:

A、损伤修复反应:配置如下反应体系,37℃反应60min:

试剂 用量(μL)
DNA Damage Repair Buffer(DNA损伤修复缓冲液) 5
NAD+ 0.5
ATP high(ATP高) 5
dNTP 0.5
DNA Damage Repair Mix(DNA损伤修复混合液) 1
DNA 37

B、末端修复反应:配置如下反应体系,25℃反应10min:

试剂 用量(μL)
DNA 50
DNA Damage Repair Mix(DNA损伤修复混合液) 2

C、磁珠纯化:加入50ul磁珠与样本结合10min后,使用75%的无水乙醇清洗两次,然后用24ul的水将DNA从磁珠上面溶解下来。

D、加接头:配置如下反应体系,25℃过夜反应(12-16小时)

试剂 用量(μL)
DNA 20
Annealed Blunt Adapter(退火平端接头)(20μM) 10
Template Prep Buffer(模板制备缓冲液) 4
ATP low(ATP低) 2
Ligase(连接酶) 1
3

E、双酶消化:配置如下反应体系,37℃反应60min.

试剂 用量(μL)
DNA 40
ExoIII 1
ExoVII 1

F、磁珠纯化:磁珠纯化:加入50ul磁珠与样本结合10min后,使用75%的无水乙醇清洗两次,然后用30ul的水将DNA从磁珠上面溶解下来。

G、片段分选:分选1-2Kb之间的片段。

(7)制备上机:加primer+加测序聚合酶。

A、引物连接:配置如下反应体系,20℃反应60min。

试剂 用量(μL)
6.1
10×Primer Buffer(引物缓冲液) 1
Sample Volume(样本量) 1.9
Diluted Sequencing Primer(稀释的测序引物) 1

B、聚合酶连接:30℃反应60min。

试剂 用量(μL)
dNTP 1.6
DTT 1.6
Binding Buffer V2(结合缓冲液V2) 1.6
Sample Volume(样本量) 9.2
Polymerase Diluted(稀释的聚合酶) 1

C、磁珠纯化:使用0.6倍磁珠纯化产物。

(8)数据分析处理

其结果如下:

1、Agilent 2100片段大小结果:

表4现有方法扩增结果(优化前)

细菌16S DNA全长在1.5kb左右,Pacbio官方方法进行实验(非UMI的方法扩增),一般80%左右的样本片段长度都在1-2Kb之间。使用目前公布的UMI方法进行扩增后,样本Agilent2100质检结果显示,该方法扩增产物,特异性扩增笔记在20-30%左右,会导致大量的非特异性扩增。

表5现有方法测序结果(优化前)

对比实施例1和对比例1的方法不难看出,应用本发明所提供的方法与常规方法相比,数据质量和常规方法基本接近,表明本发明所提供的方法不会对测序造成不利的影响。

采用对比例1提供的方法进行菌群定量,其结果如图3所示,Pacbio测序定量出来的菌群为图例中的A、B、C和D四个,图3中黑色横线部分为菌群实际投入量,实验结果表明应用该方法理论与实际偏差较大。

以上结果表明,本发明应用转座酶对目标区域进行扩增、建库和测序的方法,不仅不会影响测序质量,而且还能够实现目标区域核酸的定量。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

SEQUENCE LISTING

<110> 武汉华大医学检验所有限公司

<120> 对核酸的目标区域进行扩增的方法、建库和测序方法及试剂盒

<130> PIDC3194980

<160> 26

<170> PatentIn version 3.5

<210> 1

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> Tn5

<220>

<221> misc_feature

<222> (20)..(27)

<223> n is a, c, g, or t

<400> 1

agatgtgtat aagagacagn nnnnnnnaga tgtgtataag agacag 46

<210> 2

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Me

<400> 2

ctgtctctta tacacatct 19

<210> 3

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F1

<400> 3

tcagacgatg cgtcatagag tttgatcctg gctcag 36

<210> 4

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F2

<400> 4

ctatacatga ctctgcagag tttgatcctg gctcag 36

<210> 5

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F3

<400> 5

tactagagta gcactcagag tttgatcctg gctcag 36

<210> 6

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F4

<400> 6

tgtgtatcag tacatgagag tttgatcctg gctcag 36

<210> 7

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R1

<400> 7

atgacgcatc gtctgaggyt accttgttac gactt 35

<210> 8

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R2

<400> 8

gcagagtcat gtatagggyt accttgttac gactt 35

<210> 9

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R3

<400> 9

gagtgctact ctagtaggyt accttgttac gactt 35

<210> 10

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R4

<400> 10

catgtactga tacacaggyt accttgttac gactt 35

<210> 11

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-F1

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 11

tcagacgatg cgtcatnnnn nnnnnnagag tttgatcctg gctcag 46

<210> 12

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-F2

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 12

ctatacatga ctctgcnnnn nnnnnnagag tttgatcctg gctcag 46

<210> 13

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-F3

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 13

tactagagta gcactcnnnn nnnnnnagag tttgatcctg gctcag 46

<210> 14

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-F4

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 14

tgtgtatcag tacatgnnnn nnnnnnagag tttgatcctg gctcag 46

<210> 15

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-R1

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 15

atgacgcatc gtctgannnn nnnnnnggyt accttgttac gactt 45

<210> 16

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-R2

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 16

gcagagtcat gtatagnnnn nnnnnnggyt accttgttac gactt 45

<210> 17

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-R3

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 17

gagtgctact ctagtannnn nnnnnnggyt accttgttac gactt 45

<210> 18

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-UMI-R4

<220>

<221> misc_feature

<222> (17)..(26)

<223> n is a, c, g, or t

<400> 18

catgtactga tacacannnn nnnnnnggyt accttgttac gactt 45

<210> 19

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F1

<400> 19

tcagacgatg cgtcat 16

<210> 20

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F2

<400> 20

ctatacatga ctctgc 16

<210> 21

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F3

<400> 21

tactagagta gcactc 16

<210> 22

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-F4

<400> 22

tgtgtatcag tacatg 16

<210> 23

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R1

<400> 23

atgacgcatc gtctga 16

<210> 24

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R2

<400> 24

gcagagtcat gtatag 16

<210> 25

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R3

<400> 25

gagtgctact ctagta 16

<210> 26

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<223> 16S-R4

<400> 26

catgtactga tacaca 16

26页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基因突变多重检测用引物组合物及其试剂盒

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!