一种用于二代测序文库构建方法及试剂盒

文档序号：1884854 发布日期：2021-11-26 浏览：20次 >En<

阅读说明：本技术 一种用于二代测序文库构建方法及试剂盒 (Method and kit for constructing second-generation sequencing library ) 是由黄必胜胡咏武于 2021-07-20 设计创作，主要内容包括：本发明公开了核酸测序领域的一种用于二代测序文库构建方法及试剂盒,包括步骤1：提取需要测序的基因组DNA,包含但不限于各种肿瘤组织DNA,或外周血游离DNA或各种体液,如但不限于胸腔积水、尿液,唾液等中的DNA,步骤2：设计包含特异目标序列引物的,同时带有样本标记序列(index)和测序引物的引物序列,并人工合成该引物；步骤3：将所述特异性引物和待测DNA混合,进行PCR扩增；步骤4：纯化PCR产物；步骤5：上机测序,该用于二代测序文库构建方法及试剂盒简化了建库流程,降低建库成本,提高了检测的灵敏度,也降低了检测所需测序的数据量,有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费。(The invention discloses a method and a kit for constructing a second-generation sequencing library in the field of nucleic acid sequencing, and the method comprises the following steps of 1: extracting genomic DNA to be sequenced, including but not limited to DNA of various tumor tissues, or free DNA of peripheral blood or DNA in various body fluids, such as but not limited to pleural effusion, urine, saliva and the like, step 2: designing a primer sequence which contains a specific target sequence primer and is provided with a sample marker sequence (index) and a sequencing primer, and artificially synthesizing the primer; and step 3: mixing the specific primer and the DNA to be detected, and carrying out PCR amplification; and 4, step 4: purifying the PCR product; and 5: the method and the kit for constructing the second-generation sequencing library simplify the library construction process, reduce the library construction cost, improve the detection sensitivity, reduce the data amount of sequencing required by detection, effectively remove false positives, improve the enrichment efficiency of target DNA fragments and reduce the sequencing data waste.)

一种用于二代测序文库构建方法及试剂盒

技术领域

本发明涉及核酸测序领域，具体为一种用于二代测序文库构建方法及试剂盒。

背景技术

基因突变是指基因在结构上发生碱基对组成或排列顺序的改变。在病原体检测、肿瘤突变基因检测、孕妇血浆中存在胎儿游离DNA的检测中，需要在大量的正常基因序列中发现少量的突变基因，这时候，二代测序以其高通量测序的特点，就能够发挥出优异的特点，以远低于一代测序(Sanger测序) 的成本检测出样本中少量的(低于1％)突变基因，例如癌症患者血浆中存在肿瘤特征的游离DNA(ctDNA)、癌组织样本(如FFPE)中存在比例较低的亚克隆突变和孕妇血浆中存在胎儿游离DNA，以及艾滋病、肝炎等患者血浆中存在病毒DNA。

但是常规二代测序方法的测序文库的构建过程比较复杂，包括基因组的片段化、DNA片段进行末端修复，得到平末端DNA片段，将平末端DNA片段进行3'端加A，得到3'端加A的DNA片段，再将3'端加A的DNA片段进行加接头，得到加接头DNA片段；以及将所述加接头DNA片段进行PCR扩增，得到扩增产物等步骤，期间还要经过多步的纯化，模版DNA损失很多，非常不利于低频率的基因突变检测。如果还要增加对目标片段的捕获步骤，检测的准确性更加难以保证，实践中常常需要加大测序深度，极大增加测序成本。

发明内容

本发明的目的在于提供一种用于二代测序文库构建方法及试剂盒，以解决上述背景技术中提出模版DNA损失很多，非常不利于低频率的基因突变检测，检测的准确性更加难以保证，增加测序成本的问题。

为实现上述目的，本发明提供如下技术方案：一种用于二代测序文库构建方法，包括如下步骤：

步骤1：提取需要测序的基因组DNA，包含但不限于各种肿瘤组织DNA，或外周血游离DNA(孕妇外周血或正常人或肿瘤患者外周血DNA)或各种体液，如但不限于胸腔积水、尿液，唾液等中的DNA。

步骤2：设计包含特异目标序列引物的，同时带有样本标记序列(index) 和测序引物的引物序列，并人工合成该引物；

步骤3：将所述特异性引物和待测DNA混合，进行PCR扩增；

步骤4：纯化PCR产物；

步骤5：上机测序；

其中步骤2中使用的引物序列还包括SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA的退火产物作为所述接头，所述SEQ ID NO:1(A+B)：5'-GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG(X1)m-3'，所述 SEQ ID NO:2(D+E+F)：5'-CAAGCAGAAGACGGCATACGAGAT(N)n(X2)m-3'；

其中所述SEQ ID NO:1(A+B)中(X1)m被设计成与被检测的目标序列位点附近上游引物；所述SEQ ID NO:2(D+E+F)中(N)n为标签序列，用于区分来自不同样本的测序数据，n为6～12的正整数，n个N彼此独立地选自A、 T、C、G，(X2)m为下游引物，m为20-40的正整数，距离该位点1～50bp，例如2～20bp的目标序列特异性引物。

优选的，所述步骤3中PCR反应体系为DNA20ul、PCR引物混合物5ul和 PCR主混合物25ul。

优选的，所述步骤4中对产物进行纯化的步骤，可以采用本领域熟知的磁珠法或滤膜吸附法试剂盒。

本发明还提供一种用于二代测序文库的试剂盒包括所述上下游引物具体可以是，但不限于核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA，或者它们的退火产物。

优选的，还包括以下试剂：Taq酶，DNTP，MgCl₂和PCR缓冲液。

优选的，还包括磁珠法DNA纯化试剂盒或滤膜吸附法DNA纯化试剂盒。

与现有技术相比，本发明的有益效果是：该用于二代测序文库构建方法及试剂盒，其省略了DNA末端补平，3’端加腺嘌呤和测序引物的连接等步骤，也减少了纯化步骤，通过将测序引物与特异的目标序列引物联合设计，也省略了目标序列的捕获步骤，极大地简化了建库流程，降低建库成本，提高了检测的灵敏度，也降低了检测所需测序的数据量，有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费，能够应用于目标序列测序，包括但不限于应用于癌症患者血浆中存在肿瘤特征的游离DNA(ctDNA)、癌组织样本(如FFPE)中存在比例较低的亚克隆突变和孕妇血浆中存在胎儿游离DNA，以及艾滋病、肝炎等患者血浆中存在病毒DNA的二代测序检测。

附图说明

图1为本发明的测序示意图；

图2为本发明实施例中设置PCR的程序图。

具体实施方式

下面本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在一个方面中，本发明提供一种用于DNA二代测序文库构建的方法，其包括：

步骤2：设计包含特异目标序列引物的，同时带有样本标记序列(index) 的和测序引物的引物序列，并人工合成该引物；

步骤3：将所述特异性引物和待测DNA混合，进行PCR扩增；

步骤4：纯化PCR产物；

步骤5：上机测序

其中，如图1所示的步骤2具有该结构，具体的，但不限于使用核苷酸序列如SEQ IDNO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2所示的单链DNA的退火产物作为所述接头；

本发明的建库方法中仅在所述步骤3中进行一次PCR扩增。

本发明的建库方法中，对步骤1中的DNA片段的量没有特殊限制，但需要说明的是，本发明的建库方法可适用于微少量样本建库，因此，步骤1中的DNA片段的量可以为1～200ng，例如可以为5～50ng。

其中，本发明的建库方法中，仅在所述步骤4中进行一次PCR扩增(可进行例如10～30个温度循环)，除此之外不再包含对加接头DNA片段进行PCR 扩增的步骤，这样可以减少因PCR扩增引入的错配，有效降低假阳性的发生。

其中，本发明的检测DNA突变的方法中的测序可以例如利用Illumina平台(例如HiSeq 2500或NextSeq 500)进行。

在另一方面中，本发明还提供一种用于构建二代测序DNA文库的试剂盒，其可用于实施本发明的建库方法，其包含用于构建二代测序DNA文库的试剂，所述用于构建二测序DNA文库的试剂包含：

核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2 所示的单链DNA，或者它们的退火产物；

在另一方面中，本发明还提供一种用于检测DNA低频突变的试剂盒，其可用于实施本发明的检测方法，其包含：

用于构建二代测序DNA文库的试剂，以及用于对二代测序DNA文库进行上机测序的试剂；

其中，所述用于构建二代测序DNA文库的试剂包括：

核苷酸序列如SEQ ID NO:1所示的单链DNA与核苷酸序列如SEQ ID NO:2 所示的单链DNA，或者它们的退火产物；二代DNA测序文库进行上机测序的试剂包括选自下组中的至少一种或两种以上：DNA聚合酶、dNTP、冲洗杂交液/ 缓冲液、100％甲酰胺(质量/体积)、用于测序的Read 2测序引物、Index i7 测序引物、用于测序的Read 1测序引物、HiseqRapid PE Flow Cell、水、以及增强光感度/照相用试剂。

以下结合实施例，对本发明进行进一步详细说明，应当理解，此处所描述的具体实施例是用于解释本发明，并非对本发明的限定。

实施例1

采用本发明的建库方法构建二代测序DNA文库检测AKT1、TP53和PIK3CA 基因突变。

1.1特异引物设计

设计了如下的特异引物(相当于SEQ ID NO:3所示的单链DNA)，其中， AKT1-T219P可用于检测AKT1NM_001014431:c.A655C:p.T219P，TP53-T245P可用于检测TP53NM_001126115:c.A733C:p.T245P，PIK3CA-H047R可用于检测 PIK3CA NM_006218:c.A3140G:p.H1047R。

特异引物序列如下表所示

1.2 DNA提取

选取两份血浆样本，采用磁珠法从2mL血浆中提取的游离DNA样本1和2，并定量取10ng游离DNA建库，分别使用上述特异引物来检测目标序列，对于上述的两个样本，使用不同的Index之外，其他操作全部相同。

5’Adapter：

5'-GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG-3'

3’Index-41引物(对于1)：

5'-CGTGATGT-3'

3’Index-42引物(对于2)：

5'-GTCAGTCG-3'

3’Adapter：

5’-CAAGCAGAAGACGGCATACGAGAT

PCR反应：设置PCR程序如图2所示，反应结束后，及时将样品取出放入 4℃冰箱保存并按要求退出程序或关闭仪器。

1.3 PCR产物的回收纯化

0.9×Ampure磁珠回收纯化反应体系中的PCR产物，溶于30μL EB中。

1.4文库定量

对文库进行2100Bioanalyzer(Agilent)/LabChip GX(Caliper)及QPCR检测，质检合格。

1.5构建好的文库用Illumina HiSeqTM2500进行PE100测序。

1.6最终获得的生物信息学数据如下表所示：

Rawdata：上机测序产出的总数据量；

Q20和Q30:基因高通量测序中，每测一个碱基会给出一个相应的质量值，这个质量值是衡量测序准确度的。行业中Q20与Q30则表示质量值≧20或30 的碱基所占百分比。Q20值是指的测序过程碱基识别(Base Calling)过程中，对所识别的碱基给出的错误概率是1％，即错误率1％，或者正确率是99％； Q30值是指的测序过程碱基识别(Base Calling)过程中，对所识别的碱基给出的错误概率是0.1％，即错误率0.1％，或者正确率是99.9％；

比对率：下机测序数据经低质量过滤后比对到参考基因组上的百分比；

靶向捕获效率：比对到目标区域的数据量除以比对到参考基因组的数据量*100％，或者描述为比对到目标区域的数据量占比对到参考基因组数据量的百分比。

本发明提供的一种DNA二代测序文库构建方法及试剂盒能够方便、快捷进行测序文库构建，并且极大的降低了建库成本和测序成本，同时又能有效去除假阳性、提高目标DNA片段富集效率且减少测序数据浪费。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

虽然在上文中已经参考实施例对本发明进行了描述，然而在不脱离本发明的范围的情况下，可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是，只要不存在结构冲突，本发明所披露的实施例中的各项特征均可通过任意方式相互结合起来使用，在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此，本发明并不局限于文中公开的特定实施例，而是包括落入权利要求的范围内的所有技术方案。

8页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：基于基因捕获技术的测序方法

一种用于二代测序文库构建方法及试剂盒

相关技术

网友询问留言