一种双标签接头设计方法及制备方法

文档序号:1138392 发布日期:2020-10-09 浏览:2次 >En<

阅读说明:本技术 一种双标签接头设计方法及制备方法 (Design method and preparation method of double-label joint ) 是由 郑建超 汪宇盈 羊光辉 叶明芝 于 2019-03-27 设计创作,主要内容包括:本发明公开了一种双标签接头设计方法及制备方法。本发明提供了一种构建待测DNA分子测序文库的试剂盒,包括双样本标签接头;所述双样本标签接头由接头序列L和接头序列S退火形成接头;所述双样本标签接头的一端用于连接待测DNA分子;本发明有以下几种优势:1)通过在紧邻插入DNA片段两端引入新的样本标签,减少测序引物的加入次数,降低测序成本;2)本发明还能够在不增加测序成本的情况下,让单端测序项目实现双样本标签,避免样本标签串扰带来的假阳性问题。这种接头设计方案,可以满足单端测序即可实现双样本标签,可以实现对样本标签串扰产生错误测序数据的过滤。(The invention discloses a design method and a preparation method of a double-label joint. The invention provides a kit for constructing a DNA molecule sequencing library to be detected, which comprises a double-sample label joint; annealing the double-sample label joint by a joint sequence L and a joint sequence S to form a joint; one end of the double-sample label joint is used for connecting a DNA molecule to be detected; the invention has the following advantages: 1) by introducing new sample labels at two ends of the inserted DNA fragment, the adding times of the sequencing primer are reduced, and the sequencing cost is reduced; 2) the invention can also realize double-sample labeling for the single-ended sequencing project under the condition of not increasing the sequencing cost, thereby avoiding the false positive problem caused by sample label crosstalk. The design scheme of the joint can meet the requirement that double-sample labels can be realized by single-ended sequencing, and can realize filtering of wrong sequencing data generated by sample label crosstalk.)

一种双标签接头设计方法及制备方法

技术领域

本发明属于生物技术领域,尤其涉及一种双标签接头设计方法及制备方法。

背景技术

目前高通量测序技术已经成为一种重要的基因检测技术,被广泛应用于科学研究、医学检测、农业育种和司法鉴定等领域。目前主流的高通量测序技术提供商包括美国的Illumina公司、Thermo fisher公司、Pacbio公司、英国的nanopore公司和中国的华大基因(BGI)等。为了降低样本的平均测序成本,大部分情况下,会采用多个样本文库混合上机测序的策略。在文库构建过程中,对每个样本加上样本标签(index),根据样本标签可以将测序数据拆分到每个样本,最终实现测序的高通量和低成本。样本标签技术已经成为高通量测序技术中不可或缺的一部分。

实际应用中经常会遇到样本标签串扰(index-crosstalk或index-switching)问题,即在某个样本标签的数据中能够发现其他样本的数据污染,进而影响测序数据的准确性,比如会造成病原微生物检测和肿瘤低频突变检测出现假阳性结果,会造成RNA定量的结果不准。导致样本标签串扰的主要原因包括文库接头合成污染、建库操作过程中的污染、目标区域捕获pooling中的污染、测序上机前的预扩增污染、测序时错误读取样本标签和两次测序实验中间液流管道的样本残留等。

目前解决样本标签串扰问题的主要方案是采用双标签测序,即在待检测DNA的两端同时引入样本标签,在测序数据分析时,只有两个标签均正确的数据才会进入下一环节的分析。这样可以大幅度降低甚至避免了样本标签串扰问题。

目前双样本标签的文库结构如图1所示,双样本标签和待测DNA的位置之间均有测序引物结合区,Illumina采用该种方案可以实现对样本数据的过滤。文库加载到测序芯片后,先进行read1和index1的一端测序,测序完成后,进行第二端测序模板的复制合成,然后以此为模板,分别加入read2和index2的测序引物,最终实现双样本标签序列的读取。如果两个样本标签不符合实验设计,则对应的测序reads数据应该被删除,最终实现对样本标签串扰数据的过滤。

现有的双样本标签设计方案具有如下不足之处:1)为了实现对双样本标签的数据获取,需要2次加入index测序引物,增加了测序成本;2)由于两个样本标签的测序模板是DNA文库的两条链,所以在进行第二个样本标签测序之前需要进行模板链的合成,导致测序时间增加;3)目前的双样本标签设计方案不能兼容单端测序。

发明内容

为了克服现有双样本标签的缺点,本发明提供了如下技术方案。

本发明提供了一种构建待测DNA分子测序文库的试剂盒,包括双样本标签接头;

所述双样本标签接头由接头序列L和接头序列S退火形成接头;所述双样本标签接头的一端用于连接待测DNA分子;

待测DNA分子两端连接的双样本标签接头相同。

待测DNA分子可为粘末端待测DNA分子或者平末端待测DNA分子,若为平末端待测DNA分子,可通过加A后再连接双样本标签接头。

所述接头序列L从近待测DNA分子端起依次包括与所述接头序列S互补的区域甲和与所述接头序列S不互补的区域丙;

所述区域甲从近待测DNA分子端起依次由第二样本标签序列和用于退火互补的片段乙组成;

所述区域丙上设有建库引物对中引物PF的结合区;

所述接头序列S从近待测DNA分子端起依次包括与所述接头序列L互补的区域丁和与所述接头序列L不互补的区域戊;

所述区域丁从近待测DNA分子端起依次由所述第二样本标签序列的互补序列和所述片段乙的互补序列组成;

所述区域戊从近待测DNA分子端起包括所述建库引物对中引物PR的结合区。

上述试剂盒中,还包括所述建库引物对;

所述建库引物对由所述引物PF和所述引物PR组成;

所述引物PR从5'末端起包括第一样本标签序列和结合所述区域戊的区域。

上述试剂盒中,所述区域戊从近待测DNA分子端起包括第一样本标签序列和所述建库引物对中引物PR的结合区;

所述试剂盒还包括所述建库引物对;

所述建库引物对由所述引物PF和所述引物PR组成;

所述引物PR中含有结合所述区域戊的区域,且不含有所述第一样本标签序列。

上述试剂盒中,所述第二个样本标签序列的长度大于3nt;

或所述第二个样本标签序列的长度为3-10nt。第二个样本标签的长度可以是3个碱基及大于3个碱基以上的任意碱基组合,不推荐10个以上的碱基数,因为会造成较多的数据浪费。

上述试剂盒中,所述双样本标签接头为鼓泡状或Y型结构或可能是其他结构,只要在紧邻***片段DNA两端引入新的样本标签,均属于本发明的保护范围。

在本发明的实施例中为Y型结构,其中2接头序列的互补区为Y型的主干,而非互补区为Y型的分叉区。

所述双样本标签接头的另一端为鼓泡状或游离不互补双链结构;或,所述接头序列L从近待测DNA分子端起最后一个碱基磷酸化修饰。

上述试剂盒中,所述双样本标签接头由序列1所示的接头序列L和序列3所示的接头序列S退火形成;

或所述双样本标签接头由序列2所示的接头序列L和序列4所示的接头序列S退火形成;

或所述建库引物对由序列5所示的引物和序列6或7所示的引物组成。

本发明另一个目的是提供一种用上述试剂盒构建待测DNA分子测序文库的方法。

本发明提供的方法,包括如下步骤:

在建库引入双样本标签时,使所述双样本标签中的第二样本标签序列位于待测DNA分子和测序引物结合区之间;

或,在建库引入双样本标签时,使所述双样本标签中的第二样本标签序列紧邻所述待测DNA分子两端。

上述方法包括如下步骤:

1)上述双样本标签接头和待测DNA分子连接,得到连接产物;

待测DNA分子可为粘末端待测DNA分子或者平末端待测DNA分子,若为平末端待测DNA分子,可通过加A后再连接双样本标签接头;

2)用上述建库引物对扩增所述连接产物,得到待测DNA分子测序文库;所述待测DNA分子测序文库中第二样本标签序列紧邻所述待测DNA分子两端。

上述试剂盒或上述方法在构建待测DNA分子测序文库中的应用也是本发明保护的范围;

或,上述试剂盒或上述方法在待测DNA分子单端测序中的应用也是本发明保护的范围;

或,上述试剂盒或上述方法在待测DNA分子双端测序中的应用也是本发明保护的范围;

或,上述双样本标签接头和其对应的所述建库引物在构建待测DNA分子测序文库中的应用也是本发明保护的范围;

或,上述双样本标签接头和其对应的所述建库引物在待测DNA分子单端测序中的应用也是本发明保护的范围;

或,上述双样本标签接头和其对应的所述建库引物在待测DNA分子双端测序中的应用也是本发明保护的范围。

上述应用中,所述单端测序为无创产前基因测序、病原微生物基因测序或RNA测序。

本发明将采用更低的测序成本和测序时间实现双样本标签的测序,尤其是对于单端测序的项目,比如无创产前基因检测和病原微生物检测等,在不增加测序成本的情况下,实现对样本标签串扰数据的高效过滤。

本发明有以下几种优势:1)通过在紧邻***DNA片段两端引入新的样本标签,减少测序引物的加入次数,降低测序成本;2)本发明还能够在不增加测序成本的情况下,让单端测序项目实现双样本标签,避免样本标签串扰带来的假阳性问题。这种接头设计方案,可以满足单端测序即可实现双样本标签,可以实现对样本标签串扰产生错误测序数据的过滤。

附图说明

图1为常见的双样本标签接头设计方案与测序方法。

图2为本发明双样本标签接头构建文库结果示意图。

图3为本发明所述双样本标签接头设计方案的实现方法。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例1、双样本标签接头的设计及其应用于测序文库构建

一、双样本标签接头

1、双样本标签接头及其建库试剂盒的制备

双样本标签接头中的第二样本标签位于测序引物结合区与***DNA片段中间。

图3A中所示双样本标签接头的结构如下:

双样本标签接头A由接头序列L-A和接头序列S-A退火形成的Y型接头,

双样本标签接头A的一端由接头序列L-A和接头序列S-A的互补区域形成互补平末端或互补粘性末端,另一端由接头序列L-A和接头序列S-A不互补区域形成游离不互补双链;且互补平末端或互补粘性末端用于连接待测DNA分子;互补粘性末端通过T-A连接方式与待测DNA分子连接。

所述接头序列L-A从近待测DNA分子端起依次由与接头序列S-A互补的区域甲-A和与接头序列S-A不互补的区域丙-A组成;

其中所述区域甲-A从近待测DNA分子端起依次由第二样本标签序列和片段乙(大小为7-15nt)组成;

所述区域丙-A上设有建库引物对A中引物PF-A的结合区(在本发明的实施例中,引物PF-A结合区是在区域丙-A上且远离区域甲-A的末端);

所述接头序列L-A从近待测DNA分子端起最后一个碱基磷酸化;

所述第二个样本标签的长度大于3nt,具体为3-10nt。

所述接头序列S-A从近待测DNA分子端起依次由与接头序列L-A互补的区域丁-A和与接头序列L-A不互补的区域戊-A组成;

所述区域丁-A从近待测DNA分子端起依次由第二样本标签序列互补序列和片段乙的互补序列组成;

所述区域戊-A从近待测DNA分子端起依次包括第一样本标签序列和建库引物对A中引物PR-A的结合区(在本发明的实施例中,引物PR-A结合区是在区域戊上且远离区域丁的末端);

第一样本标签序列的长度大于6nt,小于12。

建库引物对A由建库引物PF-A和建库引物PR-A组成。

含有双样本标签接头的建库试剂盒包括双样本标签接头和建库引物对A;

2、双样本标签接头制备

图3B中所示的结构结构如下:

双样本标签接头B由接头序列L-B和接头序列S-B退火形成Y型接头;

双样本标签接头B的一端由接头序列L-B和接头序列S-B的互补区域形成互补平末端或互补粘性末端,另一端由接头序列L-B和接头序列S-B不互补区域形成游离不互补双链;且互补平末端或互补粘性末端用于连接待测DNA分子;

所述接头序列L-B从近待测DNA分子端起依次由与接头序列S-B互补的区域甲-B和与接头序列S-B不互补的区域丙-B组成;

其中所述区域甲-B从近待测DNA分子端起依次由第二样本标签序列和片段乙(大小为7-15nt)组成;

所述区域丙-B上设有建库引物对B中引物PF-B的结合区(在本发明的实施例中,引物PF-B结合区是在区域丙上且远离区域甲的末端);

所述接头序列L-B近待测DNA分子的末端碱基磷酸化;

所述第二个样本标签的长度大于3nt,具体为3-10nt。

所述接头序列S-B从近待测DNA分子端起依次由与接头序列L-B互补的区域丁-B和与接头序列L-A不互补的区域戊-B组成;

所述区域丁-B从近待测DNA分子端起依次由第二样本标签序列互补序列和片段乙的互补序列组成;

所述区域戊-B上设有建库引物对B中引物PR-B的结合区(在本发明的实施例中,引物PR-B结合区是在区域戊-B上且远离区域丁-B的末端),且没有第一样本标签序列。

建库引物对B由建库引物PF-B和建库引物PR-B组成;

所述建库引物PR-B从5'末端起包括第一样本标签序列和结合所述区域戊-B的区域。

第一样本标签序列的长度大于6nt,小于12nt。

本发明双样本标签接头构建文库结果示意图如图2所示。

单端测序的时候,可以先读取***片段前的index2,然后顺次读取***片段的序列(即Reads1),之后加入index1的测序引物进行index1的读取;

双端测序的时候,可以先读取***片段前的index2,然后顺次读取***片段的序列(即Reads1),之后加入index1的测序引物进行index1的读取;再加入reads2的测序引物,同样的,产生的数据中会先出现的是index3的序列信息,然后是***DNA的Reads2的信息。

二、双样本标签接头构建测序文库

1、待测DNA分子的制备

通过PCR的方法制备带有平末端或者粘性末端的待测DNA分子。

2、双样本标签接头连接

1)图3A的方法连接

原理:直接通过一个连接反应,将上述一合成的双样本标签接头与***DNA片段进行连接,直接构建成完整的文库(A中的PCR步骤可省略,可应用于PCR-free,但缺点是接头合成较长较难)。

方案:

将待测DNA分子、双样本标签接头A和T4DNA连接酶进行混合进行连接反应,得到连接产物;

再用建库引物对扩增所述连接产物,得到DNA测序文库。

2)图3B的方法连接

原理:先通过一个连接反应,将新增的位于***DNA片段两端的样本标签加上,然后再通过一个PCR扩增反应,引入常规接头中的样本标签,最终构建出完整的双样本标签文库(B中接头短,容易合成,可以根据实际应用选择后面加上的Index,但缺点是必须要有PCR步骤)。

方案:

将待测DNA分子、双样本标签接头B和T4DNA连接酶进行混合进行连接反应,得到连接产物;

再用建库引物对扩增所述连接产物,得到DNA测序文库。

三、测序

上机测序。

实施例2、双样本标签接头的设计及其应用于测序文库构建

一、构建双样本标签接头

1、构建双样本标签接头序列

根据实施例1的设计方案,设计如下表1所示的构建双样本标签接头B所需的接头序列;

从北京六合华大基因科技有限公司合成表格中的接头序列,纯化方式为C18 DSL,订购量为5OD。

表1构建接头所需的序列及扩增引物信息

接头序列订购后,采用TE缓冲液溶解至100μM的母液。

2、双样本标签接头的制备

分别将Ad01L和Ad01S按照等物质的量混合,用TE缓冲液配制成25μM的接头混合液,室温放置30分钟以上,退火成含有部分双链的Y形结构,命名为Ad01M(双样本标签接头B);

分别将Ad02L和Ad02S按照等物质的量混合,用TE缓冲液配制成25μM的接头混合液,室温放置30分钟以上,退火成含有部分双链的Y形结构,命名为Ad02M(双样本标签接头B)。

二、双样本标签接头构建测序文库

1、待测DNA分子的制备

以λ噬菌体DNA作为模板,设计2对表2所示的PCR引物,进行PCR扩增,得到λP1和λP2(平末端),作为待测DNA分子。

表2标准品的PCR引物

从北京六合华大基因科技有限公司合成表格中的引物,纯化方式为C18 DSL,订购量为5OD。引物订购后,采用TE缓冲液溶解至100μM的母液,再稀释成10μM的工作液。

上述PCR扩增的反应体系和程序如表3所示。

采用rTaqDNA聚合酶(深圳华大智造科技有限公司,01K01201MS)进行PCR扩增,反应体系和条件如表3。

表3为PCR反应体系和程序

对PCR产物进行1.5X的Ampure XP磁珠(Beckman,A63880)纯化,定量稀释到1ng/μL的浓度。

2、双样本标签接头连接

采用KAPA Hyper Prep Kit建库试剂盒(Kapa Biosystems,KR0961)构建文库,具体如下:

1、双样本标签接头连接

纯化后PCR产物λP1和λP2用试剂盒加A后各取10ng,分别加入1μL浓度为10μM的接头Ad01M和Ad02M,为了模拟样本标签串扰,会在Ad01M的连接反应中加人0.01μl的Ad02M,得到接头Ad01M连接产物和接头Ad02M连接产物。

2、建库引物扩增

将表1中的PF分别与PR01和PR02等物质的量混合,用TE缓冲液配制成10μM的引物工作液,分别命名为P01M和P02M,作为文库构建的PCR引物。

用接头Ad01M连接产物为模板,用P01M扩增,得到λP1测序文库。

用接头Ad02M连接产物为模板,用P02M扩增,得到λP2测序文库。

实验设计如表4所示。

表4实施例实验设计

文库名 S1 S2
***DNA λP1 λP2
连接接头 Ad01M Ad02M
混入1%接头 Ad02M Ad01M
PCR引物 P01M P02M

三、测序

采用华大智造的BGISEQ-500测序仪,按照单端测序100碱基的测序模式,每个样本测序1万以上的reads。

对测序产生的reads进行分析统计,如表5所示。统计计算结果显示,本次模拟的1%的样本标签污染率实际检测分别为0.95%和1.37%。在实际样本测试中,只需要对不符合预期的测序数据进行过滤删除(比如表5中的Ad01_P02和Ad02_P01),就可以避免样本标签串扰导致的假阳性问题。即只需要关注两个样本标签完全符合预期的reads。

表5测序reads数目

Figure BDA0002008728740000091

SEQUENCE LISTING

<110>深圳华大基因股份有限公司 深圳华大临床检验中心

<120>一种双标签接头设计方法及制备方法

<160> 7

<170> PatentIn version 3.5

<210> 1

<211> 36

<212> DNA

<213> Artificial sequence

<400> 1

cacgaagtcg gaggccaagc ggtcttagga agacaa 36

<210> 2

<211> 36

<212> DNA

<213> Artificial sequence

<400> 2

gtgcaagtcg gaggccaagc ggtcttagga agacaa 36

<210> 3

<211> 30

<212> DNA

<213> Artificial sequence

<400> 3

gaacgacatg gctacgatcc gacttcgtgt 30

<210> 4

<211> 30

<212> DNA

<213> Artificial sequence

<400> 4

gaacgacatg gctacgatcc gacttgcact 30

<210> 5

<211> 17

<212> DNA

<213> Artificial sequence

<400> 5

gaacgacatg gctacga 17

<210> 6

<211> 45

<212> DNA

<213> Artificial sequence

<400> 6

tgtgagccaa ggagttgatc ggacctattg tcttcctaag accgc 45

<210> 7

<211> 45

<212> DNA

<213> Artificial sequence

<400> 7

tgtgagccaa ggagttggat tccgtccttg tcttcctaag accgc 45

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:哮喘生物标志物KLRC1及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!