一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂

文档序号:1595776 发布日期:2020-01-07 浏览:27次 >En<

阅读说明:本技术 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂 (Ultralow frequency mutation nucleic acid fragment detection method, library construction method, primer design method and reagent ) 是由 陆利 唐薇 朱丽芳 曹曼曼 徐根明 潘艺 赵谦 于 2019-10-14 设计创作,主要内容包括:本发明公开了一种超低频突变核酸片段检测方法、突变核酸片段文库构建方法、引物设计方法和试剂。首先对待检样本的片段化核酸进行末端修复补平加A;进行分子标签接头连接;采用分子标签引物与单分子特异性引物组合,对连接接头产物进行扩增子法靶向富集;最后进行PCR扩增富集。本发明设计的单分子特异性引物使得可利用的有效模板数明显提高、其带有的调节序列可明显降低特异性引物之间形成引物二聚体的概率,还可明显提高模板利用率。本发明超低频突变核酸片段检测方法,使用单侧单引物扩增子法富集和分子标签技术,提高了有效模板利用率,降低了噪音源,降低假阳性,提高了检测的灵敏度和特异性,特别适合痕量超低频突变样本检测。同时本发明还能进行高效文库构建。(The invention discloses an ultralow frequency mutation nucleic acid fragment detection method, a mutation nucleic acid fragment library construction method, a primer design method and a reagent. Firstly, performing end repairing and filling-in addition A on fragmented nucleic acid of a sample to be detected; performing molecular label joint connection; combining a molecular label primer and a single-molecule specific primer to perform targeted enrichment on the connecting joint product by an amplicon method; and finally, carrying out PCR amplification enrichment. The designed single molecule specific primer obviously increases the number of available effective templates, and the regulating sequence can obviously reduce the probability of primer dimer formation between specific primers and also can obviously increase the utilization rate of the templates. The method for detecting the ultralow-frequency mutation nucleic acid fragment improves the utilization rate of an effective template, reduces a noise source, reduces false positive, improves the sensitivity and specificity of detection and is particularly suitable for detecting trace ultralow-frequency mutation samples by using a single-side single-primer amplicon method enrichment and molecular labeling technology. Meanwhile, the invention can also carry out high-efficiency library construction.)

一种超低频突变核酸片段检测方法、文库构建方法、引物设计 方法和试剂

技术领域

本发明属于分子生物学检测技术领域,具体涉及一种超低频突变核酸片段检测方法、突变核酸片段文库构建方法、引物设计方法和试剂。

背景技术

以第二代测序技术(Next Generation Sequencing)为手段检测体细胞突变在肿瘤研究和肿瘤诊断中起到重要作用。而应用到肿瘤罕见突变基因检测、肿瘤突变耐药鉴定、治疗应答效果评估等方面,需要检测到突变频率在0.1%或者更低。由于标准的建库流程采用DNA聚合酶方法引入背景噪音,超低频突变信号会被背景噪音掩盖而难以区分。而主要的噪音源可细分为三部分:第一部分来自于靶向捕获技术;第二部分是在文库扩增富集时由PCR聚合酶产生;最后就是测序仪本身的测序错误;针对前两种噪音源,目前主要是靶向富集技术降噪。现在流行的靶向富集技术主要有两种:一种是扩增子,一种是杂交捕获;杂交捕获存在两个明显的弊端,1)实验操作繁琐,流程比较长,2)探针杂交过程会对DNA造成损伤,导致碱基突变,噪音升高。而扩增子技术无杂交过程,不会产生额外的噪音,操作简单,流程便捷。

传统的扩增子富集技术是基于双侧富集,存在cfDNA模板丢失问题,痕量的ctDNA趁机溜走。而单侧富集技术能有效的解决上述问题,目前主要的单侧富集技术有两种,一种为单侧富集-链成环(背靠背引物)模式;一种单侧富集-巢式PCR引物(巢式PCR引物)模式;而单测富集-链成环模式无单分子标签技术降噪,单测富集-巢式PCR引物模式采用双引物导致引物3’端与待检位点必须保留一定距离,进而也会存在少量模板丢失,因此均严重影响检测限。而本发明中首次采用了单侧富集-单分子特异性引物(单引物)模式进行扩增子富集技术(如图1所述);扩大引物的适用范围、增加有效模板使用量,特别是大大提高检测低频突变样本的检测限。其次,本发明中单分子特异性引物由特异性序列、调节序列和测序序列组成,特异性序列和调节序列的组合可有效提供多重PCR的特异性和引物利用率。再次,本发明提供的YEA和YLA反应液,优化了建库流程,实现了扩增子富集之前无需进行预扩增(PCR-Free技术),降低了因PCR扩增引入错误概率。最后,本发明中提供带单分子标签接头技术,可进一步纠正建库和测序引物的错误。

发明内容

本发明的首要目的是提供一种超低频基因突变检测用单分子特异性引物设计方法。申请人经过前期大量探索和验证总结出该方法,利用该方法设计合成的单分子特异性引物可有效提高多重PCR的特异性和模板利用率。

所述的超低频突变核酸片段检测用单分子特异性引物设计方法,包括两种方式:只含有靶向序列和测序引物序列,所述的靶向序列为与待测突变区域上游或者下游特异性互补的序列,进而得到上游单分子特异性引物或者下游单分子特异性引物。或者除了靶向序列和测序引物序列,还包括调节序列,调节序列使靶向序列分成靶向上游序列和靶向下游序列两部分。优选含有调节序列的设计方式。

靶向序列在单分子特异性引物的3’端,测序引物序列在单分子特异性引物的5’端。

进一步的,上述设计方法中,所述的靶向序列要满足的条件具体包括:

1)靶向序列长度为20-100碱基对;

2)靶向序列的退火温度为50-80℃;

3)靶向序列的3’端碱基为C或G。

进一步的,上述设计方法中,所述的调节序列要满足的条件具体包括:

1)调节序列由4-30碱基对组成;

2)调节序列的碱基由天然碱基,或非天然碱基,或天然碱基与非天然碱基组成;

3)调节序列的3’端与靶向下游序列的3’端的距离为10-30碱基对。

所述的调节序列可明显降低特异性引物之间形成引物二聚体的概率,可明显提高引物利用率。

进一步的,上述设计方法中需要满足:所述的单分子特异性引物的3’端距离待测突变位点或区域1-30个碱基对。

本发明的第二个目的是提供一种超低频突变核酸片段检测方法,以解决现有检测技术捕获DNA片段特异性低、检测超低频基因准确性低的技术问题。

所述的超低频突变核酸片段检测方法,包括以下步骤:

(1)由上述的方法设计得到上游单分子特异性引物和下游单分子特异性引物;

(2)对待检DNA样本的片段化核酸进行末端修复补平加A;

(3)对末端修复补平加A的片段化核酸进行分子标签接头连接;

(4)采用分子标签引物分别与上游单分子特异性引物和下游单分子特异性引物组合,对连接接头产物进行扩增子法靶向富集;所述的上游单分子特异性引物为单条引物,或者是根据两个以上突变区域上游设计的引物集,所述的下游单分子特异性引物为单条引物,或者是根据两个以上突变区域下游设计的引物集;

(5)对扩增子法靶向富集产物进行PCR富集;对PCR富集产物检测。

进一步的,所述的超低频突变核酸片段检测方法,步骤(3)所述的分子标签接头为完全或部分互补的双链;分子标签接头包括分子标签序列和测序引物序列;分子标签序列由8-12个随机核苷酸组成。

进一步的,所述的超低频突变核酸片段检测方法,还包括以下任意一种或几种处理方式:

A,步骤(2)和(3)两步反应合并成一步反应同时进行;即对片段化核酸进行末端修复补平加A和分子标签接头连接的操作在同一反应体系中完成;

B,在步骤(3)后,对链接接头后的反应产物进行纯化,除去过量的接头;

C,在步骤(4)后,对上游单分子特异性引物富集产物和下游单分子特异性引物富集产物进行纯化,以除去过量的上游单分子特异性引物、下游单分子特异性引物和分子标签引物。

进一步的,所述的超低频突变核酸片段检测方法,还包括以下任意一种或几种的处理方式:

a,对纯化后的链接了接头的反应产物进行预扩增,然后进行扩增子法靶向富集;

b,步骤4)和5)两步富集合并成一步PCR反应富集。

进一步的,所述的预扩增包括:先采用分子标签引物与通用引物组合进行预扩增,然后采用单分子特异性引物与通用引物组合进行扩增子法靶向富集,或者先采用通用引物组合进行预扩增,然后采用单分子特异性引物与分子标签引物组合进行扩增子法靶向富集。

进一步的,所述的超低频突变核酸片段检测方法,所述的超低频突变包括点突变、缺失***、基因扩增、基因甲基化,基因融合中的一种或多种。

进一步的,检测融合基因时,采用分子标签引物与上游单分子特异性引物或下游单分子特异性引物组合,进行扩增子法靶向富集和PCR反应富集。

进一步的,当确定基因融合发生在已知区域内,需要检测基因融合在该区域内的具***点时,在该区域依次间隔30-50bp设计引物集,进行扩增子法靶向富集和PCR反应富集。

进一步的,所述的超低频突变核酸片段检测方法,核酸片段包括DNA或RNA,可以是完整或碎片化形式。

进一步的,完整的DNA或RNA末端修复补平前均需片段化处理。RNA需要转换成cDNA处理。

进一步的,核酸片段来源包括动物、植物或微生物。

进一步的,核酸来源包括血浆、尿液、汗液、唾液、***、胸水、腹水、粪便、化石、石蜡包埋(FFPE)或刑侦样本。

本发明的第三个目的是提供一种超低频突变核酸片段文库构建方法,以解决现有检测技术捕获DNA片段特异性低、建库过程中引入错误突变、检测超低频基因准确性低的技术问题。

所述的超低频突变核酸片段文库构建方法,其流程与本发明所述的超低频突变核酸片段检测方法的步骤基本一致,区别在于仅在于将上述检测方法中最后步骤5)获得的PCR扩增产物进行文库构建。

本发明的第四个目的是提供与本发明超低频突变核酸片段检测方法配套的试剂盒。该试剂盒包括:对片段化核酸进行末端修复补平加A的试剂、对核酸进行分子标签接头连接的反应试剂、设计得到的超低频基因突变检测用单分子特异性引物。

本发明第五个目的是提供超低频突变核酸片段文库构建方法配套的试剂盒。该试剂盒包括:对片段化核酸进行末端修复补平加A的试剂、对核酸进行分子标签接头连接的反应试剂、设计得到的超低频基因突变检测用单分子特异性引物。

进一步的,所述的对核酸进行分子标签接头连接的反应试剂中含有分子标签接头,所述的分子标签接头包括单链接头、鼓泡状双链接头、‘Y’型接头或非正规的Y’型接头。

进一步的,所述的超低频突变核酸片段文库构建方法配套的试剂盒,还包括三条通用引物,即一条分子标签引物和二条测序通用引物;所述的分子标签引物是用于区分不同样本。

本发明的第六个目的是提供一种对片段化核酸进行末端修复补平加A的试剂,在本发明中称作YEA反应液。本发明提供的YEA反应液,优化了建库流程,实现了扩增子富集之前无需进行预扩增(PCR-Free技术),降低了因PCR扩增引入错误概率。

所述的YEA反应液包括:反应活性剂、反应酶和反应稳定剂;配制1L的YEA反应液,以下每种组分的浓度均是在整个试剂体系中的浓度:

反应活性剂包括:5-500mM pH 8.0的Tris-HCl、50-1000mM NaCl、50-200nMdNTPs、0.5-4mM ATP、1-100mM DTT、50-250mM MgCl2;其中的百分比以无菌水体积为计算基准;

反应酶为具有5’-3’DNA聚合酶活性、5’-3’外切酶活性与3’-5’外切酶活性以及产物3’端加碱基A的功能酶组成的酶混合物;优选包括:1-50U的Taq DNA聚合酶、10-50U的3’-5’exo klenow片段、2-100U的T4DNA聚合酶;

反应稳定剂为稳定酶活性的试剂;优选包括:0.05-1%Tween 20、1-50%甘油、20-100μg/mL BSA,0.02-0.1%Triton X-100,0.1-1%β-巯基乙醇,其中的百分比以无菌水体积为计算基准。

本发明的第七个目的是提供一种对核酸进行分子标签接头连接的反应试剂,在本发明中称作YLA反应液。本发明提供的YLA反应液,优化了建库流程,实现了扩增子富集之前无需进行预扩增(PCR-Free技术),降低了因PCR扩增引入错误概率。

进一步的,所述的YLA反应液包括:连接增强剂、高效连接酶、分子标签接头;配制1L的YLA反应液,以下每种组分的浓度均是在整个试剂体系中的浓度:

连接增强剂包括1-4mM ATP、1-100mM NAD+、1-200mM DTT、0.05-1%Tween 20、5-50%PEG聚合物(包括PEG4000、PEG6000、PEG8000中的一种或几种),其中的百分比以无菌水体积为计算基准;

高效连接酶为催化粘端或平端双链或单链DNA或RNA的5’-P末端和3’-OH末端之间以磷酸二酯键结合的连接酶;高效连接酶由一种或多种连接酶组成;

优选高效连接酶包括:500-2000U T4-DNA连接酶、50-500U Taq DNA连接酶和1-500U E·coli DNA连接酶;

所述的分子标签接头为完全或部分互补的双链;分子标签接头包括分子标签序列和测序引物序列。

图2为本发明突变位点检测原理。其中,

Figure BDA0002232081160000051

表示待检测点突变、***、缺失、甲基化等;d为单分子特异性引物,既可以位于待检测位点的上游也可以带测位点的下游;P5、P7和分子标签引物为通用引物;C为分子标签接头,包括测序序列和分子标签序列,分子标签序列由8-12随机碱基组成。

图3为本发明的建库流程的几种变形,具体包括如下几种形式:

1号流程包括:预文库扩增+单侧单引物PCR扩增富集+通用PCR扩增富集;

2号流程包括:单侧单引物PCR扩增富集+通用PCR扩增富集,但之前扩增富集之前无需预文库扩增;

3号流程包括:预文库扩增+单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR;

4号流程包括:单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR,但之前扩增富集之前无需预文库扩增。

其中4号流程为本发明的经典建库流程。

本发明设计的单分子特异性引物使得可利用的有效模板数明显提高、其带有的调节序列可明显降低特异性引物之间形成引物二聚体的概率,还可明显提高模板利用率。

本发明使用带分子标签的接头可纠错检测流程引入的噪音。

本发明超低频突变核酸片段检测方法,使用单侧单引物扩增子法富集和分子标签技术,提高了有效模板利用率,降低了噪音源,降低假阳性,提高了检测的灵敏度和特异性,特别适合痕量超低频突变样本检测。

本发明超低频突变核酸片段文库构建方法,除了具有上述检测方法的优势外,还能避免在建库过程中引入错误突变。

本发明的优势还在于:

1、实现了一步法文库构建,减低了模板损失、减少了操作步骤,降低了检测成本,缩短了检测周期;

2、既可适用于以DNA为模板检测,也适用于以RNA为模板检测。

本发明的高通量文库构建方法,可以用于Roche、Illumina、ThermoFisher、Pacific Biosciences、华大基因、Oxford Nanopore Technologies、华因康、瀚海基因等高通量测序平台。

附图说明

图1为本发明扩增子富集捕获原理与现有技术中其他富集捕获方法原理的比较。

图2为本发明突变位点检测原理。

图3为本发明的建库流程的几种变形;

1号流程包括:预文库扩增+单侧单引物PCR扩增富集+通用PCR扩增富集;

2号流程包括:单侧单引物PCR扩增富集+通用PCR扩增富集,但之前扩增富集之前无需预文库扩增;

3号流程包括:预文库扩增+单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR;

4号流程包括:单侧单引物PCR扩增富集与通用PCR扩增富集两步合并的一步PCR,但之前扩增富集之前无需预文库扩增。

图4为实施例1的文库电泳检测分析结果。

注:M:100bp DNA ladder(宝生物工程(大连)有限公司);

1:1号样本PCR反应管1的文库

2:1号样本PCR反应管2的文库

3:2号样本PCR反应管1的文库

4:2号样本PCR反应管2的文库。

图5为实施例2的文库电泳检测分析结果;

注:M:100bp DNA ladder(宝生物工程(大连)有限公司);

1:超低频突变DNA片段文库构建方法的文库。

图6为实施例3的文库电泳检测分析结果;

注:M:100bp DNA ladder(宝生物工程(大连)有限公司);

1:1号样本PCR反应管1的文库

2:1号样本PCR反应管2的文库

3:2号样本PCR反应管1的文库

4:2号样本PCR反应管2的文库

5:3号样本PCR反应管1的文库

6:3号样本PCR反应管2的文库。

图7为实施例4的文库电泳检测分析结果;

注:M:100bp DNA ladder(宝生物工程(大连)有限公司);

1:RNA文库构建方法的文库。

图8为实施例5的文库电泳检测分析结果;

注:M:100bp DNA ladder(宝生物工程(大连)有限公司);

1:total RNA一步法文库构建的文库。

图9为EML4-ALK基因融合检测原理图;

图10为实施例6的文库电泳检测分析结果;

注:M:100bp DNA ladder(宝生物工程(大连)有限公司);

1:FP001号样本PCR反应管1的文库

2:FP001号样本PCR反应管2的文库

3:FP002号样本PCR反应管1的文库

4:FP002号样本PCR反应管2的文库

5:FP003号样本PCR反应管1的文库

6:FP003号样本PCR反应管2的文库。

具体实施方式

以Illumina平台为例,结合实施例对本发明进一步说明,而非形成对本发明的限制。

实施例1微量碎片化DNA EGFR基因突变检测

1.1接头设计

Top-Adaptor:

5’-P-ACGTCACGCAGGGGAGAGCCAGGGATGACTAGG-3',见SEQ ID NO.1。

P表示磷酸化修饰。

Bottom-Adapter:

5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNCCCTGCGTGACGT*Y-3’,见SEQID NO.2。*代表硫代修饰,Y代表简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。

以上序列需退火成双链。

EGFR基因:(下面的EXON18、EXON19、EXON20、EXON21是EGFR基因的4个外显子上游内含子部分序列、外显子序列、下游部分内含子序列)

EXON18

CAAGTGCCGTGTCCTGGCACCCAAGCCCATGCCGTGGCTGCTGGTCCCCCTGCTGGGCCATGTCTGGCACTGCTTTCCAGCATGGTGAGGGCTGAGGTGACCCTTGTCTCTGTGTTCTTGTCCCCCCCAGCTTGTGGAGCCTCTTACACCCAGTGGAGAAGCTCCCAACCAAGCTCTCTTGAGGATCTTGAAGGAAACTGAATTCAAAAAGATCAAAGTGCTG[GG]CTCCGGTGCGTTCGGCACGGTGTATAAGGTAAGGTCCCTGGCACAGGCCTCTGGGCTGGGCCGCAGGGCCTCTCATGGTCTGGTGGGGAGCCCAGAGTCCTTGCAAGCTGTATATTTCCATCATCTACTTTACTCTTTGTTTCACTGAGTGTTTGG,见SEQ ID NO.3。

[]表示检测关注的突变位点

即EGFR基因表达的第719位的氨基酸G突变成S或C,碱基G突变成A或T;第719位的氨基酸G突变成A,碱基G突变成C。

上游单分子特异性引物

EGFR-E18

U:5’-AGATGTGTATAAGAGACAGGCTCCCAACCAAGCTCTCTTGAGGATCTTG-3’,见SEQ IDNO.4。

下游单分子特异性引物

D:5’-AGATGTGTATAAGAGACAGGGACCTTACCTTATACACCGTGCCGAACGC-3’,见SEQ IDNO.5。

EXON19

GCAATATCAGCCTTAGGTGCGGCTCCACAGCCCCAGTGTCCCTCACCTTCGGGGTGCATCGCTGGTAACATCCACCCAGATCACTGGGCAGCATGTGGCACCATCTCACAATTGCCAGTTAACGTCTTCCTTCTCTCTCTGTCATAGGGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAA[G][G]AAT[T]AAGAGAAGCAACATCTCCGAAAGCCAACAAGGAAATCCTCGATGTGAGTTTCTGCTTTGCTGTGTGGGGGTCCATGGCTCTGAACCTCAGGCCCACCTTTTCTCATGTCTGGCAGCTGCTCTGCTCTAGACCCTGCTCATCTCCACATCCTAAATGTTCACTTTCTATG,见SEQ ID NO.6。

[]表示检测关注的突变位点

即EGFR基因中从第2235-2249位碱基缺失(关注的第一个碱基G开始缺失),2236-2250位碱基缺失(关注的第二个碱基G开始缺失),2240-2257为碱基缺失(关注的第三个碱基T开始缺失)。

上游单分子特异性引物

EGFR-E19

U:5’-AGATGTGTATAAGAGACAGCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATC-3’,见SEQID NO.7;下游单分子特异性引物

D:5’-AGATGTGTATAAGAGACAGCCACACAGCAAAGCAGAAACTCACATCGAGG-3’,见SEQ IDNO.8。

EXON20

CCATGAGTACGTATTTTGAAACTCAAGATCGCATTCATGCGTCTTCACCTGGAAGGGGTCCATGTGCCCCTCCTTCTGGCCACCATGCGAAGCCACACTGACGTGCCTCTCCCTCCCTCCAGGAAGCCTACGTGATGGCCA[G]CGT[GG]A[CA]ACCCCCAC[GT]GTGCCGCCTGCTGGGCATCTGCCTCACCTCCACCGTGCAGCTCATCA[C]GCAGCTC[AT]GCCCTTCGGCTGCCTCCTGGACTATGTCCGGGAACACAAAGACAATATTGGCTCCCAGTACCTGCTCAACTGGTGTGTGCAGATCGCAAAGGTAATCAGGGAAGGGAGATACGGGGAGGGGAGATAAGGAGCCAGGATCCTCACATGCGGTCTGCGCTCCTGGGATAGCAAGAGTTTGCCATGGGGATATG,见SEQ ID NO,9。

[]表示检测关注的突变位点

即EGFR基因表达的第768位氨基酸S突变为I,碱基G突变成T;

EGFR基因表达的第769位氨基酸V和第770位氨基酸D之间***三个氨基酸ASV;第2307-2308位碱基之间***GCCAGCGTG;

EGFR基因表达的第770位氨基酸D和第771位氨基酸N之间***氨基酸G;第2310-2311位碱基之间***GGT;

EGFR基因表达的第773位氨基酸H和第774位氨基酸V之间***氨基酸H;第2319-2320位碱基之间***CAC;

EGFR基因表达的第790位氨基酸T突变为M,碱基C突变为T。

单分子特异性上游引物

EGFR-E20U-1:5’-AGATGTGTATAAGAGACAGACCATGCGAAGCCACACTGACGTGCCTCTC-3’,见SEQ ID NO.10。

EGFR-E20U-2:5’-AGATGTGTATAAGAGACAGGCATCTGCCTCACCTCCACCGTGCAGCTC-3’,见SEQ ID NO.11。

单分子特异性下游引物

EGFR-E20D-1:5’-AGATGTGTATAAGAGACAGATTGTCTTTGTGTTCCCGGACATAGTCCAGG-3’,见SEQ ID NO.12。

EGFR-E20D-2:5’-AGATGTGTATAAGAGACAGATGAGCTGCGTGATGAGCTGCACGGTGGAG-3’,见SEQ ID NO.13。

EXON21

TCTGTTTCAGGGCATGAACTACTTGGAGGACCGTCGCTTGGTGCACCGCGACCTGGCAGCCAGGAACGTACTGGTGAAAACACCGCAGCATGTCAAGATCACAGATTTTGGGC[T]GGCCAAAC[T]GCTGGGTGCGGAAGAGAAAGAATACCATGCAGAAGGAGGCAAAGTAAGGAGGTGGCTTTAGGTCAGCCAGCATTTTCCTGACACCAGGGACCAGGCTGCCTTCCCACTAGCTGTAT,见SEQ ID NO.14。

[]表示检测关注的突变位点

即EGFR基因表达的第858位氨基酸L突变成R,碱基T突变为G;第861位氨基酸L突变成Q,碱基T突变为A。

EGFR-E21U:5’-AGATGTGTATAAGAGACAGGGAACGTACTGGTGAAAACACCGCAGCATGTC-3’,见SEQ ID NO.15。

EGFR-E21D:5’-AGATGTGTATAAGAGACAGGCCTCCTTCTGCATGGTATTCTTTCTCTTCCG-3’,见SEQ ID NO.16。

预扩增用通用引物(Pre-lib-primer):

5'-CCTAGTCATCCCTGGCTCTC-3’,见SEQ ID NO.17。

分子标签引物(TS-Index primer):

5'-CAAGCAGAAGACGGCATACGAGAT[Index-7]GTGACTGGAGTTCAGACGTGT-3',见SEQ IDNO.18。

[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。

通用PCR富集引物

P7引物序列为:

5’-CAAGCAGAAGACGGCATACGAGAT-3’,见SEQ ID NO.19,

TN5-UNI-BLK序列为:

5'-AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAG-3',见SEQ ID NO.20。

1.2实验步骤

取2例样本(一例正常人和一例已知突变位点和频率的阳性样本)分别获得4ml血浆,将4ml血浆等体积分成两组,一组用本发明的检测方法进行建库检测,称为实验组;一组采用EGFR/ALK/BRAF/KRAS基因突变联合检测试剂盒(cat.广州燃石生物科技有限公司)使用说明书进行建库检测,样本编号为DD01、DD02。

1.2.1 ctDNA的提取

取1例2ml正常人血浆和1例2ml已知突变频率为0.01%T790M突变的阳性患者血浆样本,分别命名为CT01、CT02;按照MagMAXTMCell Free DNA Isolation Kit(ThermoFisherCat.A29319)说明书操作,提取游离DNA,包括以下步骤:

a)样本裂解

b)磁珠结合

c)磁珠洗涤

d)洗脱

e)定量

1.2.2微量碎片化DNA末端修复补平添加碱基A(本发明称作YEA反应)

使用本发明的YEA反应液(10mM Tris-HCl(pH 8.0)、50mM NaCl、50nM dNTPs、0.5mM ATP、0.05%Tween 20、20mM DTT、10U klenow片段(3’-5’exo)、20UT4DNAPolymerase、5%甘油、20μg/mL BSA,0.02%Triton X-100,0.1%β-巯基乙醇,50mM氯化镁和40U Taq DNA聚合酶),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,

组分 用量
YEA反应液 10μL
游离DNA(0.05ng/μL) 10μL
双蒸水 补足至50μL
Total体积 50μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

37℃15min

72℃30min

4℃forever。

1.2.3接头连接(本发明称作YLA反应)

将YEA反应产物从热循环仪上取下置于室温冷却,将YLA反应液(1mM ATP、20mMNAD+、5mM DTT、0.05%Tween 20、5%PEG-6000、2000U T4-DNA连接酶)按照下表配置反应体系:

组分 用量
YLA反应液 46μL
YEA反应产物 50μL
接头(5μM) 4μL
Total体积 100μL

涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

20℃15min

65℃10min。

1.2.4纯化

将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,25μL ElutionBuffer洗脱。

1.2.5预扩增

将1.2.4纯化产物按照下表配制PCR反应体系:

组份 用量
2x KAPA HiFiHostart buffer 25μL
Pre-lib-primer(15μM) 1μL
Ts-index primer(15μM) 1μL
纯化产物(0.02ng/μL) 23μL

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000121

1.2.6预扩增产物纯化

使用60μLAmpure XP beads进行纯化,纯化产物50μL Elution Buffer洗脱。

1.2.7扩增子靶向富集

将所有EGFR上游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;获得上游单分子特异性引物集(U)和下游单分子特异性引物集(D)分成两管进行扩增子富集。分别命名PCR反应管1和PCR反应管2;分别按照下表配置PCR反应体系:

PCR反应管1(U)

组分 用量
Gold 360 master Mix(2x) 25μL
预扩增反应产物 23μL
上游单分子特异性引物集(U) 0.2μL
P7引物(10μM) 1μL

PCR反应管2(D)

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000132

1.2.8纯化

将反应管1和反应管2从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

1.2.9 PCR扩增富集

将反应管1和反应管2纯化产物分别按照下表配制PCR反应体系:

组份 用量
2x KAPA HiFiHostart buffer 25μL
TN5-UNI-BLK(15μM) 1μL
P7引物(15μM) 1μL
反应管1或2纯化产物 23μL

按照下表,执行PCR扩增程序:

1.2.10 PCR产物纯化

使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

1.2.11 qPCR质检及上机测序

按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。

1.2.12上机测序

按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。

1.3实验结果

1.3.1文库电泳检测分析结果

根据电泳分析结果(图4),文库主带清楚且主要分布在300bp左右,条带亮度明亮,与预期结果一致。

1.3.2qPCR定量分析结果

qPCR检测结果如下:

样品 qPCR浓度(nM)
1号样本反应管1文库 113.6
1号样本反应管2文库 109.8
2号样本反应管1文库 168.5
2号样本反应管2文库 177.5

建库文库达到上机要求浓度,可用于上机测试。

1.3.3上机质控数据

将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性。

分析结果如下:

Figure BDA0002232081160000151

1.3.4检测突变结果

将质控mapped比后的数据进行突变点分析,检测结果如下表:

Figure BDA0002232081160000152

实施例2BRAF基因靶向测序

2.1接头设计

Top-Adaptor:

5’P-ACGTCACGCAGGGNNNNNNNNAGATGTGTATAAGAGACAG-3’,见SEQ ID NO.21,

P表示磷酸化修饰。

Bottom-Adapter:

5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNCCCTGCGTGACGTT-3’,见SEQID NO.22。以上序列需退火成双链,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。

BRAF 11号外显子序列如下:

AAAACACTTGGTAGACGGGACTCGAGTGATGATTGGGAGATTCCTGATGGGCAGATTACAGTGGGACAAAGAATTG[G]ATCTGGATCATTT[GGA]ACAGTCT[A]CAAGGGAAAGTGGCATG,见SEQ ID NO.23,

BRAF 11号外显子及其上下游内含子序列如下:

CCTGTATCCCTCTCAGGCATAAGGTAATGTACTTAGGGTGAAACATAAGGTTTTCTTTTTCTGTTTGGCTTGACTTGACTTTTTTACTGTTTTTATCAAGAAAACACTTGGTAGACGGGACTCGAGTGATGATTGGGAGATTCCTGATGGGCAGATTACAGTGGGACAAAGAATTG[G]ATCTGGATCATTT[GGA]ACAGTCT[A]CAAGGGAAAGTGGCATGGTAAGTATGTAATGTGGTGACATTGTGACAAGTCATAATAGGATATGTTTAACAACTTTTATTTTGTAAAAAATATCATCAAAGGAAATATTCACTGTTC,见SEQ ID NO.24。

[]表示检测关注的突变位点

BRAF基因表达的第466位氨基酸G突变成V,第1397位碱基G突变成T;

BRAF基因表达的第469位氨基酸G突变成A,第1406位碱基G突变成C;

BRAF基因表达的第469位氨基酸G突变成L,第1405-1406位碱基GG替换为TT;

BRAF基因表达的第472位氨基酸Y突变成C,第1415位碱基A突变成G。

上游单分子特异性引物:

BRAF-E11

U:

5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGAGATTCCTGATGGGCIIIIIIIIAGATTACAGTGGGACAAAG-3’,见SEQ ID NO.25,

下游单分子特异性引物:

D:

5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTACCACATTACATACTTAIIIIIIIICCATGCCACTTTCCC-3’,见SEQ ID NO.26,

其中I为非天然产物碱基,为次黄嘌呤碱基,用于调节减少引物之间形成dimer。

BRAF 15号外显子序列:

ATATATTTCTTCATGAAGACCTCACAGTAAAAATAGGTGATTTTGGT[C]TAGCTACA

G[T]GAAATCTCGATGGAGTGGGTCCCATCAGTTTGAACAGTTGTCTGGATCCATTTT

GTGGATG,见SEQ ID NO.27,

BRAF 15号外显子及其上下游内含子序列如下:

ACAGAATTATAGAAATTAGATCTCTTACCTAAACTCTTCATAATGCTTGCTCTGATAG

GAAAATGAGATCTACTGTTTTCCTTTACTTACTACACCTCAGATATATTTCTTCATGA

AGACCTCACAGTAAAAATAGGTGATTTTGGT[C]TAGCTACAG[T]GAAATCTCGATGGA

GTGGGTCCCATCAGTTTGAACAGTTGTCTGGATCCATTTTGTGGATGGTAAGAATTG

AGGCTATTTTTCCACTGATTAAATTTTTGGCCCTGAGATGCTGCTGAGTTACTAGAA

AGTCATTGAAGGTCTCAACTATAGTATTTTCAT,见SEQ ID NO.28。

[]表示检测关注的突变位点

BRAF基因表达的第597位氨基酸L突变为V,第1789位碱基C突变成G;

BRAF基因表达的第600位氨基酸V突变为E,第1799位碱基T突变成A。

上游单分子特异性引物:

BRAF-E15

U:

5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTCTTCATGAAGACCTCACAGTAAIIIIIIIIAAATAGGTGATTTTGG-3’,见SEQ ID NO.29,

下游单分子特异性引物:

D:

5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCCAGACAACTGTTCAIIIIIIIIAACTGATGGGACCCACTCCATCAG-3’,见SEQ ID NO.30,

其中I为非天然产物碱基,为次黄嘌呤碱基,用于调节减少引物之间形成dimer。

通用引物序列如下:

P5引物:

5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGA-3’,见SEQ ID NO.31,

分子标签引物:

5’-CGGCATACGAGAT-[Index-7]-GTGACTGGAGTTC-3’,见SEQ ID NO.32。

[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。

P7引物:

5’-CAAGCAGAAGACGGCATACGAGAT-3’,见SEQ ID NO.19。

2.2实验步骤

2.2.1核酸提取

取200μL正常人全血样本,按照全血基因组DNA提供试剂盒说明书操作,提取基因组DNA,包括以下步骤:

a)样本裂解

b)磁珠结合

c)磁珠洗涤

d)洗脱

2.2.2核酸片段化处理

采用超声或酶切方法对基因组DNA进行片段化处理。按照片段大小回收需求片段化DNA。

2.2.3末端修复补平添加碱基A(本发明称作YEA反应)

使用本发明的YEA反应液(同实施例1),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,

Figure BDA0002232081160000181

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

37℃15min

72℃30min

4℃forever。

2.2.3接头连接(本发明称作YLA反应)

YLA反应液体系见实施例1部分,将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:

组分 用量
YLA反应液 46μL
YEA反应产物 50μL
接头(5uM) 4μL
Total体积 100μL

涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

20℃15min

65℃10min。

2.2.4纯化

将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱

2.2.5单侧单引物扩增子富集

将所有上游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM;获得上游单分子特异性引物集(U)和下游单分子特异性引物集(D)分成两管进行扩增子富集。分别命名PCR反应管1和PCR反应管2;分别按照下表配置PCR反应体系:

PCR反应管1(U)

组分 用量
Gold 360 master Mix(2x) 25μL
YLA反应产物 23μL
上游单分子特异性引物集(U) 1μL
分子标签引物(10uM) 1μL

PCR反应管2(D)

组分 用量
Gold 360 master Mix(2x) 25μL
YLA反应产物 23μL
下游单分子特异性引物集(D) 1μL
分子标签引物(10uM) 1μL

涡旋振荡混匀,瞬时离心,,置于热循环仪上按照下列程序进行孵育:

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000191

2.2.6纯化

将反应管1和反应管2从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱。

2.2.7PCR扩增富集

将反应管1和反应管2纯化产物按照等体积合并混匀,按照下表配制PCR反应体系:

组份 用量
2x KAPA HiFiHostart buffer 25μL
P5引物(20uM) 1μL
P7引物(20uM) 1μL
纯化产物 23μL

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000201

2.2.8 PCR产物纯化

使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

2.2.9 qPCR质检

按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。

2.2.10上机测序

按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。

2.3实验结果:

2.3.1文库电泳检测分析结果

根据电泳分析结果(图5),文库主带清楚且主要分布在300bp左右,条带亮度明亮,与预期结果一致。

2.3.2qPCR定量分析结果

qPCR检测结果如下:

样品 1
qPCR浓度(nM) 108.04

建库文库达到上机要求浓度,可用于上机测试。

2.3.3上机质控数据

将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果如下:

Figure BDA0002232081160000211

实施例3超低起始量cf-DNA基因检测一步法文库构建

3.1接头引物设计

3.1.1接头设计

Top-Adaptor:

5’-P-ACGTCACGCAGGGNNNNNNNNAGATGTGTATAAGAGACAG-3’,见SEQ ID NO.33,

P代表磷酸化修饰。

Bottom-Adapter:

5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNCCCTGCGTGACGT*Y-3’,见SEQID NO.34,*Y代表硫代修饰的简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。

以上序列需退火成双链。

针对KRAS基因2号外显子G12R位点设计

KRAS 2号外显子序列如下:

ATGACTGAATATAAACTTGTGGTAGTTGGAGCT[GG]T[GG]CGTAGGCAAGAGTGCCTTGACGATACAGCTAATTCAGAATCATTTTGTGGACGAATATGATCCAACAATAGAG,见SEQ ID NO.35,

KRAS 2号外显子及上下游内含子序列如下:

AATTTTGTAAGGTATTTTGAAATAATTTTTCATATAAAGGTGAGTTTGTATTAAAAGGTACTGGTGGAGTATTTGATAGTGTATTAACCTTATGTGTGACATGTTCTAATATAGTCACATTTTCATTATTTTTATTATAAGGCCTGCTGAAAATGACTGAATATAAACTTGTGGTAGTTGGAGCT[GG]T[GG]CGTAGGCAAGAGTGCCTTGACGATACAGCTAATTCAGAATCATTTTGTGGACGAATATGATCCAACAATAGAGGTAAATCTTGTTTTAATATGCATATTACTGGTGCAGGACCATTCTTTGATACAGATAAAGGTTTCTCTGACCATTTTCATGAGTACTTATTACAAGATAATTATGCTGAAAGTTAAGTTA,见SEQ ID NO.36。

[]表示检测关注的突变位点

KRAS基因表达的第12位氨基酸G突变成C,第34位碱基G突变成T;

KRAS基因表达的第12位氨基酸G突变成R,第34位碱基G突变成C;

KRAS基因表达的第12位氨基酸G突变成S,第34位碱基G突变成A;

KRAS基因表达的第12位氨基酸G突变成A,第35位碱基G突变成C;

KRAS基因表达的第12位氨基酸G突变成D,第35位碱基G突变成A;

KRAS基因表达的第12位氨基酸G突变成V,第35位碱基G突变成T;

KRAS基因表达的第13位氨基酸G突变成C,第37位碱基G突变成T;

KRAS基因表达的第13位氨基酸G突变成R,第37位碱基G突变成C;

KRAS基因表达的第13位氨基酸G突变成S,第37位碱基G突变成A;

KRAS基因表达的第13位氨基酸G突变成D,第38位碱基G突变成A;

KRAS基因表达的第13位氨基酸G突变成A,第38位碱基G突变成C。

上游单分子特异性引物:

KRAS-E2

U:5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTGACTGAATATAAACGGTAGTTGGGC-3’见SEQ ID NO.37,

下游单分子特异性引物:

D:5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCACAAAATGATTCTGAATTAGCTGTATCGTCAAGGCAC-3’见SEQ ID NO.38,

通用引物序列如下:

分子标签引物:

5’-CGGCATACGAGAT[Index-7]GTGACTGGAGTTC-3’见SEQ ID NO.39,[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。

P5引物:

5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGA-3’见SEQ ID NO.31,

P7引物:

5’-CAAGCAGAAGACGGCATACGAGAT-3’见SEQ ID NO.19。

3.2实验步骤

3.2.1 ct-DNA提取

取3例2ml正常人血浆,分别命名为CF001、CF002、CF003;按照MagMAXTMCell FreeDNA Isolation Kit(ThermoFisher Cat.A29319)说明书操作,提取游离DNA,包括以下步骤:

a)样本裂解

b)磁珠结合

c)磁珠洗涤

d)洗脱

e)定量

3.2.2末端修复补平添加碱基A(本发明称作YEA反应)

使用本发明的YEA反应液(具体参见实施例1相应部分),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,

Figure BDA0002232081160000231

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

37℃15min

72℃30min

4℃forever。

3.2.3接头连接(本发明称作YLA反应)(YLA的具体组分和浓度,参见实施例1相关部分)

将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:

组分 用量
YLA反应液 46μL
YEA反应产物 50μL
接头(5uM) 4μL
Total体积 100μL

涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

20℃15min

65℃10min。

3.2.4纯化

将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱。

3.2.5一步法PCR(One-step PCR)靶向富集

将所有上游单分子特异性引物按照等物质的量混匀,使终物质的量为1uM;将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为1uM;获得上游单分子特异性引物集(U)和下游单分子特异性引物集(D)分成两管进行扩增子富集。分别命名PCR反应管1和PCR反应管2;分别按照下表配置PCR反应体系:

PCR反应管1(U)

组分 用量
Gold 360 master Mix(2x) 25μL
YLA反应产物 23μL
上游单分子特异性引物集(U) 0.2μL
分子标签引物(10uM) 0.2μL
P5引物(20uM) 1μL
P7引物(20uM) 1μL

PCR反应管2(D)

组分 用量
Gold 360 master Mix(2x) 25μL
YLA反应产物 23μL
下游单分子特异性引物集(D) 1μL
分子标签引物(10uM) 0.2μL
P5引物(20uM) 1μL
P7引物(20uM) 1μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000241

Figure BDA0002232081160000251

3.2.6纯化

将反应管1和反应管2从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

3.3 qPCR质检及上机测序

按照实施例1中方法对文库进行qPCR质控和上机测序。

3.4实验结果

3.4.1文库电泳检测分析结果

根据电泳分析结果(图6),文库主带清楚且主要分布在200bp左右,条带亮度明亮,与预期结果一致。

3.4.2 qPCR文库定量分析结果

qPCR检测结果如下:

Figure BDA0002232081160000252

建库文库达到上机要求浓度,可用于上机测试。

3.4.3测序数据分析结果

将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果如下:

Figure BDA0002232081160000261

实施例4 RNA核酸一步法文库构建

以mRNA为检测对象,对ALK基因融合进行RNA文库构建及检测。ALK基因融合断裂点主要是发生在19号intron区域。而基因组DNA转录成mRNA时,会进行剪切编辑,将intron区域剪切掉,因此,设计特异性引物时无需关注断裂点,只需要在ALK基因的20号外显子5’段设计引物,即可完成ALK基因融合检测。

4.1接头引物设计

4.1.1接头设计:

接头序列

Top-Adaptor:

5’-P-NNNNNNNNACGTCACGCAGGGGAGAGCCAGGGATGACTAGG-3'见SEQ ID NO.40,

P表示磷酸化修饰。

Bottom-Adapter:

5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNN*Y-3’见SEQ ID NO.41,

*Y代表硫代修饰的简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。

以上序列需退火成双链。

ALK-Exon 20

TGTACCGCCGGAAGCACCAGGAGCTGCAAGCCATGCAGATGGAGCTGCAGAGCCCTGAGTACAAGCTGAGCAAGCTCCGCACCTCGACCATCATGACCGACTACAACCCCAACTACTGCTTTGCTGGCAAGACCTCCTCCATCAGTGACCTGAAGGAGGTGCCGCGGAAAAACATCACCCTCATTCG见SEQ ID NO.42。

下游单分子特异性引物:

ALK-Exon 20-1D:AGATGTGTATAAGAGACAGGCTTGCAGCTCCTGGTGCTTCC见SEQ IDNO.43

ALK-Exon 20-2D:AGATGTGTATAAGAGACAGCTCAGGGCTCTGCAGCTCCATCTGC见SEQ IDNO.44

ALK-Exon 20-3D:AGATGTGTATAAGAGACAGCAAGCTCCGCACCTCGACCATCATGACCGAC见SEQ ID NO.45TN5-UNI-BLK序列为:

5'-AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAG-3',见SEQ ID NO.20。分子标签引物(TS-Index序列)为:

5'-CAAGCAGAAGACGGCATACGAGAT[Index-7]GTGACTGGAGTTCAGACGTGT-3'见SEQ IDNO.46,[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。

P7引物:

5’-CAAGCAGAAGACGGCATACGAGAT-3'见SEQ ID NO.19。

4.2实验步骤

4.2.1人源总RNA提取。

按照血液/组织/细胞总RNA提取试剂盒说明书进行总RNA提取。并通过跑胶对RNA完整性进行质控。

4.2.2 cDNA第一链合成

a.按照下表配制反应cDNA第一链合成体系:

Figure BDA0002232081160000271

b.吹打混匀,瞬时离心,70℃孵育10min,孵育完成迅速转移至冰上。瞬时离心收集管盖液体;

c.按照下表加入下列反应组分:

组分 体积
5X First-Strand Reaction Buffer 4μL
0.1M DTT 2μL
10mM dNTP mix 1μL

d.吹打混匀,瞬时离心,45℃孵育2min;加入1uL SuperScriptR II RT,轻轻吹打混匀,45℃孵育1h。

4.2.3 cDNA第二链合成及纯化

a.将反应管置于冰上,按照下表依次将下列组分加入第一链合成反应管中:

组分 体积
DEPC-treated water 91μL
5X Second-Strand Reaction Buffer 30μL
10mM dNTP mix 3μL
E.coli DNA Ligase(10U/μL) 1μL
E.coli DNA Polymerase I(10U/μL) 4μL
E.coli RNase H(2U/μL) 1μL
Total volume 150μL

b.轻轻吹打混匀,瞬时离心,置于预冷的热循环仪上按照下列程序进行孵育:16℃孵育2h;关闭热盖。

c.孵育结束后,向反应管中加入2μL T4DNA聚合酶,轻轻吹打混匀,继续置于16℃孵育5min;

d.孵育结束后,将反应管置于冰上,向反应管中加入10μL 0.5M EDTA终止反应;

e.加入160μL苯酚:氯仿:异戊醇(25:24:1)混合液,涡旋剧烈混匀,室温14000g离心5min,反应管液体分层。小心移除140μL上层水相并转移至新的1.5mL离心管中;

f.向新的反应管中加入70μL 7.5M NH4OAc和500μL预冷的100%乙醇,涡旋振荡混匀;立即置于室温、14000g离心20min;

g.小心弃除上清,用500μL预冷的70%乙醇重悬沉淀物,14000g室温离心2min;小心弃除上清;

h.将反应管管盖打开,置于37℃孵育10min,蒸干残留的乙醇,用20μL DEPC水溶解。

4.2.4末端修复补平添加碱基A(本发明称作YEA反应)

使用本发明的YEA反应液(具体组分及浓度参见实施例1部分),对回收的片段化DNA进行末端修复加A。按照下表配置反应体系:

组分 用量
YEA反应液 10μL
cDNA二链产物 1-100ng
双蒸水 补足至50μL
Total体积 50μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

37℃15min

72℃30min

4℃forever。

4.2.5接头连接(本发明称作YLA反应)(YLA反应液参见实施例1)

将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:

组分 用量
YLA反应液 46μL
YEA反应产物 50μL
接头(5uM) 4μL
Total体积 100μL

涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

20℃15min

65℃10min。

4.2.6纯化

将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱。

4.2.7单侧单引物扩增子富集

将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM,获得下游单分子特异性引物集(D);按照下表配置PCR反应体系:

PCR反应管(D)

组分 用量
Gold 360 master Mix(2x) 25μL
YLA反应产物 23μL
下游单分子特异性引物集(D) 1μL
分子标签引物(10uM) 1μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

按照下表,执行PCR扩增程序:

4.2.8纯化

将反应管D从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μLElution Buffer洗脱。

4.2.9 PCR扩增富集

将反应管D按照下表配制PCR反应体系:

组份 用量
2x KAPA HiFiHostart buffer 25μL
TN5-UNI-BLK引物(20uM) 1μL
P7引物(20uM) 1μL
纯化产物 23μL

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000302

Figure BDA0002232081160000311

4.2.10 PCR产物纯化

使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

4.2.11 qPCR质检

按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。

4.2.12上机测序

按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。

4.3实验结果:

4.3.1文库电泳检测分析结果

根据电泳分析结果(图7),文库主带清楚且主要分布在500-700bp左右,条带亮度明亮,与预期结果一致。

4.3.2qPCR定量分析结果

qPCR检测结果如下:

样品 R001
qPCR浓度(nM) 87.5

建库文库达到上机要求浓度,可用于上机测试。

4.3.3上机质控数据

将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果见。

实施例5 total RNA一步法文库构建

以除核糖体RNA以外total RNA为检测对象,对ALK基因融合进行RNA文库构建及检测。ALK基因融合断裂点主要是发生在19号intron区域。而基因组DNA转录成mRNA时,会进行剪切编辑,将intron区域剪切掉,因此,设计特异性引物时无需关注断裂点,只需要在ALK基因的20号外显子5’段设计引物,即可完成ALK基因融合检测。

5.1接头引物设计

5.1.1接头序列

接头序列参见实施例4所示;

5.1.2单分子特异性引物序列

特异性引物序列参见实施例4所示。

5.1.3其他引物序列

其他引物序列参见实施例4所示。

5.2实验步骤

5.2.1人源总RNA提取。

按照血液/组织/细胞总RNA提取试剂盒说明书进行总RNA提取。并通过跑胶对RNA完整性进行质控。

5.2.2去除rRNA

参照

Figure BDA0002232081160000321

rRNA Depletion Kit(Human/Mouse/Rat)(cat.E6310,NEB)核糖体RNA去除试剂盒说明书,对核糖体RNA进行去除。具体步骤如下:

a.探针捕获杂交RNA;

b.RNase H酶消化;

c.DNase I消化;

d.纯化磁珠对去核糖体RNA产物进行纯化;

5.2.3 RNA碎片化

参照

Figure BDA0002232081160000322

Magnesium RNA Fragmentation(cat.E6150,NEB)试剂盒说明书对RNA进行片段化处理,具体步骤如下:

a.参照试剂盒说明书配制片段化反应体系,95℃,孵育1-5min;

b.RNA片段化产物纯化。

5.2.4 cDNA第一链合成

按照下表配制反应体系:

组份 体积(μL)
碎片化RNA 13.5
随机引物 1

轻轻吹打混匀,瞬时离心,将反应管置于热循环仪上,按照65℃,孵育5min,瞬时离心收集管盖液体,

a.按照下表加入下列反应组分:

组分 体积(μL)
5X First-Strand Reaction Buffer 4
0.1M DTT 2
10mM dNTP mix 1

b.吹打混匀,瞬时离心,45℃孵育2min;加入1uL SuperScriptR II RT,轻轻吹打混匀,45℃孵育1h。

5.2.5 cDNA第二链合成及纯化

a.将反应管置于冰上,按照下表依次将下列组分加入第一链合成反应管中:

Figure BDA0002232081160000331

b.轻轻吹打混匀,瞬时离心,置于预冷的热循环仪上按照下列程序进行孵育:16℃2h;关闭热盖。

c.孵育结束后,向反应管中加入2μL T4DNA聚合酶,轻轻吹打混匀,继续置于16℃孵育5min;

d.孵育结束后,将反应管置于冰上,向反应管中加入10μL 0.5M EDTA终止反应;

e.加入160μL苯酚:氯仿:异戊醇(25:24:1)混合液,涡旋剧烈混匀,室温14000g离心5min,反应管液体分层。小心移除140μL上层水相并转移至新的1.5mL离心管中;

f.向新的反应管中加入70μL 7.5M NH4OAc和500μL预冷的100%乙醇,涡旋振荡混匀;立即置于室温、14000g离心20min;

g.小心弃除上清,用500μL预冷的70%乙醇重悬沉淀物,14000g室温离心2min;小心弃除上清;

h.将反应管管盖打开,置于37℃孵育10min,蒸干残留的乙醇;用20μL DEPC水溶解。

5.2.6末端修复补平添加碱基A(本发明称作YEA反应)(YEA反应液具体组分和浓度参见实施例1)

使用本发明的YEA反应液,对回收的片段化DNA进行末端修复加A。按照下表配置反应体系,

组分 用量
YEA反应液 10μL
cDNA 1-100ng
双蒸水 补足至50μL
Total体积 50μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

37℃15min

72℃30min

4℃forever。

5.2.7接头连接(本发明称作YLA反应)(YLA的组分和浓度参见实施例1)

将YEA反应产物从热循环仪上取下置于室温冷却,按照下表配置反应体系:

组分 用量
YLA反应液 46μL
YEA反应产物 50μL
接头(5uM) 4μL
Total体积 100μL

涡旋混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

20℃15min

65℃10min。

5.2.8纯化

将反应管从热循环仪上取下,加入80Ampure XP beads进行纯化,50μL ElutionBuffer洗脱。

5.2.9 One-step PCR靶向富集

将所有下游单分子特异性引物按照等物质的量混匀,使终物质的量为10uM,获得下游单分子特异性引物(D);按照下表配置PCR反应体系:

PCR反应管(D)

组分 用量
Gold 360 master Mix(2x) 25μL
YLA反应产物 23μL
下游单分子特异性引物集(D) 1μL
分子标签引物(10uM) 0.2μL
TN5-UNI-BLK引物(20uM) 1μL
P7引物(20uM) 1μL
双蒸水 补足至50μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000351

5.2.10纯化

将反应管1从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μLElution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

5.3 qPCR质检及上机测序

按照实施例1中方法对文库进行qPCR质控和上机测序。

5.4实验结果:

5.4.1文库电泳检测分析结果

根据电泳分析结果(图8),文库主带清楚且主要分布在500-700bp左右,条带亮度明亮,与预期结果一致。

5.4.2qPCR定量分析结果

qPCR检测结果如下:

样品 R002
qPCR浓度(nM) 97.3

建库文库达到上机要求浓度,可用于上机测试。

5.4.3上机质控数据

将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果见。

实施例6融合基因检测

EML4-ALK基因融合检测原理如图9所示:EML4基因与ALK基因融合以DNA为模板检测,因两个基因融合具***点信息未知,但可以知道是在intron区域内,所以针对intron区域设计高特异性的单侧靶向捕获引物,以30-50bp移步进行引物集覆盖以确定具体的融合位点。与以RNA(实施例5和6)为检测模板最大的区别在于:RNA模板设计的引物覆盖的区域为外显子区域,对RNA完整度和丰度要求高。整个建库试剂成本和测序成本都偏高。却无法确定具体的融合基因断裂点。而以DNA为模板进行检测,可以确定到具体的断裂点坐标。

6.1接头引物设计

接头序列

Top-Adaptor:

5’-P-NNNNNNNNNNACGTCACGCAGGGGAGAGCCAGGGATGACTAGG-3'见SEQ ID NO.47,

P为磷酸化修饰,

Bottom-Adapter:5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNNN*Y-3’见SEQ ID NO.48

*Y代表硫代修饰的简并碱基A或T,N代表随机碱基A或T或G或C,用于区分纠正PCR和测序引入的错误。

以上序列需退火成双链。

以EML4-ALK基因融合为例:

引物设计:

ALK-Intron 19

GTGAGTGCACAGAGCCCCAGGGACTCCCAAGGGGGCAGGAAGGCAGGACTGAATAGTGTC

TCAGGCTGTGCCACAGGTGCCAAGGTGTCACTTCGTTATGCTAGTCCCTGGAATTGGGTG

GGGTGGTGATTAGGGCAGCCCAGGCCAAGCCAAAACGGAAGCTCCCAACCTTCCCCCCAC

CAGAGCAGCTGCAGTTCCCTGAGGAGCCCCTGATTCTGCACCTCAGCCCCGTGTGTATCC

TCCTGGCTGATCAGGGGGTGGGGAGCTCCTTCAGTGTCCATCACGATGGTGAAAGCTCGC

CCCCACCCCTAGACGTCACTTCTAGCTCCCACATGCTTCCACCGGCGCAGCTCCTGTTTG

GCTCCCACCCTATGTAATGCACTAGCCCACTCTTCCCCAAACCAGCCCTCCACCACCCTC

CAGGCAGAGAGATAGGAAAATCGGTTTCTGAGTATATTTCTGTTCAGCCTGTGAGCCAAG

GTGAGCTGACCTGCAGGTCACAGAGAACTCAGTGTGGTCCCAACCAGCTCTTACTGCTGG

CAGAGACATGCCCAGGACAGATGGGCAGAGGCTTGAAAAGGGCAGAGGGAAAGGCTCTTG

AGAGCCCTCGCAGGCCAGGCCCCTGCAGGCAAAGGGATCTGCCGGTAGAAGGGAGATGGC

AGCACACACTGTGTCCCCATATGGTGCCATCCCTCAAAGGGACAGGATAATAGGAGCTAA

CACTTGTTGCATGGTTACTACGTGCTCGGCAATTTACACATTTCAATTCATTCGATCCTC

AGGTAACCCTAATCTGATCACGGTCGGTCCATTGCATAGAGGAGGGAACTGAGCACATAG

CGGGTGACTCATTTGCCCTGGCCCATGTGTTGGGGGGCTGGGCTTTACACACAGAATCTA

CCCACTGAATCACAATTTTGTTCTGGCTTCCATGGAGTTTGCCTTCCAGAACATCCTCAC

ATGTAGGAGTGATAATGGTCACTCACATTGGTAGAGCTCTTTAGGATTTTTCAAAACCAT

TTTATGTTGGTGAATTCATTTCATTGACAACCCTAGAGGGTGGGGAGTGGCAGTGGTTAG

GGAAACAGGGCAGGAGTTACCATCCCTGCCTACAGAGAGGGAAACTGCAGTCCAAAGAGG

TCCTGTGACCTGGTCCTCATGGCTCAGCTTGTAAGTAACAAGAGGCGGAATTAGAGCACA

GATCCCCAGACACCAATTCAGAGATCTTTTCATGATGTGGCTCTTCTCCAACTCTGTGGC

TTGGCAGTTCTCCAACTATAGGAAACACAACTGACCAAGATCCCAGCTGCACCCTCAAAT

CCACTGCTGTGATTGCACTGAAGCTGCCCTACCCAATGGCTGAGCACAGCAGAAATACTA

AGGCAGGCCAATTCCTGGGAGTCATGGGACTCCTCTGATGACTGACTTTGGCTCCAGAAC

CCCTTAGGGCCTTGCTGAAACTTCCTTAGGCTCCATGGCACCCAGGGTGCTTCCACCCAA

CCTTCCCTCCCTCCCTCGTTCACGTGGGGTTATACTTGCAACACAGTCTGCTGGTTCACC

CAGCCTTCCCTGGCTCCCTCCCCATTTCCTCTCATGGGCATTTCTTCTAATAAAATCTGC

AGACCATATTGGGTCTAATCCCATCTCCAGTCTGCTTCTTGGAGGAACCAGACTAACATG

ACTCTGCCCTATATAATACAAATAATTATTTTCCATATATCTGATTTTTAGCTTTGCATT

TACTTTAAATCATGCTTCAATTAAAGACACACCTTCTTTAATCATTTTATTAGTATTTCT

AAGTATGATGGAAAGGTTCAGAGCTCAGGGGAGGATATGGAGATCCAGGGAGGCTTCCTG

TAGGAAGTGGCCTGTGTAGTGCTTCAAGGGCCAGGCTGCCAGGCCATGTTGCAGCTGACC

ACCCACCTGCAG见SEQ ID NO.49。

Exon 20

TGTACCGCCGGAAGCACCAGGAGCTGCAAGCCATGCAGATGGAGCTGCAGAGCCCTGAGTACAAGCTGAGCAAGCTCCGCACCTCGACCATCATGACCGACTACAACCCCAACTACTGCTTTGCTGGCAAGACCTCCTCCATCAGTGACCTGAAGGAGGTGCCGCGGAAAAACATCACCCTCATTCG,见SEQ ID NO.50。

Intron 19-Exon20

GTGAGTGCACAGAGCCCCAGGGACTCCCAAGGGGGCAGGAAGGCAGGACTGAATAGTGTC

TCAGGCTGTGCCACAGGTGCCAAGGTGTCACTTCGTTATGCTAGTCCCTGGAATTGGGTG

GGGTGGTGATTAGGGCAGCCCAGGCCAAGCCAAAACGGAAGCTCCCAACCTTCCCCCCAC

CAGAGCAGCTGCAGTTCCCTGAGGAGCCCCTGATTCTGCACCTCAGCCCCGTGTGTATCC

TCCTGGCTGATCAGGGGGTGGGGAGCTCCTTCAGTGTCCATCACGATGGTGAAAGCTCGC

CCCCACCCCTAGACGTCACTTCTAGCTCCCACATGCTTCCACCGGCGCAGCTCCTGTTTG

GCTCCCACCCTATGTAATGCACTAGCCCACTCTTCCCCAAACCAGCCCTCCACCACCCTC

CAGGCAGAGAGATAGGAAAATCGGTTTCTGAGTATATTTCTGTTCAGCCTGTGAGCCAAG

GTGAGCTGACCTGCAGGTCACAGAGAACTCAGTGTGGTCCCAACCAGCTCTTACTGCTGG

CAGAGACATGCCCAGGACAGATGGGCAGAGGCTTGAAAAGGGCAGAGGGAAAGGCTCTTG

AGAGCCCTCGCAGGCCAGGCCCCTGCAGGCAAAGGGATCTGCCGGTAGAAGGGAGATGGC

AGCACACACTGTGTCCCCATATGGTGCCATCCCTCAAAGGGACAGGATAATAGGAGCTAA

CACTTGTTGCATGGTTACTACGTGCTCGGCAATTTACACATTTCAATTCATTCGATCCTC

AGGTAACCCTAATCTGATCACGGTCGGTCCATTGCATAGAGGAGGGAACTGAGCACATAG

CGGGTGACTCATTTGCCCTGGCCCATGTGTTGGGGGGCTGGGCTTTACACACAGAATCTA

CCCACTGAATCACAATTTTGTTCTGGCTTCCATGGAGTTTGCCTTCCAGAACATCCTCAC

ATGTAGGAGTGATAATGGTCACTCACATTGGTAGAGCTCTTTAGGATTTTTCAAAACCAT

TTTATGTTGGTGAATTCATTTCATTGACAACCCTAGAGGGTGGGGAGTGGCAGTGGTTAG

GGAAACAGGGCAGGAGTTACCATCCCTGCCTACAGAGAGGGAAACTGCAGTCCAAAGAGG

TCCTGTGACCTGGTCCTCATGGCTCAGCTTGTAAGTAACAAGAGGCGGAATTAGAGCACA

GATCCCCAGACACCAATTCAGAGATCTTTTCATGATGTGGCTCTTCTCCAACTCTGTGGC

TTGGCAGTTCTCCAACTATAGGAAACACAACTGACCAAGATCCCAGCTGCACCCTCAAAT

CCACTGCTGTGATTGCACTGAAGCTGCCCTACCCAATGGCTGAGCACAGCAGAAATACTA

AGGCAGGCCAATTCCTGGGAGTCATGGGACTCCTCTGATGACTGACTTTGGCTCCAGAAC

CCCTTAGGGCCTTGCTGAAACTTCCTTAGGCTCCATGGCACCCAGGGTGCTTCCACCCAA

CCTTCCCTCCCTCCCTCGTTCACGTGGGGTTATACTTGCAACACAGTCTGCTGGTTCACC

CAGCCTTCCCTGGCTCCCTCCCCATTTCCTCTCATGGGCATTTCTTCTAATAAAATCTGC

AGACCATATTGGGTCTAATCCCATCTCCAGTCTGCTTCTTGGAGGAACCAGACTAACATG

ACTCTGCCCTATATAATACAAATAATTATTTTCCATATATCTGATTTTTAGCTTTGCATT

TACTTTAAATCATGCTTCAATTAAAGACACACCTTCTTTAATCATTTTATTAGTATTTCT

AAGTATGATGGAAAGGTTCAGAGCTCAGGGGAGGATATGGAGATCCAGGGAGGCTTCCTG

TAGGAAGTGGCCTGTGTAGTGCTTCAAGGGCCAGGCTGCCAGGCCATGTTGCAGCTGACC

ACCCACCTGCAGTGTACCGCCGGAAGCACCAGGAGCTGCAAGCCATGCAGATGGAGCTGCAGAGCCCTGAGTACAAGCTGAGCAAGCTCCGCACCTCGACCATCATGACCGACTACAACCCCAACTACTGCTTTGCTGGCAAGACCTCCTCCATCAGTGACCTGAAGGAGGTGCCGCGGAAAAACATCACCCTCATTCG,见SEQ ID NO.51。

以Exon 20 5’端附近30-50bp左右为第一条特异性引物,依次以间隔30-50bp设计第二条引物、第三条引物......第n条引物,引物序列如下:

ALK-Exon20-D1 AGATGTGTATAAGAGACAGCATGGCTTGCAGCTCCTGGTGCTTCCGGCGGTACAC
ALK-Intron19-D2 AGATGTGTATAAGAGACAGGCCACTTCCTACAGGAAGCCTCCCTGGATCTCC
ALK-Intron19-D3 AGATGTGTATAAGAGACAGGGTGTGTCTTTAATTGAAGCATGATTTAAAGTAAATG
ALK-Intron19-D4 AGATGTGTATAAGAGACAGGGCAGAGTCATGTTAGTCTGGTTCCTCCAAGAAGC
ALK-Intron19-D5 AGATGTGTATAAGAGACAGGAAATGCCCATGAGAGGAAATGGGGAGGGAGCC
ALK-Intron19-D6 AGATGTGTATAAGAGACAGGAGGGAAGGTTGGGTGGAAGCACCCTGG
ALK-Intron19-D7 AGATGTGTATAAGAGACAGAGAGGAGTCCCATGACTCCCAGGAATTGGCCTGC
ALK-Intron19-D8 AGATGTGTATAAGAGACAGGTGGATTTGAGGGTGCAGCTGGGATCTTGGTC
ALK-Intron19-D9 AGATGTGTATAAGAGACAGATGAAAAGATCTCTGAATTGGTGTCTGGGGATCTGTG
ALK-Intron19-D10 AGATGTGTATAAGAGACAGGACTGCAGTTTCCCTCTCTGTAGGCAGGGATGGTAAC
ALK-Intron19-D11 AGATGTGTATAAGAGACAGCCCCACCCTCTAGGGTTGTCAATGAAATG
ALK-Intron19-D12 AGATGTGTATAAGAGACAGGATGTTCTGGAAGGCAAACTCCATGGAAGCCAGAAC
ALK-Intron19-D13 AGATGTGTATAAGAGACAGCGCTATGTGCTCAGTTCCCTCCTCTATGCAATGGAC
ALK-Intron19-D14 AGATGTGTATAAGAGACAGGAGCACGTAGTAACCATGCAACAAGTGTTAGC
ALK-Intron19-D15 AGATGTGTATAAGAGACAGGCCATCTCCCTTCTACCGGCAGATCCCTTTG
ALK-Intron19-D16 AGATGTGTATAAGAGACAGCCTCTGCCCATCTGTCCTGGGCATG
ALK-Intron19-D17 AGATGTGTATAAGAGACAGGCTCACCTTGGCTCACAGGCTGAACAG
ALK-Intron19-D18 AGATGTGTATAAGAGACAGGAAGAGTGGGCTAGTGCATTACATAGGGTGGGAGC
ALK-Intron19-D19 AGATGTGTATAAGAGACAGCGTGATGGACACTGAAGGAGCTCCCCACC
ALK-Intron19-D20 AGATGTGTATAAGAGACAGGAACTGCAGCTGCTCTGGTGGGGGGAAGG
ALK-Intron19-D21 AGATGTGTATAAGAGACAGGCCCCCTTGGGAGTCCCTGGGGCTCTGTGCACTCAC

上表中序列依次见SEQ ID NO.52—72。

TN5-UNI-BLK序列为:

5'-AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAG-3'见SEQID NO.20。分子标签引物(TS-Index序列)为:

5'-CAAGCAGAAGACGGCATACGAGAT[Index-7]GTGACTGGAGTTCAGACGTGT-3'见SEQ IDNO.73。

[Index-7]表示7个随机的碱基,目的是用于区分不同的样品。

P7引物:

5’-CAAGCAGAAGACGGCATACGAGAT-3’,见SEQ ID NO.19。

6.2实验步骤

6.2.1石蜡组织切片(FFPE)样本DNA提取

取3例编号分别为FP001、FP002、FP003的FFPE样本;每例样本取5片石蜡切片,按照MagMAXTMFFPE DNA/RNA Ultra Kit(life,cat.A31881)说明书操作,提取DNA,包括以下步骤:

a)样本脱蜡

b)样本消化

c)磁珠结合

d)清洗

e)洗脱

f)定量

6.2.2DNA片段化处理

采用超声或酶切法对FFPE三例样本的DNA进行片段化处理,gap修复及纯化回收处理。

6.2.2末端修复补平添加碱基A及接头连接

使用本发明的YEA反应液(配方同实施例1),YLA反应液(配方同实施例1),对回收的片段化DNA进行末端修复加A和接头连接。按照下表配置反应体系,

组分 用量
YEA反应液 10μL
FFPE样本DNA 1~50ng
YLA反应液 40μL
接头(5uM) 4μL
双蒸水 补足至100μL
Total体积 100μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

25℃60min

72℃30min

4℃forever。

6.2.3纯化

将反应管从热循环仪上取下,加入80μLAmpure XP beads进行纯化,50μL ElutionBuffer洗脱,加入100μLAmpure XP beads进行纯化,50μL Elution Buffer洗脱,用于下游靶向捕获。

6.2.4单侧单引物扩增子靶向捕获

特异性引物集-D中每种引物都是等物质的量混合,终浓度为10uM。

分别按照下表配置PCR反应体系:

PCR反应管(D)

组分 用量
Gold 360 master Mix(2x) 25μL
纯化产物 23μL
特异性引物集-D 1μL
TS-Index序列 1μL

涡旋振荡混匀,瞬时离心,置于热循环仪上按照下列程序进行孵育:

按照下表,执行PCR扩增程序:

Figure BDA0002232081160000421

6.2.5纯化

将反应管D从热循环仪上取下,分别加入60μLAmpure XP beads进行纯化,50μLElution Buffer洗脱。

6.2.6PCR扩增富集

将反应管D纯化产物分别按照下表配制PCR反应体系:

组份 用量
2x KAPA HiFiHostart buffer 25μL
TN5-UNI-BLK(10uM) 1μL
P7引物(10uM) 1μL
纯化产物 23μL

按照下表,执行PCR扩增程序:

6.2.7 PCR产物纯化

使用60μLAmpure XP beads进行纯化,30μL Elution Buffer洗脱。取其中5μL纯化产物进行2%琼脂糖凝胶电泳检测。

6.2.8qPCR质检

按照KAPA Library Quantifcation Kit(Kapabiosystems,Cat No.KK4854)说明书进行操作,使用Roche Light Cycler 480实时荧光定量PCR仪检测,参照试剂盒里的标准品进行文库浓度的绝对定量。

6.2.9上机测序

按照MiSeq测序仪操作流程进行文库变性、稀释以及150bp双端测序。

6.3实验结果:

6.3.1文库电泳检测分析结果

根据电泳分析结果(图10),文库主带清楚且主要分布在300bp左右,条带亮度明亮,与预期结果一致。

6.3.2 qPCR定量结果

文库Qpcr定量结果如下:

文库名称 FP001 FP002 FP003
qPCR浓度(nM) 48.4 50.4 39.3

文库浓度达到上机要求。

6.3.3测序数据分析结果

测试数据经过fastqc软件进行Q30质控,再通过去除接头,过滤,Bowite2软件进行hg19参考基因组进行比对,评估引物特异性及捕获效率。分析结果如下表:

Figure BDA0002232081160000441

序列表

<110> 湖南大地同年生物科技有限公司

<120> 一种超低频突变核酸片段检测方法、文库构建方法、引物设计方法和试剂

<130> 无

<160> 73

<170> SIPOSequenceListing 1.0

<210> 1

<211> 33

<212> DNA

<213> 人工序列(Artificial)

<400> 1

acgtcacgca ggggagagcc agggatgact agg 33

<210> 2

<211> 56

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (35)..(42)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (56)..(56)

<223> Y为硫代修饰的简并碱基A或T

<400> 2

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnccctgcgt gacgty 56

<210> 3

<211> 381

<212> DNA

<213> Homo sapiens

<400> 3

caagtgccgt gtcctggcac ccaagcccat gccgtggctg ctggtccccc tgctgggcca 60

tgtctggcac tgctttccag catggtgagg gctgaggtga cccttgtctc tgtgttcttg 120

tcccccccag cttgtggagc ctcttacacc cagtggagaa gctcccaacc aagctctctt 180

gaggatcttg aaggaaactg aattcaaaaa gatcaaagtg ctgggctccg gtgcgttcgg 240

cacggtgtat aaggtaaggt ccctggcaca ggcctctggg ctgggccgca gggcctctca 300

tggtctggtg gggagcccag agtccttgca agctgtatat ttccatcatc tactttactc 360

tttgtttcac tgagtgtttg g 381

<210> 4

<211> 49

<212> DNA

<213> 人工序列(Artificial)

<400> 4

agatgtgtat aagagacagg ctcccaacca agctctcttg aggatcttg 49

<210> 5

<211> 49

<212> DNA

<213> 人工序列(Artificial)

<400> 5

agatgtgtat aagagacagg gaccttacct tatacaccgt gccgaacgc 49

<210> 6

<211> 372

<212> DNA

<213> Homo sapiens

<400> 6

gcaatatcag ccttaggtgc ggctccacag ccccagtgtc cctcaccttc ggggtgcatc 60

gctggtaaca tccacccaga tcactgggca gcatgtggca ccatctcaca attgccagtt 120

aacgtcttcc ttctctctct gtcataggga ctctggatcc cagaaggtga gaaagttaaa 180

attcccgtcg ctatcaagga attaagagaa gcaacatctc cgaaagccaa caaggaaatc 240

ctcgatgtga gtttctgctt tgctgtgtgg gggtccatgg ctctgaacct caggcccacc 300

ttttctcatg tctggcagct gctctgctct agaccctgct catctccaca tcctaaatgt 360

tcactttcta tg 372

<210> 7

<211> 55

<212> DNA

<213> 人工序列(Artificial)

<400> 7

agatgtgtat aagagacagc cagaaggtga gaaagttaaa attcccgtcg ctatc 55

<210> 8

<211> 50

<212> DNA

<213> 人工序列(Artificial)

<400> 8

agatgtgtat aagagacagc cacacagcaa agcagaaact cacatcgagg 50

<210> 9

<211> 408

<212> DNA

<213> Homo sapiens

<400> 9

ccatgagtac gtattttgaa actcaagatc gcattcatgc gtcttcacct ggaaggggtc 60

catgtgcccc tccttctggc caccatgcga agccacactg acgtgcctct ccctccctcc 120

aggaagccta cgtgatggcc agcgtggaca acccccacgt gtgccgcctg ctgggcatct 180

gcctcacctc caccgtgcag ctcatcacgc agctcatgcc cttcggctgc ctcctggact 240

atgtccggga acacaaagac aatattggct cccagtacct gctcaactgg tgtgtgcaga 300

tcgcaaaggt aatcagggaa gggagatacg gggaggggag ataaggagcc aggatcctca 360

catgcggtct gcgctcctgg gatagcaaga gtttgccatg gggatatg 408

<210> 10

<211> 49

<212> DNA

<213> 人工序列(Artificial)

<400> 10

agatgtgtat aagagacaga ccatgcgaag ccacactgac gtgcctctc 49

<210> 11

<211> 48

<212> DNA

<213> 人工序列(Artificial)

<400> 11

agatgtgtat aagagacagg catctgcctc acctccaccg tgcagctc 48

<210> 12

<211> 50

<212> DNA

<213> 人工序列(Artificial)

<400> 12

agatgtgtat aagagacaga ttgtctttgt gttcccggac atagtccagg 50

<210> 13

<211> 49

<212> DNA

<213> 人工序列(Artificial)

<400> 13

agatgtgtat aagagacaga tgagctgcgt gatgagctgc acggtggag 49

<210> 14

<211> 239

<212> DNA

<213> Homo sapiens

<400> 14

tctgtttcag ggcatgaact acttggagga ccgtcgcttg gtgcaccgcg acctggcagc 60

caggaacgta ctggtgaaaa caccgcagca tgtcaagatc acagattttg ggctggccaa 120

actgctgggt gcggaagaga aagaatacca tgcagaagga ggcaaagtaa ggaggtggct 180

ttaggtcagc cagcattttc ctgacaccag ggaccaggct gccttcccac tagctgtat 239

<210> 15

<211> 51

<212> DNA

<213> 人工序列(Artificial)

<400> 15

agatgtgtat aagagacagg gaacgtactg gtgaaaacac cgcagcatgt c 51

<210> 16

<211> 51

<212> DNA

<213> 人工序列(Artificial)

<400> 16

agatgtgtat aagagacagg cctccttctg catggtattc tttctcttcc g 51

<210> 17

<211> 20

<212> DNA

<213> 人工序列(Artificial)

<400> 17

cctagtcatc cctggctctc 20

<210> 18

<211> 45

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (24)..(25)

<223> 第24和25个碱基之间***7个作为分子标签的随机碱基

<400> 18

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45

<210> 19

<211> 24

<212> DNA

<213> 人工序列(Artificial)

<400> 19

caagcagaag acggcatacg agat 24

<210> 20

<211> 58

<212> DNA

<213> 人工序列(Artificial)

<400> 20

aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagag 58

<210> 21

<211> 40

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (14)..(21)

<223> n is a, c, g, or t

<400> 21

acgtcacgca gggnnnnnnn nagatgtgta taagagacag 40

<210> 22

<211> 56

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (35)..(42)

<223> n is a, c, g, or t

<400> 22

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnccctgcgt gacgtt 56

<210> 23

<211> 118

<212> DNA

<213> Homo sapiens

<400> 23

aaaacacttg gtagacggga ctcgagtgat gattgggaga ttcctgatgg gcagattaca 60

gtgggacaaa gaattggatc tggatcattt ggaacagtct acaagggaaa gtggcatg 118

<210> 24

<211> 318

<212> DNA

<213> Homo sapiens

<400> 24

cctgtatccc tctcaggcat aaggtaatgt acttagggtg aaacataagg ttttcttttt 60

ctgtttggct tgacttgact tttttactgt ttttatcaag aaaacacttg gtagacggga 120

ctcgagtgat gattgggaga ttcctgatgg gcagattaca gtgggacaaa gaattggatc 180

tggatcattt ggaacagtct acaagggaaa gtggcatggt aagtatgtaa tgtggtgaca 240

ttgtgacaag tcataatagg atatgtttaa caacttttat tttgtaaaaa atatcatcaa 300

aggaaatatt cactgttc 318

<210> 25

<211> 69

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (50)..(51)

<223> 第50和51个碱基之间***8个次黄嘌呤碱基I

<400> 25

acactctttc cctacacgac gctcttccga tctggagatt cctgatgggc agattacagt 60

gggacaaag 69

<210> 26

<211> 65

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (50)..(51)

<223> 第50和51个碱基之间***8个次黄嘌呤碱基I

<400> 26

acactctttc cctacacgac gctcttccga tctaccacat tacatactta ccatgccact 60

ttccc 65

<210> 27

<211> 119

<212> DNA

<213> Homo sapiens

<400> 27

atatatttct tcatgaagac ctcacagtaa aaataggtga ttttggtcta gctacagtga 60

aatctcgatg gagtgggtcc catcagtttg aacagttgtc tggatccatt ttgtggatg 119

<210> 28

<211> 319

<212> DNA

<213> Homo sapiens

<400> 28

acagaattat agaaattaga tctcttacct aaactcttca taatgcttgc tctgatagga 60

aaatgagatc tactgttttc ctttacttac tacacctcag atatatttct tcatgaagac 120

ctcacagtaa aaataggtga ttttggtcta gctacagtga aatctcgatg gagtgggtcc 180

catcagtttg aacagttgtc tggatccatt ttgtggatgg taagaattga ggctattttt 240

ccactgatta aatttttggc cctgagatgc tgctgagtta ctagaaagtc attgaaggtc 300

tcaactatag tattttcat 319

<210> 29

<211> 71

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (50)..(51)

<223> 第50和51个碱基之间***8个次黄嘌呤碱基I

<400> 29

acactctttc cctacacgac gctcttccga tctcttcatg aagacctcac agtaaaaata 60

ggtgattttg g 71

<210> 30

<211> 73

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (49)..(50)

<223> 第49和50个碱基之间***8个次黄嘌呤碱基I

<400> 30

acactctttc cctacacgac gctcttccga tcttccagac aactgttcaa actgatggga 60

cccactccat cag 73

<210> 31

<211> 44

<212> DNA

<213> 人工序列(Artificial)

<400> 31

aatgatacgg cgaccaccga gatctacact ctttccctac acga 44

<210> 32

<211> 26

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (14)..(15)

<223> 第13和14个碱基之间***7个作为分子标签的随机碱基

<400> 32

cggcatacga gatgtgactg gagttc 26

<210> 33

<211> 40

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (14)..(21)

<223> n is a, c, g, or t

<400> 33

acgtcacgca gggnnnnnnn nagatgtgta taagagacag 40

<210> 34

<211> 56

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (35)..(42)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (56)..(56)

<223> Y为硫代修饰的简并碱基A或T

<400> 34

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnccctgcgt gacgty 56

<210> 35

<211> 111

<212> DNA

<213> Homo sapiens

<400> 35

atgactgaat ataaacttgt ggtagttgga gctggtggcg taggcaagag tgccttgacg 60

atacagctaa ttcagaatca ttttgtggac gaatatgatc caacaataga g 111

<210> 36

<211> 383

<212> DNA

<213> Homo sapiens

<400> 36

aattttgtaa ggtattttga aataattttt catataaagg tgagtttgta ttaaaaggta 60

ctggtggagt atttgatagt gtattaacct tatgtgtgac atgttctaat atagtcacat 120

tttcattatt tttattataa ggcctgctga aaatgactga atataaactt gtggtagttg 180

gagctggtgg cgtaggcaag agtgccttga cgatacagct aattcagaat cattttgtgg 240

acgaatatga tccaacaata gaggtaaatc ttgttttaat atgcatatta ctggtgcagg 300

accattcttt gatacagata aaggtttctc tgaccatttt catgagtact tattacaaga 360

taattatgct gaaagttaag tta 383

<210> 37

<211> 58

<212> DNA

<213> 人工序列(Artificial)

<400> 37

acactctttc cctacacgac gctcttccga tctgactgaa tataaacggt agttgggc 58

<210> 38

<211> 72

<212> DNA

<213> 人工序列(Artificial)

<400> 38

acactctttc cctacacgac gctcttccga tctccacaaa atgattctga attagctgta 60

tcgtcaaggc ac 72

<210> 39

<211> 26

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (13)..(14)

<223> 第13和14个碱基之间***7个作为分子标签的随机碱基

<400> 39

cggcatacga gatgtgactg gagttc 26

<210> 40

<211> 41

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (1)..(8)

<223> n is a, c, g, or t

<400> 40

nnnnnnnnac gtcacgcagg ggagagccag ggatgactag g 41

<210> 41

<211> 45

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (35)..(44)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (45)..(45)

<223> Y为硫代修饰的简并碱基A或T

<400> 41

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnny 45

<210> 42

<211> 187

<212> DNA

<213> Homo sapiens

<400> 42

tgtaccgccg gaagcaccag gagctgcaag ccatgcagat ggagctgcag agccctgagt 60

acaagctgag caagctccgc acctcgacca tcatgaccga ctacaacccc aactactgct 120

ttgctggcaa gacctcctcc atcagtgacc tgaaggaggt gccgcggaaa aacatcaccc 180

tcattcg 187

<210> 43

<211> 41

<212> DNA

<213> 人工序列(Artificial)

<400> 43

agatgtgtat aagagacagg cttgcagctc ctggtgcttc c 41

<210> 44

<211> 44

<212> DNA

<213> 人工序列(Artificial)

<400> 44

agatgtgtat aagagacagc tcagggctct gcagctccat ctgc 44

<210> 45

<211> 50

<212> DNA

<213> 人工序列(Artificial)

<400> 45

agatgtgtat aagagacagc aagctccgca cctcgaccat catgaccgac 50

<210> 46

<211> 45

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (24)..(25)

<223> 第24和25个碱基之间***7个作为分子标签的随机碱基

<400> 46

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45

<210> 47

<211> 43

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (1)..(10)

<223> n is a, c, g, or t

<400> 47

nnnnnnnnnn acgtcacgca ggggagagcc agggatgact agg 43

<210> 48

<211> 45

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (35)..(44)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (45)..(45)

<223> Y为硫代修饰的简并碱基A或T

<400> 48

gtgactggag ttcagacgtg tgctcttccg atctnnnnnn nnnny 45

<210> 49

<211> 1932

<212> DNA

<213> Homo sapiens

<400> 49

gtgagtgcac agagccccag ggactcccaa gggggcagga aggcaggact gaatagtgtc 60

tcaggctgtg ccacaggtgc caaggtgtca cttcgttatg ctagtccctg gaattgggtg 120

gggtggtgat tagggcagcc caggccaagc caaaacggaa gctcccaacc ttccccccac 180

cagagcagct gcagttccct gaggagcccc tgattctgca cctcagcccc gtgtgtatcc 240

tcctggctga tcagggggtg gggagctcct tcagtgtcca tcacgatggt gaaagctcgc 300

ccccacccct agacgtcact tctagctccc acatgcttcc accggcgcag ctcctgtttg 360

gctcccaccc tatgtaatgc actagcccac tcttccccaa accagccctc caccaccctc 420

caggcagaga gataggaaaa tcggtttctg agtatatttc tgttcagcct gtgagccaag 480

gtgagctgac ctgcaggtca cagagaactc agtgtggtcc caaccagctc ttactgctgg 540

cagagacatg cccaggacag atgggcagag gcttgaaaag ggcagaggga aaggctcttg 600

agagccctcg caggccaggc ccctgcaggc aaagggatct gccggtagaa gggagatggc 660

agcacacact gtgtccccat atggtgccat ccctcaaagg gacaggataa taggagctaa 720

cacttgttgc atggttacta cgtgctcggc aatttacaca tttcaattca ttcgatcctc 780

aggtaaccct aatctgatca cggtcggtcc attgcataga ggagggaact gagcacatag 840

cgggtgactc atttgccctg gcccatgtgt tggggggctg ggctttacac acagaatcta 900

cccactgaat cacaattttg ttctggcttc catggagttt gccttccaga acatcctcac 960

atgtaggagt gataatggtc actcacattg gtagagctct ttaggatttt tcaaaaccat 1020

tttatgttgg tgaattcatt tcattgacaa ccctagaggg tggggagtgg cagtggttag 1080

ggaaacaggg caggagttac catccctgcc tacagagagg gaaactgcag tccaaagagg 1140

tcctgtgacc tggtcctcat ggctcagctt gtaagtaaca agaggcggaa ttagagcaca 1200

gatccccaga caccaattca gagatctttt catgatgtgg ctcttctcca actctgtggc 1260

ttggcagttc tccaactata ggaaacacaa ctgaccaaga tcccagctgc accctcaaat 1320

ccactgctgt gattgcactg aagctgccct acccaatggc tgagcacagc agaaatacta 1380

aggcaggcca attcctggga gtcatgggac tcctctgatg actgactttg gctccagaac 1440

cccttagggc cttgctgaaa cttccttagg ctccatggca cccagggtgc ttccacccaa 1500

ccttccctcc ctccctcgtt cacgtggggt tatacttgca acacagtctg ctggttcacc 1560

cagccttccc tggctccctc cccatttcct ctcatgggca tttcttctaa taaaatctgc 1620

agaccatatt gggtctaatc ccatctccag tctgcttctt ggaggaacca gactaacatg 1680

actctgccct atataataca aataattatt ttccatatat ctgattttta gctttgcatt 1740

tactttaaat catgcttcaa ttaaagacac accttcttta atcattttat tagtatttct 1800

aagtatgatg gaaaggttca gagctcaggg gaggatatgg agatccaggg aggcttcctg 1860

taggaagtgg cctgtgtagt gcttcaaggg ccaggctgcc aggccatgtt gcagctgacc 1920

acccacctgc ag 1932

<210> 50

<211> 187

<212> DNA

<213> Homo sapiens

<400> 50

tgtaccgccg gaagcaccag gagctgcaag ccatgcagat ggagctgcag agccctgagt 60

acaagctgag caagctccgc acctcgacca tcatgaccga ctacaacccc aactactgct 120

ttgctggcaa gacctcctcc atcagtgacc tgaaggaggt gccgcggaaa aacatcaccc 180

tcattcg 187

<210> 51

<211> 2119

<212> DNA

<213> Homo sapiens

<400> 51

gtgagtgcac agagccccag ggactcccaa gggggcagga aggcaggact gaatagtgtc 60

tcaggctgtg ccacaggtgc caaggtgtca cttcgttatg ctagtccctg gaattgggtg 120

gggtggtgat tagggcagcc caggccaagc caaaacggaa gctcccaacc ttccccccac 180

cagagcagct gcagttccct gaggagcccc tgattctgca cctcagcccc gtgtgtatcc 240

tcctggctga tcagggggtg gggagctcct tcagtgtcca tcacgatggt gaaagctcgc 300

ccccacccct agacgtcact tctagctccc acatgcttcc accggcgcag ctcctgtttg 360

gctcccaccc tatgtaatgc actagcccac tcttccccaa accagccctc caccaccctc 420

caggcagaga gataggaaaa tcggtttctg agtatatttc tgttcagcct gtgagccaag 480

gtgagctgac ctgcaggtca cagagaactc agtgtggtcc caaccagctc ttactgctgg 540

cagagacatg cccaggacag atgggcagag gcttgaaaag ggcagaggga aaggctcttg 600

agagccctcg caggccaggc ccctgcaggc aaagggatct gccggtagaa gggagatggc 660

agcacacact gtgtccccat atggtgccat ccctcaaagg gacaggataa taggagctaa 720

cacttgttgc atggttacta cgtgctcggc aatttacaca tttcaattca ttcgatcctc 780

aggtaaccct aatctgatca cggtcggtcc attgcataga ggagggaact gagcacatag 840

cgggtgactc atttgccctg gcccatgtgt tggggggctg ggctttacac acagaatcta 900

cccactgaat cacaattttg ttctggcttc catggagttt gccttccaga acatcctcac 960

atgtaggagt gataatggtc actcacattg gtagagctct ttaggatttt tcaaaaccat 1020

tttatgttgg tgaattcatt tcattgacaa ccctagaggg tggggagtgg cagtggttag 1080

ggaaacaggg caggagttac catccctgcc tacagagagg gaaactgcag tccaaagagg 1140

tcctgtgacc tggtcctcat ggctcagctt gtaagtaaca agaggcggaa ttagagcaca 1200

gatccccaga caccaattca gagatctttt catgatgtgg ctcttctcca actctgtggc 1260

ttggcagttc tccaactata ggaaacacaa ctgaccaaga tcccagctgc accctcaaat 1320

ccactgctgt gattgcactg aagctgccct acccaatggc tgagcacagc agaaatacta 1380

aggcaggcca attcctggga gtcatgggac tcctctgatg actgactttg gctccagaac 1440

cccttagggc cttgctgaaa cttccttagg ctccatggca cccagggtgc ttccacccaa 1500

ccttccctcc ctccctcgtt cacgtggggt tatacttgca acacagtctg ctggttcacc 1560

cagccttccc tggctccctc cccatttcct ctcatgggca tttcttctaa taaaatctgc 1620

agaccatatt gggtctaatc ccatctccag tctgcttctt ggaggaacca gactaacatg 1680

actctgccct atataataca aataattatt ttccatatat ctgattttta gctttgcatt 1740

tactttaaat catgcttcaa ttaaagacac accttcttta atcattttat tagtatttct 1800

aagtatgatg gaaaggttca gagctcaggg gaggatatgg agatccaggg aggcttcctg 1860

taggaagtgg cctgtgtagt gcttcaaggg ccaggctgcc aggccatgtt gcagctgacc 1920

acccacctgc agtgtaccgc cggaagcacc aggagctgca agccatgcag atggagctgc 1980

agagccctga gtacaagctg agcaagctcc gcacctcgac catcatgacc gactacaacc 2040

ccaactactg ctttgctggc aagacctcct ccatcagtga cctgaaggag gtgccgcgga 2100

aaaacatcac cctcattcg 2119

<210> 52

<211> 55

<212> DNA

<213> 人工序列(Artificial)

<400> 52

agatgtgtat aagagacagc atggcttgca gctcctggtg cttccggcgg tacac 55

<210> 53

<211> 52

<212> DNA

<213> 人工序列(Artificial)

<400> 53

agatgtgtat aagagacagg ccacttccta caggaagcct ccctggatct cc 52

<210> 54

<211> 56

<212> DNA

<213> 人工序列(Artificial)

<400> 54

agatgtgtat aagagacagg gtgtgtcttt aattgaagca tgatttaaag taaatg 56

<210> 55

<211> 54

<212> DNA

<213> 人工序列(Artificial)

<400> 55

agatgtgtat aagagacagg gcagagtcat gttagtctgg ttcctccaag aagc 54

<210> 56

<211> 52

<212> DNA

<213> 人工序列(Artificial)

<400> 56

agatgtgtat aagagacagg aaatgcccat gagaggaaat ggggagggag cc 52

<210> 57

<211> 47

<212> DNA

<213> 人工序列(Artificial)

<400> 57

agatgtgtat aagagacagg agggaaggtt gggtggaagc accctgg 47

<210> 58

<211> 53

<212> DNA

<213> 人工序列(Artificial)

<400> 58

agatgtgtat aagagacaga gaggagtccc atgactccca ggaattggcc tgc 53

<210> 59

<211> 51

<212> DNA

<213> 人工序列(Artificial)

<400> 59

agatgtgtat aagagacagg tggatttgag ggtgcagctg ggatcttggt c 51

<210> 60

<211> 56

<212> DNA

<213> 人工序列(Artificial)

<400> 60

agatgtgtat aagagacaga tgaaaagatc tctgaattgg tgtctgggga tctgtg 56

<210> 61

<211> 56

<212> DNA

<213> 人工序列(Artificial)

<400> 61

agatgtgtat aagagacagg actgcagttt ccctctctgt aggcagggat ggtaac 56

<210> 62

<211> 48

<212> DNA

<213> 人工序列(Artificial)

<400> 62

agatgtgtat aagagacagc cccaccctct agggttgtca atgaaatg 48

<210> 63

<211> 55

<212> DNA

<213> 人工序列(Artificial)

<400> 63

agatgtgtat aagagacagg atgttctgga aggcaaactc catggaagcc agaac 55

<210> 64

<211> 55

<212> DNA

<213> 人工序列(Artificial)

<400> 64

agatgtgtat aagagacagc gctatgtgct cagttccctc ctctatgcaa tggac 55

<210> 65

<211> 51

<212> DNA

<213> 人工序列(Artificial)

<400> 65

agatgtgtat aagagacagg agcacgtagt aaccatgcaa caagtgttag c 51

<210> 66

<211> 50

<212> DNA

<213> 人工序列(Artificial)

<400> 66

agatgtgtat aagagacagg ccatctccct tctaccggca gatccctttg 50

<210> 67

<211> 44

<212> DNA

<213> 人工序列(Artificial)

<400> 67

agatgtgtat aagagacagc ctctgcccat ctgtcctggg catg 44

<210> 68

<211> 46

<212> DNA

<213> 人工序列(Artificial)

<400> 68

agatgtgtat aagagacagg ctcaccttgg ctcacaggct gaacag 46

<210> 69

<211> 54

<212> DNA

<213> 人工序列(Artificial)

<400> 69

agatgtgtat aagagacagg aagagtgggc tagtgcatta catagggtgg gagc 54

<210> 70

<211> 48

<212> DNA

<213> 人工序列(Artificial)

<400> 70

agatgtgtat aagagacagc gtgatggaca ctgaaggagc tccccacc 48

<210> 71

<211> 48

<212> DNA

<213> 人工序列(Artificial)

<400> 71

agatgtgtat aagagacagg aactgcagct gctctggtgg ggggaagg 48

<210> 72

<211> 55

<212> DNA

<213> 人工序列(Artificial)

<400> 72

agatgtgtat aagagacagg cccccttggg agtccctggg gctctgtgca ctcac 55

<210> 73

<211> 45

<212> DNA

<213> 人工序列(Artificial)

<220>

<221> misc_feature

<222> (24)..(25)

<223> 第24和25个碱基之间***7个作为分子标签的随机碱基

<400> 73

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgt 45

64页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于高通量测序样本溯源的质控品及其设计和使用方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!