一种高通量的病原体微生物基因检测筛查方法
阅读说明:本技术 一种高通量的病原体微生物基因检测筛查方法 (High-throughput pathogen microorganism gene detection screening method ) 是由 杨功达 曾丰波 胡秀弟 于 2020-04-29 设计创作,主要内容包括:本发明属于生物领域,尤其设计一种高通量的病原体微生物基因检测筛查方法。一种高通量的病原体微生物基因检测筛查方法,包括:S1:设计探针;S2:芯片合成;S3:提取样品中的DNA或RNA;S4:文库构建;S5:文库目标区域杂交捕获和测序;S6:采用高通量测序平台检测;S7:进行生信分析,采用Samtools来计算病原体基因组序列每个位点的深度;与探针目标区域重叠的序列被视为“目标序列”;相反,则被视为“非目标序列”。本发明通过一次检测,可同时实现“靶向病原体检测”和“宏基因组检测”,既能提高靶向病原体的检测灵敏度,又能检测到未设计探针的病原体,扩大了检测范围。(The invention belongs to the field of biology, and particularly relates to a high-throughput pathogen microorganism gene detection screening method. A high throughput pathogen microbial gene detection screening method comprising: s1: designing a probe; s2: chip synthesis; s3: extracting DNA or RNA in a sample; s4: constructing a library; s5: hybrid capture and sequencing of library target regions; s6: detecting by adopting a high-throughput sequencing platform; s7: performing a biogenesis analysis, and calculating the depth of each site of a pathogen genome sequence by adopting Samtools; sequences that overlap with the probe target region are considered "target sequences"; conversely, it is considered to be a "non-target sequence". The invention can realize the target pathogen detection and the metagenome detection at the same time through one-time detection, not only can improve the detection sensitivity of the target pathogen, but also can detect the pathogen without a designed probe, thereby enlarging the detection range.)
技术领域
本发明属于生物领域,尤其设计一种高通量的病原体微生物基因检测筛查方法。
背景技术
病原体微生物的检测和鉴定对临床上判断感染类型及进行有针对性的治疗都具有非常重要的意义。病原体微生物种类繁多,来源广泛,而即使是不同种类的病原体感染,表现在临床症状上具有一定的相似性,比如普遍伴有发烧等症状,所以很难从临床表现区分感染类型,而准确有效的筛查或诊断检测方法具显得至关重要。目前临床上采用的病原体微生物检测方法主要有培养法,基于蛋白的抗原抗体特异性检测,以及基于核酸的基因检测,常见的有QPCR,一代测序和高通量测序等等。由于培养条件的局限性,可被培养的微生物种类较少,而且培养需要较长的时间周期,培养法的劣势比较明显。基于抗原抗体特异性检测具有速度快的优势,但能够检测的微生物种类不多,而且无法准确地确定具体的病原体微生物的物种。核酸检测具有较强的普遍性,在病原体微生物的检测上有着越来越广的应用。
病原体微生物的基因检测方法中,QPCR是应用最多的一种技术,通过选取微生物基因组中物种特异的序列,设计相应的引物或探针,通过相对定量的方法来确定样品中是否存在该病原体的感染,并计算病原体的基因组组拷贝数。QPCR对检测已知的病原体,有较大优势,成本低,速度快,准确率高。但临床上,多种病原体可能会有类似的感染症状,而QPCR的检测位点有限,需要多次检测才能满足对多种病原体实现检测的需求。同时,还有一些罕见或未知的病原体,又会引发临床症状,这些感染类型QPCR很难解决。
由于高通量测序成本的下降,以及目标区域捕获技术的发展,基于高通量测序的病原体感染检测也被越来越多地用到。目前常见的检测方式主要分为全基因组或宏基因组(WGS)和目标区域捕获测序两类。宏基因组测序不作任何假设前提,对待测样品中的所有物种的基因组都进行检测,虽然检测的范围很广,但是要求的数据量很大,并且其中大部分的数据都是来自背景的序列,数据有效率很低,检测的灵敏度有限,成本又非常高。
目标区域捕获测序,事先将一系列病原体的物种特异序列设计成探针或引物,对待测样品中的DNA进行目标区域富集,再进行测序分析。目标区域捕获测序常用的方法主要有液相杂交捕获,和多重PCR两类。目标区域捕获测序对目标区域进行了富集,检测的灵敏度相比全基因组测序大大提高,同时需要的测序数据量也较小,成本较低。但它只针对事先确定的病原体微生物进行检测,检测范围存在一定的局限性。
发明内容
本发明的目的是通过液相杂交技术和高通量测序技术,同时实现对已知和未知病原体的筛查。既可以对目标的病原体进行捕获和富集,提高检测的灵敏度,又可以通过对“非目标区域”的序列进行分析,扩大检测范围。
具体的,本发明的技术方案如下:
本发明第一个方面公开了一种高通量的病原体微生物基因检测筛查方法,包括:
S1:设计探针;
S2:芯片合成;
S3:提取样品中的DNA或RNA;
S4:文库构建;
S5:文库目标区域杂交捕获和测序;
S6:采用高通量测序平台检测;
S7:进行生信分析,采用Samtools来计算病原体基因组序列每个位点的深度;与探针目标区域重叠的序列被视为“目标序列”;相反,则被视为“非目标序列”。
应该理解,本发明不限于上述步骤,还可以包含其他的步骤,例如在步骤S1之前、步骤S1和S2之间、步骤S2和S3之间、步骤S3和S4之间、步骤S4和S5之间、步骤S5和S6之间、步骤S6和S7之间和步骤S7之后,还包含其他额外的步骤,而不超出本发明的保护范围。
优选的,选择目标病原体微生物作为筛查对象,运用生物信息学方法,选择该病原体基因组上的物种特异序列,并以此区域设计探针序列。
优选的,每种微生物设计1-100条探针,探针合成后,等摩尔体积混合,得到液相检测芯片。
优选的,所述样品为血液样品,样品采集和分离后得到cfDNA。
优选的,所述S4包括:
S41:分别取cfDNA进行QuantiFluorTM-ST(Promega)定量和Agilent 2100检测质量;
S42:以cfDNA作为样本,使用二代构建文库测序试剂盒分别制备基因组DNA文库和cfDNA文库。
更优选的,所述S42依次包括以下步骤:
末端补平、补平后纯化、加A尾、加A尾后纯化、加单分子标记接头、加接头后磁珠纯化、文库扩增、文库鉴定和文库纯化步骤。
优选的,所述高通量测序平台为illumine X-Ten。
优选的,所述S7包括:
S71:对下机数据进行数据分析,先进行数据拆分,再对数据进行质量值过滤,去除低质量数据;
S72:将测得序列的K-mers比对到所有参考基因组,将Kraken用作分类学分类器;根据kraken的算法,建立自定义分类,得到数据库;
S73:采用Samtools来计算病原体基因组序列每个位点的深度;得到目标序和“非目标序列”;
S74:使用自定义脚本来计算探针目标区域的覆盖范围以及非目标区域的序列数;如果一个病原体的序列同时出现在目标区域和非目标区域,则认定为阳性。
优选的,所述病原体为BK病毒。应当理解,本发明检测的病原体并不限于BK病毒,任何可用本发明方法检测出的病原体均在本发明的保护范围之内。
本发明第二个方面公开了上述方法在病原体检测中的应用。
在符合本领域常识的基础上,上述各优选条件,可任意组合,而不超出本发明的构思与保护范围。
本发明的技术方案使用液相杂交捕获技术,可以对要检测的目标病原体基因组序列进行探针的设计和制作,并对检测样品进行目标区域的捕获测序。本发明技术方案,可以通过调整杂交捕获的实验条件(杂交温度和杂交捕获试剂的配比),来获得不同比例的“上靶率”。上靶率=(属于目标区域的序列总数)/(属于该样品的所有下机序列)。上靶率一般是用来衡量液相杂交捕获技术的富集效率,上靶率越高,测序结果中属于目标区域的序列比例就越高,富集效果越好。非目标区域的片段,往往是被当成“没有用的序列”而丢弃。而本方面技术方案,可以对液相杂交捕获的测序结果中,属于“目标区域的序列”和“非目标区域的序列”都能进行分析利用。通过调整杂交捕获条件,获得的“非目标区域的序列”非常接近一个随机的WGS文库,而“目标区域序列”则是我们想要得到的目标片段。我们通过控制好液相杂交捕获技术的“上靶率”,让测序结果中的“目标序列”和“非目标序列”合理分配。在测序结果中,“目标序列”承担目标病原体的富集功能,能够以100倍以上的效率富集病原体序列,提高检出灵敏度。结果中的“非目标序列”是几乎没有偏向的宏基因组数据(WGS),即使没有被设计探针的病原体序列,只要存在于检测样品中,也能从“非目标序列”中被检测。而目标病原体的序列,既能在“目标序列”中被富集,又能在“非目标序列”中检测上,从而提高检测的准确率。
本发明相对于现有技术具有如下的显著优点及效果:
本发明方法既可以对目标的病原体进行捕获和富集,提高检测的灵敏度,又可以通过对“非目标区域的序列”进行分析,扩大检测范围。通过调整液相杂交捕获流程,可以对捕获过程的“on-target rate(上靶率)”进行调整,从20-75%不等。例如当上靶率在60%时,会有60%的下机数据属于我们设计的目标病原体,而剩余的40%下机数据是对检测样品核酸序列的随机测序,相当于一个宏基因组数据,而其中包含了非靶向的病原体序列,这是对目标区域捕获测序的补充。
因此,通过一次检测,可同时实现“靶向病原体检测”和“宏基因组检测”,既能提高靶向病原体的检测灵敏度,又能检测到未设计探针的病原体,扩大检测范围。
附图说明
图1为本发明实施例中检测一例BK病毒阳性的病人血浆样品的结果对比图。
具体实施方式
下面结合附图和实施例对本发明的技术方案进行详细描述,但并不因此将本发明限制在所述的实施例范围之中。
下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。本发明所用试剂和原料均市售可得。
实施例1
本实施例公开了一种高通量的病原体微生物基因检测筛查方法,包括以下步骤:
1.探针设计
根据研究目的,选择目标病原体微生物作为筛查对象,运用生物信息学方法,选择该病原体基因组上的物种特异序列,并以此区域设计探针序列。
2.芯片合成
针对56种微生物(可选10-5000种),共设计750条探针(每种微生物可以设计1-100条探针),探针合成后(由生工生物工程(上海)股份有限公司合成)等摩尔体积混合,得到液相检测芯片。
3.提取样品中的DNA或RNA
3.1、以血液样品为例,样本采集和血浆分离
3.1.1样本采集:抽取供体血液8ml左右,用抗凝血管保存运输;
3.1.2血浆分离:获得新鲜全血样本,1600g,4℃离心10min,分离上清液至新的离心管,将上清液继续16000g,4℃离心10min,离心后的上清液转移至新的离心管,得到分离后的血浆,血浆可在-20℃下保存;
3.1.3血细胞分离:全血样本离心后的下层沉淀即为血细胞。
3.2、用莱枫游离DNA提取试剂盒(DK607)抽提分离后血浆,得到cfDNA。
4.文库构建
4.1、分别取1μl cfDNA进行QuantiFluorTM-ST(Promega)定量,另取1μl使用Agilent 2100检测质量。
4.2、以cfDNA作为样本,使用KAPA LTP Library Preparation Kit分别制备基因组DNA文库和cfDNA文库,具体步骤如下所示:
4.2.1末端补平
4.2.1.1向标记好的离心管中加入表1所示的末端补平混合液,用移液器吹打混匀;
表1末端补平混合液
试剂名称
体积
水
8μl
KAPA End Repair Buffer(10×)
7μl
KAPA End Repair Enzyme Mix
5μl
总体积
20μl
4.2.1.2取50μl步骤4.2中定量后的样本,加入20μl表1所示的末端补平混合液,得到总体积为70μl的样本反应液,用移液器吹打混匀;
4.2.1.3在PCR仪上运行如下程序:
20℃保持30min,10℃静置。
4.2.2补平后纯化
重悬浮AgencourtAMpure XP reagent,磁珠室温放置30min。
4.2.2.1样品管中加入120μl磁珠和步骤4.2.1中末端补平后的样本反应液,充分吹打混匀,室温静置5min;
4.2.2.2将样品管置于磁力架上,待上清澄清后,吸弃上清;
4.2.2.3保持样品管在磁力架上,加入200μl新鲜配制的80%乙醇,室温孵育至少30sec,转动离心管以清洗磁珠,吸弃上清;
4.2.2.4保持样品管在磁力架上,加入200μl新鲜配制的80%乙醇,室温孵育至少30秒,转动离心管以清洗磁珠,吸弃上清;
4.2.2.5将样品管瞬时离心,放置于磁力架上去掉残存的乙醇,室温晾干至磁珠表面无明亮反光后,从磁力架上取下样品管,加入42μl Nuclease-Free water重悬磁珠。
4.2.3加A尾
4.2.3.1根据样本的数量,计算所需试剂用量,于标记好的离心管中加入表2所示的混合液,用移液器吹打混匀;
表2加A尾混合液
试剂名称
1个样本
8个样本
48个样本
KAPAA-Tailing Buffer(10×)
5μl
40μl
240μl
KAPA A-Tailing Enzyme
3μl
24μl
144μl
总体积
8μl
64μl
384μl
4.2.3.2取42μl步骤4.2.2中纯化后的样本,加入8μl表4所示的混合液,总体积为70μl,用移液器吹打混匀;
4.2.3.3在PCR仪上运行如下程序:
30℃保持30min,10℃静置。
4.2.4加A尾后纯化
4.2.4.1样品管中加入KAPA PEG/NaCl SPRI Solution 90μl和步骤(3)中加A尾后的样本反应液,充分吹打混匀,室温静置5min;
4.2.4.2将样品管置于磁力架上,待上清澄清后,吸弃上清;
4.2.4.3保持样品管在磁力架上,加入200μl新鲜配制的80%乙醇,室温孵育至少30sec,转动离心管以清洗磁珠,吸弃上清;
4.2.4.4保持样品管在磁力架上,加入200μl新鲜配制的80%乙醇,室温孵育至少30sec,转动离心管以清洗磁珠,吸弃上清;
4.2.4.5将样品管瞬时离心,放置于磁力架上去掉残存的乙醇,室温晾干至磁珠表面无明亮反光后,从磁力架上取下样品管,加入32μl Nuclease-Free water重悬磁珠。
4.2.5加单分子标记接头
4.2.5.1根据样本的数量,计算所需试剂用量,于标记好的离心管中加入如下表3所示的接头连接混合液和步骤4.2.4所得纯化后的样本(Beads with DNA),用移液器吹打混匀:
表3接头连接混合液
试剂名称
1个样本
单分子标记接头
5μl
5×KAPA Ligation Buffer
10μl
KAPA T4 DNA Ligase
5μl
Beads with DNA
30μl
总体积
18μl
4.2.5.2连接:20℃保持15min。
4.2.6加接头后磁珠纯化
4.2.7文库扩增
4.2.7.1室温解冻2×KAPA HiFiHotStartReadyMix,于标记好的离心管中加入表4所示的文库扩增体系,用移液器吹打混匀;
表4文库扩增体系
试剂名称
1个样本
2×KAPA HiFiHotStartReadyMix
25μl
primer(10μM)
2μl
总体积
27μl
4.2.7.2取23μl步骤4.2.6中的纯化样本加入27μl表6所示的PCR扩增体系,总体积50μl,用移液器轻轻混匀,瞬时离心2s,在PCR仪上运行如下程序:98℃变性45s,8个循环(98℃变性45s,65℃退火30s,72℃延伸30s),72℃延伸1min,4℃冷却静置。
4.2.8文库鉴定
取2μl步骤4.2.7所得PCR产物于2%琼脂糖凝胶电泳,确定片段分布于250-500bp之间。
4.2.9文库纯化
4.2.9.1加入AgencourtAMpure XP reagent 50μl于样品管中,样本管中盛装有步骤4.2.7中扩增后的文库样本,充分吹打混匀,室温静置5min。
4.2.9.2瞬时离心样品管2s,置于磁力架上5min,吸弃上清。
4.2.9.3保持样品管在磁力架上,加入200μl新鲜配制的80%乙醇,快速转动样品管以清洗磁珠,吸弃上清。
4.2.9.4将样品管瞬时离心,放置于磁力架上去掉残存的乙醇,室温晾干至磁珠表面无明亮反光,加入22μl Nuclease free water,用移液器吹打混匀。室温静置2min,再次放置于磁力架上,取20μl上清于新的离心管。
4.2.9.5取1μl样本使用QuantiFluorTM-ST(Promega)精确定量,得到样本文库,将样本文库保存至-20℃或进行下一步的杂交捕获。
5.文库目标区域杂交捕获、测序
5.1、将纯化后的文库样本浓度吸取总量为500ng的样本至新的1.5ml离心管,加入表5所示试剂,放入浓缩仪浓缩至完全干燥,如不立即进行下一步实验,可室温(15-25℃)放置过夜;
表5浓缩体系
5.2、杂交体系配制与文库的变性
5.2.1室温溶解xGen 2×Hybridization Buffer,根据文库样本数量,配制表6所示的杂交混合液,用移液器吹打混匀;
表6杂交混合液
试剂名称
1个反应体积
xGen 2×Hybridization Buffer
8.5μL
xGen Hybridization Buffer Enhancer
2.7μL
Nuclease-Free Water
1.8μL
总体积
13μL
5.2.2向每管步骤5.1中浓缩完成后的样本加入13μl表6所示的杂交混合液,室温静置5min;
5.2.3用移液器吹打混匀样本并转移至low-bind 0.2ml PCR管,将样本放入PCR仪运行如下程序:
95℃保持10min,65℃静置;
5.2.4当95℃运行结束时,保持样本在PCR仪上,立即加入4μl xGen LockdownProbe pool,用移液器吹打混匀,避免产生气泡,此时反应总体积为17μl。
5.2.5记录杂交开始时间,根据实验进度,选择4h或16h杂交时间。
5.3、配制Wash Buffer
5.3.1根据表7将xGen 2×Bead Wash Buffer、xGen 10×Wash Buffer I、xGen10×Wash Buffer II、xGen 10×Wash Buffer III、xGen 10×Stringent Wash Buffer配制成1×工作液,移液器吹打混匀;
表7工作液体系
5.3.2准备稀释好的Wash Buffer I和Stringent Wash Buffer,按表8条件存放,其它试剂于室温存放(保证65℃孵育时间不少于2h);
表8存放条件
试剂名称
1×工作液体积
1×工作液储存温度
Wash Buffer I
100μL
65℃
Wash Buffer I
200μL
室温(15-25℃)
Stringent Wash Buffer
400μL
65℃
5.3.3准备M-270磁珠
从4℃冰箱中取出M-270磁珠,确认磁珠已放置于室温30min,涡旋混匀使磁珠重悬浮;
5.3.3.1在1.7ml low-bind管中为每个样本准备100μl磁珠;
5.3.3.2将low-bind管置于磁力架上,静置至管内液体澄清,吸弃上清;
5.3.3.3加入200μl 1×Bead Wash Buffer,涡旋混匀10sec,静置于磁力架上至管内液体澄清,吸弃上清;
5.3.3.4重复步骤5.3.3.3一次;
5.3.3.5加入100μl 1×Bead Wash Buffer,移液器吹打混匀。
5.3.3.6将100μl悬浮磁珠转移至新的0.2ml low-bind管,置于磁力架上,静置至管内液体澄清,吸弃上清。
5.4、捕获
5.4.1确认步骤2的杂交反应已满足4h,保持样本和磁珠在PCR仪上,将样品转至准备好的磁珠管内,移液器吹打混匀,避免产生气泡;
5.4.2 65℃孵育45min,期间每隔12min将磁珠混匀(保持样本在PCR仪上),避免产生气泡。
5.5、洗涤
注意以下步骤需在65℃条件下快速操作:
5.5.1每个样本加入100μl 1×Wash Buffer I(65℃预热),快速混匀;
5.5.2将样品转移至一新的1.7ml管中(65℃预热),快速混匀;
5.5.3样品管置于磁力架上,静置至管内液体澄清,吸弃上清;
5.5.4加入200μl 1×Stringent Wash Buffer(65℃预热),轻柔混匀,65℃水浴5min。样品管置于磁力架上,静置至管内液体澄清,吸弃上清;
5.5.5重复步骤(4)一次;
5.5.6加入200μl常温1×Wash Buffer I,涡旋混匀2min。样品管置于磁力架上,静置至管内液体澄清,吸弃上清;
5.5.7加入100μl常温1×Wash Buffer II,涡旋混匀1min。样品管置于磁力架上,静置至管内液体澄清,吸弃上清;
5.5.8加入200μl常温1×Wash Buffer III,涡旋混匀30sec,样品管置于磁力架上,静置至管内液体澄清,吸弃上清;
5.5.9将样品管从磁力架上取下,加入20μl Nuclease-Free Water,移液器吹打混匀,确保所有磁珠处于悬浮状态并全部转至0.2ml PCR管。
5.6PCR富集
5.6.1室温解冻2×KAPA HiFiHotStartReadyMix,配制PCR扩增体系。
5.6.2每个样本(23μL)加入27μL PCR mix,总体积50μL,用移液器轻轻混匀,瞬时离心2s,在PCR仪上运行如下程序:98℃变性45s,12个循环(98℃变性15s,60℃退火30s,72℃延伸30s),72℃延伸1min,4℃冷却静置。
5.7纯化
重悬浮AgencourtAMpure XP reagent,确认磁珠已放置室温30min,每个样本用70μl beads纯化,20μl洗脱。
5.8文库定量
5.8.1取1μl步骤7中纯化后的样品用QubitFluorometer 3.0定量;
5.8.2取2μl PCR产物用于2%琼脂糖凝胶电泳,剩余样本于-20℃保存。
6.高通量测序
样本数据量为10M Reads,插入片段选择178(测序平台为illumine X-Ten,或其他高通量测序平台)。
7.生信分析
对下机数据进行数据分析,先进行数据拆分,再对数据进行质量值过滤,去除低质量数据。然后将测得序列的K-mers比对到所有参考基因组,将Kraken用作分类学分类器。根据kraken的算法,灵敏度和准确性高度依赖于数据库大小,我们建立了一个自定义分类该数据库包括984种细菌,248种真菌,657种病毒,古细菌,34种寄生虫和人类基因组GRCh38。
Kraken算法对错误和序列敏感,通常输出精度高,但灵敏度结果却较低。从数据库中提取目标病原体的基因组(也出现在第一步结果中)作为参考。分配有分类标签的相应序列也用bwa进行比对。对符合以下条件的序列进行计数:a)比对中小于5bp的错配。b),比对中少于2个插入缺失。c),在bwa输出的CIGAR字符串中最多出现2个soft-clipping。d),在双端读取的两端同时发生soft-clipping时,插入大小小于500bp或估计的插入大小等于比对长度。e),比对长度超过100bp。采用Samtools来计算病原体基因组序列每个位点的深度。与探针目标区域重叠的序列被视为“目标序列”,相反,被视为“非目标序列”。然后,使用自定义脚本来计算探针目标区域的覆盖范围以及,非目标区域的序列数。如果一个病原体的序列同时出现在目标区域和非目标区域,则认定为阳性。没有被探针覆盖的病原体,不会出现在目标区域内,但通过分析非目标区域的序列,可以找到其它的病原体序列,从而可以扩大检测范围,实现对非目标区域病原体的检测。
实施例2
本实施例对一例BK病毒阳性的病人血浆样品进行检测,方法与实施例1类似,命名为T型检测,区别在于检测对象为BK病毒。
本实施例一共测了长度为PE75的3.5M reads。其中设计的BK病毒探针区域为0.3Kb,下机数据中共有34.8K条序列来自BK病毒的目标区域,22.7K条序列来自BK病毒的非目标区域。同时又对该样品进行了宏基因组测序(WGS),并把测序结果与T型检测中的“目标BK序列”和“非目标BK序列”进行了对比(圈图)。圈图最内圈是WGS的检测结果,中圈是T型检测得到的“非目标BK序列”,外圈是T型检测得到的“目标BK序列”。可以看到中圈和内圈的结果非常相似,即我们的T型检测可以实现等同于WGS的检测效果。而外圈中的目标序列被显著富集,平均测序深度约为非目标序列的114倍。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。