适用于PacBio测序平台的原核全长初始转录本建库方法及应用

文档序号:1350625 发布日期:2020-07-24 浏览:10次 >En<

阅读说明:本技术 适用于PacBio测序平台的原核全长初始转录本建库方法及应用 (Prokaryotic full-length initial transcript library building method suitable for PacBio sequencing platform and application ) 是由 方涛 于 2020-04-09 设计创作,主要内容包括:本发明提供一种适用于PacBio测序平台的原核全长初始转录本建库方法及应用,包括:依次在原核生物总RNA的3’末端加尾、5’末端添加生物素标记帽子,然后捕获带有生物素标记的初始转录本,最后合成初始转录本全长cDNA并构建其PacBio文库。该方法在原核转录组的3’末端加尾作为cDNA全长扩增一链合成的引物位点,实现了原核生物进行全长转录组测序,扩大了全长转录组测序技术的适用范围。同时,在初始转录本5’末端添加生物素标记的帽子,然后富集目标全长初始转录本,从而去除总RNA中的rRNA,极大的提高了数据有效率;合成全长cDNA时,在第一条链的末端添加额外核苷酸序列作为第二链引物的结合位点,避免SMARTer技术的偏好性问题,使测序更加均一。(The invention provides a prokaryotic full-length initial transcript library building method suitable for a PacBio sequencing platform and application thereof, wherein the method comprises the following steps: and sequentially adding a tail at the 3 &#39;end and a biotin-labeled cap at the 5&#39; end of the total RNA of the prokaryote, capturing an initial transcript with a biotin label, finally synthesizing the full-length cDNA of the initial transcript and constructing a PacBio library of the initial transcript. The method adds the tail at the 3&#39; end of the prokaryotic transcriptome as a primer site for cDNA full-length amplification one-strand synthesis, realizes the full-length transcriptome sequencing of prokaryotes, and enlarges the application range of the full-length transcriptome sequencing technology. Meanwhile, a biotin-labeled cap is added at the 5&#39; end of the initial transcript, and then the target full-length initial transcript is enriched, so that rRNA in total RNA is removed, and the data efficiency is greatly improved; when synthesizing full-length cDNA, adding extra nucleotide sequence at the end of the first chain as the binding site of the second chain primer, avoiding the preference problem of SMARTer technology and making the sequencing more uniform.)

适用于PacBio测序平台的原核全长初始转录本建库方法及 应用

技术领域

本发明涉及高通量测序文库构建技术领域,更具体地,涉及一种适用于PacBio测序平台的原核全长初始转录本建库方法及应用。

背景技术

随着第二代基因测序技术的发展,对生物样本的转录组测序也日趋成熟。科学家对所研究的样本进行转录组测序,探究不同品系、不同外界条件处理、不同发育时期、不同组织或不同细胞之间的基因表达差异。利用二代测序平台的转录组测序技术可针对基因结构进行研究,如发现cSNP、SSR、预测ORF等。二代测序技术的优势在于通量高,能比较精确地反映不同样本之间的基因表达差异,但基于读长的限制,在文库构建过程中需要对mRNA样本进行打断,并在信息分析过程中进行重新拼接,这样就会导致存在一定的误差;另外,对于测序结果中的5’端和3’端的信息不完整,往往得不到mRNA的全长序列。

针对二代测序平台进行转录组测序的弊端,美国PacBio公司的三代测序平台可以针对真核生物的全长转录组进行直接测序。基于PacBio三代测序读长长的优势,mRNA序列无需打断即可测通,获得全长转录本,提供精确的可变剪接和转录起始位点信息,准确分辨同源异构体,同源基因,家族基因和等位基因,为下游分子克隆实验提供极佳序列文库。对于特异种质资源,可以发现鉴定新基因。通过对样本的全长转录组测序,可以获得物种大量的mRNA全长序列。全长mRNA的获得,将为广大的科研工作者提供更好的技术支持。在很多科研项目中,尤其涉及到基因功能的研究,需要获得靶基因的mRNA全长序列,对于基因组序列未知的物种,需要通过RACE(cDNA末端快速扩增)技术来获得mRNA全长,而该方法技术难点高,实验周期长,往往成为获得靶基因mRNA全长序列的瓶颈。基于三代测序平台的全长转录组测序,将很好地解决这一技术问题,通过该技术获得大量的真核生物mRNA全长序列,科学家可以从中选取感兴趣的基因进行后续研究。

三代全长转录组测序,即利用PacBio三代测序平台对某一物种的mRNA进行测序研究。凭借超长读长的优势,无需打断RNA分子,直接对反转录的全长cDNA测序,即可得到从5’末端到3’PolyA尾的高质量全长转录本序列,从而对同源异构体(isoform)、可变剪接、融合基因、同源基因、超家族基因、等位基因表达等进行精确分析。三代全长转录组测序以平均超长读长10-15kb的优势、结合多片段文库筛选技术,实现了无需拼接的转录本分析,克服了传统二代转录组Unigene拼接较短、转录本结构不完整的缺陷,也由于其可直接获得单个RNA分子从5’端到3’端的高质量全部转录组信息而得名。

相比二代的转录组测序,三代全长转录组的优势说明如下:a.超长读长(平均读长20-30K,最长读长300K),可一次将真核生物的全长转录本信息读取完整;b.无需进行片段打断和拼接,避免出现组装错误;c.基于全长转录组测序得到的完整准确的转录本信息,结合二代数据,方便识别特异性表达且做更加精确的基因和转录本表达定量。d.针对有参考基因组的物种,全长转录组信息可以纠正基因组的错误组装、更准确地发现新的转录本和基因、分析基因融合事件等。e.无需链特异性建库,全长转录组测序可直接获取正义链、反义链及部分LncRNA信息。

目前的全长转录组测序都是基于真核生物的mRNA具有poly(A)结构设计的,真核生物的成熟mRNA在3’端存在poly(A)尾巴,使用Clontech的SMARTerPCR cDNA SynthesisKit可以直接合成真核生物的全长cDNA。对于原核转录组,由于没有poly(A)尾巴的存在,无法适用真核全长转录组的流程,同时,由于SMARTer技术的链转换效率,在转录本的5’端测序存在偏好性,部分全长转录组很难测序到。针对这些技术缺陷,本专利开发出一种基于原核生物的原核全长初始转录本建库技术。

发明内容

针对现有技术中存在的技术问题,本发明提出了一种适用于PacBio测序平台的原核全长初始转录本建库方法及应用,该方法解决SMARTer技术的链转换效率低、转录本测序存在偏好性的问题,实现了原核生物进行全长转录组测序,扩大了全长转录组测序技术的适用范围。

为实现上述目的,本发明是通过以下技术方案实现的:

本发明的第一个目的是提出一种适用于PacBio测序平台的原核全长初始转录本建库方法,包括:1)在原核生物的总RNA的3’末端加尾;2)3’末端加尾的原核总RNA的5’末端添加生物素标记帽子;3)捕获带有生物素标记的初始转录本;4)合成初始转录本全长cDNA;5)全长cDNA的PacBio文库构建。

进一步地,所述合成初始转录本全长cDNA包括以下步骤:

(1)合成初始转录本全长cDNA的第一条链;

(2)cDNA的第一条链末端添加额外的核苷酸序列,作为第二条链的引物结合位点;

(3)合成初始转录本全长cDNA的的第二条链;

(4)扩增并纯化全长cDNA。

更进一步地,所述步骤(2)中采用末端转移酶TdT给cDNA的第一条链末端添加额外的核苷酸序列

更进一步地,使用TdT进行末端碱基添加的反应体系为:初始转录本全长cDNA的第一条链纯化产物39μL、TdT Buffer(10X)5μL、CoCl2solution(2.5mM)5μL、10mM dCTP或dGTP0.5μL、Terminal Transferase(20units/μl)0.5μL。

进一步地,所述全长cDNA的PacBio文库构建包括以下步骤:

(1)初始转录本全长cDNA损伤修复;

(2)末端修复;

(3)对末端修复产物连接测序接头;

(4)核酸外切酶消化及纯化。

进一步地,所述文库构建还包括文库质检以确定文库大小。

本发明的第二个目的是提出一种适用于原核生物的全长转录组测序方法,包括采用上述任一项所述的建库方法进行原核生物全长初始转录本建库,然后采用高通量PacBio测序平台进行测序。

与现有技术相比,本发明的有益效果在于:

(1)本发明提出的适用于PacBio测序平台的原核全长初始转录本建库方法,以原核生物总RNA为检测样本,在原核转录组的3’末端加尾作为后续cDNA全长扩增时一链合成的引物位点,使原核转录组可以适用真核生物的建库流程,实现了原核生物进行全长转录组测序,扩大了全长转录组测序技术的适用范围。

(2)基于Total RNA中含有90%以上对测序数据无用的rRNA的原因,本申请针对原核生物的初始转录本在5’端存在三磷酸基团,而降解的转录本与成熟的核糖体RNA的5’端仅存在一个磷酸基团的这一特征,通过在具有三个磷酸基团的5’端加上具有生物素标记的帽子结构,然后通过链酶亲和素磁珠可以捕获全长初始转录本,实现核糖体RNA的去除,同时也确定捕获的为RNA的全长序列。

(3)本发明在逆转录合成cDNA的第一条链后,使用TdT酶在末端添加额外的核苷酸序列作为第二链的引物的结合位点,实现cDNA的全长扩增。可以避免SMARTer技术的扩增选择偏好性问题,使转录本的测序更加均一可靠。

附图说明

图1为适用于PacBio测序平台的原核全长初始转录本建库方法流程图。

图2为原核生物总RNA 5’末端添加生物素标记帽子筛选初始转录本原理图。

图3为使用不同方案合成全长cDNA的效果示意图。

图4为构建的大肠杆菌全长初始转录本文库大小分布结果示意图。

具体实施方式

展示一下实例来具体说明本发明的某些实施例,且不应解释为限制本发明的范围。对本发明公开的内容可以同时从材料、方法和反应条件进行改进,所有这些改进,均应落入本发明的的精神和范围之内。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。

实施例1:大肠杆菌全长初始转录本建库

本实施例以大肠杆菌总RNA为研究对象,构建适用于PacBio测序平台的原核全长初始转录本测序文库,其技术流程如图1所示。具体方法为:首先在原核转录组的3’末端加尾作为后续cDNA全长扩增时一链合成的引物位点,然后在原核总RNA的5’末端添加生物素标记帽子并捕获带有生物素标记的初始转录本,从而去除核糖体RNA(其原理如图2所示);最后进行初始转录本全长cDNA的合成并构建全长cDNA的PacBio文库。在逆转录合成cDNA的第一条链后,使用TdT酶在末端添加额外的核苷酸序列作为第二链的引物的结合位点,实现cDNA的全长扩增。

一、在大肠杆菌的Total RNA的3’末端添加poly(A)尾

此部分使用的试剂均采购自NEB,大肠杆菌的Total RNA检测合格后(总量>1ug,RIN值>7)进行如下实验,反应体系配制如表1:

表1大肠杆菌Total RNA的3’末端添加poly(A)尾反应体系

轻弹混匀后37℃孵育30min。反应30min可以在3’末端添加100bp以上的poly(A)尾巴。

反应结束后,使用RNAclean Beads进行纯化,最后使用10μl nuclease freewater洗脱,获得纯净的具有poly(A)尾的原核RNA(Totalpoly(A)RNA)。

二、大肠杆菌的5’末端添加生物素标记帽子

此部分使用的试剂均采购自NEB,大肠杆菌Total RNA的5’末端添加生物素标记帽子反应体系配制如表2:

表2大肠杆菌Total RNA的5’末端添加生物素标记帽子反应体系

轻弹混匀后70℃孵育2min,立即置于冰上。然后加入表3中试剂:

表3

轻弹混匀后37℃孵育30min,立即置于冰上,使用RNAclean Beads进行纯化,最后使用87.5μl nuclease free water洗脱(DTB-GTP capped RNA),此步完成后会在完整的初始转录本的5’末端添加带有生物素标记的帽子结构。

三、带有生物素标记的初始转录本的捕获

使用Hydrophilic streptavidin magnetic beads(NEB#S1421S)进行生物素标记RNA的捕获富集,具体操作如下:

1、Hydrophilic streptavidinmagnetic beads的清洗

(1)将Hydrophilic streptavidin magnetic beads涡旋混匀,取30μL置于磁力架上2min至液体澄清,将液体转移至1.5mL的nuclease free管中;

(2)加入400μL的10mM Tris-HCl pH 7.5,50mM NaCl,1mM EDTA清洗两次;

(3)加入400μL的10mM Tris-HCl pH 7.5、500mM NaCl、1mM EDTA清洗两次;

(3)将原磁珠上清转回重悬。

2、生物素磁珠与生物素结合

(1)在处理的30μL生物素磁珠中加入87.5μL的DTB-GTP capped RNA,25℃孵育20min;

(2)加入200μL的10mM Tris-HCl pH 7.5、500mM NaCl、1mM EDTA清洗两次;

(3)加入200μL的10mM Tris-HCl pH 7.5、50mM NaCl、1mM EDTA清洗两次;

(4)加入30μL的10mM Tris-HCl pH 7.5、50mM NaCl、1mM EDTA和1mM biotin,25℃孵育20min,置于磁力架上收集上清;

(5)使用RNA clean Beads进行纯化,最后使用30μL nuclease free water洗脱。

3、生物素磁珠与生物素二次结合

加入30μL处理的生物素磁珠进行二次结合与洗脱,最后使用RNA clean Beads进行纯化,使用6μLnuclease free water洗脱,获得初始转录本RNA。

四、初始转录本全长cDNA的合成

1、使用NEB的ProtoScript II cDNA第一链合成试剂盒(#E6560)合成初始转录本RNA的全长cDNA。取新的0.2mL PCR管,置于冰上,加入表4所述试剂:

表4

轻柔涡旋混匀,瞬时离心,置于PCR仪上65℃5min。

表4中所述的3’RTprimer(12μM)在上海生工合成,序列为:

SEQ ID NO.1:AAGCAGTGGTATCAACGCAGAGTACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN

2、上步反应结束后瞬时离心,置于冰上,加入表5所述试剂:

表5

首先轻柔涡旋混匀,瞬时离心,42℃60min延伸;然后加入50units Rnase,37℃30min;使用1X DNAclean Beads进行纯化,使用39μl nuclease free water洗脱。

3、逆转录合成cDNA的第一条链后,使用TdT酶在末端添加额外的核苷酸序列作为第二链的引物的结合位点,实现cDNA的全长扩增。使用TdT进行末端碱基添加,反应体系如表6所示:

表6

首先轻柔涡旋混匀,瞬时离心,37℃30min;然后使用1X DNAclean Beads进行纯化,使用36.5μl nuclease free water洗脱。

4、合成初始转录本全长cDNA的的第二条链,使用KAPA的扩增试剂,反应如表7所示:

表7

轻柔涡旋混匀,瞬时离心,95℃30s,60℃3mins。然后使用1X DNAclean Beads进行纯化,使用40μl nuclease free water洗脱。

3’RTprimer(12μM)在上海生工合成,序列为:

SEQ ID NO.2:AAGCAGTGGTATCAACGCAGAGTACGGGGGGGGGG

GGGGGGGGGG

5、扩增全长cDNA,使用KAPA的扩增试剂,反应如表8所示:

表8

PCRprimer(12μM)在上海生工合成,序列为:

SEQ ID NO.3:AAGCAGTGGTATCAACGCAGAGTAC

充分混匀,瞬时离心,将Mix平均分到8联排的0.2mL PCR管中(每管50μL);将PCR管置于PCR仪上,进行PCR扩增。

PCR扩增后结果见图3。图3中M泳道作为电泳条带大小的参考,1、2泳道为去除rRNA方式合成的cDNA(采用RiboMinus Transcriptome Isolation Kit,Bacteria(ThermoFisher K155004)试剂盒去除rRNA),可见明显的23S核糖体cDNA,3、4泳道为本专利方法合成的cDNA,不可见明显的23S和16S核糖体cDNA,5、6泳道为Total RNA合成的cDNA,可见明显的23S和16S核糖体cDNA。

反应完成后,将8联排管取出,立即使用1X DNAclean Beads进行纯化,使用40μlnuclease free water洗脱。对纯化后的cDNA进行质检,要求纯化后cDNA在2ug以上。

五、全长cDNA的PacBio文库构建

本步反应试剂均采购自PacBio。

(1)DNA损伤修复

取一新的0.2mL低吸PCR管,加入表9所示试剂:

表9

充分混匀,瞬时离心,37℃孵育20min,4℃恒温5min,反应完成后,置于冰上,待下一步反应。

(2)末端修复

向上步反应体系中加入如表10所示试剂:

表10

充分混匀,瞬时离心,25℃孵育5min,4℃保存,反应完成后立即磁珠进行纯化,使用31μL Elution Buffer洗脱。

(3)连接接头

向上步产物的0.2mL离心管中加入下表11所示试剂:

表11

充分混匀,瞬时离心,25℃孵育15min,65℃孵育10min使连接酶失活。

(4)核酸外切酶消化及纯化

向上步反应体系加入如表12所示试剂:

表12

充分混匀,瞬时离心,37℃孵育1h,反应结束后使用磁珠进行纯化,使用20μLElution Buffer洗脱,洗脱液即构建好的文库。

六、文库质检

取1μL文库,进行Qubit定量,确定文库浓度;取1μL文库进行2100检测,确定文库大小。文库大小检测峰图如图4所示。文库平均大小为1600bp。

实施例2:大肠杆菌全长转录组测序

依据PacBio官方标准测序流程对文库测序,产出33.16G数据,其中rRNA比例仅为0.68%,分析该数据共获得了309278条FLNC,说明该方案可以高效率的去除核糖体RNA,同时也可以高比例的获得原核全长初始转录本。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

序列表

<110> 嘉兴菲沙基因信息有限公司

<120> 适用于PacBio测序平台的原核全长初始转录本建库方法及应用

<160> 3

<170> SIPOSequenceListing 1.0

<210> 1

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aagcagtggt atcaacgcag agtacttttt tttttttttt tttttttttt tttttvn 57

<210> 2

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aagcagtggt atcaacgcag agtacggggg gggggggggg ggggg 45

<210> 3

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aagcagtggt atcaacgcag agtac 25

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种用于纳米孔测序建库的位置锚定条码系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!