一种用于低宿主背景干扰的核酸文库制备方法及应用

文档序号:1811507 发布日期:2021-11-09 浏览:18次 >En<

阅读说明:本技术 一种用于低宿主背景干扰的核酸文库制备方法及应用 (Preparation method and application of nucleic acid library for low host background interference ) 是由 涂波 丁泽琴 孙梓健 于 2021-08-06 设计创作,主要内容包括:本发明涉及动物、植物及微生物靶基因的扩增技术领域,具体涉及一种用于低宿主背景干扰的核酸文库制备方法及应用;可以改善核酸靶向测序分析技术,并可以提供准确的靶向测序、多重测序及高通量测序;可以用于对核酸的低拷贝靶基因进行测序,降低宿主高丰度核酸干扰;可用于核酸靶基因的靶向测序;可用于核酸靶基因的去除用于测序,提高检测准确性。(The invention relates to the technical field of amplification of target genes of animals, plants and microorganisms, in particular to a preparation method and application of a nucleic acid library for low host background interference; the technology of nucleic acid target sequencing analysis can be improved, and accurate target sequencing, multiple sequencing and high-throughput sequencing can be provided; the method can be used for sequencing low copy target genes of nucleic acid, and reducing the interference of host abundant nucleic acid; can be used for the target sequencing of nucleic acid target genes; can be used for removing the target gene of nucleic acid for sequencing and improving the detection accuracy.)

一种用于低宿主背景干扰的核酸文库制备方法及应用

技术领域

本发明涉及动物、植物及微生物靶基因的扩增技术领域,尤其涉及一种用于低宿主背景干扰的核酸文库制备方法及应用。

背景技术

在目前涉及生物研究的技术中,从Sanger测序到以Illumina测序平台的二代测序技术和单分子测序为主的三代测序,核酸测序技术得到了广泛的应用。随着测序技术的不断发展,虽然不同的测序平台的测序准确性及精确性不断提高,但是对于复杂样本中混合有大量于靶基因同源的或非同源的核酸序列带来的污染难以消除这一难题仅从测序平台的更迭是无法消除的。这一问题在单一物种的测序中尚能通过算法优化等方法加以克服,但对于多物种混合测序(如宏基因组测序)则会带来无法避免的污染。

在目前对于复杂样本靶基因测序的方法中,多种试验实践使用了在核酸纯化、聚合酶链式反应及测序数据后期去除等策略进行了改进,但无可避免的会在核酸纯化试剂盒的使用中造成样本核酸提取的偏差、聚合酶链式反应中使用特殊引物造成部分核酸片段无法扩增或扩增结果与实际丰度偏离和靶基因被高丰度同源序列掩盖等缺点。这些缺点最终导致了与靶序列同源性较高的核酸序列无法完全去除,靶序列的序列信息及丰度无法全部真实的获,降低了检测的准确性。

发明内容

本发明的目的在于提供一种用于低宿主背景干扰的核酸文库制备方法及应用,用于核酸样品中高丰度非靶序列的去除,同时提高低拷贝靶向基因序列在测序过程中不会被高丰度非同源核酸序列干扰,可在任意测序平台获得真实可靠结果,提高检测准确性。

为实现上述目的,第一方面,本发明提供了一种用于低宿主背景干扰的核酸文库制备方法,包括:

设计靶序列探针引物,使用聚合酶获得核酸模板,进而获得探针;

探针通过与靶序列进行杂交形成DNA-RNA复合体;

使用非配对核酸内切酶和单链特异性核酸酶切断杂交体;

使用靶序列通用引物获得扩增子群体进行测序文库构建。。

在一实施方式中,所述靶序列探针引物为单一寡聚核苷酸、一系列寡聚核苷酸或修饰的寡聚核苷酸中的一种。

在一实施方式中,设计靶序列探针引物,使用聚合酶获得核酸模板,进而获得探针,具体包括:

使用扩增引物和核酸模板对靶向或非靶向序列进行扩增子扩增,产生一个或多个扩增子。

在一实施方式中,设计靶序列探针引物,使用聚合酶获得核酸模板,进而获得探针,具体还包括:

使用DNA模板用于产生靶向基因的扩增子生成探针,所述探针为DNA、RNA或DNA/RNA杂交探针。

在一实施方式中,探针通过与靶序列进行杂交形成DNA-RNA复合体,具体杂交方式为:

探针与靶标核酸通过退火方式杂交、探针与靶标核酸在缓冲液中进行杂交、探针与靶标核酸在紫外线处理下杂交、探针拴系于固体或半固体支持物上与核酸杂交、探针与拴系于固体或半固体支持物上的核酸杂交中的一种。

在一实施方式中,所述非配对核酸内切酶为T7核酸内切酶。

在一实施方式中,所述单链特异性核酸酶为S1核酸酶。

第二方面,本发明还提供一种用于低宿主背景干扰的核酸文库的应用,对核酸文库进行高通量测序。

本发明的一种用于低宿主背景干扰的核酸文库制备方法及应用,可以改善核酸靶向测序分析技术,并可以提供准确的靶向测序、多重测序及高通量测序;可以用于对核酸的低拷贝靶基因进行测序,降低宿主高丰度核酸干扰;可用于核酸靶基因的靶向测序;可用于核酸靶基因的去除用于测序,提高检测准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的一种用于低宿主背景干扰的核酸文库制备方法的流程示意图。

图2是实施例4的结果图。

图3是本发明提供的群落结构多样性分析图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

请参阅图1,图1是本发明实施例提供的一种用于低宿主背景干扰的核酸文库制备方法的流程示意图。具体的,所述用于低宿主背景干扰的核酸文库制备方法可以包括以下步骤:

S101、设计靶序列探针引物,使用聚合酶获得核酸模板,进而获得探针;

在本发明实施例中,对待测序靶序列设计扩增引物。该引物可用于一个或多个扩增子的扩增使用。该引物:可以是单一寡聚核苷酸,或一系列寡聚核苷酸,或修饰的寡聚核苷酸。使用核酸作为探针来源的模板用于非靶向或靶向基因的消除,该模板可以是:线性DNA片段、线性RNA片段、亚克隆至环状载体的核酸片段或核酸文库中的核酸序列。在一些情况下,模板来源于DNA、RNA、cDNA或基因组DNA的片段化产物。在一些情况下,通过超声处理、酶消化、加热处理、反复移液处理、机械震荡和雾化的方式对模板DNA进行片段化。所述靶序列探针引物为单一寡聚核苷酸、一系列寡聚核苷酸或修饰的寡聚核苷酸中的一种。使用扩增引物和核酸模板对靶向或非靶向序列进行扩增子扩增;产生一个或多个扩增子,其中该扩增子通过以下步骤产生:通过涉及靶基因引物与核酸进行杂交,进行引物的延伸反应,将引物的延伸反应产物与特定的核酸序列连接成为扩增子;将一个或多个扩增子与标识符序列进行连接用于产生非靶向基因结合探针。在一些实施方案中,生成作为探针模板的核酸片段含有一个或多个靶向基因序列的核酸片段。在一些实施方案中,多个靶向基因的核酸片段通过基因合成仪产生。在一些实施方案中,多个靶向基因的核酸片段通过限制性内切酶切割后使用核酸连接酶连接产生。在一些实施方案中,多个靶向基因的核酸片段通过同源重组酶产生。在一些实施方案中,靶向基因的序列包含整个靶基因的核酸序列。在一些实施方案中,靶向基因的序列包含靶基因的部分核酸序列。在一些实施方案中,扩增子的扩增可通过线性扩增、非线性扩增、等温扩增或滚环扩增以完成。在一些实施方案中,将至少一个扩增子与至少一个不同的扩增子连接。在一些情况下,扩增子包含分子条形码、核酸序列,非A、T、G或C的核酸。在一些情况下,标识符序列位于扩增子的5‘端。在一些情况下位于扩增子的3’端。在一些实施方案中,将用于产生靶向基因的扩增子生成探针。在一些情况下,该探针为寡聚核苷酸探针。在一些情况下,该探针为DNA、RNA或DNA/RNA杂交探针。在一些情况下,探针为线性探针、非线性探针或茎环结构探针的一种或多种。在一些情况下,探针中含有类寡核苷酸衍生物。在一些情况下,探针中含有核苷酸修饰分子。在一些情况下,探针包含兼并序列。在一些情况下,探针包含引物序列。在一些情况下,探针包含非引物序列。在一些情况下,探针通过DNA聚合酶或RNA聚合酶生成,探针包含经修饰的核苷酸或脱氧核苷酸。在一些情况下,探针通过核酸外切酶产生。在一些情况下,探针通过核酸内切酶或者限制性内切酶产生。在一些情况下,探针通过基因合成仪产生。

S102、探针通过与靶序列进行杂交形成DNA-RNA复合体;

在本发明实施例中,生成的探针的靶标是一个或多个靶向基因。在一些实施方案中,生成的探针含有一个或多个靶向基因序列的核酸片段。在一些实施方案中,多个靶向基因的核酸片段通过基因合成仪产生。在一些实施方案中,多个靶向基因的核酸片段通过限制性内切酶切割后使用核酸连接酶连接产生。在一些实施方案中,探针结合的靶标核酸是单链DNA、双链DNA、RNA、cDNA和基因组DNA。在一些情况下,通过以下方法对核酸进行片段化:超声处理、酶消化、加热处理、反复移液处理、紫外线处理、机械震荡处理和雾化处理。

在一些实施方案中,探针与靶标核酸杂交。在一些情况下,探针与靶标核酸通过退火方式杂交。在一些情况下,探针与靶标核酸在缓冲液中进行杂交。在一些情况下,探针与靶标核酸在紫外线处理下杂交。在一些情况下,探针拴系于固体或半固体支持物上与核酸杂交。在一些情况下,探针与拴系于固体或半固体支持物上的核酸杂交。

在一些实施方案中,探针与靶标核酸杂交后的杂交体进行去除。在一些情况下,通过修饰的磁珠对杂交体进行空间分离去除。在一些情况下,通过核酸酶进行酶切去除。在一些情况下,通过加热或机械震荡的方式去除。

在一些实施方案中,将未与探针结合的核酸分离、富集纯化。在一些情况下,通过将核酸于琼脂糖凝胶中进行分离纯化。在一些情况下,通过将核酸通过核酸吸附剂进行空间分离,核酸吸附剂包括:羟基磁珠(磁性微球)、羧基磁珠(磁性微球)、氨基化磁珠(磁性微球)、核酸吸附柱、玻璃粉、玻璃纤维和玻璃珠。

S103、使用非配对核酸内切酶和单链特异性核酸酶切断杂交体;

在本发明实施例中,所述非配对核酸内切酶可以是T7核酸内切酶。所述单链特异性核酸酶可以是S1核酸酶。单链特异性核酸酶本发明使用的引物或探针与核酸靶标片段的一个或者多个区域具有特异性。在一些情况下,引物或探针与核酸靶标片段的一个或多个区域具有至少50%的互补序列。在一些情况下,引物或探针与核酸靶标片段的一个或多个区域具有至少75%的互补序列。在一些情况下,引物或探针与核酸靶标片段的一个或多个区域具有至少90%的互补序列。在一些情况下,引物或探针与核酸靶标片段的一个或多个区域具有至少100%的互补序列。

在一些实施方案中,本发明使用的引物或探针与非核酸靶标片段的一个或者多个区域具有特异性。在一些情况下,引物或探针与非核酸靶标片段的一个或多个区域具有至少50%的互补序列。在一些情况下,引物或探针与非核酸靶标片段的一个或多个区域具有至少75%的互补序列。在一些情况下,引物或探针与非核酸靶标片段的一个或多个区域具有至少90%的互补序列。在一些情况下,引物或探针与非核酸靶标片段的一个或多个区域具有至少100%的互补序列。

在一些实施方案中,本发明使用的引物或探针会引入经修饰的核苷酸、寡核苷酸或类寡核苷酸衍生物。在一些情况下,引物或探针的修饰可以在序列的5’端。在一些情况下,引物或探针的修饰可以在序列的3’端。在一些情况下,引物或探针的修饰可以在序列的中间片段任意位置。在一些情况下,引物或探针通过荧光基团修饰。在一些情况下,引物或探针通过生物素修饰。在一些情况下,引物或探针通过甲基化修饰。在一些情况下,引物或探针通过磷酸化修饰。在一些情况下,引物或探针通过锁核酸修饰。在一些情况下,引物或探针通过C3-Spacer或C5-Spacer修饰。在一些情况下,引物或探针通过地高辛修饰。

在一些实施方案中,将核酸探针与样品核酸进行杂交,核酸探针与靶基因结合,而非靶标核酸不与探针结合。

在一些实施方案中,将探针与靶基因形成的杂交链降解消除。

在一些实施方案中,将探针与靶基因形成的杂交链复合体通过亲和吸附从体系中移除。在一些情况下,杂交链复合体通过链霉亲和素磁珠(磁性微球)从体系中移除。杂交链复合体通过聚苯乙烯磁珠(磁性微球)从体系中移除。

在一些实施方案中,使用核糖核酸酶降解未与探针结合体系中的RNA。在一些情况下,使用RNase A降解体系中的RNA。在一些情况下,使用RNase H降解体系中的RNA。在一些情况下,使用S1 Nuclease降解体系中的RNA。在一些情况下,使用RNase A、RNase H或S1Nuclease中的一种或多种混合酶降解体系中的RNA。

S104、使用靶序列通用引物获得扩增子群体进行测序文库构建。

在本发明实施例中,将未与探针杂交的核酸片段富集后进行测序文库的构建。在一些实施方案中,核酸文库为高通量测序文库。在一些情况下,核酸文库为DNA测序文库。在一些情况下,核酸文库为RNA测序文库。在一些情况下,核酸文库是甲基化DNA文库。在一些情况下,核酸文库是甲基化RNA文库。在一些情况下,核酸文库为小于550bp的短片段测序文库。在一些情况下,核酸文库是大于等于1kb的长片段测序文库。

在一些情况下,核酸文库包含至少100个、至少至少1000个、至少10000个、至少100000个、至少1000000个、至少10000000个、至少100000000个、至少1000000000个、至少10000000000个核酸片段。

在一些情况下,通过选自以下的方法对核酸进行片段化:超声处理、酶消化、热处理、反复移液处理和雾化处理。

在一些实施方案中,本发明提供了包括对测序接头(Adaptor)序列、标签(Index)序列和核酸序列连接和富集的方法。在一些情况下,连接和富集的方法是通过线性扩增完成。在一些情况下,连接和富集的方法是通过滚环扩增完成。在一些情况下,连接和富集的方法是通过等温扩增完成。在一些情况下,连接和富集的方法是通过非线性扩增方法完成。

在一些实施方案中,测序文库的核酸序列将包含核酸分子条形码(Barcode)。在一些情况下,核酸分子条形码位于待测文库核酸分子的5‘端。在一些情况下,核酸分子条形码位于待测文库核酸分子的3‘端。在一些情况下,核酸分子条形码包含酶的靶序列。

在一些实施方案中,本发明提供了一种方法,其包括:对未与探针结合的核酸进行测序。在一些情况下,使用Sanger测序法进行测序。在一些情况下,使用边合成边测序的大规模平行测序法(Sequencing by Synthesis)进行测序。在一些情况下,使用单分子测序法进行测序。

在一些实施方案中,使用高性能计算机从高通量测序原始数据中读取并获得含有标识符序列的样品测序数据。在一些情况下,高通量测序原始数据是测序仪光学照相结果。在一些情况下,高通量测序原始数据是电脉冲记录结果。在一些情况下,高通量测序原始数据是fastq格式的测序数据。在一些情况下,高通量测序原始数据是fasta格式的测序数据。在一些情况下,高通量测序数据是Sanger测序的大量测序数据。

在一些实施方案中,引物延伸获得的产物为至少100个碱基、至少1000个碱基、至少10000个碱基的扩增子。

预见性实施例:

实施例1:样品总DNA的纯化及片段化

样本的总DNA通过CTAB法或样本对应的基因组DNA纯化试剂盒进行总DNA的纯化。纯化的总DNA通过Qubit荧光计或Nano Drop微量分光光度计测定核酸浓度,使用Agilent2100生物分析仪检测总DNA完整度。

实施例2:靶点基因的筛选及探针制备

以拟南芥叶片内生原核微生物检测为例,在NCBI Nucleotide核酸数据库检索植物质体及线粒体16S基因(NC_000932.1)序列,根据查询得到的拟南芥质体及线粒体序列进行化学合成对应DNA,并亚克隆至pUC18克隆载体中,命名为pUC18-NC321。使用引物AT7_515F/U806R和U515F/AT7_806R,以pUC18-NC321为模板分别扩增得到含有T7启动子的扩增子,随后将两个扩增子等摩尔量混合,获得探针DNA模板U4,终浓度为50ng/μl。

以U4为模板使用T7 RNA聚合酶进行体外转录合成RNA探针,反应体系如下:

组分 体积
10×Reaction Buffer 2μl
ATP(50mM) 2μl
CTP(50mM) 2μl
UTP(50mM) 2μl
GTP(50mM) 2μl
U4 DNA mix 5μl
T7 RNA polymerase Mix 2μl
ddH2O 3μl

将以上组分混合均匀,37℃孵育2小时。随后加入1μl DNaseI孵育10min去除U4DNA模板。将获得的RNA探针使用ZymoResearch RNA Clean&Concentrator-25进行回收纯化后使用Qubit定量后于-80℃保存,该探针命名为PU-4。

实施例3靶基因与探针结合

使用16S通用引物U27F/U1492R,以pUC18-NC321及ZymoBIOMICS MicrobialCommunity DNA Standard(D6306)作为模板进行PCR扩增,扩增产物分别进行DNA纯化回收后获得扩增子AF1和AZ1,将AF1和AZ1按10:1的比例混合后获得待处理靶基因样本FZ1,该样本终浓度为25ng/μl。

在本实施例中,将靶基因样本FZ1与实施例2中获得探针PU-4等量混合后,在热循环以上进行退火,获得的退火产物(MFZ1)将包含两种组分:组分1,AF1与PU-4在AF1片段的515bp-806bp区段形成DNA-RNA杂交体;组分2,含有AZ1和PU-4,两者无反应。

实施例4靶基因的去除

在实施例3中获得的退火产物MFZ1中加入1μl T7 EndonucleaseI(T7E1)/S1nuclease mix,37℃孵育15分钟,随后加入RNaseA,37℃孵育10min。以上反应产物通过使用ZymoResearch DNA Clean&Concentrator-100进行纯化浓缩后获得产物CFZ1。产物CFZ1进行琼脂糖凝胶电泳后分析产物,该产物显示,靶基因AF1的515-806bp区域已被切割断裂,分别形成515bp和756bp的DNA片段,而产物中的AZ1保持完整,如图2所示,其中M是DNA分子量标记,FZ1是靶基因DNA,CFZ为酶解后的DNA产物。

实施例5靶基因去除验证

本实施例通过使用高通量测序技术对CFZ1片段进行测序,验证FA1去除效率。实施方案如下:

使用16S rRNA基因U515F/U806R引物,以FZ1和CFZ1为模板进行PCR反应(进行3次技术重复),分别获得扩增产物SFZ1和SCFZ1,随后使用Illumina公司TruSeq DNA PCR-FreeSample Prep Kit(FC-121-3001/3003)构建测序文库,采用采用PE250测序方式,测序试剂盒使用Illumina公司Hiseq Rapid SBS Kit v2(FC-402-4023 500 Cycle)。获得的测序数据进行数据质控后进行OTU聚类,最终使用R语言进行数据转换后进行群落结构多样性分析。分析结果发现使用本发明所述方法可将占比较高的AF1(Arabidopsis Chloroplast)去除,仅剩非靶序列CFZ1。结果如图3所示。

本发明提供的一种用于低宿主背景干扰的核酸文库制备方法,可以改善核酸靶向测序分析技术,并可以提供准确的靶向测序、多重测序及高通量测序;可以用于对核酸的低拷贝靶基因进行测序,降低宿主高丰度核酸干扰;可用于核酸靶基因的靶向测序;可用于核酸靶基因的去除用于测序。

以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:利用受控气流的长丝的生产

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!