一种判断二代测序检测基因编辑结果可信度的方法及应用

文档序号:1955242 发布日期:2021-12-10 浏览:13次 >En<

阅读说明:本技术 一种判断二代测序检测基因编辑结果可信度的方法及应用 (Method for judging reliability of second-generation sequencing detection gene editing result and application ) 是由 曾婉俐 李雪梅 向海英 高茜 米其利 刘欣 李晶 黄海涛 杨光宇 蒋佳芮 许力 于 2021-09-14 设计创作,主要内容包括:本发明公开了一种判断二代测序检测基因编辑结果可信度的方法及应用,方法包括:(1)针对单个样本的有效数据和能够匹配上靶基因的数据均大于等于2000条;匹配上靶基因的数据与有效数据的比大于等于50%;(2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,变异序列与参考序列的比大于等于10:1,判断此突变序列为纯合型突变;若未检测到变异序列,则认为未发生编辑;(3)将GQ值设置为大于等于30;(4)有检测到变异序列时,同时满足(1)-(3)的判定变异结果可信,否则不可信;对于未检测到变异序列的,满足(1)则认为该非变异结果可信,否则不可信。解决了二代测序结果判定中出现的假阳性或假阴性,提高检测结果的可信度。(The invention discloses a method for judging the credibility of a second-generation sequencing detection gene editing result and application thereof, wherein the method comprises the following steps: (1) the effective data aiming at a single sample and the data which can match the upper target gene are more than or equal to 2000; the ratio of the data of the matched target genes to the effective data is more than or equal to 50 percent; (2) detecting a variant sequence different from a reference sequence at a certain position in 23nt targeted by the sgRNA sequence, wherein the ratio of the variant sequence to the reference sequence is more than or equal to 10:1, and judging that the variant sequence is homozygous mutation; if no variant sequence is detected, no editing is considered to occur; (3) setting the GQ value to be greater than or equal to 30; (4) if the variant sequence is detected, the judgment variant results of (1) to (3) are credible, otherwise, the judgment variant results are not credible; for sequences in which no variant is detected, if (1) is satisfied, the non-variant result is considered to be authentic, otherwise, the non-variant result is not authentic. The method solves the problem of false positive or false negative in the judgment of the second-generation sequencing result, and improves the reliability of the detection result.)

一种判断二代测序检测基因编辑结果可信度的方法及应用

技术领域

本发明涉及植物基因工程技术领域,特别涉及一种判断二代测序检测基因编辑结果可信度的方法及应用。

背景技术

基因编辑技术CRISPR-Cas9是快速实现特定基因突变的有效手段,目前在育种和基因功能研究中得到广泛的研究应用。CRISPR-Cas9是对靶标基因进行编辑,通过靶标基因的变异改变素材的性状、研究靶向基因的功能。经CRISPR-Cas9获得的编辑素材,需要通过基因测序检测靶向基因的编辑位置、编辑类型和基因型。

编辑素材的单个靶向基因的突变检测,常规采用一代测序进行检测,通过对一代测序得到的峰图进行分析,判定靶基因的编辑位置、编辑类型和基因型,该方法测序成本高、峰图分析工作量大。当规模创制编辑素材,需要检测的靶向基因增多时,仍然采用一代测序会增加测序成本和峰图分析的工作量,因此出现了经PCR后采用二代测序的方式检测靶基因突变的方法。二代测序方法可同时对上千个样本进行测序分析靶向基因的突变,主要经PCR扩增、建库、上机测序、数据拆分和分析判定不同靶基因的编辑位置、编辑类型和基因型。

目前二代测序通过检测结果变异序列(alt)和参考序列(ref)之间的差异和比值进行统计分析来判定编辑位置、编辑类型;基因型的判断,则是通过变异检测软件根据ref/alt的支持reads数目得到的检测到。这样的判定没有考虑到reads数目以及比例等,会造成靶基因的变异检测结果和非变异检测结果存在假阳性或者假阴性,影响下一代研究样本的选择。

发明内容

本发明所要解决的技术问题是提供一种判断二代测序检测基因编辑结果可信度的方法及应用,解决了二代测序结果判定中出现的假阳性或假阴性,提高检测结果判断的可信度,提高了获得纯合编辑素材的效率。

本发明所要解决的技术问题是通过以下技术方案来实现的:

一种判断二代测序检测基因编辑结果可信度的方法,包括以下步骤:

(1)数据量的限定:针对单个样本的有效数据(Clean Reads)大于等于2000条;能够匹配上靶基因的数据(Mapped Reads)大于等于2000条;匹配上靶基因的Mapped Reads数占比Clean Reads的比值(用于判定PCR 的特异性),Mapped Rate大于等于50%;

(2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,当变异序列(alt)与参考序列(ref)之间的比值DP-Value 大于等于10:1时,判断此突变序列为纯合型突变(Hom),否则判断为杂合型突变(Het);若没有检测到变异序列(alt),则认为没有发生编辑;

(3)数据分析表明,当(2)中有检测到变异序列时,genotype quality (GQ)值大于等于30时,样本下一代检测结果的稳定性更好,因此,这里将GQ值设置为大于等于30;

(4)有检测到变异序列时,同时满足步骤(1)、步骤(2)和步骤(3) 的则判定该变异结果可信为“Right”,否则不可信为“Wrong”;对于未检测到变异序列的样本,满足步骤(1)则认为该非变异结果可信为“Right”,否则不可信为“Wrong”。

优选地,还包括以下步骤:

(5)判断发生变异的检测结果为“Right”的样本,则表示该样本靶基因发生编辑的结果可信,可优先进行研究;判断发生非变异的检测结果为“Right”的样本,则表示该样本靶基因未发生编辑的结果可信,不进行下一步研究。

优选地,还包括以下步骤:

(6)经判断发生变异的或未发生变异的但检测结果为“Wrong”的样本,则表示该样本靶基因发生编辑或者未发生编辑的结果不可信,可再次进行上机测序再判断是否进一步研究。

优选地,步骤(6)中的可再次进行上机测序再判断是否进一步研究是指重新进行步骤(1)-(4)的方法;或者重新进行步骤(1)-(5)的方法;或者重新进行步骤(1)-(6)的方法。

一种根据上述的判断二代测序检测基因编辑结果可信度的方法的应用。

优选地,应用于混池敲除文库创制烟草基因编辑素材的高通量。

本发明上述技术方案,具有如下有益效果:

本申请经过对检测结果的reads数和比例进行设定,从而对二代变异检测结果和非变异检测结果的可信度进行判断,进一步提高编辑检测结果和非变异检测结果的准确性,为基因编辑素材的突变检测结果的准确判断提供支持,提高检测结果的可信度,同时也提高了获得纯合编辑素材的效率。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1为本申请的样本S1在靶点内发生G到GT的纯合插入突变图。

图2为本申请的样本S4在靶点内未发生变异图。

图3本申请的样本S7在靶点内未发生变异图。

图4本申请的样本S8在靶点内未发生变异图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

一种判断二代测序检测基因编辑结果可信度的方法,包括以下步骤:

(1)数据量的限定:针对单个样本的有效数据(Clean Reads)大于等于2000条;能够匹配上靶基因的数据(Mapped Reads)大于等于2000条;匹配上靶基因的Mapped Reads数占比Clean Reads的比值,大于等于50%;

(2)在sgRNA序列靶向的23nt中,某个位置检测到区别于参考序列的变异序列,当变异序列(alt)与参考序列(ref)之间的比值DP-Value 大于等于10:1时,判断此突变序列为纯合型突变(Hom),否则判断为杂合型突变(Het);若没有检测到变异序列(alt),则认为没有发生编辑;

(3)将genotype quality(GQ)值设置为大于等于30;

(4)有检测到变异序列时,同时满足步骤(1)、步骤(2)和步骤(3) 的则判定该变异结果可信为“Right”,否则不可信为“Wrong”;对于未检测到变异序列的样本,满足步骤(1)则认为该非变异结果可信为“Right”,否则不可信为“Wrong”。

(5)判断发生变异的检测结果为“Right”的样本,则表示该样本靶基因发生编辑的结果可信,可优先进行研究;判断发生非变异的检测结果为“Right”的样本,则表示该样本靶基因未发生编辑的结果可信,不进行下一步研究。

(6)经判断发生变异的或未发生变异的但检测结果为“Wrong”的样本,则表示该样本靶基因发生编辑或者未发生编辑的结果不可信,可再次进行上机测序再判断是否进一步研究。

以下实施例1和实施例2均按照上述方法分析:

实施例1

样本:选择4个样本进行二代测序检测靶基因突变的结果(如表1所示),具体为:

(1)选择的4个样品记为S1、S2、S3和S4,它们单个样本的有效数据 (Clean Reads)和能够匹配上靶基因的数据(Mapped Reads)均大于等于2000 条,并且4个样本匹配上靶基因的Mapped Reads数占比Clean Reads的比值 Mapped Rate,分别是98.54%、98.27%、98.02%和98.66%,均大于50%;

(2)sgRNA序列靶向的23nt中,位置190检测到区别于参考序列(G) 的变异序列(GT),S1-S3的变异序列(alt)与参考序列(ref)之间的比值DP-Value 均满足大于等于10:1,判断这个样本在此位点的变异为纯合型变异(Hom); S4未检测到变异序列,判断这个样本在此位点未发生变异;

(3)S1、S2和S3样本的genotype quality(GQ)值分别是72、99和99,均满足大于30;

上述4个样品中,S1、S2和S3样本同时满足了条件(1)-(3)。因此,认为样本S1、S2和S3在位置190发生了从G-GT的变异,变异类型均是纯合型(Hom),该结果可信,判断为“Right”;S4满足了条件(1),但S4未检测到变异,认为样本S4在sgRNA序列靶向的23nt中,未发生变异,结果可信,判断为“Right”。

(4)下一步研究将优先选择S1、S2和S3进行,S4不再进行研究。

表1:S1-S4的可信度分析表

为验证高通量判定变异检测的结果,对S1和S4进行一代测序验证,如图1所述样本S1在sgRNA序列靶向的23nt中,发生了从G到GT的纯合插入突变;图2显示样本S4在sgRNA序列靶向的23nt中,未发生变异。

实施例2

样本:选择4个样本进行二代测序检测靶基因突变的结果(如表2所示),具体为:

(1)选择的4个样品记为S5、S6、S7和S8,其中样本为S6、S7和S8 的Clean Reads和Mapped Reads分别大于等于2000条,并且三个样本的 Mapped Rate分别是93.29%、99.84%和99.87%,均大于50%;

(2)sgRNA序列内的23nt中,S5、S6、S7和S8均没有检测到变异序列;

(3)样品S6、S7和S8满足了条件(1)。因此,认为样本S6、S7和S8 在23nt的序列内未发生变异,判断该结果可信;样本S5在23nt的序列内未发生变异,判断该结果不可信。

(4)放弃对样品S6、S7和S8的研究,S5可再次上机再判断是否进一步研究。

表2:S5-S8的可信度分析表

为验证高通量判定变异检测的结果,对S7和S8进行一代测序验证,如图3和图4所示样本S7和S8在sgRNA序列靶向的23nt中,均未发生变异。

虽然本发明已以实施例公开如上,然其并非用于限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种不同的选择和修改,因此本发明的保护范围由权利要求书及其等同形式所限定。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种生存期预测模型的生成方法及装置、存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!