假阳性样本的排除方法、装置以及电子设备

文档序号:719688 发布日期:2021-04-16 浏览:33次 >En<

阅读说明:本技术 假阳性样本的排除方法、装置以及电子设备 (Method and device for eliminating false positive sample and electronic equipment ) 是由 李冬 杨智 贺贤汉 于 2020-12-30 设计创作,主要内容包括:本申请提供了一种假阳性样本的排除方法、装置以及电子设备,涉及数据检测技术领域,包括:获取未知样本的扩增数据,通过聚类方法从未知样本的扩增数据中确定明显扩增样本,计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值,基于标准差、最大扩增高度以及Ct-max值,排除未知样本中的假阳性样本,缓解了目前排除假阳性样本的精确度较低的技术问题。(The application provides a method and a device for eliminating false positive samples and electronic equipment, relates to the technical field of data detection, and comprises the following steps: obtaining amplification data of an unknown sample, determining an obviously amplified sample from the amplification data of the unknown sample by a clustering method, calculating standard deviations of a plurality of cyclic signals of the obviously amplified sample, the maximum amplification height of the obviously amplified sample and a Ct-max value corresponding to the maximum amplification height, and eliminating false positive samples in the unknown sample based on the standard deviations, the maximum amplification height and the Ct-max value, so that the technical problem of low accuracy of eliminating the false positive samples at present is solved.)

假阳性样本的排除方法、装置以及电子设备

技术领域

本申请涉及数据检测技术领域,尤其是涉及一种假阳性样本的排除方法、装置以及电子设备。

背景技术

目前,诊断传染病标准的核酸定量方法多采用荧光实时定量PCR,能够量化样品模板的初始值,常被用在基因分析表达、转基因食物检测和癌症检测中。

但是,目前实际的PCR扩增曲线是较为多样的,即使是同一次扩增实验,各孔位的扩增曲线也相差很大,而且,现有的方法都无法较为精确的消除不明显扩增曲线样本的分析结果差异,目前排除假阳性样本的精确度较低,难以从总体上对所有扩增孔位进行考察。

发明内容

本发明的目的在于提供一种假阳性样本的排除方法、装置以及电子设备,以缓解目前排除假阳性样本的精确度较低的技术问题。

第一方面,本申请实施例提供了一种假阳性样本的排除方法,所述方法包括:

获取未知样本的扩增数据;

通过聚类方法从所述未知样本的扩增数据中确定明显扩增样本;

计算所述明显扩增样本的多个循环信号的标准差、所述明显扩增样本的最大扩增高度以及所述最大扩增高度对应的Ct-max值;

基于所述标准差、所述最大扩增高度以及所述Ct-max值,排除所述未知样本中的假阳性样本。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述计算所述明显扩增样本的多个循环信号的标准差、所述明显扩增样本的最大扩增高度以及所述最大扩增高度对应的Ct-max值的步骤,包括:

计算所述明显扩增样本的多个循环信号的标准差;

根据多倍所述标准差的位置,得到所述明显扩增样本的Ct值,并基于所述Ct值查找所述明显扩增样本的最大扩增高度以及所述最大扩增高度对应的Ct-max值。

结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述基于所述标准差、所述最大扩增高度以及所述Ct-max值,排除所述未知样本中的假阳性样本的步骤,包括:

计算所述标准差的平均值;

根据所述平均值排除所述未知样本中的假阳性样本,并基于所述最大扩增高度以及所述Ct-max值排除所述未知样本中的假阳性样本。

结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,多倍所述标准差的位置中的倍数为10倍;

所述根据所述平均值排除所述未知样本中的假阳性样本的步骤,包括:

在除所述明显扩增样本以外的样本的最大扩增高度小于10倍平均标准差时,将所述扩增数据中的扩增曲线置为0,以排除所述未知样本中的假阳性样本。

结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述基于所述最大扩增高度以及所述Ct-max值排除所述未知样本中的假阳性的步骤,包括:

在除所述明显扩增样本以外的样本的最大扩增高度小于所述明显扩增样本的最大扩增高度的1/5,且除所述明显扩增样本以外的样本的Ct值小于所述Ct-max值时,将所述扩增数据中的扩增曲线置为0,以排除所述未知样本中的假阳性样本。

结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述扩增数据为PCR扩增数据;

所述假阳性样本为PCR假阳性样本。

结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述聚类方法为K-means聚类方法。

第二方面,本发明实施例提供了一种假阳性样本的排除装置,包括:

获取模块,用于获取未知样本的扩增数据;

确定模块,用于通过聚类方法从所述未知样本的扩增数据中确定明显扩增样本;

计算模块,用于计算所述明显扩增样本的多个循环信号的标准差、所述明显扩增样本的最大扩增高度以及所述最大扩增高度对应的Ct-max值;

排除模块,用于基于所述标准差、所述最大扩增高度以及所述Ct-max值,排除所述未知样本中的假阳性样本。

第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法的步骤。

第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述第一方面所述的方法。

本申请实施例带来了以下有益效果:

本申请实施例提供的一种假阳性样本的排除方法、装置以及电子设备,包括:首先获取未知样本的扩增数据,然后再通过聚类方法从未知样本的扩增数据中确定明显扩增样本,之后计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值,最后在基于标准差、最大扩增高度以及所Ct-max值,从而排除未知样本中的假阳性样本,本方案中,通过聚类方法从未知样本的扩增数据,能够确定明显扩增样本,再者,计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值,实现了最后根据标准差、最大扩增高度以及所Ct-max值,排除未知样本中的假阳性样本,缓解了目前排除假阳性样本的精确度较低的技术问题。

附图说明

为了更清楚地说明本申请

具体实施方式

或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种假阳性样本的排除方法的流程示意图;

图2为本申请实施例提供的一种假阳性样本的排除方法的另一流程示意图;

图3(a)和图3(b)为本申请实施例提供的一种假阳性样本的排除方法中PCR检测系统4个孔位的原始扩增数据示意图;

图4(a)和图4(b)为本申请实施例提供的一种假阳性样本的排除方法中PCR检测系统4个孔位的分析结果示意图;

图5为本申请实施例提供的一种假阳性样本的排除装置的结构示意图;

图6为示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,诊断传染病标准的核酸定量方法仍然多采用荧光实时定量PCR,其能够量化样品模板的初始值,常被用在基因分析表达、转基因食物检测和癌症检测中。当面对整版的多个孔位的PCR扩增曲线的情况下可以发现,其一:一些从原始扩增曲线上看不具有明显扩增的检测结果也出现了抬头,而这些抬头或者说千奇百怪的扩增曲线与具有明显扩增的曲线相比,其扩增高度是很低的;其二:一些具有相似的不明显原始扩增曲线的样本,最终的分析结果出现了差异,有些出现了抬头,而有些没有抬头。扩增高度低而出现了抬头也就是假阳性,需要进行鉴别清除。而之所以会出现这些问题,主要的原因在于,目前的分析方法一般采用的是“一步法”,即利用一种分析方法对每个孔位依次进行分析,显然,这样的分析方法不适应从总体上对所有扩增孔位进行考察的习惯。

实际的PCR扩增曲线是千奇百怪的,即使是同一次扩增实验,各孔位的扩增曲线也相差很大。但总体而言,可分为两类:具有明显扩增的及不具有明显扩增的。现有的方法都无法较为精确的消除不明显扩增曲线样本的分析结果差异,目前排除假阳性样本的精确度较低,难以从总体上对所有扩增孔位进行考察。

基于此,本申请实施例提供了一种假阳性样本的排除方法、装置以及电子设备,通过该方法可以缓解目前排除假阳性样本的精确度较低的技术问题。即首先利用聚类方法从未知样本的扩增数据确定明显扩增样本,其次计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值,最后再根据标准差、最大扩增高度以及所Ct-max值,排除未知样本中的假阳性样本,总体而言,该方法易于理解,容易实现,精度较高。

实施例一:

图1为本申请实施例提供的一种假阳性样本的排除方法的流程示意图。如图1所示,该方法包括:

步骤S110,获取未知样本的扩增数据。

步骤S120,通过聚类方法从未知样本的扩增数据中确定明显扩增样本。

步骤S130,计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值。

步骤S140,基于标准差、最大扩增高度以及所述Ct-max值,排除未知样本中的假阳性样本。

通过聚类方法从未知样本的扩增数据,能够确定明显扩增样本,再者,计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值,实现了最后根据标准差、最大扩增高度以及所Ct-max值,排除未知样本中的假阳性样本,缓解了目前排除假阳性样本的精确度较低的技术问题。

在一些实施例中,上述扩增数据为PCR扩增数据,上述假阳性样本为PCR假阳性样本。通过对PCR假阳性样本的确认,能够对明显扩增样本进行统计结果,排除假阳性样本。

示例性的,上述步骤S110中获取未知样本扩增数据的步骤,具体包括:步骤a),采集未知样本的PCR扩增数据。

例如,如图2所示,采集荧光强度数据。通过采集未知样本的PCR扩增数据,以便于后续对将所有未知样本扩增曲线分为明显扩增样本及非明显扩增样本。

在一些实施例中,上述步骤S130中计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值的过程,可以包括如下具体步骤:

步骤b),计算明显扩增样本的多个循环信号的标准差;

步骤c),根据多倍标准差的位置,得到明显扩增样本的Ct值,并基于Ct值查找明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值。

需要说明的是,如图2所示,计算明显扩增样本3-15个循环信号标准差、最大扩增高度及对应的Ct-max值方法为,计算明显扩增样本3-15个循环信号标准差,需要注意的是,因一次实验可能有多个明显扩增样本,为减少误差,保存所有明显扩增样本标准差并计算平均标准差。

通过计算明显扩增样本的多个循环信号的标准差,能够得到明显扩增样本的Ct值,从而根据Ct值查找明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值,对疑难PCR扩增曲线中的假阳性进行了排除,易于理解,容易实现,精度较高。

在一些实施例中,上述步骤S140中基于标准差、最大扩增高度以及Ct-max值,排除未知样本中的假阳性样本的过程,可以包括如下具体步骤:

步骤d),计算标准差的平均值。

步骤e),根据平均值排除未知样本中的假阳性样本,并基于最大扩增高度以及Ct-max值排除未知样本中的假阳性样本。

对于上述步骤d),当其他样本最大扩增高度小于10倍平均标准差时,将该样本扩增曲线置0,即排除该样本阳性可能。

对于上述步骤e),当其他样本最大扩增高度小于明显扩增样本最大扩增高度的1/5(注:经验值,可以根据大量实验结果得出),但Ct值小于Ct-max时将该样本扩增曲线置0,即排除该样本阳性可能。

如图2所示,通过计算标准差的平均值,能够根据平均值排除未知样本中的假阳性样本,从而基于最大扩增高度以及Ct-max值排除未知样本中的假阳性样本,对疑难PCR扩增曲线中的假阳性进行了排除,易于理解,容易实现,精度较高。

在一些实施例中,多倍标准差的位置中的倍数为10倍;上述步骤e)具体可以包括如下步骤:

步骤f),在除明显扩增样本以外的样本的最大扩增高度小于10倍平均标准差时,将扩增数据中的扩增曲线置为0,以排除未知样本中的假阳性样本。

对于上述步骤f),可以根据10倍标准差位置,获得各明显扩增样本Ct值,并找出最大扩增高度及对应Ct-max值。

需要说明的是,10倍标准差位置即为阈值线位置,其对应的横坐标即为该明显扩增样本Ct值。通过简单比较,即可获得具有最大扩增高度的明显扩增样本扩增高度及对应的Ct-max值。

通过将扩增数据中的扩增曲线置为0,能够排除未知样本中的假阳性样本,从而对疑难PCR扩增曲线中的假阳性进行了排除,精度较高。

在一些实施例中,上述步骤e)具体还可以包括如下步骤:

步骤g),在除明显扩增样本以外的样本的最大扩增高度小于明显扩增样本的最大扩增高度的1/5,且除明显扩增样本以外的样本的Ct值小于所述Ct-max值时,将扩增数据中的扩增曲线置为0,以排除述未知样本中的假阳性样本。

通过将扩增数据中的扩增曲线置为0,能够在除明显扩增样本以外的样本的Ct值小于所述Ct-max值时,以排除述未知样本中的假阳性样本。

本申请实施例中,可以利用博日荧光定量PCR检测系统进行了多次PCR扩增实验,并对采集到的原始扩增数据进行分析。这里以其中一次实验一个通道部分代表性孔位数据作为示例。图3(a)中选取了4个孔位的原始扩增数据,从上至下4条曲线以孔1-4区分,图3(b)为其中扩增高度较小的序号2-4孔位扩增数据放大图。

其中,数据基本参数,循环数目:40。单由图3(a)可见,1孔具有明显扩增,2孔稍有扩增,3、4孔扩增不明显。由图3(b)可见,2孔扩增变得明显,3孔具有上斜趋势,但扩增不明显,4孔稍有扩增。

对于计算结果,按照前述步骤,进行了分析,最终获得的各孔扩增曲线如图4所示,其中,图4(a)为4个孔位的总体扩增曲线,图4(b)为去除明显扩增的1孔之后的其他孔位扩增曲线放大图。

由图4(a)和图4(b)可见,孔1具有明显扩增,且在阈值线以上,即具有Ct值,孔2稍有扩增,具有明显抬头,但没有达到阈值线标准,孔3无扩增,孔4虽在原始扩增曲线表现有一定扩增,但其扩增高度也未达到阈值线,该扩增非真实扩增,已排除。

在一些实施例中,上述步骤S120中的聚类方法为K-means聚类方法。示例性的,首先利用直接差分法计算扩增曲线导数曲线,找出所有极大值点,其次以导数最大值为一类,以其他极大值点做为另一类,进行K-means二分聚类分析,计算轮廓系数,最后考察轮廓系数,如果该二分类总体轮廓系数达到给定的阈值(注:一般设置成接近1的值,比如0.99),则该二分类成立,该样本为明显扩增样本。

通过利用K-means聚类方法找出明显扩增样本,能够计算明显扩增样本3-15个循环信号标准差、最大扩增高度及对应的Ct-max值,从而对疑难PCR扩增曲线中的假阳性进行了排除,易于理解,容易实现,精度较高。

实施例二:

图5为本申请实施例提供的一种假阳性样本的排除装置的结构示意图,如图5所示,假阳性样本的排除装置500包括:

获取模块501,用于获取未知样本的扩增数据;

确定模块502,用于通过聚类方法从未知样本的扩增数据中确定明显扩增样本;

计算模块503,用于计算明显扩增样本的多个循环信号的标准差、明显扩增样本的最大扩增高度以及最大扩增高度对应的Ct-max值;

排除模块504,用于基于标准差、最大扩增高度以及Ct-max值,排除未知样本中的假阳性样本。

实施例三:

本申请实施例提供的一种电子设备,如图6所示,电子设备600包括存储器601、处理器602,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。

参见图6,电子设备还包括:总线603和通信接口604,处理器602、通信接口604和存储器601通过总线603连接;处理器602用于执行存储器601中存储的可执行模块,例如计算机程序。

其中,存储器601可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口604(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

总线603可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器601用于存储程序,所述处理器602在接收到执行指令后,执行所述程序,前述本申请任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器602中,或者由处理器602实现。

处理器602可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器602中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器602可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器601,处理器602读取存储器601中的信息,结合其硬件完成上述方法的步骤。

实施例四:

对应于上述假阳性样本的排除方法,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有机器可运行指令,计算机可运行指令在被处理器调用和运行时,计算机可运行指令促使处理器运行假阳性样本的排除方法的步骤。

本申请实施例所提供的假阳性样本的排除装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述假阳性样本的排除方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:扩增曲线基线确定方法、装置以及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!