基于蛋白质组的数据检测系统、方法、设备及存储介质

文档序号:1863196 发布日期:2021-11-19 浏览:42次 >En<

阅读说明:本技术 基于蛋白质组的数据检测系统、方法、设备及存储介质 (Proteome-based data detection system, method, device and storage medium ) 是由 丁琛 冯晋文 刘洋 李姚 杨烨 于 2020-05-15 设计创作,主要内容包括:本发明公开了一种基于蛋白质组的数据检测系统、方法、设备及存储介质,所述数据检测系统包括:接收模块及执行模块;所述接收模块用于接收待检测信息,所述待检测信息包括蛋白质组信息;所述执行模块用于将所述待检测信息输入至检测模型以获取检测结果。本发明通过对机体功能的执行者蛋白质的检测,可以克服现有技术中全基因组测序、外显子测序或对基因表达产物mRNA检测而对机体所患疾病预测有偏差的缺陷,通过将蛋白质组信息输入至检测模型可以自动获取对用户的检测结果,从而避免了人工检测程序的繁琐性及高时长性,能够准确反映待检测用户的生理机能状态。(The invention discloses a proteome-based data detection system, method, device and storage medium, wherein the data detection system comprises: a receiving module and an executing module; the receiving module is used for receiving information to be detected, and the information to be detected comprises proteome information; the execution module is used for inputting the information to be detected into a detection model to obtain a detection result. The invention can overcome the defect that the prediction of the diseases of the organism is biased by whole genome sequencing, exon sequencing or mRNA detection of gene expression products in the prior art by detecting the protein of the executor of organism functions, and can automatically acquire the detection result of a user by inputting proteome information into a detection model, thereby avoiding the complexity and high duration of manual detection procedures and accurately reflecting the physiological function state of the user to be detected.)

基于蛋白质组的数据检测系统、方法、设备及存储介质

技术领域

本发明涉及自动化分析领域,特别涉及一种基于蛋白质组的数据检测系统、方法、设备及存储介质。

背景技术

现有技术存在多种对机体的数据进行检测的方法,一般来说,对于机体中的分子特征可以使用组学的手段进行检测,在基因组学中,全基因组测序或是外显子测序可以分析个人基因组的变化和异常;在转录组学中,测量机体内mRNA(基因表达产物)的变化。通过上述方法可以实现对机体一定程度的数据检测,然而上述的组学技术手段并非检测的是机体功能的执行者蛋白质,所以它们无法准确地反映机体的生理状态。

发明内容

本发明要解决的技术问题克服了现有技术中对机体的检测结果无法反映机体准确的生理状态的缺陷,提供一种基于蛋白质组的数据检测系统、方法、设备及存储介质。

本发明是通过下述技术方案来解决上述技术问题:

本发明提供了一种基于蛋白质组的数据检测系统,所述数据检测系统包括:接收模块及执行模块;

所述接收模块用于接收待检测信息,所述待检测信息包括蛋白质组信息;

所述执行模块用于将所述待检测信息输入至检测模型以获取检测结果。

较佳地,所述数据检测系统还包括报告生成模块,用于根据所述检测结果自动生成检测报告。

较佳地,所述检测报告包括所述蛋白质组分析过程的质谱图。

较佳地,所述检测结果包括预测概率;

所述执行模块还用于判断所述预测概率是否大于或等于预设概率,若是,则生成第一提示信息,若否,则生成第二提示信息;

和/或,

所述数据检测系统还包括训练模块,用于将历史蛋白质组学数据输入至机器学习模型进行训练以获取所述检测模型。

较佳地,所述执行模块包括:检测流程获取单元及预测概率获取单元;

所述检测流程获取单元用于将所述待检测信息输入至检测模型以获取对应的检测流程;

所述预测概率获取单元用于根据所述检测流程对所述待检测信息进行分析以获取预测概率。

较佳地,所述预测概率获取单元包括:流程解析子单元、任务生成子单元、任务执行子单元及概率生成子单元;

所述流程解析子单元用于解析所述检测流程;

所述任务生成子单元用于根据解析后的所述诊断流程生成不同优先级的执行任务;

所述任务执行子单元用于根据所述执行任务的优先级依次执行所述执行任务;

所述概率生成子单元用于对所有所述执行任务执行完成后生成预测概率。

较佳地,所述流程解析子单元用于通过Airflow(一工作流管理框架)解析所述诊断流程;

和/或,

所述任务执行子单元用于通过Celery(一分布式任务调度系统)接收不同优先级的执行任务并将不同优先级的执行任务分配到执行进程中;

和/或,

所述数据检测系统还包括显示模块,用于显示所述执行任务的执行状态;

和/或,

所述数据检测系统还包括日志生成模块,用于生成所述执行任务的执行日志,并将所述执行日志存储至数据库中。

本发明还提供了一种基于蛋白质组的数据检测方法,所述数据检测方法包括:

接收待检测信息,所述待检测信息包括蛋白质组信息;

将所述待检测信息输入至检测模型以获取检测结果。

较佳地,所述数据检测方法还包括步骤:根据所述检测结果自动生成检测报告。

较佳地,所述检测报告包括所述蛋白质组分析过程的质谱图。

较佳地,所述检测结果包括预测概率;

将所述待检测信息输入至检测模型以获取检测结果的步骤包括:判断所述预测概率是否大于或等于预设概率,若是,则生成第一提示信息,若否,则生成第二提示信息;

和/或,

所述数据检测方法还包括步骤:将历史蛋白质组学数据输入至机器学习模型进行训练以获取所述检测模型。

较佳地,将所述待检测信息输入至检测模型以获取检测结果的步骤还包括:

将所述待检测信息输入至检测模型以获取对应的检测流程;

根据所述检测流程对所述待检测信息进行分析以获取预测概率。

较佳地,根据所述检测流程对所述待检测信息进行分析以获取预测概率的步骤包括:

解析所述检测流程;

根据解析后的所述诊断流程生成不同优先级的执行任务;

根据所述执行任务的优先级依次执行所述执行任务;

对所有所述执行任务执行完成后生成预测概率。

较佳地,通过Airflow解析所述诊断流程;

和/或,

通过Celery接收不同优先级的执行任务并将不同优先级的执行任务分配到执行进程中;

和/或,

所述数据检测方法还包括步骤:显示所述执行任务的执行状态;

和/或,

所述数据检测方法还包括步骤:生成所述执行任务的执行日志,并将所述执行日志存储至数据库中。

本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的数据检测方法。

本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的数据检测方法的步骤。

在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。

本发明的积极进步效果在于:本发明通过对机体功能的执行者蛋白质的检测,可以克服现有技术中全基因组测序、外显子测序或对基因表达产物mRNA检测而对机体所患疾病预测有偏差的缺陷,通过将蛋白质组信息输入至检测模型可以自动获取对用户的检测结果,从而避免了人工检测程序繁琐性及高时长性,能够准确反映待检测用户的生理机能状态。

附图说明

图1为本发明实施例1的基于蛋白质组的数据检测系统的模块示意图。

图2为本发明实施例2的基于蛋白质组的数据检测系统的模块示意图。

图3为本发明实施例3的执行模块的模块示意图。

图4为本发明实施例3的预测概率获取单元的模块示意图。

图5为本发明实施例4的基于蛋白质组的数据检测方法的流程图。

图6为本发明实施例5的基于蛋白质组的数据检测方法的流程图。

图7为本发明实施例5中步骤403的实现方式的流程图。

图8为本发明实施例6中步骤402的实现方式的流程图。

图9为本发明实施例6中步骤4022的实现方式的流程图。

图10为本发明实施例7中的电子设备的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。

实施例1

本实施例提供了一种基于蛋白质组的数据检测系统,如图1所示,本实施例中的数据检测系统包括:接收模块101及执行模块102。

其中,接收模块101用于接收待检测信息,执行模块102用于将待检测信息输入至检测模型以获取检测结果。

其中,待检测信息包括待检测用户的蛋白质组学信息。

本实施例中,通过对待检测用户的大量、高维度、结构化的蛋白质组学数据的检测,可以克服现有技术中全基因组测序、外显子测序或对基因表达产物mRNA检测而对机体所患疾病预测有偏差的缺陷,通过将蛋白质组信息输入至检测模型中可以自动获取对用户的检测结果,从而避免了人工检测程序繁琐性及高时长性,能够准确反映待检测用户的生理机能状态。

实施例2

本实施例提供了一种基于蛋白质组的数据检测系统,本实施例是对实施例1的进一步改进,如图2所示,本实施例中的数据检测系统还包括报告生成模块103,用于根据所述检测结果自动生成检测报告。

其中,检测报告所包含的条目可以根据实际需求进行设置,如,可以包括待诊断用户的个人信息,如姓名、性别及年龄等,可以包括待检测用户的历史检测信息,可以包括待检测用户的检测样品(如蛋白质组样品)的样品信息,如送样日期、样品编号、样品来源及样品类型等,可以包括检测信息,如检测项目、检测编号及检测方法等,可以包括检测结果信息,如质谱结果(质谱图、蛋白质鉴定总数等)、样品分型结果(聚类分析图)等,还可以包括检测总结论、对检测结果的说明、检测员、审核者、报告日期等条目。

可选的,检测报告生成模块103还可进一步通过网络推送服务将检测报告推送给待检测用户。

可选的,为了进一步给待检测用户提供检测结果,上述检测结果包括预测概率,执行模块102还用于判断所述预测概率是否大于或等于预设概率,若是,则生成第一提示信息,若否,则生成第二提示信息。

其中,在具体实践中,第一提示信息可用于提醒待检测用户的检测结果与某一具体疾病有关联,或作为诊断某一疾病的预测参考,第二提示信息可用于提醒待检测用户的检测结果未与某一具体疾病有关联,或作为未诊断出某一疾病的预测参考。

可选的,为了得到更有参考价值、预测结果更准确的检测模型,本实施例中的基于蛋白质组的数据检测系统还包括训练模块104,用于将历史蛋白质组学数据输入至机器学习模型进行训练以获取所述检测模型。

其中,历史蛋白质组学数据可来源于实验室产出的临床蛋白质组学数据,应当理解,该历史蛋白质组学数据可以不断更新,从而可以进一步训练机器学习模型,使得该检测模型也可以不断更新。

本实施例中,可以根据检测结果自动生成一检测报告,可以使检测结果以可视化形式便于用户查看。

本实施例中,执行模块根据检测结果生成提示信息从而进一步给用户提供了更有参考价值信息。

本实施例中,训练模块可以基于历史蛋白质组学数据训练机器学习模型从而得到一检测模型,该检测模型可以根据不同的蛋白质组学数据及不同的使用方法实现检测流程的增加、更新和删除操作,从而自动得到与待检测的蛋白质组学数据最匹配的检测流程。

实施例3

本实施例提供了一种基于蛋白质组的数据检测系统,本实施例是对实施例1或实施例2的进一步改进,如图3所示,执行模块102具体包括:检测流程获取单元1021及预测概率获取单元1022。

其中,检测流程获取单元1021用于将所述待检测信息输入至检测模型以获取对应的检测流程,预测概率获取单元1022用于根据所述检测流程对所述待检测信息进行分析以获取预测概率。

具体的,如图4所示,预测概率获取单元1022包括流程解析子单元10221、任务生成子单元10222、任务执行子单元10223及概率生成子单元10224。

流程解析子单元10221用于解析所述检测流程,任务生成子单元10222用于根据解析后的所述诊断流程生成不同优先级的执行任务,任务执行子单元10223用于根据所述执行任务的优先级依次执行所述执行任务,概率生成子单元10224用于对所有所述执行任务执行完成后生成预测概率。

其中,流程解析子单元10221利用Airflow流程调度和监视服务,完成对任务流程依赖关系的解析,任务生成子单元10222根据解析后的检测流程生成任务执行信息,并将任务发布到不同优先等级的消息队列中,任务执行子单元10223利用Celery的任务执行管理功能,通过Celery接收消息队列中的任务,并将它分配到执行进程中。

可选的,为了便于查询每一执行任务的执行状态,本实施例中的数据检测系统还包括显示模块及日志生成模块,显示模块用于显示所述执行任务的执行状态;日志生成模块用于生成所述执行任务的执行日志,并将所述执行日志存储至数据库中以供Airflow检查。

其中,显示模块还可用于实时显示各个执行任务的运行状态、复原提交的检测流程的结构和信息,以及保存、删除、分享和分析检测流程。

实施例4

本实施例提供了一种基于蛋白质组的数据检测方法,如图5所示,所述数据检测方法包括:

步骤401、接收待检测信息。

步骤402、将所述待检测信息输入至检测模型以获取检测结果。

其中,待检测信息包括待检测用户的蛋白质组学信息。

本实施例中,通过对待检测用户的大量、高维度、结构化的蛋白质组学数据的检测,可以克服现有技术中全基因组测序、外显子测序或对基因表达产物mRNA检测而对机体所患疾病预测有偏差的缺陷,通过将蛋白质组信息输入至检测模型中可以自动获取对用户的检测结果,从而避免了人工检测程序繁琐性及高时长性,能够准确反映待检测用户的生理机能状态。

实施例5

本实施例提供了一种基于蛋白质组的数据检测方法,本实施例是对实施例4的进一步改进,如图6所示,步骤402后还包括步骤403、根据所述检测结果自动生成检测报告。

其中,检测报告所包含的条目可以根据实际需求进行设置,如,可以包括待诊断用户的个人信息,如姓名、性别及年龄等,可以包括待检测用户的历史检测信息,可以包括待检测用户的检测样品(如蛋白质组样品)的样品信息,如送样日期、样品编号、样品来源及样品类型等,可以包括检测信息,如检测项目、检测编号及检测方法等,可以包括检测结果信息,如质谱结果(质谱图、蛋白质鉴定总数等)、样品分型结果(聚类分析图)等,还可以包括检测总结论、对检测结果的说明、检测员、审核者、报告日期等条目。

可选的,本实施例中在生成检测报告后,还可进一步通过网络推送服务将检测报告推送给待检测用户。

可选的,为了进一步给待检测用户提供检测结果,上述检测结果包括预测概率,如图7所示,步骤403具体可包括:

步骤501、判断所述预测概率是否大于或等于预设概率,若是,则执行步骤502,若否,则执行步骤503。

步骤502、生成第一提示信息。

步骤503、生成第二提示信息。

其中,在具体实践中,第一提示信息可用于提醒待检测用户的检测结果与某一具体疾病有关联,或作为诊断某一疾病的预测参考,第二提示信息可用于提醒待检测用户的检测结果未与某一具体疾病有关联,或作为未诊断出某一疾病的预测参考。

可选的,为了得到更有参考价值、预测结果更准确的检测模型,本实施例中的数据检测方法还包括步骤:将历史蛋白质组学数据输入至机器学习模型进行训练以获取所述检测模型。

其中,历史蛋白质组学数据可来源于实验室产出的临床蛋白质组学数据,应当理解,该历史蛋白质组学数据可以不断更新,从而可以进一步训练机器学习模型,使得该检测模型也可以不断更新。

本实施例中,可以根据检测结果自动生成一检测报告,可以使检测结果以可视化形式便于用户查看。

本实施例中,可以根据检测结果生成提示信息从而进一步给用户提供了更有参考价值信息。

本实施例中,可以基于历史蛋白质组学数据训练机器学习模型从而得到一检测模型,该检测模型可以根据不同的蛋白质组学数据及不同的使用方法实现检测流程的增加、更新和删除操作,从而自动得到与待检测的蛋白质组学数据最匹配的检测流程。

实施例6

本实施例提供了一种基于蛋白质组的数据检测方法,本实施例是对实施例4或实施例5的进一步改进,如图8所示,步骤402具体包括:

步骤4021、将所述待检测信息输入至检测模型以获取对应的检测流程。

步骤4022、根据所述检测流程对所述待检测信息进行分析以获取预测概率。

具体的,如图9所示,步骤4022还可以包括:

步骤40221、解析所述检测流程。

步骤40222、根据解析后的所述诊断流程生成不同优先级的执行任务

步骤40223、根据所述执行任务的优先级依次执行所述执行任务。

步骤40224、对所有所述执行任务执行完成后生成预测概率。

其中,步骤40221中利用Airflow流程调度和监视服务,完成对任务流程依赖关系的解析,步骤40222中根据解析后的检测流程生成任务执行信息,并将任务发布到不同优先等级的消息队列中,步骤40223中利用Celery的任务执行管理功能,通过Celery接收消息队列中的任务,并将它分配到执行进程中。

可选的,为了便于查询每一执行任务的执行状态以及整体检测流程,本实施例中的数据检测方法还包括下述步骤:

显示所述执行任务的执行状态;

生成所述执行任务的执行日志,并将所述执行日志存储至数据库中以供Airflow检查。

复原提交的检测流程的结构和信息;

保存、删除、分享和分析检测流程。

实施例7

本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例4-实施例6中任意一数据检测方法。

图10示出了本实施例的硬件结构示意图,如图10所示,电子设备9具体包括:

至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:

总线93包括数据总线、地址总线和控制总线。

存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。

存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例4-实施例6中任意一数据检测方法。

电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的,并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例8

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例4-实施例6中任意一数据检测方法的步骤。

其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例4-实施例6中任意一数据检测方法的步骤。

其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:蛋白质组学数据的分析系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!