一种基于医学检验数据的多病种预测方法

文档序号：139194 发布日期：2021-10-22 浏览：27次 >En<

阅读说明：本技术 一种基于医学检验数据的多病种预测方法 (Multi-disease prediction method based on medical inspection data ) 是由陈超宋彪韩泽文于 2020-12-31 设计创作，主要内容包括：本发明涉及一种基于医学检验数据的多病种预测方法。方法包括数据获取模块、数据处理模块、模型构建模块、疾病预测模块、结果显示模块。各个模块分别代表的内容如下,数据获取模块获取检验科的审核后常规检验数据,数据处理模块利用获取的检验数据对数据进行进一步的清洗转换和加载,模型构建模块则利用处理后的数据进行神经网络分类模型的构建,疾病预测模块使用构建好的模型进行实际检验数据的预测分析,结果输出模块将模型的预测后的结果转化整合为多病种概率输出。本发明创造可以打破以往经验及能力局限,利用常规检验数据同时预测多种疾病发生的概率,对疾病的发现及临床诊断提供了重要的信息。(The invention relates to a multi-disease prediction method based on medical inspection data. The method comprises a data acquisition module, a data processing module, a model construction module, a disease prediction module and a result display module. The data acquisition module acquires conventional examination data after examination of the clinical laboratory, the data processing module further cleans, converts and loads the data by using the acquired examination data, the model construction module constructs a neural network classification model by using the processed data, the disease prediction module performs prediction analysis on actual examination data by using the constructed model, and the result output module converts and integrates the predicted results of the model into multi-disease probability output. The invention can break the previous experience and ability limitations, and simultaneously predict the probability of occurrence of various diseases by using the conventional test data, thereby providing important information for disease discovery and clinical diagnosis.)

一种基于医学检验数据的多病种预测方法

技术领域

本发明创造涉及医学检验领域和疾病预测领域,具体涉及一种基于医学检验数据的多病种预测方法。

背景技术

经历了这次突如其来的新冠肺炎疫情，医院检验科在疫情防控及检测方面发挥了至关重要的作用，在医院中的地位也得到了明显的提升。检验科目前更加关注的问题在仪器设备质量控制，实验室流程自动化，以及更多提升检验科工作效率的问题，但是检验科如何在现有基础上进行更深一步的技术发展，除了简单提供检验结果之外，提供更多的基于检验结果的预测性信息是非常有意义的。第一:可以准确及时的辅助医生进行治疗手段的决策，第二:可以有效防止医生漏诊的情况，第三:可以为患者提供具有重要参考意义的预警信息。目前检验科能够利用以往经验根据特定项目的特定检验指标为一些特定的疾病提供临床诊断的依据，但是这是检验人员及临床医师长期积累的经验知识，也就是说如果没有长期的实验及大量临床样本的验证，形成新的知识非常困难且耗时。如果我们能快速有效的通过挖掘检验科的常规数据进行更深入的信息探索与整合从而发现我们利用以往经验不能直接判断的信息，就可以为医生及患者提供更加有意义的数据。为了挖掘检验科更多的价值，可以基于其大量的医学检验数据，利用机器学习进行深入的数据挖掘分析，以研究探索出检验数据背后隐藏的更多的需要大量经验知识才能发现的重要医学信息。

发明内容

针对上述问题为了挖掘出医学检验数据更多有价值的信息，本发明旨在提供一种基于医学检验数据的多病种预测方法。

本发明创造的总体架构为:数据获取模块、数据处理模块、模型构建模块、疾病预测模块、结果输出模块。以下为分模块详细步骤介绍:

数据获取模块:获取医学检验数据中的常规检验数据，如血常规、生化、尿常规等数据。

数据处理模块:将上述获取到的常规检验数据进行进一步处理，去除特殊值、缺失严重、超出正常检验指标范围的异常样本数据，为少量部分样本进行缺失值填补，数据的标准化处理。

模型构建模块:本模块利用数据处理模块后的数据，利用神经网络模型进行模型分类器的构建。

疾病预测模块:该模块将利用上述步骤中已经构建出的模型以及经过处理后的医学检验数据进行病种的预测。

结果输出模块:该模块将利用上述步骤中预测后返回的结果，再次进行结果的转化整合并展示最终的多病种预测概率结果。

本发明创造具有如下有益效果:本发明中的多病种预测方法基于医院常规检验数据，对于医院就医的大多数人群具有普适性，易于实践及广泛推广应用。本发明有利于医院检验科技术能力的进一步提升、有利用为临床诊断以及疾病预防提供更为准确的数据依据。

附图说明

利用附图对发明创造作进一步说明，但附图中的实施例不构成对本发明创造的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1是本发明结构示意图。

具体实施方式

本发明实施例的整体架构流程如图1所示，下面将以图1为主线进行对本发明实施例技术实现方法的详细阐述。

参见图1，本实施例的一种基于医学检验数据的多病种预测方法，包括数据获取模块、数据处理模块、模型构建模块、疾病预测模块、结果输出模块。

本实施例数据获取模块主要为lis系统的检验结果数据，且数据是经过审核过后的数据一般不会存在特别异常的不符合现实场景的数据，该类数据不仅对于本实施例而且对于其他相关研究也具有很大的价值。在医疗检验数据获取上要按照不同病种的检验结果进行分类获取，包括但不限于高血压、肺结核、冠心病、丙肝、乙肝等慢性疾病。

优选地、本实施例数据处理模块包含如下步骤:数据的格式转化,检验结果数据中存在例如:+、-、+1、-1、******等结果的数据，这些数据都有其自身代表的含义，不能简单的进行去除进行处理，需要通过格式转化来保留这类数据的结果价值。

数据的异常值处理。在医学领域异常值要比其他领域更为敏感。如个体之间的不同身体机能变化可能导致检验结果中的数值差距明显。但是这在医学上针对特殊的人并不一定就是异常，其恰恰是身体机能变化的正确体现。也就是说如果按照传统的异常检测方法可能使我们的数据中能反应疾病明显变化的特征消失，反而不利于我们从数据中发现问题。本实施例优选地利用临床检验结果的界限值进行异常值的处理，临床的界限值相比正常的检验结果范围更加宽泛，可以有效避免使用常规异常检测手段的弊端。

数据的缺失值处理。对于医学检验结果的缺失值填补一直没有很好的解决方案。所以在缺失值处理方面采用填补缺失前先判断缺失的方法。判断缺失的占样本总体的比例，缺失比例如小于20%则可利用缺失填补,如比例大于该水平则视情况而定，建议去除缺失样本。

数据的正态分布检验。设。表示来自总体的样本,表示样本均值，表示 i 阶样本中心矩。正态分布的偏度和峰度均为 0，其中偏度和峰度的定义分别为:

。

该检验就是根据这个特点来检验分布正态性的。

数据的标准化。本实施例中使用机器学习的方法构建神经网络模型,在数据学习的过程中需要转化为有利于机器学习的数据标准。在机器学习领域中，不同评价指标（即医学检验数据中不同的检验项目数据）往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。

数据样本不平衡处理。数据不平衡情况很常见如果没有好的方案解决会严重影响学习的效果。本例中在数据不平衡处理上采用过采样的方法，使较少类别的样本数据量增加。过采样的方法有多种，可以在原来数据的基础上随机过采样，也可以通过算法生成新的类似以前样本数据特征的新数据。在使用时可以根据实际测验结果，择优选取。

数据集的划分。数据集划分为训练集测试集，一般训练集样本应比测试集样本多，比较常用的比例为8:2、7:3、7.5:2.5等，本例采用8:2的比例进行数据集分配，应用时可根据实际训练情况选取最合适的比例。

优选地,本实施例模型构建模块。采用神经网络为基础模型，分别构建不同病种的分类器。模型以keras顺序模型为基础架构进行搭建。模型共分为三大层:输入层、隐藏层、输出层。隐藏层的设置是最为灵活的，本例中隐藏层设置为5层，利用relu函数进行激活。隐藏层后接入输出层采用sigmoid函数激活。神经网络中的其他参数,如:神经元个数、训练批大小、损失函数、寻最优化损失算法及其他优化手段可以根据实际情况选择合适的搭配。

优选地,本实施例疾病预测模块。预测模块需要准备好需要进行预测的检验数据，数据格式及标准需要同模型训练使用的规格相同。之后将数据输入到之前构建好的多个多病种分类器中，分别输出其模型对应的结果。

优选地,本实施例中结果输出模块。本模块实现模型输出结果的转换整合。将多病种分类器的结果转化为对应结果的概率，实现结果的统一汇总。如预测样本结果正常并无患病情况则不输出概率，如果预测出患有某种疾病则输出其具体的预测概率，如[高血压:90%,冠心病77%,肺结核:67%]。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

6页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：用于药物临床试验项目风险控制的方法和系统

一种基于医学检验数据的多病种预测方法

相关技术

网友询问留言