一种基于ResNet-Xgboost模型预测心电波异常类型的方法

文档序号:56089 发布日期:2021-10-01 浏览:10次 >En<

阅读说明:本技术 一种基于ResNet-Xgboost模型预测心电波异常类型的方法 (Method for predicting abnormal type of electrocardiowave based on ResNet-Xgboost model ) 是由 杨晓磊 郭自强 程保喜 李晓萌 薛时伦 刘卫军 张刚 于 2021-05-31 设计创作,主要内容包括:本发明一种基于ResNet-Xgboost模型预测心电波异常类型的方法,属于心电波异常类型预测技术领域;所要解决的技术问题为:提供一种基于ResNet-Xgboost模型预测心电波异常类型的方法的改进;解决上述技术问题采用的技术方案为:包括如下步骤:构建8导联心电图数据集;构建能够捕捉不同导联间相似性的ResNet结构的深度神经网络模型,并输出深度特征;根据领域知识和专家经验,构造常用的基于心电波的衍生特征作为人工构造特征;将深度特征和人工构造特征进行特征拼接后作为输入,构建多标签Xgboost预测模型;对于一个新的8导联心电图数据,先输入深度神经网络模型,得到深度特征,与人工特征拼接后输入训练好的Xgboost预测模型,预测患某种疾病的概率;本发明应用于心电波异常预测。(The invention discloses a method for predicting an abnormal type of an electrocardiowave based on a ResNet-Xgboost model, belonging to the technical field of predicting the abnormal type of the electrocardiowave; the technical problem to be solved is as follows: an improvement of a method for predicting an abnormal type of an electrocardiograph wave based on a ResNet-Xgboost model is provided; the technical scheme for solving the technical problems is as follows: the method comprises the following steps: constructing an 8-lead electrocardiogram data set; constructing a deep neural network model of a ResNet structure capable of capturing the similarity between different leads, and outputting depth characteristics; constructing commonly used derived features based on the electrocardiowaves as artificial construction features according to domain knowledge and expert experience; performing feature splicing on the depth features and the artificial construction features to be used as input, and constructing a multi-label Xgboost prediction model; for a new 8-lead electrocardiogram data, firstly inputting a deep neural network model to obtain a depth characteristic, splicing the depth characteristic with an artificial characteristic, and then inputting a trained Xgboost prediction model to predict the probability of suffering from a certain disease; the method is applied to the prediction of the abnormal electrocardiowave.)

一种基于ResNet-Xgboost模型预测心电波异常类型的方法

技术领域

本发明一种基于ResNet-Xgboost模型预测心电波异常类型的方法,属于预测心电波异常类型的方法

技术领域

背景技术

心电图(ECG)是医生用来辅助诊断心脏相关疾病的重要工具,目前医院普遍还是采用纸质心电图,主要依靠人工经验来判断可能存在的心脏疾病。一次完整的ECG波形记录的是一个完整的心跳过程,通常由P波、QRS波、T波、U波、P-R期间、Q-T期间组成,详见图一。随着信息化技术的发展,现在已经有较为成熟的方法可以将纸质ECG转化为电压信号,并以二维矩阵的形式来存储心电波信号,这为通过Ai技术来进行智能诊断提供了坚实的数据基础。

在ResNet网络提出之前,大家普遍认为越深的网络准确率也会越高,假设我们构建了一个浅层的网络,并在某个预测问题上达到了较高的准确率,理论上,我们在当前网络后叠加多个恒等变化的网络层自然的加深网络后,得到的深层网络的性能应与浅层网络相当,不会出现准确率下降的问题。但是,经过实验发现,不断增加恒等变化的层数,模型准确率会呈现倒u型,即准确率先不断增加,达到一个最大值后,就开始大幅下降。ResNet在网络结构中加入了快捷链接和降采样的构建块,可以很好的解决这种“退化”问题,提高模型预测精度。

树模型对数据的结构和分布不需作任何假设,可以捕捉住变量间的相互作用,其中XGBoost是boosting框架下的一种提升算法,对GBDT的实现过程进行了改进,极大的提高了模型运行的速度和效率,被广泛的应用在一些公开的机器学习竞赛中,并取得了较好的成绩。

李杰(2012)使用一阶差分QRST检测算法和自适应f波波数检测算法检测单导心电图中的房颤信号;罗成思(2018)利用房颤信号的poincare图分布的相关指标对房颤进行识别,利用CONCOR聚类算法识别室性早搏;刘娜(2019)使用支持向量机、K最近邻、决策树和随机森林四种传统的机器学习算法预测患房颤的概率。但是上述算法或研究都仅是针对某一种心脏类疾病的心电波异常信号的研究,并且仅使用人工经验构造特征,使用传统的统计方法或机器学习算法进行概率预测,这样的缺点在于人工构造特征数量有限,会遗漏很多有用的信息,进而影响模组的预测效果。

发明内容

本发明为了克服现有技术中存在的不足,所要解决的技术问题为:提供一种基于ResNet-Xgboost模型预测心电波异常类型的方法的改进。

为了解决上述技术问题,本发明采用的技术方案为:一种基于ResNet-Xgboost模型预测心电波异常类型的方法,包括如下步骤:

步骤一:构建8导联心电图数据集;

步骤二:构建能够捕捉不同导联间相似性的ResNet结构的深度神经网络模型,并输出深度特征;

步骤三:根据领域知识和专家经验,构造常用的基于心电波的衍生特征作为人工构造特征;

步骤四:将深度特征和人工构造特征进行特征拼接后作为输入,构建多标签Xgboost预测模型;

步骤五:对于一个新的8导联心电图数据,先输入深度神经网络模型,得到深度特征,与人工特征拼接后输入训练好的Xgboost预测模型,预测患某种疾病的概率。

所述步骤二具体为:从8导联心电图矩阵中学习特征表达,将ResNet网络倒数第二层和最后一层的输出进行拼接,作为深度特征变量。

所述ResNet网络具体包括输入层、卷积层、第一个ResNet的构建块、第二个ResNet的构建块、重构层、池化层、输出层;

输入层:将一张心电图设置成一个5000*8的二维矩阵;

卷积层:卷积核大小为50*1,滤波器个数为32,步长为2;

第一个ResNet的构建块:包括主干道和恒等映射,其中主干道包括3层:批标准化处理层、线性修正单元层、卷积核大小为15*1、滤波器个数为32、步长为2的卷积层,恒等映射经步长2后与主干道的输出形状一致,将两者相加,依次往下再重复两次;

第二个ResNet的构建块:包括主干道和恒等映射,其中主干道包括3层:批标准化处理层、线性修正单元层、卷积核大小为5*1、滤波器个数为32、步长为2的卷积层,恒等映射经步长2后与主干道的输出形状一致,将两者相加,依次往下再重复两次;

重构层:将第二个ResNet的构建块的输出转换为二维数据;

池化层:通过取平均的方式将重构层的输出转换为一维向量;

输出层:模型训练时表示该样本的真实标签,预测时表示对某个新进样本在各个疾病类型上的预测概率。

所述步骤四中的多标签Xgboost预测模型具体包括20种心脏类疾病的Xgboost预测模型,其中针对每种疾病训练一个Xgboost模型。

所述步骤五具体为:在深度神经网络训练完成后,对训练样本进行预测,将池化层的输出与输出层的输出的概率进行拼接,结合依靠人工经验衍生的特征做为机器学习模型的输入,为每种疾病训练一个XgBoost模型。

本发明相对于现有技术具备的有益效果为:本发明提供的基于ResNet-Xgboost模型预测心电波异常类型的方法,与现有技术多只针对某一种心脏类疾病相比,本发明考虑了20种常见的心脏类疾病,应用范围更广。

现有技术多基于独立单导联来人工构建特征,而忽略了不同导联间的相关性,本发明提出的ResNet网络结构,可以有效的捕捉不同导联间的相关性信息。

现有技术多仅依靠人工经验来衍生入模特征,特征数量有限,可能会遗漏有效信息,本发明在现有基础上补充ResNet网络生成的深度特征,丰富了特征变量的数量,增强了特征的表达能力,可以有效提高模型的预测准确性。

附图说明

下面结合附图对本发明做进一步说明:

图1为一次完整的ECG波形;

图2为本发明预测方法的流程图;

图3为本发明ResNet网络的结构图。

具体实施方式

如图1至图3所示,本发明一种基于ResNet-Xgboost模型预测心电波异常类型的方法,包括如下步骤:

步骤一:构建8导联心电图数据集;

步骤二:构建能够捕捉不同导联间相似性的ResNet结构的深度神经网络模型,并输出深度特征;

步骤三:根据领域知识和专家经验,构造常用的基于心电波的衍生特征作为人工构造特征;

步骤四:将深度特征和人工构造特征进行特征拼接后作为输入,构建多标签Xgboost预测模型;

步骤五:对于一个新的8导联心电图数据,先输入深度神经网络模型,得到深度特征,与人工特征拼接后输入训练好的Xgboost预测模型,预测患某种疾病的概率。

所述步骤二具体为:从8导联心电图矩阵中学习特征表达,将ResNet网络倒数第二层和最后一层的输出进行拼接,作为深度特征变量。

所述ResNet网络具体包括输入层、卷积层、第一个ResNet的构建块、第二个ResNet的构建块、重构层、池化层、输出层;

输入层:将一张心电图设置成一个5000*8的二维矩阵;

卷积层:卷积核大小为50*1,滤波器个数为32,步长为2;

第一个ResNet的构建块:包括主干道和恒等映射,其中主干道包括3层:批标准化处理层、线性修正单元层、卷积核大小为15*1、滤波器个数为32、步长为2的卷积层,恒等映射经步长2后与主干道的输出形状一致,将两者相加,依次往下再重复两次;

第二个ResNet的构建块:包括主干道和恒等映射,其中主干道包括3层:批标准化处理层、线性修正单元层、卷积核大小为5*1、滤波器个数为32、步长为2的卷积层,恒等映射经步长2后与主干道的输出形状一致,将两者相加,依次往下再重复两次;

重构层:将第二个ResNet的构建块的输出转换为二维数据;

池化层:通过取平均的方式将重构层的输出转换为一维向量;

输出层:模型训练时表示该样本的真实标签,预测时表示对某个新进样本在各个疾病类型上的预测概率。

所述步骤四中的多标签Xgboost预测模型具体包括20种心脏类疾病的Xgboost预测模型,其中针对每种疾病训练一个Xgboost模型。

所述步骤五具体为:在深度神经网络训练完成后,对训练样本进行预测,将池化层的输出与输出层的输出的概率进行拼接,结合依靠人工经验衍生的特征做为机器学习模型的输入,为每种疾病训练一个XgBoost模型。

本发明提供的基于ResNet-Xgboost模型预测心电波异常类型的方法针对的是采样频率500 HZ,长度10秒,单位电压4.88微伏的8导联心电波数据,基于8导联心电图检查数据,构建ResNet-Xgboost模型,来预测心电波异常类型的方法;其中8导联心电波数据包含2个肢体导联,分别是Ⅰ导联、Ⅱ导联,6个胸部导联,分别是V1、V2、V3、V4、V5、V6导联。不同导联输出的心电波是从不同方向观察心脏跳动的结果,可以立体多方位的反应心脏异常情况,本发明仅考虑常见的20种心脏疾病作为标签,20种心脏疾病如下表1所示:

表1 20种心脏疾病类型。

本发明将深度神经网络与机器学习算法相结合,自动化衍生特征与人工经验衍生特征相结合,来预测分别患20种常见疾病的概率。主要思路是:首先提出一种可以捕捉不同导联间相似性的ResNet结构的深度神经网络模型,构建多标签预测模型,从8导联心电图矩阵中学习特征表达,将网络倒数第二层和最后一层的输出进行拼接,作为深度特征变量;其次,根据领域知识和专家经验,构造常用的基于心电波的衍生特征;最后,将以上两部分特征结合起来,针对每种疾病训练一个Xgboost模型,来预测患该种疾病的概率,流程图详见图2。

本发明提出的ResNet网络结构,详见图3。整体上来看,共有5个大层,首先是输入层,将一张心电图视为一个5000*8的二维矩阵;层1是个卷积核大小为50*1,滤波器个数32,步长为2的卷积层;层2是第一个ResNet的构建块,主干道又包含3层,一个批标准化处理层,一个线性修正单元层,和一个卷积核大小为15*1,滤波器个数为32,步长为2的卷积层,旁边实曲线就是ResNet结构中的恒等映射,经步长2后与主干道的输出形状一致,将两者相加,依次往下再重复两次;层3是第二个ResNet的构建块,与层2类似,分为主干道和恒等映射(identity mapping)部分,主干道包括一个批标准化处理层,一个线性修正单元层,和一个卷积核大小为5*1,滤波器个数为32,步长为2的卷积层,identity mapping同层2;层4是重构层,作用是将层3的输出转换为二维数据;层5是池化层,通过取平均的方式将层4的输出转换为一维向量;最后是输出层,模型训练时表示该样本的真实标签,预测时表示对某个新进样本在各个疾病类型上的预测概率。

上述深度神经网络训练完成后,对训练样本进行预测,将层5的输出与输出层的输出概率拼接,结合依靠人工经验衍生的特征做为机器学习模型的输入,为每种疾病训练一个XgBoost模型。

本发明在应用时,心电图样本首先经过ResNet网络,得到深度特征,然后将其与人工特征拼接,再分别经过每种疾病的XGBoost模型,得到该样本患每种疾病的概率。

本发明针对现有技术中存在的仅使用人工经验来构造特征变量,遗漏了大量潜在特征的问题,提出一种可以捕捉不同导联间相似性的resnet结构的深度神经网络模型,自动化的生成深度特征变量;针对现有技术中仅使用统计方法或传统机器学习算法来进行单个心脏疾病种类预测,运行效率和模型效果较差的问题,本发明使用boosting框架下的XgBoost算法,基于深度特征和人工特征来构建模型进行预测,预测准确性高。

关于本发明具体结构需要说明的是,本发明采用的各部件模块相互之间的连接关系是确定的、可实现的,除实施例中特殊说明的以外,其特定的连接关系可以带来相应的技术效果,并基于不依赖相应软件程序执行的前提下,解决本发明提出的技术问题,本发明中出现的部件、模块、具体元器件的型号、连接方式除具体说明的以外,均属于本领域技术人员在申请日前可以获取到的已公开专利、已公开的期刊论文、或公知常识等现有技术,无需赘述,使得本案提供的技术方案是清楚、完整、可实现的,并能根据该技术手段重现或获得相应的实体产品。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:头戴式睡眠仪

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!