一种基于BiLSTM-Treg的心电信号分类方法

文档序号:215995 发布日期:2021-11-09 浏览:6次 >En<

阅读说明:本技术 一种基于BiLSTM-Treg的心电信号分类方法 (Electrocardiosignal classification method based on BiLSTM-Treg ) 是由 姚金良 李润川 彭岩 宋鲲鹏 宋洪军 周兵 王宗敏 于 2021-09-10 设计创作,主要内容包括:本发明涉及一种基于BiLSTM-Treg的心电信号分类方法,包括建立BiLSTM-Treg神经网络模型、采集心电信号、对数据进行预处理、进行心电信号的分类的步骤;本发明首先对数据进行预处理,滤除心电信号中的噪声,并将心电信号以心搏为单位划分,其次,将连续的单心搏组合成心搏段,使得心搏间的节律信息得以保留;然后进行模型的搭建与优化,最后进行心搏分类;本发明通过构建融合心搏间节律信息的时序BiLSTM-Treg神经网络模型,并利用树正则化方法进行优化,提高了神经网络模型的泛化能力,提高了心搏分类的准确率。(The invention relates to an electrocardiosignal classification method based on a BiLSTM-Treg, which comprises the steps of establishing a BiLSTM-Treg neural network model, collecting electrocardiosignals, preprocessing data and classifying the electrocardiosignals; the method comprises the steps of preprocessing data, filtering noise in electrocardiosignals, dividing the electrocardiosignals by taking heart beats as a unit, and combining continuous single heart beats into heart beat sections to keep rhythm information among the heart beats; then, building and optimizing a model, and finally classifying heart beats; according to the invention, by constructing the time sequence BilSTM-Treg neural network model fusing the internodal rhythm information and optimizing by using the tree regularization method, the generalization capability of the neural network model is improved, and the accuracy of heart beat classification is improved.)

一种基于BiLSTM-Treg的心电信号分类方法

技术领域

本发明属于心电信号分类技术领域,具体涉及一种基于BiLSTM-Treg的心电信号分类方法。

背景技术

心电图(ECG)作为心脏电活动在体表的综合表现,蕴含着丰富的反应心脏节律及其电传导的生理和病理信息,传统的心电图波形分析是通过医务人员手动完成的,他们需要根据心血管疾病诊断规则和个人经验给出诊断结果。由于患者个体差异,以及疾病的复杂性,使得心电图的种类繁多,医生手动进行ECG波形的分析,这需要医生具有专业的医学理论基础和丰富的临床经验。由于心律失常的多样性和ECG波形的复杂性,因而医生进行心电图分类的普遍效率较低。

随着计算机技术和电子信息技术的飞速发展,计算机已成为医疗现代化不可缺少的重要工具,国内外的心电研究人员提出了各种心搏分类方法,这些方法可以从是否需要人工进行心电信号的特征提取这一角度分为两类:基于特征工程的分类方法和基于深度学习的方法。传统的基于规则和基于机器学习的心搏分类方法都需要手动的进行特征提取,但是由于心电信号的波形复杂,抗干扰能力差,使得手工提取到的特征往往会产生人为误差,并且手工设计的特征非常依赖研究者的先验知识。

深度学习具有自动提取特征和分类的优势,很好的解决了手工提取特征所带来的一系列问题。一些研究者使用深度神经网络模型进行心电信号的自动分类,Acharya URajendra等人提出了一种9层的深度卷积神经网络(CNN)用于心电信号的自动识别,分别使用原始心电信号和滤除了高频噪声的心电信号对心跳进行诊断分类,准确率分别为94.03%和93.47%。中国专利201910095804.7也提出了一种基于BiLSTM-Attention深度神经网络的心搏分类方法,但是尽管上述研究都巧妙的使用深度神经网络进行心电信号的分类,但并未全面考虑心搏间的节律信息且未对网络的可解释性进行分析,分类精度也有待提升。

发明内容

本发明的目的是克服现有技术的不足而提供一种基于BiLSTM-Treg的心电信号分类方法,通过构建融合心搏间节律信息的时序BiLSTM-Treg神经网络模型,并利用树正则化方法进行优化,提高了神经网络模型的泛化能力,提高了心搏分类的准确率。

本发明的技术方案如下:

一种基于BiLSTM-Treg的心电信号分类方法,包括如下步骤:

建立BiLSTM-Treg神经网络模型:该神经网络模型由MIT-BIH心律失常数据库中的心搏数据作为训练集、并将连续的多个单心搏的心电信号组成心搏段,并以心搏段为单位利用树正则化的BiLSTM模型训练得到;心电数据以心搏段为单位输入神经网络模型,使得模型在心搏类型识别时可以充分的利用心搏段中蕴含的节律信息,提高了分类准确率;

采集心电信号;

对数据进行预处理:利用计算机对心电信号进行离散小波变换去噪,后将去噪后的心电信号以心搏为单位进行划分;离散小波变换对心电信号进行去噪,能够避免失去心电信号中重要的生理细节,更好的保留心电信号的特征。

进行心电信号的分类:将去噪后的心电数据以心搏段为单位输入BiLSTM-Treg神经网络模型进行分类。

进一步的,心搏段包括10-15个单心搏。

进一步的,心搏段包括15个单心搏。

进一步的,利用db6小波来进行心电信号的去噪;心搏分割时,以MIT-BIH数据库中标注的R波峰值点作为心搏分割参考点,分别在R峰前后提取0.25s和0.4s,截取R峰前90个采样点,R峰后144个采样点作为一个完整的心搏。

进一步的,建立BiLSTM-Treg神经网络模型包括如下步骤:以xt=[xt1,xt2,…,xt235,]表示一个单心搏样本,将连续的t个单心搏组成的心搏段作为网络的输入,心搏段中单心搏的个数t为网络的时间步长;首先使用BiLSTM进行心搏分类,其次使用决策树对BiLSTM进行模拟,并计算平均路径长度,然后训练多层感知机MLP模型得到代理正则化函数之后将添加到BiLSTM模型的目标函数中进行下一轮的训练直至训练集损失停止减少,存储模型并中断。

进一步的,树正则化的实现方法具体包含如下两个阶段:首先,训练深度神经网络,同时由一棵决策树紧密建模,使这棵决策树能够精确的模拟网络的预测过程;其次,将这棵决策树的复杂性度量——平均路径长度作为模型优化的惩罚项;

决策树的生成公式可由公式(13)-公式(14)表示,

其中xn为训练集的样本特征,为深度模型的预测标签,W为深度模型中的权重矩阵,为决策树的预测标签;

树正则化的计算公式如公式(15)所示,

其中PathLength(tree,xn)为第n个样本的路径长度,Ω(W)为平均路径长度,也即是惩罚项;

为了在网络优化过程中使用梯度下降策略,使用代理正则化函数使其可以代理之前的APL计算方法,如公式(16)和公式(17)所示,

其中ξ表示MLP模型的权重矩阵,ε为正则化强度,{Wj,Ω(Wj)}表示已知的参数向量及其对应的真实路径长度的数据集,J表示数据集的总个数。因此使用代理模型之后,BiLSTM-Treg神经网络模型的目标函数如公式(18)所示,

进一步的,单心搏中提取10个采样点作为单心搏的关键特征点进行树正则化建模中决策树的生成,这10个关键特征点分别是126、112、162、121、153、80、224、93、100、120,采样点126、120、121、153对应ST段、112对应j点、224对应T波结束点、162对应T波起始点、80对应Q波峰值、93对应R波峰值、100对应S波峰值。

进一步的,决策树中的Value字段中的值表示为N、S、V、F、Q这五种类别的心搏个数分别占对应类别心搏总数的百分比,采样点126为模拟决策树的根节点,其他九个采样点为模拟决策树的叶节点。

与现有技术相比,本发明的有益效果是:

本发明通过构建融合心搏间节律信息的时序BiLSTM-Treg神经网络模型,并利用树正则化方法进行优化,提高了神经网络模型的泛化能力,提高了心搏分类的准确率;

本发明将有利于心搏分类的节律信息融合到BiLSTM-Treg神经网络模型中,具体的,在处理数据集时,将连续的单心搏组成心搏段,保留了心搏间的节律信息,然后将心电数据以心搏段为单位输入神经网络模型,使得模型在心搏类型识别时可以充分的利用心搏段中蕴含的节律信息,相比于其它的深度学习方法提高了心搏分类的准确率;

本发明的方法将心搏分为五类(非异位(N)、室上异位(S)、室性异位(V)、融合心搏(F)和未知心搏(Q)),并在MIT-BIH心律失常数据库上进行了验证,结果表明,该算法的总体分类准确率为99.32%;与其他心搏分类的方法相比,本文提出的BiLSTM-Treg算法不仅提高了分类准确率,获得了更高的灵敏度和阳性预测值,而且具有一定的可解释性。

附图说明

图1为本发明实施例1的离散小波变换预处理前后的心电信号对比图。

图2为本发明实施例1的单心搏形态图及心搏分割图。

图3为本发明实施例1的BiLSTM-Treg神经网络模型的流程处理图。

图4为本发明实施例1的BiLSTM-Treg模型算法的描述。

图5为本发明实施例2的10个关键特征点位于心电波形的位置示意图。

图6为发明实施例2的决策树示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

一种基于BiLSTM-Treg的心电信号分类方法,包括如下步骤:

建立BiLSTM-Treg神经网络模型:该神经网络模型由MIT-BIH心律失常数据库中的心搏数据作为训练集、并将连续的多个单心搏的心电信号组成心搏段,并以心搏段为单位利用树正则化的BiLSTM模型训练得到,保存最优的模型;心电数据以心搏段为单位输入神经网络模型,使得模型在心搏类型识别时可以充分的利用心搏段中蕴含的节律信息,提高了分类准确率;

采集心电信号;

对数据进行预处理:预处理阶段主要是对心电信号进行去噪和分割,一般来说采集到的心电信号由于设备和人体自身的影响不可避免地含有噪声,这些噪声主要包括基线漂移、工频干扰、肌电干扰;利用计算机对心电信号进行离散小波变换去噪,后将去噪后的心电信号以心搏为单位进行划分;

离散小波变换对心电信号进行去噪,可以很好进行心电信号的时频分析,与短时傅里叶变换的等间隔时频定位相比,小波变换在低频可以提供较高的频率分辨率和在高频提供较高的时间分辨率,能够避免失去心电信号中重要的生理细节,更好的保留心电信号的特征;

进行心电信号的分类:将去噪后的心电数据以心搏段为单位输入BiLSTM-Treg神经网络模型进行分类。

心电图上蕴含的心搏间节律信息是心电图分类的重要依据,常见的节律类型有:二联律,三联律,室速,房速。二联律:每一次正常的心跳后都会出现一次早搏,连续出现三组或三组以上称为二联律;根据早搏类型又可分为室早二联律和房早二联律;如N-V-N-V-N-V这样的节律变化即为室早二联律,N-S-N-S-N-S这样的节律变化即为房早二联律。三联律:每两次正常的心跳后都会出现一次早搏;连续出现三组或三组以上称为三联律;根据早搏类型又可分为室早三联律和房早三联律;如N-N-V-N-N-V-N-N-V这样的节律变化即为室早三联律,N-N-S-N-N-S-N-N-S这样的节律变化即为房早三联律。室速:连续的三个或三个以上的室性早搏,如:V-V-V这样的节律变化。房速:连续的三个或三个以上的房性早搏,如:S-S-S这样的节律变化。此外,某些类型的心搏的出现还反映了心电图节律的变化,比如在一个持续的室速心律后,常常会由于窦房结的电信号产生一个心室融合心搏,紧接着出现心室夺获心搏,因此心室融合心搏和心室夺获就是室速心律的重要特点。

本发明将这些有利于心搏分类的节律信息融合到BiLSTM-Treg神经网络模型中。在数据预处理时将连续的单心搏组成心搏段,从而保留了心搏间的节律信息,然后将心电数据以心搏段为单位输入神经网络模型,使得模型在心搏类型识别时可以同时获取到前后心搏的相关信息、充分的利用心搏段中蕴含的节律信息,提高了分类准确率。进一步的,心搏段包括10-15个单心搏,优选的,心搏段包括15个单心搏;在15个心搏以内,心搏的节律信息如二联律、三联律、房速、室速等都可以在15个心搏以内表现出来。若心搏段过长时,心搏信息过于冗余,会影响网络的性能;若心搏段长度为小于15则可能不足以覆盖所有的心搏的节律类型,准确率降低。

进一步的,利用db6小波来进行心电信号的去噪,以获得良好的分类精度,db6小波具有较高的正则性,使得重构之后的信号比较光滑,离散小波变换公式为公式(1)、(2):

Ψj,k(x)=a0 -j/2Ψ(a0 -jx-kb0) 公式(2)

其中WΨ(j,k)为小波系数,Ψj,k(x)为不同尺度不同位置下的离散小波函数,f(x)为输入的心电信号,Ψ(k)为小波基函数,j为尺度的阶数,j越大,尺度越小,相当于频率越高,越靠近细节,k为位置的偏移量,a0为尺度参数,b0为位置参数。使用离散小波变换预处理前后的信号对比如图1所示,图1左边的图为处理前的原始心电信号、图1右边的图为去噪后的心电信号。

进一步的,如图2所示,心搏分割就是将一条心电图记录以一个完整的心搏为单位进行划分,一个完整的心搏应该包含P波、QRS复合波和T波,本实施例以MIT-BIH数据库中标注的R波峰值点作为心搏分割参考点,分别在R峰前后提取0.25s和0.4s,截取R峰前90个采样点,R峰后144个采样点作为一个完整的心搏。

进一步的,在Bi-LSTM模型中使用树正则化,目的是为了优化模型,减小模型的泛化误差,提高分类精度,同时利用生成的模拟决策树分析理解BiLSTM模型如何进行的心搏分类,使用树正则化的Bi-LSTM模型、即BiLSTM-Treg神经网络模型如图3、图4所示:建立BiLSTM-Treg神经网络模型包括如下步骤:以xt=[xt1,xt2,…,xt235,]表示一个单心搏样本,将连续的t个单心搏组成的心搏段作为网络的输入,心搏段中单心搏的个数t为网络的时间步长;首先使用BiLSTM进行心搏分类,其次使用决策树对BiLSTM进行模拟,并计算平均路径长度,然后训练多层感知机MLP模型得到代理正则化函数之后将添加到BiLSTM模型的目标函数中进行下一轮的训练直至训练集损失停止减少,存储模型并中断。

进一步的,树正则化的实现方法具体包含如下两个阶段:首先,训练深度神经网络,同时由一棵决策树紧密建模,使这棵决策树能够精确的模拟网络的预测过程;其次,将这棵决策树的复杂性度量——平均路径长度作为模型优化的惩罚项;

决策树的生成公式可由公式(13)-公式(14)表示,

其中xn为训练集的样本特征,为深度模型的预测标签,W为深度模型中的权重矩阵,为决策树的预测标签;

树正则化的计算公式如公式(15)所示,

其中PathLength(tree,xn)为第n个样本的路径长度,Ω(W)为平均路径长度,也即是惩罚项;

为了在网络优化过程中使用梯度下降策略,使用代理正则化函数使其可以代理之前的APL计算方法,如公式(16)和公式(17)所示,

通过训练一个多层感知机使神经网络模型的参数向量W与平均路径长度之间建立映射关系,将W和APL作为多层感知机MLP的输入,APL表示最短路径长度,目标函数如公式(17)所示;

其中ξ表示MLP模型的权重矩阵,ε为正则化强度,{Wj,Ω(Wj)}表示已知的参数向量及其对应的真实路径长度的数据集,J表示数据集的总个数。因此使用代理模型之后,BiLSTM-Treg神经网络模型的目标函数如公式(18)所示,

MIT-BIH心律失常数据库中的心搏数据作为训练集、是研究学者应用最多的数据库该数据库中包含了48条记录,每条数据的长度30分钟左右,大约65万个采样点,采样频率为360HZ。MIT-BIH心律失常数据库标注的类别为十五种。而根据医学仪器促进协会(AAMI)提出的ANSI/AAMI EC57:2012分类法可将心律失常分为五大类:N(正常或束支传导阻滞),S(室上性异位搏动),V(心室异位搏动),F(融合搏动)和Q(未指定搏动),本发明在提取了连续心搏段的基础上,构建融合心搏间节律信息的时序网络将心搏分为医学仪器促进协会提出的五种类型,分别为非异位(N)、室上异位(S)、室性异位(V)、融合心搏(F)和未知心搏(Q)。

本发明按照医学仪器促进协会的五种分类对MIT-BIH心律失常数据库中109454个心搏进行了分类,包括90,595个N类别的心搏;2,781个S类别的心搏;7,235个V类别的心搏;F类别的心搏数量仅有802个;8041个Q类别的心搏。本文从数据集中随机选取心搏数据的90%作为训练集,剩下的10%进行测试,数据的具体分布如下表1所示:

表1实验数据统计

为计算BiLSTM-Treg神经网络模型对心搏分类的性能,本文将分类结果分为四类分别是TP、FP、TN、FN。以N类为例,公式(19)-(22)分别表示N类真阳性心搏(TPN),N类假阳性心搏(FPN),N类真阴性心搏(TNN),N类假阴性心搏(FNN)的计算方法。表2显示了分类结果的混淆矩阵。

表2:心搏分类结果统计

TPN=Nn 公式(19)

FPN=Sn+Vn+Fn+Qn 公式(20)

TNN=Ss+Sv+Sf+Sq+Vs+Vv+Vf+Vq+Fs+Fv+Ff+Fq+Qs+Qv+Qf+Qq 公式(21)

FNN=Ns+Nv+Nf+Nq 公式(22)

为了测试神经网络模型分类的性能,本发明使用灵敏度、特异度、阳性预测值和准确度用作具体的指标。灵敏度(Se)也称为召回率,是指被正确判断出的阳性样本占实际为阳性样本的比例;灵敏度越高,正确预测的样本比例越大。特异度(SP)是指被正确判断出阴性样本的比例占实际为阴性样本的比例。阳性预测值(+p)是指正确判断出的阳性样本占所有被判断为阳性样本的比例。准确度(Acc),是指真阳性和真阴性之和与样本总数的比例,反映了测试结果与实际结果之间的一致性。上述四个评价指标的计算公式如(23-26)所示:

Se=TP/(TP+FN) 公式(23)

Sp=TN/(TN+FN) 公式(24)

+p=TP/(TP+FP) 公式(25)

Acc=(TP+TN)/(TP+TN+FP+FN) 公式(26)

经测试,在心搏段长度为10-15单心搏时,BiLSTM模型的总体分类准确率为99.12%-99.18%,在心搏段长度为15时,准确率为99.18%。

再用树正则化对BiLSTM模型网络权重进行约束后得到优化的BiLSTM-Treg神经网络模型,并用MIT-BIH心律失常数据库数据集未拿来训练的10%数据进行测试,总体分类准确率达到99.32%,证明了本发明的可行性和有效性。与树正则化优化前相比,BiLSTM-Treg总体准确率比BiLSTM提高了0.14%,S类、V类、F类的精确度均有提升,其中F类的精确度提升较为明显,提升了5.62%。表3为树正则化优化前后分类结果及性能。

本模型将心搏间的节律信息融合到了时序网络中,使网络可以有效的学习到这部分信息,并选取了最佳的心搏段长度,实现了心搏的自动分类。在MIT-BIH心律失常数据库上进行了实验,结果表明,该方法可以有效的区分N、S、V、F、Q五种类型的心搏,平均分类准确率达99.32%。本模型除F类灵敏度较低,其他各项指标均具有明显优势,从心搏类型来看,本模型使得S类的灵敏度相比于其他方法均有较为明显的提升。

实施例2

本实施例为基于实施例1的另一种实施方式,对于实施例1相同的技术方案描述将省略,仅对与实施例1不同的技术方案进行说明。

本实施例相比于实施例1相比,在对去噪后的心电数据进行分析时,从单心搏中仅提取10个采样点作为单心搏的关键特征点进行分析。

如图5所示,单心搏中提取10个采样点作为单心搏的关键特征点进行树正则化建模中决策树的生成,这10个关键特征点分别是126、112、162、121、153、80、224、93、100、120,采样点126、120、121、153对应ST段、112对应j点、224对应T波结束点、162对应T波起始点、80对应Q波峰值、93对应R波峰值、100对应S波峰值。采样点126为心电波形中ST段的点,ST段指从QRS波群结束到T波起点之间的一段,代表心室除极和心室复极之间的一段时间[40],正常的ST段光滑且与基线平齐。采样点224为心电波形中T波的结束点,T波是QRS波群后的一个波幅较大,持续时间较长的波,显示了心室复极的过程。采样点112为心电波形中的J点,J点是QRS波群的终末与ST段起始之交接点。采样点93、采样点100分别是心电波形中的R波和S波,他们与采样点80所对应的Q波共同组成QRS波群。QRS波群是一组变化复杂且波幅较大的波群,显示了心室去极的过程

使用以上10个关键特征点作为单心搏的特征,并使用BiLSTM-Treg进行心搏分类。实验结果如表4所示,总体分类准确率为98.45%。表4基于关键特征点与BiLSTM-Treg算法的分类结果。

表4基于关键特征点与BiLSTM-Treg算法的分类结果。

与没有仅使用这10个采样点数据的BiLSTM-Treg相比,本实施例除S类的灵敏度之外,其余各项指标都没有明显的降低。通过10个关键特征点作为单心搏的特征,进行心电图的分析,能够极大的降低运算量,提高BiLSTM-Treg神经网络模型分类效率。

以下为用决策树对BiLSTM-Treg神经网络模型进行可解释性分析,由于单心搏的特征点较多,生成的模拟决策树过于庞大,因此仍使用以上10个关键特征点所生成的决策树进行说明:

如图6所示,决策树中的Value字段中的值表示为N、S、V、F、Q这五种类别的心搏个数分别占对应类别心搏总数的百分比,采样点126为模拟决策树的根节点,其他九个采样点为模拟决策树的叶节点。以节点2为例,Value中的0.08代表该节点中的S类心搏个数占S类总心搏个数的0.08%,也就表示该节点中几乎不包含S类心搏。

(1)采样点126为模拟决策树的根节点,根据该点处的电压值是否小于-0.0692mv可以将样本分为两部分,分别为节点2和节点3。在节点2中F类与Q类心搏占比较大,其余三种类别的心搏占比较少。因此,采样点126将28.95%的F类心搏和46.22%的Q类心搏从总样本中分离出来。

(2)由节点11和节点12表明,节点2根据采样点224的值将F类心搏与Q类心搏区分开,其中节点11中仅有0.38%的Q类心搏,节点12中S类心搏为0%。

(3)由节点5可以表明,节点3根据采样点112的值将25.1%的V类心搏与25.53%的Q类心搏从节点3中分离出来。由节点14和节点15表明,节点5根据采样点153的值将S类与Q类心搏区分开。

(4)由节点13表明,节点4根据采样点162的值将26.00%的V类心搏从节点4中分离出来。由节点16表明,节点6根据采样点80的值将14.85%的V类心搏和12.59%的F类心搏从节点6中分离出来。

(5)由节点8表明,节点7根据采样点93的值,分别将11.88%的N类、34.33%的S类、13.11%的V类、3.22%的F类、19.53%的Q类心搏从节点7的样本中分离出来,并经过节点9和节点10最终在节点18分出了6.81%的V类,在节点19分出了15.78%的Q类,在节点20分出了21.62%的S类心搏。

尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

17页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基线漂移曲线的生成方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!