基于机器学习的心电数据分类方法及装置

文档序号:293390 发布日期:2021-11-26 浏览:9次 >En<

阅读说明:本技术 基于机器学习的心电数据分类方法及装置 (Machine learning-based electrocardiogram data classification method and device ) 是由 徐啸 李晓宇 孙瑜尧 于 2021-08-31 设计创作,主要内容包括:本发明涉及人工智能技术领域,揭露一种基于机器学习的心电数据分类的方法,包括:获取对心电数据处理得到的多个等长的心跳数据;响应于心电分类任务的触发指令,将多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,心电分类模型包括多个表征模块和心跳聚合模块,使用表征模块提取多个等长的心跳数据的向量表征,使用心跳聚合模块融合多个等长的心跳数据的向量表征之间的信息;将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。本发明通过将心跳周期性融入数据形式与模型结构中,能够降低训练过程中模型解耦所需的计算复杂度,提高模型应用效果,使得心电数据分类结果具有更高的准确度。(The invention relates to the technical field of artificial intelligence, and discloses a machine learning-based electrocardiogram data classification method, which comprises the following steps: acquiring a plurality of heartbeat data with equal length obtained by processing the electrocardiographic data; responding to a triggering instruction of an electrocardio classification task, inputting a plurality of isometric heartbeat data into a pre-constructed electrocardio classification model for prediction, wherein the electrocardio classification model comprises a plurality of representation modules and a heartbeat aggregation module, the representation modules are used for extracting vector representations of the isometric heartbeat data, and the heartbeat aggregation module is used for fusing information among the vector representations of the isometric heartbeat data; and processing the vector representation of the fused heartbeat data to the mapping relation of the heartbeat data in different categories, and outputting the classification result of the electrocardio data. According to the method, the heartbeat is periodically fused into the data form and the model structure, so that the calculation complexity required by model decoupling in the training process can be reduced, the application effect of the model is improved, and the electrocardio data classification result has higher accuracy.)

基于机器学习的心电数据分类方法及装置

技术领域

本发明涉及人工智能技术领域,尤其是涉及到基于机器学习的心电数据分类的方法、装置、计算机设备及计算机存储介质。

背景技术

随着机器学习的火热发展,越来越多的领域都将机器学习方法和自己的领域相互结合,医疗领域也不例外,例如:通过对心电数据进行分类、预测等等,通过对大量心电数据的分析,可以帮助医生发现许多心脏疾病,如房颤、心肌梗死、急性低血压等,进而判断病人的心脏状况。

现有技术中,机器学习通过借助多层神经网络模型,可以很好地实现复杂非线性函数映射关系的描述,并且可以对心电数据背后隐藏的特征进行自主挖掘,从而完成对心电数据的分类任务。然而,由于新型传感技术的迅速发展,需要分析的心电数据不仅数量庞大,而且结构复杂,上述使用机器学习的方法来进行心电数据的分类时并未考虑到心电数据自身的特征,并且在训练过程中模型结构所需的计算复杂度较高,使得模型应用效果不理想,影响心电数据分类结果的准确性。

发明内容

有鉴于此,本发明提供了一种基于机器学习的心电数据分类的方法、装置、计算机设备及计算机存储介质,主要目的在于解决现有技术使用机器学习的方法在训练过程中模型结构所需的计算复杂度较高,使得模型应用效果不理想,影响心电数据分类结果的准确性的问题。

依据本发明一个方面,提供了一种基于机器学习的心电数据分类的方法,该方法包括:

获取对心电数据处理得到的多个等长的心跳数据,多个等长的所述心跳数据具有相同的时间长度;

响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,所述心电分类模型包括多个表征模块和心跳聚合模块,使用所述表征模块提取多个等长的心跳数据的向量表征,使用所述心跳聚合模块融合所述多个等长的心跳数据的向量表征之间的信息;

将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。

在本发明另一实施例中,所述获取对心电数据处理得到的多个等长的心跳数据,具体包括:

将心电数据进行分割得到不同时间长度的心电片段,所述心电片段为一个心跳周期;

针对所述不同时间长度的心电片段进行重采样处理,得到多个等长的心跳数据。

在本发明另一实施例中,在所述响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测之前,所述方法还包括:

基于预先设置的心电分类任务标签,将多个等长的心跳样本输入至网络模型中进行训练,构建心电分类模型,所述网络模型包括多个表征模块和心跳聚合模块,所述表征模块用于学习单个心跳样本的向量表征,所述心跳聚合模块用于融合所述多个心跳样本的向量表征之间的信息;

所述基于预先设置的心电分类任务标签,将多个等长的心跳样本输入至网络模型中进行训练,构建心电分类模型,具体包括:

基于预先设置的心电分类任务标签,确定所述多个等长的心跳样本中每个心跳样本对应的类别标签和相应重采样因子,所述重采样因子为重采样的频率比例量化形成的数值;

将携带有类别标签的心跳样本与相应重采样因子进行拼接后,分别输入至不同的表征模块进行训练,得到每个心跳样本的向量表征;

将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块进行训练,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

在本发明另一实施例中,所述表征模块包括归一化层和自注意力层,所述将携带有类别标签的心跳样本与相应重采样因子进行拼接后,分别输入至不同的表征模块进行训练,得到每个心跳样本的向量表征,具体包括:

将携带有标签类别的心跳样本经过线性映射后与相应重采样因子进行拼接后,分别输入至单个心跳的表征模块进行训练;

利用所述表征模块的自注意力层,对拼接后的心跳样本进行特征编码,得到单个心跳样本的向量表征;

利用所述表征模块的归一化层,将所述单个心跳样本的向量表征映射到稳定分布的向量空间,以使得编码后的向量表征具有相同维度。

在本发明另一实施例中,所述自注意力层加入有窗口机制,所述利用所述表征模块的自注意力层,对拼接后的心跳样本进行特征编码,得到单个心跳样本的向量表征,具体包括:

利用所述窗口机制,将所述拼接后的心跳样本进行使用预设窗口长度进行划分,得到多个窗口的心跳样本数据;

将所述表征模块的自注意力层作用于每个窗口的心跳样本数据,得到单个心跳样本的向量表征。

在本发明另一实施例中,所述心跳聚合模块包括卷积层、池化层和归一化层,所述将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块进行训练,得到心跳样本在不同类别上的映射关系,构建心电分类模型,具体包括:

将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块的卷积层,对所述汇总后心跳样本的向量表征进行特征提取;

利用所述聚合模块的归一化层,将特征提取后的向量表征映射到稳定分布的向量空间,以使得特征提取后的向量表征具有相同维度;

利用所述聚合模块的池化层,对特征提取后具有相同维度的向量表征进行降维度处理,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

在本发明另一实施例中,在所述将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果之后,所述方法还包括:

根据所述心电数据的分类结果,记录所述心电数据的分布特征;

将所述心电数据的分布特征映射到心电分类任务设置的各个维度指标上,以对各个维度指标进行异常评估。

依据本发明另一个方面,提供了一种基于机器学习的心电数据分类的装置,所述装置包括:

获取单元,用于获取对心电数据处理得到的多个等长的心跳数据,多个等长的所述心跳数据具有相同的时间长度;

预测单元,用于响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,所述心电分类模型包括多个表征模块和心跳聚合模块,使用所述表征模块提取多个等长的心跳数据的向量表征,使用所述心跳聚合模块融合所述多个等长的心跳数据的向量表征之间的信息;

输出单元,用于将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。

在本发明另一实施例中,所述获取单元包括:

分割模块,用于将心电数据进行分割得到不同时间长度的心电片段,所述心电片段为一个心跳周期;

处理模块,用于针对所述不同时间长度的心电片段进行重采样处理,得到多个等长的心跳数据。

在本发明另一实施例中,所述装置还包括:

构建单元,用于在所述响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测之前,基于预先设置的心电分类任务标签,将多个等长的心跳样本输入至网络模型中进行训练,构建心电分类模型,所述网络模型包括多个表征模块和心跳聚合模块,所述表征模块用于学习单个心跳样本的向量表征,所述心跳聚合模块用于融合所述多个心跳样本的向量表征之间的信息;

所述构建单元包括:

确定模块,用于基于预先设置的心电分类任务标签,确定所述多个等长的心跳样本中每个心跳样本对应的类别标签和相应重采样因子,所述重采样因子为重采样的频率比例量化形成的数值;

训练模块,用于将携带有类别标签的心跳样本与相应重采样因子进行拼接后,分别输入至不同的表征模块,得到每个心跳样本的向量表征;

构建模块,用于将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

在本发明另一实施例中,所述表征模块包括归一化层和自注意力层,所述训练模块包括:

拼接子模块,用于将携带有标签类别的心跳样本经过线性映射后与相应重采样因子进行拼接后,分别输入至单个心跳的表征模块进行训练;

编码子模块,用于利用所述表征模块的自注意力层,对拼接后的心跳样本进行特征编码,得到单个心跳样本的向量表征;

第一映射子模块,用于利用所述表征模块的归一化层,将所述单个心跳样本的向量表征映射到稳定分布的向量空间,以使得编码后的向量表征具有相同维度。

在本发明另一实施例中,所述编码子模块,具体用于利用所述窗口机制,将所述拼接后的心跳样本进行使用预设窗口长度进行划分,得到多个窗口的心跳样本数据;

所述编码子模块,具体还用于将所述表征模块的自注意力层作用于每个窗口的心跳样本数据,得到单个心跳样本的向量表征。

在本发明另一实施例中,所述心跳聚合模块包括卷积层、池化层和归一化层,所述构建模块包括:

提取子模块,用于将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块的卷积层,对所述汇总后心跳样本的向量表征进行特征提取;

第二映射子模块,用于利用所述聚合模块的归一化层,将特征提取后的向量表征映射到稳定分布的向量空间,以使得特征提取后的向量表征具有相同维度;

降维子模块,用于利用所述聚合模块的池化层,对特征提取后具有相同维度的向量表征进行降维度处理,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

在本发明另一实施例中,所述装置还包括:

记录单元,用于在所述将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果之后,根据所述心电数据的分类结果,记录所述心电数据的分布特征;

评估单元,用于将所述心电数据的分布特征映射到心电分类任务设置的各个维度指标上,以对各个维度指标进行异常评估。

依据本发明又一个方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现基于机器学习的心电数据分类的方法的步骤。

依据本发明再一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于机器学习的心电数据分类的方法的步骤。

借由上述技术方案,本发明提供一种基于机器学习的心电数据分类的方法及装置,获取对心电数据处理得到的多个等长的心跳数据,多个等长的心跳数据具有相同的时间长度,并响应于心电分类任务的触发指令,将多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,心电分类模型包括多个表征模块和心跳聚合模块,使用表征模块提取多个等长的心跳数据的向量表征,使用心跳聚合模块融合所述多个等长的心跳数据的向量表征之间的信息,进一步将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。与现有技术中借助多层神经网络结构进行心电数据的分类过程相比,本申请中通过将心电数据的周期性特征融入到数据形式与模型结构中,由于网络模型本身能提供更高的计算效率和更好的可解释性,使得针对等长的心跳数据所训练的网络模型具有更好的分类效果,能够降低训练过程中模型解耦所需的计算复杂度,使得心电数据分类结果具有更高的准确度。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种基于机器学习的心电数据分类的方法的流程示意图;

图2示出了本发明实施例提供的另一种基于机器学习的心电数据分类的方法的流程示意图;

图3示出了本发明实施例提供的一种基于机器学习的心电数据分类的装置的结构示意图;

图4示出了本发明实施例提供的另一种基于机器学习的心电数据分类的装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本发明实施例提供了一种基于机器学习的心电数据分类的方法,通过将心跳周期性融入数据形式与模型结构中,能够降低训练过程中模型解耦所需的计算复杂度,提高模型应用效果,使得心电数据分类结果具有更高的准确度,如图1所示,该方法包括:

101、获取对心电数据处理得到的多个等长的心跳数据。

其中,多个等长的心跳数据具有相同的时间长度,这里心电数据相当于围绕心电图所搜集的病历信息,也就是说,心电数据除了包含心电图信号之外,还有更加全面的病人数据,如:性别、年龄、用药、临床争端、其他检查以及心电历史数据等信息,具体针对心电数据进行处理的过程主要是针对心电图信号,考虑到心电图信号具有周期性特点,这里可以利用心电图信号的心跳周期对其进行分割,得到每个心跳周期形成不同长度的心电片段,然后对心电片段进行重采样,以获取到相同时间长度的心跳数据。

本申请中,医疗通过云接入不同的医学设备,如脑电、肌电、动态血压等设备,还能够与医院内各个系统互联互通,如电子病历、集成平台等系统连接,进而获取到各种表达形式的医疗数据,这里可以从医疗数据中提取心电数据。医疗云是指在云计算、移动技术、多媒体、4G通信、大数据、以及物联网等新技术基础上,结合医疗技术,使用“云计算”来创建医疗健康服务云平台,实现了医疗资源的共享和医疗范围的扩大。因为云计算技术的运用于结合,医疗云提高医疗机构的效率,方便居民就医。像现在医院的预约挂号、电子病历、医保等都是云计算与医疗领域结合的产物,医疗云还具有数据安全、信息共享、动态扩展、布局全局的优势。

在本发明实施例中,执行主体可以为基于机器学习的心电数据分类的装置,具体可以应用在智慧医疗或医疗云等适用于疾病预测的医疗平台服务器端,通过医疗平台服务器端对心电数据处理得到多个等长的心跳数据,由于等长的心跳数据融合有心电数据的周期性特点,后续针对心电数据构建的心电分类模型能够在周期性相关的分类任务上表现更好的应用效果,使得心电数据分类结果具有更高的准确度。

上述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

102、响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测。

其中,心电分类模型包括多个表征模块和心跳聚合模块,使用表征模块提取多个等长的心跳数据的向量表征,使用心跳聚合模块融合多个等长的心跳数据的向量表征之间的信息,可以理解的是预先构建的心电分类模型为使用心跳样本经过网络模型进行训练得到,这里可以使用编码器网络结构或其他具有编码效果的网络结构对表征模块进行训练,使用深度卷积网络结构或其他具有信息融合功能的网络结构对心跳聚合模块进行训练。心电分类任务可以根据实际应用场景所设置,不同心电分类任务所需要使用预测的心电分类模型不同,例如,心电分类任务的应用场景为性别,需要使用针对性别应用场景的心电分类模型,心电分类任务的应用场景为判断心率类别,需要使用针对判断心率应用场景的心电分类模型,这里不进行限定。

具体在预测过程中,由于针对心电数据使用不同重采样的频率会从一定程度上影响心跳数据在心电分类模型中的表征,这里可以将重采样的频率形成采样因子与一个心跳数据拼接后传入针对单个心跳的表征模块,同理,针对其他心跳数据也可以与相应重采样的频率所形成采样因子进行拼接后输入至单个心跳的表征模块,在每个表征模块中对心跳数据进行编码,得到单个心跳数据的向量表征,在经过多个表征模块后,将输出所有心跳数据的向量表征汇总后输入至心跳聚合模块中进行信息融合,得到融合后心跳数据的向量表征。

103、将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。

在本申请中,融合后心跳数据的向量表征可以处理为心跳样数据在不同类别上的映射关系,该映射关系可表现为心跳数据在不同类别标签上的概率值,概率值越大,说明心电数据在相应类别上的可能性越高,并根据该映射关系输出心电数据的分类结果。

可以理解的是,心电分类模型的分类效果取决于特征提取的正确性,本申请考虑到心电数据的周期性特征,并不是将心电数据视为一维多通道图片数据直接传入深度学习网络中,而是考虑到心电数据具有的周期性特征,使用心电数据处理为多个等长的心跳样本所训练形成的心电分类模型,能够提取到更准确的心电特征,提高心电数据的分类效果。

在实际应用中,心电数据的分类结果可根据心电分类任务的应用场景将心电数据在各个类别标签上的概率值作为判断的辅助依据,将概率值最高的类型确定为心电数据类别的参考,例如,对于疾病类型预测的应用场景,分类结果可作为疾病类型的诊断参考,进一步可以针对疾病类型进行提前预警,并提供治疗方案,有效控制疾病发展。

本发明实施例提供的一种基于机器学习的心电数据分类的方法,获取对心电数据处理得到的多个等长的心跳数据,多个等长的心跳数据具有相同的时间长度,并响应于心电分类任务的触发指令,将多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,心电分类模型包括多个表征模块和心跳聚合模块,使用表征模块提取多个等长的心跳数据的向量表征,使用心跳聚合模块融合所述多个等长的心跳数据的向量表征之间的信息,进一步将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。与现有技术中借助多层神经网络结构进行心电数据的分类过程相比,本申请中通过将心电数据的周期性特征融入到数据形式与模型结构中,由于网络模型本身能提供更高的计算效率和更好的可解释性,使得针对等长的心跳数据所训练的网络模型具有更好的分类效果,能够降低训练过程中模型解耦所需的计算复杂度,使得心电数据分类结果具有更高的准确度。

本发明实施例提供了另一种基于机器学习的心电数据分类的方法,通过将心跳周期性融入数据形式与模型结构中,能够降低训练过程中模型解耦所需的计算复杂度,提高模型应用效果,使得心电数据分类结果具有更高的准确度,如图2所示,所述方法包括:

201、将心电数据进行分割得到不同时间长度的心电片段。

其中,心跳片段为一个心跳周期,心电数据可以记录设置时间内若干个心跳周期的心电片段,考虑到心电数据在每个心跳周期中出现的波形曲线具有一定的规律,各个心跳片段内的特征可作为心电分类的判断依据,这里按照心跳周期将心电数据分割得到不同时间长度的心电片段,针对每个心电片段内的心电数据就进行特征分析,能够提高心电分类任务预测结果的准确性。

在一种可能的实现方式中,心电数据可以为表现为心电图,该心电图为心脏在每个心跳周期中,由起搏点、心房、心室相继兴奋,伴随着心电生物电的变化,通过心电描记器从体表引出多种形式的电位变化的图形。而不同心电图类型在心跳周期内具有不同的波形表征,例如,心房颤动的心电图类型在心跳周期内波形表征没有规律,窦性心动过缓的心电图类型每个心跳周期时长都大于设置的时间值,窦性心动过速的心电图类型每个心跳周期时长都小于设置的时间值。

202、针对所述不同时间长度的心电片段进行重采样处理,得到多个等长的心跳数据。

考虑到心跳周期的时长区间,这里针对不同时间长度的心电片段进行重采样处理时可使用时长区间内的均值,将每个心电片段重采样为等长的心跳数据,例如,心跳周期的时间平均为0.6秒至1秒,可以选取0.8秒作为重采样的时间长度,得到多个时间长度为0.8秒的心跳数据。

203、基于预先设置的心电分类任务标签,确定所述多个等长的心跳样本中每个心跳样本对应的类别标签和相应重采样因子。

其中,预先设置的心电分类任务标签相当于心电数据的类别标签,具体可以根据心电分类任务的实际应用场景所设置,例如,心电分类任务的应用场景为性别,可以设置心电数据的类别标签为男/女,心电分类任务的应用场景为判断心率类别,可以设置心电数据的类别标签为心房颤动/窦心跳过速等,还可以结合多心电分类任务的应用场景设置心电数据的类别标签,这里不进行限定。

可以理解的是,在将心跳样本输入至网络模型之前,需要针对心跳样本进行标记,并在训练过程中使用标记的类别标签来优化网络模型的分类效果,由于不同心电分类标签受到应用场景的影响,这里可以根据心电分类任务的应用场景设置心电分类任务标签,该心电分类任务标签相当于心电数据的类别标签,具体针对波形变化设置心电分类任务标签会考虑到心跳样本中不同波段具有的特征,利用心跳样本中波段特征对心跳样本进行标记,针对疾病类型设置心电分类任务标签会考虑心跳样本的疾病类别表征,利用疾病类别表征对心跳样本进行标记。例如,心电分类任务的应用场景为性别,可以设置心电数据的类别标签为男/女,心电分类任务的应用场景为判断心率类别,可以设置心电数据的类别标签为心房颤动/窦心跳过速等,还可以结合多心电分类任务的应用场景设置心电数据的类别标签,这里不进行限定。

进一步地,由于每个心跳样本为心电片段经过重采样所得到具有相同时间长度的心跳数据,为了保证心跳样本具有相同时间长度,不同心跳样本对应有不同的重采样的频率比例,例如,时间长的心电片段需要使用较低重采样的频率比例,而时间短的心电片段需要使用较高重采样的频率比例,这里重采样的频率比例能够反映心跳片段内心电波的形态差异,从一定程度上降低心跳片段内的波形特征损失,有必要针对每个心跳片段确定相应重采样的频率比例,并将其作为重采样因子保存,以便于在后续模型训练过程中使用重采样因子作为波形特征提取的依据。

204、将携带有类别标签的心跳样本与相应重采样因子进行拼接后,分别输入至不同的表征模块进行训练,得到每个心跳样本的向量表征。

其中,表征模块包括归一化层和自注意力层,这里每个心跳样本与相应重采样因子拼接后形成一个输入样本,针对每个输入样本设置一个表征模块,多个输入样本即设置多个表征模块,分别将每个输入样本输入至表征模块中进行训练,每个表征模块具有相同的网络结构,与两个编码器网络结构相似,即一个归一化层叠加一个自注意力层形成表征模块的一个子快,一个归一化层叠加另一个自注意力层形成表征模块的另一个字块,两个子块构成一个表征模块。

考虑到不同心跳样本所处向量空间的差异性,具体可以将携带有标签类别的心跳样本经过线性映射后与相应重采样因子进行拼接后,分别输入至单个心跳的表征模块进行训练,然后利用表征模块的自注意力层,对拼接后的心跳样本进行特征编码,得到单个心跳样本的向量表征,利用表征模块的归一化层,将单个心跳样本的向量表征映射到稳定分布的向量空间,以使得编码后的向量表征具有相同维度。

上述自注意力层加入有窗口机制,具体利用所述表征模块的自注意力层,对拼接后的心跳样本进行特征编码,得到单个心跳样本的向量表征,可以利用所述窗口机制,将拼接后的心跳样本进行使用预设窗口长度进行划分,得到多个窗口的心跳样本数据,然后对窗口长度进行滑动,并将表征模块的自注意力层作用于每个窗口的心跳样本数据,得到单个心跳样本的向量表征。需要说明的是,针对表征模块的网络结构,这里加入有窗口机制的自注意力层具有两个,第一个自注意力层加入窗口机制后,并不是作用于整个输入的心跳样本,而是将整个心跳样本用固定长度进行划分,并将自注意力作用于每个窗口的心跳样本,而第二个自注意力层加入窗口机制后,需要在自注意力作用到每个窗口的心跳样本之前,对窗口进行滑动,然后对滑动后每个窗口的心跳样本进行自注意力,滑动长度可设置为半个窗口大小。

205、将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块进行训练,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

其中,心跳聚合模块包括卷积层、池化层和归一化层,由于各个模块输出的心跳样本的向量表征作为单个心跳周期内的特征反映,无法反映心电图整体的类别特征,这里通过心跳聚合模块汇总各个表征模块输出的心跳样本的向量表征,并针对汇总后心跳样本的向量表征进行信息融合,能够从不同心跳周期内提取到有效特征,并利用提取到的有效特征之间相互融合后的特征对心跳样本进行准确分类。

这里每个心跳样本与相应重采样因子拼接后形成一个输入样本,针对每个输入样本设置一个表征模块,多个输入样本即设置多个表征模块,分别将每个输入样本输入至表征模块中进行训练,每个表征模块具有相同的网络结构,与两个编码器网络结构相似,即一个归一化层叠加一个自注意力层形成表征模块的一个子块,一个归一化层叠加另一个自注意力层形成表征模块的另一个子块,两个子块构成一个表征模块。

具体可以将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块的卷积层,对所述汇总后心跳样本的向量表征进行特征提取,利用聚合模块的归一化层,将特征提取后的向量表征映射到稳定分布的向量空间,以使得特征提取后的向量表征具有相同维度,利用聚合模块的池化层,对特征提取后具有相同维度的向量表征进行降维度处理,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

可以理解的是,为了保证心电分类模型的训练效果,在利用心跳样本对应的分类任务标签作为已知的类别标签值对网络模型进行训练过程中,需要使用损失函数计算心电分类任务的预测值与已知类别标签值所形成的偏差值,并在网络上模型中反向传递偏差值以不断调整网络模型的模型参数。

206、响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测。

207、将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。

本申请将心跳周期性融入心电数据形式与模型结构中,使得针对心电数据构建的自注意力编码网络能够达到更好的分类效果,由于自注意力编码网络本身能够提供更高的计算效率和更好的可解释性。使用大规模心电数据对自注意力编码网络进行预训练所构建的分类模型,针对心电分类任务具有更优的识别效果。

208、根据所述心电数据的分类结果,记录所述心电数据的分布特征。

可以理解的是,心电数据的分类结果基于不同的应用场景都能够从一定程度反映各种类型的心电图表现,这里心电图表现可以包括但不局限于心脏各个部位的电位和时间变化,通过从目标心电数据的分类结果中解析出心脏各个部位的电位和时间变化,可以记录目标心电数据的分布特征。

209、将所述心电数据的分布特征映射到心电分类任务设置的各个维度指标上,以对各个维度指标进行异常评估。

这里心电分类任务设置的各个维度指标可以为针对心电数据是否存在异常所设置,例如,心率指标、呼吸率指标、波形指标等,由于心电数据的分布特征在不同维度指标上的表现数值不同,通过将心电数据的分布特征映射到各个维度指标上,可以得到心电数据在每个维度指标上的表现数值,需要说明的是,有的维度指标需要计算得到,例如,心率指标可通过除以每个心跳周期的时距计算得到,而有的指标可以直接从分布特征中提取得到,例如,波形指标可从波形图中截取。

可以理解的是,这里每个维度指标在实际应用场景中都具有临床意义,均设置有正常的数值范围,通过维度指标的表现数值是否处于正常数值范围,可以实现对各个维度指标进行异常评估。

进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种基于机器学习的心电数据分类的装置,如图3所示,所述装置包括:获取单元31、构建单元32、输出单元33。

获取单元31,可以用于获取对心电数据处理得到的多个等长的心跳数据,多个等长的所述心跳数据具有相同的时间长度;

预测单元32,可以用于响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,所述心电分类模型包括多个表征模块和心跳聚合模块,使用所述表征模块提取多个等长的心跳数据的向量表征,使用所述心跳聚合模块融合所述多个等长的心跳数据的向量表征之间的信息;

输出单元33,可以用于将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。

本发明实施例提供的一种基于机器学习的心电数据分类的装置,获取对心电数据处理得到的多个等长的心跳数据,多个等长的心跳数据具有相同的时间长度,并响应于心电分类任务的触发指令,将多个等长的心跳数据输入至预先构建的心电分类模型中进行预测,心电分类模型包括多个表征模块和心跳聚合模块,使用表征模块提取多个等长的心跳数据的向量表征,使用心跳聚合模块融合所述多个等长的心跳数据的向量表征之间的信息,进一步将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果。与现有技术中借助多层神经网络结构进行心电数据的分类过程相比,本申请中通过将心电数据的周期性特征融入到数据形式与模型结构中,由于网络模型本身能提供更高的计算效率和更好的可解释性,使得针对等长的心跳数据所训练的网络模型具有更好的分类效果,能够降低训练过程中模型解耦所需的计算复杂度,使得心电数据分类结果具有更高的准确度。

作为图3中所示基于机器学习的心电数据分类的装置的进一步说明,图4是根据本发明实施例另一种基于机器学习的心电数据分类的装置的结构示意图,如图4所示,所述获取单元31包括:

分割模块311,可以用于将心电数据进行分割得到不同时间长度的心电片段,所述心电片段为一个心跳周期;

处理模块312,可以用于针对所述不同时间长度的心电片段进行重采样处理,得到多个等长的心跳数据。

在具体应用场景中,如图4所示,所述装置还包括:

构建单元34,可以用于在所述响应于心电分类任务的触发指令,将所述多个等长的心跳数据输入至预先构建的心电分类模型中进行预测之前,基于预先设置的心电分类任务标签,将多个等长的心跳样本输入至网络模型中进行训练,构建心电分类模型,所述网络模型包括多个表征模块和心跳聚合模块,所述表征模块用于学习单个心跳样本的向量表征,所述心跳聚合模块用于融合所述多个心跳样本的向量表征之间的信息;

所述构建单元34包括:

确定模块341,可以用于基于预先设置的心电分类任务标签,确定所述多个等长的心跳样本中每个心跳样本对应的类别标签和相应重采样因子,所述重采样因子为重采样的频率比例量化形成的数值;

训练模块342,可以用于将携带有类别标签的心跳样本与相应重采样因子进行拼接后,分别输入至不同的表征模块,得到每个心跳样本的向量表征;

构建模块343,可以用于将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

在具体应用场景中,如图4所示,所述表征模块包括归一化层和自注意力层,所述训练模块342包括:

拼接子模块3421,可以用于将携带有标签类别的心跳样本经过线性映射后与相应重采样因子进行拼接后,分别输入至单个心跳的表征模块进行训练;

编码子模块3422,可以用于利用所述表征模块的自注意力层,对拼接后的心跳样本进行特征编码,得到单个心跳样本的向量表征;

第一映射子模块3423,可以用于利用所述表征模块的归一化层,将所述单个心跳样本的向量表征映射到稳定分布的向量空间,以使得编码后的向量表征具有相同维度。

在具体应用场景中,所述编码子模块3422,具体可以用于利用所述窗口机制,将所述拼接后的心跳样本进行使用预设窗口长度进行划分,得到多个窗口的心跳样本数据;

所述编码子模块3422,具体还可以用于将所述表征模块的自注意力层作用于每个窗口的心跳样本数据,得到单个心跳样本的向量表征。

在具体应用场景中,如图4所示,所述心跳聚合模块包括卷积层、池化层和归一化层,所述构建模块343包括:

提取子模块3431,可以用于将各个表征模块输出的心跳样本的向量表征汇总后输入至聚合模块的卷积层,对所述汇总后心跳样本的向量表征进行特征提取;

第二映射子模块3432,可以用于利用所述聚合模块的归一化层,将特征提取后的向量表征映射到稳定分布的向量空间,以使得特征提取后的向量表征具有相同维度;

降维子模块3433,可以用于利用所述聚合模块的池化层,对特征提取后具有相同维度的向量表征进行降维度处理,得到心跳样本在不同类别上的映射关系,构建心电分类模型。

在具体应用场景中,如图4所示,所述装置还包括:

记录单元35,可以用于在所述将融合后心跳数据的向量表征处理到心跳数据在不同类别上的映射关系,输出心电数据的分类结果之后,根据所述心电数据的分类结果,记录所述心电数据的分布特征;

评估单元36,可以用于将所述心电数据的分布特征映射到心电分类任务设置的各个维度指标上,以对各个维度指标进行异常评估。

需要说明的是,本实施例提供的一种基于机器学习的心电数据分类的装置所涉及各功能单元的其他相应描述,可以参考图1、图2中的对应描述,在此不再赘述。

基于上述如图1、图2所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1、图2所示的基于机器学习的心电数据分类的方法。

基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。

基于上述如图1、图2所示的方法,以及图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1、图2所示的基于机器学习的心电数据分类的方法

可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。

本领域技术人员可以理解,本实施例提供的基于机器学习的心电数据分类的装置的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。

存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前现有技术相比,本申请中通过将心电数据的周期性特征融入到数据形式与模型结构中,由于网络模型本身能提供更高的计算效率和更好的可解释性,使得针对等长的心跳数据所训练的网络模型具有更好的分类效果,能够降低训练过程中模型解耦所需的计算复杂度,使得心电数据分类结果具有更高的准确度。

本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

20页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种老年痴呆症诊疗装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!