一种基于深度学***台的肺音特征分类系统及方法

文档序号:1771898 发布日期:2019-12-03 浏览:18次 >En<

阅读说明:本技术 一种基于深度学***台的肺音特征分类系统及方法 (A kind of lungs sound tagsort system and method based on deep learning and cloud platform ) 是由 刘满禄 赵子豪 张华� 宋宇 张静 周建 于 2019-09-26 设计创作,主要内容包括:本发明公开了一种基于深度学习和云平台的肺音特征分类系统及方法,系统包括肺音数据采集模块、数据预处理模块、语谱图图像数据获取模块、特征训练模块、特征分类模块和结果反馈模块。本发明可通过电子听诊器获取肺音,避免了人工听诊导致肺音特征获取不准确、X胸透诊断法和CT诊断法伤身的问题,本发明可以实现无主观性的获取肺音的特征,为医师提供肺音特征数据,便于医师进行后续的诊断。(The invention discloses a kind of lungs sound tagsort system and method based on deep learning and cloud platform, system includes lungs sound data acquisition module, data preprocessing module, sound spectrograph image data acquisition module, feature training module, tagsort module and result feedback module.The present invention can obtain lungs sound by electronic auscultation device, avoiding artificial auscultation causes lungs sound feature to obtain the problem of inaccuracy, X Chest X-rays diagnosis and CT diagnosis are harmful to the health, the feature of the acquisition lungs sound of no subjectivity may be implemented in the present invention, lungs sound characteristic is provided for doctor, carries out subsequent diagnosis convenient for doctor.)

一种基于深度学***台的肺音特征分类系统及方法

技术领域

本发明涉及声音信号处理领域,具体涉及一种基于深度学***台的肺音特征分类系统及方法。

背景技术

肺音是呼吸系统气体交换时产生的生理信号。异常肺音是呼吸系统产生病变时在一个呼吸周期中渗入到正常肺音的附加音,如哮鸣音、湿罗音和爆裂音等。哮鸣音常见于阻塞性肺疾病(如支气管哮喘,囊性纤维化);湿罗音常见于大叶性肺炎、肺充血和肺水肿的早期,也见于细支气管和肺泡炎等疾病;爆裂音常见于肺间质纤维化,慢性支气管炎病人也会有此异常肺音。气管壁的周期性震荡是哮鸣音的来源;湿罗音的发生是由于气体经过呼吸道与气道的分泌物(比如积液、痰、血等)作用后形成了水泡,最后破裂形成的肺音;气流与气管壁表面摩擦产生的间歇性脉冲是爆裂音的来源,持续时间短,约为5ms。肺音传导至人体前胸皮肤处和胸腔后背处,在此处采集的肺音往往混有环境噪音、皮肤摩擦音和心音的干扰,由于肺音通常用于帮助医师判断可能存在的病情,因此如何减小和消除这些干扰对肺音信号的影响,这是在对病人进行肺音诊断时必须考虑的。

肺音信号中蕴含着丰富的信息,这些信息对临床疾病的诊断和鉴别起着重要的作用,目前,在临床医学上对肺音疾病最常用的定性方法仍是人工听诊方法、X胸透诊断法和CT诊断法。通常,正确的听诊结果可辅助于其他检查结论,进而提高听诊效率和准确性。然而对于人工听诊方法来说,由于采用传统听诊器,其传导性能,频率范围等因素都可以影响到最终的结果,所以对于这种结果很难让专业人士信服。在X胸透诊断法和CT诊断法中,采用X射线穿透人体进行检查,若病人接触的X射线过多,超过身体能承受的范围,就可能产生放射性反应,甚至会有一定程度上遭受放射性损害。

发明内容

针对现有技术中的上述不足,本发明提供的一种基于深度学***台的肺音特征分类系统及方法解决了人工听诊肺音准确率不足,以及X胸透诊断法和CT诊断法伤身的问题。

为了达到上述发明目的,本发明采用的技术方案为:

提供一种基于深度学***台的肺音特征分类系统,其包括肺音数据采集模块、数据预处理模块、语谱图图像数据获取模块、特征训练模块、特征分类模块和结果反馈模块;

肺音数据采集模块,用于采集不同年龄段已知肺音特征的肺音音频数据;用于采集待分类肺音特征的肺音音频数据及年龄信息;

数据预处理模块,用于对肺音音频数据进行杂音过滤预处理,分别得到预处理后的不同年龄段已知肺音特征的肺音音频数据,和预处理后的待分类肺音特征的肺音音频数据;

语谱图图像数据获取模块,用于对预处理后肺音音频数据进行语谱图处理,分别获取不同年龄段已知肺音特征的语谱图图像数据,和待分类肺音特征的语谱图图像数据;

特征训练模块,用于建立数据库、搭建云平台并在云平台上建立深度学习网络,将不同年龄段已知肺音特征的语谱图图像数据及其对应的肺音特征作为深度学习网络的训练数据进行分类训练,获取训练后的深度学习网络;

特征分类模块,用于将待分类肺音特征的语谱图图像数据及年龄信息作为最新训练后的深度学习网络的输入,通过最新训练后的深度学习网络对该肺音的特征进行分类;

结果反馈模块,用于将输出特征分类模块所得到的分类结果保存至数据库并输出;根据专家系统获取该待分类肺音特征的肺音的真实肺音特征,并将该待分类肺音特征的肺音数据、年龄信息及其肺音特征作为训练数据对当前深度学习网络进行再训练,得到新的训练后的深度学习网络。

进一步地,数据预处理模块包括小波变换滤波单元和高通滤波单元;

小波变换滤波单元,用于滤除肺音中心音的干扰,得到带有失真的肺音;

高通滤波单元,用于去除带有失真的肺音中的干扰部分,得到预处理后的肺音音频数据。

进一步地,深度学习网络为AlexNet网络,AlexNet网络包括五个卷积层、三个池化层和三个全连接层,以及分为四类的softmax层,其排列顺序为卷积层-池化层-卷积层-池化层-卷积层-卷积层-卷积层-池化层-全连接层-全连接层-全连接层-softmax层;

第一个卷积层包括96个大小为11*11、步长为4的卷积核;

第一个池化层包括大小为3*3、步长为2的池化核;

第二个卷积层包括256个大小为5*5的卷积核;

第二个池化层包括大小为3*3、步长为2的池化核;

第三个卷积层包括384个大小为3*3的卷积核;

第四个卷积层包括384个大小为3*3的卷积核;

第五个卷积层包括256个大小为3*3的卷积核;

第三个池化层包括大小为3*3、步长为2的池化核;

softmax层的四个分类分别为正常音、哮鸣音、湿罗音和爆裂音。

进一步地,每个卷积层和全连接层的激活函数均为非线性激活函数ReLU。

提供一种基于深度学***台的肺音特征分类方法,其包括以下步骤:

S1、采集不同年龄段已知肺音特征的肺音音频数据,采集待分类肺音特征的肺音音频数据及年龄信息;

S2、对肺音音频数据进行杂音过滤预处理,分别得到预处理后的不同年龄段已知肺音特征的肺音音频数据,和预处理后的待分类肺音特征的肺音音频数据;

S3、对预处理后肺音音频数据进行语谱图处理,分别获取不同年龄段已知肺音特征的语谱图图像数据,和待分类肺音特征的语谱图图像数据;

S4、建立数据库、搭建云平台并在云平台上建立深度学习网络,将不同年龄段已知肺音特征的语谱图图像数据及其对应的肺音特征作为深度学习网络的训练数据进行分类训练,获取训练后的深度学习网络;

S5、将待分类肺音特征的语谱图图像数据及年龄信息作为最新训练后的深度学习网络的输入,通过最新训练后的深度学习网络对该肺音的特征进行分类;

S6、将输出特征分类模块所得到的分类结果保存至数据库并输出;

S7、根据专家系统获取该待分类肺音特征的肺音的真实肺音特征,并将该待分类肺音特征的肺音数据、年龄信息及其肺音特征作为训练数据对当前深度学习网络进行再训练,得到新的训练后的深度学习网络。

进一步地,步骤S1中不同年龄段具体为每一岁为一个年龄段;步骤S1中已知肺音特征包括正常音、哮鸣音、湿罗音和爆裂音。

进一步地,步骤S2中对肺音音频数据进行杂音过滤预处理的具体方法为:

采用小波变换滤波滤除肺音中心音的干扰,得到带有失真的肺音,采用高通滤波去除带有失真的肺音中的干扰部分,得到预处理后的肺音音频数据。

进一步地,步骤S5中建立深度学习网络的具体方法包括:

按照卷积层-池化层-卷积层-池化层-卷积层-卷积层-卷积层-池化层-全连接层-全连接层-全连接层-softmax层的顺序构建AlexNet网络;其中第一个卷积层包括96个大小为11*11、步长为4的卷积核;第一个池化层包括大小为3*3、步长为2的池化核;第二个卷积层包括256个大小为5*5的卷积核;第二个池化层包括大小为3*3、步长为2的池化核;第三个卷积层包括384个大小为3*3的卷积核;第四个卷积层包括384个大小为3*3的卷积核;第五个卷积层包括256个大小为3*3的卷积核;第三个池化层包括大小为3*3、步长为2的池化核;softmax层包括四个分类,其分别为正常音、哮鸣音、湿罗音和爆裂音;每个卷积层和全连接层的激活函数均为非线性激活函数ReLU。

本发明的有益效果为:

1、本发明可通过电子听诊器获取肺音,避免了人工听诊导致肺音特征获取不准确、X胸透诊断法和CT诊断法伤身的问题,本发明可以实现无主观性的获取肺音的特征,为医师提供肺音特征数据,便于医师进行后续的诊断。

2、本发明的肺音信号分类模型采用了AleNet作为信号分类深度学习网络,并选用神经元激活函数ReLU作为激活函数,其在训练时间的梯度衰减上面比一般的神经元激活函数tanh快6倍,因此本发明建立的深度学习网络极大地提高了训练的效率。

3、本发明提出将心音干扰作为小波滤波后的目标信号,用高通滤波后的肺音减去心音干扰成份,可得到较纯净的肺音。

4、针对不同年龄段用户的肺音信号有差异的问题,本发明提出对不同年龄段的用户分别训练对应的网络模型,本方法能够得出更具体和准确的分类结果。

5、常规的肺音诊断方法需要在医院等特定场所进行,需要花费大量的人力物力进行肺音采集及诊断,本发明的基于深度学***台的肺音特征分类系统及方法可以在普通场所很好地协助医生对病人的肺音特征类型进行分类。

6、本发明在云端构建数据库和深度学习网络,便于相关医院或机构实现数据共享,可便于相关医师学习并锻炼听诊能力,提高医师的专业度。

附图说明

图1为本系统的框架图;

图2为本方法的流程示意图。

具体实施方式

下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

如图1所示,该基于深度学***台的肺音特征分类系统包括肺音数据采集模块、数据预处理模块、语谱图图像数据获取模块、特征训练模块、特征分类模块和结果反馈模块;

肺音数据采集模块,用于采集不同年龄段已知肺音特征的肺音音频数据;用于采集待分类肺音特征的肺音音频数据及年龄信息;

数据预处理模块,用于对肺音音频数据进行杂音过滤预处理,分别得到预处理后的不同年龄段已知肺音特征的肺音音频数据,和预处理后的待分类肺音特征的肺音音频数据;

语谱图图像数据获取模块,用于对预处理后肺音音频数据进行语谱图处理,分别获取不同年龄段已知肺音特征的语谱图图像数据,和待分类肺音特征的语谱图图像数据;

特征训练模块,用于建立数据库、搭建云平台并在云平台上建立深度学习网络,将不同年龄段已知肺音特征的语谱图图像数据及其对应的肺音特征作为深度学习网络的训练数据进行分类训练,获取训练后的深度学习网络;

特征分类模块,用于将待分类肺音特征的语谱图图像数据及年龄信息作为最新训练后的深度学习网络的输入,通过最新训练后的深度学习网络对该肺音的特征进行分类;

结果反馈模块,用于将输出特征分类模块所得到的分类结果保存至数据库并输出;根据专家系统获取该待分类肺音特征的肺音的真实肺音特征,并将该待分类肺音特征的肺音数据、年龄信息及其肺音特征作为训练数据对当前深度学习网络进行再训练,得到新的训练后的深度学习网络。

数据预处理模块包括小波变换滤波单元和高通滤波单元;小波变换滤波单元,用于滤除肺音中心音的干扰,得到带有失真的肺音;高通滤波单元,用于去除带有失真的肺音中的干扰部分,得到预处理后的肺音音频数据。

深度学习网络为AlexNet网络,AlexNet网络包括五个卷积层、三个池化层和三个全连接层,以及分为四类的softmax层,其排列顺序为卷积层-池化层-卷积层-池化层-卷积层-卷积层-卷积层-池化层-全连接层-全连接层-全连接层-softmax层;第一个卷积层包括96个大小为11*11、步长为4的卷积核;第一个池化层包括大小为3*3、步长为2的池化核;第二个卷积层包括256个大小为5*5的卷积核;第二个池化层包括大小为3*3、步长为2的池化核;第三个卷积层包括384个大小为3*3的卷积核;第四个卷积层包括384个大小为3*3的卷积核;第五个卷积层包括256个大小为3*3的卷积核;第三个池化层包括大小为3*3、步长为2的池化核;softmax层的四个分类分别为正常音、哮鸣音、湿罗音和爆裂音。每个卷积层和全连接层的激活函数均为非线性激活函数ReLU。

如图2所示,该基于深度学***台的肺音特征分类方法包括以下步骤:

S1、采集不同年龄段已知肺音特征的肺音音频数据,采集待分类肺音特征的肺音音频数据及年龄信息;

S2、对肺音音频数据进行杂音过滤预处理,分别得到预处理后的不同年龄段已知肺音特征的肺音音频数据,和预处理后的待分类肺音特征的肺音音频数据;

S3、对预处理后肺音音频数据进行语谱图处理,分别获取不同年龄段已知肺音特征的语谱图图像数据,和待分类肺音特征的语谱图图像数据;

S4、建立数据库、搭建云平台并在云平台上建立深度学习网络,将不同年龄段已知肺音特征的语谱图图像数据及其对应的肺音特征作为深度学习网络的训练数据进行分类训练,获取训练后的深度学习网络;

S5、将待分类肺音特征的语谱图图像数据及年龄信息作为最新训练后的深度学习网络的输入,通过最新训练后的深度学习网络对该肺音的特征进行分类;

S6、将输出特征分类模块所得到的分类结果保存至数据库并输出;

S7、根据专家系统获取该待分类肺音特征的肺音的真实肺音特征,并将该待分类肺音特征的肺音数据、年龄信息及其肺音特征作为训练数据对当前深度学习网络进行再训练,得到新的训练后的深度学习网络。

步骤S1中不同年龄段具体为每一岁为一个年龄段;步骤S1中已知肺音特征包括正常音、哮鸣音、湿罗音和爆裂音。

步骤S2中对肺音音频数据进行杂音过滤预处理的具体方法为:采用小波变换滤波滤除肺音中心音的干扰,得到带有失真的肺音,采用高通滤波去除带有失真的肺音中的干扰部分,得到预处理后的肺音音频数据。

步骤S5中建立深度学习网络的具体方法包括:按照卷积层-池化层-卷积层-池化层-卷积层-卷积层-卷积层-池化层-全连接层-全连接层-全连接层-softmax层的顺序构建AlexNet网络;其中第一个卷积层包括96个大小为11*11、步长为4的卷积核;第一个池化层包括大小为3*3、步长为2的池化核;第二个卷积层包括256个大小为5*5的卷积核;第二个池化层包括大小为3*3、步长为2的池化核;第三个卷积层包括384个大小为3*3的卷积核;第四个卷积层包括384个大小为3*3的卷积核;第五个卷积层包括256个大小为3*3的卷积核;第三个池化层包括大小为3*3、步长为2的池化核;softmax层包括四个分类,其分别为正常音、哮鸣音、湿罗音和爆裂音;每个卷积层和全连接层的激活函数均为非线性激活函数ReLU。

在本发明的一个实施例中,经过预处理的肺音音频数据通过语谱图处理,得到包含肺音特征的语谱图图像信号,该肺音语谱图是彩色图像,需要将其进行RGB分离,得到三张227*227的图像,再将三张227*227的图像送入深度学习网络中进行下一步处理。

在具体实施过程中,对深度学习网络的训练可以以同一个年龄段中的数据对其进行训练,即得到多个与不同年龄段相对应深度学习网络,再根据待分类数据的年龄,选取对应年龄段的深度学习网络对其进行分类。也可以将不同的年龄段作为标签对深度学习网络进行训练,得到一个训练后的深度学习网络,再采用该网络对待分类数据进行分类。

综上所述,本发明可通过电子听诊器获取肺音,避免了人工听诊导致肺音特征获取不准确、X胸透诊断法和CT诊断法伤身的问题,本发明可以实现无主观性的获取肺音的特征,为医师提供肺音特征数据,便于医师进行后续的诊断。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:视频数据分布式存储方法、装置、计算机设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!