一种基于时序卷积网络的中医脉象识别模型的建立方法

文档序号：1896157 发布日期：2021-11-30 浏览：31次 >En<

阅读说明：本技术 一种基于时序卷积网络的中医脉象识别模型的建立方法 (Method for establishing traditional Chinese medicine pulse condition recognition model based on time sequence convolution network ) 是由郭睿颜建军燕海霞王忆勤朱光耀于 2021-09-08 设计创作，主要内容包括：本发明公开了一种基于时序卷积网络的中医脉象识别模型的建立方法,通过检测手环对腕部桡动脉处的压力脉搏波信号、容积脉搏波信进行采集,通过检测指夹对指端的容积脉搏波信号进行采集,得到原始脉搏波信号,分别获得原始脉搏波信号的单周期波形；并对单周期波形的长度作规正化处理,获得具有相同长度的脉象时间序列的数据集；然后将数据集分为训练集、验证集和测试集,对训练集和验证集进行时序卷积网络计算,并进行验证和超参数调整,最终得到脉象识别模型；然后将测试集导入到脉象识别模型进行识别验证,得到脉象诊断识别的预测结果。本发明所提出的脉象识别方法拥有较高的准确率,可以为人体心血管系统健康状态的诊断提供参考。(The invention discloses a method for establishing a traditional Chinese medicine pulse condition recognition model based on a time sequence convolution network, which comprises the steps of collecting pressure pulse wave signals and volume pulse wave signals at the radial artery position of a wrist through a detection bracelet, collecting the volume pulse wave signals at a finger end through a detection finger clip to obtain original pulse wave signals, and respectively obtaining single-period waveforms of the original pulse wave signals; normalizing the length of the monocycle waveform to obtain a data set of pulse condition time series with the same length; then dividing the data set into a training set, a verification set and a test set, carrying out time sequence convolution network calculation on the training set and the verification set, and carrying out verification and hyper-parameter adjustment to finally obtain a pulse condition identification model; and then, importing the test set into a pulse condition identification model for identification verification to obtain a prediction result of pulse condition diagnosis and identification. The pulse condition identification method provided by the invention has higher accuracy and can provide reference for the diagnosis of the health state of the cardiovascular system of the human body.)

技术领域

本发明涉及脉象识别技术领域，具体为一种基于时序卷积网络的中医脉象识别模型的建立方法。

背景技术

人体的脉象信号与心脏搏动、脉道通利和气血盈亏直接相关，具有时变性和非线性的特点。不同类型的脉象信号会呈现出较明显的形态差异。

在脉象信号的分析识别研究中，一般首先对脉搏波进行特征提取，然后再建立脉象信号分类模型。通过特征点法提取了脉搏波上具有生理意义的时域特征，这种分析方法较直观、运用较多，但通常只能反映部分的脉搏波信息；文献则使用频域分析法，从统计的角度获取不同脉象的频域特征，但是缺少了时间维度上的形态变化信息；采用的时频域分析法结合了时间和频谱的信息，但其更倾向于描述脉象局部状态的特征。不难发现，上述分析方法通常在提取特征后，还需要利用机器学习等算法对特征数据集进行学习，以建立脉象信号分类模型，但是所提取的特征难以完整体现脉象信号在时域上的形态变化，可能导致部分细节信息的丢失，从而降低模型的识别准确率。

因此我们对此做出改进，提出一种基于时序卷积网络的中医脉象识别模型的建立方法。

发明内容

为了解决上述技术问题，本发明提供了如下的技术方案：

本发明一种基于时序卷积网络的中医脉象识别模型的建立方法，包括以下几个步骤：

步骤1：原始脉搏波信号的采集，通过检测手环对腕部桡动脉处的压力脉搏波信号、容积脉搏波信进行采集，通过检测指夹对指端的容积脉搏波信号进行采集，得到原始脉搏波信号，分别获得原始脉搏波信号的单周期波形；

步骤2：并对单周期波形的长度作规正化处理，获得具有相同长度的脉象时间序列的数据集；

步骤3：然后将数据集分为训练集、验证集和测试集，对训练集和验证集进行时序卷积网络计算，并进行验证和超参数调整，最终得到脉象识别模型；

步骤4：然后将测试集导入到脉象识别模型进行识别验证，得到脉象诊断识别的预测结果。

作为本发明的一种优选技术方案，所述的步骤2中对单周期波形的长度作规正化处理的方法是，

步骤1，设定统一的脉象序列长度，使其至少可容纳一个单周期脉搏波；

步骤2，使用同一样本分割得到的单周期脉搏波补充在序列末尾，直至达到设定的序列长度。

作为本发明的一种优选技术方案，所述对训练集和验证集进行时序卷积网络计算的方法，是将多个残差块结构串联组成时序卷积网络，每个残差块结构中具有两个参数相同的膨胀因果卷积层，在输入的一维脉象时间序列经膨胀因果卷积层卷积后，在进行权重归一化，随后使用线性整流函数为激活函数，最后进行了正则化，按照此步骤进行两次；在残差块进行残差连接恒等映射的过程中，使用了1×1卷积，使得其输入与输出张量的维度保持一致。

作为本发明的一种优选技术方案，所述膨胀因果卷积的方法是，

若定义输入的脉象时间序列为0层，RF_(m，n)为第层中节点在第层上感受野大小，则在步长为1的前提下通过推导计算，膨胀卷积中各层的感受野大小如下：

其中，式中k_i、d_i分别为对第1层作膨胀卷积时卷积核的大小和膨胀率，若保持各层卷积核大不变，则经过简化后，各卷积层中的节点在0层的感受野大小为：

本发明的有益效果是：该种基于时序卷积网络的中医脉象识别模型的建立方法，原始脉搏波信号的采集，通过检测手环对腕部桡动脉处的压力脉搏波信号、容积脉搏波信进行采集，通过检测指夹对指端的容积脉搏波信号进行采集，得到原始脉搏波信号，分别获得原始脉搏波信号的单周期波形；并对单周期波形的长度作规正化处理，获得具有相同长度的脉象时间序列的数据集；然后将数据集分为训练集、验证集和测试集，对训练集和验证集进行时序卷积网络计算，并进行验证和超参数调整，最终得到脉象识别模型；然后将测试集导入到脉象识别模型进行识别验证，得到脉象诊断识别的预测结果。能够从脉象时间序列中提取出具有显著差异性的特征，较好地保留了脉象信号中的形态信息。在TCN特征自学习的过程中，网络在膨胀因果卷积的作用下，在有限的层次中扩大了对脉象时间序列的感受野，更好地抓取了脉象信号的细节信息和形态变化特征，从而使脉象信号识别模型获得了良好的分类性能。本发明所提出的脉象识别方法拥有较高的准确率，可以为人体心血管系统健康状态的诊断提供参考。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中；

图1是本发明的基于时序卷积网络的中医脉象识别模型的建立方法的流程示意图；

图2是本发明的残差块结构的结构示意图；

图3是本发明的膨胀因果卷积的结构示意图；

图4是基于TCN的脉象识别模型网络结构的结构示意图；

图5是前级TCN层提取的部分特征曲线图；

图6是后级TCN层提取的64个特征值的变化曲线对比图；

图7是七组脉象时间序列两两之间存在显著性差异的特征数量。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例：如图1所示，本发明一种基于时序卷积网络的中医脉象识别模型的建立方法，包括以下几个步骤：

步骤2：并对单周期波形的长度作规正化处理，获得具有相同长度的脉象时间序列的数据集；

步骤3：然后将数据集分为训练集、验证集和测试集，对训练集和验证集进行时序卷积网络计算，并进行验证和超参数调整，最终得到脉象识别模型；

步骤4：然后将测试集导入到脉象识别模型进行识别验证，得到脉象诊断识别的预测结果。

本发明能够从脉象时间序列中提取出具有显著差异性的特征，较好地保留了脉象信号中的形态信息。在TCN特征自学习的过程中，网络在膨胀因果卷积的作用下，在有限的层次中扩大了对脉象时间序列的感受野，更好地抓取了脉象信号的细节信息和形态变化特征，从而使脉象信号识别模型获得了良好的分类性能。本发明所提出的脉象识别方法拥有较高的准确率，可以为人体心血管系统健康状态的诊断提供参考。

由于不同个体的单周期波形长度并不一致，而TCN网络需要输入长度一致的时间序列，因而需要对其进行规正化处理。常用的规正化处理方式有末尾补零和多抽样，率重采样两种。但前者会导致脉搏周期较短的序列出现大量无意义信息，后者则可能会丢失重要细节变化。因此，为使脉象时间序列保持原有形态和信息完整性，本发明采用如下规正化处理方式。

所述的步骤2中对单周期波形的长度作规正化处理的方法是，

步骤1，设定统一的脉象序列长度，使其至少可容纳一个单周期脉搏波；

步骤2，使用同一样本分割得到的单周期脉搏波补充在序列末尾，直至达到设定的序列长度。

所述对训练集和验证集进行时序卷积网络计算的方法，是将多个残差块结构串联组成时序卷积网络，每个残差块结构中具有两个参数相同的膨胀因果卷积层，在输入的一维脉象时间序列经膨胀因果卷积层卷积后，在进行权重归一化，随后使用线性整流函数为激活函数，最后进行了正则化，按照此步骤进行两次；在残差块进行残差连接恒等映射的过程中，使用了1×1卷积，使得其输入与输出张量的维度保持一致。

其中残差块结构的结构示意图如图2所示，TCN是一种可用于处理时序问题的网络。对于较长的脉象时间序列，传统的CNN由于卷积核大小的限制，无法在有限的层次中很好地抓取该序列内的依赖信息。TCN则采用了一种新的网络结构，解决了CNN在处理时序问题上的缺陷。

为在对脉象时间序列进行卷积处理时，能够抓取时间序列上更多的形态变化信息，需要扩大神经节点的感受野(Receptive Field，RF)。在标准卷积的网络中，扩大感受野一般有增加网络层深度、增大卷积核尺寸、池化和增加步长等方式，但这可能会导致计算量的大幅增加和脉象时间序列中重要特征信息的丢失。而膨胀卷积通过在标准卷积核中注入空洞，能够在保留脉象特征信息的同时实现感受野的指数级增长。在因果卷积的基础上，按膨胀率(d)在卷积核中添加空洞，实现卷积核的扩张。图3可以看到，当1时，卷积核大小与2×1的标准卷积核一致，在一维卷积中其感受野大小为2，而当d＝2时，节点对脉象时间序列的感受野扩大到了4，而当

d＝4时，节点对序列的感受野再次扩大了两倍。

其中所述膨胀因果卷积的方法是，

本发明以TCN为基础建立了脉象信号分类模型，模型网络如图4所示。在该网络结构中，堆叠了两级TCN，使感受野更大、网络更稳定。输入的脉象时间序列维度为800×1，经试验，卷积层使用5×1滤波器，滑动步长为1，并在前级和后级中滤波器数量分别设置为32和64。TCN残差块中的膨胀率设置为[1,2,4,8,16,32,64]，并采用锯齿状结构在两级TCN中重复。前级对脉象时间序列的感受野大小为509，而通过采用两级TCN后，感受野可以增大到1017。可以看到堆叠式TCN能够通过少数几层网络就实现较大的感受野，与传统CNN等网络相比大幅降低了计算成本，同时对较长的脉象时间序列也具有良好的特征信息抓取能力。

建立深度学习网络模型需要大量样本数据作为支撑，但由于时间限制、社会环境等原因，在临床采集到的脉象样本数量有限，因此本发明使用上海中医药大学四诊信息综合研究实验室提供的脉象数据建立识别模型。数据采样频率为720Hz，七类脉象样本共1812例，其中滑脉221例、平脉96例、细脉92例、弦脉657例、细滑脉202例、细弦脉325例、弦滑脉219例。在训练时序卷积网络前，对压力脉搏波信号进行了归一化处理。因此，由于不同采集设备的信号放大倍数不一致导致的幅值差异不会影响模型在脉诊手环采集得到脉象数据上的分类性能。

为避免样本数量的不均衡而导致分类模型发生过拟合，降低分类性能，本发明使用少数类样本过采样技术来均衡七类脉象样本数量，共得到4355例样本，各类样本占比分别为：14.68％、14.83％、13.95％、14.39％、13.51％、14.10％、14.54％。实验中设置训练集、验证集和测试集的样本比例为6:2:2。

本发明采用分类模型研究中常用的准确率、精确率和召回率指标来评价模型的整体性能，准确率Accuarcy、精确率Precision和召回率Recall的定义如下

在这三个评价指标中，准确率代表了整体的预测准确度，精确率代表对某一类预测结果的预测准确度，召回率代表对某一类样本的预测准确度。此外，采用了混淆矩阵展示各类脉象样本预测结果的分布情况。

本发明所建立的TCN模型通过卷积实现了对时间序列的特征提取。如图5展示了七类脉象时间序列经过前级TCN层中32个滤波器的卷积后，提取的32组特征曲线(图中展示了部分曲线)。从图中可以看出，所提取的特征曲线与脉象时间序列的形态变化有较强的相关性：第一组基本保留了脉象波形的主要变化趋势特征；第二组的特征曲线变化幅度较小，主要反映了波形上的细微变化，如降中峡、重搏波等；第三组则对脉搏波的起跳点十分敏感，对应每个脉象周期的起点后都有明显的尖峰出现；第四组对不同脉象的时间序列表现出波形变化上的差异，如对弦脉及其兼脉普遍出现了较剧烈的变化，而对细脉及其兼脉，其变化幅度较小，可以认为该组特征保留了脉象时间序列中更深层的信息。由此可见，在本发明建立的前级TCN层中，对同一脉象时间序列提取的32组特征曲线互不相同、各有特点。据此可以判断出，TCN在特征自学习的过程中，从不同角度保留了脉象时间序列上的形态特点，形成了信息上的互补。

而在后级TCN层中，上述32组特征曲线序列经过64个滤波器的卷积后输出64个特征。如图6所示，从每类脉象时间序列的特征提取结果中随机选取了三组进行对比。

从中可以看出，在同一类脉象时间序列的64个特征中，在其特征值变化曲线上存在一些较为明显的相似区间(图中黑色线框所示)，这些特征点的相似区间反映了在同一类脉象的时间序列上存在有共同点，表明携带有相近或相同的生理病理信息。而在兼脉之间，也存在部分相似区间(图中红色线框所示)，例如在细脉和细滑脉的第25个至第45个特征点区间内，变化曲线呈现出2～3个主要的波峰，并且波峰波谷所处特征点位置和幅度基本一致，表明在细滑脉的时间序列中也兼具有细脉时间序列的形态信息。简言之，64个特征对于同一种类或者具有相同性质的脉象样本表现出相似的数值变化，而这些共性为后续的脉象分类识别提供了重要依据。

为进一步研究通过深度学习网络TCN提取的脉象时间序列特征在七组脉象之间的差异性，使用SPSS24.0对所有测试集样本的64个特征进行了统计分析。首先对七组样本的64个特征进行正态性检验和方差齐性检验后，发现不满足使用参数检验的要求，因此选用了非参数检验中的Kruskal-Wallis H检验方法对七组独立脉象样本进行了统计分析，显著性水平为0.05。结果显示七组样本在所提取的64个特征上整体呈显著性差异(P<0.05)，即对于每个特征，七组脉象时间序列中至少有两组在该特征上具有显著性差异。进而本发明对各组脉象特征之间的差异性进行了事后检验，并使用Bonferroni校正调整显著性水平至0.00238。图7显示了在七组脉象时间序列的两两比较中呈现显同类脉象样本特征值曲线的部分相似处兼脉样本特征值曲线的部分相似处华东理工大学硕士学位论文第63页著性差异(P<0.00238)的特征数量。

任意两组脉象之间在64个特征上，至少有一半以上的特征存在

显著性差异，其中弦脉和平脉之间呈显著性差异的特征数量最多，达58个；而细滑脉和滑脉之间呈显著性差异的特征数量最少，为38个。此外，表5.2还显示出单脉(滑脉、平脉、细脉、弦脉)之间具有显著性差异的特征数量相对较多，最小值为细脉与平脉之间的45个；兼脉(细滑脉、细弦脉、弦滑脉)之间的具有显著性差异的特征数量相对较少，最大值为弦滑脉和细滑脉之间的42个；兼脉与其相应并见单脉(如细滑脉与细脉、滑脉)之间具有显著性差异的特征数量也相对较少，最大值出现在细脉与细滑脉之间，为48个，最小值为细滑脉与滑脉之间的38个。由此可见，通过TCN自学习方式对脉象时间序列提取的64个特征较好地保留了脉象形态变化上的关键信息，使得在单脉之间多数特征出现较大的差异性，而在兼脉上由于其兼具有多种脉象的特性，使得所提取的特征也保留了其中并见脉象的部分信息，导致兼脉与其并见脉之间有显著差异。

特征的数量与单脉之间相比略少。通过上述对TCN提取的脉象时间序列特征的定性和定量分析，可以判断出利用时序卷积直接对脉象时间序列提取的特征能够较好地反映不同脉象在时域上的形态变化，对于一些细节信息和更深层次的形态信息也可以进行较充分地挖掘和保留，获取了较多数量的在不同种类脉象上具有显著性差异的脉象特征。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

11页详细技术资料下载

一种基于时序卷积网络的中医脉象识别模型的建立方法

相关技术

网友询问留言