一种基于脉冲群智能算法并结合stft-psd和pca的癫痫时期分类方法

文档序号:1619933 发布日期:2020-01-14 浏览:3次 >En<

阅读说明:本技术 一种基于脉冲群智能算法并结合stft-psd和pca的癫痫时期分类方法 (Epileptic period classification method based on pulse group intelligent algorithm and combined with STFT-PSD and PCA ) 是由 段立娟 连召洋 陈军成 乔元华 于 2019-09-30 设计创作,主要内容包括:本文公开了一种癫痫时期特征提取及分类方法。首先,对原始的癫痫脑电数据进行随机打乱预处理,并分别划分4折的训练集和测试集。其次,采用结合方法对预处理后的数据提取特征,一方面,通过WPT或STFT-PSD提取非线性的时频特征,然后,在得到的时频特征上再结合PCA算法提取脑电数据的主成分特征,并消除噪声和冗余特征,并作为特征提取的最终特征。最后,采用脉冲神经网络对提取的特征做分类分析,脉冲神经网络算法不仅考虑个体互助和信息交互,拥有很强的鲁棒性;并且它模拟的神经元更加接近大脑中真实的神经元,考虑更多的时间信息,拥有更强的计算能力。(An epileptic stage feature extraction and classification method is disclosed. Firstly, carrying out random scrambling pretreatment on original epilepsia electroencephalogram data, and respectively dividing a training set and a test set which are respectively divided into 4 folds. Secondly, extracting characteristics of the preprocessed data by adopting a combination method, on one hand, extracting nonlinear time-frequency characteristics through WPT or STFT-PSD, then, extracting principal component characteristics of the electroencephalogram data by combining the obtained time-frequency characteristics with PCA algorithm, eliminating noise and redundant characteristics, and using the principal component characteristics as final characteristics of characteristic extraction. Finally, the extracted features are classified and analyzed by adopting a pulse neural network, and the pulse neural network algorithm not only considers individual mutual assistance and information interaction, but also has strong robustness; and the simulated neurons are closer to the real neurons in the brain, more time information is considered, and the method has stronger computing power.)

一种基于脉冲群智能算法并结合STFT-PSD和PCA的癫痫时期 分类方法

技术领域

本发明属于医学疾病中脑电信号处理技术领域,尤其涉及一种基于脉冲群智能算法并结合STFT-PSD和PCA的癫痫时期分类方法。

背景技术

癫痫是一种严重的脑功能障碍的疾病,不仅使患者躯体遭受痛苦,而且在一定程度上导致精神及社会心理障碍。癫痫严重损害患者的身心健康.将癫痫脑电信号从不同时期的检测出来,能够给医生诊断病情带来帮助。

由于采集到的脑电信号是一种随机性强、波形直观上缺乏规律性的非平稳信号,因此需要采用有效的特征提取方法来提高脑电信号的分类准确率。由于癫痫中频率的变化比较明显,而短时傅立叶变换的功率谱密度(STFT-PSD)和小波转换(WPT)都可以经过非线性转化从脑电信号中提取时频信息。此外,脑电信号中可能存在噪声,而WPT和STFT-PSD都不能有效的消除脑电信号中的噪声和不重要的冗余特征。主成分分析(PCA)在低维空间保持重要特征的同时,也可以消除噪声和不重要的特征。因此本文采用STFT-PSD或WPT与PCA结合来提取脑电特征。

提取的特征主要用于癫痫脑电信号的分类,Murugavel提出了一种分层结合的支撑向量机MSVM算法和极限学习机ELM算法用于癫痫时期分类。然而,传统的机器学习分类算法的性能也有待提高,选择合适的分类模型变得非常关键。脉冲群智能优化算法是一种结合了群智能优化和脉冲神经元模型的分类算法。群智能优化算法是一种仿生的随机搜索算法,它没有中心控制,因此当一个或几个个体表现不好的时候,不会影响整体求解问题。布谷鸟算法可以通过模拟布谷鸟的寄生育雏和Levy飞行机制有效求解优化问题。此外,癫痫与大脑中神经元脉冲的发放有一定的关系。脉冲神经元模型SNM考虑时间信息的影响,其模拟的神经元更加接近人类真实大脑中的神经元,在生物医学方面已有很强的理论支撑。因此,本文采用脉冲群智能算法算完成癫痫时期的分类。

发明内容

针对上述背景,本发明提出一种基于脉冲群智能算法并结合STFT-PSD和PCA的癫痫时期分类方法,并提高其分类准确率。在特征提取方面,首先用STFT-PSD或WPT提取非线性的时频特征,然后,采用PCA提取主成分特征并消除噪声和不重要的冗余特征。在特征分类方面,脉冲群智能分类算法不仅充分考虑了个体合作和信息交互,拥有很强的鲁棒性,并且考虑更多的信息,拥有更强的计算能力。

为实现上述目的,本发明采用如下的技术方案:

一种基于脉冲群智能算法并结合STFT-PSD和PCA的癫痫时期分类方法,包括:

步骤(1)脑电信号预处理

把得到癫痫的脑电数据随机打乱并归一化,采用4折交叉验证的方法划分每折的训练集和测试集。

步骤(2)特征提取与融合

首先用STFT-PSD或WPT提取非线性的时频特征,然后,采用PCA提取主成分特征并消除噪声和不重要的冗余特征。

a.时频特征提取

通过WPT或STFT-PSD对预处理后的脑电数据提取时频特征。

通过WPT提取非线性的时频特征。

1)计算小波树的重建系数c。

2)然后,计算子频带平均方差系数。

通过STFT-PSD提取非线性的时频特征。

1)用FFT计算信号的DFT。

2)然后,计算PSD的自动谱。

3)把特征矩阵拉伸为特征向量。

b.线性特征提取

根据得到的时频特征,通过PCA提取主成分特征,并消除冗余噪声。

1)通过优化目标函数获得权重。

2)通过权重和时频特征可以得到低维空间坐标,得到最终的特征。

步骤(3)特征分类

在分类方法方面,脉冲群智能算法充分考虑个体合作和信息交互,并且拥有更强的计算能力。脉冲群智能优化分类算法结合带Levy飞行机制的布谷鸟搜索算法(CS)和脉冲神经元模型(SNM)。在SNM中模拟的神经元更加真实,并且考虑更多的时间信息。神经元(也就是CS中的个体)不是在每次都被激活,只有当它们的能量达到一定的值时才会被激活。当一个个体被激活后,便发射脉冲并且传递信息给CS中的其它个体,其它个体根据适应度值决定靠近还是远离该个体。

SNM-CS分类模型的过程如下:

1)生成初始种群N个鸟巢,及初始化参数。

2)随机选择一个布谷鸟,并通过Levy飞行机制生成新的候选解。

3)与SNM结合获得脉冲发射率。

4)更新候选解

5)丢弃一些不好的个体并建立新的个体。

6)更新并发现历史种群最优解,并转化为癫痫脑电信号的分类准确率。

附图说明

图1为本发明所涉及方法的结构图;

具体实施方式

下面结合附图和具体实施细节对本发明做进一步的描述。

本发明所涉及方法的流程包括以下步骤:

(1)脑电信号预处理。

首先,把得到癫痫脑电数据随机打乱并归一化。然后,前75%的样本为训练集,后25%的样本为测试集,并采用4-折交叉验证。

(2)结合特征提取

a.非线性时频特征提取

通过WPT提取时频特征E,具体如下:

1)计算小波树的重建系数c:

ci,j1=Fwprcoef(X,i,n,nt,iwin,a1,b1)

其中X是经过预处理后的输入脑电信号(EEG),i是EEG样本的序号,n是每个EEG样本内的采样点数,n=4096,nt为时间窗的采样点,nt=32,iwin是时间窗口的序号,a1为分解级别,a1=3,b1为小波基的名称,b1=dmey,j1是与a1和iwin有关的变量。

2)然后,计算子频带平均方差系数E:

Figure BDA0002222861470000031

其中,a2为子频带的数目,

Figure BDA0002222861470000032

j2是与a1和iwin有关的变量,1≤j2≤128,ik为子频带的序号,Fvar是求方差的函数,j2是与a1和iwin有关的变量,时频特征向量E为128维。

通过STPT-PSD提取非线性的时频特征P。

1)用FFT计算信号的DFT。

[Y,f]=FDFT(Xin,n,nop,nwin,nfft,fs)

其中,矩阵Xin是每个带有合适偏置的EEG样本向量x的中心估计。n是每个EEG样本的采样点,nop是交叠窗口的长度,nop=128,nwin为滑动窗口的长度,nwin=256,nfft为离散傅立叶变换(DFT)的采样点,nfft=256,fs为采用频率,fs=128,f为为由每个EEG样本采样频率构成的采用频率向量,Y为经过DFT后信号的矩阵值。

2)然后,计算PSD的功率密度谱矩阵Pxx

Pxx=FPSD(Y,nfft,f,n,nop,nwin,fs)

其中,Pxx为功率密度谱矩阵,FPSD为求功率密度矩阵的函数。

3)最后,把每个EEG样本的129×31维矩阵Pxx拉成一个3999维的向量特征P。

b.线性特征提取Y

1)通过优化目标函数L(w)获得权重W和特征值λ

L(w)=wTCw-λ(wTw-1)

根据ACR选择PCA输出的维数,其中ACR累计贡献率,ACR的大小与计算的特征值λ有关,经过WPT后,当维数为8时,即选取前8维的特征值λ和对应的权重W时,ACR为98.02%并且高于98%。经过STFT-PSD后,当维数为33时,ACR为98.145%并且高于98%。

2)通过权重W和特征X可以得到低维空间坐标Y

Y=XW

其中,X为通过WPT提取时频特征E或为通过STPT-PSD提取非线性的时频特征P。Y为与之对应的输出的线性特征,当X为E时,X为128维,Y为8维;当X为P时,X为3999维,Y为33维;

(3)特征分类

将经过PCA后提取的线性特征输入SNM-CS分类模型,完成癫痫脑电信号的分类。

SNM-CS分类模型的过程如下

1)生成初始种群N个个体,及初始化参数。

初始化种群中个体的值(即权重W,也是候选解或个体的位置)。这里,N=40,权重的下限值Lb=-20,权重的上限值Lu=20

当未达到迭代次t<iter或训练数据集的分类准确率小于阈值时,重复2)到5)

2)随机选择一个布谷鸟,并通过Levy飞行机制生成新的候选解,即新的位置,具体过程如下:

通过Levy飞行机制生成新位置的公式如下

Figure BDA0002222861470000051

其中,α>0是步长缩放因子,α=1,λ=1.2,Levy随机路径定义如下:

Figure BDA0002222861470000052

Figure BDA0002222861470000053

其中,N(.)为正态分布函数,σ2为正态分布的方差,Γ(.)为伽玛分布函数。

3)与SNM结合获得脉冲发射率和适应度值,脉冲发射率的计算方法如下:

脉冲神经云模型可以用于求解识别问题,基于同类样本产生类似的脉冲发射率。

输入电流定义如下:

I=γ·x·w

其中,X是分类模型的输入数据,是经过PCA后提取线性特征,w为SNM中神经元的权重,γ为辅助神经元发射的加速因子,γ=100。

将求得的输入电流I代入如下公式,计算得到ν,μ,具体公式如下:

Figure BDA0002222861470000054

Figure BDA0002222861470000055

其中,C为膜电容,C=100,ν为神经元的膜电压,μ为恢复变量,vr为重置膜电压参照值,vr=-60,vt为瞬时门限电压,vt=-40,系数为k=0.7,a为恢复变量的缩放因子,a=0.03,b为恢复变量的灵敏度,b=-2,vc为膜电压的重置值,vc=-50,˙表示求导,Ud为发放脉冲后恢复变量的递增值,Ud=100。当v>vpeak,vpeak=35,v设置为vc,μ设置为U+Ud并发放脉冲。脉冲发射率如下vfire及个体适应度(即分类准确率)fi函数如下:

vfire=Ffire(u,v,vpeak)

fi=Ffit(vfire,T)

其中,vfire为得到的脉冲发射率,Ffire为计算脉冲发射率的函数,根据单位时间内发放脉冲的个数来计算个体的脉冲发射率,T为脑电数据的标签值,Ffit为计算适应度的函数,根据个体的脉冲发射率vfire,把个体分成不同类别,并和标签值T对比,计算分类准确率,也就是个体的适应度,fi为得到的个体适应度,也是样本的分类准确率。

4)更新个体当前解以及种群的局部最优解

如果当前迭代的候选解适应度fi大于上次迭代的候选解适应度fj,则个体的候选解j更新为i,如果个体候选解的适应度大于当前局部最优解,更新种群局部最优解为当前个体的候选解。

5)丢弃一些不好的个体并建立新的个体;

种群中会以一定的概率Pa丢弃不好的个体,即不好的候选解,Pa=0.35,并且重建个体。丢弃个体间相似性大于阈值的候选解,也丢弃适应度小于阈值的候选解。

6)根据种群每次迭代的局部最优解,得到种群历史最优解,和种群最优解处的癫痫脑电信号的分类准确率。

为了了验证算法的稳定性,算法运行20次,每次计算4折交叉验证的平均准确率,随后,记录下这20次的最高准确率和平均准确率。

对比分析

表1本发明方法与主流脑电分类算法的准确率对比

Figure BDA0002222861470000061

对比实验中采用德国波恩大学公开数据集来验证特征提取及分类算法的性能。实验结合如表1所示,Max_acc代表算法运行20次4折平均准确率中的最高分类准确率,Avg_acc代表20次4折平均准确率中的平均分类准确率。第二栏是采用的特征提取方法的名称,第三栏是采用的分类模型的名称。ELM算法在原始数据上的平均分类准确率和最高分类准确率分别为79.44%和88%,ELM作为分类模型,DFA、AE和HE分别作为特征提取的平均分类准确率分别为82%、88%和88%。WPT作为特征提取,HELM和KHELM分别作为分类模型,平均分类准确率分别为90.32%和93.68%,最高分类准确率分别为94%和98%。STFT-PSD作为特征提取,HELM和KHELM分别作为分类模型,平均分类准确率分别为93.56%和94.36%,最高分类准确率都为98%。Nonlinear Features作为特征提取,GMM作为分类模型,平均分类准确率为95%。EMD作为特征提取,C4.5作为分类模型,平均分类准确率为95.3%。FLP作为特征提取,Kernel SVM作为分类模型,平均分类准确率为95.33%。WPE作为特征提取,SVM作为分类模型,平均分类准确率为96.5%。DTCWT作为特征提取,GRNN作为分类模型,平均分类准确率为98.00%。FE-ESN作为特征提取,ELM作为分类模型,最高分类准确率为98.3%。如表1所示,我们发明的癫痫时期分类方法,用WPT或STFT-PSD提取非线性的时频特征,然后结合PCA提取主成分特征,并消除噪声,最后结合SNM-CS分类方法,其分类准确率有明显提升。WPT+PCA或STFT-PSD+PCA结合SNM-CS的最高分类准确率都可以达到100%,平均分类准确率分别达到98.53%和98.95%。与其它对比方法相比,我们发明的结合特征及分类方法的平均分类准确率和最高分类准确率都是最高的。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于脑电多参数的虚拟现实情境任务注意力测训系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!