一种基于半监督生成对抗网络的轴承故障诊断方法

文档序号:1657586 发布日期:2019-12-27 浏览:8次 >En<

阅读说明:本技术 一种基于半监督生成对抗网络的轴承故障诊断方法 (Bearing fault diagnosis method based on semi-supervised generation countermeasure network ) 是由 陶洪峰 王鹏 魏强 庄志和 周龙辉 王连云 于 2019-09-23 设计创作,主要内容包括:本发明涉及一种基于半监督生成对抗网络的轴承故障诊断方法,包括:获取轴承在不同状态下的振动信号,并划分为多个样本;将样本随机划分为训练集和测试集,在训练集中构建少量不同故障的标签样本;构建一维半监督生成对抗网络模型;将训练集输入该对抗网络进行训练;训练好的对抗网络用于测试集中轴承故障的诊断。本发明直接输入原始采集的振动信号,经过训练直接输出测试集中轴承故障类别,实现了端到端的最优诊断模型;并通过使用一维卷积层和一维反卷积层,强化了一维半监督生成对抗网络提取特征的能力;本发明为一种半监督训练方式,不需要大量的人工标签样本,大大节约了时间和人力成本,并且轴承故障诊断效果和抗噪声能力强,稳定性好。(The invention relates to a bearing fault diagnosis method based on a semi-supervised generation countermeasure network, which comprises the following steps: obtaining vibration signals of a bearing in different states, and dividing the vibration signals into a plurality of samples; randomly dividing the samples into a training set and a testing set, and constructing a small number of label samples with different faults in the training set; constructing a one-dimensional semi-supervised generation confrontation network model; inputting a training set into the confrontation network for training; the trained countermeasure network is used for testing the diagnosis of concentrated bearing faults. The method directly inputs the originally acquired vibration signal, directly outputs the concentrated bearing fault category after training, and realizes an end-to-end optimal diagnosis model; the capability of one-dimensional semi-supervised generation of the confrontation network for extracting features is enhanced by using the one-dimensional convolution layer and the one-dimensional deconvolution layer; the invention is a semi-supervised training mode, does not need a large number of manual label samples, greatly saves time and labor cost, and has strong bearing fault diagnosis effect and anti-noise capability and good stability.)

一种基于半监督生成对抗网络的轴承故障诊断方法

技术领域

本发明涉及轴承故障诊断技术领域,尤其是一种基于半监督生成对抗网络的轴承故障诊断方法。

背景技术

在机械系统和电力系统中,滚动轴承作为重要基础部件之一,在各种复杂工况下,常常容易发生滚动体变形、磨损、腐蚀、裂缝等各种形式的缺陷。损伤的滚动轴承可能造成工程实践中生产过程的巨大经济损失,甚至可能造成人员安全事故。因此,对滚动轴承故障诊断的研究具有很重要的意义。

滚动轴承的故障类型按照其故障形式分,主要包括剥落、磨损、腐蚀等,造成这些故障的原因十分复杂,结构的设计问题,运行过程中装配、使用以及保养不当都可能导致轴承的故障。在轴承的运行过程中,如果某些部位出现故障,故障点与其接触部位会随着轴承的转动产生冲击性脉冲,该脉冲会对轴承的固有频率形成脉冲调制现象。故障发生在轴承不同部位,其冲击脉冲形式不同,具体表现在接触部位经过损伤部位的频率不同,这个频率称之为故障的“特征频率”。因此,按照故障发生的部位,可以将滚动轴承的故障分为内圈故障、外圈故障、滚动体故障和保持架故障4类。

现有技术中,轴承故障诊断主要采用的手段是获取设备的振动信号、声发射信号、电磁信号、超声信号等,通过一定的手段从这些信号之中获得轴承的相关故障信息。具体可归纳为特征提取和故障识别两个步骤。在特征提取方面,原始信号在时域、频域以及时频域的特征已经得到了广泛研究,包括小波变换,短时傅里叶变换,经验模态分解等信号处理方法。在故障识别方面,则由一些人工智能方法如支持向量机、人工神经网络和k最近邻法则等来实现。此外,近年来,由于深度学习可以构建深度神经网络,能够自动学习低层特征,并逐步形成更加抽象的高层表示,所以深度学习已经广泛应用到轴承故障诊断领域。

不管是传统故障诊断方法还是基于深度学习的轴承故障诊断方法,多数是监督学习,需要大量的数据标签。但在实际问题中,获得的原始数据大部分是无标签数据,手工标注故障样本需要丰富的专家经验,并且需要耗费大量的时间和人力成本。

发明内容

本申请人针对上述现有生产技术中的缺点,提供一种结构合理的基于半监督生成对抗网络的轴承故障诊断方法,从而基于较少的标签样本实现轴承故障诊断,大大节约了时间和人力成本,并且诊断准确率高、抗噪声能力强、稳定性好。

本发明所采用的技术方案如下:

一种基于半监督生成对抗网络的轴承故障诊断方法,包括如下步骤:

第一步:通过振动信号采集设备获取轴承振动信号,该振动信号为一维的时间序列数据,具有周期性和时序性的特点;

第二步:将轴承转一圈采集到的离散数据作为一个样本,将第一步中采集的数据集划分为多个样本;

第三步:将第二步中的样本随机划分为训练集和测试集,并使得训练集与测试集中样本的数量比例为9:1;确定训练集中带标签样本的数量,并将该数量的样本标上标签;

第四步:将第三步中的训练集输入预先建立的一维半监督生成对抗网络进行迭代训练,并在迭代中运用Adam算法调整网络权值;

所述一维半监督生成对抗网络主要包括生成器和分类器;所述生成器生成与训练集中统计分布相匹配的假样本集;所述生成器和分类器均包括输入层、中间层和输出层;

所述生成器的结构为:其输入层的输入为服从均值为-1,方差为1高斯分布的128维高斯噪声,所述生成器输出层的激活函数为Tanh函数,所述生成器的中间层包含两层全连接层和四层一维反卷积层,一维反卷积层的卷积核均设置为5x1,且四层一维反卷积层位于两层全连接层的中间;所述一维反卷积层之间的激活函数为ReLU函数,在每次完成反卷积后均进行批量归一化处理;

所述生成器的损失函数为:

Lnew=Ez~p(z)[log(1-C(G(z)))]+0.01*Lmatch

其中:Lmatch为特征匹配方法下生成器的损失函数,其方程为:x为训练集中的样本,pdata(x)为x的数据分布,q(x)为x在分类器中间层的特征值,p(z)为z的数据分布,q(G(z))为假样本集中的样本在分类器中间层的特征值;C(G(z))为假样本集中的样本从属某一故障类别的概率;

所述分类器的结构为:其输入层的输入为由训练集和假样本集混合的样本集,所述分类器输出层的激活函数为Softmax函数,所述分类器的中间层包含一层全连接层和五层一维卷积层,第一层一维卷积层的卷积核设置为5x1,另外四层一维卷积层的卷积核均设置为3x1,并且全连接层位于五层一维卷积层的后面;所述一维卷积层之间的激活函数为LeakyReLU函数,在每次完成卷积后均进行批量归一化处理;

所述分类器的损失函数为:

其中:

Lunsup=Lunlabel+Lgen

Lgen=-Ex~Glog[pmod(y=m+1|x)

x为采集的真实样本;y为标签;E为期望;pmod(y|x,y<m+1)表示x为某一种标签的概率;pmod(y=m+1|x)表示x为假样本的概率;Lsup表示分类器训练带标签样本时的损失函数;Lunsup表示分类器训练无标签样本时的损失函数,该无标签样本包括训练集中的无标签样本和由生成器生成的假样本;Lunlabel表示分类器训练训练集中无标签样本时的损失函数;Lgen表示分类器训练假样本集中样本时的损失函数;

迭代训练包括如下步骤:

1)在高斯噪声中采样生成向量z,并将该向量输入至生成器,经一维反卷积层和全连接层输出后,得到假样本集G(z);

2)将训练集中的样本与假样本集中的样本按批次输入分类器,经一维卷积层和全连接层提取特征后,通过Softmax函数输出归一化的概率值C(x)和C(G(z));

3)对一维半监督生成对抗网络的权值参数进行更新:

3.1)将生成器参数固定,以训练分类器;若分类器中输入的是训练集中的无标签样本,则将Lunlabel作为损失函数,若分类器中输入的是训练集中带标签样本,则将Lsup作为损失函数,若分类器中输入的是由生成器生成的样本,则将Lgen作为损失函数;并利用Adam算法调整分类器的参数;

3.2)将分类器参数固定,以训练生成器;生成器对样本训练集和假样本集G(z)进行特征匹配,以Lnew作为损失函数,并利用Adam算法调整生成器的参数;

4)重复1)至3),直至达到预定迭代次数;

第五步:将第三步中的测试集输入经第四步训练好的一维半监督生成对抗网络,测试集中样本进入由第四步训练好的分类器,经一维卷积层和全连接层提取特征后,进行批量归一化处理,再经分类器输出层输出结果,即完成测试集中样本的故障类别判断,输出诊断结果;

通过使用一维卷积层和一维反卷积层,强化了一维半监督生成对抗网络提取特征的能力;利用由带标签样本和无标签样本构成的训练集,结合由生成器生成的假样本集,对分类器进行迭代训练,进而使得分类器对测试集中的无标签样本进行故障分类。

本发明的有益效果如下:

本发明结构紧凑、合理,操作方便,直接输入原始振动信号,通过构建的深度网络自动学习到低层特征,并逐步形成更加抽象的高层表示,最后直接输出轴承故障类别,实现了一种端到端的最优诊断模型;将一维卷积层和一维反卷积层与半监督生成对抗网络结合,使得对抗网络更适合处理一维时间序列数据,强化了一维半监督生成对抗网络提取轴承信号深层特征的能力,达到了良好的诊断效果和抗噪声性;基于少量标签样本的半监督训练方式,大大节约了时间和人力成本。

附图说明

图1为本发明一维半监督生成对抗网络的结构图。

图2为本发明故障诊断方法的流程图。

图3为本发明全连接层网络结构图。

图4为本发明一维卷积层的网络结构图。

图5为本发明生成器的网络结构图。

图6为本发明分类器的网络结构图。

图7为本发明在不同带标签样本数量下的诊断结果评估准确率的趋势图。

图8为本发明第5次迭代后训练集特征数据分布图。

图9为本发明第25次迭代后训练集特征数据分布图。

图10为本发明第100次迭代后训练集特征数据分布图。

图11为本发明第300次迭代后训练集特征数据分布图。

图12为本发明在不同噪声下的诊断结果评估准确率的趋势图。

具体实施方式

下面结合附图,说明本发明的具体实施方式。

如图1所示,本实施例的一种基于半监督生成对抗网络的轴承故障诊断方法,包括如下步骤:

第一步:采集信号:通过振动信号采集设备获取轴承振动信号,该振动信号为一维的时间序列数据,随着轴承的转动该振动信号具有周期性和时序性的特点;

第二步:划分样本:将轴承转一圈采集到的离散数据作为一个样本,将第一步中采集的数据集划分为多个样本;

第三步:划分训练集和测试集:将第二步中的样本随机划分为训练集和测试集,并使得训练集与测试集中样本的数量比例为9:1;确定训练集中带标签样本的数量,并将该数量的样本标上标签;即使得训练集中包含有带标签样本和无标签样本,而测试集中均为无标签样本;

第四步:训练:将第三步中的训练集输入预先建立的一维半监督生成对抗网络进行迭代训练;

一维半监督生成对抗网络,缩写为1D-SGAN,主要包括生成器和分类器;生成器生成与训练集中统计分布相匹配的假样本集;生成器和分类器均包括输入层、、中间层和输出层;

生成器的结构为:其输入层的输入为服从均值为-1,方差为1高斯分布的128维高斯噪声,生成器输出层的激活函数为Tanh函数,生成器的中间层包含两层全连接层和四层一维反卷积层,一维反卷积层的卷积核均设置为5x1;且四层一维反卷积层位于两层全连接层的中间,如图5所示,其中size表示卷积核大小,num表示卷积核数目,s表示卷积步长;一维反卷积层之间的激活函数为ReLU函数,在每次完成反卷积后均进行批量归一化处理;ReLU函数帮助生成器实现非线性表示,并使网络更方便训练;Tanh函数用以将生成器输出限制在[-1,1];

生成器的损失函数为:

Lnew=Ez~p(z)[log(1-C(G(z)))]+0.01*Lmatch

其中:Lmatch为特征匹配方法下生成器的损失函数,其方程为:x为训练集中的样本,pdata(x)为x的数据分布,q(x)为x在分类器中间层的特征值,p(z)为z的数据分布,q(G(z))为假样本集中的样本在分类器中间层的特征值;C(G(z))为假样本集中的样本从属某一故障类别的概率;

分类器的结构为:其输入层的输入为由训练集和假样本集混合的样本集,分类器输出层的激活函数为Softmax函数,分类器的中间层包含一层全连接层和五层一维卷积层,第一层一维卷积层的卷积核设置为5x1,另外四层一维卷积层的卷积核均设置为3x1,并且全连接层位于五层一维卷积层的后面,如图6所示;一维卷积层之间的激活函数为LeakyReLU函数,在每次完成卷积后均进行批量归一化处理;LeakyReLU函数帮助分类器防止出现梯度消失的问题,Softmax用以预测样本的相应类别;

分类器的损失函数为:

其中:

Lunsup=Lunlabel+Lgen

Lgen=-Ex~Glog[pmod(y=m+1|x)

x为采集的真实样本;y为标签;E为期望;pmod(y|x,y<m+1)表示x为某一种标签的概率,即某一标签所指示的故障的概率;pmod(y=m+1|x)表示x为假样本的概率;Lsup表示分类器训练带标签样本时的损失函数;Lunsup表示分类器训练无标签样本时的损失函数,该无标签样本包括训练集中的无标签样本和由生成器生成的假样本;Lunlabel表示分类器训练训练集中无标签样本时的损失函数;Lgen表示分类器训练假样本集中样本时的损失函数。

如图3所示为全连接层的网络结构图,如图4所示为一维卷积层的网络结构图;

从图3和图4可知,全连接层的计算相当于对输入X整体进行求和;而一维卷积层相当于在X上平移求和,其得到的f各个节点值保留了一定的连续性属性;相比于全连接层,一维卷积层更适合处理一维时间序列数据。

如图2所示为训练和测试的流程图。

一维半监督生成对抗网络的迭代训练包括如下步骤:

1)在高斯噪声中采样生成向量z,并将该向量输入至生成器,经一维反卷积层和全连接层输出后,得到假样本集G(z);

2)将训练集中的样本与假样本集中的样本按批次输入分类器,经一维卷积层和全连接层提取特征后,通过Softmax函数输出归一化的概率值C(x)和C(G(z));

3)对一维半监督生成对抗网络的权值参数进行更新:

3.1)将生成器参数固定,以训练分类器;若分类器中输入的是训练集中的无标签样本,则将Lunlabel作为损失函数,若分类器中输入的是训练集中带标签样本,则将Lsup作为损失函数,若分类器中输入的是由生成器生成的样本,则将Lgen作为损失函数;并利用Adam算法调整分类器的参数;

3.2)将分类器参数固定,以训练生成器;生成器对样本训练集和假样本集G(z)进行特征匹配,以Lnew作为损失函数,并利用Adam算法调整生成器的参数;

4)重复1)至3),直至达到预定迭代次数。

第五步:诊断:将第三步中的测试集输入经第四步训练好的一维半监督生成对抗网络,测试集中样本进入由第四步训练好的分类器,经一维卷积层和全连接层提取特征后,进行批量归一化处理,再经分类器输出层输出结果,即完成测试集中样本的故障类别判断,输出诊断结果。

通过使用一维卷积层和一维反卷积层,实现了原始振动信号,即轴承时间序列数据的处理,强化了一维半监督生成对抗网络提取特征的能力,使得轴承故障诊断效果好,抗噪声能力强;利用由带标签样本和无标签样本构成的训练集,结合由生成器生成的假样本集,对分类器进行迭代训练,进而使得分类器对测试集中的无标签样本进行故障分类,实现了一种端到端的最优诊断模型;基于标签样本的半监督训练方式,大大节约了时间和人力成本。

1D-SGAN的分类器意图区分输入数据是训练集中带标签的真样本、无标签的真样本还是生成器产生的假样本,生成器则尽力产生可以欺骗分类器的假样本;假设对于一个m类分类问题,1D-SGAN会给生成器生成的样本贴上“生成”标签作为第m+1类,分类器的输出维度从m增加到m+1,通过不断训练分类器识别生成样本与带标签真样本、无标签真样本的区别,从而学习到无标签样本里的有效信息,进而实现半监督学习。

对一维半监督生成对抗网络进行迭代训练时,用每一次迭代后的对抗网络对训练集进行一次预测,每次迭代意味着用含有带标签样本和无标签样本的训练集训练了1D-SGAN一次。使用TSNE对训练集经分类器提取的特征进行降维,得到两维属性,以可视化提取特征的数据分布。

将测试集进行测试,得到一维半监督生成对抗网络诊断的准确率。

若测试集故障总类别数为m,每个类别的样本数已知,分别为c1,c2,....,cm,分类器对每个类别预测正确的样本数分别为x1,x2,...,xm,则诊断的准确率为:

实施例:

以公开的凯斯西储大学轴承数据中心网站提供的数据集为例

一、基于一维半监督生成对抗网络的诊断过程

轴承型号为SKF6205,转速为1797rpm,损伤位置分别为内圈、滚动体、外圈,损伤直径分别为0.007、0.014、0.021英寸,共计9种故障状态和1种正常状态;振动信号的采集频率为12kHz,因此轴承转一圈获得的采样点约为400个,计算如下:

在损伤直径为0.007英寸处的内圈,由振动信号采集设备采集到121991个采样点;则选择前120000个采样点,并以400个采样点为一个样本,则共有300个样本;按照9:1的比例将样本划分为训练集和测试集,则训练集中样本为270个,测试集中样本为30个。此为轴承的一种故障状态下的样本采集,而轴承有9种故障状态和1种正常状态共计10种不同状态,则最终训练集中的样本为270*10=2700个,测试集中样本为30*10=300个。

在训练集中随机选择100个样本贴上标签,则余2600个样本无标签。

将训练集中样本分批输入一维半监督生成对抗网络进行迭代训练;每个批次为100个样本,优化算法选择Adam算法,其中学习率设置为0.0002,动量设置为0.5,迭代次数设置为300次。

训练完成后,用1D-SGAN在300次迭代训练后对测试集进行测试,诊断结果具体细节如表1所示.可以看出,经300次迭代后的1D-SGAN在测试集上有优秀的故障分类表现,验证了1D-SGAN在轴承少标签样本故障诊断任务上的有效性。

表1 1D-SGAN的故障诊断结果

二、诊断优越性的验证

为了验证在轴承少标签样本故障诊断上的优越性以及比较不同数量的有标签样本对该一维半监督生成对抗网络(One-dimensional Semi-supervised GAN,简称1D-SGAN)的影响,将1D-SGAN与原始半监督生成对抗网络(Semi-supervised GAN,简称SGAN)和半监督分类方法半监督自训练(Semi-supervised Self-training,SST)进行了比较。

原始SGAN的生成器和分类器模型均为多层感知机,除了输入层、输出层,中间含有多层全连接层,主要适用于处理输入为图像形式的样本。

半监督分类方法半监督自训练,首先利用带标签数据集训练出初始分类器,使用该分类器对一些无标签数据进行标记,将可信度最高的一些标签新示例放入到带标签数据集中,再在新的带标签数据集上进行下一次训练直到满足截止条件为止。

当带标签样本数量增加时,无标签样本数量则相应减少,保证训练集中样本总数量不变。例如,当带标签样本数量为200时,无标签样本数量则为2500。每一种方法都用相同的训练集进行训练,用相同的测试集进行测试。

测试结果评估指标准确率如图7所示,可以看出,1D-SGAN和SGAN的故障分类能力受有标签样本的数量影响较少,而SST受影响较大。随着训练集中带标签样本数量的增加,SST的分类能力大幅增强,诊断准确率从70.667%上升到88.000%,但仍与另两种方法有较大的差距。此外可以看出,在带标签样本数仅为100的情况下,原始SGAN在故障分类上有不错的表现,准确率最低为95.667%,但1D-SGAN的表现更加优秀,可以达到99.333%,从而验证了在轴承少标签样本时故障诊断上的优越性。

三、分类器提取特征能力的验证

使用TSNE对训练集经分类器提取的特征进行降维,得到两维属性,作为X轴和Y轴,并以可视化的方式提取特征的数据分布,如图8、图9、图10和图11所示,其中Normal表示轴承正常情况,BA表示滚动体故障,IR表示内圈故障,OR表示外圈故障,数据表示损伤直径,即:BA007表示损伤直径为0.007英寸的轴承滚动体故障,IR014表示损伤直径为0.014英寸的轴承内圈故障,OR021表示损伤直径为0.021英寸的轴承外圈故障。可以看出,训练刚开始的时候,不同类别的特征点大致分布在一定的范围,但有较多点互相混合;随着迭代次数的增加,训练集的特征数据分布越来越清晰,混淆分布的点越来越少.这意味着模型的分类器提取特征的能力增强,当300次迭代完成后,从图11中可以看出分类器已经可以很好的提取样本中的重要特征。

四、抗噪声能力的验证

在实际的工业环境中,噪声往往不是由单一源头造成,而是很多不同来源的噪音复合体,未知且多变。把真实噪音看成非常多不同概率分布的随机变量的组合,并且每一个随机变量都是独立的,根据中心极限定理,它们的归一化总和就随着噪音源数量的上升,趋近于一个高斯分布。因此,用高斯白噪声来近似实际环境中的噪声。

为了验证对噪声的鲁棒性,用上面带标签样本数量为100情况下训练好的1D-SGAN来测试加了不同信噪比高斯白噪声的测试数据。

将三种不同算法(SST,SGAN,1D-SGAN)在加了不同噪声的测试集上进行测试。

三种算法在不同噪声下的测试结果评估指标准确率如图12所示,可以看出,随着信噪比的降低,也即噪声的增强,三种算法的诊断准确率均出现逐渐下降的趋势。1D-SGAN对于信噪比为5dB以上的情况仍具有较高的准确率,但在0dB时,准确率只有60.333%,相对于5dB时下降了19.000%,已经无法达到实际应用的标准。原始SGAN则对于信噪比为10dB以上的情况有较好的鲁棒性,而SST受限于自身算法的局限性,在原始信号上就不具有良好的表现,在加了不同噪声后,诊断准确率指标均低于70%。对比可知,1D-SGAN相比于SST和SGAN具有更好的鲁棒性。

本发明基于较少的标签样本实现轴承故障诊断,并且故障识别精度高,噪声鲁棒性好,稳定性好。

以上描述是对本发明的解释,不是对发明的限定,本发明所限定的范围参见权利要求,在本发明的保护范围之内,可以作任何形式的修改。

17页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种通用发动机主轴平稳性检测设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!