一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法

文档序号:340160 发布日期:2021-12-03 浏览:28次 >En<

阅读说明:本技术 一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法 (Cross-domain subspace learning electronic nose drift compensation method based on manifold learning ) 是由 闫嘉 田雨桐 王丽丹 段书凯 于 2021-08-12 设计创作,主要内容包括:本发明涉及一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法,其特征在于,将气体数字信号送入处理器,处理器利用LME-CDSL数学模型进行气体样本分析,获得气体样本数据;处理器将气体样本数据送入分类器进行气体分类,获得气体分类结果。其有益效果是:具有更好的信息保存性能。不仅抑制了数据漂移,还同时维护了源域的流形和标签信息以及两个域的知识信息;局部线性流形学习完成高维数据的紧凑表示,能够保留非漂移样本的局部特征,提高模型的判别能力;保证了LME-CDSL模型的鲁棒性和识别性能;本发明通过特征值分解实现特征子空间学习,计算成本极短,易于实际应用。(The invention relates to a cross-domain subspace learning electronic nose drift compensation method based on manifold learning, which is characterized in that a gas digital signal is sent to a processor, and the processor performs gas sample analysis by using an LME-CDSL mathematical model to obtain gas sample data; and the processor sends the gas sample data into the classifier for gas classification to obtain a gas classification result. The beneficial effects are as follows: has better information storage performance. Not only is data drift inhibited, but also the manifold and tag information of a source domain and the knowledge information of the two domains are maintained; the compact representation of high-dimensional data is completed by local linear manifold learning, the local characteristics of non-drifting samples can be reserved, and the discrimination capability of the model is improved; the robustness and the recognition performance of the LME-CDSL model are ensured; the invention realizes the characteristic subspace learning through the characteristic value decomposition, has extremely short calculation cost and is easy to be practically applied.)

一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法

技术领域

本发明属于电子鼻信号处理技术,具体设计一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法。

背景技术

电子鼻是一种模仿生物嗅觉系统的智能设备,由多个交叉敏感的化学传感器和模式识别程序组成,能够对简单或复杂气味进行辨别。近几十年来,电子鼻系统越来越流行,并在医学、生物学、食品工业、室内环境监测等众多领域得到应用。理想情况下,电子鼻系统在相同的气体环境下会有相同的响应。当环境内没有待测气体时,电子鼻系统响应将处于基线。然而,目前的电子鼻技术在实际应用中还存在不少问题,如气敏传感器漂移问题。

气敏传感器漂移是由传感器老化、中毒或湿度和温度波动引起的,它显示了气体传感器阵列中的非线性动态特征。因此,当对相同种类的气体做出反应时,气体传感器的响应并不总是相同的。在人工嗅觉领域,电子鼻传感器漂移问题被称为不适定问题,难以探索其共同特性。

漂移补偿的方法可分为传感器信号预处理、周期校正和自适应校正3类。

1.传感器信号预处理方法:诸如基线处理和频域滤波。尽管传感器信号预处理的实现方式简单,但漂移信号仅被视为理想的线性信号,从而限制了应用范围。

2.周期性校正,例如偏最小二乘法(partial least square)。它利用从实验中获得的参考气体来模拟电子鼻系统的实际漂移水平,然后估计漂移信号,通过估计漂移信号和实际漂移信号之间的运算来实现抑制。这种方法虽然易于实现,但非常耗时耗力。

3.自适应校正,例如领域正则化成分分析(domain regularizedcomponentanalysis),跨域判别子空间学习(cross-domain discriminate subspace learning)等。与上述方法不同,它是在特征层次上完成漂移补偿的。相比之下,涉及长期漂移信号变化的知识将自适应地训练模型,然后进行传感器对应的抗漂移输出。

发明内容

为了解决上述技术问题,本发明提供了一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法,旨在减轻传感器漂移带来的分布失真、数据不确定性增强和电子鼻性能恶化的影响。

基于上述目的,本发明设计了一个有监督的局部流形嵌入跨域子空间学习(localmanifold embedding cross domain subspace learning,LME-CDSL)模型用于电子鼻漂移补偿。

本发明的技术方案如下:

一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法,包括:

步骤1、电子鼻传感器系统在环境中检测到待测气体后,传感器系统产生电流信号或电压信号,统一处理成电阻响应曲线后,每个信号样本经过信号调理电路进行滤波、放大,再经AD转换,生成有效的气体数字信号;

步骤2、将气体数字信号送入处理器,处理器提取响应曲线的特征,获得无漂移的源域气体样本数据和有漂移的目标域气体样本数据;

步骤3、处理器利用源域气体样本数据和目标域气体样本数据训练LME-CDSL模型,再利用训练好的LME-CDSL模型,对目标域气体样本数据的漂移补偿,将得到的补偿后的数据送入分类器进行气体分类,获得气体分类结果;

步骤4、处理器经人机交互机构输出气体分类结果。

本发明通过增强特征级别的流形和分布一致性,对数据样本进行降维,实现数据漂移补偿,进而提高对漂移气体传感器数据集的气体识别性能。受机器学习原理的启发,我们将源域数据视为非漂移数据,而目标域数据为漂移数据。

所述步骤3中LME-CDSL数学模型的初级表达式l为:

其中,为源域数据集,NS为源域样本数,为目标域数据,NT为目标域样本数,P为投影转换矩阵,Tr(·)和(·)T分别为迹运算和转置运算,所有矩阵均为大写字母,向量则为小写字母;

所述步骤3中LME-CDSL数学模型经过拉格朗日乘数法得到的优化表达式为:

在这一部分,令 得到:

B-1AP=ρ2P (3)

由此可知,P为B-1A的特征向量组,即投影转换矩阵,可通过对B-1A进行特征值分解得到,由于优化目标要求解对应最大值,其最优投影方向P*应当为P的前d个特征向量,其特征向量[(p1)1,(p1)2,...,(p1)d]根据特征值降序排列,P*被表示为:

P*=[p1,p2,...,pd]. (4)

其中,λ为正则化参数,分别为源域数据的类间散布矩阵和类内散布矩阵,x为单个源域数据,C为类别数,μc为原始源域子类c的数据中心,μS为原始源域数据中心,μT为原始目标域数据中心,E为单位矩阵,W为局部权值矩阵,ρ2为拉格朗日乘子。

对目标域气体样本数据XT进行漂移补偿,表达式如下:

YT=(P*)TXT

其中,YT为补偿后的目标域气体样本数据。

步骤三中的漂移补偿方法为静态分析方法:

获得第一批气体样本数据,作为无漂移的源域气体样本数据;

采用无漂移的源域气体样本数据训练原始LME-CDSL数学模型,优化原始LME-CDSL数学模型的参数,获得第一参数LME-CDSL数学模型;

利用第一参数LME-CDSL数学模型计算作为有漂移的目标域气体样本数据的之后所有时间段气体样本数据。

步骤三中的漂移补偿方法为动态分析方法:

获得第一批气体样本数据,作为无漂移的源域气体样本数据;

采用无漂移的源域气体样本数据训练原始LME-CDSL数学模型,优化原始LME-CDSL数学模型的参数,获得第一参数LME-CDSL数学模型;

利用第一参数LME-CDSL数学模型计算作为有漂移的目标域气体样本数据的第二时间段样本气体,获得第二批补偿后的目标域气体样本数据;

采用作为无漂移的源域气体样本数据的第二时间段样本气体训练原始LME-CDSL数学模型,优化原始LME-CDSL数学模型的参数,获得第二参数LME-CDSL数学模型;

利用第二参数LME-CDSL数学模型计算作为有漂移的目标域气体样本数据的第三时间段样本气体,获得第三批补偿后的目标域气体样本数据;

依次类推,直到;

利用第末-1参数LME-CDSL数学模型计算第末时间段样本气体,获得第末批补偿后的目标域气体样本数据。

LME-CDSL模型同时考虑了统计分布和几何分布的一致性,从而通过域适应和流形学习的结合提高了传感器漂移的补偿性能。它可以轻松完成原始数据的紧凑表示,从而极大地保留了内在信息。据搜集,这种方法尚未被应用于传感器漂移补偿。

LME-CDSL模型的设计初衷是实现特征提取和数据降维,进而实现漂移补偿,最终任务是对预计子空间进行分类,并保证尽可能高的准确分类性能。本专利采用极限学习机(ELM)作为分类器。本专利拟基于源域投影后数据YS学习分类器,尔后利用目标域投影后数据YT进行测试。以下对ELM分类器及其学习步骤进行简述。

步骤三中分类器表达式为:

f(YT)=softmax(Hβ+b), (5)

其中(Hβ+b)i为矩阵(Hβ+b)的第i个行向量,矩阵N为样本矩阵 中的样本数,为激活函数,矩阵隐层神经元偏置b=[b1,b2,...,bhid],hid为隐层神经元数,权重矩阵β的表达式如下:

其中ED为D维单位矩阵,T为标签向量。

获取的气体分类结果f(YT),对于其中的某一样本的分类结果其表现为一个c维行向量,向量中各数值对应属于各类气体类别的概率,即第一个元素表示该样本属于第一类气体的概率,第二个元素表示该样本属于第二类气体的概率,以此类推,向量内所有元素累加和为1,概率最大者视为该样本属于对应类别。

有益效果:本发明对数据进行降维,不仅抑制了数据漂移,还同时维护了源域的流形和标签信息以及两个域的知识信息;局部线性流形学习完成高维数据的紧凑表示,将源域的几何知识转移到目标域,能够保留非漂移样本的局部特征,提高模型的判别能力;领域自适应部分利用最大均值差异(MMD)和方差最大化,使不同领域的样本分布更加相似,保留了内在属性,保证了LME-CDSL模型的鲁棒性和识别性能;本发明通过特征值分解实现特征子空间学习,计算成本极短,易于实际应用。

附图说明

图1为本发明流程图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明:

如图1所示,一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法,包括:

步骤1、电子鼻传感器系统在环境中检测到待测气体后,传感器系统产生电流信号或电压信号,统一处理成电阻响应曲线后,每个信号样本经过信号调理电路进行滤波、放大,再经AD转换,生成有效的气体数字信号;

每次获取一种气体的数字信号,以不定长的时间段为采样周期,前期老化不明显,可以时间段长,后期漂移明显,可以时间段短。每个时间段的数据组为一组或多组气体数字信号。多组数据用于训练,对单个数据进行检测;

步骤2、将气体数字信号送入处理器,处理器提取响应曲线的特征,获得无漂移的源域气体样本数据和有漂移的目标域气体样本数据;

步骤3、处理器利用源域气体样本数据和目标域气体样本数据训练LME-CDSL模型,再利用训练好的LME-CDSL模型,对目标域气体样本数据的漂移补偿,将得到的补偿后的数据送入分类器进行气体分类,获得气体分类结果;

步骤4、处理器经人机交互机构输出气体分类结果。

所述步骤3中LME-CDSL数学模型的初级表达式为:

其中,为源域数据集,NS为源域样本数,为目标域数据,NT为目标域样本数,P为投影转换矩阵,Tr(·)和(·)T分别为迹运算和转置运算,Ed×d为d维单位矩阵,所有矩阵均为大写字母,向量则为小写字母;

所述步骤3中LME-CDSL数学模型经过拉格朗日乘数法得到的优化表达式为:

在这一部分,令 得到:

B-1AP=ρ2P (3)

由此可知,P为B-1A的特征向量组,可通过对B-1A进行特征值分解得到,由于优化目标要求解对应最大值,其最优投影方向P*应当为P的前d个特征向量,其特征向量[(p1)1,(p1)2,...,(p1)d]根据特征值降序排列,P*被表示为:

P*=[p1,p2,...,pd]. (4)

其中,λ为正则化参数,分别为源域数据的类间散布矩阵和类内散布矩阵,C为类别数,μc为原始源域子类c的数据中心,μS为原始源域数据中心,μT为原始目标域数据中心,E为单位矩阵,W为局部权值矩阵,ρ2为拉格朗日乘子。

对目标域气体样本数据XT进行漂移补偿,表达式如下:

YT=(P*)TXT

其中,YT为补偿后的目标域气体样本数据。

步骤3中的漂移补偿方法为静态分析方法:

获得第一批气体样本数据,作为无漂移的源域气体样本数据;

采用无漂移的源域气体样本数据训练原始LME-CDSL数学模型,优化原始LME-CDSL数学模型的参数,获得第一参数LME-CDSL数学模型;

利用第一参数LME-CDSL数学模型计算作为有漂移的目标域气体样本数据的之后所有时间段气体样本数据。

步骤3中的漂移补偿方法为动态分析方法:

获得第一批气体样本数据,作为无漂移的源域气体样本数据;

采用无漂移的源域气体样本数据训练原始LME-CDSL数学模型,优化原始LME-CDSL数学模型的参数,获得第一参数LME-CDSL数学模型;

利用第一参数LME-CDSL数学模型计算作为有漂移的目标域气体样本数据的第二时间段样本气体,获得第二批补偿后的目标域气体样本数据;

采用作为无漂移的源域气体样本数据的第二时间段样本气体训练原始LME-CDSL数学模型,优化原始LME-CDSL数学模型的参数,获得第二参数LME-CDSL数学模型;

利用第二参数LME-CDSL数学模型计算作为有漂移的目标域气体样本数据的第三时间段样本气体,获得第三批补偿后的目标域气体样本数据;

依次类推,直到;

利用第末-1参数LME-CDSL数学模型计算第末时间段样本气体,获得第末批补偿后的目标域气体样本数据。

步骤3中分类器表达式为:

f(YT)=softmax(Hβ+b), (5)

其中(Hβ+b)i为矩阵(Hβ+b)的第i个行向量,矩阵N为样本矩阵 中的样本数,为激活函数,矩阵隐层神经元偏置b=[b1,b2,...,bhid],hid为隐层神经元数,权重矩阵β的表达式如下:

其中ED为D维单位矩阵,T为标签向量。

获取的气体分类结果f(YT),对于其中的某一样本的分类结果其表现为一个c维行向量,向量中各数值对应属于各类气体类别的概率,即第一个元素表示该样本属于第一类气体的概率,第二个元素表示该样本属于第二类气体的概率,以此类推,向量内所有元素累加和为1,概率最大者视为该样本属于对应类别。

本发明的验证方法如下,共有如下两种实施方案:

1)静态验证:固定批次1为源域,K为目标域(K=2,3,…,10);

2)动态验证:依次在批次K-1上训练,批次K上测试(K=2,3,…,10)。隐层结点数设置为50。

采用了Vergara历时三年收集的传感器漂移数据集,这个传感器漂移数据集是在2008年1月至2011年2月的36个月内通过气体平台采集的。这些记录是通过电子鼻系统采样的,该系统具有一个包含16个MOS气体传感器的阵列,暴露于六种气体,包括不同浓度水平的氨,乙醛,丙酮,乙烯,乙醇和甲苯。对于每个传感器,提取了八个特征,故每个样本都是一个128维特征向量。根据时间分为10个批次,详细如下表所示:

静态验证结果如下:表中最后一行为LME-CDSL模型验证的准确度。

动态验证结果如下:表中最后一行为LME-CDSL模型验证的准确度。

验证方法步骤总结如下:

输入:源域数据目标域数据近邻数目k,正则化因子λ和降维维数d,ELM分类器隐层节点数L。

输出:目标域数据分类结果V=f(YT).

1.计算源域数据中心

2.计算目标域数据中心

3.计算源域数据的类内散布矩阵

和4.类间散布矩阵

重复以下步骤NS次:

找到距离第i个源域数据最近的k个数据;

根据以上得到的k个数据计算局部协方差矩阵Si

计算第i个源域数据的权重向量wi

返回第4步或结束

5.将所有源域数据的权重向量组合为权重矩阵

6.计算B-1A;

7.对B-1A进行特征值分解,得到特征值和特征向量组P;

8.根据特征值由大到小,对特征向量组P内的特征向量进行排列,并选取前d个特征向量作为子空间投影方向,得到P*=[p1,p2,...,pd];

9.计算源域和目标域的投影子空间YS=(P*)TXS,YT=(P*)TXT

10.用L个隐藏节点、输入权重矩阵W和隐藏层偏置b初始化ELM;

11.用源域子空间数据YS计算H;

12.计算矩阵β;

13.重复以下步骤NT次:

计算来获得样本对应属于各类的概率,class为类别数;

返回第13步或结束;

将目标域子空间内所有样本的分类结果组合为矩阵 各样本中取对应各类最大概率的类别作为模型分类类别,与实际标签对比判断分类对错,进而计算该模型准确度。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种微型气体传感器的制作工艺及其传感器

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类