一种基于时域加权的空气污染物浓度监测方法

文档序号:1707600 发布日期:2019-12-13 浏览:7次 >En<

阅读说明:本技术 一种基于时域加权的空气污染物浓度监测方法 (air pollutant concentration monitoring method based on time domain weighting ) 是由 顾锞 乔俊飞 夏俊勇 于 2019-09-09 设计创作,主要内容包括:本发明公开了一种基于时域加权的空气污染物浓度监测方法。引入时间加权矩阵到支持向量回归模型中来增强不同时刻训练样本的权重。首先,收集一周内6种气象指标和6种空气污染物浓度共计12个特征的数据作为特征向量并以此构成样本数据。然后引入时间加权矩阵建立时域加权支持向量回归机模型。最后,用样本训练TSVR模型,对监测结果进行评估。实验结果表明,本发明提出的模型在空气污染物浓度监测和实现效率方面与目前的监测方法相比具有很大优势。(The invention discloses an air pollutant concentration monitoring method based on time domain weighting. And introducing a time weighting matrix into the support vector regression model to enhance the weight of the training samples at different moments. Firstly, data of 12 features in total of 6 meteorological indexes and 6 air pollutant concentrations in one week are collected as feature vectors, and sample data are formed according to the feature vectors. And then introducing a time weighting matrix to establish a time-domain weighted support vector regression model. And finally, training a TSVR model by using the sample, and evaluating the monitoring result. Experimental results show that the model provided by the invention has great advantages in the aspects of air pollutant concentration monitoring and realization efficiency compared with the conventional monitoring method.)

一种基于时域加权的空气污染物浓度监测方法

技术领域

本发明涉及一种基于时域加权的空气污染物浓度监测方法,通过以当前时刻的6种气象指标和1小时前的6种空气污染物浓度共计12种特征的数值作为特征向量,对空气污染物的浓度进行实时监测。基于时域加权的空气污染物浓度监测方法属于大气环境和机器学习的交叉领域。

背景技术

近年来,PM2.5、PM10、CO、NO2、SO2和O3是世界各国监测到的最典型的空气污染物。这些空气污染物的浓度远远超过了规定的标准,对许多国家的人类健康造成了严重和长期的危害。PM2.5又称细颗粒物,是指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物。它能较长时间悬浮于空气中,与较粗的大气颗粒物相比,PM2.5粒径小,面积大,活性强,易附带有毒、有害物质,且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响更大。

为了避免空气污染对人体造成的巨大危害,需要一个能够对空气污染物实时监测的系统,以协助政府和人民的决策。由于监测的滞后性,空气污染物浓度的监测只能在若干小时之后才能获悉。为了达到对空气污染物浓度的实时测量,我们提出来一个软测量监测系统来间接测量当前空气污染物浓度。

本发明旨在引入时间加权矩阵来区分不同时刻的训练样本对空气污染物浓度实时监测模型权重影响不同,用一周内的12个特征的数值作为特征向量构成训练样本训练模型,将当前时刻的6种气象指标和1小时前监测的6种空气污染物浓度共计12种特征组成的特征向量作为测试样本输入到训练好的监测模型中,得到空气污染物浓度实时监测值。

发明内容

本发明获得了一种基于时域加权的空气污染物浓度监测方法,以用于解决空气污染物浓度实时监测问题。

本发明采用了如下的技术方案及实现步骤:

一种基于时域加权的空气污染物浓度监测方法,针对空气污染物浓度进行实时监测,以当前时刻的6种气象指标和1小时前的6种空气污染物浓度共计12种特征的数值组成特征向量,通过特征向量构成训练样本训练时域加权支持向量回归机模型并对结果进行评价;

其特征在于,包括以下步骤:

(1)收集数据,建立时域加权支持向量回归机模型;

①收集一周内的12个特征的数据作为特征向量,包括收集当前时刻温度、相对湿度、风速、风向、压力和能见度这6种气象指标的数值,同时收集相应1小时前PM2.5、PM10、 CO、NO2、SO2和O3这6种空气污染物的浓度数值;通过特征向量构成样本数据;

②建立时域加权支持向量回归机模型:

单任务支持向量回归机表达式H(xi)为:

H(xi)=wTΨ(xi)+b (1)

其中,xi为单任务支持向量回归机的输入向量,Ψ(xi)代表将输入的特征向量映射到高维希尔伯特空间的非线性映射,w和b分别代表权重和偏置。通过建立关于w、b的目标函数和约束函数,并对该优化问题采用拉格朗日乘数法已对其求解,从而得到时域加权支持向量回归机的最终表达式;

(2)进行训练,将收集到的样本数据作为训练样本对模型进行训练,得到最优的时域加权支持向量回归机模型,考虑到样本的时序距离当前时刻较远的样本数据对于模型的影响较小,故用当前时刻的6种气象指标和1小时前监测的6种空气污染物浓度共计12 种特征组成的特征向量训练最优的模型,得到空气污染物浓度监测值,然后将测试结果与真实结果进行比较,根据模型评价指标MSE、NMGE、IOA判别模型性能。

本发明的创造性主要体现在:

本发明为了能够对空气污染物浓度进行实时监测,提出的基于时域加权的空气污染物浓度监测模型,充分考虑了时域相关信息对空气污染物浓度监测的影响,实现了对空气污染物浓度的实时监测,使本发明具有更好的泛化能力。

具体实施方式

本发明获得了一种基于时域加权的空气污染物浓度监测模型,通过以当前时刻的6种气象指标和1小时前的6种空气污染物浓度共计12种特征的数值作为输入,通过样本数据训练模型,得到最优的时域加权支持向量回归机模型,实现了对未来空气污染物浓度的实时监测。解决了空气污染物浓度难以监测、难以控制的问题,可以为政府决策、群众出行等提供参考;

本发明采用了如下的技术方案及实现步骤:

一种基于时域加权空气污染物浓度的监测方法,以当前时刻的6种气象指标和1小时前的6种空气污染物浓度共计12种特征的数值作为特征向量;

(1)收集数据,建立时域加权支持向量回归机模型;

①收集一周内的12个特征的数据作为特征向量,包括收集当前时刻温度、相对湿度、风速、风向、压力和能见度这6种气象指标的数值,同时收集1小时前PM2.5、PM10、CO、 NO2、SO2和O3这6种空气污染物的浓度数值;通过收集的特征向量构成样本数据;

②建立时域加权支持向量回归机模型:

将传统的单任务支持向量回归机拓展为时域加权支持向量回归机,其表达式H(x)为:

H(x)=Ψ(x)TW+b (1)

其中,xi为单任务支持向量回归机的输入向量,Ψ(xi)代表将输入的特征向量映射到高维希尔伯特空间的非线性映射,w和b分别代表权重和偏置;

定义Dt={(x1,y1),(x2,y2),…,(xi,yi),…,(xp,yp)}为样本数据集,其中p为样本总数量,对于i取1到p之间的任意整数,xi为第i个样本的输入特征向量,其维数为输入特征的数量,yi为第i个样本对应的输出的真实值,其维数为1;建立求解单任务支持向量回归机的权重w和偏置b的目标函数和约束函数:

其中,Φ=(Ψ(x1),Ψ(x2),…,Ψ(xp))是用于非线性映射的向量,ξ=(ξ12,…,ξp)T表示由误差松弛变量组成的向量,其求解过程见下文,γ为一个正的实正则参数,其数值通过多次试凑确定,Ip表示包含p个元素的单位向量。通过求解式(2)的最优化问题,可得到权重w、偏置b和误差松弛变量ξ的值;

但是,上述目标函数并没有考虑时域中数据样本重要性的差异,假设T0为当前时刻, T-1,T-2,…,T,…T-∞为用于训练的样本,每一个训练样本分配一个权重参数,即τ为权重参数,可取任意实数;当τ>0时,靠近当前时刻T0的训练样本对训练模型的影响最大;向式(2)中加入一个时间加权矩阵Λ,式(2)写为:

方阵Λ表示为:

其中,λ={1,2,…,∞}对应T时刻的样本,τ>0为了使样本接近T0;引入一个加权阈值YΛ对样本进行筛选,将式(4)简化为:

其中,YΛ=0.01,运用拉格朗日乘数法,构造出拉格朗日函数L(w,ξ,a,b)求解该优化问题:

L(w,ξ,a,b)=F(w,ξ)-aTTw+bIp+ξ-y) (6)

其中,a=(a1,a2,…,ar)T表示拉格朗日乘数的矩阵,r表示a中所含元素的个数,拉格朗日乘数为待求未知量,通过求解方程将拉格朗日乘数与其他待求解参数w、ξ、b一同求出。分别令L(w,ξ,a,b)相对w,b,ξ和a的偏导数等于零:

线性方程组(5)到(9)含有4个未知量a、w、ξ、b,求解该方程组得a的解和b的解b*。将a*、b*带入(1)中即得到时域加权支持向量回归机的最终表示:

其中K(xi,xj)=Ψ(xi)TΨ(xj)T和径向基函数核用于将样本数据x映射到高维空间。

(2)进行训练,将收集到的样本数据作为训练样本对模型进行训练,得到最优的时域加权支持向量回归机模型,考虑到样本的时序距离当前时刻较远的样本数据对于模型的影响较小,故用当前时刻的6种气象指标和1小时前监测的6种空气污染物浓度共计12 种特征组成的特征向量训练最优模型,得到空气污染物浓度监测值,然后将测试结果与真实结果进行比较,根据模型评价指标MSE、NMGE、IOA判别模型性能。

对本模型进行测试,将本发明简称为TSVR模型,与其他五种目前流行的模型进行对比,对比效果见表1、表2和表3。

表1本模型和五种先进模型对大气污染物浓度预测结果的均方误差MSE对比

表2本模型和五种先进模型对大气污染物浓度预测结果的归一化平均总误差NMGE

表3本模型和五种先进模型对大气污染物浓度预测结果的IOA对比。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种测定多花梾木耐涝能力的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!