基于局部加权因子模型的工业非平稳过程软测量建模方法

文档序号：1613090 发布日期：2020-01-10 浏览：5次 >En<

阅读说明：本技术 基于局部加权因子模型的工业非平稳过程软测量建模方法 (Industrial non-stationary process soft measurement modeling method based on local weighting factor model ) 是由何雨辰张丽芳方靖云王云宋执环严天宏于 2019-09-03 设计创作，主要内容包括：本发明公开了一种基于局部加权因子模型的工业非平稳过程软测量建模方法。本发明引入滑动窗口,在每个滑动窗口中建立因子分析模型,将在线查询样本输入到各个滑动窗口中得到查询样本与训练样本的局部相似度以及查询样本在滑动窗口中的局部置信度,再综合所有滑动窗口的结果得到每个训练本的全局权重,根据全局权重计算训练样本集的加权平均值,在加权平均值的基础上对查询样本进行预测得到查询样本的丁烷含量预测值。本发明通过建立在线测量样本与训练样本之间的权重关系,提高了预测结果的准确性。(The invention discloses an industrial non-stationary process soft measurement modeling method based on a local weighting factor model. The method includes the steps of introducing sliding windows, establishing a factor analysis model in each sliding window, inputting online query samples into each sliding window to obtain the local similarity between the query samples and training samples and the local confidence of the query samples in the sliding windows, then integrating results of all the sliding windows to obtain the global weight of each training book, calculating the weighted average value of a training sample set according to the global weight, and predicting the query samples on the basis of the weighted average value to obtain the butane content prediction value of the query samples. According to the invention, the accuracy of the prediction result is improved by establishing the weight relationship between the online measurement sample and the training sample.)

技术领域

本发明属于工业非平稳过程软测量建模和应用领域，特别涉及一种基于局部加权因子模型的工业非平稳过程软测量建模和在线检测方法。

背景技术

虽然概率模型在软测量建模领域得到了迅速的发展并取得了丰厚的成果，但是现有工作大都是基于过程是基于平稳这一假设的，在实际中，随着市场需求的变化、生产计划调整、外部扰动等原因，工业过程大都呈现非平稳特性，即一部分过程变量的统计指标如，均值、方差、协方差随着时间改变，工业非平稳过程广泛地存在于工业生产活动中，非平稳过程状态时刻改变，在非平稳过程的前部，数据特性与非平稳过程起始状态较为相似，而随着时间轴的推移，其数据特性与起始状态的相似度逐渐减弱，慢慢趋向于非平稳过程结束后的目标状态。因此，对于非平稳过程中系统状态时刻变化的情况，仅仅通过单一模型对非平稳过程加以描述显然比较困难。在非平稳过程中，数据特性较为复杂且难以测量。而软测量技术可以有效解决工业过程中遇到的重要变量的实时测量难题，它通过构造可靠的软测量模型，利用过程中容易测量的辅助变量实现对于难以测量的主导变量的在线估。传统的概率潜变量模型，如概率主成分分析，大多是静态线性方法，过程动力学和非线性尚未得到充分考虑。而非平稳过程有非线性、非动态特性、非高斯特性等特点，考虑到加权概率模型能够很好的解决工业非平稳过程出现的问题，将加权概率模型与软测量建模结合应用于工业生产领域具有重大意义，以解决工业生产过程中关键变量的预测问题。

发明内容

本发明的目的在于针对脱丁烷塔中丁烷含量实时检测的难点，提供一种基于局部加权因子分析模型的工业非平稳过程软测量方法。

一种基于局部加权因子分析模型的工业非平稳过程软测量方法，其特征包括以下步骤：

步骤1：收集脱丁烷塔的离线运行数据作为训练样本集X_train∈R^N×n，离线运行数据包括已知的多组测量数据，每组测量数据包括同一时刻下与丁烷含量值相关的多个过程变量值，过程变量包括温度、压力和流量，将每组测量数据作为一个训练样本，由此将所有的训练样本组成训练样本集X_train∈R^N×n，将各组测量数据对应的已知的丁烷含量值组成丁烷含量样本集Y_trian∈R^N×1；

训练样本集X_train∈R^N×n通过现场采集获取，其中N为训练样本的个数，n为一组训练样本包含的过程变量总个数。

步骤2：采用固定长度的滑动窗以固定步长滑动扫描训练样本集，依次获得多个滑动窗口，在每一个滑动窗口中分别建立因子分析模型，每个滑动窗口将各自窗口内的训练子集输入到因子分析模型中进行训练，得到因子分析模型的最优参数集{Z_τ,Σ_τ}，从而得到训练后的因子分析模型；

若滑动窗口的固定长度取值为W，步长为T，则一共产生

个滑动窗口，每个滑动窗口处于训练样本集中的不同位置，每一个滑动窗口内所包含的训练样本的个数相同，但是各个滑动窗口内的训练样本的组成不完全相同，存在单个训练样本被包含于多个滑动窗口的情况。

步骤3：实时采集脱丁烷塔在线运行过程中新的一组测量数据作为查询样本，查询样本对应的丁烷含量值未知，将查询样本x_new输入到各个滑动窗口中计算查询样本与训练子集的局部相似度以及计算查询样本在滑动窗口中的局部置信度；

步骤4：由于训练样本集中的一个训练样本可能被包含在不同滑动窗口中的训练子集内，因此一个训练样本上存在多个对应不同窗口的局部相似度和局部置信度，即单个训练样本可能具有多个局部相似度和多个局部置信度，通过将单个训练样本具有的所有局部相似度和局部置信度进行计算得到该训练样本唯一确定的全局权重。根据步骤3得出的查询样本在各个滑动窗口中的局部相似度和局部置信度，计算得到训练样本集中的每个训练样本相对于该查询样本所唯一确定的全局权重；

步骤5：建立局部加权因子分析模型，将训练样本集、丁烷含量样本集以及当前查询样本的全局权重的值输入到局部加权因子分析模型中，利用期望最大算法并根据全局权重对训练样本集和丁烷含量样本集分别进行加权得到加权训练样本集和加权丁烷含量样本集，根据加权训练样本集和加权丁烷含量样本集对局部加权因子分析模型进行训练求解得到局部加权因子分析模型的最优参数集{P,C,Σ_x,Σ_y}，从而得到训练后的局部加权因子模型，完成软测量的建模；

步骤6：将查询样本直接输入到步骤5训练后的局部加权因子模型中得到查询样本的丁烷含量值，从而得到每组实时数据对应的丁烷含量值。实际测量过程中，重复步骤3-步骤6从而得到各个查询样本各自对应的丁烷含量值。

所述步骤2中的每个滑动窗口的处理方法相同，单个滑动窗口的处理方法具体是：

2.1)将该滑动窗口内所包含的所有训练样本作为该滑动窗口的训练子集，将训练子集进行归一化处理，归一化处理是指该滑动窗口内的训练子集满足均值为0方差为1。将归一化处理后的训练子集输入到因子分析模型中确定最优参数：

所述的因子分析模型表示如下：

X_τ＝Z_τα_τ+e_τ

其中，X_τ表示第τ个窗口内的训练子集，Z_τ表示第τ个窗口内公共因子的因子载荷矩阵，α_τ表示第τ个窗口内训练子集的公共因子，α_τ∈R^G×1，G为公共因子个数；e_τ表示第τ个窗口内训练子集的特殊因子；

训练子集的公共因子α_τ和特殊因子e_τ都服从高斯分布，具体是：

p(α_τ)＝N(0,I),p(e_τ)＝N(0,Σ_τ)

式中，p(α_τ)和p(e_τ)分别表示α_τ服从均值为0，方差为1的高斯分布，e_τ服从均值为0，方差为Σ_τ的高斯分布，I表示公共因子α_τ的协方差矩阵，Σ_τ为特殊因子e_τ的协方差矩阵；

选取因子载荷矩阵Z_τ和协方差矩阵Σ_τ作为第τ个窗口的因子分析模型的最优参数；

2.2)根据因子分析模型对训练子集进行训练，采用极大似然估计的方法建立该窗口下因子分析模型的最优参数集的似然函数，利用期望最大算法(EM算法)求解似然函数，从而得到该窗口下训练后的因子分析模型的最优参数集{Z_τ,Σ_τ}。

按上述方法求出所有滑动窗口对应的因子分析模型的最优参数集，并存入数据库中备用。

所述步骤3中的查询样本输入到每个滑动窗口中的处理方法相同，查询样本集输入到第τ个滑动窗口的处理方法具体是：

3.1)将查询样本输入到训练后的因子分析模型计算得到查询样本的窗口公共因子α_new：

其中，α_new表示查询样本的窗口公共因子，α_new∈R^G×1；x_new表示查询样本，

和σ分别表示归一化前的训练子集的均值和标准差，Z_τ ^T表示因子载荷矩阵Z_τ的转置矩阵；

3.2)第τ个窗口内训练子集的公共因子包括多组公共因子，每组公共因子对应一个训练样本且个数为G，每个训练样本具有的公共因子总个数均相同，总个数自行设定，采用KL散度计算查询样本与训练子集中的每一个训练样本之间的局部相似度：

其中，KL_j表示第τ个窗口中训练子集的第j个训练样本和查询样本之间的局部相似度，j＝1,2…W,W表示训练子集中的训练样本总个数，W与滑动窗口长度相同；g表示第j个训练样本的公共因子的序数，g＝1,2...G，G表示第j个训练样本的公共因子的总个数，σ_τ,g表示第τ个窗口中第g个公共因子标准差；α_j,g表示第j个训练样本的公共因子中第g个公共因子的值；α_new,g表示查询样本的窗口公共因子α_new中的第g个值；

公共因子标准差σ_τ是指第τ个窗口内训练子集的公共因子中的标准差且σ_τ∈R^G×1。

训练样本集中的第i＝1个训练样本、第i＝1+T个训练样本、第i＝1+2T个训练样本…第i＝(N-W+1)个训练样本分别作为各个滑动窗口内训练子集的第一个训练样本。按照步骤3.1)-3.2)的方法计算查询样本和该滑动窗中每一个训练样本的局部相似度。

3.3)采用支持向量数据描述方法(SVDD)计算该查询样本与该滑动窗口的局部置信度，SVDD被用于计算查询样本和滑动窗之间的置信度。SVDD被应用于确定查询样本和每个移动窗口之间的局部置信度。以该种方式计算查询样本在每一个滑动窗口中的局部置信度。WS_τ越接近0，相似度越高。每个滑动窗口的局部置信度计算方法相同。具体如下：

其中，WS_τ表示查询样本在第τ个滑动窗口的局部置信度，ζ_i表示查询样本投射在高维空间的向量，a_τ和R_τ分别表示第τ个窗口中的训练子集经SVDD求解得到的超球体的中心和半径，||ζ_i-a_τ||²表示查询样本在高维空间内与中心a_τ的距离。

步骤4中每个训练样本相对于该查询样本的全局权重计算公式相同，具体是：

其中，w_i,z为训练样本集的第i个训练样本的第z个局部权重，i＝1.2…N，N表示训练样本集中训练样本的总个数；KL_i,z表示第i个训练样本的第z个局部相似度；WS_i,z为第i个训练样本的第z个局部置信度，z＝1,2...Γ，z为包含第i个训练样本的窗口序数；

为权重控制参数，φ_z为包含第i个训练样本的第z个滑动窗口中训练子集的局部相似度的标准差，Sim_i为训练样本集的第i个训练样本的全局权重；Γ表示包含第i个训练样本的所有滑动窗口总个数。

第i个训练样本的第z个局部置信度具体是指，在包含该训练样本的Γ个滑动窗口中，第z个滑动窗口通过步骤3.3)计算得到的查询样本与该滑动窗口的局部置信度WS_τ。

第i个训练样本的第z个局部相似度同理，是指在包含该训练样本的Γ个滑动窗口中，第z个滑动窗口通过步骤3.2)计算得到的查询样本和该训练样本之间的局部相似度。

本发明通过步骤2建立了多个总数量确定的滑动窗口，步骤2建立的滑动窗口的序数用字母τ表示，字母z表示的是在包含第i个训练样本的Γ个滑动窗中第z个窗口的序数。

步骤5所述的局部加权因分析模型包括过程变量加权模型和丁烷含量预测模型，分别表示为：

X＝Pα+u

Y＝Cα+f

其中，X表示加权训练样本集，Y表示加权丁烷含量样本集，P和C分别表示加权训练样本集X和加权丁烷含量样本集Y的加权公共因子α的因子载荷矩阵，α表示加权公共因子(X和Y的加权公共因子α相同)，u和f分别表示加权训练样本集和加权丁烷含量样本集的测量噪声；

X的测量噪声的概率密度函数p(u)和Y的测量噪声的概率密度函数p(f)均服从均值为0的高斯分布，表示为：

p(u)＝N(0,Σ_x),p(f)＝N(0,Σ_y)

其中，Σ_x表示加权训练样本集的测量噪声的协方差，Σ_y表示加权丁烷含量样本集的测量噪声的协方差。

所述步骤6具体为：

6.1)首先根据过程变量加权模型以及训练样本集的加权平均值计算查询样本的查询公共因子

其中，

表示训练样本集的加权平均值，N表示训练样本集中训练样本的总个数；x_i表示第i个训练样本；

6.2)再根据丁烷含量预测模型以及丁烷含量样本集的加权平均值计算得到丁烷含量值

式中，

表示丁烷含量样本集的加权平均值，实际在线预测中，默认丁烷含量预测模型的测量噪声f为零，y_i表示第i个丁烷含量值。

本发明引入滑动窗口，在每个滑动窗口中建立因子分析模型，将在线查询样本输入到各个滑动窗口中得到查询样本与训练子集的局部相似度以及查询样本在滑动窗口中的局部置信度，再综合所有滑动窗口的结果得到每个训练样本的全局权重，根据全局权重计算训练样本集的加权平均值对查询样本进行预测得到查询样本的丁烷含量预测值。本发明通过建立查询样本与训练样本之间的权重关系，提高了预测结果的准确性。

本发明与现有技术相比具有的有益效果有：

一般情况下，通过离线实验室分析丁烷含量值往往需要花费数小时时间，这就会导致脱丁烷塔的控制滞后，本发明通过对脱丁烷塔中的过程变量和丁烷含量之间的关系建立局部加权概率模型，能够很好的解决非平稳过程中的高斯特性，在局部加权概率模型框架下，通过该过程中容易测量的变量对难以测量的丁烷含量值进行在线软测量，预测时间花费较短，预测结果较为准确，实现了脱丁烷塔中硫丁烷含量的在线估计。

附图说明

图1为本发明涉及的因子分析的流程图；

图2为本发明方法流程图；

图3为本发明涉及的脱丁烷塔流程图；

图4为基于是基于局部加权概率模型的工业非平稳过程软测量结果。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

本发明针对脱丁烷塔中的丁烷含量检测问题，通过过程中容易测量的变量，利用局部加权因子分析模型，对该过程中丁烷含量进行在线软测量。

本发明实施例及其实施过程如下：

第一步：通过集散控制系统和实时数据库系统收集脱丁烷塔中各个过程变量的数据：训练样本集X_trian∈R^N×n，将这些数据存入历史数据库，并选取部分数据作为建模用样本。

第二步：通过现场抽取和离线实验室分析获取历史数据库中用于建模的样本所对应的丁烷含量值作为软测量模型的输出Y_trian∈R^N×1，将这些数据存入历史数据库。

该步骤是为了获取软测量建模中的输出变量，即脱丁烷塔中的丁烷含量。一般情况下，通过离线实验室分析丁烷含量值往往需要花费数小时，这就会导致脱丁烷塔的控制滞后。

第三步：引入覆盖在训练样本集上的滑动窗，滑动窗口，在窗口中建立因子分析模型，得出所有窗口中模型的参数，并存入历史数据库。

为了得到因子分析中最优参数集{Z_τ,Σ_τ}，需要对似然函数做极大化处理。并通过支持向量数据描述计算出每个窗口中训练子集的中心和半径。一并存入数据库中备用。

第四步：收集新的在线测量数据作为查询样本，并按每个滑动窗中训练子集均值和标准差分别归一化。

第五步：计算归一化后的查询样本在每个窗口中的潜在因子，并计算其与窗口中训练子集之间的局部相似度。以该种方式计算查询样本与所有滑动窗中每一个训练样本之间的局部相似度。

第六步：计算归一化后的查询样本与每一个窗口中训练子集之间的局部置信度。引入支持向量数据描述方法(SVDD)，SVDD被用于计算查询样本和滑动窗之间的窗口置信度。以该种方式计算查询样本在每一个滑动窗中的局部置信度。

第七步：结所有窗口中局部置信度与局部相似度得到该查询样本在训练样本集当中的全局权重。

第八步：建立局部加权因子模型，将加权后的训练样本集和查询样本作为局部加权因子模型的输入优化求解模型参数。具体是：将X_trian和全局权重作为模型的输入，Y_trian作为模型的输出建立加权因子分析模型：

X＝Pα+u

Y＝Cα+f

其中P∈R^n×G，C∈R^1×G为载荷矩阵，α∈R^G×1为公共因子，p(α)～N(0,I)服从均值为0，协方差为1高斯分布。n为训练样本集的过程变量个数，G为公共因子个数。u∈R^n×1，f∈R¹ ^×1为过程变量和丁烷含量对应的噪声，服从均值为0的高斯分布，即p(u)＝N(0,Σ_x),p(f)＝N(0,Σ_y)，其中，∑_x和∑_y为噪声对应的协方差。为了得到局部加权因子分析模型最优参数集Θ＝{P,C,Σ_x,Σ_y}，需要对以下似然函数做极大化处理，即

基于上述优化函数，为了得到最优的模型参数值，采用期望最大算法，该算法分为两个步骤，分别为E步和M步，具体如下：

在该算法的E步中，对潜在因子变量的后验分布密度函数进行估计，即

因为上式右边都为高斯分布，所以后验概率也为高斯分布的形式。从而得到一介和二介的统计量估计值如下：

E(α_i|x_i,y_i,Θ)＝(I+P^T(Σ_xi)^-1P+C^T(∑_yi)^-1C)^-1.(P^T(Σ_xi)^-1x_i+C^T(∑_yi)^-1y_i)

E(α_iα_i ^T|x_i,y_i,Θ)＝(I+P^T(Σ_xi)^-1P+C^T(∑_yi)^-1C)^-1.E(α_i|x_i,y_i,Θ)E^T(α_i|x_i,y_i,Θ)

在算法的M步中，基于模型的不同参数，分别对优化函数求偏导数，令偏导数为零，可求得最优参数值。即

通过E步和M步的反复迭代，当模型的似然函数不再变化后，即可得到最优的模型参数。

第九步：将查询样本直接输入到训练后的局部加权因子分析模型中，计算查询样本的关键指标—丁烷含量值。

计算如下：

在此基础上，计算关键变量值如下：

以下结合一个具体的脱丁烷塔例子来说明本发明的有效性。针对该过程，一共采集了2394个数据，其中780个数据用来建模，并对其对应的丁烷含量值进行离线分析和标记。另外采集的100个数据样本用来验证软测量模型的有效性。在该过程中，一共选取了7个过程变量对该过程的丁烷含量进行软测量建模，这7个过程变量分别为塔顶温度、塔顶压力、回流流量、下一级流量、灵敏板温度、塔底温度和塔底压力。

接下来结合该具体过程对本发明的实施步骤进行详细地阐述：

1.局部加权因子分析的软测量建模将选取的7个过程变量组成的数据矩阵作为软测量模型的输入，丁烷含量数据矩阵作为软测量模型的输出，按照实施步骤中给出的详细方法，建立基于局部加权因子分析的软测量模型。

2.获取过程中实时测量数据信息，为了测试新方法的有效性，我们对100个验证样本进行测试，并利用建模时存储的参数对其进行处理。

3.丁烷含量的在线软测量对100个查询样本进行在线软测量建模，获得相应的在线估计值。图4给出了本发明方法针对100个验证样本的在线软测量结果和拟合优度。曲线颜色相对较浅的曲线表示软测量模型的在线估计值，相对较深的曲线表示各个查询样本的离线分析值。

如图4所示，采用本发明的方法使得在线估计值与离线分析值之间的拟合系数达到0.947，相比于传统离线测量丁烷含量的方法，本发明的通过该过程中容易测量的变量对难以测量的丁烷含量值进行在线软测量建模，而且测量结果的拟合程度高，结果准确，实现了脱丁烷塔中丁烷含量的在线估计。本发明引入了局部加权概率软测量建模方法，能够很好的解决工业非平稳过程复杂的数据特性，通过工业非平稳过程中的过程变量对关键变量进行在线估计，从而使得软测量的结果更为可靠和可信。

上述实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。

15页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：用于吊车系统的自适应控制器的设计方法、控制器及系统

基于局部加权因子模型的工业非平稳过程软测量建模方法

相关技术

网友询问留言