一种基于隐变量的贝叶斯网络复杂工业过程软测量方法

文档序号:1140674 发布日期:2020-09-11 浏览:3次 >En<

阅读说明:本技术 一种基于隐变量的贝叶斯网络复杂工业过程软测量方法 (Bayesian network complex industrial process soft measurement method based on hidden variables ) 是由 徐玉雪 王云 何雨辰 于 2020-04-02 设计创作,主要内容包括:本发明公开了一种基于隐变量的贝叶斯网络复杂工业过程软测量方法。该方法充分发挥贝叶斯网络和局部加权学习的优势,通过隐变量计算待预测在线样本与对应训练样本的全局相似度对原始数据加权,将加权后的数据输入贝叶斯网络进行预测,实现复杂非平稳工业过程的自适应软测量。本发明针对复杂工业过程的时变特性,在有监督地训练贝叶斯网络的基础上,引入基于隐变量的相似度计算和加权,缓解了模型过拟合现象,提高了预测精度,为复杂化工生产过程中与生产安全、生产质量和生产效率密切相关的质量变量的软测量建模提供了方法支持。(The invention discloses a Bayesian network complex industrial process soft measurement method based on hidden variables. The method gives full play to the advantages of the Bayesian network and local weighted learning, weights the original data by calculating the global similarity of the online sample to be predicted and the corresponding training sample through the hidden variables, inputs the weighted data into the Bayesian network for prediction, and realizes the self-adaptive soft measurement of the complex non-stationary industrial process. Aiming at the time-varying characteristic of the complex industrial process, the similarity calculation and weighting based on the hidden variable are introduced on the basis of supervised training of the Bayesian network, so that the model overfitting phenomenon is relieved, the prediction precision is improved, and method support is provided for soft measurement modeling of the quality variable closely related to the production safety, the production quality and the production efficiency in the complex chemical production process.)

一种基于隐变量的贝叶斯网络复杂工业过程软测量方法

技术领域

本发明属于连续化工过程控制和软测量领域,具体涉及一种基于隐变量 的贝叶斯网络复杂工业过程软测量方法。

背景技术

连续化学工业生产中存在难以在线测量和监测的生产状态,面对此类复 杂过程中相关变量的监控往往用软测量方法:先采样容易检测的物理量的样 本数据,然后间接估计可以从一定程度上反应生产过程状态和产品质量的变 量。目前,各种基于数据驱动的模型已被应用于软测量,而直接基于数据驱 动学习方法,难以有效地发现能揭示质量变量与生产系统密切关系的隐变量。

贝叶斯网络是目前不确定知识和推理领域有效的理论模型之一,这种通 过结合图论和概率论的图模型能够更好的处理较为复杂的、模糊的和不确定 性的场景,将其用于软测量模型的构建成为研究热点。

在实际复杂工业过程中,由于平台设备的老化、催化剂的失活和过程环 境的改变等会引起模型的退化,原来建立的模型不再适用于现有的运行状态, 导致模型精度下降。为了正确跟踪过程状态和解决时变问题,有人提出了基 于滑动窗和即时学习的贝叶斯网络,但也存在一定的局限性,往往忽视了隐 变量对软测量模型的影响。本发明针对复杂工业生产中的时变过程,在有监 督地训练贝叶斯网络的基础上,引入基于隐变量的相似度计算和加权,缓解 了过拟合,并减小了模型误差,提高了对复杂工业过程中质量变量的预测精 度。

发明内容

为了解决背景技术中存在的技术问题,本发明提供了一种基于隐变量的 贝叶斯网络复杂工业过程软测量方法,该方法利用贝叶斯网络有监督地计算 隐变量,并根据隐变量计算全局相似度对原始数据加权,将加权后的数据输 入贝叶斯网络进行预测,实现工业过程的自适应软测量。

本发明采用的技术方案是:

步骤1,通过传感器采集复杂连续工业过程同生产安全和质量密切相关 的数据,分为训练样本集[X,Y]和查询样本集[Xquery,Yquery]。训练样本集中,过 程变量X=[x1,x2,...xn]∈Rm×n和质量变量Y=[y1,y2,...yn]∈Rk×n,将用于软测量建模, 其中m是过程变量X的变量个数,k是质量变量Y的变量个数,n是数据集中 包含的样本个数。查询样本集中,过程变量Xquery用于软测量预测,Yquery用于 验证软测量预测效果;

所述复杂工业过程相关的数据具体包括通过安装在复杂工业生产过程的 某个化学反应容器的传感器采集到重要变量的数值。过程变量相对容易监测 的变量,质量变量为关系该生产质量与安全的重要变量。传感器包括有安装 于塔顶、塔板和塔底处的温度传感器,塔顶馏出气体处的压力传感器,回流 罐处的速度传感器以及下一级生产入口的速度传感器。

步骤2,对于每一个查询样本xq∈Xquery利用滑动窗从训练样本集中选取一 定数量的样本Dtrain,根据工业生产过程的相关变量关系和Dtrain的大小构建有 监督贝叶斯网络,训练贝叶斯网络,求取Dtrain对应的隐变量T,将xq输入贝叶 斯网络求得隐变量tnew

步骤3,利用隐变量T,tnew求出每个滑动窗口的置信度和局部相似度,进 而得到xq与Xtrain的全局相似度用于对原始工业过程变量的局部加权;

步骤4,将全局相似度作为权重对Xtrain、Ytrain进行加权,得到局部加权后 的训练数据Xt、Yt,将Xt、Yt按节点输入贝叶斯网络,求出xq对应的预测值yq, 完成对所有查询样本xq对应的工业过程质量变量的预测;

步骤5,所有查询样本预测完毕后,衡量软测量模型对复杂工业过程变 量的预测效果。采用均方根误差RMSE来衡量预测结果的准确性,用R2衡量 预测结果对数据的跟踪能力,计算方法如下:

Figure BDA0002436176980000021

其中yreal即每个查询样本xq对应的yq

Figure BDA0002436176980000022

为yreal的均值,为ypred为每个查 询样本对应的预测值,n为查询样本的个数。

所述的步骤2中具体包括:

步骤2-1,将步骤1划分出的训练样本集用滑动窗口遍历,每个窗口包含 的样本个数为w,窗口个数为s,则遍历的样本数为W=w×s,即每个查询样本 xq∈Xquery对应的训练集为Dtrain=[Xtrain,Ytrain]∈R(m+k)×W

步骤2-2,选用序α=<X,t,Y>构建节点数为3的质量相关的贝叶斯网络, 该网络相对于传统贝叶斯网络包含了对训练集中质量变量即Ytrain的监督。按 照对应网络节点输入Xtrain、Ytrain,即有监督地训练贝叶斯网络,并求出训练 数据集Dtrain对应的隐变量T∈RW×i,i表示隐变量的个数;

本发明所涉及贝叶斯网络的示意图如图1所示,其中节点代表变量,节 点间的有向箭头表示变量间的因果依赖关系。该贝叶斯网络共有3个节点, 三条有向边,顺序为α=<X,t,Y>,节点X代表过程变量,节点T代表隐变量, 节点Y代表质量变量。节点X为父节点,有两条边出发分别指向子节点T和 Y,节点T有一条边出发指向Y。网络节点X对应输入Xtrain,节点Y对应输 入Ytrain,训练贝叶斯网络后,从节点T输出隐变量。

步骤2-3,将新的过程变量xq输入贝叶斯网络节点X,求出xq对应的隐变 量tnew∈R1 ×i

所述步骤3中,流程如图3,具体过程如下:

步骤3-1,应用SVDD来确定xq与每个窗口的置信度,第v个的窗口置信 度被定义为:

其中av和Rv分别表示根据第v个窗口中计算出的隐变量Tv构造超球面的 中心坐标和半径,xv表示tnew在超球面中对应的坐标。

步骤3-2,假设第r个训练样本属于第v个移动窗口,tnew与当前训练样 本对应隐变量tr的局部相似度Sv计算如下:

其中,为取值0-1的调谐参数,σd为dτ对应的标准差。

步骤3-3,第v个窗口中第r个训练样本与xq的全局相似度为:

Simr=winv·Sv

xq与训练样本的全局相似度可以表示为:

SIM=[Sim1,Sim2,···,Simr,···Simw×s]

所述步骤4中,具体过程如下:

步骤4-1,根据步骤3所述,按下式计算Xt、Yt

步骤4-2,按照对应网络节点输入Xt、Yt,训练贝叶斯网络,求出xq对应 的预测值yq

步骤4-3,重复步骤2至步骤4,直到预测完成Xquery中所有查询样本对应 的预测值Yq,执行步骤5。

本发明与现有技术相比具有的有益效果有:

1、利用工业生产的过程知识,充分挖掘变量间的因果依赖关系,构建贝 叶斯网络,使得变量之间的关系更为直观。

2、充分地利用的过程知识和重要的有标签生产数据,有监督地对贝叶斯 网络进行参数学习和训练。

3、通过计算隐变量挖掘多个变量之间的潜在关系,将隐变量用于原始数 据加权,提高原始数据的利用率,有利于模型更新,实现工业过程的自适应 软测量

本发明针对实际生产过程的时变特性,利用贝叶斯网络有监督地计算隐 变量,将传统的贝叶斯网络扩展成自适应软测量模型,可以选用较少的训练 样本进行预测;相较于其他的传统自适应软测量模型本发明的优势主要体现 在缓解了过拟合,提高了预测精度,为复杂化工生产过程与生产安全、生产 质量和生产效率密切相关的质量变量的软测量建模提供了方法支持。

附图说明

图1为本发明涉及的贝叶斯网络结构;

图2为本发明涉及的脱丁烷塔结构示意图;

图3为本发明方法流程示意图;

图4为基于本发明方法预测丁烷含量的结果示意图;

图5为对比方法无隐变量加权贝叶斯网络预测丁烷含量结果示意图;

图6为本发明方法技术路线图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

本发明实施例及其实施过程如下:

下面以脱丁烷塔生产过程为例,基于操作过程记录的数据,对过软测量 建模方法做详细描述,技术路线如图6。

脱丁烷塔是石脑油裂解的精制工艺,目的是将丁烷与石脑油流分离,验 证软测量模型领域不同算法的基准平台。图2为脱丁烷塔生产的工艺流程图。 在脱丁烷塔中,检测色谱柱底部的丁烷含量是监测生产是至关重要的部分。 然而,丁烷的测量并不像温度那样容易。因此本发明选择如表1所示与温度、 压力、流量、浓度相关的易于测量的过程变量,来估计质量变量即丁烷含量。

表1

过程变量 变量描述
U1 塔顶温度
U2 塔顶压力
U3 回流量
U4 下一级流量
U5 第6块塔板温度
U6 塔底温度(左)
U7 塔底温度(右)

如图3所示,为应用基于有监督贝叶斯网络隐变量相似度与局部加权的 复杂工业过程软测量建模方法,对脱丁烷塔塔底的丁烷含量进行预测,制定 了如下步骤:

步骤1,通过传感器采集复杂连续工业过程同生产安全和质量密切相关 的变量,分为训练样本集[X,Y]和查询样本集[Xquery,Yquery]。样本集中,过程变 量的个数为7,质量变量的个数为1,查询样本的个数为500。

步骤2,对于每一个查询样本xq∈Xquery,利用10个窗口大小为5的滑动 窗口选择50个训练样本,输入到贝叶斯网络用EM算法进行参数学习,接着 用联合树推理引擎求出训练样本对应的隐变量T;将作为xq证据输入网络, 求得隐变量tnew

步骤3,利用隐变量T,tnew求出每个滑动窗口的置信度和局部相似度,进 而得到xq与Xtrain的全局相似度用于对原始工业过程变量的局部加权;

步骤4,将全局相似度作为权重对Xtrain、Ytrain进行加权,得到局部加权后 的训练数据Xt、Yt,将Xt、Yt按节点输入贝叶斯网络,求出xq对应的预测值yq, 完成对所有查询样本xq对应的工业过程质量变量的预测;

步骤5,所有查询样本预测完毕后,衡量软测量模型对复杂工业过程变 量的预测效果。采用均方根误差RMSE来衡量预测结果的准确性,用R2衡量 预测结果对数据的跟踪能力,计算方法如下:

Figure BDA0002436176980000051

其中yreal即每个查询样本xq对应的yq为yreal的均值,为ypred为每个查 询样本对应的预测值,n为查询样本的个数。

本发明方法预测丁烷含量的结果如图4所示,传统方法:未引入隐变量 的局部加权贝叶斯软测量建模作为效果对比方法,预测结果如图5所示,两 种方法的预测效果对比如表2所示,从表2可以看出,本发明方法比未引入 隐变量的贝叶斯网络预测精度有所提高。

表2

本发明方法 传统方法
RMSE 0.0350 0.0536
R<sup>2</sup> 0.9414 0.8622

综上,本发明提出的方法,一种基于隐变量的贝叶斯网络复杂工业过程 软测量方法,能完成对复杂工业过程的软测量建模,并实现对如丁烷的质量 变量的预测,一定程度上提高了软测量的预测精度。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种自动线生产任务动态调度方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类