一种电网元器件的寿命预估方法

文档序号:188955 发布日期:2021-11-02 浏览:15次 >En<

阅读说明:本技术 一种电网元器件的寿命预估方法 (Service life estimation method for power grid components ) 是由 唐兵 马振国 谢楠 黄煜铭 张柯琪 罗皎虹 李萧 曹丹怡 张建勇 张斌武 于 2021-08-12 设计创作,主要内容包括:本发明涉及一种电网元器件的寿命预估方法,包括如下步骤:1)将电网元器件的所有数据标签进行收集,并将其分隔为若干子数据集;2)将元器件的“设计寿命”“安装日期”“损坏日期”标签融合为“生命历程”,3)将离散型文本标签的参数值依次数字化为整数0至n;4)分别对上述这八个标签对应的值进行归一化处理;5)运用留出法,将子数据集按照8:2的比例划分为两个互斥的集合,其中,训练集S占比80%,测试集T占比20%;6)将通过训练集S训练出模型,再用测试集T评估其测试误差,作为泛化误差的估计值;7)利用训练完成的算法得到元件的预测剩余寿命。本发明实现了小元器件寿命预测的智能化,提高了预测的精度和速度。(The invention relates to a life estimation method of a power grid component, which comprises the following steps: 1) collecting all data labels of the power grid components, and dividing the data labels into a plurality of subdata sets; 2) fusing the labels of &#39;design life&#39;, &#39;installation date&#39; and &#39;damage date&#39; of the components into &#39;life history&#39;, and 3) sequentially digitizing the parameter values of the discrete text labels into integers from 0 to n; 4) respectively carrying out normalization processing on the values corresponding to the eight labels; 5) dividing the subdata set into two mutually exclusive sets according to the proportion of 8:2 by using a retention method, wherein the training set S accounts for 80%, and the testing set T accounts for 20%; 6) training a model through a training set S, and evaluating a test error of the model through a test set T to serve as an estimated value of a generalization error; 7) and obtaining the predicted residual life of the element by using the trained algorithm. The invention realizes the intellectualization of the life prediction of the small component and improves the precision and the speed of the prediction.)

一种电网元器件的寿命预估方法

技术领域

本发明涉及一种电网元器件的寿命预估方法,具体的说,是一种基于支持向量机的方法对电网元器件寿命进行预估的方法。

背景技术

随着电力技术的不断发展和电网建设步伐不断加快,电网企业对运行高效性、稳定性以及信息化技术有了更高的要求。目前,针对电网元器件故障预测的研究领域主要集中在变压器等大型元器件领域,对于小型元器件,如:CPU板、显示屏、DC220V电源等,大多采用专家经验来评估剩余寿命,暂时没有一种智能化的寿命预估方法,具有预测速度慢、预测精度低等缺陷。

发明内容

本发明公开一种电网元器件寿命预估方法,其无需对元器件运行进行监测便可实现预估,预测精度高。

本发明采用如下技术手段实现:一种电网元器件的寿命预估方法,包括如下步骤:

1)将电网元器件的所有数据标签进行收集,并将其分隔为若干子数据集;

2)将元器件的″设计寿命″″安装日期″″损坏日期″标签融合为″生命历程″,按照下面伪代码的方法计算已损坏的元器件的生命历程;

假设编号为i的元器件,其安装时间为Date_install_i,损坏时间为Date_broken_i,设计寿命为Planed_life_i(天)。则其全生命周期的设计生命历程和真实生命历程可以按以下伪代码进行计算:

其中DLP表示按设计寿命计算的生命历程、RLP表示实际经过的生命历程。

3)将″厂家″″设计寿命″″安装地点″″间隔″″温度″″湿度″″运维班组″六个离散型文本标签的参数值依次数字化为整数0至n,其中,(n+1)代表相应标签的参数个数;

4)分别对″厂家″″设计寿命″″安装地点″″间隔″″温度″″湿度″″运维班组″这八个标签对应的值进行归一化处理;

5)运用留出法,将子数据集按照8∶2的比例划分为两个互斥的集合,其中,训练集S占比80%,测试集T占比20%;

6)将通过训练集S训练出模型,再用测试集T评估其测试误差,作为泛化误差的估计值

7)利用训练完成的算法得到元件的预测剩余寿命。

步骤5中利用分层抽样法令S与T内的样本各类别比例大抵一致。

步骤6中,在模型训练之前需要对权重向量W和偏差b进行初始化,具体步骤如下:

3-1)随机生成一个含8个元素的权重向量W和偏差b,W的每个元素分别代表厂家、设计寿命、安装地点、间隔、温度、湿度、运维班和设计生命历程这8个影响因子的权重大小。计算W的均值Wmean和标准差S,

3-2)对每个W中的元素Wi,按进行标准化,得到服从标准正态分布的权重向量ω=[ω1,ω2,...,ω8],将ω与b构建超平面f(x)=ωTφ(x)+b。

3-3)选择合适的核函数将数据投影到高维坐标系;

3-4)在(0,1)范围内选取一个合适的ε作为软间隔间距;

3-5)构建不敏感损失函数与损失函数;

3-6)通过拉格朗日乘数法得到令损失函数最小的ω和b,作为模型训练结果。

所述核函数κ(xi,xj)具体表示为

κ(xi,xj)=(φ(xi),φ(xj))=φ(xi)Tφ(xj)

其中,(φ(xi),φ(xj))表示φ(xi)与φ(xj)的内积。

所述超平面借助核函数求得,

所述软间隔间距构成一个构建一个宽度为2ε的间隔带以提高模型容错率及泛化效果,其目标函数为:

C>0,l0/1为0/1损失函数,表示为:

对目标函数引入松弛变量ξi≥0,则目标函数为:

所述不敏感函数为损失函数为f(xi)表示使用当前模型训练参数预测出的第i组数据的生命历程,yi表示数据集中第i组数据的真实生命历程,m为该种设备的所有记录条数,对损失函数引入松弛变量ξi

则损失函数为

所述拉格朗日函数为

对ω,b,ξi求偏导,得到

将上式带入原始支持向量机可以得到支持向量回归模型的解

进一步考虑核函数,可得其中κ(x,xi)为核函数。

步骤6中对模型采用决定系数R2进行评估,

表示通过模型预测的生命历程值,yi表示真实生命历程值。

步骤7中预测剩余寿命的步骤如下:

7-1)将系统中正在运行的元件的″厂家″″设计寿命″″安装地点″″间隔″″温度″″湿度″″运维班组″″运行状态″等数据依次代入f(x),通过上述方法计算各元件的预测生命历程(LP)。

7-2)将预测生命历程换算为预测剩余寿命(PRUL),转换公式如下。

在公式中,Ttoday代表今天的日期,Tinstall代表元件的安装日期,两者相减的结果表示该元件运行的累计时间,将累计运行时间除以经过的生命历程即可得到根据现有条件预测该元件的总寿命,再减去已经运行的时间,就得到了该元件的预测剩余寿命。

本发明针对有限数据集,通过全生命周期模拟的方法增强数据集,可以在数据集有限的情况下得到良好的训练模型;且本发明利用已有消缺记录提取特征信息,基于支持向量机方法,在不需要实时监测元器件运行的电气信息的条件下确定元器件寿命的预估模型,实现了小元器件寿命预测的智能化,提高了预测的精度和速度。

附图说明

图1为本发明数据预处理流程示意图;

图2为本发明模型训练流程示意图;

图3为本发明模型评估流程示意图

图4为本发明总流程图。

具体实施方式

下面对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

步骤一:数据预处理

本发明所用到的数据集共有十一个字段,对应参数值如下表:

元器件的类型决定了元器件的寿命、特性以及对环境的敏感程度。因此,读入原始数据之后,按照元器件类型″CPU″″DC220V电源板″″显示屏″三类,将原始数据集拆分为三个子数据集,分别对其进行切分、训练和测试,将大大提高模型的针对性和准确度。由于对每个子数据集的操作相同,以下步骤仅以一个子数据集为例,阐述本发明的技术方案。

首先,将″厂家″″设计寿命″″安装地点″″间隔″″温度″″湿度″″运维班组″六个离散型文本标签的参数值依次数字化为整数0至n,其中,(n+1)代表相应标签的参数个数。

其次,引入新标签″生命历程″,其计算方法为:

假设编号为i的元器件,其安装时间为Date_install_i,损坏时间为Date_broken_i,设计寿命为Planed_life_i(天)。则其全生命周期的设计生命历程和真实生命历程可以按以下伪代码进行计算:

其中DLP表示按设计寿命计算的生命历程、RLP表示实际经过的生命历程。这样一方面可以对元件的全生命周期进行预测,同时可以增强数据集。

再次,根据公式

分别对″厂家″″设计寿命″″安装地点″″间隔″″温度″″湿度″″运维班组″这八个标签对应的值进行归一化处理,其中,Xscale表示归一化之后的数值,X表示原参数值,Xmean表示该标签下所有参数的平均值,S表示该标签下所有参数的标准差。

最后,运用留出法,将子数据集按照8:2的比例划分为两个互斥的集合,其中,训练集S占比80%,测试集T占比20%,此后将通过训练集S训练出模型,再用测试集T评估其测试误差,作为泛化误差的估计值。

为了使划分的训练集与测试集数据分布尽可能保持一致性,减少因数据划分过程引入额外的偏差而对最终结果产生的影响,因此,本发明采用分层抽样法,使得S与T内的样本各个类别的比例大抵一致。

考虑到在实际生产中″温度″″湿度″″运维班组″三个环境与人为因素对于不同元器件具有不同的影响权重,故采用加权数据结合计算重心降维的方法使这三维数据各有侧重,同时简化运算时间。

首先构建合适密度函数ρ(x,y,z),其中x,y,z分别代表″温度″″湿度″″运维班组″。该密度函数应具有以下性质:

接着,通过主成分分析等方法,确定″温度″″湿度″″运维班组″的相对权重,假设权重分别为a%,b%,c%,依次将每组x,y,z变换为a%x,b%y,c%z,得到带有权重的三组坐标点。

然后,考虑由该三组坐标点与构成的空间立体,通过下列公式求得该空间立体的重心坐标:

最后根据以下公式

求出该三维数据加权降维后的结果r,用计算所得的r替代原有的″温度″″湿度″″运维班组″三个因素,可以使模型更加贴近现实应用环境,且缩短训练所需的时间和资源。

步骤二:模型训练

在训练模型前,需要初始化训练模型所需要的参数权重向量W和偏差b。具体方法如下:

首先,随机生成一个含8个元素的权重向量W和偏差b,W的每个元素分别代表厂家、设计寿命、安装地点、间隔、温度、湿度、运维班组和运行状态这8个影响因子的权重大小。计算W的均值Wmean和标准差S,对每个W中的元素Wi,按

进行标准化,得到服从标准正态分布的权重向量ω=[ω1,ω2,...,ω8],以加快训练速度。

为得到合理划分几类样本的超平面,针对数据特点,提出核函数和软间隔的方法。

核函数方法主要针对线性不可分的样本空间,将其映射到更高一维的特征空间,使其实现线性可分。在此情况下,划分的超平面可以表示为

f(x)=ωTφ(x)+b (8)

公式中φ(x)表示将x映射后的特征向量,ω为通过公式(2)计算得到的服从正态分布的权重向量,ωT表示ω的转置矩阵,b为初始化模型时生成的偏差。

由于直接计算φ(xi)Tφ(xj)十分困难,给出设想函数κ(xi,xj),它表示在原始样本空间中通过设想函数来计算,以此代替两者在特征空间中的内积运算,具体表示为

κ(xi,xj)=(φ(xi),φ(xj))=φ(xi)Tφ(xj) (9)

其中,(φ(xi),φ(xj))表示φ(xi)与φ(xj)的内积。

所以超平面可以借助核函数求得,

核函数类型多种多样,具体核函数的选择将根据对训练后模型的评估情况具体选择,以实现向量机性能最优化。

软间隔的方法具体表示如下。在(0,1)内选取一个合适的数值ε作为软间隔间距,构建一个宽度为2ε的间隔带,不计算落入间隔带中的样本,允许一部分样本预测出错,以提高模型容错率与泛化效果。

与硬间隔方法不同的是,软间隔允许一部分样本不满足约束,但它应该尽可能少,于是目标函数写为

其中C>0是一个常数,为惩罚项系数。如果C值较大,算法能够更好地分类所有训练点的决策边界,不过模型的训练时间也会更长。如果C值较小,决策功能会更简单,但代价是训练的准确度,C值一般取为1,但需要根据训练情况进行合理选择。而l0/1是″0/1损失函数″,表示为

在此基础上,引入松弛变量ξi≥0,于是可以得到软间隔支持向量机表达式,

考虑建立回归模型来计算超平面,建立与软间隔带对应的不敏感函数

以及损失函数

在公式中,f(xi)表示使用当前模型训练参数预测出的第i组数据的生命历程,yi表示数据集中第i组数据的真实生命历程,m为该种设备的所有记录条数。

对公式(15)引入松弛变量ξi使得

则上式(15)可化为

为了达到最佳预测效果,需要尽可能降低损失函数值,故需要求损失函数L的最小值。因此,引入拉格朗日乘子μi≥0,αi≥0,得到拉格朗日函数

将公式(17)即对ω,b,ξi求偏导,得到

将上式带入原始支持向量机可以得到支持向量回归模型的解

更进一步,将公式(9)带入得其中κ(x,xi)为核函数。

步骤三:模型评估

在正式将模型投入使用前,需要对模型进行评估,以确定模型的好坏。这里,我们采用回归算法中常用的模型评估系数——决定系数(R2)。该系数反映的是因变量的全部变异能通过回归关系被自变量解释的比例。决定系数R2越大,表示可以被解释的程度越高,拟合效果越好。具体的计算公式为:

公式中的表示通过模型预测的生命历程值,yi表示真实生命历程值。

计算决定系数(R2)的值,如果该系数在预期范围之内,则认为当前训练得到的模型符合要求,可以投入使用,否则,需要继续调整参数(如:核函数、软间隔间距)直至模型符合预期要求。

步骤四:模型应用

首先,将系统中正在运行的元件的″厂家″″设计寿命″″安装地点″″间隔″″温度″″湿度″″运维班组″″运行状态″等数据依次代入f(x),通过上述方法计算各元件的预测生命历程(LP)。

接着,将预测生命历程换算为预测剩余寿命(PRUL),转换公式如下。

在公式中,Ttoday代表今天的日期,Tinstall代表元件的安装日期,两者相减的结果表示该元件运行的累计时间(单位:天)。将累计运行时间除以经过的生命历程即可得到根据现有条件预测该元件的总寿命,再减去已经运行的时间,就得到了该元件的预测剩余寿命(单位:天)。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种用于启动电池的短路检测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类