一种基于硬投票集成学习的变压器故障诊断的方法

文档序号:1903394 发布日期:2021-11-30 浏览:15次 >En<

阅读说明:本技术 一种基于硬投票集成学习的变压器故障诊断的方法 (Transformer fault diagnosis method based on hard voting ensemble learning ) 是由 马洪斌 杨飞 史娜 于 2021-08-13 设计创作,主要内容包括:本发明公开了一种基于硬投票集成学习的变压器故障诊断的方法,包括以下的步骤:步骤1、建立对变压器进行故障诊断的硬投票集成学习分类模型;步骤2、对未知的变压器故障进行故障类型识别;本发明采用机器学习搭建了变压器的故障诊断模型,故障识别准确率高,故障识别简单高效,为初期的变压器运行状态识别提供了有效的支撑,大大降低了工作的强度,保障了变压器故障类型识别的安全性和可靠性。(The invention discloses a transformer fault diagnosis method based on hard voting ensemble learning, which comprises the following steps of: step 1, establishing a hard voting integrated learning classification model for fault diagnosis of a transformer; step 2, identifying the fault type of the unknown transformer fault; according to the method, the fault diagnosis model of the transformer is built by machine learning, the fault identification accuracy is high, the fault identification is simple and efficient, effective support is provided for the identification of the initial running state of the transformer, the working strength is greatly reduced, and the safety and the reliability of the fault type identification of the transformer are guaranteed.)

一种基于硬投票集成学习的变压器故障诊断的方法

技术领域

本发明涉及变压器故障诊断技术领域,尤其涉及一种基于硬投票集成学习的变压器故障诊断的方法。

背景技术

变压器作为电力系统中的重要组成部分,对于电力的安全、可靠供应发挥着至关重要的作用,一旦发生故障将会严重影响电网的安全稳定运行。变压器作为电力的连接和转换部分,内部结构和运行工况较为复杂,发生故障难以准确的进行 故障研判,因此对变压器的故障诊断对于保障电网安全运行意义重大。当前针对变压器故障诊断主要采用的是油中气体分析法(IEC三比值法),能够较准确、可靠地发现逐步发展的潜伏性故障,防止由此引起的重大事故。但在实际应用中其诊断的准确率往往只能达到80%左右,故障诊断的准确率偏低。

发明内容

本发明的目的在于提供一种基于硬投票集成学习的变压器故障诊断的方法,以解决上述技术问题。

为实现上述目的本发明采用以下技术方案:.

一种基于硬投票集成学习的变压器故障诊断的方法,包括以下的步骤:

步骤1、建立对变压器进行故障诊断的硬投票集成学习分类模型;

(1)数据集获取,通过在设备运维管理系统中获取的变压器正常和故障数据作为初始数据;每组样本数据主要为变压器油中五种气体组分和所对应的变压器故障类型;

(2)数据集分类,将初始数据分为训练集和测试集,以训练集数据进行训练学习得到变压器的故障诊断模型,以测试集数据对得到的故障诊断模型进行验证,判断模型识别的准确率;

(3)故障特性分析,依据变压器在运行过程中的正常及故障状态,将变压器运行状态分为正常、中低温过热、高温过热、低能量放电、高能量放电;

(4)特征气体输入,以变压器油中甲烷、乙烯、乙烷、乙炔、氢气五种气体组分和对应的正常、中低温过热、高温过热、低能量放电、高能量放电五种状态作为训练集输入;

(5)选取基分类器,分别采用支持向量机、逻辑回归、K-最近邻分类、贝叶斯分类、决策树、随机森林对训练数据进行训练学习,得到六个变压器故障诊断模型;

(6)识别结果验证,对得到的变压器故障诊断模型,以测试集进行验证,得到各个模型识别的准确率和各个模型对于各类故障的识别结果;

(7)集成学习诊断,将得到的六个变压器故障诊断器作为基学习器,针对其识别结果采取硬投票组合的策略,对基学习器针对每一类故障类型的预测结果进行统计分析,同一类故障标签数量最多的作为最终的结果标签进行输出,组合方式采取的是选用两个识别结果较高的分类器支持向量机和随机森林作为基础分类器,另外选取决策树分类器作为调整分类器,将三个分类器集成组合,得到新的变压器故障诊断器;

(8)对于得到的集成学习变压器故障诊断器,以测试集进行验证,得到变压器故障识别结果;

步骤2、对未知的变压器故障进行故障类型识别;

对待诊断的变压器中采集的甲烷、乙烯、乙烷、乙炔、氢气五种气体组分,输入到集成学习变压器故障诊断模型,可以得到变压器的故障识别结果。

优选的:所述步骤1中步骤(1),变压器的运行数据是通过设备运维管理系统中获取的。

优选的:所述步骤1中步骤(2),训练数据和测试数据的比例为0.7:0.3。

优选的:所述步骤1中步骤(3),变压器运行状态分为正常、中低温过热、高温过热、低能量放电、高能量放电。

优选的:所述步骤1中步骤(5),基分类器选择的为支持向量机、逻辑回归、最近邻分类、贝叶斯分类、决策树和随机森林。

优选的:所述步骤1中步骤(7),集成学习主要采用的是Vote集成学习,组合策略采用的硬投票组合输出策略,对基学习器针对每一类故障类型的预测结果进行统计分析,同一类故障标签数量最多的作为最终的结果标签进行输出,组合方式采取的是选用两个识别结果较高的分类器支持向量机和随机森林作为基础分类器,另外选取决策树分类器作为调整分类器,将三个分类器集成组合,得到新的变压器故障诊断器。

优选的:所述步骤1中步骤(7),集成学习主要组合了决策树、支持向量机和随机森林。

与现有技术相比,本发明具有以下优点:本发明采用机器学习搭建了变压器的故障诊断模型,故障识别准确率高,故障识别简单高效,为初期的变压器运行状态识别提供了有效的支撑,大大降低了工作的强度,保障了变压器故障类型识别的安全性和可靠性。

附图说明

图1为本发明集成学习故障诊断流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步详细阐述。

集成学习;

集成学习方法主要是由个体的学习器进行组合生成,通过对样本数据集的学习可以获得多个分类器,这些分类器具有多样性和准确性。根据个体的学习器之间是否是同一类型的学习算法,又可以将分类器分为“同质”和“异质”。对于个体的学习器的合并,是按照某种策略将个体学习器对新样本分类的预测结果综合考虑,从而得到一个最终的预测结果。集成策略主要有“平均值法”和“多数投票法”等。

支持向量机;

支持向量机(Support vector machine,SVM)是在统计学习理论的基础上发展出的一种模式识别方法,是一种全局最优求解算法而不是求得局部极小值,具有很好的泛化能力。SVM具有坚定的理论基础在人脸识别、文本自动分类等众多领域展现获得广泛的应用。

逻辑回归;

逻辑回归又称为逻辑斯蒂回归分析,因其训练速度较快具有较好的分类效果,广泛应用在分类中。逻辑回归模型是线性回归模型和逻辑回归模型的结合。逻辑回归主要是寻找预测函数和损失函数,预测函数是输入变量预测输出变量结果概率的一个函数。要评价预测函数预测的结果与实际值之间的差别,需要构造一个损失函数作为衡量标准,损失函数表示了训练样本输入之后预测值与真实值的平均差异。

K-最近邻;

K-最近邻就是给定一个样本,确定其类别号,找到样本在训练集中最近的k个样本,然后找出k个样本中出现次数最多的一类,其标号就是样本的标号。在最近邻算法中,通常采用的是欧氏距离,对每个训练样本在进行距离计算时没有赋予加权,因此每个样本的差异很难体现。通常通过高斯核函数引出距离公式,通过训练集学习核参数,得到一个与训练集对应的加权矩阵。再对测试集进行分类时通过引入的加权矩阵就可以表现出样本之间的差异,从而提高分类的效率。

朴素贝叶斯;

朴素贝叶斯理论假设的是事件的结果是不确定,通过事件发生的概率来量化它。事件过去发生的概率已知的话,则可以通过数学方法计算出未来发生的概率。朴素贝叶斯模型假定所有的条件属性相互独立,条件属性共有的父结点就是类属性的结点。假设就是条件独立假设。假定构造出来的模型结构简单,降低了贝叶斯网络的复杂性。实际中的数据往往具有复杂性、复杂性、不完整性,这样在构造贝叶斯模型时其条件独立假设就难以满足。

决策树;

决策树学习主要是从一组无规则、无次序的事例中推理出以决策树形式来表示的分类规则。决策树的创建过程中由于训练样本过少或数据集中存在噪声,导致决策树的许多分枝反映出训练样本中异常现象。决策树会对训练样本过度拟合,而决策树的剪枝正是解决过拟合问题。剪纸分为预剪纸和后剪纸,预剪纸提前做一些判断,会导致决策树过早停止构造,但是效率高,适合数据量大的情况,通常应用于数据预测中。决策树结构简单,便于理解,算法描述简单,分类速度快,在数据处理中广泛使用。

随机森林;

随机森林是利用重抽样方法从原始样本中抽取多个样本,对每个样本进行决策树建模,然后组合多个决策树,形成一个森林。通过形成的森林对未知的样本进行预测,选取投票最多的分类。因此随机森林相比较决策树可以大大提高分类的准确率。

变压器油及固体绝缘产生气体机理;

对于大型电力变压器,目前几乎都是用油来绝缘和散热,电力变压器油与油中的固体有机绝缘材料在运行电压下因电、热、氧化和局部电弧等多种因素作用会逐渐老化、裂解,产生少量的甲烷、乙烯、乙烷、乙炔等低分子烃类,以及一氧化碳、二氧化碳和氢气等气体,并多数溶解在油中。油中溶解气体的组分和含量在一定程度上反映出电力变压器绝缘老化或故障的程度,可以作为反映电力设备异常的特征量。通过对运行中的电力变压器定期分析溶解于油中的气体组分、含量和产气速率,能够及早发现电力变压器内部存在的潜伏性故障。

变压器典型故障分析;

变压器内部故障主要为过热式和异常放电式,其中过热式主要包括低温过热(<300℃),中温过热(300℃-700℃)和高温过热(>700℃),异常放电式主要包括低能量放电和高能量放电。

根据试验和变压器故障处理案例分析,油浸式变压器发生故障时产生的气体成分如下:

故障类型 主要气体组分 次要气体组分
油过热 甲烷 乙烯 氢气 乙烷
油和纸过热 甲烷 乙烯 一氧化碳 二氧化碳 氢气 乙烷
油和纸绝缘中局部放电 氢气 甲烷 一氧化碳 乙炔 乙烷 二氧化碳
油中火花放电 氢气 乙炔
油中电弧 氢气 乙炔 甲烷 乙烯 乙烷
油和纸中电弧 氢气 乙炔 一氧化碳 二氧化碳 甲烷 乙烯 乙炔

通过分析,我们将变压器的故障类型分为中低温过热、高温过热、低能量放电和高能量放电。将变压器的四种故障类型与正常情况,共五种状态类型作为变压器的识别结果进行模式识别。

本发明主要包括以下的步骤:

一、建立变压器进行故障诊断的集成学习分类模型;

数据集获取;通过在设备运维管理系统中获取变压器在正常和故障时的变压器油中气体组分共133组,每组样本数据主要包括甲烷、乙烯、乙烷、乙炔、氢气五种气体组分信息和变压器的正常、中低温过热、高温过热、低能量放电、高能量放电五种状态类型信息;

变压器在发生不同的故障类型时,产生的气体组分是不同的,我们在实际的工组中已知变压器的故障类型,然后采集到不同的故障所对应的气体组分;

将样本数据分为训练集和测试集,为避免样本数据的在同一类型之间分类产生的误差,我们采用比例划分,将样本数据按照7:3的比例分为训练数据93组和测试数据40组;

将甲烷、乙烯、乙烷、乙炔、氢气作为特征向量进行变压器故障模式识别,考虑到分类问题主要是针对数值型结构,气体组分为数值型不需转换,因此将变压器的状态正常、中低温过热、高温过热、低能量放电和高能量放电由字符型转换为数值型,分别标注为0、1、2、3、4;

分别采用支持向量机、逻辑回归、最近邻分类、贝叶斯分类、决策树和随机森林对训练数据进行学习,得到故障诊断模型,利用测试数据对各个故障诊断模型进行模型验证,得到各个模型的识别结果;

由40组测试数据对以上6个分类器的识别验证结果,可以得到各分类器的识别准确率,选择其中识别率较高的分类器支持向量机(故障识别准确率为90%)和随机森林(故障识别准确率为90%)作为基分类器,此外通过各分类器的对每一类故障的识别结果进行分析,选择决策树与支持向量机和随机森林进行组合,得到新的集成分类器;

一、对未知的变压器故障进行故障类型识别;

从待故障诊断的变压器中采集甲烷、乙烯、乙烷、乙炔、氢气五种气体组分,输入到集成学习故障诊断模型,得到相对应的变压器故障类型。

本发明采用了集成学习,搭建变压器故障识别分类模型,通过利用变压器油中产生的五种气体组分进行故障诊断。将采集的样本数据分为训练集和测试集,通过训练集数据得到变压器故障诊断模型,以测试集数据进行结果的验证。将故障识别率较高的分类器作为基分类器,采用集成学习进行组合,大大提高了故障识别的准确率。

实施例

一、建立变压器进行故障诊断的集成学习分类模型;

数据集获取;通过在设备运维管理系统中获取133组变压器在正常和故障时的变压器油中气体组分作为样本数据,每组样本数据包含有甲烷、乙烯、乙烷、乙炔、氢气五种气体组分信息和其对应的变压器故障类型;

将133组样本数据分为训练集和测试集,按照7:3的比例分为93组训练数据和40组测试数据;

分别采用支持向量机、逻辑回归、最近邻分类、贝叶斯分类、决策树和随机森林对训练数据进行学习,得到故障诊断模型,利用测试数据对各个故障诊断模型进行模型验证,得到各个模型的识别结果如下:

分类器 识别正确个数 识别准确率
决策树 28 70%
支持向量机 36 90%
最近邻分类 31 77.5%
随机森林 36 90%
逻辑回归 32 80%
贝叶斯分类 30 75%

我们将决策树、支持向量机和随机森林作为基分类器采用vote集成学习形成新的集合分类器,采用多数投票法的方式输出故障识别结果如下:

分类器 识别正确个数 识别准确率
集成学习 37 92.5%

vote集成学习相对于单一的分类器,将同质分类器和异质分类器进行合并,其故障识别准确率得到提升,故障识别准确率为92.5%。

二、对未知的变压器故障进行故障类型识别

通过实际现场中油色谱在线监测装置采集的五种特征气体进行变压器故障诊断,诊断结果如下所示:

序号 氢气 甲烷 乙烯 乙烷 乙炔 预测故障 实际故障
1 14.3 1.78 0.38 0.43 0 中低温过热 中低温过热
2 124.25 17.13 1.99 6.51 0.32 低能量放电 低能量放电

第一组变压器的预测结果为中低温过热,通过实际的现场红外测温检测,发现主变本体下方连接处存在过热现场。第二组变压器的预测结果为低能量放电,通过对现场的变压器进行巡视检查,发现裸引线对套管导电管之间有放电的痕迹。

本发明通过对历史故障数据进行建模搭建故障诊断模型,可直接输入气体组分数据进行变压器的故障类型诊断识别。

对比例

采用支持向量机、随机森林对同样的训练数据进行学习训练,搭建变压器故障识别模型,采用测试数据进行验证,得变压器故障识别的准确率都为90%。采用集成学习对训练数据进行训练建立的模型,在测试集验证得到的识别准确率为92.5%,由此可见,集成学习在分类识别准确率上效果较好。

以上所述为本发明较佳实施例,对于本领域的普通技术人员而言,根据本发明的教导,在不脱离本发明的原理与精神的情况下,对实施方式所进行的改变、修改、替换和变型仍落入本发明的保护范围之内。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种根据声学参量分析灌浆质量设备及其使用方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!