一种改进型AdaBoost算法的电能表计量数据故障分析方法

文档序号:1241668 发布日期:2020-08-18 浏览:6次 >En<

阅读说明:本技术 一种改进型AdaBoost算法的电能表计量数据故障分析方法 (Electric energy meter metering data fault analysis method based on improved AdaBoost algorithm ) 是由 曹献炜 李建炜 常兴智 王娜 王再望 党政军 杨杰 屈子旭 李全堂 刘贵平 林福 于 2020-04-23 设计创作,主要内容包括:本发明公开一种改进型AdaBoost算法的电能表计量数据故障分析方法,涉及电能计量检测技术领域,解决的技术问题是传统技术中数据处理速度慢,数据管理方式滞后,应用效率低。本发明构建出包括计量检测层、数据传输层、数据融合计算层和数据应用层的四层架构,将物联网技术、大数据分析技术、数据通讯技术结合起来,实现了电能表计量检测故障数据的感测、传递、分析、计算以及上层数据的监测,使得电能管理用户能够远程、在线、实时监测电能表计量故障信息。本发明的智能化水平大大提高,处理数据的能力大大增强,能够在10s内对大量的多维度数据进行处理,有利于用户快速从错综复杂的多纬度数据信息中获取电能表检测信息。(The invention discloses an electric energy meter metering data fault analysis method based on an improved AdaBoost algorithm, relates to the technical field of electric energy metering detection, and solves the technical problems of low data processing speed, lagging data management mode and low application efficiency in the traditional technology. The electric energy meter metering detection fault data monitoring system constructs a four-layer framework comprising a metering detection layer, a data transmission layer, a data fusion calculation layer and a data application layer, combines the Internet of things technology, a big data analysis technology and a data communication technology, realizes sensing, transmission, analysis and calculation of electric energy meter metering detection fault data and monitoring of upper layer data, and enables an electric energy management user to monitor electric energy meter metering fault information remotely, online and in real time. The invention has the advantages of greatly improving the intelligent level, greatly enhancing the data processing capacity, processing a large amount of multidimensional data within 10s, and being beneficial to a user to quickly acquire the detection information of the electric energy meter from the complicated multi-latitude data information.)

一种改进型AdaBoost算法的电能表计量数据故障分析方法

技术领域

本发明涉及电能计量技术领域,且更具体地涉及一种改进型AdaBoost算法的电能表计量数据故障分析方法。

背景技术

随着人们生活水平的提高和工业的不断发展,人们对电能的依赖越来越突出,电力资源显得越来越重要。也正因为如此,企业运维管理人员的工作变得越来越复杂,智能电能表的计量故障也越来越多。智能电能表是电能计量的基础装置,供电企业抄核收工作是以电能表上的计量数据为依据,如果计量数据不准确,就会影响供电企业的整体效益。因此,运维管理人员需要对智能电能表的计量故障原因引起重视,并设法排除这些故障。维护配电网的稳定迫在眉睫,只有配电网稳定,才能保障人们的正常生活和工业的发展。

在实际应用中,引起电能表故障的因素有多种,诸如电网环境因素、人为因素、检测设备、智能电能表的外观结构、软硬件设置、内置继电器误动作、开关不稳定、触点不灵敏等,任意一个环节的不足,都会造成电能表计量误差的出现。在常规技术中,通常对电能表故障的诊断仅仅局限于对电能表硬件结构的改造,通过改造其外观结构及其接线方式,并对外置开关进行针对性的选择,进而控制电能表故障。这种方式虽然在一定程度上能够减少电能表故障的发生,但是由于引起电能表故障的因素很多,无法全面对电能表的故障因素进行分析,也无法从从计量检测数据中得出隐藏在宏观现象的本质联系。

发明内容

针对现有技术的不足,本发明公开了一种改进型AdaBoost算法的电能表计量数据故障分析方法,能够将电能表计量数据进行融合,实现多种不同类型数据的集中管理,并对融合后的数据信息按照故障特性进行分类,将分类后的数据通过AdaBoost算法模型实现故障分析。

为了解决上述技术问题,本发明采用以下技术方案:

一种改进型AdaBoost算法的电能表计量数据故障分析系统,所述系统包括:

计量检测层,其内至少设置有电能表检定装置、电能表检定流水线、传感器设备或电能表检定系统,用于检测电能表数据信息,其中所述电能表数据信息至少包括电流、电压、功率、振动或纹波,所述传感器设备至少包络电传感器、红外传感器、速度传感器、加速传感器、GIS传感器、振动传感器、纹波传感器、温湿度传感器、角度传感器、磁场传感器、转速传感器、RFID标签、GPS设备、射线辐射传感器、热敏传感器、能耗传感器或M2M终端;

数据传输层,其内至少设置有线通讯模块或无线通讯模块,用于接收并传递所述计量检测层检定或者感知的电能表数据信息;其中所述有线通讯模块至少包括RS485通讯模块、RS232通讯模块、红外通讯模块或载波通讯模块,所述无线通讯模块至少包括TCP/IP通讯模块、ZigBee无线通讯模块、GPRS通讯模块、CDMA无线通讯或蓝牙通讯模块;

数据融合计算层,其内至少设置有数据管理服务器,用于融合接收到的电能表数据信息,并对融合后的电能表数据信息进行计算、处理和传递;其中:所述数据管理服务器设置有USB接口、多信道接口、数据存储模块、数据诊断模块、数据显示模块、大数据融合计算模块、大数据分类算法模块和AdaBoost算法模块,其中所述多通道数据接口支撑至少两种以上的通讯数据类型;所述大数据融合计算模块的输出端与所述大数据分类算法模块的输入端连接,所述大数据分类算法模块的输出端与所述AdaBoost算法模块的输入端连接,所述AdaBoost算法模块的输出端与所述数据诊断模块的输入端连接,所述数据诊断模块的输出端与所述数据显示模块的输入端连接;

数据应用层,其内设置有数据库,用于存储、使用或传递所述数据融合计算层处理后的数据;并且所述数据库通过GPRS通信模块与中心管理计算机连接,其中:

所述计量检测层的输出端与所述数据传输层的输入端连接,所述数据传输层的输出端与数据融合计算层的输入端连接,所述数据融合计算层的输出端与数据应用层的输入端连接。

作为本发明进一步的技术方案,所述大数据融合计算模块、大数据分类算法模块和AdaBoost算法模块均设置有两个以上的I/O接口。

作为本发明进一步的技术方案,所述中心管理计算机为WindowsXP或WIN7平台多媒体计算机。

为了解决上述技术问题,本发明采用以下技术方案:

一种改进型AdaBoost算法的电能表计量数据故障分析方法:所述方法包括以下步骤:

(S1)数据获取;获取所述记录检测到的电能表数据信息;并对获取的电能表数据清洗和抽样,输出纯净的数据信息,实现电能表数据信息的预处理;

(S2)数据传递;通过有线通讯或无线通讯的方式接收并传递所述计量检测层检定或者感知的电能表数据信息;

(S3)数据处理;用于融合接收到的电能表数据信息,并对融合后的电能表数据信息进行计算、处理和传递;其中通过大数据融合计算模块对接收到的电能表数据信息进行数据融合,利用大数据分类算法模块对融合后的电能表数据信息进行分类,然后再利用AdaBoost算法模块对分类后的电能表数据信息进行诊断,输出诊断数据信息;

(S4)数据应用;用于存储、使用或传递所述数据融合计算层处理后的数据,供上层中心管理计算机查询、追溯或管理。

作为本发明进一步的技术方案,在所述步骤(S3)中,所述大数据融合计算方法为:从接收到的原始数据中筛选数据;并构建数据融合函数,构建方法为:假设存在数据集:其中;其中数据通讯的网络节点为,为网络节点时刻采集到的数据信息,则数据融合函数可以构建为:;其中

作为本发明进一步的技术方案,在所述步骤(S3)中,所述大数据分类算法模块为KNN算法,所述KNN算法分类的原理是在数据训练集中,通过输入测试数据,然后将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的分类类型,分为以下几个步骤:

(1)计算测试数据与各个训练数据之间的距离;距离公式为:

其中分别为数据集合中的两个不同的点,为数据集合的个数;

(2)按照距离的递增关系进行排序;

(3)选取距离最小的个训练集数据;确定前个点所在类别的出现频率;

(4)然后对训练样本进行聚类,得出个聚类个数,分别为;然后输出k个子簇;以任意一个子簇作为距离中心点,其它点到该距离中心点的距离集合为

(5)返回前个点中出现频率最高的类别便为测试数据的预测分类,其中将中的比例的倒数

作为距离权值,其中个值中的类别

个数分别为 ,计算加权后的个数中最大的值作为样本数据的预测类别,通过这种方式实现数据的分类。

作为本发明进一步的技术方案,所述的值的范围介于2.5-4.8之间。

作为本发明进一步的技术方案,在所述步骤(S3)中,所述AdaBoost算法模块进行电能表计量数据故障诊断的方法为:

(1) 初始化训练数据的权值分布:假设存在N个数据样本,在开始时,将每个训练的样本点都赋予相同的权重,假设权重为1/N,然后对该N个数据样本进行训练,生成第一个弱分类器;用公式表示为:;其中为第一个弱分类器,表示弱学习在强分类器中所占的比重,是所有之间的组合;

(2)对弱分类器进行训练;按照所述步骤(1)中的方法继续训练弱分类器,直到训练个弱分类器,其中,在进行样本训练过程中,假设精确地对第i个样本进行分类时,则在构造下一个训练集合时,将权重降低5%-12%;如果没有准确地对第个样本进行分类,则将权重提高5%-12%,然后,更新权值后的样本集被用于训练下一个分类器,通过这种方式迭代地进行整个训练过程;用公式表示为

(3)按照所述步骤(2)中的方法训练N个数据样本,

(4)将N个数据样本分别按照所述步骤(1)-(3)并行进行训练,最终训练成强分类器。

作为本发明进一步的技术方案,其中所述弱分类器的误差率低于5%。

作为本发明进一步的技术方案,其中所述强分类器的训练时间小于10s。

积极有益效果:

本发明构建出包括计量检测层、数据传输层、数据融合计算层和数据应用层的四层架构,将物联网技术、大数据技术以及数据通讯技术结合在一起,构建出检测系统架构体系,实现了电能表计量检测故障数据的感测、传递、分析、计算以及上层数据的监测,使得电能管理用户能够远程、在线、实时监测电能表计量故障信息。区别于常规技术,本发明的智能化水平比较高,处理数据的能力大大比较强,能够在10s内对大量的多维度数据进行处理,有利于用户快速从错综复杂的多纬度数据信息中获取电能表检测信息;

本发明能够将大数据融合计算模块、大数据分类算法模块和AdaBoost算法模块有机地融合在一起,构成改进型AdaBoost算法,并且能够对大量的数据信息进行分类、融合,便于集中管理不同纬度、不同类型的数据信息,从而有效地对不同属性的数据信息进行分类,实现大数据分类,有利于用户读取、追溯和管理分类后的数据,最终通过AdaBoost算法模型实现数据的故障分析,从而提高了电能表计量数据的管理能力。

附图说明

图1为本发明一种改进型AdaBoost算法的电能表计量数据故障分析系统的架构示意图;

图2为本发明一种改进型AdaBoost算法的电能表计量数据故障分析系统中数据管理服务器的结构示意图;

图3为本发明一种改进型AdaBoost算法的电能表计量数据故障分析系统中数据融合结构示意图;

图4为本发明一种改进型AdaBoost算法的电能表计量数据故障分析系统中大数据模型架构示意图;

图5为本发明一种改进型AdaBoost算法的电能表计量数据故障分析方法的流程示意图;

图6为本发明一种改进型AdaBoost算法的电能表计量数据故障分析方法中数据融合算法结构示意图;

图7为本发明一种改进型AdaBoost算法的电能表计量数据故障分析方法中AdaBoost算法结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1 系统

如图1-图4所示,一种改进型AdaBoost算法的电能表计量数据故障分析系统,所述系统包括:

计量检测层,其内至少设置有电能表检定装置、电能表检定流水线、传感器设备或电能表检定系统,用于检测电能表数据信息,其中所述电能表数据信息至少包括电流、电压、功率、振动或纹波,所述传感器设备至少包络电传感器、红外传感器、速度传感器、加速传感器、GIS传感器、振动传感器、纹波传感器、温湿度传感器、角度传感器、磁场传感器、转速传感器、RFID标签、GPS设备、射线辐射传感器、热敏传感器、能耗传感器或M2M终端;

数据传输层,其内至少设置有线通讯模块或无线通讯模块,用于接收并传递所述计量检测层检定或者感知的电能表数据信息;其中所述有线通讯模块至少包括RS485通讯模块、RS232通讯模块、红外通讯模块或载波通讯模块,所述无线通讯模块至少包括TCP/IP通讯模块、ZigBee无线通讯模块、GPRS通讯模块、CDMA无线通讯或蓝牙通讯模块;

数据融合计算层,其内至少设置有数据管理服务器,用于融合接收到的电能表数据信息,并对融合后的电能表数据信息进行计算、处理和传递;其中:所述数据管理服务器设置有USB接口、多信道接口、数据存储模块、数据诊断模块、数据显示模块、大数据融合计算模块、大数据分类算法模块和AdaBoost算法模块,其中所述多通道数据接口支撑至少两种以上的通讯数据类型;所述大数据融合计算模块的输出端与所述大数据分类算法模块的输入端连接,所述大数据分类算法模块的输出端与所述AdaBoost算法模块的输入端连接,所述AdaBoost算法模块的输出端与所述数据诊断模块的输入端连接,所述数据诊断模块的输出端与所述数据显示模块的输入端连接;

数据应用层,其内设置有数据库,用于存储、使用或传递所述数据融合计算层处理后的数据;并且所述数据库通过GPRS通信模块与中心管理计算机连接,其中:

所述计量检测层的输出端与所述数据传输层的输入端连接,所述数据传输层的输出端与数据融合计算层的输入端连接,所述数据融合计算层的输出端与数据应用层的输入端连接。

在上述实施例中,所述大数据融合计算模块、大数据分类算法模块和AdaBoost算法模块均设置有两个以上的I/O接口。

在上述实施例中,所述中心管理计算机为WindowsXP或WIN7平台多媒体计算机,通过这种方式能够对电能表上传数据进行集中管理。

通过上述技术方案,构建出包括计量检测层、数据传输层、数据融合计算层和数据应用层的四层架构,将物联网技术、大数据技术以及数据通讯技术结合在一起,构建出检测系统架构体系,实现了电能表计量检测故障数据的感测、传递、分析、计算以及上层数据的监测,使得电能管理用户能够远程、在线、实时监测电能表计量故障信息。区别于常规技术,本发明的智能化水平比较高,处理数据的能力大大比较强,能够在10s内对大量的多维度数据进行处理,有利于用户快速从错综复杂的多纬度数据信息中获取电能表检测信息。

实施例2 方法

如图5-图7所示,一种改进型AdaBoost算法的电能表计量数据故障分析方法:所述方法包括以下步骤:

(S1)数据获取;获取所述记录检测到的电能表数据信息;并对获取的电能表数据清洗和抽样,输出纯净的数据信息,实现电能表数据信息的预处理;

在该步骤中,主要通过多途径、多角度、多方式地获取多纬度数据,数据类型可以包括多种形式的数据,比如图像、文字、声音、视频等多种数据类型。由于数据信息参差不齐,在这些数据类型中筛选有用的数据信息,便于后续的应用和管理。

(S2)数据传递;通过有线通讯或无线通讯的方式接收并传递所述计量检测层检定或者感知的电能表数据信息;

在该步骤中,主要实现数据的传输,在数据进行通讯时,通过红外通讯能够实现非接触数据通讯,所以一般采用红外光调制/解调来提高抗干扰度。红外通讯的主要特点是没有电气连接、通讯距离短,所以主要用于电能表现场的抄录、设置。采用的有线通讯方式主要包括RS-232接口通讯、RS-422接口通讯、RS-485接口通讯等。采用的无线通讯包括有无线数传电台通讯、GPRS、GSM通讯等。使用GPRS或GSM网络通讯,还可以充分地利用无线移动网络广阔的覆盖范围,建立安全、可靠的通讯网络。还有一种通讯方式为采用电力载波通讯,其中电力载波通讯是通过220V电力线进行数据传输的一种通讯方式。在载波电能表内部,除了有精确的电能计量电路以外,还需有载波通讯电路。它的功能是将通讯数据调制到电力线上。常见的调制方式有FSK、ASK和PSK。在具体实施例中,不局限于这种通讯方式。

(S3)数据处理;用于融合接收到的电能表数据信息,并对融合后的电能表数据信息进行计算、处理和传递;其中通过大数据融合计算模块对接收到的电能表数据信息进行数据融合,利用大数据分类算法模块对融合后的电能表数据信息进行分类,然后再利用AdaBoost算法模块对分类后的电能表数据信息进行诊断,输出诊断数据信息;下面对各个算法进行说明:

(一)大数据融合计算方法

大数据融合计算方法为:从接收到的原始数据中筛选数据;并构建数据融合函数,构建方法为:假设存在数据集:其中;其中数据通讯的网络节点为,为网络节点时刻采集到的数据信息,则数据融合函数可以构建为: ;其中

在一种实施例中,在进行数据融合时,为了提高学习精度,还采用了的小波去噪技术,在进行小波去噪时,将接收到的数据信号分解成不同频率的信号,然后计算每层的小波分解系数,然后再设定各层小波的阈值,比如介于2-200之间的阈值,然后再将各层信号与阈值进行比较,然后进行小波重构,得到去除后的噪声信号,然后再采用小波去噪效果质量进行评价,本发明采用均方根误差表示去噪效果,用公式表示为:

其中表示原始信号,表示去噪后的信号,该公式计算出的值越小,表示去噪的效果越好。

通过数据融合,并且能够对大量的数据信息进行分类、融合,便于集中管理不同纬度、不同类型的数据信息。

(二)KNN算法

在本步骤中,所述大数据分类算法模块为KNN算法,所述KNN算法分类的原理是在数据训练集中,通过输入测试数据,然后将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的分类类型,分为以下几个步骤:

(1)计算测试数据与各个训练数据之间的距离;距离公式为:

;

其中分别为数据集合中的两个不同的点,为数据集合的个数;

(2)按照距离的递增关系进行排序;

(3)选取距离最小的个训练集数据;确定前个点所在类别的出现频率;

(4)然后对训练样本进行聚类,得出个聚类个数,分别为;然后输出k个子簇;以任意一个子簇作为距离中心点,其它点到该距离中心点的距离集合为

(5)返回前个点中出现频率最高的类别便为测试数据的预测分类,其中将中的比例的倒数

作为距离权值,其中个值中的类别

个数分别为 ,计算加权后的个数中最大的值作为样本数据的预测类别,通过这种方式实现数据的分类。

在上述实施例中,所述的值的范围介于2.5-4.8之间。

在上述实施例中,值设置过小会降低分类精度;若设置过大,且测试样本属于训练集中包含数据较少的类,则会增加噪声,降低分类效果。在一种实施例中,的值取3。

在进行距离计算时,还可以采用曼哈顿距离、欧式距离和闵可夫斯基距离。其采用的公式为:

在上述公式中,当p=1时,称为曼哈顿距离(Manhattan distance),当p=2时,称为欧式距离(Euclidean distance),当当p=∞时,为闵可夫斯基距离。

(三)AdaBoost算法

在本步骤中,所述AdaBoost算法模块进行电能表计量数据故障诊断的方法为:

(1) 初始化训练数据的权值分布:假设存在N个数据样本,在开始时,将每个训练的样本点都赋予相同的权重,假设权重为1/N,然后对该N个数据样本进行训练,生成第一个弱分类器;用公式表示为:;其中为第一个弱分类器,表示弱学习在强分类器中所占的比重,是所有之间的组合;

(2)对弱分类器进行训练;按照所述步骤(1)中的方法继续训练弱分类器,直到训练个弱分类器,其中,在进行样本训练过程中,假设精确地对第i个样本进行分类时,则在构造下一个训练集合时,将权重降低5%-12%;如果没有准确地对第个样本进行分类,则将权重提高5%-12%,然后,更新权值后的样本集被用于训练下一个分类器,通过这种方式迭代地进行整个训练过程;用公式表示为

(3)按照所述步骤(2)中的方法训练N个数据样本,

(4)将N个数据样本分别按照所述步骤(1)-(3)并行进行训练,最终训练成强分类器。

在上述实施例中,所述弱分类器的误差率低于5%。

在上述实施例中,所述强分类器的训练时间小于10s。

下面结合具体实施例对上述算法做进一步的说明。

假设在输入的电能表计量数据中,包括电流、电压、功率、振动、纹波以及电网不稳定数据信息类型等,训练的数据集,其中,然后输出分类器为

首先,初始化训练数据的权值分布:

其次,对于;然后使用具有权值分布的训练数据集进行学习,得到基本分类器,然后计算电能表计量数据训练集上的最大误差

然后,再计算每个样本的相对误差,

当选择的电能表计量数据是线性误差时,则利用公式:

如果选择的电能表计量数据是平方误差时,则利用公式:

如果选择的电能表计量数据是指数误差时,则利用公式:

然后,再计算回归误差率:

计算弱学习器的系数,则有:

更新样本集的权重分布为:

其中是规范化因子,则有:

最后构建基本分类器的线性组合,则有:

是所有的中位数值对应序号k对应的弱学习器。

为了防止Adaboost过拟合,在具体应用过程中,通常也会加入正则化项,这个正则化项我们通常称为步长(learning rate)。定义为

则有

其中的取值范围为。对于同样的训练集学习效果,较小的ν意味着我们需要更多的弱学习器的迭代次数。通常我们用步长和迭代最大次数一起来决定算法的拟合效果。通过这种方式,大大提高了数据管理能力。

(S4)数据应用;用于存储、使用或传递所述数据融合计算层处理后的数据,供上层中心管理计算机查询、追溯或管理。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种负荷辨识电能表检测平台

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!