基于风能利用系数与多元多项式回归的风力机功率预测方法

文档序号:1918341 发布日期:2021-12-03 浏览:1次 >En<

阅读说明:本技术 基于风能利用系数与多元多项式回归的风力机功率预测方法 (Wind turbine power prediction method based on wind energy utilization coefficient and multivariate polynomial regression ) 是由 黄佳颖 牛王强 杨华建 江佳腾 张炜婷 王晓彤 于 2021-09-07 设计创作,主要内容包括:本发明涉及一种基于风能利用系数与多元多项式回归的风力机功率预测方法,使用风能利用系数来选择影响风机输出功率的变量,通过多元多项式的方法来建模变量与风机输出功率的关系,以达到功率预测的目的。本方法采用风能利用系数来选择影响风机输出功率的变量,减少了专家分析影响因素的困难。本方法利用风机特性曲线对风机运行状态分段,使模型更具有物理意义。本方法采用多元多项式回归模型对风机输出功率进行预测,具有较高的准确率和较低的模型复杂度。(The invention relates to a wind turbine power prediction method based on wind energy utilization coefficient and multivariate polynomial regression. The method adopts the wind energy utilization coefficient to select the variable influencing the output power of the fan, thereby reducing the difficulty of analyzing the influencing factors by experts. The method segments the running state of the fan by utilizing the fan characteristic curve, so that the model has more physical significance. The method adopts a multivariate polynomial regression model to predict the output power of the fan, and has higher accuracy and lower model complexity.)

基于风能利用系数与多元多项式回归的风力机功率预测方法

技术领域

本发明属于新能源领域,更具体地,涉及一种基于风能利用系数与多元多项式回归的风力机功率预测方法。

背景技术

化石燃料储量的减少与能源需求的稳步上升给世界带来了新的难题。风能是可再生能源,也是清洁能源,风力发电是风能的主要使用方式。功率曲线是风电机组对输入风能的利用效率和机组整体发电性能优劣的直接反映,体现了在轮毂高度测量的不同风速下风力机的输出功率水平。对风电机组功率曲线进行建模和监测能够及时发现风电机组的运行异常和早期故障,提高机组的可利用率,降低机组维护费用。通常,风电功率预测方法是使用制造商提供的风机功率曲线模型。但是,这条曲线没有考虑到风力机的具体安装位置以及运行后的磨损情况,理论风电数据与实际数据之间的差异会导致附加误差。功率曲线建模使用了许多不同的技术:IEC61400-12标准中给出的“bin”方法、参数函数、逻辑回归模型等。但是传统的风速-功率曲线只显示功率与风速的关系,没有考虑其他影响因素,例如风向,转子速度和桨距角等,具有一定的局限性。

目前,预测风机输出功率的多变量回归模型主要有人工神经网络模型、高斯过程模型等。上述多变量模型的输入特征主要是通过专家对风机运行特性的分析得出的,但是影响风机功率的因素在不同的风电场环境中是不同的。此外,人工神经网络模型的训练过程通常要花费很多时间,在模型的透明度和解释性上有一定的局限性。

发明内容

本发明的目的是基于风机SCADA数据,采用风能利用系数与多元多项式回归来预测风机输出功率。

实现本发明目的的技术解决方案为:

一种基于风能利用系数与多元多项式回归的风力机功率预测方法,包括以下步骤:

步骤1,对SCADA采样数据集D0以风速、叶片转速、桨距角以及功率作为特征提取出来,组成数据集D1。

步骤2,根据风机特性曲线将风力发电机的运行过程分为恒功率、恒转速、最大功率点跟踪三个阶段。以风速作为分割线,将采样数据集D1分割成三部分,为D11,即风速大于等于额定风速,D12,即风速大于等于额定转速风速且小于额定风速,和D13,即风速小于额定转速风速,表示风机所处的三种状态。对数据集D11按一定比例分为两组数据,记为D11-1和D11-2;对数据集D12按一定比例分为两组数据,记为D12-1和D12-2;对数据集D13按一定比例分为两组数据,记为D13-1和D13-2。D11-1,D12-1和D13-1作为训练集,即建模样本;D11-2,D12-2和D13-2作为验证集,即预测样本。

步骤3,根据风机理论基础,将风能利用系数Cp作为功率建模的中间变量。风机的桨叶具有空气动力学形状,使风轮绕其轴转动,可将风能转化为机械能。气动方程计算如下:

式中,Pw是可利用的空气动能;ρ是空气密度;R是叶片半径;v是风速。理想情况下,风力发电机从风能中获取的功率可表示为:

式中,Cp(λ,θ)是风能利用系数;λ是叶尖速比,是叶尖线速度与风速的比值;θ是桨距角;ω是叶片角速度。Cp(λ,θ)是关于叶尖速比λ和桨距角θ的非线性函数,表示为:

式中,C1-C9为功率参数,由风力发电机的类型决定。利用实际输出功率P和风速v可以计算出实际风能利用系数Cp

步骤4,分别对恒功率段数据集D11-1,恒转速段数据集D12-1和最大功率点跟踪段数据集D13-1建立多元多项式模型:

数据集D11-1:

采用多元多项式回归模型,将风能利用系数Cp(λ,θ)表示为叶尖速比λ和桨距角θ的m1阶多项式,如下式:

y=∑aijx1 ix2 j

式中,y表示风能利用系数Cp,x1表示叶尖速比λ,x2表示桨距角,aij表示系数,其中i,j=0,1,2,…,m1;i+j≤m1。采用最小二乘法找到使得代价函数J最小的阶次m1和参数aij,使得多项式模型的精度达到最高。代价函数为:

式中,N是样本数量,和yi分别是风能利用系数Cp的预测值和实际值。

合适的m1值是使模型预测的均方根误差RMSE最小对应的阶数,公式如下:

式中,N为验证样本个数;yi为验证样本风能利用系数Cp实际值;是多项式模型Cp预测值。

数据集D12-1:

由于风机处于恒转速阶段,认为转速恒为额定转速,用λ′表征此状态下风机的叶尖速比:

其中转速nN取额定转速。

同样采用多元多项式回归模型,将风能利用系数Cp(λ,θ)表示为叶尖速比λ′和桨距角θ的m2阶多项式,也用最小二乘法找到最佳阶次m2和参数aij,合适的m2值是使模型预测的RMSE最小对应的阶数。

数据集D13-1:

考虑到低风速时由于变桨距控制技术风机桨距角变化极小,对该数据集建立风能利用系数Cp关于叶尖速比λ的一元多项式模型,经最小二乘拟合找到多项式的最佳阶次m3和参数aij,合适的m3值是使模型预测的RMSE最小对应的阶数。

步骤5,利用步骤4中数据集D11-1,D12-1和D13-1建立好的风能利用系数Cp多项式模型,在验证数据集D11-2,D12-2和D13-2上进行风机输出功率预测,功率表达式为:

式中,为风能利用系数Cp的预测值。

附图说明

图1为本发明风机运行状态风速-功率曲线示意图。

图2为本发明风机运行状态风速-转速曲线示意图。

图3为本发明风机运行状态转速-功率曲线示意图。

图4为本发明恒功率段均方根误差随多项式阶次变化关系示意图。

图5为本发明恒转速段均方根误差随多项式阶次变化关系示意图。

图6为本发明最大功率点跟踪段均方根误差随多项式阶次变化关系示意图。

图7为本发明多元多项式回归建模流程示意图。

图8为本发明SCADA验证数据上预测时间-功率曲线示意图。

图9为本发明SCADA验证数据上预测风速-功率散点示意图。

具体实施方式

基于多元多项式回归和最大信息系数的风机输出功率预测,包括以下步骤:

S1、对SCADA采样数据集D0将风速、叶片转速、桨距角以及功率作为特征提取出来,组成数据集,记为D1。某台风力发电机为例,额定功率为2MW,SCADA采样时间为60s,共5915条记录D0。该风机额定风速为14m/s,额定转速风速为8.5m/s,额定转速为15.1rpm,叶片直径105m,空气密度取1.25kg/m3。对5915条记录D0以风速、叶片转速、桨距角以及功率作为特征变量提取,组成数据集D1。

S2、根据风机特性曲线将风力发电机的运行状态分为恒功率AB、恒转速BC、最大功率点跟踪CD三个阶段,如图1-图3所示。图1是风速-功率曲线。图2是风速-转速曲线。图3是转速-功率曲线。以风速作为分割线,将数据集D1分为三部分。处于恒功率阶段的数据集D11共2675条,即风速大于等于额定风速;处于恒转速阶段的数据集D12共2481条,即风速大于等于额定转速风速且小于额定风速;处于最大功率点跟踪阶段的数据集D13共759条,即风速小于额定转速风速,表示风机所处的三种状态。将数据集D11分为D11-1共2275条,和D11-2共400条;D12分为D12-1共2131条,和D12-2共350条;D13分为D13-1共609条和D13-2共150条。数据集D11-1,D12-1和D13-1作为训练集;D11-2,D12-2和D13-2作为验证集。

S3、分别对恒功率段数据集D11-1,恒转速段数据集D12-1和最大功率点跟踪段数据集D13-1建立多元多项式模型:

恒功率段:

在数据集D11-1上训练多元多项式回归模型,将预测量表示为叶尖速比λ和桨距角θ的m1阶多项式,如下式:

y=∑aijx1 ix2 j

式中,y表示风能利用系数Cp,x1表示叶尖速比λ,x2表示桨距角,aij表示系数,其中i,j=0,1,2,…,m1;i+j≤m1。采用最小二乘法找到使得代价函数J最小的阶次m1和参数aij,使得多项式模型的精度达到最高。代价函数为:

式中,N是样本数量,和yi分别是风能利用系数Cp的预测值和实际值。

进一步地,均方根误差RMSE公式如下:

式中,N为验证样本个数;yi为验证样本风能利用系数Cp实际值;是多项式模型Cp预测值。训练过程RMSE随阶数m1变化如图4所示。当多项式阶次m1从1变化到2时,模型的RMSE迅速减小后几乎不发生变化。当m1=2时,训练样本D11-1的RMSE为0.0037,验证样本D11-2的RMSE为0.0022,此时模型是最佳的,确定适当的m1值为2。建立好的风能利用系数Cp模型为:

式中,y表示风能利用系数Cp的预测值,x1表示叶尖速比λ,x2表示桨距角θ。

恒转速段:

由于风机处于恒转速阶段,认为转速恒为额定转速,该状态下叶尖速比λ′为:

其中转速nN取额定转速。

将风能利用系数Cp(λ,θ)表示为叶尖速比λ′和桨距角θ的m2阶多项式,也用最小二乘法找到最佳阶次m2和参数aij。合适的m2值是使模型预测的RMSE最小对应的阶数。训练过程中RMSE随阶数m2变化如图5所示。训练样本D12-1和测试样本D12-2的RMSE随多项式阶次增大先增大后减小,当多项式阶次大于5时,模型出现过拟合的现象。因此当阶次m2=5时,模型效果最好,训练样本的RMSE为0.0215,验证样本的RMSE为0.0344。建立好的风能利用系数Cp模型为:

式中,y表示风能利用系数Cp预测值,x1表示叶尖速比λ′,x2表示桨距角θ。

最大功率点跟踪段:

考虑到低风速时由于变桨距控制技术,风机的桨距角变化极小,在数据集D13-1上建立风能利用系数Cp关于叶尖速比λ的一元多项式模型,经最小二乘拟合找到多项式的最佳阶次m3和参数aij,合适的m3值是使模型预测的RMSE最小对应的阶数。训练过程中RMSE随阶数m3变化如图6所示。当多项式阶次m3=3时,验证样本D13-2的RMSE最低,为0.0107。建立好的风能利用系数Cp模型为:

y=2.9798-0.9899x+0.1091x2-0.37·10-2x3

式中,y表示风能利用系数Cp预测值,x表示叶尖速比λ。

S4、利用S3建立好的风能利用系数Cp多项式模型,在验证数据集D11-2,D12-2和D13-2上进行风机输出功率预测,功率表达式为:

式中,为预测功率值。上述具体建立多元多项式回归模型的步骤如图7所示。结果如图8和图9所示。图8是测试集上预测时间-功率图,实线表示实际的SCADA数据,虚线表示预测值。图9是测试集上预测风速-功率散点图,圆圈表示真实数据值,加号表示预测值。预测结果显示风速和功率呈“带状”关系。从两个图中可以看出,该模型可以预测大多数功率值。

该验证数据预测值的平均绝对百分比误差MAPE为6.29%,公式如下:

式中N是验证集总数量,yi是验证样本的实际输出功率,是模型功率预测值。

本发明优点如下:

1)本发明采用风能利用系数来选择影响风机输出功率的变量,减少了专家分析影响因素的困难。

2)本发明在风机输出功率预测方面具有较高的准确率和较低的模型复杂度。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:风力发电机组塔顶位移实时监测方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!