基于MRMR的集合经验模态分解和支持向量机的风电功率实时预测

2017-05-12 08:43李国庆张明江张礼珏
东北电力大学学报 2017年2期
关键词:互信息电功率风电场

李国庆,张 钰,张明江,张礼珏

(1.东北电力大学 电气工程学院,吉林 吉林 132012;2.国网黑龙江省电力科学研究院,黑龙江 哈尔滨 150030)



基于MRMR的集合经验模态分解和支持向量机的风电功率实时预测

李国庆1,张 钰1,张明江2,张礼珏1

(1.东北电力大学 电气工程学院,吉林 吉林 132012;2.国网黑龙江省电力科学研究院,黑龙江 哈尔滨 150030)

风电场的输出功率对风能的利用有很大意义,准确地对风电功率进行预测可以使系统安全稳定的运行。先分析得出与功率有关的变量,根据最大相关最小冗余(MRMR)原则筛选得出特征,使该特征能够代替整个风场。由于风电功率时间序列的非平稳性等特征,对风电功率时间序列采用集合经验模态分解,然后建立支持向量机预测模型。通过算例验证分析说明该方法的有效性,可以提高预测精度,减小误差。

风电功率;实时预测;最大相关最小冗余;集合经验模态分解;支持向量机

风力发电的发展越来越受大家的重视,但是大规模风电接入电网可能会对系统的电能质量,包括电压、频率、相角产生很大的影响,所以风电功率预测的准确性很重要[1-2]。常用的风电功率预测方法主要分为:物理方法[3]和统计方法[4]。物理方法是指不需要大量的历史数据,但要根据风电场所处的地理位置来进行研究分析;统计方法是指需要大量的历史数据来对模型训练,对数据的完整性要求较高。常用的统计方法主要包括:持续法[5]、卡尔曼滤波法[6]、时间序列法[7]、神经网络法[8]、模糊逻辑法[9]、支持向量机法(SVM)[10]等。

特征选择法作为一种重要的数据预处理方法,通过对高维数据降维处理,可以从原始数据集中提取出一个有效子集,该子集既能很好的保留原始数据集的有效信息又能减小复杂的冗余信息。采用集合经验模态分解(EEMD)可以对原始数据进行滤波,使之变成一组平稳序列,降低原始数据的复杂性。而支持向量机法是近年来风电功率预测常采用的方法,该模型可以用来处理高维数据,避免了交叉检验的盲目性试探,并且通过二次规划来求解可以提高建模效率。

1 特征选取

1.1 风电功率的影响因素

由空气动力学理论[11]可知,风力发电所得到输出功率Pm的表达式为

Pm=0.5ρsv3Cp(λ,β) ,

(1)

式中:Pm为发电机的输出功率,单位kW;ρ为空气密度,单位kg/m3;s为风轮扫过的面积,单位m2;v为风速,单位m/s;Cp(λ,β)为风能利用系数;λ为叶尖比;β为风轮桨距角。

其中:

(2)

(3)

(4)

式中:R为风轮半径,单位m;ω为风轮转速,单位rad/s。

由公式(1)-公式(4)可以得出:风力发电的输出功率P主要与风速v、转速ω、桨距角β有关。

1.2 互信息理论

互信息是指两个随机变量之间的相关度,设系统输出Y的概率为P(y),那么系统输出的初始不确定度的熵表示为:

(5)

当系统输入X时,系统输出的不确定度的条件熵为:

(6)

变量X与Y之间的互信息I(X,Y)表示为:

(7)

(8)

式中:PXY(x,y)为X、Y的联合概率值。

1.3 最大相关最小冗余算法

最大相关最小冗余(Minimal Redundancy Maximal Relevance,MRMR)算法[12]根据互信息评价特征的相关性和冗余度,其表达式为

(9)

(10)

式中:S为特征构成的子集;n为特征个数;I(xi,p)为风速(或转速、桨距角)与功率p之间的互信息;I(xi,xj)为变量xi(风速、转速或桨距角)和xj(风速、转速或桨距角)之间的互信息。

结合公式(9)、公式(10)得出特征满足最大相关最小冗余的条件为

(11)

2 集合经验模态分解

集合经验模态分解(EEMD)是一种对传统经验模态分解(EMD)的滤波筛选方法。在经验模态分解(EMD)之前加入不同幅值的高斯白噪声信号,根据高斯白噪声序列可以抵消的原理,使其接近真实序列。将分解后得到的固有模态分量(IMF)的均值看作是真实分量。每个固有模态分量需要同时满足以下两种情况:信号的零点数和极值点数至多相差一个;局部极小值点和极大值点定义的包络线的均值为零。集合经验模态可以把信号分解成若干个不同频率不同幅值的IMF分量。

3 支持向量机

支持向量机(SVM)是通过某种事先选择的非线性映射,把输入的向量x映射到高维的特征空间M中,然后根据结构风险最小化原则在这个特征空间进行回归分析[12]。假设有l个训练样本集:(xi,yi),i=1,2,…,l;xi∈R;yi∈R。在高维特征空间中构造回归函数:

y(x)=ωφ(x)+b,

(12)

式中:ω为权值向量;φ(x)为非线性映射;b为常数。

根据结构风险最小化原则[13-14],将回归问题转化成优化问题,然后引入拉格朗日乘子将凸二次规划问题转化成对偶问题求解,解出拉格朗日乘子后,得出回归函数表示为:

(13)

4 风电功率实时预测

根据国家能源局《风电场功率预测预报管理暂行办法》[15]的规定,风电功率实时预测是指自预测时刻起对未来15分钟至4小时的风电功率进行预测,采样的时间间隔为15分钟,一次预测的数据为16个,由此可知风电功率实时预测为超短期多步预测。

风电功率预测时,一般假设当前时刻记为t,采样间隔记为t*,已知建模域风电功率的实际值为y(t-nt*),n=0,1,2,…,N,建模域的历史数据个数为N+1个,预测值为y(t+mt*),m=1,2,…,M,M为多步预测的步数,令yG(t+mt*)为滚动多步预测时的风电功率预测值,则滚动多步预测的预测值可以表示为[16]:

图1 整场风电功率输出功率

(14)

式中:f为所选预测方法对应的映射关系。

5 算例验证

本文以吉林省某风电场2014年7月的实测数据

为例进行分析。该风电场的装机容量为33MW,风机数量为20台,单台风机的额定容量为1 500kW,数据采样间隔为15分钟。由图1可以看出,整场20台机组连续32天的输出功率。横坐标代表每间隔15分钟采集一个数据点,一共采集了32天,纵坐标代表每次对应的风电场整场的输出功率。由图1得出最大、最小功率分别为31 148kW和-10kW,发现功率的波动性比较大。

5.1 特征选取

该风电场共有20台风机,文中采用最大相关最小冗余算法对特征筛选,选出一台最能代表整个风电场的风机来预测。由表1可以看出,20台风机各变量与整场功率之间的互信息。可以看出,5号风机的互信息总和是最大的,11号风机的互信息总和是最小的,13号风机的互信息总和是平均值,所以选取5号风机作为特征,代替整场的风电功率。

表1 各台风机变量与整场功率的互信息

5.2 建立集合经验模态分解模型

集合经验模态的分解过程实际上是一个对波形的筛选叠加过程。由图2可以看出,192个功率数据点经过EEMD分解后的各个子序列。将添加的随机噪声序列设置为100组,每组随机噪声序列的标准差均设为0.2。图2可以看出:分解得到的子序列的频率是从高到低依次排列的,振幅越低频率越低。对图中子序列的分析可以看出:IMF1~IMF4为高频分量;IMF5为周期分量;rest为单调递升的剩余分量。

图2 基于EEMD分解的风电功率图3 EEMD分解后功率的绝对误差

图4 时间间隔为4小时各风机的预测结果

由图3可以看出,从上到下依次显示了原始序列的风电功率、EEMD分解得到的风电功率以及分解前后功率的绝对误差。可以看出误差的数量级达到了-13,说明可以用分解后的序列代替原序列。

5.3 建立支持向量机预测模型

5.3.1 特征对预测结果的影响

由图4可以看出:5号、11号和13号机组在7月8日的第16次预测中(全天共预测96次,每次预测16个点),采用前288个数据点的风电功率作为训练集样本,得到的4小时的预测结果。可以看出:5号风机的预测结果是最接近实际功率的,11号和13号风机都没有5号的预测效果好。

表2 不同时间间隔各风机的评价指标

由表2可以看出,三台风机分别在时间间隔为4小时和24小时的预测结果评价指标。结果显示5号风机的准确率是最高的,均方根误差是最小的,所以说明特征的选择对预测结果有很大影响。

图5 不同预测模型的预测结果

5.3.2 预测模型对预测结果的影响

由图5可以看出,不同预测模型对预测结果的影响,将持续法作为一种衡量标准,分别对EEMD-SVM和SVM预测。EEMD-SVM先对序列分解,得到一系列平稳序列后,再分别对每一序列建立支持向量机预测模型。图5可以看出分解后的预测模型较未分解的预测结果要平稳的多,准确的多。表3显示:三种预测结果分别在时间间隔为4小时和24小时的评价指标。结果表明:EEMD-SVM在不同时间间隔的预测结果都明显是最好的,较SVM准确率提高了1%左右,而持续法在时间间隔为24小时时,预测结果下降了很多,说明持续法只能在短时间间隔内能维持较高的准确率。

表3 不同时间间隔各预测模型的评价指标

6 结 论

本文提出了基于最大相关最小冗余算法的集合经验模态分解和支持向量机的风电功率实时预测,该方法对风电功率的实时预测提供了很大价值。文中以吉林省某电场为例,分析得出到以下结论:

(1)特征的选取对风电功率的预测有很大影响,正确地选取特征对风电功率预测的准确性至关重要;

(2)采用集合经验模态分解(EEMD)对时间序列进行滤波筛选得到平稳序列后,可以提高模型的预测精度;

(3)采用支持向量机建立模型时,可以处理高维数据,避免了基于交叉检验的试探盲目性,使建模效率提高,具有良好的泛化能力。

[1] 陈艳,陈超,刘显旭,等.基于不确定度评定的风电功率预测误差研究[J].电力与能源,2015,36(4):491-495.

[2] 段学伟,王瑞琪,王昭鑫,等.风速及风电功率预测研究综述[J].山东电力技术,2015,42(7):26-32.

[3] 王丹,孙昶辉.风电场发电量计算的物理模型[J].中国电力,2011,44(1):94-97.

[4] A.Sfetsos.A comparison of various forecasting techniques applied to mean hourly wind speed time series[J].Renewable Energy,2000,21(1):23-35.

[5] 韩爽,杨勇平,刘永前.三种方法在风速预测中的应用研究[J].华北电力大学学报:自然科学版,2008,35(3):57-61.

[6] 潘迪夫,刘辉,李燕飞.基于时间序列分析和卡尔曼滤波算法的风电场风速预测优化模型[J].电网技术,2008,32(7):82-86.

[7] 邵璠,孙育河,梁岚珍.基于时间序列法的风电场风速预测研究[J].华东电力,2008,36(7):26-29.

[8] L.Xingpei,L.Yibing,X.Weidong.Wind speed prediction based on genetic neural network[C]//Industrial Electronics and Applications,2009.ICIEA 2009.4th IEEE Conference on.IEEE,2009:2448-2451.

[9] W.Xiaolan,L.Hui.One-month ahead prediction of wind speed and output power based on EMD and LSSVM[C]//Energy and Environment Technology,2009.ICEET'09.International Conference on.IEEE,2009,3:439-442.

[10] X.Yang,Y.Cui,H.Zhang,et al.Research on Modeling of Wind Turbine based on LS-SVM[C]//Sustainable Power Generation and Supply,2009.SUPERGEN'09.International Conference on.IEEE,2009:1-6.

[11] 叶杭冶.风力发电机组的控制技术[M].北京:机械工业出版社,2002.

[12] 曹静.基于最大相关最小冗余的特征选择算法研究[D].秦皇岛:燕山大学,2010.

[13] 杨茂,马秀达,温道扬,等.风电功率预测研究综述[J].电测与仪表,2013,50(7):7-10.

[14] 杨茂,刘红柳.基于小波变换和支持向量机的风电功率爬坡事件识别与预测[J].东北电力大学学报,2016,36(6):30-35.

[15] 国家能源局.风电场功率预测预报管理暂行办法[S].北京:国家能源局,2011.

[16] 严干贵,王东,杨茂,等.两种风电功率多步预测方式的分析及评价[J].东北电力大学学报,2013,33(1):126-130.

The Wind Power Real-Time Diction on the EEMD and SVM of the MRMR

Li Guoqing,Zhang Yu,Zhang Mingjiang,Zhang Lijue

(1.Electrical Engineering College,Northeast Electric Power University,Jilin Jilin 132012;2.Heilongjiang Electric PowerResearch Institute,Harbin Heilongjiang 150030)

The output power of wind farm is of great significance to the use of wind power,accurately forecast wind power can make the system safe and stable operation.In this paper,we first analyzed variables related to the power,according to the principle of maximum correlation minimum redundancy (MRMR) filter characteristics,make the characteristic can replace the whole wind field.Due to the non-stationary characteristics of wind power time series,this paper will set of empirical mode decomposition (EEMD) and support vector machine (SVM) model is introduced into the real-time prediction of wind power.First using time series of wind power collection of empirical mode decomposition and not be a smooth time series is decomposed into stationary sequence,can improve the prediction accuracy.Finally,Each subsequence based support vector machine forecasting model and will receive the stacking sequence prediction results.By using the method of this paper a wind farm in Jilin province for example,the results show that the method can improve the prediction precision,reduce errors.

Wind power;Real-time prediction;Minimal redundancy maximal relevance;Ensemble empirical mode decomposition;Support vector machine

2016-07-06

吉林市科技局杰出青年人才培养计划(20156407)

李国庆( 1963-),男,博士,教授,主要研究方向:电力系统安全性和稳定性分析、控制与决策、配电系统自动化.

1005-2992(2017)02-0039-06

TM614

A

电子邮箱: 51296150@qq.com(李国庆);191601980@qq.com(张钰);672721879@qq.com(张明江);546381684@qq.com(张礼珏)

猜你喜欢
互信息电功率风电场
基于PCC-CNN-GRU的短期风电功率预测
轻松上手电功率
你会计算电功率吗
解读电功率
基于PSS/E的风电场建模与动态分析
巴基斯坦风电场环网柜设计
基于改进互信息和邻接熵的微博新词发现方法
含风电场电力系统的潮流计算
基于互信息的贝叶斯网络结构学习
海上风电场工程220KV海底电缆敷设施工简介