用于风电功率预测的RPCL优化神经网络模型

2016-10-19 02:22苏义鑫夏慧雯
北京工业大学学报 2016年5期
关键词:电功率均值聚类

苏义鑫, 夏慧雯

(武汉理工大学自动化学院, 武汉 430070)



用于风电功率预测的RPCL优化神经网络模型

苏义鑫, 夏慧雯

(武汉理工大学自动化学院, 武汉430070)

为了提高风电功率预测的准确度,提出了一种基于对手竞争惩罚学习算法(rival penalized competitive learning,RPCL)优化径向基函数(radial basis function,RBF)神经网络的风电功率预测模型. 首先通过RPCL确定网络隐含层神经元数目以及中心点初始值,然后由K均值聚类法确定隐含层神经元的中心点和宽度,最后通过最小均值算法确定隐含层神经元与输出层神经元之间的权值. 仿真结果表明:此优化模型相较于传统RBF网络具有更高的准确性.

风电功率预测; 对手竞争惩罚学习算法; RBF神经网络;K均值聚类

近年来,随着化石能源的逐渐枯竭,风能作为清洁的可再生能源,得到了大规模的发展. 与此同时国内外关于风电的课题研究也越来越深入,但其中风电功率预测的精度还没达到令人满意的程度[1].

由于风力发电主要使用的是近地风能,风电功率具有很强的随机性,因此,大规模的风电场并网会影响电网的稳定性和供电系统的可靠性. 只有通过准确地预测风电场风电功率,为电力调度部门及时调整调度计划提供可靠的依据,才能使电力供需达到平衡,减小风电场对电网的影响. 同时也会大幅降低电网的备用容量,减少电力系统运行成本.

目前风电功率的预测方法主要分为物理法、统计法(时间序列法、回归分析法等)和学习法(支持向量机、小波分析和神经网络等). 径向基函数(radial basis function,RBF)神经网络具有逼近任意非线性映射的能力,已广泛应用于各种领域,但是其网络结构和参数的选取仍没有系统的方法来确定. 本文利用基于对手竞争惩罚学习(rival penalized competitive learning,RPCL)算法的K均值聚类对数据进行处理,确定隐含层的中心. 其中,RPCL[2-4]是由Xu等在1993年提出的次胜单元受到惩罚的学习机制,具有优良的算法性能,能确定数据样本的合理聚类数,现已被广泛应用于各种领域,如图像处理[5-6]、语音识别[7]等. 然后,通过最小均值算法确定网络权值. 最后,利用中国某风电场的风电功率数据进行建模和预测实验,仿真结果显示:该方法具有较高地预测精度.

1 基于K均值聚类优化的RBF神经网络

RBF神经网络属于前向网络,由输入层、中间层和输出层组成,其网络拓扑图如图1所示. 从图1可以看到,每层的神经元接受上层传出的信息后单向向下层传输,同层的神经元之间没有信息传输,不同层之间也没有反馈. Kolmogorov理论表明:具有合适的网络结构和权值的三层前向神经网络可以逼近任意精度的函数[8].

RBF神经网络的径向基函数一般采用高斯激活函数,其表现形式(也就是隐含层节点的输出)为

(1)

式中:m、k、n分别为网络输入层、隐含层和输出层的节点数(神经元数);x={x1,x2,…,xm},为m维的输入样本;Ri(x)为隐含层第i个节点的输出;ci为隐含层第i个节点高斯函数的中心;σi为隐含层第i个节点高斯函数的宽度;‖x-ci‖为欧式范数,表示x和ci之间的距离. 从式(1)可以看出,Ri的输出范围为0~1,当输入样本离节点中心越近,相应节点的输出值就越大,在x=ci时,输出值为1.

根据RBF神经网络的结构,可以得到网络的输出为

(2)

式中:y是输出层节点的输出,在本文风电功率预测中只有一个输出;ωi为隐含层第i个节点与输出层节点之间的权值.

RBF神经网络需要确定3个重要参数:基函数的中心ci、第i个神经元宽度σi和输出层的权值ωi. 现有很多聚类分析方法用来确定网络的中心初始值,其中K均值聚类算法使用最为广泛[9-10]. 给定一个数据点集合和聚类数目K值(用户自己指定),K均值聚类算法根据某个距离函数将所有数据点分入K个聚类中,能够比较准确地确定聚类中心. 但是传统的K均值聚类算法存在2个重要的问题:一是需要提前给定K的数值;二是初始聚类中心对聚类结果影响较大,有可能收敛到局部最优解,而不是全局最优解. 本文采用RPCL算法来解决K均值聚类算法中的2个问题:确定合适的聚类数目K和理想的初始聚类中心[11-12].

2 标准RPCL算法

RPCL算法的基本思想为:每个输入样本将竞争获胜单元引向它的同时将次胜单元推开,最终,算法可自动地确定最佳聚类数目. 同时也有不少学者对RPCL算法进行了各种改进,如RPCL算法在节点距离调节时,输入数据的几何结构会对距离调整产生影响,谢娟英等[13]将样本分布密度引入进行节点距离调整,结果表明基于密度的RPCL算法在大数据集上表现优良,而在小规模数据集上传统的RPCL更优. 由于风电功率预测所用数据属于小规模数据集,因此,本文使用标准RPCL算法来进行聚类.

给定数据集X={x1,x2,…,xN},其中样本xl=[xl1,xl2,…,xlm],l=1,2,…,N. 预先设置有k个节点,一个节点表示一个类簇,将类簇的中心记为ci,i=1,2,…,k;节点i的输出值为ui∈{-1,0,1}. 当节点i为获胜节点时,ui=1,被输入样本吸引;当节点i为次胜节点时,ui=-1,被输入样本所排斥;除此之外,其他节点的输出为ui=0,将不受输入样本的影响. 具体步骤如下:

步骤2从数据集中随机选取样本xl,有

ui=

(3)

步骤3更新聚类中心ci

ci=ci+Δci

(4)

(5)

式中:αs和βr分别是竞争获胜单元和次胜单元的学习率,大小为0~1,通常αs远远大于βr. 每次修改聚类中心后,将ci中的数据与阈值δ1进行比较,这是因为在风电功率预测模型中,输入数据会先进行归一化处理,所以这里的δ1应为1. 若ci中有数据超出δ1,则此节点无意义,将其删除.

步骤4将t值加1,若算法收敛或t>T,算法结束;否则转2)继续迭代.

步骤5统计每个中心成为获胜节点的累加数量,如果该数值比阈值δ2(用于删除冗余项)小则删除该节点.

步骤6输出满足条件的节点数以及相应中心点.

3 RPCL优化的神经网络预测模型

经过上述分析,RPCL优化的神经网络模型(RPCL-RBF)可以按以下几个基本步骤进行.

步骤1样本数据进行归一化处理

x′li=(xli-vmin)/(vmin-vmax)

i=1,2,…,m;l=1,2,…,N

(6)

式中:xli、x′li分别为数据转换前、后的值;vmin、vmax分别为i维样本数据的最大值和最小值.

步骤2利用RPCL算法对归一化的样本数据进行处理,得到隐含层节点数和相应的中心点.

步骤3将上一步的输出作为K均值聚类算法的最佳聚类数目K和初始聚类中心ci(0),i=1,2,…,k.

步骤4计算每个样本到各中心的距离

di=‖x′l-ci(u)‖

(7)

然后将其分配到距离最近的聚类中心

步骤5重新计算聚类中心:

(8)

式中:X′i为距离该中心点i最近的样本点集;n为该样本集中样本点的个数. 判断新的聚类中心有无变化,若无变化,则算法结束;否则,转到步骤4继续迭代.

步骤6将K均值聚类算法得到的结果作为RBF神经网络的中心,K均值聚类属于自组织选择法,在基函数为高斯函数时,可按

(9)

σi=λdi

(10)

计算网络的基函数宽度. 式中λ为重叠系数.

步骤7采用递推最小均方误差(least mean square,LMS)来训练权值wi:

(11)

wi(v+1)=wi(v)+Δwi(v)

(12)

步骤8用训练好的RBF神经网络来进行风电功率预测.

4 应用实例

本文采用中国某一风电场某年5月10日至6月6日这段时间内风电机组输出功率的历史数据作为学习样本,不考虑天气影响. 该数据集每隔15 min采集1次,将这些数据作为原始时间序列,利用前3个小时(12个点)的数据来预测第13个点的数据,如式(14)所示.

Xt=(x(t),x(t+1),…,x(t+11))

t=1,2,…,2 677

(13)

f(Xt)=x(t+12)

(14)

将时间序列的前27天的2 592个数据作为训练数据,将第28天的96个数据作为测试数据. 在Matlab环境下建立RPCL-RBF模型,然后用测试数据来验证训练好的网络,实际输出与RBF网络预测输出对比如图2所示.

本文RPCL-RBF模型是对K均值聚类RBF模型神经网络模型的进一步优化. 为了突出经过RPCL优化后的模型具有更准确的预测效果,将RPCL-RBF模型与K均值聚类RBF模型的预测结果进行比较,其中为避免其他因素影响,将K均值聚类RBF选取与RPCL-RBF模型相同的隐含层初始个数以及初始中心. 2个模型的相对误差对比情况如图3所示.

从图3可以明显地看出,RPCL-RBF模型整体的相对误差比K均值聚类RBF模型的相对误差要小. 为了进一步说明RPCL-RBF模型的适用性,本文将其与误差反向传播(back propagation,BP)模型、RBF模型和K均值聚类的RBF模型进行对比,为避免其他因素影响,对比的3种模型选取与RPCL-RBF模型相同的网络结构即隐含层神经元个数相同,并从以下几个方面来对模型进行衡量:首先,从统计的角度由根均方误差(root mean square error,RMSE)和平均绝对百分误差(mean absolute percentage error,MAPE)来衡量模型的好坏;然后,从国家能源局发布的风电场功率预测考核指标[14]即发电预测的准确率r1来衡量预测的可靠性;最后,从算法运行的时间来衡量模型的可应用性. 具体数据列于表1中. 其中算法运行时间主要包括2个部分:离线训练时间和在线预测时间. 但是在模型设计中后者比前者更为重要,这是由于神经网络在离线训练时可以有足够的时间调整参数使其得到最佳模型,因此,本文主要对比的是模型在预测风电功率时所用的时间.

表1 各项指标的比较

从表1可以看出,与常用的几种神经网络模型相比,RPCL-RBF模型的RMSE和MAPE值最小,准确率r1最高,且预测所用时间最短.

5 结论

1) 采用了一种由RPCL和K均值聚类算法组合优化的RBF神经网络模型进行风电功率预测. 相比于K均值聚类RBF模型,RPCL-RBF模型可以先确定合适的聚类数目K和理想的初始聚类中心,使得预测结果更加精确.

2) 通过对中国某风电场的实际运行数据进行建模和预测实验,RPCL-RBF算法的准确度高于常用的BP算法、RBF算法和K均值聚类RBF算法,且用时更少,证明了本文方法的可行性和有效性.

[1] 王丽婕, 廖晓钟, 高阳, 等. 风电场发电功率的建模与预测研究综述[J]. 电力系统保护与控制, 2009, 37(13): 118-121.

WANG L J, LIAO X Z, GAO Y, et al. Summarization of modeling and prediction of wind power generation[J]. Power System Protection and Control, 2009, 37(13): 118-121. (in Chinese)

[2] AHALT S C, KRISHNAMURTHY A K, CHEN P, et al. Competitive learning algorithms for vector quantization[J]. Neural Networks, 1990, 3(3): 277-290.

[3] XU L, KRZYZAK A, OJA E. Rival penalized competitive learning for clustering analysis, RBF net, and curve detection[J]. IEEE Transactions on Neural Networks, 1993, 4(4): 636-649.

[4] CHEUNG Y M. On rival penalization controlled competitive learning for clustering with automatic cluster number selection[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(11): 1583-1588.

[5] 李涛, 裴文江, 王少华, 等. 竞争与动态合作学习聚类分析算法[J]. 哈尔滨工程大学学报, 2010, 31(1): 102-108.

LI T, PEI W J, WANG S H, et al. Competitive and dynamic cooperative learning algorithm[J]. Journal of Harbin Engineering University, 2010, 31(1): 102-108. (in Chinese)

[6] 李桂枝, 安成万, 张永谦, 等. 基于模糊熵和RPCL的彩色图像聚类分割[J]. 中国图像图形学报, 2005, 10(10): 1264-1268.

LI G Z, AN C W, ZHANG Y Q, et al. Color image clustering segmentation based on fuzzy entropy and RPCL[J]. Journal of Image and Graph, 2005, 10(10): 1264-1268. (in Chinese)

[7] 李昕, 费敏锐. 用改进的RPCL和EM算法确定EBF网络结构和参数的策略及其应用[J]. 模式识别与人工智能, 2003, 16(2): 204-207.

LI X, FEI M R. Combining improved RPCL and EM algorithm to determine the EBF architecture and parameters with its application[J]. Pattern Recognition and Artificial Intelligence, 2003, 16(2): 204-207. (in Chinese)

[8] HORNICK K, STICHCOMBE M, WHITE H. Multilayer feed forward networks are universal approximators[J]. Neural Network, 1989, 2: 359-366.

[9] 张彬. 基于聚类算法的RBF神经网络设计综述[J]. 微型机与应用, 2012, 31(12): 1-3.

ZHANG B. Overview on design of RBF network based on fuzzy clustering[J]. Microcomputer & Its Applicatons, 2012, 31(12): 1-3. (in Chinese)

[10] XIE J Y, JIANG S, XIE W X, et al. An efficient globalK-means clustering algorithm[J]. Journal of Computers, 2011, 6(2): 271-279.

[11] 谢娟英, 郭文娟, 谢维信, 等. 基于样本空间分布密度的初始聚类中心优化K均值算法[J]. 计算机应用研究, 2012, 29(3): 888-892.

XIE J Y, GUO W J, XIE W X, et al.K-Means clustering algorithm based on optimal initial centers related to pattern distribution of samples in space[J]. Application Research of Computers, 2012, 29(3): 888-892. (in Chinese)

[12] 沈佳杰, 江红, 王肃. 聚类中心计数值和全局距离变量RPCL算法[J]. 计算机工程与设计, 2014, 35(5): 1811-1815.

SHEN J J, JIANG H, WANG S. Improving RPCL algorithm based on cluster center counts and global distance vector[J]. Computer Engineering and Design, 2014, 35(5): 1811-1815. (in Chinese)

[13] 谢娟英, 郭文娟, 谢维信, 等. 基于密度RPCL的K-means算法[J]. 西北大学学报(自然科学版), 2012, 42(4): 570-576.

XIE J Y, GUO W J, XIE W X, et al. A density RPCL basedK-means algorithm[J]. Journal of Northwest University(Natural Science Edition), 2012, 42(4): 570-576. (in Chinese)

[14] 国家能源局. 风电场功率预测预报管理暂行办法[J]. 太阳能, 2011(14): 6-7.

National Energy Administration. Interim management of wind power generation prediction[J]. Solar Energy, 2011(14): 6-7. (in Chinese)

(责任编辑吕小红)

Rival Penalized Competitive Learning-based Neural Network Model for Wind Power Forecasting

SU Yixin, XIA Huiwen

(School of Automation, Wuhan University of Technology, Wuhan 430070, China)

For increasing the accuracy of wind power forecasting, a rival penalized competitive learning-based radial basis function (RBF) neural network model was presented. Firstly the number of neural network hidden-layer-nodes and its initial center values were determined by rival penalized competitive learning. And then the width of RBF and the center values of network were identified accurately throughK-means clustering. At last,appropriate weights of network were estimated by least mean square. The forecasting result shows that the presented model can lead to more accurate forecasting compared with the traditional neural network.

wind power forecasting; rival penalized competitive learning algorithm; radial basis function neural network;K-means clustering

2015- 11- 10

湖北省自然科学基金资助项目(2015CFB586)

苏义鑫(1965—), 男, 教授, 主要从事智能控制理论与应用、智能系统关键技术方面的研究, E-mail:suyixin@whut.edu.cn

TM 614

A

0254-0037(2016)05-0674-05

10.11936/bjutxb2015110029

猜你喜欢
电功率均值聚类
一种傅里叶域海量数据高速谱聚类方法
基于PCC-CNN-GRU的短期风电功率预测
一种改进K-means聚类的近邻传播最大最小距离算法
18.2电功率(教学设计)
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
浅谈均值不等式的应用
改进K均值聚类算法
均值不等式的小应用
第11讲 电能与电功率专题复习