基于贝叶斯优化CNN-LSTM混合神经网络的短期光伏出力预测

2024-04-02 08:10辽宁工程技术大学电气与控制工程学院焦家俊河北工业大学国际教育学院刘田园
电力设备管理 2024年3期
关键词:出力贝叶斯时刻

辽宁工程技术大学电气与控制工程学院 焦家俊 河北工业大学国际教育学院 刘田园

现有的负荷预测方法可分为两大类:一类为物理方法,其通过对光伏发电设备进行数学建模预测,因其无法获取时间相关性,不适用于短期发电预测;一类为统计及人工智能方法,其利用神经网络的非线性拟合能力,结合天气、气象因素对光伏处理进行建模与预测[1]。文献[2]提出基于长短期记忆网络算法(Long and Short Memory Network,LSTM)的光伏发电功率短期预测方法,对广西某额定装机容量为20MW的光伏电站的历史数据进行预处理分析,结果发现采用LSTM方法较BP方法预测结果更加准确。文献[3]提出一种卷积神经网络(Convolutional Neural Network,CNN)-LSTM的混合预测模型对澳洲某光伏系统进行了仿真分析,结果表明该方法较单一模型相比,对于不同天气类型具有更高的预测精度。

1 算法模型原理

1.1 CNN算法模型

CNN用于数据特征提取,在卷积层中,采用滤波器对输入进行卷积操作,得到相应的特征图;后经过池化层进行最大值降维,进而降低数据特征的尺寸,减少网络参数,降低运算过程中CPU资源耗费。结构图如图1所示。

图1 CNN结构图

1.2 LSTM算法模型

LSTM神经网络由时间循环神经网络(RNN)改进得来,在RNN结构的基础上增加了三种门控单元用以控制信息,其结构图如图2所示。遗忘门将t-1输出的无用信息遗忘,由t时刻的遗忘门状态Ft和t-1时刻的单元状态ct-1共同决定保留有用信息。输入门负责读取t时刻的输入xt及t-1时刻的中间状态ht-1,在输出门中经sigmoid函数、tanh函数作用后产生it、gt,其共同决定单元状态中应该保留的信息。输出门将数据处理后,向下一个时刻传递信息。由ht经tanh函数处理后的ct及ot共同决定。

图2 LSTM原理结构图

LSTM的核心表达式如下式所示:

式中:WF,Wi,Wg,Wo分别为遗忘门、输入门、输入节点、输出门的权重矩阵,其与xt、ht-1相乘;bF,bi,bg,bo分别为遗忘门、输入门、输入节点、输出门的偏置;ht-1为t-1时刻的中间状态输出,xt为t时刻的输入,ct为输入节点的状态;Ft为遗忘门状态;it、gt为t时刻输入门及输入节点状态;σ为sigmoid激活函数tanh代表双曲正切激活函数。

1.3 贝叶斯算法模型

贝叶斯优化是在函数方程未知的情况下根据已有的采样点预估函数最大值的一种算法,在本文中利用贝叶斯算法对CNN-LSTM的多个超参数进行寻优,从而提高光伏发电预测的有效性及准确性,其流程图如图3所示。

图3 贝叶斯优化流程图

1.4 基于Bayes-CNN-LSTM混合算法的神经模型的短期光伏出力预测方法

本文提出了一种基于贝叶斯优化的CNNLSTM混合神经模型的短期光伏出力预测。首先运用CNN进行特征提取。而后采用寻优算法对预测模型CNN-LSTM寻优,最后对基于贝叶斯优化的CNN-LSTM混合神经模型的短期光伏出力预测信息进行非线性拟合,进而实现光伏出力的精准预测,得到预测结果。其算法模型结构如图4所示。

图4 Bayes-CNN-LSTM模型结构图

2 数据预处理及评价指标构建

2.1 基于mRMR的光伏出力影响因素分析

本文选取新疆某光伏电站数据集作为研究对象,数据集包括光伏发电功率、气象条件,时间跨度为2019年1月1日至2019年6月30日,采样间隔为15min,共17376组样本,个别缺失数据已采用线性插值填补。考虑到光伏出力的间歇性,截取每天6:00~21:45共64个采样点数据作为试验数据,总样本量为11584组,将其按照8∶2的比例划分为训练集与测试集,由于光伏出力影响因素较多,如若特征选择不合理易导致信息丢失,故本文采用mRMR方法来进行分析。

使用mRMR方法计算所得各特征与光伏出力的互信息值如下:组件温度0.1923、环境温度0.0579、气压0.2399、湿度0.1030、总辐射0.3222、直射辐射0.1016、散射辐射0.1908。由此可见,光伏出力与总辐射之相关性最大,达到0.3222;气压、组件温度、散射幅度次之;再次是另外三个气象因素,其中环境温度对光伏出力之影响很小,互信息值仅为0.0579,为减轻数据冗余程度和预测模型拟合负担,本文将其剔除,不再纳入后续工作考虑的范畴。

2.2 超参数优化

传统的寻优方法多为试凑法,考虑到手动调参主观性强,随机性大,在归一化数据后,基于贝叶斯优化算法对CNN的一、二层卷积层卷积核大小k1、k2,一、二层卷积层通道数n1、n2、第二层卷积层后所接的池化层大小p以及LSTM的学习率lr、第一和第二隐藏层神经元个数L1和L2、最大迭代次数N共9个超参数进行寻优。寻优过程中采用提前终止策略,如若20轮迭代拟合效果仍无改善则提前终止训练过程。LSTM的批样本大小设置为256,采用Adam优化器进行训练。寻优范围设置及最终寻优结果见表2。

表1 CNN-LSTM超参数寻优范围及结果

表2 不同模型的预测效果

2.3 评价指标

为了准确评估本文模型的精度,选取平均绝对误差(MAE)、均方根误差(RMSE)这2个指标对预测结果进行评估。各评估指标的计算式如下所示:、,式中:RMSE和MAE的单位均为MW,n代表测试集数据的个数;yi为第i个预测样本的预测值;yi为第i个测试样本的真实值。

3 算例分析

为了验证本文所提方法的有效性与准确性,参考相关文献分别构建了Bayes-GRU、Bayes-LSTM、Bayes-CNN、CNN-LSTM和LSTM5组对照算法模型,针对相同的预测数据集与本文所提算法模型Bayes-CNN-LSTM(BCL)进行对比分析。本文采用时间窗口滑动的策略进行预测,滑动窗口预测时间步长设为32h,即将前128组样本作为输入特征,对第129个数据点进行预测,然后滑动窗口,将第129个预测点预测值作为新的特征,实现滚动预测。由于数据众多,为体现预测效果,本文随机选取6月27、28两日共128个数据点的预测值进行展示,各个预测模型的预测结果评价指标值见表2,预测结果如图5所示。

图5 不同模型的预测结果对比

由表2可见,本文所提方法各项评价指标均为最优。直接利用LSTM进行预测效果最差。仅利用CNN对多个输入特征进行局部特征提取而未采用寻优算法对预测模型LSTM寻优,致使预测模型LSTM的性能难以得到充分体现,其预测效果仅优于LSTM,这说明了本文所用寻优算法的有效性;而单纯利用CNN、LSTM、GRU等基准模型对负荷进行预测,并辅以寻优算法进行超参数优化,其预测效果虽优于CNNLSTM与LSTM,但仍然劣于本文所提方法,这说明了本文使用CNN模型用以特征提取的必要性;结合图5来看,本文所提方法与原始负荷曲线最为贴合,能够很好地拟合出光伏出力与各种气象dier因素之间的非线性关系,尤其在气象条件突变所致光伏出力强烈波动时间段,仍然能够捕捉到光伏出力特性。

图6还给出了6种方法预测结果误差的小提琴图,从图中可以明显看出,不同于Bayes-GRU的极端异常值较多,Bayes-LSTM的左偏分布,Bayes-CNN、CNN-LSTM、LSTM的右偏分布,本文所提方法的预测误差基本上呈对称分布,且极端误差值小。综上所述,本文所提Bayes-CNN-LSTM模型的有效性得以验证。

图6 不同模型预测误差对比分析

猜你喜欢
出力贝叶斯时刻
冬“傲”时刻
捕猎时刻
贝叶斯公式及其应用
基于贝叶斯估计的轨道占用识别方法
风电场有功出力的EEMD特性分析
要争做出力出彩的党员干部
一种基于贝叶斯压缩感知的说话人识别方法
街拍的欢乐时刻到来了
风电场群出力的汇聚效应分析
一天的时刻