基于变分模态分解的中期电力负荷混合预测模型

2023-12-12 11:28程红利黄文焘姜庆超范勤勤
应用科技 2023年6期
关键词:分量模态神经网络

程红利,黄文焘,姜庆超,范勤勤

1. 上海海事大学 物流研究中心,上海 201306

2. 上海交通大学 电力传输与功率变换控制教育部重点实验室,上海 200240

3. 华东理工大学 能源化工过程智能制造教育部重点实验室,上海 200237

随着社会和经济的发展,电能的需求越来越大。但由于电能难以大量储存且发电站的电能输出应跟随实际电能的消耗,精准的电力负荷预测不仅可以提高电网系统的经济性、稳定性和安全性[1],也是维持电力系统稳定和提高电力资源利用率的一种重要手段[2]。

中期电力负荷预测主要是通过对电力负荷的历史数据以及对负荷变化影响因素的分析,采用特定的预测模型和方法来预测未来几周或几个月的负荷数值[3]。由于受到温度、湿度等多种因素的影响,中期电力负荷数据存在复杂的非线性关系[4],故中期电力负荷预测一直是该研究领域的热点和难点。目前,电力负荷预测方法主要有传统预测方法和人工智能方法[5]。时间序列法和回归分析法等传统的预测方法主要基于线性模型,因此,它们无法有效对复杂的非平稳电力负荷序列进行建模,且预测效果较差[6]。相较于传统预测方法,人工智能方法能够提高电力负荷预测精度[7]。但单一的神经网络可能存在过拟合、泛化能力差等问题,导致预测精度降低。因此,研究者们采用混合预测模型来提高预测精度。比如,Nie 等[8]根据权重确定理论,提出一种基于智能优化算法的混合预测模型,根据不同的权重将径向基函数神经网络、极限学习机和广义回归神经网络3 个模型组合起来对电力负荷进行预测,该模型消除了单一模型固有的缺陷,有效提升了预测精度。由于电力负荷序列是一种非平稳的时间序列,对电力负荷序列进行先验分析可以提高负荷预测的准确性。经验模态分解[9](empirical mode decomposition,EMD)是一种非线性和非平稳时间序列的数据处理方法。Neeraj 等[10]提出一种EMD-注意力(attention)-长短时记忆(long shortterm memory,LSTM)网络电力负荷预测模型,该模型用EMD 将复杂的电力负荷序列分解为较平稳的序列,并将历史电力负荷与气象特征作为输入。另外,该算法还采用注意力机制突出输入的关键特征,结果表明该预测模型提升了预测精度。但EMD 在分解过程中易产生模态混叠现象,集成经验模态分解[11](ensemble empirical mode decomposition, EEMD)是EMD 的改进,通过添加辅助噪声消除EMD 分解时产生的模态混叠现象。刘扬等[12]将EEMD 与门控制循环单元(gated recurrent unit, GRU)神经网络结合,可以在一定程度上解决分解产生的模态混叠现象,并提高预测精度。然而,如果分解所得到的多个模态分量出现严重的频谱交叉时,EEMD 将不能有效地抑制模态混叠问题。Dragomiretskiy 等[13]提出了变分模态分解(variational mode decomposition,VMD)算法,该方法能够有效地抑制模态混叠现象,在处理非平稳信号时更加具有优势。Li 等[14]将VMD 与粒子群优化的双向长短期记忆(bidirectional LSTM,Bi-LSTM)网络结合,该方法对传统的预测模型进行改进,提高了模型的预测性能。盛四清等[15]提出一种基于VMD 和改进GRU 的风电功率预测模型,该模型首先利用VMD 方法分解历史风电功率序列降低非平稳性,然后利用改进GRU对分解后的序列进行预测,实验结果表明,采用VMD 分解后的预测模型具有更好的预测精度。

虽然上述研究对电力负荷预测有较好的预测效果,但它们均没有考虑模型的误差修正。根据Xu 等[16]的研究,利用主成分分析法提取风速的主要特征,将提取的主成分与误差序列作为训练集,然后利用LSTM 神经网络进行误差修正,结果表明通过误差修正提高了模型的预测精度。刘杰等[17]提出一种考虑误差修正的两阶段光伏功率预测模型,该模型首先利用回归分析方法构建线性回归模型实现初步预测,然后根据初步预测误差的特性建立更加准确的误差概率分布模型,实验结果表明误差修正策略提高了模型预测精度。李大中等[18]提出一种基于深度学习与误差修正的超短期风电功率预测方法,该方法采用双向门控制循环单元(bidirectional gated recurrent unit,BiGRU)对风电功率进行预测,提取预测误差。另外,该方法采用随机森林算法构造误差模型,对初步预测结果进行修正,通过仿真验证了该方法的有效性。为进一步提高中期电力负荷预测精度,本文鉴于VMD 算法优势,采用“分解—预测—修正”的策略,提出一种基于变分模态分解的中期电力负荷混合预测模型(hybrid prediction model of medium-term power load based on variational mode decomposition, HPMMPL-VMD)。首先使用VMD算法将原始电力负荷序列分解为若干个模态分量来降低序列的非平稳性,并利用LSTM 对分解后各个模态分量进行建模;然后利用最小二乘支持向量回归(least square support vector regression,LSSVR)[19]进行误差修正,将初始预测值与误差预测值相加得到最终的预测结果;最后对澳大利亚某地区电力负荷数据集[20]进行实例验证。将HPMMPL-VMD 模型与其他预测方法进行对比分析,以平均绝对百分比误差、均方根误差和决定系数作为误差分析指标,实验结果表明:HPMMPL-VMD 模型得到的3 个评价指标分别为1.2%、120.67 和0.992 1,明显优于其他模型,验证了本文所提模型的有效性。

1 相关工作

1.1 变分模态分解

VMD 算法是一种自适应和完全非递归的信号分解方法,它可以解决信号分解过程中的模态混叠和端点效应问题[13];主要计算步骤如下[21]:

1)将原始的信号f(x)分解成K个不同中心频率的模态分量,再通过调节原始信号的高斯平滑度获得子序列的带宽,使各个模态的带宽之和最小,并且将各个模态之和等于原始信号作为约束条件,构建变分问题为

式中: {uk}为分解后的第k个模态分量,{ωk}为 {uk}对应的中心模态,K为模态分量总数,δ(x)为狄拉克函数单位冲激函数, ∂x为对x求偏导,f(x)为原始信号,x为采样时刻,j为虚数单位。

2)为了将上述约束变分问题转变为非约束变分问题,引入了拉格朗日乘子和二次惩罚因子,得到增广拉格朗日函数:

式中: λ为拉格朗日乘子, β为二次惩罚因子。

3)利用交替方向乘子优化得到各模态分量和中心频率,进行交替寻优,更新 {uk}、{ωk}的公式为

式中:n为迭代次数,和分别为f(ω)和u(ω)的傅里叶变换。

4)根据式(1)更新后的 {uk}得到更新的 λ为

式中: τ为噪声容限参数,

5)给定的判别精度 ε>0,存在

当满足式(2)时停止迭代,得到k个相对平稳的模态分量。

1.2 LSTM 神经网络

循环神经网络(recurrent neural network,RNN)在短时时间序列预测方面有较好的效果,但它只有一层隐藏层,且在处理长时间序列时容易出现梯度爆炸或者梯度消失问题,不能满足现实需求[4]。LSTM 神经网络在RNN 的基础上进行了改进,解决了RNN 存在的问题[22]。LSTM 神经网络在隐藏层增加了一种记忆单元和3 种门结构,即遗忘门、输入门和输出门,结构如图1 所示。LSTM 神经网络主要的计算步骤如下[23]。

图1 LSTM 神经网络结构

遗忘门控制上一时刻的单元状态信息被遗忘的程度。遗忘门将上一时刻的电力负荷的输出和当前时刻的输入作为输入,并通过sigmoid 函数将输出范围控制在[0,1],计算公式为

式中:rt为遗忘门,Wr为遗忘门的权重矩阵,br为遗忘门的偏差矩阵,zt为t时刻的输入,ht-1为上一时刻的输出, σ为sigmoid 函数。

输入门决定当前时刻的输入有多少保存到当前的单元状态中。首先通过sigmoid 函数和t函数计算出输入门的值和t时刻通过输入门的临时单元状态;其次利用遗忘门和输入门的共同作用更新单元状态。计算公式为

式中:ut为输入门,Wu和Wv分别为输入门的权重矩阵和当前状态的权重矩阵,vt为t时刻通过输入门的临时单元状态,tanh为激活函数,ct-1和ct为前一时刻和当前时刻的单元状态,bu和bv分别为输入门的偏差矩阵和当前状态的偏差矩阵。

输出门控制当前单元状态有多少可以输出。该门首先将上一时刻的电力负荷的输出和当前时刻的输入作为输入,并通过sigmoid 函数将输出范围控制在[0,1];其次通过t函数将当前时刻的单元状态输出控制在[-1,1];最后得到t时刻的输出。计算公式为

式中:mt为输出门,Wm为输出门的权重矩阵,bm为输出门的偏差矩阵,ht为t时刻的输出。

1.3 最小二乘支持向量回归

LSSVR 是支持向量回归的改进版本,对于非线性函数有较强的拟合能力,其基本原理如下[19]:

假设样本数据为d维向量,给定一组样本数据(al,sl),l=1,2,…,H(H为样本量),其中al∈Rd为输入量,sl为输出,根据结构化最小原理,LSSVR 的优化问题可表示为

式中: θ为权重向量,φ(al)为高维特征空间的非线性映射输入,b为偏置值, γ为正则化参数,el为误差变量。

对于优化目标引入拉格朗日乘子,构造拉格朗日函数为

式中 α为拉格朗日乘子。

式中K(al,aj)为核函数,本文采用径向基核函数(radial basis function,RBF),计算公式为

式中 ρ为核函数宽度。

2 HPMMPL-VMD 模型

电力负荷数据集是一种非平稳的时间序列,若预测时未处理原始数据,不仅增加计算的复杂度,而且会降低预测效果。LSTM 神经网络避免了梯度消失问题,同时可以学习长期的信息;LSSVR 在非线性数据集上有较好的拟合能力,且学习能力强。本文利用VMD 算法将原始电力负荷进行分解,降低数据非平稳性,并将LSTM 神经网络与LSSVR 相结合,提出一种基于VMD 的中期电力负荷混合预测模型。HPMMPL-VMD 模型的具体步骤如下:

1)利用VMD 算法对原始电力负荷数据进行处理,分解得到K个相对平稳的本征模态函数(intrinsic model function, IMF)分量。

2)采用LSTM 神经网络对各个IMF 分量分别进行建模,将各个预测分量相加得到初始电力负荷预测值。

3)将原始电力负荷值与初始预测值作差,得到误差序列。

4)利用LSSVR 对误差序列进行建模,得到误差预测值。

5)将初始预测值与误差预测值相加,得到混合模型的最终预测结果。

HPMMPL-VMD 模型结构如图2 所示。

图2 HPMMPL-VMD 模型结构

3 实验结果与分析

3.1 数据来源与数据预处理

为验证所提算法的有效性,选取澳大利亚某地区2006 年1 月1 日—2006 年3 月31 日的电力负荷数据(包括温度、湿度、电价等数据)来进行建模[20]。该电力负荷数据以及每个特征数据采样的时间间隔为0.5 h,每天采样48 个点,共4 319 个样本。本文将1 月1 日—2 月28 日的数据作为训练集,共2 831 个数据;3 月1 日—3 月31 日作为测试集,共1 488 个数据。原始电力负荷序列如图3 所示。

图3 原始电力负荷数据

为了消除奇异样本数据对预测结果的影响,对样本数据进行归一化处理。计算公式为式中:gi为输入数据,gmin为数据的最小值,gmax为数据的最大值。

3.2 参数设置与评价指标

本文模型的构建及训练均在3.8 版本Python编程环境下进行,深度学习框架为Keras。在本研究中,将LSTM 的时间步长设置为1,并由1 个输入层、2 个隐藏层和1 个输出层构成。其中第1 层隐藏层神经元的个数为128,第2 层隐藏层神经元的个数为64,输出层神经元的个数为1。另外,采用Adam 优化器优化模型参数,初始学习率设置为0.01。VMD 方法中惩罚参数ζ设置为1 980,K值设置为4。LSSVR 核函数采用径向基核函数,将惩罚因子C设置为200,正则化参数γ设置为0.001。XGboost 最大深度(max_depth)为6,学习率为0.03,弱学习器数目(n_estimators)为100,其他参数为默认值。

为评价各个算法性能,选取平均绝对百分比误差(mean absolute percentage error,MAPE)EMAP,均方根误差(root mean square error,RMSE)ERMS和决定系数(r-squared)R2作为评价指标[5],它们的计算公式为

式中:yi为电力负荷的实际值,为预测值,为实际值的平均值,N为测试集样本数。决定系数R2的范围是[0,1],R2值越接近1,表示模型拟合效果越好,实际值与预测值的误差越小。

3.3 实验与分析

3.3.1 HPMMPL-VMD 模型训练

在训练集上,VMD-LSTM[24]、EEMD-LSTM[25]、EMD-LSTM[26]、LSTM 神经网络[27]和XGboost[28]算法以及本文所提HPMMPL-VMD 模型的训练结果如表1 所示。从表1 可以看出,HPMMPL-VMD模型的MAPE 为1.77%,RMSE 为189.66,R2为98.51%。HPMMPL-VMD 模型的训练精度均高于其他比较算法,同时具有较强的拟合能力。为进一步验证所提算法的有效性,图4 给出所有算法的训练值和实际值。从图4 可以看出,HPMMPLVMD 模型的训练值与实际值曲线最为接近。

表1 所有比较算法在训练集上的结果

图4 所有比较算法在训练集上的效果

3.3.2 HPMMPL-VMD 模型预测结果对比与分析

为了验证HPMMPL-VMD 模型的有效性,将其 与 VMD-LSTM[24]、 EEMD-LSTM[25]、 EMDLSTM[26]、LSTM 神经网络[27]和XGboost[28]等算法在测试集上进行对比。所有算法的预测结果如表2 所示。

表2 所有比较算法在测试集上的结果

从表2 可以看出,VMD-LSTM 对比EEMDLSTM 和EMD-LSTM,MAPE 值分别下降了7.9%和16.3%,RMSE 值分别下降了6.01%和17.6%,R2提高至98.46%,这表明VMD 方法对非平稳序列具有较好的处理能力,使得LSTM 模型具有较好的预测效果。相比于VMD-LSTM、EEMDLSTM 和EMD-LSTM 组合模型,HPMMPL-VMD模型在MAPE 指标上分别降低了26.8%、32.6.3%和38.8%,在RMSE 指标上分别降低了32.6%、36.7%和44.3%,在R2指标上分别提升了0.76%、0.89%和1.91%。相比于LSTM 和XGboost 单一预测模型,HPMMPL-VMD 在MAPE 上分别降低了42.5%和63.3%,在RMSE 上分别降低了51.2%和64%,在R2上分别提升了2.6%和5.7%。由此表明,相比于其他预测模型,所提算法具有较高的预测精度。

此外,图5 给出所有比较算法的预测值和实际值。从图5 可以看出,HPMMPL-VMD 在波峰处的预测效果都要好于其他算法。这说明所提算法具有较好的泛化能力,能够准确预测中期的电力负荷。

图5 所有比较算法在测试集上预测效果

3.4 算法分析

3.4.1K值敏感性分析

HPMMPL-VMD 模型需要预设VMD 算法中模态分量的个数K。如果K值过大或者过小,将导致模态混叠或者一些模态分量被丢弃,这会限制该分解方法的适用性。因此,本文通过VMD 分解产生的残余能量与原始信号能量之比MAPE 来确定K值,当比值小于1%时,确定最终的模态个数[29],计算公式为

式中:Q为原始数据个数,f(x)为原始数据,uk(x)为分解后的各个模态分量。

本文使用数值递增的方式来确定K值。将K的初始值设置为2,如果MAPE 的值未小于1%,则令K=K+1,直至MAPE 的值小于1%,此时的K值作为最终的分解模态个数[29],结果如表3所示。

表3 不同K 值下MAPE 值

从表3 可以看出,当K=4 时,MAPE 的值为0.69%,剩余能量比小于1%,说明分解的模态个数为4 时,可以将原始电力负荷数据中的噪声有效分解。

对原始电力负荷进行分解,分解后的模态分量如图6 所示。从图6 可以看出,IMF1 的波动变化较大,规律性较差,IMF2、IMF3 和IMF4 的变化均有周期性,规律性较好,IMF4 的变化最为平缓。

图6 VMD 分解结果

3.4.2 误差修正的有效性分析

为验证误差修正模型的有效性, 使用HPMMPL-VMD 和不带误差修正的算法(命名为HPMMPL-VMD-1)来对测试集进行预测。本文采用平均绝对误差(mean absolute error,MAE)EMA来评价HPMMPL-VMD 和HPMMPL-VMD-1 模型的性能:

式中:yi为电力负荷的实际值,yˆi为预测值,N为测试集样本数。

HPMMPL-VMD 和HPMMPL-VMD-1 模型的MAE 值如表4 所示。由表4 可知,HPMMPL-VMD比HPMMPL-VMD-1 的MAE 值降低了38.5%,表明HPMMPL-VMD 模型的预测精度更高。

表4 HPMMPL-VMD 和HPMMPL-VMD-1 的MAE 值

另外,图7 给出了HPMMPL-VMD 和HPMMPLVMD-1 的误差绝对值对比结果。从图7 中可以看出,经过误差修正后,电力负荷的误差绝对值明显降低,说明经过误差修正的预测模型能够有效地提高中期电力负荷预测精度。

图7 HPMMPL-VMD 和HPMMPL-VMD-1 的误差绝对值

4 结论

本文提出一种基于VMD 分解的中期电力负荷混合预测模型,主要包括:

1)使用VMD 算法将原始电力负荷序列分解成多个相对平稳的模态分量,降低了负荷序列的噪声。

2)考虑误差因素,利用LSSVR 来对训练误差进行建模,有效提取误差序列中的规律信息。

通过公开数据集进行实验测试,将所提电力负荷测模型与其他预测模型进行比较,在RMSE、MAPE 等多种评价指标下,HPMMPL-VMD 模型的误差与对比模型相比明显下降。研究结果表明,HPMMPL-VMD 在中期电力负荷预测上具有较好的拟合能力和预测效果。

猜你喜欢
分量模态神经网络
帽子的分量
神经网络抑制无线通信干扰探究
论《哈姆雷特》中良心的分量
分量
基于神经网络的拉矫机控制模型建立
国内多模态教学研究回顾与展望
复数神经网络在基于WiFi的室内LBS应用
基于HHT和Prony算法的电力系统低频振荡模态识别
基于支持向量机回归和RBF神经网络的PID整定
基于瞬时对称分量法的三相四线制D-STATCOM控制研究