基于K-L信息量和ARIMA误差修正的月度电量预测

2021-03-18 07:46陈明帆宁光涛李琳玮何礼鹏刘丽新
电力需求侧管理 2021年2期
关键词:信息量月度电量

陈明帆,宁光涛,李琳玮,何礼鹏,刘丽新

(1. 海南电网有限公司,海口 570204;2. 北京清软创新科技股份有限公司,北京 100085)

0 引言

随着电力体制改革的不断深入,城乡居民暂不参与电力市场,需要电网公司对其承担保底供电责任。所以电网公司越来越重视城乡居民月度用电量的预测,以便于合理安排月度计划、更好履行保底供电责任。

城乡居民用电特性受气象、经济等因素影响显著。随着经济快速发展,城乡居民的生活用电量迅速增加;由于家用电器的普及率越来越高,特别是空调负荷已经成为城乡居民用电的重要组成部分,并且从根本上改变了居民生活用电特性。若要提高城乡居民月度电量的预测精度,不能单纯依靠历史序列进行外推,需要结合经济、气象等多因素的影响,筛选出相关性强的指标,再利用相关因素分析法建立回归模型进行预测。传统只依赖相关因素分析法建立回归模型的预测误差往往较大,如文献[1]通过基于粗糙集理论找到相关因素后进行回归分析的预测方法。自回归差分移动平均模型(autoregressive integrated moving average model,ARIMA)对预测非平稳时间序列具有很大优势,文献[2]在ARIMA 模型的基础上先消除季节周期分量影响再对月度电量进行预测;文献[3]提出一种结合X12季节分解方法的ARIMA 月度电量预测方法。但这些研究多集中在应用ARIMA模型进行月度电量预测,忽视了ARIMA模型是可以对预测误差进行修正的价值。

本文在考虑相关因素建立回归模型进行预测的基础上,充分利用ARIMA 模型对误差修正的优势,创新性地提出基于K-L信息量法和ARIMA误差修正的月度电量预测法。在筛选相关性强的指标基础上,利用相关分析法对影响因素与电量进行回归建模,计算拟合误差并构建新的非平稳时间序列,结合ARIMA 模型对此序列进行修正,提升月电量的预测准确率。

1 城乡居民用电特性分析

城乡居民用电呈现出变化趋势相对稳定、空调用电明显的特征。如图1所示某地城乡居民历年月电量,一般表现为6 月份开始电量快速上升,8 月达到顶峰,9月开始回落,每年11月至来年5月是全年用电低谷。

图1 2016—2019年城乡居民生活用电情况Fig.1 Domestic electricity consumption of urban and rural residents in 2016—2019

2 相关因素分析预测法

根据城乡居民用电特性,如历年变化趋势相对稳定,空调用电特性明显等特点,采用K-L信息量法从多种影响因素中筛选出最相关因素建立回归模型进行初步预测。

2.1 基于K-L信息量的相关因素筛选法

K-L信息量法是对指标总体概率分布的拟合程度进行评价的一种方法[4]。对于带有随机性的现象,可以认为它是服从某一概率分布的随机变量的一些实际值。如果已知真正的概率分布,通过估计选择的概率模型与实际的概率分布相近的程度来判断模型的好坏。具体计算公式如下。

(1)设一个基准指标y={y1,,y2,,…,yn} ,该指标的概率分布列为p={p1,,p2,,…,pn} ,则标准化处理后的基准变量序列pt为

式中:yj为基准随机变量;pt为对yt进行标准化处理后的序列。

(2) 设另一个指标为被选指标为x={x1,x2,…,xn} ,该备选指标概率分布序列为q={q1,q2,…,qn} ,则标准化处理后的指标序列qt为

式中:xj为备选指标随机变量;qt为对xt进行标准化处理后的序列。

(3)定义分布列q关于分布列p的K-L信息量kl为

以某地城乡居民月电量为历史数据,选取尽可能丰富的外部影响指标,应用K-L 信息量法计算出的各个指标的K-L 信息量,从表1 可以看出,与城乡居民月度电量最相关的影响因素为最高气温平均值。

表1 月度电量与各个指标的K-L信息量Table 1 Monthly electric quantity and K-L information of each indicator

2.2 基于相关因素的回归模型

相比于时间序列模型,相关因素回归模型不再只针对历史电量数据进行分析,而是把时间项换为相关因素,建立电力需求与一个或多个相关变量的回归方程式。回归分析法对相关因素的选择要求比较高,使用的相关因素必须与电力需求之间具有长期的稳定的相关关系。

常用的回归模型有线性模型、指数模型、对数模型、幂函数模型、抛物线模型、多元回归模型。

根据城乡居民的月度电量与当地月最高气温平均值之间的拟合误差最小建立回归方程,得到历史月拟合误差时间序列和预测月预测误差。但只依赖相关因素分析法建立回归模型的预测误差往往较大,需要对预测误差进行修正后再预测才能更好地提高预测精度。

3 基于ARIMA模型的误差修正

ARIMA 模型对预测非平稳时间序列具有很大优势。利用上述回归模型得到的历史月电量误差值刚好构成一个非平稳时间序列,所以可以采用ARIMA模型进行修正。

3.1 ARIMA模型原理

ARIMA 模型是采用差分运算或对数运算后将非平稳时间序列转换成对平稳时间序列后,利用自相关和偏自相关函数建立的一种时间序列预测方法[3],该模型已成熟应用在时间序列分析领域。ARMA是对平稳时间序列的预测模型,ARIMA是对非平稳时间序列先进行平稳化检验与处理后再利用ARMA模型进行预测的模型。

针对非平稳时间序列Xt的ARIMA(m,d,n)模型表达式为

式中:d为差分次数;B为滞后算子;Xt为经过d次差分后的平稳时间序列;m和n分别为自回归阶数和滑动平均阶数;φ1,φ2,…,φn分别为自回归系数;ω1,ω2,…ωq分别为滑动平均系数;εt,εt-1,…,εn-1为零均值白噪声序列。

3.2 ARIMA模型的预测步骤

ARIMA模型预测步骤如下:

(1)首先,获取时间序列,检查该序列数据是否属于平稳时间序列。常用的方法是时序图法,如果不平稳,需要对非平稳时间序列进行d次差分直到平稳。一般d≤2。

(2)其次,用Box-Jenkins 法进行模型识别,即计算自相关函数和偏自相关函数,利用两个函数的截尾和拖尾特性判断模型阶数p和q。

(3)再次,用最小二乘法计算自回归系数和滑动平均系数。

(4)最后,进行模型验证。主要检查εt是否为白噪声序列,检查方法是利用Barlett 定理构造检验统计量[1]。若为白噪声序列,模型通过,若不是白噪声序列,需要重新进行模式识别。

4 基于K-L 信息量和ARIMA 误差修正的月度电量预测

设历史月度电量序列为y={y1,y2,…,yt} 。结合K-L 信息量和ARIMA 误差修正的月度电量预测流程步骤如下,流程如图2所示。

(1)采用K-L 信息量筛选指标:首先采用K-L信息量计算月度电量与多指标的分布函数,通过KL信息量的计算公式得到各个指标与月度电量的KL信息量。选取K-L信息量在50以内的一个或多个影响指标作为月度电量的相关因素建立回归方程。

(2)相关因素分析法建立回归方程:若为一个影响指标,则建立一元回归方程;若为多个影响指标,则建立多元回归方程。

(3)获取误差时间序列:通过回归方程,计算拟合曲线与历史真实值之间的误差值。构建拟合误差时间序列D={D1,D2,…,Dt} 。

(4)利用ARIMA 模型进行误差修正[5]:运用R语言中的 ARIMA 工具包[6]对误差时间序列Dt直接建模,通过ARIMA预测模型实现对误差值的修正。

(5)基于修正误差预测月度电量:将相关因素分析法的预测值与修正后的预测误差值进行加减预算,得到修正后的月度电量预测值。

图2 基于K-L信息量和ARIMA误差修正的预测流程Fig.2 Prediction process based on K-L information and ARIMA error correction

5 算例验证

为验证本文所提出的基于K-L 信息量和ARIMA误差修正的月度电量预测模型的可行性,选取某地2016 年1 月至2019 年6 月的城乡居民月度电量作为历史数据序列,以2019年7、8、9月作为预测目标,预测具体步骤如下。

(1)为对比多元回归模型与一元回归模型的预测精度,结合K-L信息量计算结果,首先选取对电量影响较大的前四种影响因素,选择多元回归模型,建立月度电量与最高气温平均值a、房间空气调节器产量b、降雨量c、房地产开发施工面积d的月度电量值y多元回归模型为

(2)在K-L信息量得出温度对电量影响最大基础上,选择一元回归方程的抛物线模型,建立月度电量y与最高气温平均值x的回归模型为

(3)利用回归模型获取误差时间序列,得到修正前的预测误差精度如表2所示。

表2 修正前拟合误差Table 2 Fitting error before correction%

(4)利用ARIMA模型修正误差

选取历史误差值为历史值构建训练样本集,2019 年 7 月至 9 月为预测月,结合 R 语言的 ARIMA工具包,将上述误差时间序列逐次进行平稳化处理、模型识别、参数估计、模型检验等,最后输出误差修正值。修正后的预测误差如表3所示。

表3 修正后预测误差Table 3 Fitting error after correction%

(5)基于修正误差的月度电量预测

由于一元方程的预测误差更小,因此采用一元回归方程结合ARIMA 修正方法对月度电量进行预测,即将相关因素分析中的预测值与ARIMA修正后的预测误差值进行加减运算,得到修正后的预测值见表4。

表4 预测误差修正值Table 4 Modification of prediction error万kWh

最后,单独采用相关分析法及文献[7]中的ARIMA 预测法两种预测方法进行计算,与基于K-L信息量与ARIMA误差修正预测法进行对比,并进一步计算3种结果预测误差,结果如表5,误差越小,预测精度越高。由此可见,本文所提的基于K-L 信息量和ARIMA 误差修正的月度电量预测方法对于城乡居民用电具有较好的预测效果。

表5 3种预测方案对比Table 5 Comparison of three forecasting schemes

6 结束语

将回归方程的拟合误差构建成新的非平稳时间序列,利用ARIMA 对非平稳时间序列的预测优势,修正预测误差,为提高预测精度提供思路。

基于K-L 信息量和ARIMA 误差修正的月度电量预测方法既考虑了对城乡居民用电量影响较大的相关因素,又修正了相关因素分析法的预测误差,提高了预测精度。

猜你喜欢
信息量月度电量
储存聊天记录用掉两个半三峡水电站电量
基于GIS和信息量法的四川峨眉山市地质灾害易发性定量评价
基于信息理论的交通信息量度量
四川2018年7月转让交易结果:申报转让电量11.515 63亿千瓦时
如何增加地方电视台时政新闻的信息量
电量隔离传感器测试仪的研制
月度聚焦
基于联合熵和交互信息量的视频篡改检测
月度聚焦
北斗通信在小型水电厂电量采集中的应用