城市供水DMA短期需水量预测比较研究

2017-04-13 01:16何必仕熊晓锋蔡华强洪嘉鸣
关键词:需水量用水量差分

何必仕,熊晓锋,蔡华强,洪嘉鸣

(杭州电子科技大学自动化学院,浙江 杭州 310018)

城市供水DMA短期需水量预测比较研究

何必仕,熊晓锋,蔡华强,洪嘉鸣

(杭州电子科技大学自动化学院,浙江 杭州 310018)

针对城市供水独立计量区域(DMA)实例,运用自回归积分滑动平均模型、Elman神经网络、广义回归神经网络以及最小二乘支持向量机模型进行城市供水管网短期需水量预测.结合节假日、天气状况及温度等因素对用水量的影响,修正了相应模型,进一步提高了需水量预测精度.实例计算结果表明,4种模型均能用于城市供水短期需水量预测,其中结合天气及节假日因素的最小二乘支持向量机模型具有更高的预测精度.

城市供水;需水量预测;ARIMA;ELMAN;GRNN;LSSVM

0 引 言

城市供水独立计量区域(District Metering Area,DMA)短期预测是实现供水生产科学管理、动态调度以及管网异常侦测的重要依据.但是局部用水量的波动和不确定性给需水量预测带来了困难.需水量短期预测方法一般分为时间序列方法、结构分析方法和系统方法[1].其中移动平均法[2]、指数平滑法[3]、趋势外推法[4]、季节变动法[4]等属于时间序列方法;回归分析法[5-6]等属于结构分析方法;灰色预测[7]、人工神经网络[8]、支持向量机[9-10]等属于系统方法.其中,回归分析法模型简单、方便但受多种因素综合影响,导致难以选择影响因素;时间序列模型预测精度较好、数据处理简单但是并不适用于变化较大的情况;系统方法具有自学习能力强、非线性处理好等优点,具有较高的需水量预测精度,但存在模型复杂、训练时间长等问题.

近年来,研究学者通过引入天气,节假日等用水量影响因素来优化需水量预测模型[11-15],以提高需水量短期预测精度.本文运用自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model, ARIMA),Elman神经网络(Elman Neural Network, ELMAN),广义回归神经网络(Generalized Regression Neural Network, GRNN)和最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM),并结合节假日、天气状况、温度等外部影响因素,对某市DMA短期需水量进行预测.

1 短期需水量预测模型

短期需水量的预测一般是根据城市历史用水量建立各种用水量模型,预测未来24 h或48 h的需水量.先对本文选用的4种短期需水量预测模型作简单介绍.

1.1 ARIMA模型

ARIMA模型通过寻找序列之间的规律,并用适当的数学模型来描述该规律,对未来进行分析及预测[16].非平稳序列ARIMA(p,d,q)通过初始值y1,y2,…,yd和平稳的ARMA(p,q)序列zt来表示,由于y1,y2,…,yd与yt是相互独立的,所以对zt的预测不受y1,y2,…,yd的影响,并且已知yt及其以前时刻的值,由此得到ARIMA(p,d,q)序列{yt}的预测模型.

(1)

需水量预测中所遇到的非平稳序列问题,通常都是低阶的,即d=1或d=2.特别地,令d=1,预测模型式子简化为:

(2)

1.2ELMAN模型

ELMAN模型是一种带反馈的BP网络,其短期记忆功能使模型对历史状态敏感;模型以任意精度逼近任何非线性映射,并且能较好地处理动态信息.此外,ELMAN模型可以不考虑外部噪声的影响,只需给出系统的输入输出便可以对系统进行建模[17].模型的状态空间表达式为:

(3)

其中,y为输出向量,x为中间层单元向量,u为输入向量,xc为反馈状态向量,ω3,ω2,ω1分别表示中间层到输出层,输入层到中间层以及承接层到中间层的连接权值,g(*)和f(*)分别表示输出层和中间层神经元的传递函数.

1.3GRNN模型

GRNN模型是一种具有良好非线性映射能力、容错性、鲁棒性以及柔性网络结构的径向基网络.GRNN由输入层、模式层、求和层和输出层构成.网络输入X=[x1,x2,…,xn],其输出为Y=[y1,y2,…,yk][18].模式层传递函数为:

(4)

其中,i为输入神经元个数,Xi为第i个神经元对应学习样本,σ为光滑因子.求和层分别对所有模式层神经元输出求解算术求和值传递函数SD和加权求和值传递函数SNj,最后得到输出层传递函数yj,其中j表示输出神经元个数.

(5)

1.4LSSVM模型

LSSVM继承了SVM的结构风险最小化原则,但在优化目标中采取误差的二范数作为损失函数,在预测方面,LSSVM有更好的精度和更快的速度[10].假设训练样本为(xi,yi)i=1l,其中,xi∈Rn为输入数据,yi∈R为相应的目标值.文献[19]将误差ei的二范数定义为损失函数J(ω,e),利用损失函数最小化原则确定最优线性决策y的参数,LSSVM优化问题变为:

(6)

式中,b为偏差量,Φ(xi)为LSSVM核空间映射函数,将原空间Rn映射到高维的空间Rm,那么权矢量ω∈Rm.LSSVM常用的核函数有多项式核函数、RBF核函数和Sigmoid函数,其中RBF核函数的参数较为容易,且当参数有效范围内改变时,空间复杂度变化小,易于实现.

2 模型输入输出量

短期需水量的预测依赖于用水量的历史数据,具有较强的周期性、趋势性.此外,需水量还受温度、湿度、节假日、日照、降雨量、风力等因素的影响,这些因素具有不确定性.下面对本文实例中模型输入输出量进行介绍.

2.1 实例输入量

本文采集了2014-12-02至2014-12-30某市某DMA的用水量数据,同时采集了天气、节假日等数据,主要包括日最高气温、日最低气温、天气、风力、节假日.本文中的ELMAN,GRNN,LSSVM模型将使用天气、节假日数据,部分数据如表1所示.

表1 天气、节假日的部分数据表

使用历史数据和用水量影响因素对ELMAN,GRNN,LSSVM模型进行训练,输入内容包括训练输入样本SInputtrain、训练输出样本SInputtest和预测输入样本SInputforecast,分别为:

a(i)=[a1,a2,…,a24]

(7)

d(i)=[a(i),b(i),c(i),c(i+1)]

(8)

(9)

SInputtest=[a(n+1)a(n+2) …a(m)]

(10)

SInputforcast=[d(m-n)d(m-n+2) …d(m)]

(11)

其中,a(i)为第i天历史需水量,a1,a2,…,ai为每小时的需水量数值,b(i)为第i天节假日情况,c(i),c(i+1)分别为第i天天气情况、第i+1天天气情况,由此得到第i天综合数据d(i).N为训练模型的天数,m值由历史数据训练样本天数决定,本文中,n=3,m=28.

对于ARIMA模型,输入向量由历史用水量数据组成:

e(i)=[a(1)a(2) …a(td)]

(12)

其中,td为连续的天数.对e(i)进行差分,通过自相关系数和偏自相关系数来判断ARIMA的3个参数p,d,q.

2.2 实例输出量

实例输出量为2014-12-30的小时需水量预测值,输出量格式与a(i)一致.预测后,将使用实例输出量与2014-12-30实际小时用水量进行比较,判断预测模型的优劣.

3 结果及分析

根据上述输入输出数据,分别运用ARIMA,GRNN,ELMAN,LSSVM预测模型进行实例预测.实验中,采用2014-12-02至2014-12-29共28 d共计672 h的用水量数据,分别建模预测2014-12-30的需水量.

3.1 ARIMA模型预测结果

首先对原数据进行周期性差分去除周期性和趋势性,差分后的数据与未差分数据比较如图1所示,此处进行的是一阶差分,即d=1.差分后的稳定数据的自相关系数和偏自相关系数如图2所示.

图1 差分前后数据

图2 样本自相关系数和偏自相关系数

从图2可以看出,自相关系数和偏自相关系数均具有“拖尾”性,则认定差分后的稳定数据为ARMA序列.本模型中使用最小信息准则(Akaike Information Criterio,AIC)来确定ARMA(p,q)中p,q的阶数,p=1,q=1,由此可以得出此次实验中模型为ARIMA(1,1,1).

根据式(12)得到ARIMA(1,1,1)预测曲线如图3所示,预测值曲线能够较好的与实际值曲线拟合.

3.2 ELMAN,GRNN,LSSVM模型预测结果

本文中ELMAN,GRNN,LSSVM模型分别根据式(7)-(11)创建训练样本和预测样本,样本训练方式为3 d的用水量数据预测1 d的需水量.3种模型预测曲线(包括含天气节假日因素和不含天气节假日因素)分别如图6-8所示.

3.3 预测结果分析

本文采用平均绝对百分误差(Mean Absolute Percentage Error, MAPE)、平均绝对误差(Mean Absolute Error, MAE)和均方根误差(Root Mean Square Error, RMSE)三个评价指标对预测结果进行分析.各类指标值越小,精度越高.相关系数反映的是2个变量之间的相互关系及其相关方向,其值越接近1,表示其相关性越好.各模型预测结果对比如表2所示.

图3 ARIMA预测曲线与实际曲线

图4 ELMAN预测曲线和实际曲线

图5 GRNN预测曲线和实际曲线

图6 LSSVM预测曲线与实际曲线

预测模型类别是否考虑用水量影响因素MAPE/%MAE/m3RMSE/m3相关系数ARIMAN 7.5937.0446.430.976ELMANN 6.2126.5331.680.987Y 5.3821.4226.560.991GRNNN13.4357.5469.740.947Y11.6652.5 68.330.965LSSVMN 5.8926.3333.210.986Y 5.4423.1830.880.987

根据表2及图3-6可知,4种预测方法从相关性和图形近似拟合上判断,均可用于实际需水量的预测.图5中,GRNN模型在8:00至14:00出现了较大的误差,其原因在于节假日2014-12-30当天早高峰用水比前几天的用水量减少很多,变化较大.而GRNN模型最后收敛于样本积聚较多的优化回归面,适用于数据较为稳定的情况,所以误差较大.

ARIMA模型也依赖于数据稳定性,在早高峰时间的预测值也出现了较大的误差.同时2014-12-30当天晚高峰用水比前几天有小幅上升,也对ARIMA模型预测产生了影响,所以ARIMA模型也不能很好地适用于具有不确定性的需水量预测.

由图4和表2可以看出,ELMAN模型不仅精度高,而且受数据变化的干扰小,达到了较好的预测效果,但是模型训练时间较长、容易陷入局部最优,且精度不稳定,较难推广至实际应用中.

由图6和表2还可以看出,LSSVM模型除了在早高峰8:00时产生了误差,绝大多数时段的预测具有较高的精度,精度稳定.此外LSSVM模型训练及预测速度快,具有更强的实用性.

最后,通过表2数据对比发现,ELMAN,GRNN,LSSVM模型在加入天气、节假日因素后,均能进一步提高预测精度.

4 结束语

本文通过对4种需水量预测模型(ARIMA,ELMAN,GRNN,LSSVM)的预测实例分析发现,4种模型均能用于DMA短期需水量预测,并且结合天气、节假日等用水量影响因素后能提高预测精度,并且基本达到了实际需水量预测的要求.对比4个需水量预测模型,LSSVM模型具有更好的预测效果和可行性.后续将根据用水量的周期性和趋势性,结合周边DMA用水量等因素作进一步研究,提高城市供水短期需水量预测的精度.

[1]张雅君,刘全胜.需水量预测方法的评析与择优[J].中国给水排水,2001,17(7):27-29.

[2]CAIADO J. Performance of combined double seasonal univariate time series models for forecasting water demand[J]. Journal of Hydrologic Engineering, 2010,15(3):215-222.

[3]吕谋,赵洪宾,李红卫,等.时用水量预测的自适应组合动态建模方法[J].系统工程理论与实践,1998,18(8):101-107.

[4]ZHOU S L, MCMAHON T A, Walton A, et al. Forecasting daily urban water demand: a case study of Melbourne[J]. Journal of Hydrology, 2000,236(3-4):153-164.

[5]吕谋,赵洪宾.城市日用水量预测的组合动态建模方法[J].给水排水,1997(11):25-27.

[6]LEE S J, WENTZ E A, GOBER P. Space-time forecasting using soft geostatistics: a case study in forecasting municipal water demand for Phoenix, Arizona[J]. Stochastic Environmental Research and Risk Assessment, 2010,24(2):283-295.

[7]张雅君,刘全胜.城市需水量灰色预测的探讨[J].中国给水排水,2002,18(3):79-81.

[8]JENTGEN L, CONRAD S. Energy management strategies use short-term water consumption forecasting to minimize cost of pumping operations[J]. Journal(American Water Works Association), 2007,99(6):86-94.

[9]戢钢,王景成,葛阳,等.城市小时级需水量的改进型引力搜索算法-最小二乘支持向量机模型预测[J].控制理论与应用,2014,31(10):1377-1382.

[10]俞亭超.城市供水系统优化调度研究[D].杭州:浙江大学,2004.

[11]ARBUÉS F, MARTNEZ-ESPIEIRA R. Estimation of residential water demand: a state-of-the-art review[J]. Journal of Socio-Economics, 2003,32(1):81-102.

[12]COOMES P A, KORNSTEIN B D, ROCKAWAY T D, et al. North America Residential Water Usage Trends[J]. Proceedings of the Water Environment Federation, 2010(9):6488-6500.

[13]ALVISI S, FRANCHINI M, MARINELLI A. A short-term, pattern-based model for water-demand forecasting[J]. Journal of Hydroinformatics, 2007,9(1):39-50.

[14]GATO S, JAYASURIYA N, ROBERTS P. Forecasting Residential Water Demand: Case Study[J]. Journal of Water Resources Planning & Management, 2007,133(4):309-319.

[15]GATO S, JAYASURIYA N, ROBERTS P. Temperature and rainfall thresholds for base use urban water demand modelling[J]. Journal of Hydrology, 2007,337(3):364-376.

[16]尹学康.城市需水量预测[M].北京:中国建筑工业出版社,2006:136-177.

[17]王小川.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013:196-200.

[18]FIRAT M, YURDUSEV M A, TURAN M E. Evaluation of Artificial Neural Network Techniques for Municipal Water Consumption Modeling[J]. Water Resources Management, 2009,23(4):617-632.

[19]SUYKENS J A K, LUKAS L, VANDEWALLE J. Sparse Least Squares Support Vector Machine Classifiers[J]. Neural Processing Letters, 1999,1(3):293-300.

Comparative Research on Short Term Water Demand Prediction of Urban Water Distribution System

HE Bishi, XIONG Xiaofeng, CAI Huaqiang, HONG Jiaming

(SchoolofAutomation,HangzhouDianziUniversity,HangzhouZhejiang310018,China)

Applied four methods including the ARIMA, ELMAN, GRNN and LSSVM to predict short-term water demand for a DMA instance. Considering the impact of water demand by weather conditions, temperature and holidays and other factors, so combined these factors can improve water demand forecast accuracy. The final results show that all four methods can be used for short-term water demand prediction, and the LSSVM method, which combined with weather and holiday factors, has higher prediction accuracy.

urban water distribution; water demand; ARIMA; ELMAN; GRNN; LSSVM

10.13954/j.cnki.hdu.2017.02.011

2016-09-18

国家自然科学基金资助项目(61233004,U1509205)

何必仕(1981-),男,浙江温州人,工程师,计算机软件与理论.

TU991.31

A

1001-9146(2017)02-0051-06

猜你喜欢
需水量用水量差分
RLW-KdV方程的紧致有限差分格式
新疆生产建设兵团某师用水水平分析与评价
数列与差分
你的用水量是多少?
你的用水量是多少?
澳大利亚研发出新型农业传感器可预测农作物用水量
南京城市中心区生态需水量探析
西藏地区作物需水量研究现状综述
贵州番茄需水量时空分布特征
成都市生态需水量研究