基于ARIMA模型对工业总产值数据分析

2019-12-20 12:04
新营销 2019年8期
关键词:差分运算建模

(天津财经大学 天津 300000)

一、问题及背景

随着科学技术水平的迅猛发展,国家的工业化水平是衡量该国家综合经济实力强弱的重要参考。一个国家的工业发展决定了国家的经济发展水平。因此各个国家都在积极地发展本国的工业。对工业总产值数据进行统计分析,找出数据所蕴含的内在规律,建立适当的数学模型,根据模型对未来做出预测,提出相应的政策和策略,对于提高工业水平以及国家的经济水平有重大的作用。而对于预测问题,时间序列分析一直受到广大经济学者的青睐。

实际生活中,时间序列分析的应用场景十分广泛,应用时间序列分析的一般目的是:通过给出的序列数据建立适当的数学模型,根据模型来预测未来事物的发展情况。通常经济学者能够通过在相应时间点来观察所获取数据。例如,股票的日开盘价、某海域的每天的水位变化情况、每毫秒心电的活动情况、月价格指数、商场每月的销售量、工厂年生产量等经济数据。在观察这些数据的同时找到数据之间的相关性和规律性,利用数据规律拟合合适的模型,利用数学模型对事物未来的发展情况和走势进行预测。ARIMA模型便是此中最为主要的方法之一。

本问题中利用我国2008年1月至2015年12月工业总产值的月度资料,并用Eviews以及SPSS等统计软件对数据进行时间序列分析,进一步得出适当的时间序列模型,根据历史数据对未来工业总产值进行预测。

二、时间序列分析的发展

时间序列分析起源于古埃及。古埃及的发展很大程度上依靠尼罗河,当时的当地居民就将尼罗河水位的涨落情况连续记录下来,从而构成时间序列数据。通过对这个时间序列长期的观察,当地居民发现了尼罗河的水位涨落的规律与趋势,正因如此,使古埃及的农业得到了迅速的发展。正因为先进的农业,古埃及成为了四大文明古国之一。这种从观测序列得到直观规律的方法即为描述性分析方法。时间序列分析在经济、工业等研究领域有重要的应用价值,时间序列分析的发展与其在各个领域中的应用密不可分。

近代的时间序列分析起源于统计学家Yule,他在1927年提出了自回归(AR)模型。该模型与英国统计学家Walker在1931年提出的移动平均(MA)模型组成ARMA模型,成为了时间序列分析的基础,直到现在仍然被广泛地应用于各个领域的研究中。

在经济领域的研究中,有个问题不可避免,就是金融数据会存在异方差问题。对于异方差问题,经济学家Engle提出了自回归条件异方差(ARCH)模型。ARCH模型假设如下:在同一时刻,序列的噪声服从均值为0,方差是一个随时间变化的量的正态分布。作为一种全新的模型,该模型在近代得到了极大的应用与发展,也已被广泛地用于经济市场的研究中。ARCH模型是近代经济学中的重大创新。

随着时间序列分析研究的发展,时间序列分析的应用范围也在不断扩大。目前,时间序列分析已涉及天文、地理等研究领域,在国民经济、金融市场、股票市场、医学工程、核工程、遥感技术等领域,时间序列分析均取得了重大的研究成果。

三、时间序列分析基础知识

时间序列分析是一种定量预测的分析方法,它包括一般统计分析、数学模型的建立与推断,以及对时间序列未来发展趋势的预测。传统的统计分析方法都是建立在数据独立性的基础上,与传统统计分析不同,时间序列分析则是建立在时间序列数据之间存在互相依赖关系的基础上。时间序列分析实质上就是对随机过程进行统计分析,因此,时间序列分析也可以认为是随机过程统计的一部分。例如,某单位记录了某片海域第一天,第二天,…,第N天的水位高度,然后利用时间序列分析对这些时序数据进行建模,利用模型可以对未来的水位进行预测监控。

时间序列分析的基本思想:记录某事物在一段时期内连续的变化,对序列数据进行观察,找出蕴含的规律,选择建立适当的数学模型来反映数据中所蕴含的相互依存关系,对模型进行检验,接着利用通过检验的模型对事物的未来发展趋势进行相应预测。

时间序列分析的基本假设原理如下。

第一,事物的发展趋势具有一定的延续性,通过总结数据历史变化规律,就能够推测出事物未来的发展变化趋势。

第二,事物的发展趋势具有随机性,是指任何事物都会受到随机误差的干扰。因此在对数据进行建模分析之前,首先要用加权平均的方法来对历史数据进行预处理,消除随机误差项对数据的影响。

时间序列建模基本步骤如下。

第一,用统计调查等方法获取一段连续时间内的序列数据。

第二,根据序列数据做出相应的散点图、自相关图并对时间序列数据的平稳性进行检验。对于不平稳的时间序列,应进行适当阶数的差分运算,直至序列转化为平稳时间序列。

第三,识别模型,对于短期或简单的时间序列数据,可以使用趋势模型或是季节模型,加上误差项建立模型。对于平稳序列,可用选择使用自回归滑动平均模型(ARMA模型)及其特殊情况的自回归模型、滑动平均模型或组合-ARMA模型等模型对序列进行分析建模。

第四,根据经验总结,当序列中元素的数目多于50个的时候,一般都会采取ARMA模型对序列数据建模。而对于非平稳的时间序列,则首先需要进行适当阶数的差分运算,使序列转化为平稳时间序列,再使用适当的模型去拟合差分后的平稳序列。本文所采用的模型是ARIMA模型,即先对序列进行差分运算使之平稳化,再对差分后的序列使用ARMA模型进行建模。

四、ARIMA模型基础知识

(一)ARIMA模型结构

ARIMA模型,即差分整合移动平均自回归模型,是重要的时间序列分析模型之一,又称整合移动平均自回归模型。ARIMA模型会降预测事物的观察值按照时间顺序进行相应排序从而生成一个随机序列,该序列会随着时间的变化而发生变化,序列的变化可以通过自回归移动平均产生,即该时间序列可以由时间序列本身的历史数据或者滞后项以及随机扰动项来进行解释。ARIMA(p,d,q)模型中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使分平稳序列成为平稳序列所做的差分次数(阶数)。

ARIMA模型的实质就是差分运算与ARMA模型的组合。对任何的非平稳序列,如果能通过适当阶数的差分运算使之平稳,就可以对差分后的平稳序列进行ARMA模型拟合。ARMA模型的建模过程与分析方法已经非常成熟,这就意味着对非平稳序列的时间序列分析也将会变得十分简单与可靠。

(二)ARIMA建模流程

第一,对序列数据画出对应的散点图、自相关图以及偏自相关函数图,求出自相关函数,进行平稳性检验。

第二,如果序列非平稳,进行差分运算对序列进行平稳化处理。

第三,根据所识别出来的特征选择相应的时间序列模型进行建模。

第四,参数估计,对模型参数进行初步估计并检验参数的显著性。

第五,通过Q-Q图等检验来判断(诊断)残差序列是否为白噪声序列。

第六,使用最终的模型对数据进行预测,将模型的预测值与事物的观察值进行比较,检验模型的预测精度。

五、ARIMA模型建模过程

(一)判断序列平稳性

将数据导入Eviews中并画出序列的时序图,从时序图中可以看出有上升趋势和周期性,所以该时间序列数据不具有平稳性。因此接下来要进行差分运算。

(二)差分运算

在Eviews得到差分序列的时序图。同理,可以得到d2=d(data,1,4),周期为4的时序图,接着按照同样的方法可以得到d3=d(data,1,12),周期为12的时序图,可以发现,观察图像后发现在进行差分运算后时间序列数据基本平稳。接下来要做出差分序列的自相关图并进行观察。

(三)做出差分序列的自相关图

在Eviews可以得到相应的自相关图,在自相关图中由Q值对应的Prob可以得到,各滞后阶数均显著,说明差分后的序列不具有纯随机性,时序图显示具有平稳性。(此处选择d3(series),其相对于d1,d2可以更好地根据ACF和PACF选择模型)。

根据自相关图进行模型识别,并做参数估计及显著性检验。经过分析,ACF一阶截尾,且12步截尾,PACF拖尾,可以选择模型:

ARIMA(0,1,1)×(0,1,1)12

用Eviews对上述模型进行参数估计,具体操作:Quick→Equation→输入d(data,1,12)ma(1)sma(12)→OK就得到如参数估计表。可以得到其参数估计值分别等于-0.613与-0.2342,且参数均通过显著性检验,说明模型是可行的。

接下来要对残差进行Q检验,残差对应的各阶Prob均未通过显著性检验,说明残差项为白噪声序列。

对1998年的工业总产值进行预测,由于选择的是静态预测,只能做一期预测(2016M01)

从得出的预测图中看出:2016年1月的工业总产值为12 000.5亿元且预测平均误差为196.5亿元。而经过调查后发现,该地区2016年1月真实的工业产值为11 863.5亿元。通过预测值与真实值进行比较发现误差较小,说明得到的ARIMA模型比较可靠,因此可以利用该模型对当地的工业产值预测。

总结

本文基于某地区的工业总产值历史数据进行时间序列分析并建立了ARIMA模型,模型各项指标均通过了检验,且模型也能够很好地对未来的工业总产值数据预测。

这也说明,时间序列分析在工业产值、国民经济、经济市场等领域有重要的作用,能够很好地对这些领域的相关数据进行分析与预测。

猜你喜欢
差分运算建模
重视运算与推理,解决数列求和题
数列与差分
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
有趣的运算
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
拨云去“误”学乘除运算
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
三元组辐射场的建模与仿真