基于改进型ARIMA-GRNN模型的高边坡变形预测

2021-08-20 09:12段青达陈天伟田立佳郑旭东
桂林理工大学学报 2021年2期
关键词:监测点分量边坡

段青达, 陈天伟, 田立佳, 郑旭东, 陈 明

(1.桂林理工大学 a.广西空间信息与测绘重点实验室; b.测绘地理信息学院, 广西 桂林 541006;2.广西交投科技有限公司, 南宁 530012)

0 引 言

由于受降雨、 地下水、 风化等因素的影响, 原本稳定的高边坡极易出现滑坡现象[1]。为了保证工程施工和运行的安全, 对边坡进行长期监测并预测其变形趋势至关重要[2]。

目前常用的预测模型有: 时间序列分析预测法、 神经网络、 灰色模型、 遗传算法等[3], 各种预测模型都取得了一定的成果, 但也存在一定的局限性[4]: 灰色模型对样本数据具有很强的依赖性, 短期预测较好; 遗传算法训练时间长, 对参数的选择没有准确的标准; 而时间序列分析法能较好地突出高边坡位移变形随时间的变化关系; 神经网络具有很强的鲁棒性和容错性, 可以充分逼近任意复杂的非线性关系[5]。

本文提出了将差分整合移动平均自回归模型[6](ARIMA)与广义回归神经网络(GRNN)联合的方法运用到高边坡变形预测中, 利用ARIMA模型本质上只能捕捉线性关系而不能捕捉非线性关系[7]、 GRNN神经网络对非线性数据具有极强的映射能力[8], 将二者耦合, 组建ARIMA-GRNN模型。原始的观测数据中可能存在大量的噪声, 由于噪声的存在直接影响了观测数据的波动性[9], 致使ARIMA模型前期无法准确获取高边坡位移实际的变形趋势, 从而降低了GRNN神经网络后期的预测效果。现阶段研究发现, 常用的消噪方法主要有小波分析[10]与集合经验模态分解[11](EEMD)。 小波分析能有效提取低频有用信息, 但容易忽略中高频有用信息[12], 同时选择不同的小波基和分解层数, 对消噪效果的影响很大[13], 从而加大了小波分析消噪的难度。而集合经验模态分解通过观测数据自身的时间尺度对信号进行分解, 不需预先设定任何的基函数[14], 在处理非线性、 非平稳的信号序列方面具有明显的优势。 目前, EEMD消噪常用的方法主要通过筛选出高频的本征模态分量(IMF), 将其作为噪声直接剔除[15], 这样做虽然能达到一定的消噪效果, 但也丢失了高频IMF分量的细节信息, 而且其他频率的IMF分量中的噪声也不能有效地剔除。为了挑选出高频噪声信号中隐含的低频信号, 尽可能获取更多有用信号, 本文采用EEMD与奇异值分解(SVD)结合的方法实现对观测数据的消噪, 通过对观测数据进行EEMD分解(剔除观测数据中的低频闪烁噪声), 得到一系列本征模态分量, 实现信号的初次滤波; 再对EEMD分解后的各本征模态分量构建Hankel矩阵; 利用SVD分解对矩阵进行处理, 得到由大到小的奇异值, 其中噪声具有较小的奇异值, 有用信号主要会集于较大的奇异值, 将代表噪声信号较小的奇异值归零后进行SVD重构[16]; 利用SVD分解对周期性及平稳性信号降噪具有较好的不变性及稳定性[17]特点实现信号的二次滤波(剔除各IMF分量中的高频白噪声), 即可完成信号的消噪。

本文提出的基于EEMD-SVD的ARIMA-GRNN预测模型, 不仅能较好地滤除各IMF分量中的高频白噪声, 还能保留各自的细节信息, 在一定程度上降低了ARIMA-GRNN模型建模的难度, 将其应用到高边坡累积水平位移变形监测的预测当中, 以改良高边坡变形数据的预测结果。

1 算法介绍

1.1 集合经验模态分解(EEMD)

EEMD是经验模态分解(EMD)的一种改进方法, 它在很大程度上解决了EMD模态混淆的问题[18]。通过对原始信号的平稳化处理得到频率由高到低的一系列IMF分量和余量B[19]。EEMD分解步骤如下: 向高边坡观测数据的时间序列{x(t)}中多次加入强度相同但序列不等的正态分布白噪声信号, 将加入的白噪声信号看作一个整体, 进行EMD分解[20], 对多次得到的各IMF分量进行叠加求和, 再对每次得到的IMF分量作集成平均处理, 即可得到理想的IMF值。

1.2 奇异值分解(SVD)

SVD分解是一种以相空间重构矩阵为基础的非线性滤波方法[21], 能较好地滤除周期信号与平稳性信号中的噪声成分, 被广泛应用在信号处理中。对于任意一个实数矩阵Am×n可表示为

(1)

其中:U是m×m阶正交矩阵;Λ是m×n阶对角矩阵;V是n×n阶正交矩阵;Λ对角线上的元素(λ1,λ2, …,λn)即为A的奇异值;U和V分别为左奇异向量和右奇异向量。利用ATA的正交单位向量(v1,v2, …,vn)组成右奇异向量V。

(ATA)vi=λivi;

(2)

(3)

同理,AAT的正交单位向量(u1,u2, …,un)组成左奇异向量U。ω为奇异值, 在矩阵Λ中, 按照从大到小排列, 而且下降速度极快, 取前面若干大的奇异值近似描述矩阵, 再利用奇异值的逆运算即可得到重构后的信号。

1.3 差分整合移动平均自回归模型(ARIMA)

ARIMA模型常被写为ARIMA(p,d,q), 其中p是自回归项,d是差分次数,q是移动平均项数, 通过对ARMA模型d阶差分将非平稳的时间序列转化为平稳的时间序列[22]。定义一维非平稳高边坡观测数据的时间序列为{Gt}, ARIMA(p,d,q)模型可表示为

(4)

左小龙跨在摩托车上,目光迥然,神情坚定,包括泥巴在内的所有人都诧异的看着如同雕塑一般的左小龙,一时没有了言语。

1.4 广义回归神经网络(GRNN)

GRNN神经网络由4部分构成: 输入层、 模式层、 求和层和输出层[23]。它对处理非线性问题具有极强的映射能力和学习速度, 算法原理为: 设x为随机变量, 函数值为y, 真实观测值为H, 联合密度函数为g(x,y), 函数值y的预测值Z为

(5)

(6)

其中:σ为光滑因子,n为样本数量。

1.5 建立基于EEMD-SVD的ARIMA-GRNN模型

针对高边坡观测数据多噪声、 非线性的特点, 提出了一种基于EEMD-SVD的ARIMA-GRNN预测模型。首先利用EEMD分解滤除观测数据中的低频闪烁噪声, 其次通过对各IMF分量进行SVD分解, 滤除各IMF分量的高频白噪声, 对消噪后的各IMF分量分别建立ARIMA模型, 作线性回归预测, 将ARIMA预测后的结果叠加, 作为GRNN神经网络的输入层进行训练, 即可得到最终的预测结果。算法流程如图1所示。

图1 基于EEMD-SVD的ARIMA-GRNN建模流程图

2 实验分析

2.1 数据处理

高边坡变形数据的预处理分为两个步骤: 1)设监测点的变形位移时间序列为Zm(m=1, 2, …,n), 对Zm作一阶差分得Dm, 差分序列Dm的均值为CDm, 标准差为σ, 即当|Dm-CDm|/σ>3时, 则认为是奇异值(粗差), 取相邻两点Zm-1与Zm+1的均值代替Zm点; 2)由于高边坡监测数据x、y(x为EW方向形变位移,y为SN方向形变位移)在一天内的数值变化不大, 故将监测数据按天进行平滑, 采集频率为1次/h, 即每24 h取一次平均。

图2 BD02、BD06监测点累计水平位移观测值

BD02、 BD06累积水平位移在120 d内波动性较强, 无明显的规律可循, 若直接用于建模, 很难达到理想的效果, 故对前105 d的数据进行消噪处理。在真实的高边坡观测数据中, 包含真实值与噪声两部分, 为了剔除观测数据中的噪声, 首先对观测数据进行EEMD分解, 得到6个本征模态分量, 再利用SVD分解将各IMF分量噪声分离, 即可得到纯净的IMF值。SVD分解噪声分离原理: 随机取一组IMF分量的观测序列为Y={y(1),y(2), …,y(N)}, 构造Hankel矩阵

(7)

W=Z+T。

(8)

通过式(1)将W分解为

(9)

式中: 下标z表示真实序列的相关矩阵,t表示噪声序列的相关矩阵。 通过SVD分解找出前面若干大的奇异值, 去除代表噪声信号较小的奇异值, 即可完成对噪声的分离。

对监测点BD02、 BD06观测数据前105期进行EEMD和EEMD-SVD消噪处理。由图3a、 图4a可以看出,IMF1为第一高频部分, 包含了观测数据中的噪声、 周期误差等, 经过EEMD-SVD消噪处理后, 明显降低了IMF1分量的波动性, 同时也保留了该分量的细节信息; 图3b、 图4b为第二高频部分, 包含了观测数据中的噪声、 周期误差的残余量等, 通过EEMD-SVD消噪处理后, 使得消噪后的曲线整体上更加平滑, 在一定程度上降低了该分量的波动性; 图3c、 图4c为第三高频部分, 包含了观测数据中的噪声、 周期误差分量的残余量等, 消噪处理后的曲线在拐点与极值点处变的更加平滑; 图3d—f、 图4d—f为低频部分, 经过EEMD分解后趋势已经十分明显, 波动性也较小, 消噪前与消噪后并未发生太大变化。

图3 BD02监测点各频率分量与去噪后效果对比

图4 BD06监测点各频率IMF与去噪后效果对比

2.2 预测模型

2.2.1 EEMD-SVD-ARIMA预测模型 通过对BD02、 BD06监测点观测数据的EEMD-SVD处理, 得到6组消噪后的数据, 每组包括105期数据, 以此作为训练样本, 分别对各分量建立ARIMA(p,d,q)模型, 预测后15期数据, 对于得到的6组预测结果叠加求和, 即为ARIMA(p,d,q)模型的预测输出。ARIMA模型建模参数如表1所示。

表1 各监测点建模参数

2.2.2 EEMD-SVD-GRNN模型与基于EEMD-SVD的ARIMA-GRNN模型 EEMD-SVD-GRNN模型构建的思路: 选取BD02、 BD06监测点观测数据EEMD-SVD消噪后的6组数据叠加, 分别作为基于GRNN神经网络的输入层、 模式层、 求和层传递函数, 为了避免过拟合现象, 以后15期观测数据作为输出层。

EEMD-SVD的ARIMA-GRNN模型的实现步骤为: 选取BD02、 BD06观测数据消噪后的6组数据分别构建ARIMA模型, 结合预测的15期数据, 共计120期数据, 对各分量叠加求和, 即ARIMA模型的预测值作为GRNN神经网络的输入层、 模式层、 求和层传递函数, 为了避免局部最小值问题, 以后15期观测数据作为输出层。

建立GRNN神经网络预测模型时, 光滑因子的选取尤其重要, 本文通过交叉验证和循环训练的方法, 得出最佳的Spread值。当BD02、 BD06的光滑因子分别为1.4、 0.7时, GRNN神经网络预测效果最佳; 当BD02、 BD06的光滑因子分别为0.7、 0.5时, EEMD-SVD-GRNN模型外推能力最强; 当BD02、 BD06的光滑因子分别为0.8、 0.4时, 基于EEMD-SVD的ARIMA-GRNN模型对样本数据的逼近能力最强, 图5为BD02、 BD06交叉验证后的均方误差。

图5 各种模型下不同光滑因子的均方误差

2.3 精度评定标准

为了验证基于EEMD-SVD的ARIMA-GRNN模型的有效性, 本文选取均方误差(MSE)、 平均绝对误差(MAE)、 平均相对误差(MRE)、 相关系数(R)作为精度评定的标准。

(10)

(11)

(12)

(13)

2.4 预测结果分析

本文利用基于EEMD-SVD的ARIMA-GRNN预测模型对高边坡累积水平位移变形数据进行预测, 为检验该模型的合理性和可行性, 选取BD02、 BD06监测点前105期变形数据进行建模, 分别运用ARIMA模型、 EEMD-SVD-ARIMA模型, GRNN神经网络模型、 EEMD-SVD-GRNN模型, ARIMA-GRNN模型和基于EEMD-SVD的ARIMA-GRNN预测模型对剩余的15期数据进行预测。

预测结果如图6、图7所示。ARIMA预测模型整体趋势和观测值的趋势基本一致, 但存在一定的滞后性, 相当于将观测值曲线向右平移1个单位, 而消噪后的ARIMA模型更能反映观测值的实际走势(图6a); ARIMA模型整体残差较大, 尤其在115、 116、 117期预测曲线明显偏离。实际观测值的曲线波动性较大, 而未消噪的GRNN神经网络预测曲线表现的“过于平稳”, 经EEMD-SVD消噪后的预测曲线波动性更强, 整体残差更小(图6b)。基于EEMD-SVD的ARIMA-GRNN模型在短期内反应更加灵敏, 在108、 112、 116期拐点处相较与ARIMA-GRNN模型有了明显改善(图6c)。相较于消噪后的ARIMA模型、 GRNN神经网络模型, 本文提出的基于EEMD-SVD的ARIMA-GRNN预测模型整体残差最小, 更接近观测值的实际趋势: 112~113期, 本文模型和观测值都为上升趋势, 而另外两种模型为下降趋势; 108、 111、 116期拐点处和另外两种模型相比更贴近观测值(图6d)。根据精度评定标准得到各模型的预测情况如表2所示。

表2 各模型预测精度对比

图6 监测点BD02第106—120期各模型累计水平位移预测结果

图7 监测点BD06第106—120期各模型累计水平位移预测结果

经过EEMD-SVD消噪处理后, 各预测模型的精度都有所提高。BD02监测点的结果表明, 本文模型相较于EEMD-SVD-GRNN模型MAE、MSE、MRE分别减少了32.28%、 71.03%、 31.91%,R增加了6.83%; 相较于EEMD-SVD-ARIMA模型MAE、MSE、MRE分别减少了34.95%、 50.14%、 34.69%,R增加了3.76%。本文模型在BD06监测点同样适用, 消噪后模型的精度高于不消噪的模型, 与EEMD-SVD-GRNN模型相比, 本文模型MAE、MSE、MRE分别减少了53.15%、 79.22%、 43.54%,R增加了0.19%; 而与EEMD-SVD-ARIMA模型相比,MAE、MSE、MRE分别减少了53.70%、 75.04%、 57.18%,R增加了0.15%。

综上所述, 本文提出的基于EEMD-SVD的ARIMA-GRNN预测模型应用在高边坡变形预测中, 具有较高的适用性和外推能力。

3 结 论

本文提出了基于EEMD-SVD的ARIMA-GRNN预测模型, 通过对高边坡变形数据的研究发现, 实际的高边坡观测数据中, 由于受多种因素的影响, 常存在噪声, 噪声的剔除应成为变形预测研究中必不可少的步骤。针对高边坡观测数据非线性、 复杂性问题, 通过对比分析, 该模型能较好地剔除观测数据中的噪声, 并且预测精度优异, 为高边坡变形预测的研究提供了一种立竿见影的方法。

猜你喜欢
监测点分量边坡
天津南港LNG接收站沉降监测点位布设
抚河流域综合治理监测布局优化
陡帮强化开采边坡立体式在线监测技术研究
边坡控制爆破施工
全站仪极坐标法监测点稳定性分析方法研究
二维极限平衡法在高边坡工程中的应用研究
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
水利水电工程高边坡的治理与加固探讨