滑坡位移的动态概率预测模型

2015-12-16 08:21为,廉城,程
水文地质工程地质 2015年5期
关键词:石榴树滑坡概率

姚 为,廉 城,程 立

(1.中南民族大学计算机科学学院,湖北武汉 430074;2.华中科技大学自动化学院,湖北武汉 430074)

滑坡是一种常见的地质灾害,我国长江三峡地区是多发区域。目前在三峡库区布置了许多滑坡体状态的监测设备,用于研究滑坡演化规律并基于监测数据对滑坡灾害进行预报[1]。在滑坡监测的各项数据中,滑坡体的位移是描述坡体状态、实现灾害预报的最重要数据之一,而滑坡位移的预测也是滑坡灾害研究中的重要问题。

滑坡灾害的孕灾机理十分复杂,已有的研究还无法给出滑坡演化过程的精确机理模型。在此背景下,数据驱动模型被越来越多地用于滑坡灾害研究中,以作为机理研究的补充。特别是对于可以很自然地表达为统计学问题的滑坡位移预测,数据驱动模型确实为机理研究尚无法解答的问题给出了参考,因此,统计学方法和神经网络模型在滑坡位移预测研究中得到了广泛应用[2~4]。然而数据驱动模型并不足以解决机理研究的全部问题,而数据驱动模型的研究也容易陷入一些误区:

(1)在数据驱动的预测模型中,滑坡的演化机理往往被完全忽略。在预测中没有考虑滑坡影响因素的作用,甚至试图以时间为因变量建立滑坡位移预测模型,以此为基础获得的数据间的拟合关系事实上不符合实际。

(2)一些预测模型的选择并不适合滑坡的研究。已有的研究多将滑坡位移预测构造为静态的回归问题来进行求解,这一过程中,滑坡演化的动态系统本质无法得到体现,这构成了制约预测精度提升的障碍。

(3)确定性的位移预测,其参考价值有限。预测的目的是要为避险决策提供依据,而任何预测都不可能完全准确和可靠。简单给出位移的预测值,却没有预测结果可靠性的量化评价,并不利于决策者做出正确判断。

针对现有研究存在的上述问题,本文提出一种滑坡位移的动态概率预测模型。该模型在建模过程中考虑滑坡的主要影响因素的作用,以及滑坡演化过程本身的动态特性,并以概率的形式对滑坡位移的发展趋势进行全面的描述。

1 滑坡位移预测

1.1 影响因素分析

本文针对三峡库区内的白水河滑坡和石榴树包滑坡进行预测模型研究。白水河滑坡位于三峡库区秭归县长江南岸,其南北向长600 m,东西向宽700 m,滑坡体平均厚30 m,滑坡体的体积约1260×104m3。石榴树包滑坡位于巴东县境内,在长江右岸三峡大坝上游约66 km处。石榴树包滑坡总面积约0.25 km2,总体积约700×104m3。

滑坡演化的影响因素复杂多样,现有的研究条件下还无法全面把握。一般认为直接诱发滑坡灾害的两大主要影响因素是地震和降雨[5],本文主要考虑在没有地震发生情况下的滑坡演化规律;此外,三峡库区内的滑坡多分布于河流两岸,对于这类滑坡,河流水位的变化也是影响滑坡演化的重要因素[6]。因此,本文的研究将降雨与三峡库水位作为该区域滑坡位移的主要依据。

1.2 预测模型结构

无论是采用传统统计学方法,还是具有更强非线性关系表达能力的神经网络模型,预测模型都可以采用“输入-输出”的结构来表达,输出是位移的预测值,输入则是滑坡的各个主要影响因素。考虑到降雨、水位变化等因素作用于滑坡的滞后性,通常将包含延时的监测值作为模型输入。滑坡位移的预测问题是典型的时间序列预测问题,按照时间序列预测的思想,可以由滑坡位移的历史变化挖掘变化规律,从而对未来的变化趋势进行预测[7]。另一方面,滑坡内部的应力是造成滑坡位移的主要驱动力之一,而滑坡的位移则反过来改变滑坡的内部结构从而改变其内部应力。因此,不论是从统计学的观点还是从滑坡机理的角度,都应该将包含延时的位移监测值作为预测模型的重要输入量。

图1是基于以上分析得到的滑坡位移预测模型的外部结构示意图。其中d、r和l分别表示位移、降雨和库水位三个变量。考虑到监测过程的非连续性,预测模型具有离散系统形式,输入输出分别为三个变量在不同离散时间点上的数值。不同类型的预测模型均可以采用图示的结构进行表达,而不同模型采用的预测算法则决定了模型内部结构的差异性。

图1 滑坡位移预测模型的外部结构图Fig.1 The external structure diagram of landslide displacement predictors

1.3 变量选择

滑坡各个影响因素对滑坡演化的作用可能需要一个较长的时间才显现出来,因此预测过程中应尽可能考虑各输入变量的长期历史状态。然而实际过程中,并不是具有更多输入的预测模型就一定能取得更精确的预测结果。因此,如何对输入变量进行选择是决定预测模型性能的关键。

自回归模型等统计学预测方法,通常采用相关系数作为变量选择的依据。然而,相关系数描述的是变量间的线性相关性,而对于滑坡这类复杂的动态系统,变量间相关性往往是强非线性的。基于信息论的互信息,可以描述变量间的非线性相关性,在涉及变量选择的分类及预测问题中得到了广泛应用[8]。

对于滑坡位移预测问题,可以利用互信息来描述各个变量与滑坡位移相关性的大小。然而,考虑到各变量包含的位移相关信息之间可能存在的冗余,简单按照互信息大小顺序来选择输入量,并不能保证得到最优的输入变量集合。因此,真正具有实用价值的是MIFS(Mutual Information Feature Selection)[9]、MRMR(Min Redundancy Max Relevance)[10]等一些更复杂的互信息变量选择算法。这些互信息算法为滑坡位移预测模型的变量选择提供了理论依据,但也使得预测模型的建模过程变得更为复杂。而相关性最大化意义上的最优变量选择,事实上并不能保证预测精度的最优。

现有的预测模型,多是采用统计学方法或前向神经网络建立的静态模型,模型实现的变量间的静态映射关系,只是对滑坡发展变化动态过程的近似表达。滑坡位移影响因素的各个变量,以并行方式输入预测模型,变量间的时间先后关系被完全忽略。这两方面的原因,决定了静态模型并不适合于作为滑坡演化动态系统的表达方式,从而制约了位移预测精度和可靠性的提升。

2 动态概率预测模型

2.1 模型结构

基于滑坡演化的动态系统本质,本文采用递归神经网络(Recurrent Neural Network,RNN)来建立滑坡位移的动态预测模型,模型结构如图2所示。RNN区别于传统前向神经网络的一个主要特征,是网络内部节点不是分层排列,而是任意连接的。内部节点间的连接包含了延时环节并构成回路,这种连接称为递归连接。递归连接使得网络前一时刻的状态x(t-1)能够对后一时刻的状态x(t)造成影响,这种递归作用循环往复,构成了递归网络的“记忆能力”。以此能力为基础,网络的输入能够在较长时间内持续影响到网络的输出。因此,递归网络是描述滑坡演化的理想模型。

滑坡的影响因素通过网络的输入连接,作用于滑坡的内部状态,而滑坡的内部状态则通过递归连接不断发展变化。递归网络预测模型的运算逻辑如下:

式中:wi——网络输入连接的权值;

wo——网络输出连接的权值;

wx——网络递归连接的权值;

f——内部节点的非线性运算;

g——输出节点的非线性运算。

通过调整wi、wo和wx使递归网络具有与目标动态系统大体相同的非线性和动态特性,这一过程称为递归网络的训练。

图2 滑坡位移的递归神经网络动态预测模型Fig.2 The dynamic landslide displacement predictor built on a recurrent neural network

递归连接和延时环节使网络具有了动态表达能力,但同时也提高了网络的训练难度。本文采用回声状态网络(Echo State Network,ESN)模型[11]的思想来对递归神经网络的滑坡位移预测模型进行训练。递归网络的训练目标是要使网络输出的动态过程跟踪目标动态的发展规律。而根据ESN的思想,递归网络预测模型的功能可以分割为2个方面:首先生成动态过程,然后组合动态过程来跟踪目标系统。训练过程也相应分2步完成,第一步是在满足稀疏和稳定性的条件下给定网络的输入和内部连接权值,第二步则是以代价函数最小化为目标来对输出权值进行调节。对于长度为T的训练样本,输出权值的训练按下式进行:

式中:d—— 网络输出;

do——真实位移的监测值。

与一般预测模型相比,本文提出的基于ESN的动态预测模型具有以下优点:

(1)网络的输入变量按照时间先后顺序,串行输入到网络,这与滑坡演化的实际过程是相符的;

(2)由于几个主要影响因素在所有时刻的监测值都输入到了网络,因而不需要再进行变量选择;

(3)网络内部状态的动态演化也与滑坡体内部状态的演化过程相吻合。

2.2 概率预测

采用递归神经网络实现的ESN预测模型,与传统的静态模型相比,更符合滑坡演化的机理。然而ESN动态预测模型本质上仍然是一种数据驱动模型,如前所述,数据驱动模型是对机理模型的补充,为滑坡演化的机理研究提供参考而不能替代机理研究。机理研究的不充分,造成数据驱动的滑坡位移预测具有了不确定性。ESN动态模型的位移预测,其不确定性主要包含三方面的因素:

(1)预测结构的不确定性:ESN预测模型与一般预测模型一样可以用图1所示结构来描述。在此结构中,模型的输入只是部分已知且可观测的影响滑坡的主要因素,更多未知的或是难以监测的因素没有被考虑,这使得预测模型在本质上只能是实际系统的近似。

(2)ESN算法的不确定性:ESN模型在训练过程中,输入权值和内部连接的权值在满足稀疏性和稳定性条件的前提下随机赋值,这使得模型的内部结构具有随机性。

(3)数据的不确定性:滑坡状态相关各变量的监测数据不可避免地包含着测量误差,以这些数据为基础得到的数据驱动模型,也必然会因为数据包含的误差而具有了不确定性。

模型外部结构不确定性构成了预测结果的系统误差,而ESN算法的随机性以及测量误差带来的不确定性则构成了预测结果的随机误差。既然数据驱动模型预测结果不确定性不可消除,为了使得预测结构具有更实际的参考价值,应在提供滑坡位移预测值的同时,对该预测值的不确定性进行量化的评价。由此,本文引入概率预测[12]的思想,基于ESN动态预测模型,进一步提出滑坡位移的概率预测方法,具体步骤如下:

(1)将未知的滑坡位移看作随机变量,基于中心极限定理的思想,认为滑坡位移随机变量满足正态分布 do~N(ε,σ2)。

(2)ESN模型的训练方法使得基于相同数据集得到的模型并不完全一致。以此性质为基础,可以得到一个包含了N个独立子模型的模型集合。以各个模型预测结果的样本均值来估算位移随机变量的期望,即

(3)预测结果的不确定性由方差来表示。预测不确定性表现为随机误差和系统误差的组合,因此位移随机变量分布的方差也由对应的两部分组成。随机误差对应的方差部分用预测模型集合的样本方差来估计:

(4)系统误差对应的方差部分,则以训练样本集内全部T个样本上的均方误差来估计:

通过以上步骤实现了基于ESN的滑坡位移动态概率预测模型。

3 具体案例

3.1 白水河滑坡位移预测

白水河滑坡连续51个月的监测数据见图3。将数据集的前3/4作为训练样本来训练预测模型,其余数据用于对预测模型的性能进行测试。预测过程始于第38个月,对应着水库的汛期和滑坡演化逐渐活跃的阶段。

图3 白水河滑坡的水位、降雨及位移监测数据Fig.3 Water level,rainfall and displacement recordings for the Baishuihe landslide

将本文所提动态概率预测模型与传统的预测模型进行对比,需要首先基于互信息进行变量选择。按照MRMR算法进行变量选择。MRMR基于最大相关性和最小冗余的原则给出了不同输入维数下的最优输入变量组合。按照这些最优变量组合,以核极限学习机(kernel extreme learning machine,k-ELM)[13]建立预测模型,对测试样本集内的滑坡位移数据进行模拟预测,以预测结果的平均绝对百分比误差来评价预测模型性能,结果如表1所示。

表1 白水河数据集上变量选择与预测精度的关系Table 1 Prediction accuracies achieved using different feature combinations for the Baishuihe data set

变量选择算法并不能直接给出预测精度最大化意义下的最优预测模型结构。只有建立动态预测模型,改变输入变量的并行输入方式,才能解决变量选择的问题。图4所示是ESN动态概率预测模型预测结果均值曲线与静态预测模型预测结果曲线的对比,对应的误差值在表2中给出。其中k-ELM模型按照表1结果选择两个变量的组合作为模型输入;支持向量机模型SVM[14]采用与核极限学习机模型k-ELM相同的输入变量组合;经典统计学的模型灰度模型GM(1,1)[15]是基于单变量的预测模型,选择与k-ELM模型和SVM模型相同数目的输入变量。通过对比可以看出,本文所提ESN动态概率预测模型给出了最为精确的位移预测结果。

图4 白水河滑坡位移的预测结果对比Fig.4 Comparisons between displacement predictions of the Baishuihe landslide

表2 白水河滑坡的位移预测结果对比Table 2 Comparisons between different displacement predictions of the Baishuihe landslide

图5 白水河滑坡位移的概率预测Fig.5 Probabilistic displacement predictions for the Baishuihe landslide

由于采用了概率预测,本文所提的预测方法还可以对滑坡位移的取值范围及在各范围内的概率大小进行量化描述。图5是白水河滑坡位移的概率预测结果,表示了滑坡位移两种不同置信度水平(68%,95%)的预测区间。

3.2 石榴树包滑坡位移预测

对于石榴树包滑坡位移的预测,采用与白水河滑坡相同的手段进行处理。石榴树包滑坡71个月的监测数据见图6。数据按照与前文实验中相同的比例进行划分,预测过程始于第53个月,同样对应水库的汛期。需要指出的是,两个滑坡对应预测阶段的变化趋势有较明显的差别,石榴树包的位移变化相对平缓。

图6 石榴树包滑坡的水位、降雨及位移监测数据Fig.6 Water level,rainfall and displacement recordings for the Shiliushubao landslide

按照MRMR算法对石榴树包滑坡位移的预测模型进行变量选择,得到的结果如表3所示。MRMR算法并没有指定最优输入变量集的维数,而是同时基于互信息意义下的最大相关性和最小冗余度两个准则对变量进行排序。基于变量选择的结果构造静态预测模型,同时按照本文所提方法构造ESN动态概率预测模型,进行对比实验,结果如图7和表4所示。可以看出,ESN预测模型给出的滑坡位移期望值,与静态模型的确定性预测结果相比,更接近于位移的实际测量值。而静态模型基于表3的测试结果进行变量选择,事实上引入了后验知识,这在对未知数据的预测过程中是无法实现的。

表3 石榴树包数据集上变量选择与预测精度的关系Table 3 Prediction accuracies achieved using different feature combinations for the Shiliushubao data set

石榴树包滑坡位移的概率预测结果见图8。概率预测的信息丰富且直观,给出了滑坡位移的取值范围及相应的概率大小,这对滑坡灾害防治的决策过程能提供更有效的支持。

图7 石榴树包滑坡位移的预测结果对比Fig.7 Comparisons between displacement predictions of the Shiliushubao landslide

表4 石榴树包滑坡位移预测结果的精度对比Table 4 Comparisons between different displacement predictions for the Shiliushubao landslide

图8 石榴树包滑坡位移的概率预测Fig.8 Probabilistic displacement predictions for the Shiliushubao landslide

4 结论与讨论

针对滑坡位移预测中数据驱动模型普遍存在的问题,本文提出采用递归神经网络结构和ESN算法,建立滑坡位移的动态概率预测模型。该模型模拟了滑坡演化的动态发展过程,从而能更准确地预测滑坡位移;而通过对预测过程不确定性的定量分析,模型在给出预测结果的同时对预测结果的置信度水平进行了量化的评价。模型用于三峡库区不同类型的滑坡,对滑坡位移的发展趋势能给出准确的判断和全面的描述。所提模型不仅为滑坡灾害防治的决策过程提供了新的数据分析方法,同时也对传统数据驱动预测模型的研究提供了新的思路。相比传统模型,所提方法的优点主要体现在三个方面:

首先,滑坡演化的机理在模型中更多地得到体现。模型的外部输入输出结构,描述了滑坡位移和滑坡各个影响因素间的因果关系;模型的内部节点的状态演化过程则与滑坡内部状态的变化相对应;滑坡影响因素的长期作用,也由递归网络对输入的记忆效应进行了表达。

其次,由于ESN模型按照串行方式读取输入,因此不需要进行变量选择。这不仅简化了预测模型建模过程,更是彻底避免了由于不恰当的变量选择而使得模型的预测精度受到影响的问题。

最后,以ESN的多模型组合实现滑坡位移的概率预测。与传统模型的确定性预测相比,概率预测能提供更全面的信息,具有更大的参考价值,对决策过程起到更好的支撑作用。

[1] 王利,张勤,管建安,等.基于GPS技术的滑坡动态变形监测试验结果与分析[J].武汉大学学报(信息科学版),2011,36(4):422-426.[WANG L,ZHANG Q,GUAN J A,et al.Experiment results and analysis of the dynamic deformation monitoring of a kind of landslide based on GPS technology[J].Geomatics and Information Science of Wuhan University,2011,36(4):422-426.(in Chinese)]

[2] PAGANO L,PICARELLI L,RIANNA G,et al.A simple numerical procedure for timely prediction of precipitation-induced landslides in unsaturated pyroclastic soils[J].Landslides,2010,7(3):273-289.

[3] RAN Y F,XIONG G C,LI S S,et al.Study on deformation prediction of landslide based on genetic algorithm and improved BP neural network[J].Kybernetes,2010,39(8):1245-1254.

[4] 黄海峰,易武,易庆林,等.基于R/S分析方法的渐进式滑坡位移预测研究[J].水文地质工程地质,2014,41(5):95-100.[HUANG H F,YI W,YI Q L,et al.A study of displacement prediction of progressive landslide based on the R/S analysis method[J].Hydrogeology & Engineering Geology,2014,41(5):95-100.(in Chinese)]

[5] WENG M C,WU M H,NING S K,et al.Evaluating triggering and causative factors of landslides in Lawnon River Basin, Taiwan[J].Engineering Geology,2011,123(1/2):72-82.

[6] DU J,YIN K,LACASSE S.Displacement prediction in colluvial landslides, Three Gorges Reservoir, China[J].Landslides,2012,10(2):1-16.

[7] 徐峰,汪洋,杜娟,等.基于时间序列分析的滑坡位移预测模型研究[J].岩石力学与工程学报,2011,30(4):746-751.[XU F,WANG Y,DU J,et al.Study of displacement prediction model of landslide based on time series analysis[J].Chinese Journal of Rock Mechanics and Engineering,2011,30(4):746-751.(in Chinese)]

[8] KRASKOV A,STOGBAUER H,GRASSBERGER P.Estimating mutual information[J].Physical review E,2004,69(6):1-16.

[9] BATTITI R.Using mutual information for selecting features in supervised neural net learning[J].IEEE Transactions on Neural Networks,1994,5(4):537-550.

[10] PENG H,LONG F,DING C.Feature selection based on mutual information criteria of max dependency,max relevance,and min redundancy[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238.

[11] JAEGER H, HAAS H. Harnessingnonlinearity:predicting chaotic systems and saving energy in wireless communication[J].Science,2004,304:78-80.

[12] WAN C, XU Z,PINSON P,et al.Probabilistic forecasting of wind power generation using extreme learning machine[J].IEEE Transactions on Power Systems,2014,29(3):1-12.

[13] HUANG G B,ZHOU H M,DING X J,et al.Extreme learning machine for regression and multiclass classification[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2013,42(2):513-529.

[14] 林大超,安凤平,郭章林,等.滑坡位移的多模态支持向量机模型预测[J].岩土力学,2011,2(增刊1):451-458.[LIN D C,AN F P,GUO Z L,et al.Prediction of landslide displacements through multimode support vector machine model[J].Rock and Soil Mechanics,2011,2(Supl):451-458.(in Chinese)]

[15] 王冬,黄鑫,王明东,等.灰色GM(2,1)模型在滑坡变形预测中的应用[J].水文地质工程地质,2013,40(3):121-125.[WANG D,HUANG X,WANG M D,et al.Application of gray GM(2,1)model to prediction of landslide deformation[J].Hydrogeology &Engineering Geology,2013,40(3):121-125.(in Chinese)]

猜你喜欢
石榴树滑坡概率
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
石榴树想法妙
石榴树想法妙
概率与统计(一)
概率与统计(二)
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
流火
浅谈公路滑坡治理
基于Fluent的滑坡入水过程数值模拟