基于熵权法的滑坡危险性评价
——以贵州省晴隆县为例

2022-07-09 07:46朱新婷吴彩燕谭秋焰
桂林理工大学学报 2022年1期
关键词:权法危险性滑坡

朱新婷, 吴彩燕, 谭秋焰, 廖 军

(西南科技大学 环境与资源学院, 四川 绵阳 621010)

0 引 言

自然灾害是人类社会面临的共同挑战。滑坡具有分布广、突发性和破坏性强等特点, 给社会经济发展带来了不可估量的损失, 并呈现出急剧上升的态势。为应对滑坡灾害带来的一系列问题, 全球正大力开展防灾减灾的有效途径, 滑坡危险性评价的研究成为当前滑坡灾害研究的一大热点。滑坡灾害的发生和频率往往是多种因素共同导致的结果[1], 因此从滑坡成因入手, 选取适合不同区域的评价指标对滑坡进行危险性评价, 对于准确、客观地提出防治措施意义重大。

目前, 进行滑坡灾害危险性评价的方法主要有定性和定量两大类[2], 常见的方法有专家经验法[3]、层次分析法(AHP)[4]、模糊综合评价法[5]、信息量法[6]、逻辑回归法[7]、随机森林法[8]、Newmark法[9]等。Asmelash等[4]借助GIS平台, 提取7个评价因子, 利用AHP对塔尔马伯区进行滑坡危险性评价; Kumar等[7]基于遥感和地理信息系统, 采用二元逻辑回归模型得出因子与滑坡的关系。国内,Chen等[8]运用3种算法对陕西陇海地区进行滑坡危险性评价并比较评价结果; 林高聪等[9]基于滑坡易发性评价, 采用Newmark模型结合设定地震法研究了滑坡复活和斜坡失稳等问题, 对潜在震区地震诱发滑坡进行了危险性评价; 杨宗佶等[10]选取重庆云阳县18个典型岩质滑坡为研究对象, 基于多类数据提取出9个评价因子, 利用熵权法计算各评价因子权重并得出研究对象危险度; 乔建平等[11-12]利用贡献率与权重的转换模型对三峡库区云阳—巫山段和重庆市万州区进行滑坡危险度区划。

早期的地质灾害评价大多以定性方法为主, 经过长期的使用与验证现已发展得较为成熟, 且具有操作难度低的优点, 但易受主观影响, 理论说服力较差。定量方法在近十几年有着快速发展, 其具有较强的客观性, 研究结果也较为简洁、准确, 然而定量方法需要大量数据的支持, 并且部分评价因子数据难以量化, 因此操作起来具有一定难度。为得到更精准、客观的评价方法, 越来越多的学者将定性和定量相结合的方法应用于滑坡危险性评价。

滑坡危险性评价的重点工作是综合选取滑坡评价因子和确定其权重。本文以贵州省晴隆县为研究区, 在ArcGIS和SPSS的支持下, 根据吴常润等[13]的研究, 结合研究区实际环境背景提取评价因子并对其进行相关性分析获得影响滑坡发生的内部因子, 暂不考虑滑坡诱发因素(如降雨、地震等),借助熵权法对评价因子进行客观赋权, 构建定性与定量相结合的多因子评价模型, 完成对研究区滑坡危险性评价工作, 并用ROC曲线对评价结果进行验证, 得出评价结果。

1 研究区概况及数据源

1.1 研究区概况

晴隆县位于贵州省黔西南州西南部, 地理坐标东经105°01′—105°25′, 北纬25°33′—26°11′, 全县总面积约1 309.8 km2, 与关岭县、水城县、兴仁县、普安县相邻, 南北长69 km, 东西宽33 km, 整体呈南北长东西窄,研究区地理位置如图1所示、地质图见图2。

图1 研究区地理位置

图2 研究区地质图

1.1.1 地形地貌 晴隆县位于云贵高原中部, 该地区地貌特征主要为典型喀斯特地貌, 受北盘江水系的切割, 地形起伏较大, 形成了广泛的山地景观, 最大切深可达700余m, 属深切割岩溶侵蚀山区, 海拔高差达到了1 482 m。因此, 该县具有“山高坡陡谷深”的特点。地貌以低、低中和中山为主, 分别占11.68%、20.75%、59.24%。

1.1.2 地质条件 研究区地层发育较为齐全, 地层由第四系到侏罗系均有出露, 滑坡区主要发生于中二叠统和下三叠统; 岩性主要是以石灰岩和砂岩为主, 其次是页岩、白云岩、玄武岩等。受地质构造影响, 区内褶皱发育, 主要位于北部地区, 滑坡主要为土质滑坡; 西南部地区构造多以断裂呈现, 呈北东向和北西向及近东西向, 多发育岩质滑坡。

1.2 数据源

本研究所采用的滑坡灾害点数据是通过收集研究区滑坡资料结合遥感解译的统计结果, 共有93处已知滑坡点, 其中小型滑坡 57处, 中型滑坡34处, 大型滑坡2处。与滑坡危险性评价因子有关的基础数据包括: 分辨率为30 m×30 m的数字高程模型(DEM); 晴隆县Landsat 8 TM遥感影像; 晴隆县1∶5万地质图。

2 评价体系的建立

首先收集了研究区的地质灾害情况、地理环境等资料。基础数据是进行评价的前期准备工作, 从中筛选出对滑坡影响较大的因子参与评价体系与评价模型的建立, 利用熵权法和重分类对因子进行赋权与赋值, 通过叠加空间数据计算得到滑坡危险性区划图, 并对其结果进行分析与验证, 具体评价流程见图3。

图3 滑坡危险性评价流程

2.1 评价因子的选择

滑坡是一种危害性极强的自然灾害, 大多发生在山区, 具有极强的危险性和破坏性。滑坡灾害的发育和发生往往受到多种因子的共同制约, 因此, 构建滑坡评价体系之前, 首先要先确定参与的评价因子。评价因子的选取需要参考研究区和数据获取情况。根据提取地形因子差分计算的阶数, 可将地形因子大致分为3类, 具体见图4。本文以地形因子作为评价因子的基础, 以DEM为基础数据, 利用ArcGIS的空间分析功能统计出12个地形因子与滑坡的关系,其中地形起伏度的最佳分析窗口大小通过最大高差法求得[14]。

图4 滑坡危险性评价体系地形因子分类

通过对12个地形因子进行分类处理得到研究区滑坡灾害危险性基础评价因子。由于评价因子之间存在着不同程度的相关性, 为降低后续叠加计算模型的复杂化, 通过软件分析各因子之间的相关性强弱, 删去具有强相关性的因子, 以消除冗余, 选取相关性较弱的因子或相互独立的因子[15]。在自然科学领域中, 皮尔逊相关系数(Pearson)能准确度量X和Y变量之间的强弱相关关系, 被广泛应用于医学研究、风险预测等方面, 其值介于[-1, 1]。对于样本中的变量X=[x1,x2, …,xn]T和Y=[y1,y2, …,yn]T, 皮尔逊相关系数通常用r表示为

(1)

利用ArcGIS多值提取至点功能获取模型所需的研究区滑坡点属性数据, 滑坡影响因素提取如图5所示。将获取的各评价因子数据组成滑坡灾害危险性评价数据库[16]。借助主成分分析将地形因子进行降维处理, 地表粗糙度、地形起伏度、高程变异系数、地表切割深度、坡度5个因子合并为主成分一, 本文称“地形综合指数”。在SPSS软件相关性分析工具中多次加入滑坡影响因子数据, 以验证的方法选取因子, 并得到因子间的皮尔逊相关性系数(表1), 通过相关性分析对相关性强的因子进行剔除, 选取地形综合指数、坡向、坡形因子、坡度变率(SOS)、坡向变率(SOA)、归一化植被指数(NDVI)、地层岩性以及距水系距离进行模型训练。

表1 滑坡评价因子间皮尔逊相关性系数

图5 滑坡影响因素提取图

2.2 评价单元的划分及训练样本集的选择

评价单元的划分方式直接影响了评价模型的建立和精度。目前, 常用在滑坡危险性评价的评价单元有: 栅格单元[17]和斜坡单元[18],其中斜坡单元是滑坡、崩塌等地质灾害发育的基本单元, 其划分依靠高程数据, 通过提取山脊线和山谷线组成的地形作为斜坡单元, 然而这种方法受主观因素的影响, 使其划分出的单元具有不准确性, 加大了计算难度; 栅格单元叠加大量空间数据具有明显的速度优势且操作便捷, 评价单元的大小又关乎计算的复杂程度以及最后的评价结果[19]。因本文DEM数据的空间分辨率为30 m, 故设置30 m×30 m分辨率的栅格单元作为滑坡危险性评价的基本评价单元, 共划分2 319行, 1 362列, 共计1 454 206个栅格单元。

在样本选择中, 将93个已知滑坡灾害点作为正样本。为保持样本个数的平衡, 以滑坡点为中心作100 m缓冲区为滑坡区域, 其余区域为非滑坡区域, 在非滑坡区域随机选取与灾害点相等数量的非灾害点为负样本[20]。正负样本作为模型的样本集, 故而可以将样本数据分为两类。选取样本集中70%的灾害点和相同数量的非灾害点作为训练样本, 其余30%的灾害点和相同数量的非灾害点作为验证样本。

2.3 熵权法

为避免对评价因子进行无权重的迭加计算及人为主观干扰导致的评价结果不准确, 本文充分利用滑坡的属性信息, 综合多方面因素选取研究区内影响滑坡发生的评价因子, 选用基于信息熵理论的熵权法来确定各评价因子的权重。熵权法是一种客观赋权法, 它通过对数据的计算辨析出各因素之间的差异程度, 从而计算出各因素的权重, 给多因素综合评价提供依据, 具有很好的解释性[21]。在滑坡危险性评价研究中引入熵思想, 根据滑坡数据提供的信息熵, 可客观确定出影响滑坡发生发育的各评价指标权重。以晴隆县为例介绍熵权法的计算步骤: 现有n=8个评价指标,m=93个滑坡对象, 组成原始数据矩阵Ri×j

其中,i=1, 2,…,n;j=1, 2,…,m。

由于每项评价指标的单位和属性不同, 因此需要先统一基础数据, 作标准化处理, 即将原本评价指标的特殊值统一为相对的标准值, 将其标准化值记为Ri×j′。

正向指标

负向指标

从而得到标准化后的新矩阵:

第j项评价指标下第i个样本值占该评价指标的比例

(2)

计算第i个评价指标的熵值, 记为

(3)

式中:Pij为因子出现的概率。进一步计算出相对应的权重, 记为Wi, 计算公式为

(4)

根据上述计算步骤, 各评价指标熵值及权重见表2。可知, 熵值能直接反映出滑坡各评价指标的贡献程度, 确定出每个评价指标的权重。其中, NDVI和坡形因子的影响程度较小, 因此熵值就越大, 权重占得越小; 而距水系距离和坡向变率的影响程度较大, 因此熵值就越小, 权重占得越大。

表2 滑坡危险性各指标计算结果

2.4 评价模型

综合评价模型是分析因变量(是否发生滑坡)和一系列自变量(影响滑坡因素)之间的组合关系。在这种类型的分析中, 所有相关因素都以30 m×30 m的栅格为单位进行采样。

本文采用的综合评价模型是在确定评价指标体系基础上, 代入熵权法计算出的权重[22], 借助ArcGIS软件重分类工具进行赋值, 赋值依据范围内存在滑坡数量, 最终根据综合评价模型表达出研究区的滑坡危险性程度。综合评价指数为

(5)

式中:S为滑坡危险性指数;wi为评价因子权重;bi为评价因子分值。根据综合评价指数在ArcGIS中用栅格计算器进行叠加分析。

3 评价结果

3.1 评价结果分析及比较

利用熵权法和ArcGIS的重分类功能得到训练样本的评价因子权重和分值, 在ArcGIS中根据式(5)进行栅格叠加计算, 得到训练区的综合栅格图层, 其数值范围在1.6~5.0。利用ArcGIS进行滑坡危险区划等级方法的比较, 其中自然间断点分级法较其他分级方法更为准确且视觉效果达到良好。根据研究区的实际情况, 选择运用聚类思维的自然断点法对研究区进行划分, 分别为极高、高、中、低及极低5个危险区[23], 绘制出滑坡危险性区划图(图6)。统计出5类危险区的面积大小及滑坡在各危险区内分布的数量、比例和密度, 具体见表3。可知, 极高、高、中、低和极低危险区的面积分别占研究区总面积的10.46%、26.71%、26.84%、20.74%、15.12%。其中极高危险区占总面积的10.46%, 但灾害比例为44.09%, 表明该区域滑坡十分密集, 存在的危险性较大, 与实际情况相符。

表3 滑坡危险性分区与灾害分布

图6 不同分级方法的危险性区划结果

利用ArcGIS对滑坡灾害点进行核密度分析, 得到滑坡灾害密度图(图7), 由统计得出高密集区占比10.23%, 与实验结果的极高危险区面积占比几乎一致, 进一步验证了实验的可靠性。

图7 滑坡灾害密度图实际结果

3.2 精度验证

根据滑坡灾害在各类危险区的分布比例和分布密度(图8), 可清晰看出随着滑坡危险性提高, 滑坡灾害分布比例和密度都随之增加, 且在极高危险区达到峰值, 与实际滑坡灾害点发育规律一致, 符合研究区野外勘测情况。

图8 滑坡灾害比例及密度

ROC(receiver operating characteristic, 受试者工作特征)曲线, 又称感受性曲线[24], 是为了预测诊断性实验好坏并通过曲线得到诊断临界值的一种精度统计方法。ROC曲线分析基于混淆矩阵, 以滑坡危险性指数作为阈值, 通过2×2的混淆矩阵得到横坐标X轴为1-特异性, 即假阳性率或误报率(FPR), 在本文表示非灾害点被误报为滑坡点的比例,X轴越接近零准确率越高; 纵坐标Y轴为敏感度, 即真阳性率或敏感度(TPR), 表示滑坡点被准确预测的比例,Y轴越大代表准确率越好, 即滑坡点被准确预测的比例。ROC曲线距离坐标左上角越近, 表示模型预测越准确。一般ROC曲线下的面积(area under curve, AUC)可用作衡量模型整体质量, 当面积>70%, 表明模型预测准确度高。目前, ROC曲线模型精度验证被广泛应用在地质灾害敏感性评价中。在SPSS中导入处理好的训练样本数据和验证样本数据, 绘制出ROC曲线, 分别得到模型的训练样本曲线以及验证样本曲线(图9), AUC值分别为0.859和0.892, 模型的成功率与预测率均较高, 结果表明, 基于熵权法的综合评价模型精度较高, 使用该方法可以对晴隆县滑坡灾害危险性进行准确评价。

图9 滑坡灾害ROC曲线成功率(a)和预测率(b)

4 结论与讨论

4.1 结论

(1)本文以贵州省晴隆县为研究区, 根据研究区地形地貌特点选取了12个地形因子作为基础评价因子, 通过相关性分析与主成分分析, 以验证的方式筛选出地形综合指数、坡向、坡度变率、坡向变率、坡形因子、距水系距离、NDVI、地层岩性8个评价因子建立滑坡危险性评价指标体系, 利用熵权法与综合评价模型进行滑坡危险性评价, 根据ArcGIS栅格叠加计算得到的危险性区划图与实际滑坡点位比对, 其中大田乡、三宝彝族乡、长流乡均位于高、极高危险区, 与实际情况大致吻合, 且滑坡灾害高密集区与高危险区占比几乎一致。

(2)通过熵权法计算得出的评价因子权重由大到小为: 地层岩性、坡向变率、距水系距离、坡度变率、地形综合指数、坡向、坡形因子、NDVI。滑坡主要分布在中二叠统和下三叠统地层, 越靠近水系发生滑坡可能性越大。由滑坡危险性区划图可知, 高危险区与低危险区区分较为明显。用样本对研究区进行精度验证, 结果表明模型精度较高, 能在预测滑坡灾害中起到作用。

4.2 讨论

滑坡危险性评价可为当地发生滑坡进行预测分析, 是现代灾害领域的一项研究热点, 但客观赋权仍是一个难题。本文基于熵权法确定评价因子权重, 相较于以往的主观赋权方法, 避免了人为主观的影响, 客观性更强, 对结果有很好的解释性。其中熵权法的权重确定过度依赖于样本, 仅有对评价因子的纵向比较, 缺少对评价因子间的横向比较, 利用SPSS软件对评价因子进行相关性分析能够得到其横向比较, 将两者结合可以相互改进, 但适用领域还有待讨论研究。

由于研究区之间存在不同程度的差异, 在建立评价体系和模型时都要进行多方面综合考量。运用GIS的空间分析功能很好地提取研究所用的基础数据, 但如何保证提取的评价因子在数量和类别上充足、合理, 仍需要结合多方面知识进行大量实验工作来解决。

猜你喜欢
权法危险性滑坡
2001~2016年香港滑坡与降雨的时序特征
基于熵权法的BDS钟差组合预测模型的建立
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
O-3-氯-2-丙烯基羟胺热危险性及其淬灭研究
危险性感
基于熵权法的城市轨道交通系统运营效率
一起汽车火灾调查与油品泄漏危险性分析
输气站场危险性分析
浅谈公路滑坡治理
“监管滑坡”比“渣土山”滑坡更可怕