基于网格化Logistic回归模型的区域突发环境事件应急决策方法

2024-01-09 08:53冯寿娟
中国地质调查 2023年6期
关键词:回归系数概率决策

冯寿娟

( 河北德禹环保科技有限公司,河北 唐山 064400)

0 引言

突发环境事件是指由于环境污染、自然灾害等因素的影响而突然发生的且造成重大损失的事件。近年来突发环境事件频繁发生,造成了严重的人员伤亡和财产损失。与一般环境事件相比,突发性环境事件重点在于“突发”两个字,不确定性更高,造成的损失和伤亡也更大[1-2]。在此背景下,如何进行有效地应急防控成为当下研究的重点。

为解决上述问题,很多专家和学者都进行了相关研究。例如: 魏斌等[3]以甘肃省为例,总结了2011—2019年期间该地区发生的80多起事件的起因,并对这些事件的时空特征进行了分析,最后以污染物特征为参考提出了具体的防控策略; 张以飞等[4]以江苏工业园区为研究区,提取该地区的3个一级指标及25个二级指标,以这些指标为输入,利用层次分析法建立了评估模型,对该地区突发环境事件风险分级进行了划分; 王思等[5]在其研究中以珠三角某石化区及周边区域为例,通过网格化技术将该区域划分为若干基本单元,然后计算环境风险受体易损性,确定了网格风险值,完成了风险区划分,确定了重点防控区域,为差异化管理提供参考。结合前人研究成果,本文提出一种基于网格化Logistic回归模型的区域突发环境事件应急决策方法,以期为突发环境事件的处理提供参考,降低突发事件带来的损失和伤亡。

1 应急决策方案

1.1 影响变量的选择

影响变量,即影响因子,也可以说是诱因,在影响变量的综合作用下,会导致区域突发环境事件的发生,因此,要想确定区域突发环境事件的发生概率,划分风险等级区域,确定影响变量是十分重要的[6-7]。

基于上述分析,本文利用德尔菲方法来进行影响变量的选择。德尔菲方法是一种通过计算3个专家系数而进行变量筛选的方法。该方法经过多轮的征询,计算专家意见协调程度[8]。

专家积极系数计算公式为

(1)

式中:μi为第i个影响变量的专家积极系数;xki为第k个专家对第i个影响变量的评分;m为专家人数,个;n为影响变量的数量,个。

专家意见权威系数计算公式为

(2)

式中:ηi为第i个影响变量的第k个专家意见权威系数;Mi为第i个影响变量的经验性评分结果。

专家意见协调系数计算公式为

(3)

式中:Yi代表第i个影响变量的专家意见协调系数。其他符号含义同式(1)、(2)。

当μi≥0.7,ηi≤0.25以及Yi<0.5时,认为该影响变量是重要的[9]。

选取出来的指标由于量纲不同,不能用于同一个模型的输入,因此需要进行标准化处理,处理公式为

(4)

1.2 事件发生概率计算与安全区划定

Logistic回归模型是一种定量分析事件发生概率的大小计算模型。Logistic回归模型是由logit变换+几率计算公式演化而成[10]。

logit变换模型为

log(y)=ζ0+ζ1x1+ζ2x2+...+ζnxn。

(5)

式中:y为事件发生概率;ζ0,ζ1,ζ2,...,ζn代表模型的参数,即逻辑回归系数;x1,x2,....,xn为影响变量。

几率是指事件发生的概率与不发生的概率之比。假设一个事件发生的概率为p,则相应的不发生的概率则为1-p,那么这个事件的整体几率y就可以通过下述公式计算出来[11],即

(6)

概率和几率是对等关系,因此,由上述logit变换模型和几率表达式构建Logistic回归模型。根据1.1节选出的变量,采集研究区的历史变量数据,以此作为输入,构建基于Logistic回归模型的事件发生概率计算模型[12]。该模型原始表达式为

(7)

式中: 各符号含义同式(5)(6)。

将式(7)进行转换,即可得到区域突发环境事件发生概率p的计算公式,即

(8)

式中: 各符号含义同式(7)。

在式(7)中,由于逻辑回归系数ζ0,ζ1,ζ2,...,ζn是不确定的,因此模型并不能直接应用,还需要从研究区突发环境事件历史资料中提取变量对应的数据及其结果代入式(8)中。利用SPSS 软件来反演求解各个逻辑回归系数,使得ζ0,ζ1,ζ2,...,ζn已知[13]。最后进行两种检验,即对回归系数进行显著性检验,对回归模型进行拟合度检验,从而保证模型的合理性。

1 km×1 km的单元网格可提供合理的精度,揭示研究区的空间变化情况,同时也可以保持计算复杂度在可接受范围内。在城市规划、自然灾害风险评估中,1 km×1 km的单元网格尺度已经被证明在环境风险评估中具有较好的适用性。因此,将研究区划分为1 km×1 km的单元网格,然后利用式(8)计算每一个单元区域的突发环境事件的发生概率[14-15]。发生概率取值为0~1,为提高可操作性,减少分类和决策选择,将突发环境事件发生概率划分为3个等级(表1)。

表1 突发环境事件发生概率等级划分Tab.1 Classification of occurrence probability for environmental emergencies

在低风险区中划分安全区,当需要进行人员疏散或者撤离时,将这些安全区作为目的地,规划应急撤离方案。

1.3 应急决策方案设计

以安全区为参考,确定为可供选择的安全地点,规划区域突发环境事件应急决策方案,即确定人员疏散路径。应急决策方案设计流程如下。

(1)对疏散问题作出基本假设,确定安全点。

(2)建立以最短距离为目标的函数模型。该模型可描述为

(9)

其中

Hij=w·lij,

(10)

(11)

式中: minL为最短疏散路径距离,m;Hij为待疏散人群集中点i至安全点j的当量长度,m;Gij为需要从点i疏散到点j的人数,个;Zij为从点i疏散到点j的道路阻断风险效用函数;Rij为从点i疏散到点j的通行概率;pmin、pmax为疏散网络的最小通行概率和最大通行概率;m为待疏散人群集中点数量,个;n为安全点数量,个;w为不同区域的危险系数,高风险取值1.0,中风险取值0.5,低风险取值0.2;lij为待疏散人群集中点i至安全点j的疏散路线距离,m。

(3)设置约束条件。计算公式如下

(12)

(13)Gij≥0 。

(14)

式中:Aj为待疏散人群集中点需要疏散人数,个;Bi为各安全点容量。

(4)利用寻优算法,如粒子群算法进行求解,得出最优人员疏散路径,完成应急决策方案设计[16-17]。

基于粒子群算法计算变异粒子ζ的适应值,则有

(15)

式中:f(ζ)为ζ中所有疏散路径距离的平均适应值,m;l=1,2,…,|ζ|,为第l个疏散路径; |ζ|为ζ中的疏散路径数量,个。

对适应度低的粒子进行替换,选择出适应度最优的个体粒子L1及全局粒子L2。

首先对L1和L2的位置进行更新,则有

(16)

根据适应度值判断粒子迭代是否停止。若适应度值为最优,则停止迭代,输出最优疏散路径和路径距离,否则重复更新粒子,直至满足停止迭代条件。

通过上述过程,完成了基于网格化Logistic回归模型的区域突发环境事件应急决策方法研究。

2 算例分析与测试

2.1 研究区概况

假设研究区内某化工园区中一化工厂发生毒气泄漏问题(图1),引发区域突发环境事件,需要进行应急决策,将人员疏散至安全区。

图1 研究区示意图Fig.1 Sketch of the study area

2.2 影响变量选取结果

基于1.1节的研究,选取该研究区内突发环境事件的影响变量,建立变量体系,如表2所示。

表2 影响变量选取结果Tab.2 Results of the impact variable selection

从表2可以看出,总共选出13个变量,作为回归模型的输入指标。

2.3 回归系数计算及模型构建

基于表2变量,采集该区域历史数据,以此作为样本,输入公式(8)中,计算得到回归方程回归系数,并进行检验,计算得出Logistic回归系数,结果如表3所示。

表3 Logistic回归系数Tab.3 Logistic regression coefficient

将表3中的Logistic回归系数对应地代入到公式(8)中,完成基于Logistic的突发环境事件发生概率计算模型的构建。

2.4 单元网格划分结果

假设研究区内承灾体的性质、规模和易损性均一致,利用ArcGIS的create fishnet 模块对图1研究区进行单元网格划分,计算每一个网格的突发环境事件发生概率,并划分风险等级,获取低风险区,结果如图2所示。

图2 单元网格划分Fig.2 Cell grid division

2.5 应急决策方案

选取蚁群算法作为求取算法,求取最优人员疏散路径,结果如表4所示。

表4 蚁群算法基本参数设置Tab.4 Basic parameter setting of the ant colony algorithm

在表4给定参数设置下,蚁群算法可在不足10 min 的时间内找到满意的解决方案。

在公式(12)~(14)等约束条件下,利用蚁群算法求取公式(9)目标函数,得出最优人员疏散路径,完成应急决策方案设计,如图3所示。

图3 最优人员疏散路径Fig.3 The optimal evacuation route

安全区的选择不仅要离待疏散人群集中点较近且具有足够容量,而且要考虑其可达性和逃生路径的畅通程度。共有3条最优人员疏散路径,分别对应3个安全区作为人员集中点,其中: 路径1总长度为2 365.48 m,人员疏散预计花费25.47 min完成; 路径2总长度为1 687.95 m,人员疏散预计花费18.25 min完成; 路径3总长度为1 892.35 m,人员疏散预计花费20.40 min完成。

3 结论

(1)利用ArcGIS的create fishnet 模块进行单元格划分,通过计算每一个网格的突发环境事件发生概率,确定风险等级,可有效获取安全区。

(2)通过蚁群算法,可在10 min内规划3条最优人员疏散路径,每条路径的人员疏散预计时间较短,均未超过26 min,有效完成了应急决策方案的制定。

(3)研究仍需进一步改进,如在突发因素的考虑上,疏散过程中可能遇到原本可以通行的路径突然无法通行的情况,在路径设计上,要考虑此种情况的出现,进行优化。

猜你喜欢
回归系数概率决策
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
为可持续决策提供依据
概率与统计(一)
概率与统计(二)
决策为什么失误了
多元线性回归的估值漂移及其判定方法
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
On Commuting Graph of Group Ring ZnS3∗