沿海地区风暴潮灾害风险评估与区划
——基于混合算法优化的PPDC模型

2016-06-23 02:53潘艳艳苏春暖
统计与信息论坛 2016年2期

潘艳艳,苏春暖,赵 昕

(中国海洋大学 经济学院,山东 青岛 266100)

沿海地区风暴潮灾害风险评估与区划

——基于混合算法优化的PPDC模型

潘艳艳,苏春暖,赵昕

(中国海洋大学 经济学院,山东 青岛 266100)

摘要:以沿海11省市的风暴潮灾害风险为研究对象,采用遗传与粒子群混合算法对投影寻踪动态聚类(PPDC)模型进行优化,将粗糙集理论(RST)与修正的PPDC模型组合运用,对中国沿海地区风暴潮灾害的风险进行综合评估与区域等级划分。实证结果表明:广东和福建两省是中国风暴潮灾害的高风险区,风险评估值超过2.5,山东、浙江、海南和广西属于风暴潮灾害的中风险区,风险评估值处于[1.8,2.2]之间,江苏、天津、辽宁、河北和上海属于风暴潮灾害的低风险区,风险评估值低于1.5。研究结论为国家实施差异化的灾害风险管理战略提供了思路与参考。

关键词:风暴潮灾害;风险评估与区划;投影寻踪动态聚类

一、引言

21世纪被称为海洋世纪,加强海洋的开发与利用关系到国家的长远发展[1]。然而,频发的海洋灾害严重影响了沿海地区经济社会的平稳发展。在众多的海洋灾害中,风暴潮灾害引起的损失占90%以上,因此对风暴潮灾害风险进行科学管理,减少灾害损失是实现沿海地区海洋资源高效开发利用,保障海洋经济可持续发展的关键[2]。科学的风险评估与区划是实现灾害风险管理的前提。

目前,关于风暴潮灾害风险评估与区划的研究成果相对较少,国内外的研究主要集中于危险性、暴露性等层面的分析。Ken研究了城市社区对风暴潮灾害的暴露性和脆弱性的度量方法,并在澳大利亚 Cairns 市进行了实证检验[3]。2004年,亚洲灾害预防中心对亚洲地区易发生台风风暴潮灾害的地区进行了统计分析,据此得出了台风风暴潮的脆弱性和后果影响范围及程度的区划图[4]。Yarnal等运用SLOSH和DEM模型对承灾体的暴露性进行分析,绘制了风险区划图[5]。陈香采用灾害风险指数法和加权综合评价法对福建省台风灾害风险进行了评估及区划[6]。王晓玲综合层次聚类、灰色关联以及熵值法,从经济风险角度进行风暴潮灾害的风险区划[7]。赵昕等总结风暴潮灾害特征与致灾因子,运用多元决策和统计方法,对山东省沿海城市风暴潮灾害风险进行了区化研究[8]。

总结国内外学者的研究成果可知,国外关于自然灾害风险的研究较早,应用相对广泛,但大多集中于单种风险的研究,综合化潮灾风险研究较少。而国内的研究所使用的方法模型较为传统,随着国家对风暴潮灾害风险管理的日益重视,灾害风险评估与区划的理论方法与模型亟待创新与丰富,探索一种系统化的风暴潮灾害风险评估方法是目前海洋灾害风险管理的重要议题。

风暴潮灾害风险评估与区划需要解决两个主要问题:第一,构建全面系统的风险评估指标体系;第二,寻找科学有效的风险评估模型。对于第一个问题,本文拟在现有研究成果基础上,从灾害学、经济学等多角度辨识风暴潮灾害的风险因素,构建涵盖危险性、暴露性、敏感性和恢复力等较为全面的风险评估指标体系。鉴于指标的冗余性和相关性,引入粗糙集理论(RST)对指标体系进行属性简约,提炼出影响风暴潮灾害的主要风险因素。对于第二个问题,本文引入动态聚类投影寻踪(PPDC)模型对风暴潮灾害风险进行评价,将高维灾情数据信息映射在低维空间,利用投影方向表现原始数据结构。在此过程中,引入遗传和粒子群混合算法对PPDC模型的投影过程进行优化,最大限度地保留和反映原始灾情数据信息,以实现对风暴潮灾害风险的科学评估与分析。

二、PPDC模型构建与优化

(一)PPDC模型的建立

设xij0表示第i个样本的第j个指标,其中i=1,2,…,n;j=1,2,…,m;n是样本的个数,m是指标数,则PPDC模型构建步骤如下[9]:

第一,数据无量纲化。由于各指标所代表的含义不同,致使各指标间出现量纲不一致的问题,因此有必要在模型建立前对各指标实行归一化处理,达到消除量纲的目的。

(1)

④不断重复上述步骤,直到出现终止条件:

(2)

式(2)中,ε为允许的充分小误差值,此时得到一个分类结果序列Vk=(Lk,Θk),k=1,2,…,并记:

(3)

(4)

(二)遗传与粒子群混合算法下PPDC模型优化

本文构建了基于遗传和粒子群的混合算法,混合算法将遗传算法GA中的交叉和变异操作融入到粒子群算法PSO中,直接以目标函数作为搜索信息,GA中的交叉可以扩大粒子的搜索空间,能有效防范算法陷入局部最优的困境,而变异能够在陷入局部最优时改变粒子的结构,增强了PSO的全局寻优能力。因此,混合算法既具有GA强大的全局搜索性能,又具有PSO的位置转移思想,可以得到精度更高的解。混合算法优化的PPDC模型的实现步骤如下[10]:

第一,初始化粒子并设定有关参数。设定群体规模n、粒子的初始速度和位置、学习因子c1和c2的以及全局最优解的变化数h,把粒子的初始位置设定为个体最优值pbest,将pbest中的最优值表示为全局最优gbest。

第二,计算适应度值。将PPDC模型中的投影指标Q(a)=ss(a)-dd(a)作为目标函数,并依据该函数计算每一个粒子的适应度值。

第三,寻找个体极值和群体极值:将种群中每一粒子的当前适应度值分别与自身的历史最优pbest以及所有粒子的历史全局最优gbest进行比较,若该粒子当前的适应度值分别优于pbest和gbest,则更新pbest和gbest,将更新后的pbest和gbest作为个体最优值和粒子群的全局最优值,否则pbest和gbest仍取原来的值。

第四,交叉操作:判断粒子群当前适应度值的变化情况,主要通过未达到最大适应度值的粒子个数来确定。当未达到最大适应度值的粒子个数大于总粒子数的1/4时,使用优劣粒子交叉法;否则,使用随机交叉法。

第五,判断条件:基于全局最优解的变化情况来判断算法是否陷入局部最优解,当h=h0时,表示此时可能陷入了局部最优解,步骤转到第六步,否则转入第七步。

第六,变异操作:针对适应度值较低的粒子进行重新初始化,同时使用变异算子对其他的粒子实现变异操作。

第七,速度和位置更新:根据粒子的位置和速度更新公式来调整粒子的位置和速度。

第八,判断结束条件:如果迭代次数t>tmax,算法终止,输出结果;否则t=t+1,转入第二步。

三、沿海省市风暴潮灾害风险评估指标体系设计

(一)初始指标体系构建

风暴潮只有作用在易损性较差的承灾体上才会发生灾害,因此风暴潮灾害风险评估指标体系的构建不仅要体现风暴潮自身的内在特征,更要反映承灾体受风暴潮影响程度、抵御风暴潮灾害的能力以及风暴潮潜在受灾区对灾害的预防及应对能力等。因此,从风暴潮灾害的危险性和承灾体的易损性两方面,结合指标数据的可得性来建立沿海省市风暴潮灾害风险评价的初始指标体系(见表1)。

表1 沿海省市风暴潮灾害风险评估初始指标体系

风暴潮灾害危险性指标的选择主要参照风暴潮危险性因素,考虑风暴潮灾害的致损性,侧重于风暴潮灾害的活动频次以及规模强度。因此,本文选取的危险性指标中除了风暴潮的自然特征指标外,融入风暴潮灾害历年损失数据来反映风暴潮灾害的危险性。风暴潮灾害易损性指标的选择根据Turner框架[11],从暴露程度、敏感程度和恢复力三个角度来建立承灾体的易损性指标体系。其中,暴露程度越高,敏感程度越强,恢复力越弱,则承灾体的易损性就越大,间接反映出灾害的风险越高。

(二)基于RST的指标体系属性约简

本文基于粗糙集理论(RST),运用Rosetta软件,利用Bjorvand提出的基于遗传算法的属性约简来剔除冗余指标信息,该算法是在求出差异矩阵的基础上采用遗传算法进行优化以得出属性约简结果[12]。通过运算得到较为简洁且能完整反映沿海省市风暴潮灾害风险的指标体系,如表2所示,共包含17个指标,其中危险性指标4个,易损性指标13个,易损性是暴露性、敏感性和恢复力指标约简后的合并指标。

表2 沿海省市风暴潮灾害风险评估指标体系

四、沿海省市风暴潮灾害风险综合评估

(一)样本数据来源

本文以津、冀、辽、沪、苏、浙、闽、鲁、粤、桂和琼11个沿海省市作为研究对象,风险评估的区域单位级别为省或直辖市。指标的数据来源为各年《中国统计年鉴》、《中国海洋灾害公报》、《中国财政统计年鉴》、《保险统计年鉴》、《中国海洋统计年鉴》以及沿海11省市的各地区统计年鉴。

(二)基于优化的PPDC模型的风暴潮灾害风险测度

1.风险数值的计算

1)运用混合算法求解最佳投影方向向量。将处理后的标准化数据带入MATLAB 2013a程序中,实现最佳投影方向向量的求解。在程序求解中,其初始参数设置为样本数n=11,指标数m=17,学习因子c1=2,c2=2,最大迭代次数Tmax=500,交叉率pc1=0.6,pc2=0.7,变异率pm=0.2。

通过程序运行求得风险评价指标最佳投影方向向量为:a1=(0.326 0,0.253 8,0.331 0,0.392 3,0.163 3,0.094 6,0.139 8,0.027 9,0.364 9,0.131 3,0.089 8,0.342 6,0.162 1,0.296 6,0.061 6,0.155 1,0.303 3),满足||a||=1的条件。向量a1中的数值代表各指标的投影方向值(见表3),且各指标投影方向的数值大小在一定程度上反映了各评价指标对风暴潮灾害综合风险的影响程度。

表3 指标的最佳投影方向值

从表3可知,各指标对风暴潮灾害风险的影响程度从大到小依次为:累计直接经济损失>海岸线长度>15岁以下占比>风暴潮灾害累计发生次数>累计死亡人数>保险密度>城乡居民人均储蓄额>单位时间风暴潮登陆次数>人均GDP>人均财政支出>每千人医院和卫生院床位数>沿海城市人口> GOP占比>耕地面积>女性占比>人均城市道路面积> 海洋经济密度。

同理,可分别求出危险性指标和易损性指标中各指标的最佳投影方向,危险性指标最佳投影方向向量为:a2=(0.294 6,0.054 2,0.564 7,0.769 0),见表4;易损性指标的最佳投影方向向量为:a3=(0.049 4,0.371 8,0.153 1,0.057 7,0.434 3,0.069 4, 0.107 7, 0.254 0, 0.429 1, 0.498 1,0.067 9,0.046 1,0.352 2),见表5。

表4 危险性指标的最佳投影方向值

由表4可知,累计直接经济损失对风暴潮灾害的危险性影响最大,其次为风暴潮灾害累计发生次数。因此,风暴潮灾害造成的累计直接经济损失越大,灾害的危险性越高,反之,灾害的危险性越高,造成较大的直接经济损失的可能性越大;地区风暴潮灾害累计发生次数越多,该地区未来发生该灾害的概率越大,则表明其危险性越高,这两种解释与理论上是相吻合的。

表5 易损性指标的最佳投影方向值

由表5可知,城乡居民人均储蓄额、海岸线长度、人均财政支出、耕地面积以及保险密度对易损性的影响程度较大;每千人医院和卫生院床位数、人均GDP、海洋经济密度、人均城市道路面积对易损性的影响程度较小。

表6 沿海省市风暴潮灾害风险评估值

由表6中各省市风暴潮灾害危险性、易损性和综合风险的排名可知,灾害综合风险高的地区,其灾害的危险性和该地区的易损性都相对较高,反之亦然,如广东省;灾害综合风险低的地区,其危险性和易损性也相对较低,反之亦然,如上海市;对于危险性较高而易损性较低或者危险性较低而易损性较高的地区,其灾害的综合风险一般来说处于居中位置,如海南省。

2.风险等级的划分

在实际应用中,聚类数的大小并未给出准确的数值,其取值的不同也会对聚类的效果产生一定的影响。关于最佳聚类数的确定,本文参照韩凌波的做法,设距离评价函数为[13]:

(5)

图1 距离评价函数随k值变化趋势图

表7 沿海省市风暴潮灾害风险区划结果

由表7可知,福建和广东两省属于风暴潮灾害的高风险区,其风险值都超过2.5。原因是广东和福建两省遭受海洋灾害的可能性比较大。2002年至2012年两省发生风暴潮灾害的次数是沿海省市中最多的,其中广东省风暴潮灾害累计发生达27次,福建省累计达21次。在此期间,两省因风暴潮灾害所引起的受灾人数、经济损失以及水产养殖损失等累计值都处于其他沿海省市的前列。虽然广东和福建两省的防灾减灾能力以及灾害的监测预警能力较强,但是由于他们的暴露程度和敏感程度较大,致使承灾体的综合易损性较大,遭受损失的风险较大。

山东、浙江、海南和广西属于风暴潮灾害的中风险区,其风险值处于[1.8,2.2]之间。从地理位置上看,尽管海南和广西处在灾害极易出现的区域,但因它们的人口和经济的密集程度都比较小,则地区风暴潮灾害的暴露程度低,遭受损失的可能性减小,其承灾体易损性低。但是,上述四省的经济发展水平较高,海洋产业尤其是海洋渔业发展较为迅速,在风暴潮灾害的袭击下,遭受损失的数额较大,灾害风险可能较大。这类地区的风险低于广东和福建两省,属于中风险区。

江苏、辽宁、河北以及天津和上海属于风暴潮灾害的低风险区,其风险值低于1.5。因其地理位置,历年风暴潮灾害的发生次数较少,强度较小,遭受损失的概率较小,且应对风暴潮灾害的能力较强。因此,风暴潮灾害风险较低,属于灾害低风险区。

五、结论

本文基于遗传与粒子群混合算法对PPDC模型进行了优化,将RST粗糙集理论与修正的PPDC模型组合运用,对我国沿海地区风暴潮灾害的风险进行综合评估。

在理论方法层面,本文提出了涵盖评估模型和评估指标体系的较为系统的风暴潮灾害风险评估方法,是优化投影寻踪动态聚类方法在灾害风险评估领域的新应用。遗传算法和粒子群混合算法能够在优化过程中达到优势互补,加快收敛速度,防止陷入局部最优解。混合算法优化下的PPDC模型,可以更好地提取投影结构的有效信息,计算出更加科学、合理的投影特征值,从而依据低维空间的投影特征值分析出高维数据的结构特征。在保持分辨能力的前提下,RST粗糙集理论可以剔除众多指标间的共性部分,兼顾了指标体系的科学性与可执行性,提高了风险评估工作的效率。

在模型运用层面,本文运用RST粗糙集理论对较为庞杂的指标体系进行了属性简约,最终确定选取了风暴潮灾害风险评估的17项指标,为PPDC模型的应用提供了前提和支撑。PPDC模型在整个运算过程中毋需主观给定参数,其评估结果客观、明确、稳定性好,已经在多因素聚类评价,如资源承载力评价、生态环境质量评价、灾害危险性评价、灾害脆弱性评价、多属性决策等研究领域被广泛应用并取得良好效果。本文运用遗传与粒子群混合算法修正的PPDC模型实现了对我国沿海11省市风暴潮灾害的风险评估与区域分异。结果显示,广东和福建省是风暴潮灾害的高风险区,山东、浙江、海南和广西属于灾害的中风险区,江苏、天津、辽宁、河北和上海属于灾害的低风险区。模型得到的结论与我国的现实情况相符。根据中华人民共和国民政行业标准《自然灾害风险分级方法(MZT031—2012)》,“自然灾害风险=自然灾害风险事件发生的可能性×自然灾害风险事件产生的后果”。以广东和福建两省为例,《中国海洋灾害统计公报》历年统计数据显示,2002年至2012年广东和福建两省发生风暴潮灾害的次数是沿海省市中最多的。同时,两省的风暴潮灾害所引起的受灾人数、直接经济损失以及水产养殖损失等累计值都处于其他沿海省市的前列,即灾害风险事件产生的后果严重,由此可知两省属于风暴潮灾害的高风险区。其他省市的情况亦是如此。这与模型评估的结果相一致,因此,模型评估结论具有可信性。

在政策实践层面,本文对我国致损最严重的海洋灾害的风险进行了测度,基于省际数据对沿海省市的风暴潮灾害风险进行了等级划分,从风险管理的角度,为国家实施区域差异化的灾害管理战略提供了思路和参考。

参考文献:

[1]苏为华,张崇辉,李伟. 中国海洋经济综合发展水平的统计测度[J].统计与信息论坛, 2014(10).

[2]丁黎黎,朱琳,何广顺.中国海洋经济绿色全要素生产率测度及影响因素[J].中国科技论坛, 2015(2).

[3]Ken Granger. Quantifying Storm Tide Risk in Cairns[J]. Natural Hazards,2003(30).

[4]Asian Disaster Preparedness Center. Asian Urban Disaster Mitigation Program[R].Klong Luang: Asian Disaster Preparedness Center (ADPC), 2004.

[5]Yarnal B, Frazier T G, Wood N. Influence of Potential Sea Level Rise on Societal Vulnerability to Hurricane Storm-surge Hazards, Sarasota County, Florida[J].Applied Geography, 2010(30).

[6]陈香.福建省台风灾害风险评估与区划[J].生态学杂志,2007(6).

[7]王晓玲.风暴潮灾害经济风险区划研究[D].青岛:中国海洋大学, 2010.

[8]赵昕,贾宁,李莉.山东省风暴潮灾害风险区划研究[J].中国渔业经济,2011(1).

[9]张鹏洲,倪长健.基于投影寻踪动态聚类模型的边坡稳定性评价[J].四川环境,2010(1).

[10]王莎,高茂庭.一种基于混合PSO的投影寻踪动态聚类模型[J].计算机工程与应用, 2013(8).

[11]Turner B L, Kasperson R E. A Framework for Vulnerability Analysis in Sustainability Science[J]. National Academy of Sciences, 2003(14).

[12]Bjorvand A T.‘Rough Enough’—A System Supporting the Rough Sets Approach[R]. Norwegian University of Science and Technology,Trondheim, Norway,1996.

[13]韩凌波.一种新的K-means最佳聚类数确定方法[J].现代计算机,2013(30).

(责任编辑:张爱婷)

Risk Assessment and Regional Classification of Storm Surge Disasters of Coastal Areas:Based on PPDC Model with Hybrid Optimization Algorithm

PAN Yan-yan, SU Chun-nuan, ZHAO Xin

(School of Economy, Ocean University of China, Qingdao 266100, China)

Abstract:This paper combines Rough Set Theory (RST) with Projection Pursuit Dynamic Cluster (PPDC) model optimized by Genetic Algorithm (GA) and Particle Swarm Optimization (PSO) to assess the comprehensive risk and make regional classification of storm surge disasters of eleven provinces and cities of Coastal Areas. The empirical results are as follows: Guangdong and Fujian are the high risk area of storm surge disaster in China, whose risk assessment scores are both more than 2.5. Shandong, Hainan, Guangxi and Zhejiang belong to the medium risk area of storm surge disaster and their risk assessment scores are between 1.8 and 2.2. Tianjin, Liaoning, Hebei, Shanghai and Jiangsu belong to the low risk area of storm surge disaster whose risk assessment scores are all less than 1.5. The conclusion of this thesis is to provide a reference for the implementation of the risk management strategy of China.

Key words:storm surge disasters; risk assessment and regional classification; Projection Pursuit Dynamic Cluster

收稿日期:2015-08-14;修复日期:2015-10-28

基金项目:国家自然科学基金项目《风暴潮灾害脆弱性测度及损失补偿对策研究》(71373247);国家自然科学基金项目《不对称PPP模式下风暴潮灾害保险合作机制研究》(71503238)

作者简介:潘艳艳,女,山东烟台人,博士研究生,研究方向:灾害风险管理;

中图分类号:X43∶O213.9

文献标志码:A

文章编号:1007-3116(2016)02-0021-07

苏春暖,女,山东威海人,硕士研究生,研究方向:数量经济;

赵昕,女,辽宁锦州人,教授,博士生导师,研究方向:海洋经济、风险管理。

【统计理论与方法】