基于聚类分析识别地铁乘客伤害事故模式

2020-07-01 05:26伟副教授王甜甜
安全 2020年6期
关键词:双峰类别聚类

李 伟副教授 王甜甜 张 伟,2

(1.首都经济贸易大学 管理工程学院,北京 100070;2.北京市地铁运营有限公司,北京 100044)

0 引言

李为为等[1]对影响地铁安全运营的人、车辆、轨道、供电、信号等主要原因进行了探讨,提出“人—车—轨道—安全管理”的安全运营系统及应急救援体系相结合的对策;代宝乾等[2]确定了地铁火灾、列车脱轨、拥挤踩踏等危险有害因素,并指出地铁事故受内、外部2大因素的影响;李铭辉[3]运用系统安全分析方法辨识了地铁运营中的危险因素,接着用定性和定量相结合的分析和评价方法,探索了适合我国的地铁运营安全综合评价;韩豫等[4]运用脆弱性理论和耗散结构理论,以干扰、暴露和脆弱性为致因要素,建立事故演化模型,构建了地铁系统的脆弱链模型;万欣等[5]将Petri网与模糊数学相结合,提炼乘客异常行为导致地铁运营事故的形成机理,进而得出乘客行为影响地铁运营的关键路径;曾明华等[6]在考虑地铁运营安全各影响因素相互关系的基础上,综合利用ISM和模糊多态贝叶斯网络实现了对地铁运营安全的风险预测;Azadeh A等[7]通过将AHP与数据包络分析法相结合,提出了地铁运营集成模型,并将其应用于地铁运营系统中的风险分析,以期找出主要风险因素,对运营过程的安全管理进行优化;Jae Seong等[8]通过分析地铁运营火灾安全事故,研究了屏蔽门在火灾事故中所起的作用,提出了应对火灾发生的相应预防措施;Min An等[9]认为要合理运用层次分析法以及三角模糊数来获取各指标权重,避免主观因素对指标赋权产生影响而造成偏差。这些研究对地铁运营安全起到重要作用,但其研究多是宏观层面的,对于事故水平的划分也主要是靠现场经验确定。本研究将基于地铁运营事故处理记录,就事故本身探寻其客观规律性。在北京地铁事故处理数据统计分析的基础上,从人、列车、环境等因素进行系统聚类,获取特征性的事故分类并对比其结果,从不同角度探究北京地铁运营事故的发生模式与危险因素,为揭示各种地铁运营事故的发生机理和修订相应政策提供科学依据。

1 地铁运营事故研究因素的提取

1.1 数据来源

本研究数据来源于北京市地铁年度安全生产责任保险案件报表,调取2017年11月1日到2018年10月31日期间的北京地铁事故数据,共计1180起事故。为满足分析的要求,排除有缺失项及无法认定的记录后,将每起事故中主要责任人的事故记录信息纳入分析,共946条事故主要责任人记录。本研究中“事故主要责任人”定义为数据库条目中事故涉及人的事故责任定性为“全部”或“主要”;若同一事故中出现多于一条事故责任定性为“不同”的事故记录,则按照新事故纪录加以处理。

1.2 研究因素的提取及分析

本研究基于一般程序处理事故记录的内容,同时考虑地铁伤害的危险因素,选取数据库中性别、年龄、时间、具体位置、事件原因、伤害类型等因素作为聚类分析的外显变量,采用系统聚类[10]中的样品聚类(Q型聚类),样本之间的差距用平方欧氏距离表示,类别之间的差距用离差平方和表示,聚类方法采用瓦尔德法。根据地铁运营各事故的概率分布情况,选择3种主要伤害类型同时作为因变量,性别、年龄、时间、具体位置、事件原因为自变量分别进行聚类,然后比较模型聚类结果中的主要特征变量,进行模型结果择优。本研究的系统聚类采用SPSS 23.0完成。

2 聚类结果分析

2.1 北京地铁运营事故的统计描述性分析

本研究共纳入946条事故责任人信息,经初步统计表明:在8种伤害类型中,电梯伤害、摔伤、夹伤共占比88.58%,可视为地铁伤害的3种主要伤害类型,如下图。故将分别以这3种伤害结局为因变量,进行系统聚类分析。

各责任人特征在伤害类型组间的分布,见表1,除性别因素在组间无差异外,其他研究因素在伤害类型组间均有统计学差异(表1中“事件原因”特征的24个具体内容没有列出)。

图 2018年度地铁运营事故分布

2.2 模型拟合结果

以年龄、时间、具体位置、事件原因为变量,分别对电梯伤害、摔伤、夹伤的所有事故信息进行系统聚类,其计算方法和计算过程将不再赘述。最后根据各自的聚类树状图及实际情况,得出了各自的聚类数目:电梯伤害取5类为最佳;摔伤取5类为最佳;夹伤取4类为最佳。3种聚类结果的类别概率与条件概率分布下面详细讨论。分类结果将按类别概率从大到小排列,按条件概率进行特征命名。

表1 地铁运营事故特征描述性结果

2.2.1 电梯伤害聚类结果

电梯伤害的5个类别概率中前2个类别贡献了52%的事故概率。分析事故特征的条件概率结果,见表2。

式(13)说明,MDCFT结果呈二维周期性,调频率维周期为N,频率维周期为N2,参数估计将会出现模糊,将会影响目标的运动补偿效果。假设有调频斜率u1,u2且Δu=u1-u2,当Δu=N2时MDCFT的参数估计结果将出现模糊,由式(13)可计算出足够引起参数估计产生模糊的最低速度为1 500 000 m/s,该值远远超过实际目标的速度,因此频率步进雷达参数估计模糊问题不予考虑。

(1)各分类均以女性为主(条件概率>58%)。

(2)年龄<29岁和事件原因中行走分神、家长看管不利、紧急制动等变量的条件概率均低于0.2,表2中不予列出。

(3)类别概率最大的两类,条件概率最大的事故原因分别为“行李原因”及“未扶稳摔倒”。

(4)分析单个变量的条件概率,从年龄分布可以看出,第2、3类别均以>60岁的老年人为主;从时间变量的条件概率来看,第1、2类事故高峰期出现在下午,这显然与早晚高峰的“双峰形”的客流规律不相符合,这是由于近年来交通流量的快速增长,地铁交通流量的波动幅度范围即交通流量的峰值和谷值之间的变化差距己经变得不再明显。

表2 电梯伤害类别概率和条件概率分布

2.2.2 摔伤聚类结果

摔伤的5个类别概率中前4个类别贡献了92%的事故概率。分析事故特征的条件概率,见表3。

(1)引起摔伤的主要原因有:不慎摔倒、地面湿滑、行李原因、紧急制动、老弱病残孕群体行动不便、人多拥挤等,且类别概率最大的两类主要事故原因的条件概率均包含变量“不慎摔倒”。

(2)分析单个变量的条件概率,从年龄的条件概率分布可以看出,第1类受害者以中老年为主,事故原因主要为“不慎摔倒”,而其余事故类别在老年人中的条件概率不足0.2;时间及具体位置变量的条件概率在各类别中有较明显的区分度,如类别2主要发生在上午傍晚双峰时间段,发生位置集中在站台、站厅。

表3 摔伤类别概率和条件概率分布

2.2.3 夹伤聚类结果

夹伤的4个类别概率中前2个类别贡献了76%的事故概率。分析事故特征的条件概率,见表4。

(1)引起夹伤的主要原因有:不慎夹到、行李原因、人多拥挤、上下车抢时间、闸机故障、站台屏蔽门故障等,且类别概率最大的一类的主要事故原因的条件概率为变量“不慎夹到”。

(2)分析单个变量的条件概率,从年龄的条件概率分布可以看出,第1类受害者以<20和≥60岁群体为主,主要事故原因为“不慎夹到”,发生时间为上下午双峰段,集中在白天;第2类别的主要事故原因为“上下车抢时间”,以50~59岁女性为主要特征,主要位置在站台,可知多发生车门夹伤和屏蔽门夹伤。

表4 夹伤类别概率和条件概率分布

2.3 电梯伤害、摔伤、夹伤事故模式分析

根据类别概率的大小,将电梯伤害、摔伤及夹伤各类别(5、5、4类)按其特征进行命名,见表5,结果表明:

(1)对于电梯伤害,中老年人群在上下午双峰时间段因行李原因导致的事故可用于重点预防干预。进一步分析发现,上下午双峰时间段(8~11点、13~17点)地铁电梯人多拥挤,此类别人群由于年龄大行动迟缓,携带大件行李乘坐电梯,容易对自身及他人都造成危害,因此,地铁管理方面应对此类人群严格安检,严禁携带超长、笨重、妨碍通行等物品进站。2、3类均为老年人群(≥60岁),因此应进一步加强老年人群搭乘电梯安全知识的宣传。

表5 聚类结果命名及各类别伤害构成比(n,%)

(2)对于摔伤,各类别对伤害结局的贡献以“中老年上下午双峰楼梯不慎摔倒组”最大,“站台及站厅地面湿滑组”次之,“中年上午行动不便/人多拥挤组”最小。上下午双峰时段,中老年人群行动迟缓,易滞留于楼梯引发危害,因此双峰时段应加强地铁工作人员的引导疏散,确保楼梯的畅行。第2类为“站台及站厅地面湿滑组”,多发生于中年人群,除了这类人群出行基数大外,还多与乘客心理懈怠有关,防范措施为加强安检,加大雨雪天气工作人员的执勤力度。

(3)对于夹伤事故,“老幼上下车不慎夹到组”类别概率为45.83%,对伤害贡献最大,此类别事故多发生于老年或幼年人群,因年龄因素发生屏蔽门或车门夹伤,可采取重点关注弱势群体的客流引导、乘车安全规则的普及教育等措施;第2类为“中年出行高峰上下车抢时间组”,中年人群在各出行高峰时段均易由于上下车抢时间而发生夹伤,且中年人群抢时间行为多于老年人群,受夹伤风险自然也高于其他群体。

以上分析结果可以为制定地铁伤害的预防措施提供新的依据,如在电梯伤害预防中应重点关注上、下午双峰时段中老年群体携带不便行李的问题,严格安检;对摔伤预防时应重点关注双峰时段客流疏导问题,规范乘客乘梯行为等;在夹伤预防中应加强对弱势群体的关注,对于幼、老龄乘客为确保其安全可采取强制性家属陪同措施等。

3 结论

本研究采用系统聚类方法对北京地铁伤害事故数据进行分析,将3种主要伤害类型进行聚类,各类别在时间、年龄、具体位置、事故原因等方面各有区分。从研究结果来看,将年龄、时间、具体位置等多个因素纳入系统聚类分析,提供的新组合事故类别使得不同时间、不同位置中伤害发生的危险性更清晰,可用于重点预防干预。但从地铁事故处理记录看,大部分事故原因被归因于其他,故应完善地铁运营事故统计及分析工作,摸索和研究事故发生的规律,进而预防事故的发生。地铁运营事故致因因素包括人、列车、线路、环境等,本文对各因素之间的耦合关系进行了深入研究。然而随着地铁运营的不断发展,风险源的形成也越来越复杂,仅探索致因因素显然不够,以后需进一步对各因素之间背后的相互耦合规律进行研究。

猜你喜欢
双峰类别聚类
一种傅里叶域海量数据高速谱聚类方法
论陶瓷刻划花艺术类别与特征
双峰映辉
一起去图书馆吧
灵 山
Artist Prints Charms of West Lake
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现
选相纸 打照片