基于数据挖掘的船舶引航事故致因分析

2022-07-15 01:51陈浩广州港引航站
珠江水运 2022年12期
关键词:引航员项集数据挖掘

陈浩 广州港引航站

陈炎 上海海事大学

1.引言

随着船舶大型化、专业化、高速化的发展,港口船舶引航的风险越来越大,船舶引航对于保证船舶安全航行、提高港口作业效率和保护水域环境具有重要意义,因此需要进行加强船舶引航安全管理,进行船舶引航事故致因的研究。

船舶引航是一项系统工程,引航风险影响因素繁多且呈现出复杂的相互关联,国内外学者从不同角度对船舶引航风险的成因进行研究。方泉根等采用FSA对出船舶引航风险进行了全面的分析和评估,就如何确保船舶在受限水域安全引航操作进行了新的探索;郭云龙等在利用动态贝叶斯网络进行船舶引航动态风险预测的基础上,根据风险值对引航任务进行分级管理;周丽丽等通过构建船舶引航风险成因的灰色关联分析模型,求得引航风险成因的最优关联系数,进行船舶引航风险成因的关联度排序。关于船舶交通事故成因的数据挖掘方面的研究,张晓辉利用数据挖掘方法对水上交通基础数据进行全因素挖掘实验。刘正江等利用数据挖掘对人为失误与其影响因素之间的关系进行挖掘,初步确定船舶避碰过程中人为失误与引发因素之间的对应关系。

然而,上述研究较少涉及船舶引航事故致因的研究,尤其是船舶引航事故形成过程的事故链的研究。本文采用Apriori算法对船舶引航事故的致因进行关联规则的挖掘,结合定性贝叶斯网络事故致因分析推导最可能的船舶致因事故链。

2.基于Apriori算法的船舶引航事故致因分析模型

2.1 关联规则及Apriori算法

关联规则是数据挖掘中非常重要的分支,当前有很多关联规则挖掘的算法,其中R.Agrawal等人提出的Apriori算法是最为著名的,以下是关于Apriori算法的一些概念。

1)项集或候选集。Item={Item,Item,...,Item}称为k项集或k项候选集。假设数据库DB包含m项属性(A,B,...,M),1项集1_Item=({A},{B},...,{M}),2项集2_Item=({A,B},{A,C},...,{A,M},{B,C},...,{L,M}),共有[m×(m-1)/2]个项集;3项集3_ Item=({A,B,C},{A,B,D},...,{B,C,M},...,{K,L,M});以此类推,m_ Item={A,B,...,M},有一个项集。

3)强项集或频繁项集。如果k项候选集的支持度大于或者等于设定的最小支持度,则称该项候选集为k项强项集或者k项频繁项集。

根据关联规则所涉及的维数可以将其划分为单维关联规则和多维关联规则。当关联规则中属性只有一维,就称其为单维关联规则或者一维关联规则,否则称为多维关联规则。由于船舶引航事故通常由多个风险因素综合影响所致,因此应进行多维关联规则挖掘。

2.2 船舶引航事故影响因素

根据“人-机-环-管”(MMEM)系统安全理论,船舶引航事故主要由人员(引航员、船员、其他船舶人员和拖轮人员等)因素、船舶因素、环境因素和管理因素组成。本文通过对某港近3年的104起船舶引航事故分析,结合MMEM理论和专家建议,将引航事故分为碰撞事故、触损事故、搁浅事故、失控事故和其他5类,将事故致因分为安全监管不足、引航员状态不佳、物理环境不良、技术环境不良、其他人员因素、船舶因素、人员疏忽、技术技能不足和违章操作9类因素,为了便于因素识别,对各类事故和致因进行编码如下:碰撞事故(Y1)、触损事故(Y2)、搁浅事故(Y3)、失控事故(Y4)、其他(Y5)、安全监管不足(X1)、引航员状态不佳(X2)、物理环境不良(X3)、技术环境不良(X4)、其他人员因素(X5)、船舶因素(X6)、人员疏忽(X7)、知识技能不足(X8)、违章操作(X9)。

根据引航事故致因的分类对数据库进行整理,将各个因素按照属性及相近原则进行分类,其中安全监管不足包括监督不充分、引航计划不适当、没有及时纠正问题、监督违章等因素;引航员状态不佳包括生理和心理状态不良;物理环境不良包括能见度不良、风、流、大浪、潮汐和不可抗力等因素;技术环境不良包括航道弯度、碍航物、助航设施、通航密度、可航水域水深和宽度等因素;其他人员因素包括本船船员失误、他船船员失误、拖轮船员失误和通信合作过失等;船舶因素包括设备缺陷、结构缺陷、货物问题和船舶限制等;人员疏忽包括瞭望疏忽、航行戒备疏忽和情景意识缺失等;知识技能不足包括应急处置过失和操纵行为失误等;违章操作包括引航员违章、他船船员违章和拖轮操作违章等。

3.船舶引航事故过程分析

3.1 船舶引航事故形成过程

通过船舶引航过程和事故案例的分析,分析船舶引航事故形成的过程,为获取最大可能事故致因链建立事故形成过程网络图,首先建立的引航事故形成流程图如图1所示。

图1 船舶引航事故形成流程图

不同船舶引航事故是由不同的因素的相互作用造成的,各因素间呈现复杂的网络关系,本文采用贝叶斯网络模型来表示船舶因素事故各因素的作用关系。

3.2 船舶引航事故网络结构

贝叶斯网络是一个有向无环图,网络结构由代表变量节点及连接这些节点有向边构成。节点代表随机变量,节点间的有向边代表了节点间的互相关系(由父节点指向其子节点),变量间的关系由条件概率表示。应用贝叶斯网络结构可直观描述船舶引航事故形成过程。结合引航事故数据库分析引航事故形成过程,构建每一起事故贝叶斯网络结构图,将104起事故样本的网络结构拟合成一个综合引航事故致因网络,如图 2 所示。

图2 船舶引航事故致因网络图

4.船舶引航事故致因链分析

事故致因链是导致某类事故的最可能的路径,可以反映事故的形成规律。运用Apriori算法对事故数据库进行挖掘可以得到多维的各个因素的强关联关系,得到的强关联关系可能呈现分散的状态,结合上文的事故致因网络图综合分析可以得到引航事故的致因链。

4.1 构建事故数据库

对某港近3年的104起船舶引航事故数据库进行整理,将其中各因素用表1、表2中国的代码进行表示,没有包含的因素则相应位置空缺,构建得到Apriori算法挖掘的数据库。

4.2 事故数据挖掘

采用Apr ior i算法对上文建立的数据库进行挖掘,可以使用R、Python、Java、Matlab、SAS等进行编程实现,现在市面上有很多专业的数据挖掘软件,本文选用使用较为普遍的Weka软件进行关联规则的挖掘。在软件中选取Apriori算法,最小支持度和最小置信度的设置采用迭代法,通过迭代最终确定支持度的阈值为0.4,可信度的阈值为0.5。运行结果如图3所示。

图3 挖掘的频繁项集

软件挖掘结果显示,引航碰撞事故Y1与X1(安全监管不足)、X3(物理环境不良)、X7(人员疏忽)、X8(知识技能不足)在设置阈值下呈现出强关联规则,结合引航事故致因网络图进行分析可以得到引航碰撞事故最可能的致因链如图4所示,为完善事故数据链添加“碰撞危险”节点。根据该事故致因链可知预防引航碰撞事故发生的关键是避免出现碰撞危险,而一旦出现碰撞危险避碰的操纵行为和引航员的应急处理就显得尤为重要,要加强引航员应急能力和临危心理素质的培养。

图4 引航碰撞事故致因链

4.3 致因分析

通过建立基于全部因素的关联分析,探究在引航事故中的致因因素,以及致因因素间的关联性。可以识别出在引航事故的发生中致因因素众多,主要包括环境因素、船员因素、瞭望失误、避让行为失误、应急处理失误、船舶设备操作失误以及违规等相关因素。综合事故致因的分析图,可以发现引航事故发生时,涉及到很多的致因因素,而且因素之间存在着许多的关联性。主要的致因因素包括环境因素,以及引航员在操作时的应急操作失误和船舶设备操作失误。环境因素主要是风和流的变化因素以及航道船舶密度因素,风流以及航道环境因素的突变容易加大引航事故的风险值,因此加强对引航过程中的环境因素,尤其是风与流,以及航道密度的观测,有助于引航过程中安全水平的提升。同时不安全行为中还有引航员感知行为失误的行为,对船舶位置以及船速等的错误操作,导致事故的发生,因此有必要加强对引航员的知识安全培训和对引航机构安全文化建设,以避免失误行为的出现。接下来结合多因素间的关联性,分析得出引航事故的发生是由于船舶之间通信与合作出现失误,以及在瞭望的过程中存在疏忽,引航员在操作船舶避让时避让行为也出现失误,最终导致事故的发生。其中包括环境层(风、流以及船舶密度)、引航员应急操作失误、瞭望疏忽、危险处理失误等因素。在前文的相关性分析中发现,引航员的不安全行为和引航的组织影响建设具有较强的相关性,因此要加强对引航站组织氛围的安全文化建设,减少引航员不安全行为的出现,同时加强在引航过程中对环境因素的识别与关注,特别是针对风与流以及航道交通密度的检测,发挥VTS 系统的作用。多因素中较为关键的是引航过程中的瞭望,及时地发现引航过程中的问题,并针对突发问题采取正确合适的措施,避免违规现象的出现,最终降低事故发生的概率,提升引航的安全水平。

1) 针对被引航的船舶的相关措施建议。

引航船舶是引航过程中的重要部分。在构造的引航事故致因分析路径中,可以识 别到引航船舶与他船的通信合作过失以及瞭望过程中的过失是较为关键的致因因素。因此引航船舶应做好船员的安全培训,构建安全的组织氛围,并在引航前检查船上设备的完好性,并在引航过程中,提高警惕,注意瞭望,时刻注意与他船之间的通信与合作,从而保证引航过程中的安全。

2)针对引航员的相关措施建议。

引航员的不安全行为是导致引航中事故发生的最直接原因,通过对引航事故的研究分析,发现引航员的通信合作以及在应急处理过程中存在的过失较为重要,因此针对引航人员,首先要从自身出发,在平时提高自己的安全意识,主动学习引航过程中的相关规定条例,提升自身的安全素养。同时在引航的过程中,要注重与他船之间的通信合作,加强瞭望,观察航道的实时状况,遇到紧急问题采取适宜的举措,化险为夷,将引航过程中的风险降到最低。

3)针对引航站的相关措施建议。

在本文的研究中发现,组织氛围的建设和不安全行为是有密切的相关性。引航站应加强组织氛围建设,加强对引航员的安全文化教育,提升引航人员的安全意识和风险意识,从而减少引航人员感知型失误行为的出现。同时引航站应加强相关技术建设,加强对航道内的风、流以及航道交通密度的检测,实时防范环境中存在的风险,降低环境因素对引航安全的影响,从而提升引航的安全水平。

5.结语

应用贝叶斯网络和Apriori算法数据挖掘法综合确定船舶引航事故形成过程的事故致因链,综合利用两种方法的优点进行互补,是引航事故致因研究的一种新的思路,研究结果有助于船舶引航的科学监管。但是,由于事故数据库中触损、搁浅和失控等事故类型的案例较少,因此未能挖掘这些事故类型的致因链,通过构建更加丰富的数据库、选取合适的阈值参数等可以得到更加科学全面的分析结果。

猜你喜欢
引航员项集数据挖掘
日本引航员培训与考证体系研究与借鉴
基于并行计算的大数据挖掘在电网中的应用
关于引航员梯国际规范的使用研究
一种基于Hadoop的大数据挖掘云服务及应用
一种频繁核心项集的快速挖掘算法
基于GPGPU的离散数据挖掘研究
一种新的改进Apriori算法*
分布式数据库的精简频繁模式集及其挖掘算法*