基于安全大数据应用平台的铁路安全综合管理系统设计方案

2021-02-23 02:04陈同喜谢文广苏尔慈刘彦军
铁路计算机应用 2021年1期
关键词:铁路局集团公司铁路

陈同喜,谢文广,杨 光,苏尔慈,刘彦军

(1. 中国铁路北京局集团有限公司 安全监察室,北京 100860;2. 中国铁道科学研究院集团有限公司 铁路大数据研究与应用创新中心,北京 100081;3. 北京经纬信息技术有限公司 北京 100081)

近年来,随着铁路信息技术的快速发展,将大数据等新技术应用于铁路安全综合管理,辅助提升安全管理效率,对于保障铁路运输安全具有积极的意义。

铁路安全大数据分析是智能铁路、运输安全、人工智能、大数据等领域交叉研究内容[1-3]。康高亮等人[4]提出中国高速铁路安全保障体系框架;佘振国等人[5]研究提出铁路安全风险预警信息系统设计方案;周进[6]研究铁路运输事故致因及安全风险分析方法;杨连报[7]研究铁路事故故障文本大数据分析的关键技术及应用;黄英华[8]提出利用大数据技术推进安全生产双重预防机制建设;马小宁[9]全面总结铁路大数据应用实践并对今后发展进行展望。以上学者主要针对铁路运输安全体系框架、顶层设计或者安全管理机制开展研究,利用大数据分析技术开展安全管理应用系统开发的研究相对较少。

本文以铁路局集团公司的铁路安全综合管理系统(简称:系统)作为安全大数据应用平台的研究实例,针对铁路局集团公司安全监督管理的业务需求,提出系统方案设计,后续将以此为蓝图推进系统开发。

1 系统架构

1.1 总体架构

系统依托铁路局集团公司安全大数据应用平台,以安全数据汇集与治理为基础,集成安监、人事、机务、工务、电务、供电、车辆等专业的安全主题数据,利用大数据技术对结构化、非结构化的海量业务数据开展分析;在此基础上,引入AI算法开展安全趋势研判研究,帮助安全管理业务人员及时发现和消除安全隐患,以采取有效措施防止安全事故的发生。系统总体架构如图1所示。

图1 铁路安全综合管理系统总体架构

(1)既有系统

以中国铁路北京局集团有限公司(简称:北京局集团公司)各专业既有系统中安全管理主题相关数据作为基础数据源,为铁路安全综合管理系统的构建提供数据支持。

(2)平台层

通过铁路局集团公司安全大数据应用平台,将现有安全管理主题相关数据源接入,进行清洗和转换,剔除冗余和无效数据;重新梳理业务应用数据的血缘关系,将原先分散在多个独立应用系统中的安全管理主题相关数据以新的结构集中存储在大数据平台中,建立清晰的数据目录,为铁路安全综合管理系统的研发提供有利条件。

(3)应用层

应用层主要包括安全生产关键指标分析、安全风险智能分析及安全态势感知分析3项功能,基于大数据统计分析功能,结合人工智能算法,分析数据中隐含的态势和规律,辅助判别安全趋势变化。

(4)用户层

用户层涵盖铁路局集团公司决策层与各业务部门及站段,为用户提供按其职责权限定制开发的安全综合管理数据分析服务;根据各类用户不同职责,分配相应的系统功能访问权限。

1.2 技术架构

系统技术架构基于铁路局集团公司安全大数据应用平台,逻辑上可划分为数据采集层、数据服务层、数据访问层、数据应用层及数据展现层5个层次,如图2所示。

图2 铁路安全综合管理系统技术架构

(1)数据采集层将各类安全管理主题相关数据通过标准数据接口,先抽取并存储到中间数据库中,对这些数据进行结构梳理,并建立数据登记的原始记录。

(2)数据服务层提供结构化和非结构化数据存储服务;其中,结构化数据存储管理主要以数据仓库为主,为结构化数据提供标准SQL数据定义、操纵、查询与控制服务;非结构化数据库由HBase、HDFS等组成,对海量的非结构化数据提供存储服务,并完成分布式计算。

(3)数据访问层采用Hibernate完成对象关系型数据库映射,与外部系统的数据接口一般采用RESTful方式实现。

(4)数据应用层是系统开发的基本框架集合,主要采用SpringMVC等框架,完成业务逻辑的实现。

(5)数据展现层是系统面向用户的前端展示媒介,采用Bootstrap框架实现页面响应式渲染,通过Ajax异步请求与服务器实现数据交互,以可视化方式将分析结果数据动态展现给用户 。

1.3 数据接口

系统数据接口主要包括2类:实时数据接口与非实时数据接口。其中,实时数据接口又分为高可靠实时共享接口与高性能实时共享接口;前者采用分布式队列 Kafka 技术,能够保证数据不丢失,适用于响应速度适中、数据准确性要求高的安全业务场景;后者采用 WebSocket Stomp 协议共享,高效但不能保证数据不丢失,适用于并发请求较多且实时性要求较高的业务场景。对于非实时数据接口,系统采用RESTful 方式实现数据共享,接口响应间隔由系统轮循间隔决定,适用于大数据量分析、且实时性要求不高的业务场景。

2 功能设计

2.1 事故及故障综合分析

依托铁路局集团公司安全大数据应用平台,对原先分散在多个系统中的安全管理主题相关数据进行梳理、整合,利用内存计算、即席查询等技术,为不同层级安全管理业务人员提供自助式分析服务。

2.1.1 安全即席分析

(1)交互式分析:提供可视化分析界面,集中展示安全管理主题相关数据,揭示每一项数据的特征和分布规律,检视数据是否满足正态分布及帕累托分布;调整细分的目标数据集合,可切换分析指标、维度和图形样式;探查数据中是否存在异常情况,可定位发生异常的目标数据,生成直观的数据诊断报告。

(2)智能检索:梳理海量的安全管理主题相关数据,为数据创建便于统计、分析的各种索引。用户输入关键字后,系统可主动判断用户意图,根据索引自动选择数据对象,切分用户关注的详细数据集合;在图形界面上展现对应的数据分析图表,以便于开展交互式探查分析。

(3)启发式分析:当用户进行数据分析时,系统首先呈现目标数据集合的分布规律,以启发业务人员设置合适的、有针对性的过滤条件,辅助其发掘安全数据中隐含的规律。

2.1.2 安全风险智能分析

(1)安全风险构成及趋势分析:按照铁路局集团公司、业务部门、站段、车间等4个层级,进行安全风险总量的构成分析,发现与预期不符的构成部分,对其展开趋势研判与对比,诊断安全风险及管控异常情况。

(2)安全风险分级管控分析:按照重大、较大、一般、较低4个风险级别,分析铁路局集团公司、业务部门、站段、车间安全风险总量在各个风险级别上的分布情况,发现与预期不符的情况,避免重大安全风险出现漏检或少检。

2.1.3 安全态势感知分析

(1)异常情况分析:综合评估铁路局集团公司、业务部门、站段、车间的安全风险、隐患、通知书、故障、事故数据,并根据数据分布规律及趋势变化,分析安全管理异常状况。

(2)态势感知分析:通过对事故故障、安全问题、安全信息、检查写实记录、安全风险管控及隐患排查治理等数据研究,实现对各专业安全态势感知。

2.1.4 安全生产关键指标分析

汇集安全风险过程控制管理系统和安全监督管理信息系统的相关数据,分析并揭示安全风险控制情况、安全隐患排查情况、安全投入情况、网络安全情况、高铁和旅客列车安全情况、从业人员伤亡情况、责任铁路交通事故情况、责任行车设备故障情况、安全红线触犯情况等安全生产关键指标。

2.1.5 事故故障溯源分析

(1)风险自动识别:比对已建立的安全风险数据模型库,实现风险的自动识别与告警。

(2)风险等级判定:判断已发生危险事件的危险等级,对比修正现有风险库。

(3)危险事件推演:对已发生的危险事件进行溯源分析,建立危险事件致因关联数据库,自动对比铁路局集团公司安全大数据匹配情况,对存在同类危险概率可能性进行分析判断,提出安全管理干预建议。

2.2 安全风险管控与隐患排查治理分析

2.2.1 安全风险分析

按照风险项目、风险项点、风险类别、风险危害程度,对铁路局集团公司级、站段级风险点进行归类和统计,对系统识别出的安全重大风险、较大风险进行自动预警。

2.2.2 安全隐患分析

按照隐患的类别和等级,对发现的安全隐患进行归类和统计,提供隐患历史记录溯源;基于安全管理主题相关数据,分析安全风险与安全隐患之间关系,安全隐患与事故/故障之间关系,以及安全隐患与安全设备、安全人员之间关系;对已发现的安全隐患进行处理并销号,实现安全隐患的闭环管理,防范事故/故障的发生。

2.3 安全综合管理分析

基于各类安全管理主题业务数据,开展关联分析,挖掘安全隐患的主要来源、事故/故障的致因,以及可能导致的关联的事故故障类别。同时,建立安全“风险—隐患—事故故障”演变规律模型,分析安全设备检测、监测、报警数据与隐患、事故/故障的关联关系,建立风险、隐患、事故/故障、安全监督、设备状态、人员、外部环境的知识图谱,辅助安全管理人员实现及时、精准的监督检查。

3 关键技术

3.1 文本分析技术

系统运用文本分析技术,提取安全事故/故障报告中蕴含的非结构化安全管理主题相关数据,经处理后形成集检索、提取、归类、转化等功能于一体的安全管理资料文本知识库,基于该文本知识库开展面向风险、隐患、安全事故/故障的关联分析,挖掘安全事件的发展规律。

自然语言处理(NLP, Natural Language Processing)的应用主要有机器翻译、文本摘要、文本情感分析、知识图谱、智能问答等[9]。鉴于铁路行业语料的独特性,铁路自然语言处理(文本分析)是一种有别于通用自然语言处理分析的垂直行业应用类型,主要应用全文检索、命名实体识别、不平衡数据分类、协同过滤、知识图谱、时间序列、深度学习等技术。此外,从时空、关联、行为等角度,建立面向铁路安全业务的AI模型,提供业务应用和人工智能分析模型的接口服务调用。

面向安全综合管理的文本分析技术通过采集与安全事故和故障相关的文本数据,建立故障库、事故库和事故/故障报告库,实现事故/故障追踪报告的大数据分布式存储和全文检索。同时,应用深度学习模型、命名实体识别等大数据和文本挖掘等前沿技术和工具,从非结构化的事故/故障文本数据中自动提取出事故/故障名称、地点、时间、原因、整治措施等关键信息,将非结构化的事故/故障文本数据转换为结构化数据进行存储,建立铁路局集团公司历史事故/故障库,应用文本分析技术对重点事故/故障、多发事故/故障区域等展开分析。

3.2 数据治理技术

系统融合数据治理技术,依托铁路局集团公司安全大数据应用平台的元数据管理、主数据管理、数据质量管理等模块,实现对铁路局集团公司安全管理主题相关数据的全生命周期管理,提供血缘分析、影响分析、关联分析、数据质量报告等功能。

铁路局集团公司安全大数据应用平台可自动同步主数据平台中的安全管理主题相关数据,依据主数据与数据稽核规则,按需建立不同的稽核模型,对接入平台的安全管理主题相关数据进行质量稽核。该平台采用批处理与流处理相结合的方式,对各类安全管理主题相关数据进行分析处理,并生成数据质量报告;采用Hadoop中MapReduce计算框架,利用基于Spark生态技术的批处理与流处理、基于Flink生态技术的批处理与流处理以及基于Storm技术的流处理,将瞬间计算转换为平稳的流式实时计算,以充分利用服务器的空闲时间,减轻服务器瞬时压力,提升铁路安全管理主题数据治理的实时性。

4 结束语

以铁路安全综合管理系统作为北京局集团公司安全大数据应用的研究实例,从系统架构、功能设计、关键技术3方面介绍系统设计方案。作为铁路安全大数据应用的示范项目,该系统将为铁路安全管理人员提供便捷、灵活、客观的辅助决策支持工具,旨在为铁路安全综合管理赋能。

目前,用户与研发单位已利用Demo程序,就系统设计方案充分沟通、论证和确认,下一步将全面启动开发工作。

猜你喜欢
铁路局集团公司铁路
詹天佑,“中国铁路之父”
沿着中老铁路一路向南
一路欢声一路歌 中老铁路看点多
关于国家控股集团公司财务风险管理问题探析
集团公司财务共享服务中心问题分析
铁路机动车管理信息系统
H5 智联韵动版
中铁总所属18个铁路局挂牌成为公司
高铁车站春节旅客运输组织实践
昆明铁路局完成IP会议及语音系统建设