语义分析人工智能在石油天然气生产现场安全管理追溯中的应用展望

2023-11-14 05:42刘洋谭昆张健威郝壮远
石化技术 2023年11期
关键词:图谱关联因素

刘洋 谭昆 张健威 郝壮远

中国石油集团安全环保技术研究院 北京 102206

安全问题对于石油天然气生产至关重要,随着现代化的企业安全制度的确立,国内油气企业的事故发生率与事故亡人率显著降低。但是,目前企业在安全管理方面依然存在许多问题,例如同一起事故在同一单位多次发生、同一类问题在不同的单位重复出现,其中一个重要原因就是对现场安全数据资源的认识和价值利用不足,原因分析不到位。企的内部数据库中已经积累了海量的安全文本数据,但是缺乏高效的分析方法,没有正确认识到事故事件资源的潜在价值。

随着计算机硬件的不断发展与各种公开数据集的提出,深度学习技术再次成为各个领域的研究热点,研究者们提出了各式各样的神经网络模型,例如循环神经网络[1(RNN)、卷积神经网络[2](CNN)、强化学习[3]、对抗生成网络[4](GAN)等。基于深度学习的自然语言处理算法不断刷新自然语言处理领域各个任务的最高记录,例如关系抽取[5]、机器翻译[6]、命名实体识别[7]、问答系统[8]和阅读理解[9]。本论文的一项主要工作为使用深度学习技术对油气行业的HSE 数据进行文本挖掘,涉及到的自然语言处理任务有文本相似度计算、词向量训练、文本分类等。

1 构建现场安全知识图谱

现场安全管理涉及大量的安全知识点,如危险源识别、风险评估方法、事故案例等,这些知识点之间存在复杂的关联关系。然而,这些安全知识常常散落在各种文件、历史案例与专家脑中,难以系统梳理和关联。

语义分析人工智能技术可以自动提取这些安全知识,识别知识点之间的关联关系,构建现场安全知识图谱。具体可以:

1.1 安全知识采集

构建安全知识图谱的第一步是广泛采集现场安全管理涉及的各类知识,主要来源包括:

(1) 安全规程及操作规范文件。包含对设备安全要求、操作流程、预警值等详细规定;

(2) 安全案例及事件报告。记载了历史上发生的事故案例,包括事件过程、影响及教训,是安全知识的重要来源;

(3) 专家访谈与经验分享。专家在长期工作中积累了大量安全管理知识与经验,需要通过访谈等方式进行采集;

(4) 跟踪知识与前沿技术。跟踪行业内外最新发布的标准、技术白皮书等,采集最新安全管理知识与理念;

(5) 数据统计与分析结果。通过分析现场各类监控数据和过程参数,可以发现设备或过程的“空窗期”知识等。

1.2 知识抽取与表示

从上述来源采集的安全知识常常以非结构化形式表达,需要利用语义分析技术转换为结构化知识表示:

(1) 实体识别。识别安全知识中的关键实体,如设备名称、工艺参数、物料名称等,建立实体节点;

(2) 关系抽取。分析实体之间的关联与作用,识别相互依赖、顺序关系、上下级关系等,构建关系边;

(3) 事件解析。解析安全案例报告等,识别关键事件与影响因素,建立事件节点与关系;

(4) 概念归纳。分析概念定义及上下文,识别近义词与上位概念,建立概念类别体系。

1.3 知识关联与推理

在获得安全知识结构化表示后,需要构建知识点之间的关联与逻辑关系,实现对知识的深度理解与推理:

(1) 相互关联。根据知识内容与语义,识别知识点之间的相互依赖、交互作用、相关影响等关联关系。

(2) 层级分类。根据概念抽象程度将知识点分类,识别上位概念和下位概念关联。

(3) 逻辑推理。构建知识关联网络,支持对知识的推理与查询,发现知识之间的潜在关联与联系。

(4) 知识完备性分析。检查知识关联网络的完备性,发现知识缺失或关联不足之处,指导后续知识采集。

构建安全知识图谱是一个循环迭代的过程。通过不断采集、抽取、关联与完善,可以实现对现场安全管理知识的系统梳理,为实现安全追溯与决策提供知识基础。

2 开展事件追溯

在石油天然气生产现场,各种安全事件时有发生,事后开展事件追溯可以找出事件发生的完整路径,分析各种影响因素,为事件调查和防范决策提供基础。

然而,现场的数据量大且分散在各个监控系统、传感器数据与手写记录中,使用人工方式开展事件追溯需耗费大量时间和精力。语义分析人工智能技术可以实现自动化事件追溯:

2.1 现场数据采集与整合

事件追溯首先需要采集与事件相关的各类现场数据,包括:

(1) 监控系统数据。包括视频监控、巡检数据,提供事件发生时的现场环境信息。

(2) 工艺参数数据。包括压力、温度、流量等实时数据,反映事件发生时工艺状态。

(3) 传感器数据。各类震动、热损失传感器的数据,可检测到设备微小变化。

(4) 操作日志与工作票。操作员操作记录和工作许可,提供有关人员行为信息;。

(5) 事件报告。事件发生后编写的报告,描述事件过程及现场情况,是追溯的重要信息源。

然后需要对采集的数据进行清洗、转化和关联,构建与事件相关的统一数据环境,方便进行后续追溯与分析。

2.2 事件实体与数据识别

在数据环境下,利用自然语言处理等技术识别:

(1) 关键事件实体。如事件发生的设备名称、时间点、涉及物料等。

(2) 数据参数变化。在事件发生前后识别工艺参数、传感器数据等的变化模式;。

(3) 操作行为记录。识别事件相关的操作行为,如关闭阀门、启动设备等。

(4) 报告信息提取。从事件报告等中提取事件过程中环境变化、操作响应等信息。

这些信息为在海量的数据中精确定位到与事件相关的数据提供依据,实现事件追溯路径的识别。

2.3 事件数据关联与追溯路径构建

根据上述识别的各类信息,可以在数据环境下构建事件追溯路径:

(1) 时间 axis构建。根据事件实体中提取的时间信息,定位到事件发生前后的瞬时数据,构建事件沿时间轴的数据分布。

(2) 空间路径识别。根据事件相关的设备实体、传感器位置等信息,识别事件涉及的数据在空间上的分布与传播路径。

(3) 数据变化关联。根据工艺参数、传感器数据的变化模式,关联到导致这些变化的数据,延伸事件追溯路径。

(4) 操作行为链接。根据操作日志与工作票中识别的操作记录,找到导致这些操作的数据变化或报警信息,扩展事件追溯路径。

(5) 路径完备性评估。评估构建路径的完备性,发现数据缺失或关联不足之处,提供后续采集或关联的方向。

通过上述步骤,可以实现在大量现场数据中自动识别事件关联信息,构建事件从发生到结束的完整追溯路径,为事件影响因素分析和决策提供详实依据。但也需警惕由于数据不完备或算法限制导致的路径误导,需要专家验证与修正。

3 进行原因分析

3.1 影响因素提取

原因分析第一步是从构建的事件追溯路径和安全知识图谱中提取所有可能影响事件发生的因素,主要包括:

(1) 数据异常点。如工艺参数超限,传感器测量异常等,可能导致设备故障或操作错误。

(2) 操作不当。操作员错误操作可能直接导致事件发生,需要检查事件相关操作记录。

(3) 设备问题。设备老化或潜在缺陷可能影响正常运行,需要检查维保记录及历史故障信息。

(4) 管理漏洞。如安全规程不完善、培训不足等管理方面原因,是较难识别但也需考虑的影响因素。

(5) 外界环境。如气象条件变化、供电供料异常等外界环境变化也可能是事件癥结所在。

3.2 因素关系建模

当提取各种影响因素后,需要构建这些因素之间的相互作用模型,识别对事件产生直接影响的因素。关系建模主要通过:

(1) 知识图谱推理。利用构建的安全知识图谱,分析各因素与事件结果之间的逻辑关系与相互作用,判断因果关系。

(2) 统计学分析。利用历史数据对各影响因素与事件的对应关系进行统计学分析,得出因素作用的置信度。

(3) 专家验证。通过提出影响因素与关系模型,征询专家意见进行验证与修正,减少模型误导的可能。

3.3 原因确定与验证

根据构建的影响因素关系模型,可以确定最可能的原因:

(1) 综合判断。考虑各因素对事件产生影响的置信度和知识推理结果,综合判断作用最大的因素作为原因;

(2) 路径追溯。从事件结果以因果逻辑推理至各影响因素,可以判断导致后续影响的因素作为原因。

(3) 双向验证。基于原因提出的假说,检验其是否可以解释导致事件产生的全部影响因素与变化过程。如果不能充分解释,则需重新确定原因。

(4) 专家评估。将人工智能确定的原因提交专家评估,判断其准确性与合理性,必要时提出新的因素考虑。

原因分析的结果将决定后续的改进方案和指导措施。所以,必须在数据和知识的支持下,采用多角度检验的方式确保其准确性,最大限度地减少由算法局限导致的误判风险。同时,也需要不断通过实践检验,优化知识模型和分析方法。

总体而言,实现以数据和知识驱动的原因分析需要安全知识图谱与事件追溯的有力支撑。只有在全面考虑各类影响因素的基础上,才能得出准确可信的事件癥结判断。这也为人工智能在复杂问题分析中的不足提出了更高要求。

4 结束语

石油天然气生产现场涉及大量工艺设备与操作环节,安全管理追溯难度大,数据驱动的人工智能技术为其带来新思路。语义分析人工智能技术可以实现对现场海量异构数据的深入理解,构建安全知识图谱,开展事件追溯与原因分析,为现场安全管理决策提供信息化支撑。

总之,语义分析人工智能技术为实现石油天然气生产现场“数据驱动”、“全自动化”的新一代安全管理追溯体系提供了可能。但也面临一定的挑战,需要在实践中不断总结经验、优化提高。

猜你喜欢
图谱关联因素
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
绘一张成长图谱
解石三大因素
“一带一路”递进,关联民生更紧
奇趣搭配
补肾强身片UPLC指纹图谱
智趣
主动对接你思维的知识图谱
短道速滑运动员非智力因素的培养
杂草图谱