基于信号检测论的国际豁免航班飞行员注意特征分析*

2022-03-23 05:24李敬强张希凝周妍汝刘安南
交通信息与安全 2022年6期
关键词:警觉虚报阶段性

李敬强 张希凝 胡 超 周妍汝 刘安南

(中国民航大学安全科学与工程学院 天津 300300)

0 引 言

鉴于新冠肺炎疫情在全球的持续蔓延与恶化趋势,根据国家防疫政策的总原则,中国民航局允许我国航空公司经营的国际客/货运航班以豁免的方式运行,最大程度地降低飞行人员的感染GOVID-19的风险。所谓豁免航班,是指在原有机组人数的基础上再增加1~2 套机组,并且取消原定在目的地的过夜休息改为直接飞回出发地的航班。该运行模式导致连续飞行时间成倍增加,使得洲际航线总飞行时间介于24~30 h 之间,长时间飞行且频繁穿越不同时区对飞行安全带来重要挑战。处于值勤任务中的飞行机组人员需要保持最佳的警觉度对飞行仪表的各类信息进行监测。然而,当前洲际豁免运行模式下飞行员疲劳风险与安全执行任务能力方面的研究较少。因此,豁免航班飞行过程中飞行员的警惕性、疲劳程度、对各种信号的检测能力,以及敏感性等特征对飞行安全的影响亟须进一步研究[1-3]。

研究显示个体在长时间警觉任务中错漏事件发生概率更高,并会随着时间的推移而增加[4]。飞行过程中,飞行员需要对关键事件信号做出正确反应,这意味着保持警觉和专注可能更具有挑战性,需要付出更多的精神努力[5]。警惕性下降一方面与观察者区分目标与非目标的能力下降(辨别能力下降)有关,同时,也可能因为观察者的判断标准发生了变化。

信号检测论(signal detection theory,SDT)是关于人们在不确定的情况下如何做出决定的理论[7]。信号检测理论的经典心理物理模型将辨别能力(d')和判断标准(β)区分开来[8]。辨别能力(d')是指感知者辨别各种信号的能力。如表1所示[9],判断标准(β)是指被试者对接收的信息进行判断的标准或策略。该理论改变了传统上人们对感觉阈限的理解,它说明被试判断刺激是否出现不仅取决于信号的强度,还要看作业的性质以及被试对判断后果的认识。在经典的SDT中,被试的刺激识别有4种结果,分别为:击中(correct detection,CD)、正确否定(correct rejection,CR)、漏报(missed detection,MD)、虚报(false alarm,FA)[10]。

表1 SDT 结果Tab.1 The outcomes of SDT

信号检测论现代理论认为,警惕性下降是由于信息处理资源的损耗导致被试针对信号与噪音的辨别能力的下降,也有可能是由判断标准的变化。有研究发现,持续注意力的降低是由于β的变化,而不受d'降低的影响,此外,如果对被试提出不同的要求,如对不同情境表现不同的注意,β也会受到显著影响[11-12]。而且,被试进行测试时期望不同(主试提供奖惩),β会受到显著影响,进而影响最终决策[13]。

目前,豁免运行航班是新冠疫情背景下采用的特有客/货运输模式。然而该运行类型是否对飞行员的信号检测能力带来影响尚不明确,是否会影响飞行员信息加工的决策标准尚不清晰。本研究基于信号检测论原理比较豁免与否2种运行中飞行员对选择性、持续性与阶段性信号的感知能力,以期为飞行机组人员疲劳风险管理政策的制定提供参考。

1 测试方案

1.1 测试对象

在国内至北美洲的往返航班(北京/成都—洛杉矶/温哥华)中选择豁免航班与不豁免航班,每个航班上至少有1名飞行员参加本次测试。要求参加测试前3 d飞行员保证正常作息。得到18名飞行员的测试结果,2种航班各9 名飞行员,其中各有4 名机长,5 名副驾驶。所有飞行员年龄均在26~40 周岁,驾驶机型均为787机型,去程航班离港时间处于北京时间23:00—01:00之间。

1.2 测试工具

本研究使用的测试工具为持续绩效测试(continuous performance test,CPT)、卡罗林斯卡嗜睡量表(Karolinska sleepiness scale,KSS),以及机组人员状态检查表(samn perelli scale,SP)。

1.2.1 持续绩效测试

屏幕每次呈现3 张图片,见图1(a),图片由{╧╟╤╢╩╠╦╣}无特殊语义特征的抽象符号组成。要求被试先判断A1 与B1 形状与方向是否一致,不一致按J键,一致则按F键,如果判断A1与B1一致,接下来要判断A1与B2形状与方向是否一致,一致按SPACE键,不一致按J键,见图1(b)。注意力由阶段性警觉、持续性警觉、选择性注意和持续注意力4个部分组成[14]。在飞行过程中,飞行员不仅要对出现的寻常信号做出反应,还要警惕突发信号,根据Riccio设计的CPT范式[15],该测试中2个符号形状不一致为持续性信号,测试结果反映持续性警觉,即对寻常信号或高频率信号的反应能力;A1 与B1 形状一致为选择性信号,反映选择性注意,是指对特定刺激做出反应并忽略其他刺激的能力;A1 与B2 形状一致为阶段性信号,反映阶段性警觉,即在警告信号后对刺激做出反应的能力。持续性信号出现的概率约为83%,选择性信号出现的概率约为12%,阶段性信号出现的概率约为5%。

图1 CPT测试Fig.1 The continuous performance test

测试过程:将CPT开发为应用程序(APP),安装在安卓系统的荣耀V6 平板上进行测试。被试按照指导语进行判断并按键,按键后原刺激消失并呈现新的刺激。2 个刺激呈现的随机间隔时间为0.5~2 s,刺激间隔期间屏幕正中呈现红色加号(字号为30)。每组共呈现128 个刺激,所有刺激呈现完之后,该测试完毕。

1.2.2 KSS与SP量表

KSS 将警觉度分为9 个等级,其中奇数等级表示:1=极度警觉;3=警觉;5=既不警觉也不困;7=困乏,但是没有想保持清醒的感觉;9=非常困,极力想保持清醒,和困乏做斗争。偶数等级(2,4,6,8)代表介于前后2个等级之间的状态。

SP将警觉度分为7个等级:1=完全警觉,完全清醒;2=很有活力,反应灵敏,但不是最好状态;3=情况一般,稍微清醒;4=有点累,不怎么清醒;5=挺累的,无精打采;6=非常疲惫,难以集中精神;7=筋疲力尽,无法有效工作。

KSS 侧重评估被试的嗜睡程度,更多地反映被试当下的困意;而SP 是专门为机组人员设计的,以工作/休息概况为基础评估机组人员的疲劳程度,更多地反映被试当下的疲劳感受。将KSS 和SP 结合起来可以更加全面地反映飞行员的警觉度和疲劳,而且KSS 和SP 结合使用也被国际民航组织推荐[16-17]。

1.3 测试流程

基于国际民航组织(International Civil Aviation Organization,ICAO)发布的飞行疲劳风险管理系统(fatigue risk management systems, FRMS)指导手册(Doc 9966)中对开展飞行机组人员的疲劳数据采集提出的建议[18]。本次测试在真实运行环境中实施,测试方法成熟,测试流程符合国际标准,测试前有充分的动员,测试过程有保障措施。

“现在,我们这里有30多个村庄变成了旅游专业村,包括石头村、软籽石榴村、齐长城村、画家村、摄影村、奇石村等。我们尽量挖掘文化要素,基本没有同质化的村庄,使游客始终有一种新鲜感,回头客不减。”山东淄博市淄川区文化和旅游局局长唐加福说,有温度的产品、有文化的包装、有品质的服务,才能真正实现可带走的记忆。

分别选择国内飞往北美洲的豁免与不豁免航班各10 班,每种类型航班选择5 名机长和6 名副驾驶共22名飞行员参与测试,机组人员平均年龄在26~40 周岁之间,驾驶机型均为787 机型。在航班出发前72 h 内对飞行员进行线上培训,讲解该测试的用途,测试规则,设备领取与归还方式,在航班出发前24 h 内进行设备准备(平板充电并配备充电器。检查平板是否安装测试程序,测试程序是否可以正常运行),航班出发前(飞行员在收发室领取航班所需证件时)领取设备并进行练习熟悉测试流程。之后在往返航班至少各进行3 次测试,测试节点见图2,飞行员在飞机起飞前(测试1)和降落后(测试3)至少各进行1次测试,测试2是指在起飞任务爬升至顶点下座后至降落任务(进近任务)上座前期间的巡航任务(自动驾驶飞行过程中的轮班休息状态)至少进行1 次测试。测试在休息舱或准备室完成,双手测试,每次测试包括KSS 量表和SP 量表以及CPT 测试,测试时间为7~10 min。返程航班结束后,飞行员至收发室归还设备。由实验人员进行数据下载整理。

图2 测试节点Fig.2 Test node

由于飞行过程中始终基于安全操作为第一准则,在不影响安全的前提下,机组人员自己协调时间完成测试。因飞行过程中充满不确定性(气象、陆空通话等),最终有2 名机长和1 名副驾驶有遗漏测试或测试中断的情况,1名副驾驶测试结果无效,剔除了该4 名受试者的数据。共保留18 名受试者数据,该18 名受试者数据测试节点完整,飞行节点准确,无测试中断现象。所有飞行员都是自愿加入该测试,并且本研究得到了监管机构、工会和航空公司管理层的支持。

2 数据处理

CPT测试总体正确率低于85%的测试结果认为是无效数据,剔除该测试全部结果。由于在测试开始时被试可能会有适应过程,测试结束时会对测试结束的期待,这2种心态会影响反应结果,为保证数据的有效性剔除128个反应中的前后各15个反应结果,统计98个剩余反应结果中对F、J、SPACE反应按键的击中、漏报、虚报、正确否定的概率,以及飞行员击中的平均反应时(reaction time,RT),分析飞行员注意水平的变化。其中击中率与漏报率总和为1,正确否定概率与虚报概率总和为1。通过计算3 种按键的辨别能力(d')与判断标准(β),分析豁免与否2种情况下飞行员对信号检测的能力的变化,d'越大说明辨别能力越强[19],β=1,标准合适;β>1,标准较严;β<1,标准较松。先验概率低,判断标准严格;先验概率高,判断标准较松[20]。计算往返共6 个飞行节点注意指标的平均值,通过Person 相关检验分析各个指标是否与飞行节点呈现相关性。Mann-Whitney U 检验分析飞行员在不同飞行模式之间注意指标的总体分布是否存在差异。

绘制3 种按键的受试者工作特征曲线(receiver operating characteristic curve, ROC),Wixted 等[21]认为,当目标是衡量目击者如何区分信号有无时,绘制ROC 曲线比计算正确率更适合。ROC 曲线是针对各种阈值设置下分类问题的性能度量。ROC 是概率曲线,曲线下方的面积大小(area under curve,AUC)表示可辨别的程度或测度。AUC接近1,这意味着它具有良好的可分离性度量,AUC接近于0,这意味着它的可分离性度量最差,AUC越高,区别信号有无的能力越高[22]。

3 信号检测能力分析

3.1 自评疲劳度

Mann-Whitney U检验结果显示,豁免与非豁免2种情况下,KSS 与SP 有显著性差异(sig=0.004,sig=0.004)。不豁免航班飞行员的自评疲劳度高于豁免航班。不豁免航班飞行员KSS 值分布在3.667~4.333之间,见图3(a),去程降落后阶段最高;豁免航班KSS 值在2.000~2.842 之间,去程飞行中最高。不豁免航班飞行员SP值分布在2.222~3.000之间,见图3(b),返程降落后最高;豁免航班SP值在1.556~2.000之间。

图3 飞行员主观疲劳度对比Fig.3 Comparison of pilots'subjective fatigue

3.2 信号检测结果

Person相关性显示,豁免与非豁免2种情况飞行员的各按键的d'、β、击中、漏报、虚报、正确否定概率与飞行节点没有显著相关性(sig>0.05),豁免航班选择性信号击中反应时与持续性信号击中反应时与飞行节点呈负相关(r=-0.885,sig=0.019;r=-0.845,sig=0.034)其余反应时指标与飞行节点之间不存在显著相关性(sig>0.05)。

如表2 所示,根据不同信号分类,持续性信号的击中率与虚报率在3 种信号中最高,正确否定概率在3 种信号中最低,持续性信号的击中率在0.966~1.000 之间,虚报率在0.066~0.219 之间,正确否定概率在0.781~0.934 之间。根据不同航班分类,豁免航班选择性信号击中率、阶段性信号击中率与虚报率低于不豁免航班,持续性信号虚报率与击中率高于不豁免航班。豁免航班选择性信号击中率在0.758~0.872之间,虚报率在0.000~0.005之间;持续性信号击中率在0.995~1.000 之间,虚报率0.123~0.219之间;阶段性信号击中率在0.793~0.859之间,虚报率0.000~0.008之间。不豁免航班选择性信号击中率在0.827~0.932 之间,虚报率在0.003~0.009之间;持续性信号击中率在0.966~0.972之间,虚报率0.066~0.147 之间;阶段性信号击中率在0.810~0.908之间,虚报率0.023~0.030之间。

表2 飞行员对3 种信号的判断结果Tab.2 Pilots'judgment results of three types signals

图4 飞行员对3种信号的辨别能力与判断标准对比Fig.4 Pilots'sensitivity and bias of three types signals

Mann-Whitney U检验结果显示,豁免与非豁免2种情况下,3种信号击中的平均反应时没有显著性差异(sig=0.262,sig=0.262,sig=0.150)。选择性信号击中的平均反应时在1 302.856~1 931.782 ms 之间,不豁免航班在去程降落后平均击中反应时最长(RT=1 771.465 ms),豁免航班在去程起飞前平均击中反应时最高(RT=1931.782 ms);持续性信号击中的平均反应时在1 048.205~1 521.993 ms之间,不豁免航班均去程降落后平均击中反应时最长(RT=1 521.993 ms),豁免航班均去程起飞前平均击中反应时最长(RT=1 496.495 ms);阶段性信号击中的平均反应时在1 163.385~1 792.643 ms 之间,不豁免航班去程起飞前平均击中反应时最长(RT=1 792.643 ms),豁免航班去程降落后平均反应时最长(RT=1 632.627 ms),见图5。不豁免航班的飞行员的选择性信号与持续性信号反应时的标准差在去程降落后最大,阶段性信号的标准差在去程起飞前最大;豁免航班飞行员选择性信号与持续性信号的反应时的标准差在去程起飞前最大,阶段性信号击中反应时的标准差在去程降落后最高。

图5 3种信号击中反应时Fig.5 Hit reaction time of three types of signals

通过击中率与虚报率绘制ROC曲线,如下图所示。本研究中不豁免航班AUC略高于豁免航班,但AUC 差异极小,选择性信号、持续性信号与阶段性信号的差异分别是0.008,0.019,0.006。如图6所示,2 种航班AUC接近于1,说明飞行员能够维持较为优秀的警惕性。

图6 3种信号的ROC曲线Fig.6 ROC curves of three types of signals

表3 3 种信号AUCTab.3 AUC of three types of signals

3.3 讨 论

豁免航班的运行方式缓解了飞行员的主观疲劳,可能与豁免航班机组人数增加、机组轮班次数增加有关。由图3 可见:不豁免飞行员与豁免飞行员的自测疲劳度有一定的差异,说明豁免的运行方式能够缓解主观疲劳感受,此外KSS与SP都是飞行员对自己疲劳感受的主观报告,其结果很可能受到飞行员对飞行任务的期望影响,即心理准备状态或心态。豁免航班配备飞行机组人数多于不豁免航班,飞行员在机上能够得到有效的休息,而飞行员对任务的期望感不同有可能导致豁免航班的主观疲劳感低于不豁免航班。不豁免航班飞行员需要到达目的地进行休息(过夜),在课题组进行的问卷调研中显示不豁免航班机组人员对国外新冠肺炎疫情形势比较担忧,存在较明显精神压力,这可能是不豁免航班自我疲劳(更多心理疲劳层面)感受相对较高潜在原因之一。当然,仍然需要下一步开展更深入研究并结合机组人员访谈来确定其原因。

无论豁免与否,飞行员的d'与β基本不受飞行节点的影响。3种信号中,无论豁免与否飞行员都更倾向于将信号判断为持续性信号,这可能是因为持续性信号的先验概率最高。豁免航班飞行员相较于非豁免航班更倾向于判断为持续性信号(豁免航班对持续性信号的虚报率高于不豁免航班),而2种航班进行测试时持续性信号的先验概率是一样的,表明豁免航班有牺牲选择性注意和阶段性警觉来维持较高的持续性警觉的倾向。

豁免航班选择性信号的辨别能力略高于不豁免航班,持续性信号与阶段性信号的辨别能力明显高于不豁免航班,豁免运行的方式会提高飞行员的辨别能力。豁免航班飞行员对选择性信号的判断标准略严格于不豁免航班,对持续性信号的判断标准明显松于不豁免航班,对阶段性信号的判断标准没有明显差异,这也是因为豁免航班飞行员牺牲了阶段性警觉与选择性注意来维持持续性警觉的另一证据。无论豁免与否,飞行员对选择性信号与阶段性信号的判断标准较为严格,持续性信号判断标准较松,这是因为持续性信号本身出现的概率较高。

本研究中,随着飞行节点的推移,豁免航班对选择性信号与阶段性信号的击中反应时降低,说明豁免航班机上轮班休息能够有效地帮助飞行员保持选择性注意与阶段性警觉。飞行员对3种信号的击中的平均反应时不受运行方式的影响。豁免航班在去程起飞前对选择性信号和持续性信号平均击中反应时最高同时稳定性最差,同时该节点对选择性信号的辨别能力最高,该节点可能将大部分认知资源用于选择性信号辨别,在去程降落后对阶段性信号平均击中反应时最高同时稳定性最差,同时该点对阶段性信号的辨别能力最低,说明该点阶段性警觉较差。不豁免航班在去程降落后对选择性信号和持续性信号的平均击中反应时最高同时稳定性最差,说明不豁免航班的飞行员在该节点需要进行较高的认知加工来维持选择性注意和持续性警觉;在去程起飞前对阶段性信号的平均击中反应时最高同时稳定性最差,说明不豁免航班的飞行员在该节点需要进行较高的认知加工来维持阶段性警觉。2 种航班击中反应时的稳定性存在不同变化规律有可能是因为2种航班情况下机组人员轮班/休息模式影响了认知资源分配,豁免航班在去程起飞前需要考虑回程机组人员的工作安排,不豁免航班需要在去程降落后的过站期间准备回程的相关工作,2种不同的情境可能使得机组人员认知资源的利用和调配发生改变。选择性信号与阶段性信号击中平均反应时略高于持续性信号,原因可能是飞行员对选择性信号和阶段性信号的判断需要更多的认知加工。具体来说,反应时延长可能是因为d'下降(例如,延长反应时决定刺激是属于信号还是噪声),但也可能是因为β更加严格(例如,增加线索判断,直到“证据”充足做出决定),反应时是辨别能力与判断标准的1 种综合体现。

不同运行方式的航班ROC曲线差异不明显,不豁免航班AUC略高于豁免航班但差异不大,说明飞行员的选择性注意、阶段性警觉与持续性注意不会因豁免运行而大幅下降。

4 结束语

通过对比豁免与不豁免2种运行方式的航班飞行员的主观疲劳程度、辨别能力、判断标准、ROC曲线,探讨豁免运行是否会影响飞行员的注意能力。结果表明:①不豁免航班飞行员的主观疲劳度高于豁免航班;②飞行员的辨别能力与判断标准不受飞行节点的影响;③豁免航班飞行员的辨别能力略高于不豁免航班,选择性信号判断标准略严格于不豁免航班,持续性信号的判断标准略松于不豁免航班;④豁免航班飞行员可能会牺牲阶段性警觉和选择性注意以保证持续性警觉;⑤飞行员的选择性注意、阶段性警觉与持续性注意不会因豁免运行而下降。因此,航空公司采取豁免运行的方式既可以降低飞行员的感染风险,同时也未对飞行员的警惕性造成干扰,是1 种安全合理的运行方式。本研究也存在一些局限性,如测试航线仅覆盖北美洲,飞行方向尚显单一,未来需增加大洋洲、欧洲等区域航线。另外,应考虑飞行员个体差异性,如年龄、飞行小时数等对注意力特征的影响。

猜你喜欢
警觉虚报阶段性
今夜
车检过程引起ABS故障虚报分析及处理
雪夜聊吟
警觉与疾病的传播次序性对动力学的影响
七月猪价或开启阶段性快速上涨
国际金价短期或延续阶段性回调
试论政府统计中虚报与整治的博弈分析
认知警觉机制的研究与展望∗
人生投资的阶段性
偷摘葡萄的狐狸