基于改进LSTM的航空发动机气路参数预测方法

2024-03-11 02:14吴亚锋缑林峰
测控技术 2024年2期
关键词:航次故障诊断发动机

马 帅, 吴亚锋, 郑 华, 缑林峰

(西北工业大学 动力与能源学院, 陕西 西安 710072)

航空燃气涡轮发动机故障诊断系统是先进发动机控制系统和健康管理系统的重要组成部分。有效的故障诊断系统可以确保发动机安全,降低维护成本,减少重大灾难发生的风险[1]。

基于性能的气路故障诊断通常是根据发动机转速、温度、压力、流量等气路测量参数的变化判断发动机的健康状态。基于测量参数预测模型的故障诊断方法是一种最常用的发动机故障诊断方法,这种方法首先通过参数预测模型的预测值和真实测量参数生成残差信号,将测量参数特征空间转换到残差特征空间,然后通过残差特征进行故障诊断,因此也被称作基于残差的诊断方法[2-4]。参数预测模型主要分为基于物理的预测模型[5-6]和数据驱动的预测模型[7-8],随着健康监测数据的积累和深度学习技术的发展,数据驱动的建模方法越来越广泛地应用到了发动机故障诊断中。

近年来,基于动态神经网络建模的方法在发动机气路故障诊断上得到了广泛的应用[9-12]。Choayb等[10]提出一种基于非线性自回归外生(Nonlinear Auto-Regression with eXogenous inputs,NARX)模糊网络的发动机鲁棒诊断系统,实现了对发动机健康状态的实时监测。Amirkhani等[11]针对单轴重型燃气轮机气路故障,提出了一种基于NARX网络建模的故障检测与隔离系统,该系统对输入噪声具有很好的鲁棒性。从以上研究结果可知,基于动态神经网络建立发动机参数预测模型是建立发动机鲁棒故障诊断系统的一种有效方法。然而,以上研究都针对的是发动机地面工况数据或简单的飞行工况数据,使用的建模方法也大多是静态网络模型。航空发动机飞行过程数据包含了发动机的非线性动态特性以及复杂飞行条件产生的噪声干扰,为了设计可靠的故障诊断系统,需要更精准的参数预测模型。

在机器学习领域,长短时记忆(Long Short-Term Memory,LSTM)网络是目前解决时间序列问题方法中应用最广泛、最有效的方法之一[13]。在语音识别[14]、手写字体识别[15]、动作识别[16]、温度预测[17]、寿命预测[18-19]等领域均有很好的表现。非线性动态系统的输入输出序列也可以看作一种特殊的时间序列,因此LSTM网络在非线性动态系统辨识中也受到了广泛的关注[20-21]。Wang[22]将LSTM应用到了动态系统辨识和控制器设计中,对网络模型的响应速度和准确度做了详细的研究,并取得了很好的辨识和控制结果。Zarzycki等[23]使用LSTM辨识化学反应器动态系统,并成功应用到模型预测控制中。Jiang等[24]应用LSTM网络建立了船舶操控运动模型,并验证了模型的泛化性能和鲁棒性。由以上研究结果可知,LSTM是一种有效的非线性动态系统建模方法。

近年来,基于注意力机制的LSTM网络模型在多变量时间序列预测中得到了成功的应用,这种模型将注意力机制嵌入LSTM中,以增强LSTM的预测性能。Qin等[25]使用两级注意力机制循环网络(Dual-stage Attention-based Recurrent Neural Network DA-RNN)预测时间序列,较传统RNN有较大的提升。Liu等[26]提出双相两级注意力循环网络(Dual-Stage Two-Phase,Attention-based Recurrent Neural Network,DSTP-RNN)实现了多变量时间序列的长期预测。由此可知,融合注意力机制的RNN网络更能有效地实现时间序列预测。

受上述工作的启发,本文针对航空发动机飞行过程动态数据,以数据驱动的发动机气路故障诊断为导向,提出一种用于发动机参数长期预测的特征注意力增强型LSTM(Feature Attention Enhanced LSTM,FAE-LSTM)网络。FAE-LSTM以发动机飞行工况参数为输入,预测发动机的气路性能参数。本文详细阐述了FAE-LSTM网络的结构以及发动机预测模型建模过程,并使用某型先进涡扇发动机动态模型模拟真实发动机对网络进行了验证。为了模拟真实的飞行过程,发动机动态模型使用商用飞机真实记录的快速存取记录器(Quick Access Recorder,QAR)中的飞行工况作为输入[27]。本文采用两个不同的数据集对模型的预测性能和应用方法进行了验证和对比分析。首先,使用健康状态飞行数据集验证了模型在实际飞行工况下的长期预测性能。然后,使用发动机性能退化数据集,研究了FAE-LSTM在并联模式和串-并联模式两种不同应用模式下的故障检测性能。

1 问题描述和方法

1.1 问题描述

图1 发动机参数预测模型在故障诊断中的应用

由图1可知,发动机参数预测模型的作用是预测健康状态下发动机的性能参数,从而生成残差信号。数据驱动的建模方法旨在使用历史记录的飞行过程数据{U,Y}建立发动机健康状态下的参数预测模型,建模过程可以描述为

Y=f(U,θ)

(1)

式中:θ为模型参数。

飞机在飞行过程中,由于飞行环境多变、工作条件恶劣等原因,记录的飞行过程数据往往包含很多不确定性干扰,增加了建模的难度。发动机工作过程是强非线性动态过程,飞行工况覆盖范围广,建立准确的、覆盖完整飞行包线的预测模型需要大量的飞行数据,这进一步增加了建模难度。针对上述难点,本文研究结合注意力机制与LSTM网络的预测模型,使用注意力机制增强LSTM网络的输入特征,从而提高模型的预测性能。

此外,本文预测模型带有自回归结构,自回归预测模型的应用方式也会影响最终的故障诊断结果。在故障诊断中,常用的自回归模型应用方式有两种,分别为并联结构[9,28](Parallel Mode)和串-并联结构[10-11](Series-Parallel Mode)。针对本文提出的FAE-LSTM网络,选择合适的应用方式也是设计故障诊断系统时需要考虑的问题。FAE-LSTM网络的两种应用方式如图2所示。本文使用单分类支持向量机(One-Class Support Vector Machine,OCSVM)建立故障决策系统,针对FAE-LSTM的两种应用方式对故障检测结果的影响进行研究,作为后续应用过程的参考。

图2 自回归LSTM网络在故障诊断中的应用方式

1.2 基于改进增强型LSTM的发动机参数预测模型

(2)

在编码器中,FA单元是一种特殊的注意力机制模块,与传统的注意力机制不同,FA结合了LSTM单元的循环结构,能够对整个输入序列在时间维度上进行动态加权,如图3(b)所示。为了更清晰地描述FA单元的计算过程,首先对LSTM单元的更新过程进行简单的介绍。对于LSTM单元,当前时刻的隐藏状态ht可以通过前一时刻的隐藏状态ht-1、单元状态ct-1以及当前时刻的输入xt计算获得。图4为LSTM单元示意图,其中包含了遗忘门、输入门、预输出门以及输出门。式(3)~式(8)描述了LSTM单元的隐藏状态从t-1时刻到t时刻的更新过程:

图4 LSTM单元结构示意图

it=σ(Wiixt+Whiht-1+bhi)

(3)

ft=σ(Wifxt+Whfht-1+bhf)

(4)

gt=σ(Wigxt+Whght-1+bhg)

(5)

ot=σ(Wioxt+Whoht-1+bho)

(6)

ct=ft*ct-1+it*gt

(7)

ht=ot*tanct

(8)

图3 FAE-LSTM网络结构示意图

式中:Whi和bhi分别为LSTM单元中的权重和偏置;*为Hadamard乘积,即对应元素相乘。为了简洁,将式(3)~式(8)的更新过程表示为

[ht,ct]=lstm(ht-1,xt)

(9)

(10)

(11)

使用注意力权重在特征维度上对输入变量加权,可得t时刻的加权输入变量:

(12)

(13)

在时间维度上循环式(10)~式(13)可得FA单元的最终输出HFA=[h1,h2,…,hn]∈Rn×Na。

2 实验设置

2.1 发动机数据集

本文使用某型带有齿轮箱的双转子涡扇发动机非线性模型仿真数据验证FAE-LSTM网络的参数预测性能。为了模拟真实的飞行过程,发动机非线性模型的输入采用的是商用飞机QAR数据中的飞行条件(Flight Data for Tail 687)[27]。飞行条件包含了表1所示的飞行高度(ALT)、马赫数(MN)、油门开度(PLA)和大气温度(T0)。图5为一个飞行航次的飞行条件展示。在数据生成过程中,本文对真实的飞行时间进行了压缩,压缩为实际飞行时间的0.1倍。表2为本文用到的测量参数Y。表3所示为模型的健康参数H,通过改变对应部件的健康参数模拟发动机部件的性能退化或故障。

表2 传感器测量参数Y

表3 健康参数H

图5 某个飞行航次真实飞行条件展示

为了从不同的角度验证FAE-LSTM网络的性能,本文设计了两个不同的数据集,分别为健康状态飞行工况数据集和发动机退化数据集。首先,选取T7作为预测参数,通过健康状态飞行工况数据集验证FAE-LSTM网络在真实飞行工况下的预测性能。然后,使用退化数据集验证FAE-LSTM网络的并联和串-并联应用方式对故障检测结果的影响。下面分别对每个数据集进行详细介绍。

2.1.1 健康状态飞行工况数据集

数据记录了发动机每次飞行任务的工况参数和传感器测量参数,采样时间为0.15 s,涵盖了飞机的爬升、巡航和降落过程。为了模拟真实环境,本文对数据添加了3种不确定性干扰,分别是传感器噪声、环境温度变化和由于发动机退化和维护等造成的每个飞行航次之间的发动机差异。其中测量参数的传感器噪声为高斯白噪声,噪声的标准差为信号幅值的[0.16%,0.16%,0.15%,0.13%,0.25%][30];每个飞行航次的地面温度服从[10℃,35℃]的均匀分布;通过调整低压压气机、高压涡轮效率和流量修正因子模拟航次之间的发动机差异。数据集共包含42个不同飞行航次的数据,选取其中30个飞行航次的数据作为训练数据,6个航次的数据为验证数据集,6个航次的数据作为测试集数据。数据集覆盖的飞行包线如图6所示。

图6 飞行包线

2.1.2 发动机性能退化数据集

性能退化数据集模拟了发动机的加速退化过程,记录了24个飞行航次的数据,发动机在这24个飞行航次内从健康状态逐渐退化到故障状态。图7为发动机各个部件随飞行航次的退化轨迹。Δθ*和Δη*分别为部件的流量退化系数和效率退化系数,其中发动机在前7个航次处于正常退化过程的健康状态,从第8个航次开始发动机处于故障状态。退化轨迹的生成参考了文献[27]和文献[31],其中正常退化过程的健康参数退化量随飞行航次线性增加:

图7 发动机每个部件的性能退化轨迹

δn(t)=ant+δ0

(14)

式中:t为飞行航次数;an=-0.001为健康参数的线性退化系数;δ0=U(0,0.001)为初始退化量,其中U(0,0.000 1)表示在0~0.001之间均匀分布。故障阶段的健康参数退化量随飞行航次呈指数变化趋势:

δf(t)=1-exp[a(ct)b]+δn(ts)+ξ

(15)

式中:ts为发动机从健康状态过渡到故障状态的飞行航次数,a=U(0.001,0.002),b=U(1.25,1.35)。ξ=N(0,d)表示服从均值为0、标准差为d的正态分布,对于部件效率系数d=0.001,对于部件流量系数d=0.002。为了减少数据量,使发动机退化速度更快,本文为式(15)中的航次数t添加了系数c,使发动机退化速度变为原来的c倍,本文选择c=5。

该数据集用于研究FAE-LSTM网络的并联结构和串-并联结构对故障检测结果的影响。

2.2 网络设置

为了验证FAE-LSTM的性能,本文选取以下5种主流动态网络作为基线模型。

SS-LSTM:状态空间形式的LSTM网络,即不使用自回归结构,只使用飞行工况参数预测发动机性能参数。网络包含2个LSTM层,每层100个神经元节点。

NARX-NN[10-12]:NARX神经网络,网络包含2个隐藏层,每个隐藏层包含100个神经元节点,每层激活函数为ReLU函数。

AR-LSTM[17]:带有自回归结构的LSTM网络,网络包含2个LSTM层,每层包含100个神经元节点。

DA-RNN[25]:基于两阶段注意力机制的RNN网络,RNN使用LSTM,编解码器LSTM层的单元节点数都为100。

DSTP-RNN[26]:基于两阶双相注意力机制的RNN网络,RNN使用LSTM,编解码器LSTM层的单元节点数都为100。

所有网络模型在训练过程中都使用adam优化器更新网络参数,训练mini-batch值设为1 024,训练500个周期。网络训练过程的初始学习率为0.005,每隔100个训练周期学习率减半。训练前,使用min-max归一化方法将数据归一化到[-1,1]区间内。

2.3 性能评价指标

本文采用均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、拟合度指标(Fitness,FIT)来评价模型的预测精度。公式如下:

(16)

(17)

(18)

FIT公式如下:

(19)

3 结果分析

3.1 健康状态飞行工况数据集的预测结果分析

3.1.1 网络参数对FAE-LSTM预测性能的影响

该数据集的模型输入为飞行工况参数[ALT,MN,PLA,T0],输出为低压涡轮后温度T7。首先对FAE-LSTM模型参数敏感性进行研究,分别研究FA模块节点数和输入序列长度对性能的影响。分别在不同网络参数下训练FAE-LSTM网络,每个网络模型分别在不同初始化条件下训练5次,并求取平均值,结果如图8所示。由图8可知,序列长度对网络性能影响较大,而神经元数量对网络性能影响较小。序列长度至少为8时,网络有较好且平稳的预测性能。

图8 网络参数对FAE-LSTM预测性能的影响

3.1.2 对比分析

本小节对比不同动态模型在测试集上的长期预测性能,对所有网络模型进行训练,每个网络模型分别在不同初始化条件下训练5次。对带有自回归结构的网络模型选取序列长度n=8,表4为所有动态模型在测试集上的长期预测性能指标。由表4可知,本文提出的FAE-LSTM模型预测性能最好,较AR-LSTM预测误差降低了24.5%,表明了使用FA提取输入特征的有效性,结合LSTM能够更充分地捕获多变量时间序列的时空信息。

表4 动态模型在测试集上的长期预测性能(均值±标准差)

此外,通过表4可知,不使用自回归结构的SS-LSTM性能最差,表明LSTM只使用自身动态神经元而不使用自回归结构很难学习到发动机的复杂非线性动态特征。采用两阶注意力机制的DA-RNN和DSTP-RNN的预测结果没有传统AR-LSTM的性能好,原因可能是两阶注意力机制使网络复杂度大幅度增加,不利于网络的训练。

动态模型在测试集6个飞行航次对测量参数T7的预测结果以及预测误差如图9所示。在基于残差的故障诊断方法中,预测模型对参数的预测精确度直接影响故障诊断效果。

图9 动态模型在测试集6个飞行航次上的预测值和预测误差

由图9可以看出,在每个飞行航次的预测结果中,预测误差较大的阶段通常出现在工况变化剧烈的地方。首先,这是因为网络模型缺少足够的突变训练数据,使得动态模型在预测过程中出现较大误差;其次,由于自回归模型在长期预测过程中会产生误差的累计,进一步增加了预测的误差。观察图9中标记的飞行阶段,工况变化剧烈的过程往往发生在飞机的降落阶段,因此降落阶段的预测误差最大。相比其他动态网络模型,本文所用的FAE-LSTM模型在工况突变较剧烈的降落阶段的长期预测结果更准确和平稳。

3.2 性能退化数据集的预测结果分析

本小节研究FAE-LSTM网络的串-并联结构和并联结构(见图2)对生成的残差信号的影响。按照3.1.2节中的网络参数,即序列长度n=8、神经元个数为40,使用复杂飞行工况数据集对Y=[T30,T7,Ps30,N3,Wf]这5个测量参数建立FAE-LSTM预测模型。训练好FAE-LSTM网络之后,首先分别使用串-并联结构和并联结构对性能退化数据集中24个飞行航次的测量参数进行预测,记为Ysp和Yp。然后,根据Ysp和Yp计算出残差信号:

图10 FAE-LSTM预测模型在两种自回归结构下生成的T7测量信号的残差值

需要注意的是,真实残差是使用非线性模型仿真获得。使用退化数据集中每个航次的飞行工况作为非线性模型的输入,不添加故障和噪声,生成健康状态下的飞行数据。通过相同飞行工况下的健康状态数据和退化数据即可获得真实残差。

串-并联FAE-LSTM模型的反馈输入使用的是发动机真实的测量参数,由于没有自反馈迭代过程,即使在工况变化的飞行阶段,这种结构在发动机健康状态下的预测误差也非常小。但是,当发动机发生退化时,FAE-LSTM模型的反馈输入不再是健康状态下的输入,模型的预测过程是外插的预测。由于FAE-LSTM内部结构复杂,这种外插的预测过程对残差的影响不容易通过网络结构来解释。从图10中的残差值可知,外插的预测结果大幅度降低了发动机退化的故障特征。

为进一步分析两种结构对故障检测的影响,本文使用OCSVM建立故障检测系统。OCSVM是应用广泛的无监督故障检测方法[32],只使用健康状态下的发动机数据进行训练,因此首先需要从数据集中抽取健康状态的飞行数据样本作为训练数据。本文选取图7所示退化数据集中第[1,2,3,5,6]航次的数据作为OCSVM的训练数据,第[4,10,12,14,15,16]航次的数据为测试数据。OCSVM的故障检测结果混淆矩阵如图11所示,从图11中可以看出,基于并联FAE-LSTM网络的故障检测结果更精确。

图11 OC-SVM的故障检测结果

4 结束语

为获得更好的参数预测性能,提出了一种基于特征注意力机制增强型长短时记忆网络(FAE-LSTM)的发动机性能参数预测方法,经研究可得以下结论。

① 所提出的FAE-LSTM网络针对带有外源输入的系统进行建模,结合了特征注意力机制、特征融合以及LSTM的特点,结构简洁且能够充分学习到数据中的时空信息。

② 通过仿真结果可知,对比SS-LSTM、NARX-NN、AR-LSTM、DA-RNN以及DSTP-RNN等先进的动态网络模型,所提出的FAE-LSTM网络有更好的长期预测性能,长期预测误差最低减少24.5%,且在工况突变的情况下更准确和平稳,表明结合了特征注意力机制的LSTM能够更充分地捕获数据中的非线性动态信息。

③ 对于FAE-LSTM的并联和串-并联两种应用方式,故障检测系统使用并联结构生成的残差能获得更好的检测性能。

猜你喜欢
航次故障诊断发动机
发动机空中起动包线扩展试飞组织与实施
因果图定性分析法及其在故障诊断中的应用
新一代MTU2000发动机系列
我国集装箱航运企业实施作业成本管理法面临的困难及解决方案
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断
高速泵的故障诊断
新型1.5L-Eco-Boost发动机
间冷回热发动机简介