基于深度学习的装备剩余寿命区间预测研究进展

2024-03-07 14:08李先锋史建涛
工程科学学报 2024年4期
关键词:位数贝叶斯不确定性

陈 闯,李先锋,史建涛

南京工业大学电气工程与控制科学学院,南京 211816

在全球竞争日益激烈的当今时代,装备现代化和高端化已成为企业和国家保持核心竞争力的重要战略之一. 随着经济的持续发展和科技的不断进步,各种新型材料、复杂工艺和创新性技术逐渐应用于航空发动机、大型飞机、高速列车和燃气轮机等重大工程,装备也朝着大型化、自动化和集成化方向发展[1-3]. 为确保装备能够可靠、安全、稳定地执行其既定功能,装备运行性能成为了使用者、生产厂商以及设计者共同关注的核心问题.然而,在实际运行过程中,装备受到内部因素(疲劳、老化、磨损、功能缺陷等)和外部因素(振动、冲击、辐射、温度波动等)的综合影响,装备退化故障难以避免. 装备故障的发生轻则降低其任务执行能力,重则造成严重的经济损失和人员伤亡等后果[4-6]. 因此,在装备性能退化的早期,特别是在尚未造成严重危害之前,通过状态监测信息及时发现异常或定量评价装备的健康状况,并准确预测装备性能退化至主要功能丧失的时刻(即剩余寿命预测),从而对装备实施健康管理,是保障复杂装备安全、可靠和经济运行的重要手段[7].

为解决上述问题,有关装备健康状态评估、剩余寿命预测和维护决策方向的研究得到了国内外学者的广泛关注,并在过去几十年内取得了长足发展. 剩余寿命预测是连接装备运行状态信息感知与基于运行状态实现个性化精准健康管理的纽带和关键. 装备剩余寿命预测主要技术方法包括机理模型方法、数据驱动方法和混合方法[8-10]. 其中,数据驱动方法直接立足装备运行状态数据本身,而不过度依赖装备退化的失效机理且建模成本不高,能够很好适用复杂工程装备,是当前剩余寿命预测研究的主流方法[11-13]. 喻勇等[14]系统综述了数据驱动的剩余寿命预测方法中基于协变量的方法,将基于协变量的方法分为固定协变量模型、时变协变量模型和随机协变量模型. 裴洪等[15]系统综述了数据驱动的剩余寿命预测方法中基于机器学习的方法,根据机器学习模型结构的深度,将其进一步分为基于浅层机器学习的方法和基于深度学习的方法. 李银等[16]梳理了支持向量机、极限学习机、深度神经网络等6 种数据驱动方法在锂离子电池剩余寿命预测应用中的研究现状,并归纳总结了优势和缺点. Wang 等[17]进一步综述了数据驱动的剩余寿命预测方法中基于深度学习的方法,归纳总结了自动编码器、深度置信网络、卷积神经网络、递归神经网络4 个主要代表性的深度架构在剩余寿命预测中的研究进展. 这些研究从各自的角度讨论了数据驱动的寿命预测发展,特别指出深度学习作为数据驱动方法的前沿技术实现了计算机自动学习模式特征,提高了在不同领域的适用性,然而剩余寿命预测过程中的不确定性并没有得到关注.

在实际应用中,随机噪声、模型偏差、环境扰动等多种不确定性始终穿插于剩余寿命预测过程,这大大降低了预测的可信度,并可能导致不适当的维护决策,甚至导致装备崩溃. 因此,在深度学习背景下,装备剩余寿命预测不确定性研究至关重要. 首先,不确定性研究有助于提高决策的质量. 在决策制定过程中,仅仅依赖单一的寿命估计可能导致错误的决策. 例如,在维护计划中,如果不考虑不确定性,可能会导致不必要的维护活动,浪费资源,或者在不及时维护的情况下,可能会发生设备故障,带来更大的损失. 通过了解寿命预测的不确定性,决策者可以更好地权衡风险和成本,制定出更明智的决策[18]. 其次,不确定性研究有助于提高装备的安全性. 在一些如航空和核能行业,装备故障可能导致灾难性后果. 通过研究剩余寿命预测的不确定性,可以提前发现可能的故障风险,并采取适当的措施来确保装备的安全性,这对于保护人员的生命和财产至关重要. 此外,不确定性研究还有助于降低成本. 维护和修理装备的成本往往非常高昂,但如果不确定性被忽略,可能会导致不必要的维护活动,浪费资源. 通过了解不确定性,可以更精确地制定维护计划,以最大程度地减少成本. 不确定性研究还可以用来评估数据质量. 如果不确定性很高,可能是因为数据不足或不准确. 因此,通过研究不确定性,可以发现数据收集和处理中的问题,并采取措施改进数据质量,提高预测的准确性. 最后,不确定性研究有助于改进预测模型. 通过分析不确定性,可以识别模型在特定情况下的表现差异,并指导模型改进方向,这将有助于提高预测的准确性和可靠性. 因而,装备剩余寿命预测不确定性研究的必要性在于提高决策质量、确保设备安全性、降低成本、改进数据质量和预测模型的性能,这对于各种工业和军事应用中的装备管理至关重要,将为企业和组织带来巨大益处.

预测区间是用于量化预测不确定性的统计度量,通常由预测上界和预测下界组成,并在预测上界和预测下界之间预期的未知值以指定概率存在[19]. 预测区间的可用性使决策者和运营规划者能够有效地量化与点预测相关的不确定性水平,并考虑最佳和最差条件下的多种解决方案. 宽预测区间表示底层系统运行中存在高度不确定性,这些信息可以指导决策者避免在不确定条件下选择有风险的行动;窄预测区间意味着可以更自信地做出决定,而在未来面对意外情况的机会更少.本文动机在于分析和阐述当前基于深度学习的剩余寿命区间预测模型的基本思想和发展动态,进而为探究一种具有高可靠性、低计算成本和易于实现的基于深度学习的剩余寿命区间预测模型提供良好借鉴. 本文分析了深度学习背景下剩余寿命预测不确定性的来源;重点介绍并归纳了5 种流行的基于深度学习的剩余寿命区间预测模型:自举深度学习模型、局部不确定性模型、随机过程深度学习模型、贝叶斯深度学习模型、深度学习分位数回归模型及其优缺点;探讨了基于深度学习的装备剩余寿命区间预测研究中面临的挑战性问题以及未来潜在的研究方向.

1 剩余寿命预测不确定性的来源

随着工业物联网相关技术的不断发展,工业系统中可获取的状态监测数据逐渐增多. 相较于浅层机器学习方法,深度学习技术不再需要专业信号处理知识,能够自动提取或构建有用信息以支持剩余寿命预测任务,因此近年来备受研究者关注. 常用的深度学习网络结构有深度置信网络(Deep belief network, DBN)[20-25]、卷积神经网络(Convolutional neural network, CNN)[26-31]和长短时记忆神经网络(Long short-term memory, LSTM)[32-37].DBN 以受限玻尔兹曼机为基础,通过运用多个受限玻尔兹曼机方式实现概率生成,训练过程采用了贪婪逐层学习算法进行无监督预训练. 在无监督预训练完成后,DBN 利用反向传播微调操作对深层次网络进行优化,从而获得更佳的性能. CNN是由卷积、池化和全连接层组成的深度学习网络,具备空间信息处理、特征自动学习,并可结合数据增强技术来改善模型泛化能力等优势,被广泛应用于装备剩余寿命预测建模中. LSTM 是一种特殊类型的循环神经网络,通过使用一些特定组件来解决传统循环神经网络中的梯度消失和梯度爆炸问题. 由于LSTM 网络具备时序数据建模、长时依赖关系捕捉、抵御噪声干扰等优势,使得LSTM 成为一种非常有效的剩余寿命预测方法.

深度学习技术为处理复杂工程系统中的海量监测数据提供了一种有效的解决思路. 深度学习方法在装备剩余寿命预测中的应用具有巨大的优势:首先,相比于人为设计特征,深度学习提出了一种让计算机自动学习模式特征的方法,这可大大减轻工程师的负担并提高模型精度;其次,深度学习的深层网络结构使得它能够学习到更深层次的潜在特征,从而提升预测精度. 深层网络可通过逐层训练学习到不同抽象层次的特征,这些特征通常比单层网络学到的特征更加丰富和有用;最后,与传统机器学习算法相比,深度学习技术在不同领域具有更好的适用性. 如,在图像、语音和自然语言处理等领域,深度学习已经取得了非常显著的成果. 因此,在工程装备剩余寿命预测任务中采用深度学习方法具有巨大的优势,可为实际应用提供更高效和可靠的解决方案.

对于一组N个数据样本可通过带有真实参数集θ的深度学习函数f(xi,θ)生成观测目标yi:

式中,xi表示输入空间的样本; εi是带有零均值的噪声. 点预测致力于逼近真实的预测模型f(xi,θ),其近似模型f(xi,)可被视为目标分布的平均值,估计参数集可通过优化构建的损失函数(如均方误差)获得. 预测区间与概率分布有关,试图量化与观测目标yi和预测值f(xi,)之间差异相关的不确定性[38],即:

图1 剩余寿命预测中的不确定性Fig.1 Uncertainties in remaining useful life prediction

(1)数据质量:如果原始监测数据存在缺失值、样本数量不足或采样偏差等质量问题,将会对剩余寿命预测造成不确定性.

(2)模型偏差:即使使用了最先进的模型,也难免存在一定程度的偏差. 这些偏差可能源于模型本身的局限性,例如过拟合或欠拟合等,也可能来源于样本数量不足或训练数据不够充分.

(3)模型参数变化:剩余寿命预测模型通常是基于对过去数据的学习而构建,因此,如果未来数据与历史数据存在较大差异,模型性能可能会受到影响. 这种变化可能是由于装备老化、部件替换或升级等原因引起.

(4)外部环境变化:工程装备剩余寿命预测往往受到如气候变化、数据传输、操作人员行为和使用环境等外部环境的干扰,这些因素可能会影响装备的运行状态并导致不确定性.

以上这些不确定性极大地降低了点预测的可信度,因此可能会做出不适当的决策(不适当的生产、库存或维护计划),有时甚至可能导致装备崩溃. 为了实现精确的决策,决策者应该意识到预测的不确定性. 重要的是要知道模型生成的预测与实际值的匹配程度,以及不匹配风险有多大. 然而,点预测没有任何可信度的指示,也没有提供相关不确定性的信息. 基于这些原因,需要精确量化剩余寿命预测过程中的不确定性,从而为进一步实现装备运行的安全性、可靠性和经济性奠定基础.

2 基于深度学习的剩余寿命区间预测模型

基于深度学习的剩余寿命区间预测模型主要涉及自举深度学习、局部不确定性、随机过程深度学习、贝叶斯深度学习以及深度学习分位数回归等.

2.1 自举深度学习模型

自举(Bootstrap)法是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中[39]. 自举法不依赖于数据分布,在理论上可减少预测值和回归平均值之间的偏差. 由于深度学习模型的泛化误差是在参数空间的不同子集上产生,因此由深度学习集合产生的集体决策比任何单个深度学习模型做出的决策更可靠. 假设重采样原始数据得到B个训练数据集,记为,自举深度学习通过建立B个深度学习模型来估计由于模型错误指定而产生的方差(误指定方差,). 根据这一假设,可平均B个模型的点预测实现真实回归的估计,即:

式中,E{(y-)2}表示(y-)2的数学期望;y表示观测值;表示预测值.

式中, α表示显著性水平,指估计总体参数落在某一区间时可能犯错的概率;z1-α/2是标准正态分布的临界值,取决于预期置信水平(1-α)×100%.

对于使用自举法构建预测区间,总共需要训练B+1个深度学习模型:前B个自举深度学习模型用于估计,第B+1个深度学习模型用于估计.Huang 等[40-41]开发了一种自举深度CNN 架构,其包括两个主要部分:首先,采用深度CNN-多层感知机双重网络同时提取时间序列和基于图像特征中的隐藏信息表示;其次,将所提出的双重网络嵌入到自举框架中,量化剩余寿命预测区间. Liao 等[42]构建了一种自举LSTM 前馈神经网络,实现对航空发动机的剩余寿命区间预测. 为进一步提升区间预测效果,Zhao 等[43]提出了一种基于自举集成学习卷积简单循环单元方法来进行剩余寿命预测.She 等[44]提出了一种基于自举的双向门控循环单元剩余寿命预测方法. 进一步地,Guo 等[45]将自举法、CNN 和双向LSTM 进行耦合,CNN 和双向LSTM用于提取滚动轴承的时空特征,自举法用于不确定性量化.

自举深度学习为装备剩余寿命区间预测提供了重要技术支持. 自举深度学习在装备剩余寿命区间预测中的应用具备如下优点:(1)自举深度学习在不同数据子集上训练多个模型进行预测,因此可以有效避免过拟合现象;(2)自举深度学习可通过融合多个模型的预测结果来提高模型泛化能力,从而在测试集上获得更好的性能表现. 尽管如此,自举深度学习需要训练多个模型并融合其预测结果,其计算复杂度较高,尤其是在数据集非常大时,训练时间会变得非常长;由于自举深度学习生成多个数据子集,并在每个子集上训练模型,因此可能会损失一部分原始数据信息;自举深度学习依赖B个深度学习模型,而有一些模型经常是有偏差的,导致对公式(5)中的估计不够准确.

2.2 局部不确定性模型

局部不确定性模型考虑了剩余寿命预测过程中的所有误差来源,而不试图分解其各自来源的贡献,通过构建样本输入与预测下界、预测上界之间的映射关系,实现最优模型不确定性的估计[46].深度学习下剩余寿命预测不确定性主要来源于数据质量、模型偏差、模型参数变化、外部环境变化等因素,因此观测目标yi可以表示为:

式中, εx、 εm和 εθ是关于数据质量、模型偏差和模型参数变化的误差, εy是关于外部环境变化等因素引起的误差. 在大多数实际情况下,除非做出一些重要的假设,否则很难估计公式(8)中的误差分量. 因此,对总模型误差有贡献的不同分量通常被视为单个集中变量,公式(8)可以重新表述为:

式中,εtotal为总剩余误差(残差). 为获得训练样本的预测下界和预测上界,局部不确定性模型利用了数据聚类技术. 数据聚类可将多维的状态监测数据划分为几个离散的健康状态,譬如正常状态、退化状态以及失效状态. 值得注意的是,具有相同健康状态的样本将具有类似分布的误差. 在识别这些健康状态后,可根据相应历史误差的经验分布确定每个健康状态的预测区间. 通常来说,模型误差的分布取决于模型的输入和可能的状态变量,包括观测响应变量的滞后变量. 在局部不确定性估计方法中,模型误差的概率密度函数是通过经验分布估计,因而无须对残差做出任何假设. 需要指出的是,局部不确定性估计方法分析了由最优模型产生的历史模型残差(在结构和参数方面),其是基于最优性的概念,而不是等价性.

构建局部不确定性模型的基本步骤[47]:

(1)构建深度学习点预测模型,计算模型输出和实际观测的残差;

(2)使用数据聚类算法对训练样本进行聚类;

(3)根据残差按升序方式排列训练样本,然后计算每个聚类的预测下界和上界;

(4)根据每个聚类的预测下界和上界,计算每个样本的预测下界和上界;

(5)根据每个样本的预测下界和上界,构建双输出深度学习模型(第一个输出用于输出预测下界,第二个样本用于输出预测上界),即:

式中,PLL和PLU分别表示样本预测下界和上界,g(x,θˆ)表示估计预测边界的映射函数,是函数参数.

局部不确定性模型自提出以来,在水文领域一直备受关注[48-50]. Solomatine 等[48]针对不同水文情况单独估计了模型误差的概率分布,将表征该分布的参数聚合并用作输出目标值形成模型训练集. Dogulu 等[49]基于局部误差和聚类的局部不确定性模型测试了英国的几个集水区获得了良好预测效果. Rahmati 等[50]利用局部不确定性模型研究了地下水硝酸盐污染建模过程中的模型不确定性.相较而言,关于局部不确定性模型在装备剩余寿命预测领域中的应用成果较少,需要进一步探索.Chen 等[51]提出了一种基于双向LSTM 的航空发动机剩余寿命区间预测方法. 该方法在离线阶段利用一种增强的模糊C-均值算法,将航空发动机的健康状态划分为几个离散状态;在标记每个采样点的健康状态后,根据残差按升序方式排列样本,计算每个聚类和每个样本的预测上界和下界;在在线阶段,采用双向LSTM 构建局部不确定性模型,估计了剩余寿命的上预测边界和下预测边界,实现了区间预测. 进一步地,Chen 等[52]根据高斯分布假设将构建的剩余寿命预测区间转换为剩余寿命概率分布,形成了以维护时间为变量的维护成本率函数,通过最小化维护成本率函数,实现了航空发动机的最优维护决策.

局部不确定性模型在剩余寿命区间预测中的应用具备如下优点:(1)局部不确定性模型考虑了剩余寿命预测过程中的所有误差来源,而不试图分解其各自来源的贡献,因此,无须对残差做出任何假设;(2)局部不确定性模型通过构建样本输入与预测下界、预测上界之间的映射关系,实现最优模型不确定性的估计,因而计算复杂度不是很高.然而,局部不确定性涉及数据聚类技术,需要提前指定聚类数目,如果聚类数目选择不当,将会影响到模型的预测能力. 此外,局部不确定性模型使用黑盒模型构建样本输入与预测下界、预测上界之间的映射关系,内部机制和特征表示难以进行解释.

2.3 随机过程深度学习模型

随机过程(Stochastic process)是一连串随机事件动态关系的定量描述[53]. 设T是一无限实数集,将依赖于参数t∈T的一族(无限多个)随机变量称为随机过程,记为{X(t),t∈T}.X(t)是随机变量,T叫做参数集.X(t1)=x称为t1时刻的状态,全体X(t)的可能取值称为随机过程的状态空间. 对随机过程{X(t),t∈T}进行一次试验,其结果是t的函数,记为x(t),t∈T,称为随机过程的一个样本函数或样本曲线. 随机过程每次试验得到的样本函数可能都不一样. 随机过程可依其在任一时刻的状态是连续型随机变量或离散型随机变量而分成连续型随机过程和离散型随机过程. 其中,以伽玛(Gamma)过程[54-56]、维纳(Wiener)过程[57-59]为典型代表的连续型退化过程模型在装备剩余寿命预测中得到了广泛应用. 此连续型退化过程模型可根据装备退化轨迹估计出退化模型参数,推导出剩余寿命的解析概率分布,实现不确定性量化.

随机过程深度学习模型是一种基于深度学习和退化过程模型的融合技术,首先利用深度学习自动提取装备状态监测数据中的特征信息,而后基于随机过程模型推导装备剩余寿命的解析概率分布. 假设深度学习技术提取装备状态监测数据下的退化特征为D(t),t表示当前时刻,D(0)表示装备在初始时刻的退化特征量. 以维纳过程为例,其退化模型可以表示为:

式中, η表示漂移系数, γ表示扩散系数,C(t)表示标准布朗运动. 基于首达时间的概念,装备在t时刻的剩余寿命Rt通常可以表示为首次达到预先设定失效阈值 κ的时间,即Rt=inf{rt:D(t+rt)≥κ|D(t)<κ}. 剩余寿命的概率密度分布可表示为[60]:

以上通过构建随机过程深度学习模型,获得了不同装备的剩余寿命概率密度函数. 进一步采用试探法[61]以获得最优剩余寿命预测区间,其基本步骤为:根据剩余寿命概率分布,找出一个区间,使该区间的累积概率大于或等于置信度(1-α)×100%;其次,在所有符合条件的区间里,逐个计算区间宽度;最后,挑出宽度最小的区间作为该剩余寿命预测值的预测区间.

基于随机过程深度学习实现不确定性表征和量化框架下,Hu 等[62]利用DBN 提取轴承监测信号背后的深层隐藏特征,然后筛选出趋势较高的特征作为局部线性嵌入的输入,通过确定轴承健康指数,构建一个基于扩散过程的健康指数演化模型,并在首达时间意义下推导了剩余寿命概率密度函数. Li 等[63]构建了一个堆叠降噪自编码器从海量数据中提取健康指标,采用维纳过程对提取的健康指标进行建模,接着构建以预测性能最小化为核心的优化目标函数,并基于目标函数反向优化调整模型参数形成复合特征指标提取与随机退化建模的反馈闭环. 周涛等[64]构建了一种基于多维自注意力时间卷积网络和线性维纳过程的剩余寿命预测方法,形成数模联动的剩余寿命预测方法. Zhang 等[65]提出了一种基于粒子滤波器和时间注意机制双向门控递归单元的数模联动的剩余使用寿命预测方法. Chen 等[66]利用经验模态分解方法提取电池的退化趋势,基于迁移学习对LSTM 神经网络的参数进行在线更新,同时通过最大似然估计获得了基于维纳过程的退化模型的扩散系数,进而以闭合形式导出剩余寿命概率密度函数的解析表达式.

随机过程深度学习模型在剩余寿命区间预测中的应用具备如下优点:(1)随机过程深度学习模型在进行剩余寿命预测时,需要考虑初始状态、负载条件、使用环境等诸多因素,而随机过程能够很好地将这些因素融合在模型中,并且能够分析它们对系统行为的影响;(2)随机过程深度学习模型能够对未来剩余寿命建立概率分布模型,具有较好的预测能力,可以根据当前数据实时更新预测结果. 尽管如此,在随机过程深度学习建模中,需要选择合适的随机过程模型,例如伽玛过程、维纳过程、逆高斯过程等,但是这些模型的选择并不容易,需要一定的领域知识和经验;其次,在随机过程深度学习建模中,需要同时考虑深度学习和随机过程两个方面的模型复杂度,因此可能会导致模型计算量非常大. 此外,随机过程需要对其模型参数进行估计,其中某些参数可能无法直接观测到,需要依赖其他手段进行估计,这增加了模型建立的难度和误差.

2.4 贝叶斯深度学习模型

贝叶斯估计(Bayesian estimation)是利用贝叶斯定理结合新的证据及以前的先验概率,来得到新的概率[67]. 经典深度学习的剩余寿命预测通常构建一个基于神经网络的回归模型y=f(x,θ)将状态监测数据和生命周期结束时间联系起来. 贝叶斯深度学习模型本质是经典深度学习模型在概率上的扩展,一方面保留了经典深度学习模型的网络拓扑结构,以便继承经典深度神经网络的模块化和可扩展性;另一方面将经典模型的模型参数替换为随机变量,以便通过概率分布实现不确定性量化. 贝叶斯深度学习是贝叶斯估计和深度学习的融合学习过程,即采用贝叶斯定理更新深度学习模型参数的概率分布过程.

给定训练样本X和Y,贝叶斯神经网络y=f(x,θ)可由参数空间上的先验分布p(θ)以及贝叶斯回归的似然函数构成,一般情况下可使用高斯分布l(yi|f(xi,θ)). 模型参数θ独立于训练输入样本X,通过联合学习X和Y可对贝叶斯深度学习模型进行训练. 由贝叶斯定理,模型参数的后验分布为:

基于p(θ|X,Y),贝叶斯深度学习模型y=f(x,θ)可用于不确定性量化的后续推理,假设某一时刻获得在役装备的状态监测数据为,则装备终止时间可通过进行预测.

基于现有深度学习模型,不难构建用于剩余寿命预测的贝叶斯深度学习模型,但是贝叶斯深度学习的推理过程较为复杂,所以一般采用近似技术[68]. 常用的近似技术是马尔可夫链蒙特卡洛和变分推断方法. 马尔可夫链蒙特卡洛方法利用采样技术从分布中取得样本,计算这些样本的均值、方差等各种统计量,通过核密度估计求得近似分布,从而避免处理涉及后验的棘手计算. 变分推断方法则是通过假设一个简单分布来对真实后验分布进行近似,以此来减少计算. Peng 等[69]将深度学习模型扩展到贝叶斯神经网络中,提出了一种基于变分推理的贝叶斯神经网络学习和推理方法.Gal 等[70]认为神经网络中的随机失活等价于贝叶斯估计的变分推断过程,并进行了理论证明,同时提出一种蒙特卡洛随机失活来近似获得预测模型的不确性. Benker 等[71]将贝叶斯深度学习模型应用于涡轮风扇发动机的剩余寿命预测任务,提出利用哈密顿蒙特卡洛和变分推断进行推理. Chen等[72]提出了一种基于贝叶斯深度学习的二阶段滚动轴承剩余寿命区间预测方法:在第一阶段,识别轴承的状态变化,确定首次预测时刻;在第二阶段,根据新的贝叶斯深度学习模型进行剩余寿命点估计和区间预测.

贝叶斯方法在处理不确定性时具有天然的优越性,因而贝叶斯和深度学习的结合得到了学者们的青睐[73-81]. 贝叶斯深度学习模型的主要优点在于:(1)贝叶斯深度学习使用先验分布来约束模型参数,从而可避免过拟合现象;(2)贝叶斯深度学习利用深度学习优势来提取丰富特征,并利用贝叶斯方法来对模型进行建模和推断,因而贝叶斯深度学习能够处理复杂度高的任务;(3)贝叶斯深度学习通过对模型参数的后验分布进行采样,从而可得到预测结果的概率分布. 尽管如此,贝叶斯深度学习对模型参数的后验分布进行采样通常需要较大的计算成本,特别是当数据集非常大时,贝叶斯深度学习的训练和推断时间可能会变得非常长;贝叶斯深度学习中使用的先验分布通常是基于领域知识或经验得出,而如果先验分布与真实分布存在偏差,可能会影响模型的预测能力;贝叶斯深度学习中需要选择先验分布、采样方法和模型结构等不同超参数,因而选择合适的超参数需要一定的经验和知识,并且可能会面临困难和不确定性.

2.5 深度学习分位数回归模型

分位数回归(Quantile regression)研究自变量与因变量的条件分位数之间的关系,相应得到的回归模型可由自变量估计因变量的条件分位数[82].相较于传统回归分析仅能得到因变量的中央趋势,分位数回归可以进一步推论因变量的条件概率分布. 将深度学习模型和分位数回归相结合,能有效反映解释变量x在不同分位点下对被解释变量y的影响,表达式为:

式中,Qy表示被解释变量y在解释变量x给定下的条件分位数;τ ∈(0,1)表示分位点,f(x|θ(τ))表示带有参数θ(τ)的深度学习模型.

给定训练数据值时,通过式(14)可求出不同分位点下的深度学习模型参数θ(τ),其求解过程可转换为如式(15)所示的最小损失函数:

根据条件分位数理论,Qy的分位数曲线是指当 τ属于(0,1)时的分布函数,然后将获得的分位数函数作为核密度估计的输入,即可得剩余寿命的概率密度函数[83-85]. 基于获得的剩余寿命概率密度函数,类似于随机过程深度学习方法,可采用试探法获得最优预测区间.

基于分位数回归思想,Chen 等[86]开发了锂离子电池容量预测不确定性量化模型,使用一维CNN提取隐藏在原始测量信号中的深层代表性特征,而后应用双向LSTM 网络估计电池容量,同时将分位数回归层嵌入到双向LSTM 网络构建中,获得不同分位数的电池容量,最后,利用核密度估计技术推导出每个电池循环阶段预测点的概率密度.Zhang 等[87]提出了一种分布式基于深度神经网络分位数回归的剩余寿命预测方法,通过累积分布函数识别置信区间量化剩余寿命预测的不确定性.Tian 等[88]结合时间卷积网络和分位数回归算法,实现了基于预测值条件分布的核密度估计的任何时间的概率密度预测. Wang 等[89]开发了一种用于多传感器信号融合和剩余寿命预测的门控图卷积网络. 首先,从多传感器信号中构建时空图,作为预测模型的输入;接着,建立门控图卷积层,通过同时建模多传感器信号中的时间和空间相关性来准确提取退化特征;最后,将提取的特征输入分位数回归层,进而估计剩余寿命预测区间. 所提方法在模拟图形数据集、真实风电场的轴承数据集、涡扇发动机数据集以及工具磨损数据集上运行效果良好.

深度学习分位数回归模型的主要优点在于:(1)深度学习分位数回归模型具有很好的鲁棒性,能够很好地处理异常数据、离群值或噪声;(2)深度学习分位数回归模型的网络结构非常灵活,可以根据实际需求进行扩展和改进;(3)深度学习分位数回归模型可结合核密度估计技术实现概率预测. 尽管如此,深度学习分位数回归模型需要计算不同分位点下的深度学习模型参数,因而计算复杂度较高. 此外,深度学习分位数回归模型的分位数预测值有可能交叉,影响概率预测的合理性.

2.6 基于深度学习的剩余寿命区间预测模型对比

为直观比较,表1 归纳了5 种基于深度学习的剩余寿命区间预测模型的优缺点. 从表1 中可以看出,随机过程深度学习模型、贝叶斯深度学习模型和深度学习分位数回归模型可实现装备剩余寿命的概率预测,而当需要构建预测区间时,可利用试探法从剩余寿命概率分布中获得最优预测区间.相比于自举深度学习模型、贝叶斯深度学习模型以及深度学习分位数回归模型,局部不确定性模型和随机过程深度学习模型的计算复杂度相对较低. 因此,在进行基于深度学习的装备剩余寿命区间预测时,需要权衡不同区间预测模型的优缺点,并选择合适的方法和技术以满足实际需求.

表1 基于深度学习的装备剩余寿命区间预测模型优缺点Table 1 Advantages and disadvantages of remaining useful life interval prediction models for equipment based on deep learning

3 总结与展望

预测区间量化了与剩余寿命预测相关的不确定性,在构建可靠的装备运行维护系统中发挥着关键作用. 本文面向深度学习背景下装备剩余寿命预测中不确定性量化的现实需求,重点介绍了自举深度学习、局部不确定性、随机过程深度学习、贝叶斯深度学习以及深度学习分位数回归等剩余寿命区间预测模型的发展动态,探讨了模型各自的优缺点. 然而基于深度学习的装备剩余寿命区间预测研究仍处于起步阶段,存在一些明显的挑战性问题亟待解决:

(1) 深度学习区间预测模型的复杂性问题. 虽然基于深度学习的装备剩余寿命区间预测研究已取得了一些成果,但当前大多数研究在构建区间预测模型上计算量偏大. 如自举法需要构建B+1个深度学习模型,贝叶斯深度学习的推理过程较为复杂,分位数回归则需要训练多个分位点下的深度学习回归模型. 因而在后续研究中,需要优化现有模型的复杂度抑或探索新的剩余寿命区间预测方法,以进一步提升区间预测模型的计算效率.

(2) 非理想数据下的剩余寿命区间预测问题.数据是开展基于深度学习的剩余寿命区间预测研究的基础,数据质量很大程度决定了剩余寿命区间预测的质量. 然而,现代工程装备的监测数据往往呈现非理想状态,具体表现为大而非平衡、局部缺失、不完备等特点,这将导致基于这些数据建立的剩余寿命预测模型泛化能力不足,局限于某一特定条件. 因而在后续研究中,结合数据增强、迁移学习等技术将有望改善数据质量从而提升剩余寿命区间预测效果.

(3) 剩余寿命区间预测和维护决策的联合研究问题. 剩余寿命区间预测与维护决策是一个有机整体,它为降低装备停机时间、提升装备可靠性以及保障装备运行维护经济性提供了一套切实可行的完整方案. 由于综合考虑系统安全运行全过程的研究是一项非常庞大而复杂的工作,且在现有研究成果中较少定量分析各阶段输入及输出之间的相互影响,使得剩余寿命区间预测和维护决策的整体联合研究进展较为缓慢. 因而在后续研究中,需要准确刻画它们之间的定量关系,并充分考虑多目标、多决策变量的优化问题.

猜你喜欢
位数贝叶斯不确定性
法律的两种不确定性
五次完全幂的少位数三进制展开
英镑或继续面临不确定性风险
贝叶斯公式及其应用
具有不可测动态不确定性非线性系统的控制
基于贝叶斯估计的轨道占用识别方法
一种基于贝叶斯压缩感知的说话人识别方法
遥感卫星CCD相机量化位数的选择
IIRCT下负二项分布参数多变点的贝叶斯估计
“判断整数的位数”的算法分析