基于车辆响应的高速铁路轨道几何状态评估方法

2023-12-01 11:13刘秀波张彦博赵东全
铁道学报 2023年11期
关键词:车体权值波形

马 帅,刘秀波,张彦博,陈 茁,赵东全

(中国铁道科学研究院集团有限公司 基础设施检测研究所,北京 100081)

轨道几何状态是影响高速铁路列车运行安全舒适性的重要因素,科学的轨道几何状态评估方法对准确识别轨道病害、指导合理养护维修具有重要意义。世界各国普遍将轨道几何局部峰值和区段统计值作为评估指标,并建立不同等级的管理标准来评估轨道几何状态。这些指标本质上均为轨道几何幅值的数学统计量,因此均可视为基于轨道平顺性的评估方法。轨道的主要功能是支撑和引导列车运行,评估轨道状态还应该参考其上运行列车的动力响应状态。运营发现,轨道几何幅值超限未必引起显著的车辆动力响应;相反在各项轨道几何参数幅值均较小的位置,可能存在车辆响应超限。由此可见,轨道几何峰值与车辆动力响应并非简单的一一对应,二者之间存在复杂关系;既有基于幅值统计量的评估指标难以反映轨道几何波长、周期谐波等因素,以及多项轨道几何参数对车辆响应的组合激励效应,因此可能无法客观反映实际轨道几何状态。

对此,美国交通技术研究中心提出基于动力性能的轨道几何(Performance-based Track Geometry,PBTG)检测技术[1],利用神经网络学习轨道几何、运行速度等参数与轮轨力、脱轨系数等车辆动力响应指标的关联关系,并利用模型预测的车辆动力响应指标评价轨道几何状态和识别轨道病害。PBTG技术已经在美国多条铁路线上得到推广应用;由于采用了传统的全连接型神经网络模型,这种结构简单的机器学习模型对于数据特征学习能力较弱,PBTG只能预测车辆响应的区段统计值,例如区段最大值、98%分位数等,无法有效预测瞬时车辆响应。国内外还采用多元回归[2]、传递函数[3-6]、动力学仿真[7-9]等建模方法,但在预测能力、计算效率、参数依赖性等方面仍存在不足[10]。近年来,深度学习技术得到快速发展与广泛应用[11],深度学习模型能够自动学习数据中的隐含信息,在图像识别[12-14]、语言处理[15]等领域的表现显著优于传统模型。在铁路领域,深度学习模型主要应用于结构病害检测,例如,在识别扣件异常[13,16]、钢轨伤损[12,17]、动车组部件缺陷[18]等病害时表现出优异性能,并逐渐取代人工巡检。然而,将深度学习应用于车辆动力响应预测和轨道几何状态评估的研究相对较少。

本文将卷积神经网络(Convolutional Neural Network,CNN)[19]、注意力模块(Convolutional Block Attention Module,CBAM)[20]、长短时记忆网络(Long Short-term Memory,LSTM)[21]等深度学习技术融合,基于我国某高速铁路不同车型综合检测列车多次轨道检测数据,以轨道几何、车速、车型为输入,以车体加速度为输出,建立车辆动力响应预测模型并验证;进而利用模型输出的车辆响应识别不良轨道几何状态或隐形病害,通过分析模型内部参数来挖掘导致轨道状态不良的轨道几何参数类型和位置信息。在建立的车辆响应预测模型中,CNN主要用于提取轨道几何波形的局部形状特征,CBAM用于获取输入数据中不同参数、不同位置的权值(重要性程度)信息,LSTM用于学习输入输出数据中的长距离趋势性信息或空间依赖关系,并将轨道几何波形特征转化为车辆动力响应预测值。

1 基于深度学习的车辆响应预测模型

基于深度学习中的卷积神经网络、卷积注意力模块、长短时记忆网络,建立车辆响应预测模型,命名为CBAM-CNN-LSTM,模型结构见图1。

图1 车辆响应预测模型结构示意

CBAM-CNN-LSTM以轨道几何、车速、车型为输入,其中,轨道几何和车速进入模型的输入层,根据车型将训练好的模型参数赋予CBAM-CNN-LSTM(对每种车型分别训练得到一组对应的模型参数);以车体加速度为输出(即输出层的输出值),输入输出均采用张量形式。令{x,y}={[x1,x2,…,xN]、[y1,y2,…,yN]}表示输入输出数据集,其中,向量xi=[xi,1,xi,2,…,xi,n]T,yi=[yi,1,yi,2,…,yi,m]T,1≤i≤N,n、m分别为输入输出向量维度,N为数据集容量。选取左高低、右高低、左轨向、右轨向、轨距、水平、三角坑、车速作为输入参数,车体横向加速度、车体垂向加速度作为输出参数,因此n=8、m=2。

CBAM-CNN-LSTM模型结构详细参数见表1。

表1 CBAM-CNN-LSTM模型结构参数表

1.1 卷积神经网络

卷积神经网络CNN主要由卷积层、池化层组成。卷积层包含若干卷积核,每个卷积核均可以视为一个滤波器,卷积层的输入经过这些卷积核的卷积运算后输出多维度特征,并作为下一层的输入;池化层主要起降低特征尺寸的作用,通过与卷积层交替叠加,能够逐层提取更加宏观抽象的特征。轨道几何波形包含了幅值、波长等特征,是影响车辆响应状态的重要因素;CNN擅长于提取数据的形状特征,可以利用其挖掘轨道几何的局部波形特征,同时通过叠加多个卷积层和池化层,可以提取不同尺度(波长)的波形特征。

模型输入xin的每一维度均为序列型数据,需要采用一维卷积。假设模型第k层为卷积层,输入为xk,尺寸为Wk×Ck;输出为xk+1,即下一层的输入,尺寸为Wk+1×Ck+1。W表示长度,C表示维度(通道数);当k=0时,x0即输入数据xin,则W0×C0=4L×n。第k卷积层的第i(1≤i≤Ck+1)个通道的输出xk+1,i的计算式为

( 1 )

式中:xk,i为第k卷积层的第i个特征图(Feature Map);Kk,i,j为卷积核(Convolutional Kernel)或滤波器(Filter),连接xk的第j个特征图xk,j和xk+1的第i个特征图xk+1,i;Bk,i为偏置;*表示卷积运算。

卷积核在特征图上每次以固定步长(Stride)移动s个单位,然后计算卷积核与特征图对应区域的点积,直到遍历整张特征图xk,见图2。将xk+1,i位于w位置处的值表示为(xk+1,i)w,1≤w≤W,并假设卷积核尺寸为1×F(F一般为奇数),则可以得到(xk+1,i)w的计算式为

( 2 )

图2 卷积运算示意

卷积为线性运算,为了增加模型的非线性,需要将卷积层的输出特征图通过非线性激活函数,本文选取线性整流单元ReLU函数[22]。

池化层主要用于缩小特征图尺寸,同时不改变特征图通道数,既可以加快计算速度,也可以防止过拟合。池化层在特征图上移动一个池化核,进行最大值或平均值运算,分别称为最大池化(Max Pooling)和平均池化(Average Pooling)。为有效保留特征图关键信息,采用最大池化。

1.2 卷积注意力模块

卷积注意力模块CBAM仿照人眼视觉系统感知图像时关注局部重要信息、淡化无关信息的机制,计算数据中不同通道和不同位置的注意力权值。在车辆响应预测时,CBAM模块不仅有助于提高预测准确度,它计算出来的注意力权值还可以视为不同参数、不同位置的轨道几何输入对车辆响应输出的重要性程度,从而有助于分析挖掘输入输出之间的关联关系。CBAM模块包含通道注意力(Channel Attention,CA)和空间注意力(Spatial Attention,SA)两部分,能够根据输入自适应地学习到通道注意力权值和空间注意力权值,一维卷积情况下其结构见图3。

图3 卷积注意力模块CBAM结构示意

通道注意力计算输入xk∈RW×C的通道权值ACA∈RC(R表示实数),见图4;空间注意力计算xk的位置权值ASA∈RW,见图5。

图4 通道注意力CA结构

图5 空间注意力SA结构

通道注意力首先对输入进行空间池化,分别计算每个通道的最大值和平均值,得到最大池化向量xCA,max∈RC和平均池化向量xCA,avg∈RC;然后两个池化向量均经过共享参数的两层全连接网络,并依次通过向量相加和Sigmoid非线性函数,得到通道权值ACA∈RC,表达式为

ACA=σ{P1[ReLU(P0xCA,max)]+P1[ReLU(P0xCA,avg)]}

( 3 )

式中:P0∈Rc×C、P1∈RC×c分别为全连接网络的参数,通常采用“瓶颈”结构,即c≤C,c为瓶颈层维度;第一个全连接层采用ReLU函数;σ为Sigmoid函数。

空间注意力首先对输入进行通道池化,分别计算每个空间点的最大值和平均值,得到最大池化向量xSA,max∈RL和平均池化向量xSA,avg∈RL;然后两个池化向量通过一维卷积层来减少通道数,并通过Sigmoid非线性函数得到空间权值ASA∈RL,表达式为

ASA=σ{Conv[(xSA,max;xSA,avg)]}

( 4 )

式中:Conv表示卷积层;( ; )表示两个向量拼接。在CBAM-CNN-LSTM车辆响应预测模型中,CBAM直接作用于轨道几何输入xin,通道权值ACA和空间权值ASA可以分别视为不同参数、不同位置的轨道几何对车体振动响应的重要性程度;经过矩阵运算,得到注意力权值加权的向量xCBAM,表达式为

xCBAM=xin⊗ACA⊗ASA

( 5 )

式中:⊗表示矩阵每一行(每一列)与行向量(列向量)的逐点相乘。

1.3 长短时记忆网络

长短时记忆网络LSTM是一种由拥有三个“门”结构单元组成的循环神经网络,单元结构见图6。LSTM通过在每一时刻(或位置)维护内部状态,有效地解决了梯度沿时间反向传播过程的优化难题。对于每个里程位置i,“遗忘门”结合当前输入xi和前一位置输出hi-1来决定前一位置状态ci-1中哪些信息被遗忘;“输入门”利用xi和hi-1来筛选关键信息并加入到ci-1中和生成ci;“输出门”通过整合ci、xi、hi-1来计算当前位置的输出hi。

图6 LSTM单元结构示意

LSTM单元内信息传播的计算式为

zi=tanh(Wzhhi-1+Wzxxi+bz)

( 6 )

iii=tanh(Wiihhi-1+Wiixxi+bii)

( 7 )

fi=tanh(Wfhhi-1+Wfxxi+bf)

( 8 )

oi=tanh(Wohhi-1+Woxxi+bo)

( 9 )

ci=fi⊗ci-1+iii⊗zi

(10)

hi=oi⊗tanh(ci)

(11)

式中:Wzh、Wiih、Wfh、Woh均为权重矩阵;bz、bii、bf、bo均为偏置向量。

长短时记忆网络LSTM在空间上连接多个LSTM单元形成链式结构,LSTM链通过“输入门”和“遗忘门”不断更新模型状态ci,保留重要信息并遗忘不重要信息,从而具有学习长期趋势信息(或长距离空间依赖关系特征)的优越能力。考虑位置i处的车辆振动响应与轨道几何长距离空间波形有关,仅仅利用CNN提取位置i附近的局部波形特征可能存在不足,因此引入LSTM,将长距离空间波形特征用于当前位置车体加速度预测,以提高模型预测性能。

2 模型验证与分析

2.1 数据源

选取我国某高速铁路多次轨道动态检测数据为数据源,该线路运营速度为350 km/h,总长度超过1 000 km,全线铺设无缝线路和无砟轨道,同时采用桥梁、路基、隧道多种下部基础结构。检测数据来自高速综合检测列车,数据的空间采样间隔为0.25 m,检测项目主要包括高低、轨向、轨距、超高(水平)、三角坑等轨道几何参数,以及车体垂向、横向加速度、里程、车速等信息。在高速条件下,轨道几何长波成分对车体振动响应存在显著影响,因此模型输入选取长波高低和长波轨向(波长范围1.5~120 m)。截取部分检测数据绘制波形见图7。

图7 轨道检测数据波形

选取2016年6月~2017年4月的7次检测数据,检测车车型为CRH380AJ;选取2017年8月~2018年8月的7次检测数据,检测车车型为CRH2C。对不同车型的数据分别训练模型,得到两组代表不同车型的模型参数。对于两种车型,均随机选取一次数据作为测试集,其余6次数据作为训练集。通过将较长时间范围的多次检测数据合并作为训练集,旨在消除列车自身动力性能变化的影响,因此,训练到的模型可以视为代表了列车动力性能的“平均”状态。为了便于描述,将CRH380AJ车型的训练和测试数据集记为Train1、Test1,CRH2C车型的训练和测试数据集记为Train2、Test2。

2.2 准确度评价指标

模型预测准确度评价指标主要有平均绝对误差IMAE、均方根误差IRMSE、平均绝对百分误差IMAPE、希尔不等系数ITIC、Pearson相关系数ρ等。各指标定义为

(12)

(13)

(14)

(15)

(16)

IMAE和IRMSE反映了绝对预测误差,其值越小,模型准确度越高;二者之中,IRMSE对于大误差更加敏感。IMAPE、ITIC、ρ均反映了相对预测误差。IMAPE为绝对误差与真实值的百分比,但是当真实值接近零时IMAPE值偏大,而车辆响应在数值上围绕零值上下波动,因此不宜选用;ITIC为预测误差IRMSE与实际值和预测值均方根之和的比值,其值介于0~1之间,ITIC值越小模型准确度越高;ρ度量了预测值与实际值的相关性,反映了车辆响应的预测波形与实际波形的相似度,其值介于0~1之间,ρ值越大模型准确度越高。综上,采用均方根误差、希尔不等系数、Pearson相关系数来评价车辆响应预测模型的准确度。

2.3 预测效果分析

为对比常规深度学习模型与CBAM-CNN-LSTM的预测性能,还训练了LSTM模型。训练过程采用了相同的数据源、输入输出方式、模型结构参数和训练参数等。训练时采用了随机梯度下降算法优化模型参数,采用均方误差损失叠加模型参数的正则化项作为损失函数[23]。两个模型的预测准确度评价指标在整个测试集上的统计结果见表2。图8、图10为测试集某区段车体加速度实际值和预测值的波形对比图;图9、图11为车体加速度实际值和预测值的功率谱密度对比图。

表2 模型预测准确度指标统计

图8 车体横向、垂向加速度实际和预测波形对比(Test1)

图9 车体横向、垂向加速度实际和预测功率谱密度对比(Test1)

图10 车体横向、垂向加速度实际和预测波形对比(Test2)

图11 车体横向、垂向加速度实际和预测功率谱密度对比(Test2)

分析可知,LSTM模型和CBAM-CNN-LSTM模型均能够有效预测车体加速度,但CBAM-CNN-LSTM的预测准确度优于LSTM。在两个测试数据集上,CBAM-CNN-LSTM预测车体横向加速度的平均IRMSE、ITIC、ρ分别为0.004g、0.495、0.608,预测车体垂向加速度的平均IRMSE、ITIC、ρ分别为0.009g、0.348、0.793。利用CNN提取轨道几何波形特征有助于提高预测准确度。CBAM-CNN-LSTM预测车体加速度的IRMSE小于综合检测列车的检测精度(±0.01g),预测值与实际值的相关性达到强相关。在频域上,CBAM-CNN-LSTM和LSTM的车体加速度预测值功率谱密度重合度较高,前者在部分频段更接近实际值。模型对于32 m简支梁徐变上拱引起的周期性车体垂向振动均具有较好的预测能力,同时预测波长50 m以上车体横向振动的性能相对较好。

图8、图10所选区段的基础结构同时包含桥梁和路基,通过对比车体加速度预测值和实际值,不难发现:模型对于32 m简支梁桥引起的车体周期性振动,以及基础、过渡段局部变形等引起的车体振动均具有较好的预测能力,这与图9、图11相吻合。

根据相对误差指标ITIC、ρ值,模型预测车体垂向加速度的准确性优于车体横向加速度。这是因为轨道几何与车体垂向加速度的相关性要强于车体横向加速度。

3 轨道几何状态评估

我国高速铁路线路状态普遍较好,因此人们更加关注乘坐列车的舒适性。基于车辆响应的高速铁路轨道几何状态评估方法,通过训练多次检测数据得到代表不同车型的CBAM-CNN-LSTM模型参数,进而将模型预测的车体加速度用于发现影响舒适性的轨道几何病害。通过将不同时间检测的多次数据作为训练集,建立的模型代表了车辆动力性能的平均状态;通过将车型作为输入条件并对线路运行的主要车型进行建模,既可以分析不同车型对轨道几何病害的响应差异,也可以结合不同车型的响应状态来综合评估轨道状态。此外,CBAM-CNN-LSTM模型内部的注意力权值还有助于挖掘导致轨道状态不良的轨道几何参数类型和位置信息,从而为轨道养护维修提供帮助。

3.1 轨道几何病害识别

轨道几何与车辆响应之间存在复杂关系,线路上可能存在“各项轨道几何参数均不超限、但车体加速度超限或较大”的情况,这种隐形病害可以通过CBAM-CNN-LSTM模型进行识别。然而,由于我国高铁线路轨道状态较好,在测试数据中未发现车体加速度达到TG/GW 115—2012《高速铁路无砟轨道线路维修规则(试行)》[24]中规定的轨道动态质量容许偏差管理值Ⅰ级限值。因此,选取车体垂向加速度大值进行分析。

工况1:里程K7+500—K9+500,车型CRH2C,车速度为180 km/h。

绘制该区段内车体加速度和轨道几何波形见图12。图中数据来自Test2,综合检测列车车型为CRH2C。

图12 某段轨道检测数据波形(CRH2C)

由图12可以看出,在K8+421位置处,左右高低(波长1.5~120 m)已经达到Ⅰ级限值(7 mm),但此处车体垂向加速度仅为0.3 m/s2;而在K8+600—K8+900范围内,各项轨道几何参数均未达到Ⅰ级限值,但车体垂向加速度最大值达到了0.7 m/s2,对旅客乘坐列车舒适性造成一定影响。由此可见,车体加速度与轨道几何之间并非简单的一一对应关系,轨道几何大值未必引起大的车辆响应,而在轨道几何幅值小的位置可能存在较大的车辆动力响应。K8+600—K8+900范围内的32 m周期性高低虽然幅值不大,但在特定速度条件下,激起的车体垂向振动频率与车体自振频率范围接近或吻合,导致振动响应加剧。CBAM-CNN-LSTM模型预测的车体垂向加速度与真实值吻合度较高,利用预测值可以帮助定位、识别出该高低状态不良。

截取测试数据Test1中相同里程区段的数据,绘制波形,见图13。由图13可以看出,Test1与Test2的各项轨道几何波形基本一致,但Test1在K8+600—K8+900范围内车体垂向加速度较小,最大值为0.15 m/s2。数据集Test1的检测车型为CRH380AJ,表明不同车型的车辆响应存在差异性,需要对不同车型单独训练预测模型。此外,预测模型识别出来的轨道几何不良状态或病害也需要说明或标注车型、车速条件。

图13 某段轨道检测数据波形(CRH380AJ)

工况2:里程K371—K373,车型为CRH380AJ和CRH2C,车速度为300 km/h。

绘制该区段内车体加速度和轨道几何波形图,CRH380AJ和CRH2C车型数据分别见图14和图15。在K371+800和K372+500里程附近,高低均存在长波不平顺,峰值均达到5 mm以上。对应位置处,CRH380AJ车体垂向加速度检测数据最大分别为0.67、-0.62 m/s2,模型预测值最大分别为0.46、-0.48 m/s2;

图14 某段轨道检测数据波形(CRH380AJ)

图15 某段轨道检测数据波形(CRH2C)

CRH2C车体垂向加速度检测数据最大分别为0.75、-0.98 m/s2,模型预测值最大分别为0.56、-0.62 m/s2。可见,该处两种车型均存在车体剧烈振动,主要由长波高低状态不良引起。

由于实际车体垂向加速度包含了波长5 m以下的高频振动,而轨道几何与车体加速度在该波长范围的相干性较弱[23],导致预测峰值与实际峰值存在一定偏差。总体上,车体加速度预测值与实际值的波形吻合度较高,能够准确反映车体动态振动的变化趋势;同时,在车体垂向加速度实际大值处,预测的车体垂向加速度也是局部最大,呈现出良好的一致性,可以通过模型预测结果筛选出该不良轨道几何状态。

3.2 轨道几何状态分析

CBAM-CNN-LSTM模型中,卷积注意力模块CBAM直接作用于轨道几何输入。根据注意力模块的结构特点,通过对不同通道和不同空间位置的轨道几何数据自动学习权值,得到的通道权值ACA和空间权值ASA揭示了轨道几何的哪些参数、哪些位置需要给予更大权值或应该重点关注;经过权值加权后的轨道几何矩阵再依次经过CNN层、LSTM层,最后输出有效预测的车体加速度,也反过来能够证明CBAM学习到的通道权值ACA和空间权值ASA确实包含了轨道几何不同参数、不同位置幅值的重要性程度信息。这些权值有助于揭示车体加速度与轨道几何的关联机制。

选取测试集中某处车体垂向加速度大值区段,绘制检测数据波形见图16。其对应的通道权值ACA和空间权值ASA云图,见图17。

图16 车体加速度波形

图16中,在K1+174和K1+205位置处(非线路实际里程),车体垂向加速度分别为-0.51、0.59 m/s2,明显大于其他里程位置。在相同里程位置附近,高低存在近似正弦形的局部波形,且高低幅值偏大。由图17(a)中通道权值ACA,该位置处,高低、水平的权值较大,表明该车体垂向剧烈振动可能主要与高低、水平有关,同时根据权值云图的颜色深浅分布情况可以帮助确定轨道几何状态不良的里程范围。图17(b)中的空间权值云图反映了每一个里程点处车体加速度在其前后60 m范围内轨道几何的重要性程度。提取K1+174和K1+205位置处的空间权值向量,以及前后60 m范围的车体垂向加速度、高低、水平,绘制波形见图18。为了便于对比和展示,图中各数据进行了规范化处理(无量纲)。

图18 车体加速度大值位置的空间权值向量

由图18中的空间注意力曲线,K1+174处车体垂向加速度大值可能与相对位置-12~60 m范围的轨道几何影响有关,K1+205处车体垂向加速度大值可能受-40~60 m范围的轨道几何影响显著。该处车体振动主要包含低频成分,因此受前后较长范围的轨道几何激励影响,而空间权值有助于确定具体范围,从而能够为轨道几何调整和维修工作提供参考。此外,该位置处注意力权值曲线与水平波形具有近似同相位的特点,与高低近似反相位,因此空间注意力权值还能够为深入分析轨道几何与车体振动响应的空间关联关系提供帮助。

4 结论

基于深度学习中的卷积神经网络、注意力模块、长短时记忆网络,建立了CBAM-CNN-LSTM车辆响应预测模型,通过输入轨道几何、车速和车型来预测车体加速度,进而提出一种基于车辆响应的高速铁路轨道几何状态评估方法。主要得出以下结论:

1)CBAM-CNN-LSTM模型能够有效预测不同车型、不同速度工况下的车体振动响应。利用我国某条高速铁路CRH380AJ和CRH2C两种车型综合检测列车的多次检测数据进行训练和验证,结果显示CBAM-CNN-LSTM模型预测车体横向加速度的均方根误差、希尔不等系数、相关系数分别为0.004g、0.495、0.608,预测车体垂向加速度分别为0.009g、0.348、0.793。均方根预测误差小于综合检测列车的检测精度,预测值与实际值的相关性达到强相关。

2)CBAM-CNN-LSTM模型预测的车体加速度能够识别一些“各项轨道几何参数均不超限、但车体加速度较大或超限”的轨道几何不利状态或潜在病害。此外,CBAM-CNN-LSTM模型内部的注意力权值有助于挖掘导致轨道状态不良的轨道几何参数类型和位置信息,同时能够为深入分析轨道几何与车体振动响应的空间关联关系提供帮助。

猜你喜欢
车体权值波形
一种融合时间权值和用户行为序列的电影推荐模型
对《压力容器波形膨胀节》2018版新标准的理解及分析
CONTENTS
基于LFM波形的灵巧干扰效能分析
基于权值动量的RBM加速学习算法研究
动车组过分相的车体最佳接地技术分析
基于ARM的任意波形电源设计
大连台使用CTS-1记录波形特点
MIG—V工作站在高速动车铝合金车体侧墙焊接中的应用
渗透检测在铝合金车体中的实际应用