基于蚱蜢算法优化变分模态分解的滚动轴承故障诊断

2023-03-08 02:41薛彬李英顺郭占男匡博琪
车用发动机 2023年1期
关键词:蚱蜢峭度信息熵

薛彬,李英顺,郭占男,匡博琪

(1.沈阳工业大学化工过程自动化学院,辽宁 沈阳 111003;2.大连理工大学控制科学与工程学院,辽宁 大连 116024;3.沈阳顺义科技有限公司,辽宁 沈阳 110027)

如今,机械设备在各行各业中应用十分广泛,从农业机械到工程机械,尤其是船舶、动力发电等领域,都需要机械设备作为动力。滚动轴承作为机械传动的关键零件,轴承的健康状态是设备正常运行的关键。尤其轴承工作在高温、高压、高负荷的恶劣环境下,其发生故障的概率也会在工作环境的影响下大幅提高。一旦轴承发生故障,就会导致整个机械停止运转,还可能引发不良的连锁反应,对经济以及从业人员的生命造成严重的威胁。文献表明,约30%旋转机械故障都受滚动轴承故障影响[1]。滚动轴承在运行时,其振动信号中包含了大量运行状态信息[2-4]。振动信号包含了大量的干扰信号,导致基于振动信号的故障诊断特征难以提取。

为了应对这种状况,Huang等[5]首先提出了经验模态分解(EMD)的方法,EMD在处理非线性、非稳定信号具有不错的效果,但EMD在分解过程中会产生模态混叠、端点效应等问题。Wu等[6]提出的集成经验模态分解算法(EEMD)在一定程度上缓解了模态混叠问题,但由于递归分解,存在误差累积以及计算量大的问题。Dragomiretskiy等[7]提出的变分模态分解(VMD)是一种完全非递归的算法,可以自适应地将信号分解成调幅、调频信号,从根本上解决了EMD分解过程中产生的问题,且分解精度明显提高[8-9]。但VMD的分解效果在很大程度上受分解层数K和惩罚因子α的影响,需要大量的经验取值才不会导致过分解或欠分解[10]。文献[11]为了解决VMD分解过程中信息丢失或过分解问题,采用近似完全重构准则来确定分解层数K,然后根据相似模态的包络相似度将相似模态组合起来用于轴承的故障诊断中,但VMD分解中惩罚因子α的大小会影响分解模态的带宽,从而导致模态之间的混叠。文献[12]提出了基于自适应权值粒子群优化模型(PSO)[13]的极限学习机改进轴承故障诊断方法,引入频谱互相关度来选取最优惩罚因子α,但分解层数K的大小会导致VMD的过分解或欠分解。文献[14]提出了信息熵最小值原则来寻找VMD的最优参数,但其算法是分两次去寻找K和α,容易陷入局部最优解,无法找到最优参数。文献[15]提出了以最小包络信息熵作为灰狼算法的适应度函数,优化VMD以实现最佳分解。

为解决目前存在的问题,需要采用一种将两个参数同时进行优化的算法。由于包络信息熵可以更好地反映信号所包含信息中不确定性的程度[16],包络峭度对故障信号的微弱变化敏感,为同时获取K和α,本研究提出了将平均包络信息熵[17]和包络峭度两种指标融合为蚱蜢算法(GOA)[18]的目标函数,来优化变分模态分解参数,经过VMD分解提取敏感模态的时域、频域和能量[19]特征输入到支持向量机(SVM)进行训练分类,提高滚动轴承的故障诊断性能。

1 基本理论

1.1 变分模态分解

VMD是一种自适应、完全非递归的信号分解方法。VMD的核心思想是通过迭代搜索变分模型的最优解,来确定分解后的K个模态分量(IMF)及其对应的中心频率和带宽。VMD的模型如下:

(1)

式中:{uk}={u1,…uK},uk为分解后的第k个IMF;{ωk}={ω1,…ωK},ωk为对应的分解后第k个IMF的中心频率;∂(t)是对t求偏导;δ(t)为Dirac分布;*为卷积;H为原始待分解信号。为了求得约束模型的最优解,引入增广拉格朗日函数方法将约束问题转变为非约束问题,其公式如下:

L({uk},{ωk},λ)=

(2)

VMD的迭代求解步骤如下:

2)n←n+1。

(3)

(4)

(5)

4)循环执行步骤2和步骤3,直到满足终止条件(见式(6))时,结束循环。

(6)

式中:ε为判别精度,ε>0。

1.2 蚱蜢算法

蚱蜢算法(Grasshopper Optimization Algorithm,GOA)是由Saremi等[18]于2017年提出的一种元启发式仿生优化算法,具有较快的收敛速度以及较高的搜索效率,并且算法本身的自适应机制能够很好地权衡全局和局部的搜索过程,有较高的寻优精度。算法的主要定义如下。

蚱蜢群的位置移动为

Td(1)。

(7)

式中:d为变量的维度;i,j表示蚱蜢个体编号;c为控制参数,用于平衡算法;ubd,lbd分别为变量的上限和下限;dij为两个蚱蜢个体之间的欧氏距离;s表示两个蚱蜢之间的交互力影响;Td表示最优的蚱蜢个体位置。

其中,控制参数c一般为线性递减,使算法具有动态搜索能力,控制参数c和蚱蜢个体之间的相互影响s分别为

(8)

式中:cmax和cmin分别为递减区间的最大值和最小值;t为当前的迭代次数;Tmax为最大迭代次数;f和l分别为吸引强度参数和吸引尺度参数。

1.3 支持向量机

支持向量机(SVM)是一个二分类模型[20-21],可以通过多个二分类支持向量机的组合实现多分类问题。SVM的本质是将特征向量映射成空间中的一些“点”,通过画出一条“线”来区分这两类“点”。如果有了新的“点”,这条“线”也可以做出很好的分类。SVM的算法步骤如下。

给定训练集:

T={(x1,y1),(x2,y2),…(xi,yi),…(xn,yn)}。

(9)

式中:xi为输入的特征向量样本,xi∈RN;yi为每组特征向量所对应的类别,yi∈{-1,1};n表示样本数据的维度。期望能找到一个划分超平面更好的区分不同类别的样本,定义划分超平面由以下方程决定:

ωTx+b=0。

(10)

式中:ω=(ω1,ω2,…ωn)为超平面法向量;b为超平面位移项。如果超平面方程达到了最优分离平面的标准,即在类区间最大的情况下可以正确分离样本,则最优分离超平面的求解转换为

(11)

在此,引入拉格朗日乘子αi,有:

(12)

式中:α≥0。为求式(11)的最优解,将式(12)分别对ω,b求偏导再代入到式(12)中,即求解minL(ω,b,α),其对偶问题则变为

(13)

式中:K(xi,xj)为核函数,K(xi,xj)=〈ΦT(xi)·Φ(xj)〉;Φ(·)表示对低维样本的高维映射。因此,该分类决策函数被表述为

(14)

2 故障诊断流程

信息熵是衡量信号有序性和周期性的指标,用于描述信息中不确定性的程度。熵值越小,不确定性越低,即更容易得到确定的信息。包络信息熵是通过对信号进行解调运算,计算包络信号的信息熵,可以更好地反映信号所包含信息的程度[22],其表达式为

(15)

式中:MEE(k)为第k个IMF的包络信息熵;pj为模态信号归一化后的包络;M为信号VMD分解后IMF的长度;aj为信号VMD分解后IMF的第j个点的信号包络幅值。

在振动信号中,峭度对故障信号的微弱变化敏感,所含有冲击成分越多的信号峭度值越大,所包含的故障信息也就越多[23]。正常信号接近正态分布,峭度值约为3。峭度的定义为

(16)

式中:μ为信号g的均值。

影响VMD分解瞬时故障信号的主要指标有冲动性、循环平稳性和无序性[24]。因此,本研究以最小平均包络信息熵和包络峭度两种指标融合作为目标函数,去求得VMD的最佳分解参数。其综合目标函数为

(17)

通过GOA优化算法得到(Kop,αop),使用VMD算法对原始振动信号进行分解,得到Kop个IMF分量,在经过能量百分比的计算,选取能量90%及以上的敏感模态。由于单一的特征参数过于片面,因此本研究提出多域联合的特征参数作为分类模型的输入,用来对故障进行分类。具体工作流程见图1。

3 仿真信号分析

3.1 构建仿真信号

滚动轴承发生故障时,在复杂工况的噪声干扰下采集到的振动信号具有非平稳性、瞬时性和突变性[25]。因此,建立的仿真信号必须满足非平稳、多分量的条件。本研究采用参考文献[26]中的人工模拟信号,其构成如下:

a=e-8(t-0.5)2,

(18)

s1=asin(2π(100t+cos(5πt))),

(19)

s2=asin(2π(150t+50t2)),

(20)

s3=asin(2π(250t+80t3)),

(21)

s=s1+s2+s3。

(22)

信号采样频率为1 500 Hz,采样点数为1 024。其仿真信号s的时域和频谱波形见图2。各分量信号s1,s2,s3的时域和频谱波形见图3。

图3 分量信号时域频域图

3.2 分解能力对比

应用EMD方法、EEMD方法、AVMD方法分别对模拟信号进行分解,结果分别如图4至图6所示。EMD方法和EEMD方法分解时,都出现了虚假分量。利用本文提出的AVMD方法分解时可以获得理想分解结果,既没有发生过分解也没有发生欠分解。通过下式计算各模态的能量所占总能量的比例。

图4 EMD分解效果

图5 EEMD分解效果

图6 AVMD分解效果

(23)

式中:Ek表示第k个IMF的能量所占总能量的比例。由于EMD方法和EEMD方法的前3个分量的能量占总能量的90%以上,故分别选取前3个IMF进行分析对比。对比3种方法的分解效果可以看出,AVMD的分解效果更加接近于原始信号。

为了更好地对比分解后的信号与原始信号的相关性,利用下式分别计算EMD,EEMD,AVMD分解下的IMF与仿真信号3个分量的相关系数作为评价指标。

(24)

表1 分解信号与原始信号的相关性

由表1可见,与其他两个方法相比,AVMD分解得到的IMF与仿真信号分量的相关性更大。因此,AVMD分解效果最好。

4 试验分析

为了进一步验证本方法的可行性,本研究选用美国凯斯西储大学(CWRU)的滚动轴承数据集进行试验。CWRU轴承振动数据集试验平台见图7。以驱动端的直径0.177 8 mm的滚动轴承为研究对象,在转速1 750 r/min、负载1.47 kW条件下模拟内圈故障、外圈故障、滚动体故障,采样频率选择12 kHz,以1 200个采样点为一组数据,各采集100组,得到滚动体故障、内圈故障、外圈故障以及正常状态下的振动信号。

图7 CWRU轴承振动数据集试验平台

使用本研究所提出的方法,对4种状态的轴承数据通过GOA优化,获取VMD算法的最佳参数。以内圈故障数据为例,初始化模态个数K∈[2,10],且K为整数,惩罚因子α∈[200,5 000],其AVMD分解效果见图8。利用式(23)计算出各个IMF分量的能量占比(见图9),选取各状态下能量90%以上的IMF分量为敏感模态。

图9 模态的能量分布

对筛选后的敏感模态分别提取多域联合(时域特征、频域特征和能量特征)的特征信息作为特征参数,用于模型的训练。每种状态可以获取1×45维的特征向量样本,每种状态取70组特征向量作为SVM的训练集,取30组样本作为SVM的测试集。为体现AVMD算法的优越性,进一步说明该方法的有效性,本研究同时引入EMD、EEMD、观察法-VMD[27]以及PSO-VMD[22]方法对振动信号进行分析,且PSO与GOA模型的种群数均为30,迭代次数为20次,为避免启发式算法的随机性,运行50次,取平均值作为最后的结果。测试样本分类结果见图10至图14。

图10 EMD分解时测试样本分类正确率

图11 EEMD分解时测试样本分类正确率

图12 观察法-VMD分解时测试样本分类正确率

图13 PSO-VMD分解时测试样本分类正确率

图14 AVMD分解时测试样本分类正确率

为进一步量化几种方法的性能,将不同方法的故障诊断准确率列出进行比较(见表2)。

表2 不同故障诊断方法准确率比较

由表2结果可见,在相同的故障条件下,EMD分解和EEMD分解的平均准确率分别为86.667%和88.333 3%,VMD分解的正确率高达90%以上,本研究所提出的AVMD方法诊断准确率高达99.166 7%。相比于观察法获取的最佳参数,准确率提高了9.166 7%,相比于PSO优化提高了5%。结果表明,GOA优化后不易陷入局部极值,VMD的分解效果好,从而提高诊断的准确率。

5 结束语

针对传统VMD方法的参数需要人为提前设定的问题,提出了AVMD算法基于平均包络信息熵和包络峭度两种指标融合的目标函数,利用GOA寻优算法,获得针对具体信号的VMD分解参数,解决了VMD分解参数的选取问题,为后续的特征提取以及故障模式识别的提高提供了基础。通过人工模拟信号分析,AVMD算法完全优于EMD和EEMD算法,具有更好的分解能力。利用CWRU的滚动轴承数据集,通过与EMD、EEMD、观察法-VMD算法以及PSO-VMD方法比较,表明AVMD算法的模态分量包含原信号更多特征。通过人工模拟信号以及来自CWRU试验室的轴承试验信号均说明提出的方法在获取VMD参数方面的优越性。

猜你喜欢
蚱蜢峭度信息熵
基于MCKD和峭度的液压泵故障特征提取
基于信息熵可信度的测试点选择方法研究
蚱蜢开门
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
基于峭度分析的声发射故障检测
基于信息熵的实验教学量化研究
一种基于信息熵的雷达动态自适应选择跟踪方法
蚱蜢
基于鲁棒性小波包峭度图的滚动轴承故障诊断*
基于信息熵的IITFN多属性决策方法