基于C0复杂度和GG模糊聚类的轴承性能退化状态识别

2019-07-22 10:58王微胡雄王冰孙德建
轴承 2019年12期
关键词:复杂度轴承聚类

王微,胡雄,王冰,孙德建

(上海海事大学 物流工程学院,上海 201306)

0 引言

港口起重机械是码头重要的物资装卸设备,轴承是其起升机构中重要的旋转支承部件,一旦发生突发性故障,轻则带来经济损失,重则导致人员伤亡。采集并分析轴承的运行监测信号,进而准确识别轴承性能退化状态,能够降低发生突发故障的概率,提升港口起重机械的运行可靠性。轴承性能退化状态识别的关键步骤包括退化特征提取和识别模型构建[1]。

特征参数的优劣决定着性能退化状态识别的准确性。常见的退化特征主要基于时域、频域以及时频域分析方法,其中时域、频域指标因计算简单且有应用价值而被广泛采用,如信号的有效值、方差、峭度、平均频率等[2-3],但该类方法缺乏对信号的全面描述。时频分析方法具有更好的多尺度分辨率特性,但本质上仍是基于线性分析,在面对非平稳和非线性的信号时的针对性不强。针对轴承振动信号非线性、非平稳性的特点,以信息熵为基础的复杂度分析方法为该领域的研究提供了一条有效的途径。应用较多的包括模糊熵[4]、样本熵[5]、近似熵[6]等行为复杂度参数[7],该类型方法通过度量短时间窗口中新模式的概率表征信号的复杂度。与行为复杂度相对应,结构复杂度则通过变换信号的频率特性,结合信息熵分析信号的复杂度,典型方法即以Fourier变换为基础的C0复杂度。C0复杂度主要应用在脑电以及语音信号的处理中,与行为复杂度相比具有计算量低,运算速度快,参数影响小等优势[8-11]。然而,利用C0复杂度分析机械设备性能退化规律的研究较少,该方法具有在线特征分析的优势和潜力。

由于机械设备的性能退化时间长,退化过程不可预知,退化状态数目以及边界难以确定,机械设备退化状态的在线识别一直是该领域的难点问题。因此,尝试通过无监督聚类方法分析特征数据的关联性,挖掘数据之间的内在规律,识别不同的退化阶段,完成退化状态的无监督离线识别,从而为退化状态在线识别奠定基础。目前,应用较多的无监督聚类方法包括K均值聚类[12],模糊C均值聚类(Fuzzy center means,FCM)[13],GG模糊聚类(Gath-Geva fuzzy clustering,GG)[14],GK聚类(Gustafaon-Kessel clustering, GK)[15]等。其中,GG模糊聚类算法采用了模糊最大似然估计距离范数,具有更优的聚类精度[16-18]。但目前GG聚类算法的研究热点主要集中在轴承故障模式诊断中,对轴承性能退化状态的聚类分析相对较少,而且对性能退化识别中时间连续性的约束考虑较少,算法的性能还有进一步提升的空间。

综上,将C0复杂度应用于性能退化特征提取,采用logistics序列分析该参数的有效性,将时间参数映射到指数函数中,形成更符合退化过程的弯曲时间参数(Curved Time),并与C0复杂度、有效值(RMS)构成三维退化特征向量,通过GG模糊聚类算法实现不同退化状态的识别。

1 基于C0复杂度的退化特征分析

C0复杂度算法是一种非线性分析方法,无需对原始信号进行粗粒化处理,避免了信号动力学性质的改变,并且具有计算速度快的优势[19]。C0复杂度的主要思想是以序列中非规则成分的比例定量描述信号的复杂度。对于一个长度M的一维时间序列{x(t),t=0,1,2,…,M-1},C0复杂度的计算步骤如下:

1)对x(t)进行离散Fourier变换可得

(1)

2)令WM=e-2πi/M,则

(2)

3)计算均方值GM

(3)

4)保留大于GM的频谱,其余置零得

(4)

(5)

6)计算复杂度得

(6)

一般而言,C0复杂度能够描述序列的复杂性,复杂度越大,序列波动模式越复杂,取值越大;复杂度越小,序列的波动模式越简单,取值越小;因此,可以采用C0复杂度对机械设备的性能退化特征进行描述。

1.2 退化特征性能分析

Logistic混沌映射是研究动力系统、混沌、分形等复杂系统行为的一个时间离散动力系统[20]。本节以Logistic迭代作为仿真信号,分析C0复杂度在复杂度表征方面的规律和性能,信号表达式为

u(t+1)=λu(t)[1-u(t)],

(7)

式中:λ为非线性参数,λ∈[0,4];u(t)为状态变量,u(t)∈[0,1];t为迭代次数。设置初始值为u=0.4,该方程的分叉图如图1所示。

图1 Logistic混沌映射分叉图

可以看出,当λ∈(3.00,3.57)时,系统处于周期状态,并且周期个数在不断变化;当λ∈(3.57,4.0)时,系统处于混沌状态,同时一些狭小的区间混杂有周期性循环,使序列的复杂性下降。

分别计算每个λ取值下的C0复杂度,采用常用的熵分析方法进行对比,仿真计算机处理器为AMD A8-7600 Radeon R7,内存为8.00 GB,算法的参数及计算结果见表1,其中运行时间代表累计计算2 000次复杂度参数的总时间,Dim为嵌入维数,r为容差,τ为延迟因子。不同λ取值下的复杂度参数变化趋势如图2所示。

表1 算法参数以及计算结果

图2 不同复杂度方法的变化趋势

由图2可知,C0复杂度和模糊熵能够反映区间(3.00,3.57)中周期个数增多,复杂度逐渐增大的趋势,近似熵和样本熵算法则效果欠佳;同时,C0复杂度能够清晰反映混沌态复杂度不断增大的趋势,对其中混杂的周期性循环导致复杂度下降的趋势也能有所体现。从运算速度看,C0复杂度由于只涉及Fourier变换及其逆变换操作,运算速度远优于其他3种方法。因此,C0复杂度参数与序列的复杂程度具有良好的关联性,并且参数少,运算速度快,适合于在线退化特征的分析。

2 基于GG聚类的退化过程识别

2.1 GG模糊聚类评价指标

一般情况下,以模糊理论为基础的聚类算法均是采用隶属度最大原则进行类别聚类,判断的数据依据为隶属度矩阵U。应用较多的指标有分类系数(Classification Coefficient,CC)以及平均模糊熵(Average Fuzzy Entropy,AFE)[14]。CC指标越接近1,AFE指标越接近0,模糊聚类的效果越好。

此外,退化状态聚类的主要特征是同一运行状态的时间连续性。因此,提出一种序列离散度指标(Sequence Dispersion,SD),以此衡量同一类别样本时间标签的连续性。对于某个聚类,假设I为该集合的标签序列,n为该聚类的样本个数,m-1为该标签序列最大值与最小值之差,定义该聚类的序列离散度为

b=(m-n)/m,

(8)

显然,如果I为连续序列,则b=0;I越不连续,序列中存在“空位”越多,序列离散度越大。

假设整个样本集合被划分为c类,则此次聚类的时间序列离散度为

(9)

该指标越接近于0,代表时间聚集度越高,退化状态聚类效果越好;取值越大,时间聚集度越低,聚类效果越差。

2.2 退化过程识别流程

基于C0复杂度与GG模糊聚类的退化状态识别方法如图3所示。以机械设备全寿命数据为基础进行退化状态离线划分,首先提取三维特征向量对退化状态进行GG模糊聚类,然后通过3个指标对聚类效果进行评价。

选取有效值CRMS,C0复杂度以及时间弯曲参数CCT构成了三维特征向量[CRMS,C0,CCT]。其中,CRMS能够表征信号的能量累积规律;C0复杂度能够反映信号复杂度变化;CCT用于在状态聚类时考虑同一种退化状态在时间尺度上的集聚度。计算方法是将全寿命数据中的时间参数T归一化并映射到函数CCT=eT-1中,从而获得初期平缓,后期剧烈的“弯曲时间维度”,从而更准确地反映机械设备性能退化的时间分布特性,如图4所示。

3 退化状态识别实例分析

3.1 轴承全寿命数据试验

轴承全寿命数据集来自辛辛那提大学IMS中心[21],加速试验台示意图如图5所示。试验中采用的轴承类型为Rexnord ZA-2115双列圆柱滚子轴承,滚子数量为16,滚子组节圆直径为75.501 mm,滚子直径为8.407 mm,接触角为15.17°。

图5 加速试验台结构示意图

选取其中一组数据集进行分析,该组试验的加载力为5 000 N,转速为1 500 r/min,采样频率为20 kHz,每组采样时间为1 s,组间采样间隔为10 min,共采集984组数据。试验台停机后检查发现轴承1出现故障,失效形式为外圈滚道面磨损;其余3套轴承均完好。忽略数据集的采样间隔,轴承性能退化的时域波形如图6所示。信号幅值在第700组采样点开始出现增大的趋势,需要进一步进行退化特征分析。

图6 轴承全寿命数据的时域波形

3.2 退化特征提取

分别对每组采样数据进行退化特征分析,计算C0,CRMS及CCT。为降低不同量纲对聚类效果的影响,对3个特征指标进行量纲一化。C0的计算中,参数r设置为10。轴承全寿命数据集的退化特征趋势如图7所示。由图可知:1)从整体趋势上看,C0随着性能退化程度加深而逐渐降低,CRMS的趋势则与之相反;说明随着性能退化程度的增加,信号中的随机成分逐渐减少,信号的复杂度随之降低;而从能量累积角度分析,信号的能量随着退化程度的增加而不断增大,CRMS也随之增大。2)从细节上看,C0和CRMS均呈现出一定的阶段性,反映了轴承性能退化的不同状态;而通过时间的“弯曲化”,CCT与性能退化的整体趋势关联性更强。

图7 轴承全寿命数据的性能退化特征趋势

3.3 退化状态识别

对轴承退化状态进行GG模糊聚类,参考同类文献[22-23]将退化状态划分为4类:正常、轻微退化、严重退化、失效。设置参数为c=4,m=2,容差为ε=0.000 01,对不同的退化状态进行无监督GG聚类,聚类效果的等高线图如图8所示。由图可知,GG聚类算法的等高线为任意形状,说明该算法对数据源的分布要求较低,具有更好的适应性。

图8 GG聚类等高线示意图

GG聚类的轴承退化状态识别结果如图9所示,整个退化过程同样聚集为了上述4种状态,且各个状态在时间尺度的连续性均较好。

图9 GG聚类效果图

由图9可知:1)CRMS反映了性能退化过程中的能量积累情况,因此取值随着退化程度的加深而逐渐增大。2)CCT反映了性能退化的时间标度,呈现严格的单调性。3)在约第520组采样点之前,轴承一直保持较长时间的正常状态,C0维持在0.7附近;当轴承性能轻微退化时,C0非常敏感且快速下降,并出现明显的波动现象;进入到约第820组采样点后,轴承性能严重退化,C0基本维持在0.4左右,数值反弹不大;当进入到失效状态时,C0取值低于0.4且出现一些数值异常的离散点,此时认为轴承已经完全失效。

3.4 对比分析

3.4.1 时间特征参数对聚类效果的影响

首先分析时间特征参数对于聚类效果的影响。保持GG模糊聚类算法和参数设置不变,分别采用二维特征[C0,CRMS]和三维特征[C0,CRMS,T]进行对比分析,结果如图10和表2所示,其中T为未进行映射的时间参数。对比分析可知,3种方法在分类系数上取值相近,但文中方法的平均模糊熵和序列离散度最低,说明聚类的时间集聚性和聚类效果最优。

图10 选取不同特征参数的聚类效果图

表2 不同特征参数的定量评价结果

3.4.2 聚类算法对聚类效果的影响

保持三维特征向量[C0,CRMS,CCT]不变,分别采用GK聚类、FCM聚类与GG聚类进行对比分析,结果如图11和表3所示。对比分析可知,由于引入了CCT,3种算法的序列离散度均较低,说明分类的时间集聚度得到了提高。但GK和FCM聚类算法的平均模糊熵仍较高,说明模糊矩阵U中的隶属度取值相近,算法在进行模糊决策时容易造成状态误判,例如图11a中GK聚类算法将第500组采样点后出现的轻微退化状态误判为正常状态。GG聚类算法采用了模糊最大似然估计距离范数,模糊矩阵的隶属度区分较大,分类系数和平均模糊熵的取值更优,易于做出正确的决策。

图11 不同特征参数的一维聚类效果图

表3 不同聚类算法的定量评价结果

综上所述,C0复杂度具有良好的性能退化指示能力,结合弯曲时间参数和有效值能够构成科学的退化特征向量;通过GG聚类算法良好的聚类性能,能够科学地识别轴承性能退化状态。

4 结论

提出了基于C0复杂度与GG聚类的退化状态划分方法,通过实例数据的分析验证得到以下结论:

1)C0复杂度能够反映信号中不规则成分的比例,有效描述性能退化过程中的规律性,对复杂度变化十分敏感。

2)弯曲时间参数能够反映采样数据的时间特征,并且通过对指数函数的映射操作使其更符合机械设备的性能退化规律。

3)GG聚类方法能够对任意形状的数据进行聚类,将时间约束加入到特征向量中,能够在保持聚类精度的同时提高类别内部的时间聚集度。所提出的序列离散度指标参数较好地反映出了聚类的时间聚集效果。

猜你喜欢
复杂度轴承聚类
轴承知识
轴承知识
轴承知识
轴承知识
基于K-means聚类的车-地无线通信场强研究
一种低复杂度的惯性/GNSS矢量深组合方法
求图上广探树的时间复杂度
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
某雷达导51 头中心控制软件圈复杂度分析与改进