基于ID3-CNN的旋转机械故障诊断研究

2024-03-25 09:14王承超王湘江
机械工程师 2024年3期
关键词:特征提取故障诊断准确率

王承超,王湘江

(南华大学 机械工程学院,湖南 衡阳 421001)

0 引言

《中国制造2025》的提出使制造业向自动化、智能化、机械设备无人化发展[1],如何确保机械设备在无人化环境中的安全平稳运行成为现代制造业发展中的难题。旋转机械作为现代制造业的重要设备,在实际生产中使用范围广,产生的故障类型多,且故障的严重程度不均衡,为保障旋转机械在无人化环境中的稳定运行,确保生产安全,有必要针对旋转机械的故障特点建立合适的智能故障监测与诊断系统。

目前,故障诊断方法主要有基于专家经验的诊断方法、基于信号处理的“浅层学习”及基于数据驱动的“深度学习”三大类[2]。但随着机械设备不断复杂化、精密化,基于专家经验和信号处理的故障诊断方法已经难以满足当前“大数据”时代下的故障诊断需求[3-4],期望通过知识经验及精密的数学模型对机械故障进行诊断愈发困难,且随着机械设备不断更新,故障类型愈发繁多,传统的故障诊断知识难以涵盖所有故障类型。目前常用的基于支持向量机[5](Support Vector Machine,SVM)、决策树[6-7]及人工神经网络等“浅层学习”模型的故障诊断系统因为算法结构过于简单,导致在复杂环境中故障诊断效果不佳。为了弥补这一不足,研究人员通过傅里叶变换[8]、小波变换[9]等时频域分析方法对模型的特征提取能力进行优化,进一步加强了模型的特征结构。此类方法虽然取得了一定的成果,但是由于人工特征提取能力的有限性,在多类型、高维度的故障诊断任务中仍然效果不理想。

近年来,由于Hinton等[10]提出的“深度学习”(Deep Learning,DL)模型在智能特征提取上的优良表现得到了业内学者的广泛关注[11-12]。辛阔等[13]提出了一种基于深度Q学习网络的滚动轴承故障诊断方法。Abdeljaber等[14]构建了一种深度自适应一维卷积神经网络,用于钢架损伤的故障检测。刘颉等[15]利用奇异值分解得到的特征向量建立了图卷积神经网络对小样本滚动轴承数据进行诊断,解决了机械故障诊断中由于样本不足导致特征提取困难的问题。以上研究虽然通过构建不同的“深度学习”模型解决了在故障诊断中人工特征提取能力不足的问题,但是针对多类型、多层次的机械故障诊断任务,以上模型忽略了不同程度下故障特征的差异性,在故障特征具有明显差异的情况下,同时对所有故障使用同一模型诊断不仅增大了计算量,而且容易造成“深度学习”模型训练困难、模型难以收敛等问题[16]。

对于机械故障演化机理的研究表明,微小故障经过时间累积往往会形成严重故障,且演变过程往往伴随越发明显的振动、噪声等故障特征[17],即表明严重故障产生的特征信号往往越明显,而细微故障由于损伤微小,其产生的特征较为模糊,由此认为,严重故障通过基础的特征分类能有效识别,而微小故障由于特征不明显,需要对特征进行深度提取才能有效区分。基于此,针对旋转机械产生的故障特点,本文提出了一种基于ID3决策树和卷积神经网络(ID3-CNN)的故障诊断模型。该方法由浅至深进行特征提取,利用t-SNE对特征进行两次降维,确定特征分布规律,最后通过ID3决策树与卷积神经网络进行分类,以完善模型的特征提取能力,提高故障诊断的准确率。

1 相关理论

1.1 ID3决策树

ID3算法是一种逼近离散函数值的计算分类模型,在类型差异较大的数据集中,训练好的ID3模型具有分类速度快、准确率高等优点[18],因此被广泛应用于具有明显特征的故障诊断和数据挖掘中。其基本结构是由一个根节点、若干个内部节点及若干个叶子节点组成。ID3模型中根节点的样本集通过内部节点计算特征的信息增益实现最优划分,并在叶子节点处显示出数据的类型,得到最终的分类结果。其内部节点的计算过程如下。

信息熵是指数据集内部的混乱程度,信息熵越大则表示数据集越混乱。假设信号集S含有S=(s1,s2…sn)种信号,每种信号对应在集合中的概率分别是P=(p1,p2…pn),则该信号集S的信息熵可以表示为

若数据集Y中含有a种训练样本(y1、y2…ya),训练集样本量为T,设属性X中有n个值(x1、x2…xn),样本Y经过属性X划分为(Y1、Y2…Yn)的n个子集,每个子集中的样本量为(e1、e2…en),则划分后数据集Y的信息熵计算公式为

式中,p(xi)为第i个子集的权值,其计算公式为

式中,E(Y|xi)为在属性X=xi时子集Yi中的信息熵,其计算公式为

式中,p(y)为子集Yi中的样本等于y的概率。

则训练集Y在经过属性X划分后的信息增益为

1.2 卷积神经网络

卷积神经网络是一种具有较强表征学习能力的前馈神经网络,通过卷积运算可以从本质上对混杂的数据类型进行有效区分。其主要结构包括输入层、卷积层、池化层、全连接层。如图1所示,输入信号经过卷积层、池化层进行特征提取,随后对数据展开,通过全连接层和Softmax函数进行计算分类并得到诊断结果。

图1 一维卷积神经网络结构

1.2.1 卷积层

卷积层将卷积核与样本进行卷积运算提取出数据中含有的特征信息,计算公式为

1.2.2 池化层

池化层本质上是一种下采样计算,通过池化可以对特征矩阵进行降维,避免在训练过程中产生过拟合现象。常用的池化运算为平均池化和最大池化,本文选用最大池化运算,计算公式为

式中:β、b为权重矩阵和偏置矩阵,down( )为下采样函数。

1.2.3 全连接层

特征矩阵通过全连接层进行整合,将二维特征展开为一维数据,并使用Softmax激活函数进行转化,可得

式中:w0、b0分别为权值矩阵和偏置矩阵,fv为特征矢量,f( )为Softmax激活函数。

2 ID3-CNN诊断模型

2.1 诊断模型架构

ID3-CNN的基本架构如图2所示。输入层对原始的长时序数据进行采样,制作训练所需的样本,特征提取层对样本数据进行两次特征提取,提高模型的特征表达能力,然后对各类数据进行属性划分,得到诊断结构,完成对数据的检测。

图2 ID3-CNN基本架构

2.2 输入层

原始信号采样时间较长,大量特征信息在长时序信号中产生重叠,造成样本浪费,由此在不损失信号特征属性的前提下,本文对长时序信号进行了滑动重叠采样[19],从而扩充训练集样本,提高训练中模型参数的精确性,如图3所示。

图3 滑动重叠采样

滑动窗口在滑动步长的控制下,在时间方向上对原始长时序信号进行滑动采样。假设采样长度为L,滑动窗口长度为S,滑动步长为D,则采集到的样本数量N计算公式为

2.3 特征提取层

ID3-CNN模型建立了具有两次提取过程的特征提取层,首先通过人工提取信号特征,然后使用卷积运算对人工提取中特征混叠的故障类型进行再次提取。并利用t-SNE方法对两次提取到的特征进行了降维可视化,直观表现出两次特征提取后的数据变化。特征提取过程如图4所示。

图4 ID3-CNN特征提取

在卷积中常用的激活函数是Sigmiod、tanh等非线性函数,但是Sigmiod函数容易导致模型的收敛速度变慢,存在梯度丢失问题,本文在此处采用tanh激活函数:

2.4 诊断输出层

输出层将对原始数据中提取到的特征进行类型划分,通过ID3及CNN模型同时对不同类型的故障类型进行分类,直观表现出每种数据的故障类型。

3 试验分析

为验证本文所提出模型的有效性,本文选用凯斯西储大学轴承数据集(CWRU)进行了试验。试验基于Tensorflow深度学习架构,试验条件为R7-4800H、GTX1050Ti、Windows 11。

3.1 数据介绍

凯斯西储大学轴承数据库(CWRU)选用的轴承为6205-2RSJEM SKF深沟球轴承,采样频率为12 kHz,转速为1797 r/min,数据库主要包含在基座、驱动端、风扇端采集到的轴承内圈、外圈、滚动体故障,并测试了各部位故障中4种不同程度的故障类型,本文提取了在驱动端采集到的内圈故障、外圈故障、滚动体故障及正常运转等7种数据类型进行模型的验证,如表1所示。

3.2 试验及参数设计

在本次试验中,首先对原始数据进行人工时域特征提取,并且对提取的人工时域特征使用t-SNE进行降维可视化,确定故障的特征分布,随后对可视化中显示的特征混叠的故障进行卷积运算,提取深度特征,最后对第一次t-SNE可视化提取到的具有明显特征的故障类型使用ID3决策树进行甄别,对第二次特征提取的故障类型使用卷积神经网络进行诊断。

试验中每种故障选用75%的样本数据用于模型训练,其余数据用于测试训练好的模型。时域特征提取类型如表2所示,在人工时域特征提取完成后对训练集的样本数据进行随机序列打乱。

表2 时域特征及计算

在本次试验中,卷积神经网络的最大迭代次数为1000次,卷积核数量(filters)为112,卷积核尺寸(kernel_size)设置为2。同时为了验证本文建立的模型性能,本文构建了支持向量机(SVM)和二维卷积神经网络(2D_Convolutional Neural Networks,2D_CNN)用于对比实验。

模型性能通过测试的准确率表现,其定义式为

3.3 数据处理分析

首先通过滑动采样对原始数据进行样本提取,采样窗口长2048,为增强样本数据之间的关联性,设置采样重复区域长度为1000,对每种数据各采集100个样本,并划分为训练集(75%)和测试集(25%),训练集中20%作为验证集,在训练过程中进行交叉验证。时域特征的提取结果如图5所示。

图5 部分时域特征

图6 按时域特征进行数据重打标签

可发现标签为B4、OR1、NM的数据类型在时域特征中与其他数据具有明显的区分,标签为B1、B2、B3、IR1的数据在时域特征中发生混叠,不易与其他数据区分。因此,根据故障形成机理,将峰值特征突出的B4、OR1故障定义为严重故障T4、T3,将峰值差异较小的B1、B2、B3、IR1定义为轻微故障T2,如表3所示。

表3 数据标签重构

3.4 实验结果分析

使用t-SNE方法对原始数据及模型二次提取到的特征进行了降维可视化,如图7所示。

图7 原始特征与ID3-CNN提取的特征分布可视化图

图7中t-SNE降维结果表明,原始数据混叠杂乱,很难通过分类器进行有效鉴别,经过人工提取特征后,部分故障类型界限较为清晰,但仍有混叠现象,第二次特征提取后,各故障的数据特征界限清晰,具有较高的可分性,为模型的分类准确性提供了保障。

利用处理后的数据构建决策树,如图8所示,在不对决策树进行预剪枝的前提下,经过数据标签重构后的ID3决策树没有出现数据过拟合的现象,决策树模型结构清晰明了。

图8 重新定义标签后构建的决策树

图9 卷积神经网络训练准确率及损失与迭代次数的关系

故障等级严重的T3、T4类型在该决策树上测试准确率达到100%。轻微故障T2在经过决策树筛选后,由卷积神经网络进一步提取特征。轻微故障T2在卷积神经网络中训练的准确率和训练损失如图10所示,经过1000次迭代后准确率接近100%。

图10 各模型在不同故障类型中诊断的准确率

轻微故障T2的测试集在卷积神经网络中测试的准确率为95%左右。

同时使用训练好的ID3-CNN 模型与SVM、2D_CNN进行了对比实验,对比结果如图10所示。

2D_CNN测试平均准确率为92.57%,SVM模型测试平均准确率为91.42%,本文构建的ID3-CNN诊断模型测试平均准确率为97.14%。本文构建的模型在时域特征模糊的故障类型T2(B1、B2、B3、IR1)中诊断准确率达到95%,高于二维卷积神经网络和支持向量机模型的准确率,且在特征明显的故障类型T3(OR1)、T4(B4)中,本文构建的模型诊断准确率达到了100%。

4 结论

本文提出了一种基于ID3决策树与卷积神经网络融合的旋转机械故障诊断方法,针对旋转机械故障类型多、故障等级不均衡的特点,利用不同故障类型之间特征的差异性,首先对故障特征进行人工提取,然后对人工故障特征混叠的故障类型进行二次特征提取,加强了模型的特征表达能力,针对不同等级的故障类型使用不同的分类器,减小了模型的训练难度,取得了良好的故障诊断性能,主要结论如下:1)利用不同故障之间的差异性,使用多种模型进行故障诊断,相比于传统单一模型,能有效减小模型的训练难度,提高模型性能。与SVM、2D_CNN相比,ID3-CNN模型识别准确率得到提高。2)相比于传统模型中的单次提取,对故障特征进行两次提取,经过t-SNE方法降维可视化表明,两次特征提取的故障类型更具线性可分性,提高了模型的特征提取能力。

猜你喜欢
特征提取故障诊断准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
基于Daubechies(dbN)的飞行器音频特征提取
高速公路车牌识别标识站准确率验证法
Bagging RCSP脑电特征提取算法
因果图定性分析法及其在故障诊断中的应用
基于MED和循环域解调的多故障特征提取
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断