基于最大间隔超球分类器的柴油机异常检测研究

2011-02-22 09:34吴定海张培林任国全傅建平
兵工学报 2011年7期
关键词:分类器间隔柴油机

吴定海,张培林,任国全,傅建平

(军械工程学院 火炮工程系,河北 石家庄050003)

柴油机是武器装备底盘系统的动力心脏,直接关系到整体机动性能,对柴油机的运行状态进行在线监测具有极其重要的意义。由于柴油机的结构和各种激励相互作用的复杂性,使得人们难以从原理上建模来研究外在所测信号与柴油机内在故障之间的对应关系。因此,目前对柴油机故障诊断的研究大多基于对历史样本的分析和建模,研究其分布规律,从而建立分类器进行故障类型的判别。这种方法常常面临这样的问题,正常样本多而故障样本难以捕捉,这就造成了故障样本数据的严重不平衡[1]。对柴油机运行状态进行在线监测时,及时地发现其运转的异常,进行在线报警更具有重要的现实意义。因此,需要立足于数据样本不足的现状,研究能够解决此类问题的异常检测模型。

基于数据样本分布不平衡问题的机器学习问题的研究,Scholkopf[2]在支持向量机的基础上建立了单类分类支持向量机(One-class SVM),Tax 等[3]建立支持向量描述(SVDD),只需要目标类数据训练样本,在核空间以最小的超球包括目标样本,从而建立分类器,这是一种无监督的学习方法,缺乏异常数据样本的信息,模型参数难以确定,没能权衡分类器的描述精度和泛化性能。

本文研究柴油机的运行状态异常监测问题,引入一种有监督的超球分类器,结合异常数据样本的信息,分析模型的参数选择对分类器性能的影响,提出运用ROC 曲线的下方面积(AUC)作为评价指标的参数优化选择方法,实例分析验证了该故障诊断方法的优越性。

1 最大间隔超球分类器

SVDD 采用一个或多个超球将目标数据包裹在其中,实现对分布不平衡数据的很好分离[3-7]。然而,SVDD 只考虑将目标类“包紧包实”,没有考虑异常类样本信息,其超球面没能将2 类数据以最大间隔分离,并非最优分类超球面,提高了描述精度但损失了泛化性能。

而支持向量机(SVM)最优分类超平面在确保正确分类的同时,决策超平面将2 类样本以最大间隔分离,使得SVM 在遵循结构风险最小化的原则下获得了最好的泛化性能。

结合支持向量分类超平面的思想,在核空间中寻求一个超球S(a,R),将2 类样本以最大间隔分离,如图1所示。引入距离变量d,对给定的样本集xi∈Rd,yi∈{-1,1},i=1,…,n,2 类训练样本约束为[6]

这样问题便转化为在上述约束下寻求最大分类间隔[8]

图1 最大分类间隔超球分界面Fig.1 Hyper-sphere classification with maximal distance

也即等同于寻求最小化R2/d2,则引入分离比例参数K=R2/d2,最优分离超球面描述为[3,5,7-8]

式中:ξi为松弛因子;φ 为非线性映射;ν 为控制错分比例,将上述问题转化为对偶问题

解(5)式凸二次规划问题,获得球心

则决策超球面的半径通过(6)式求解

求解完成后,模型的判别函数为

图2为由Prtool[3]工具箱产生的二维2 类Banana 数据集分类效果。其中目标类样本154 个,非目标类样本46 个。对本文模型设置经验参数v=0.01,σ=4,K 为10,在v 的控制下实现2 类样本的最大间隔分离。

2 柴油机异常检测

2.1 柴油机振动信号分析

以某型军用12 缸柴油发动机为研究对象,测试工况转速为900 r/m,空载,采集第1 缸盖振动加速度信号,采用等空间同步采样,每工作循环(720°)采集1 024 点。测试了柴油机的正常状态、异常状态(单缸失火、喷油器压力过小和进气门漏气)等4种工况。

发动机缸盖振动信号是典型的非平稳信号,取1 个完整工作循环的数据作短时傅里叶变换,得其时频谱分布如图3所示。分析其时频域上的特性[9-10]如下。

1)时域分布特性:振动信号由许多瞬态冲击成分组成(主要为燃烧气体的压力冲击和进、排气门开、闭时产生的冲击),特定的冲击响应与一定时间频率段的幅值相对应。

2)频域分布特性:振动信号中高频信息丰富,且时间频率局部性明显,燃爆压力响应与进排气门落座段冲击响应分布在不同的频段,但是存在一定的交叠。发动机在正常工作状态下,各激励力作用的振动响应是相对稳定的,当发动机出现故障时,相应时频段内的能量或谱峰值将发生变化,为故障特征提取和诊断提供依据。

3)工作循环间时频特性呈现出明显的周期性,时频特性的周期性是整工作循环缸盖振动信号特征提取的依据,等角度采样相当于将不同转速下的采样过程进行了归一化处理,有效地预制了波动影响,使其具有各态历经性。同时柴油缸盖振动信号更具复杂性,并没有特定明显的频率与其故障相对应,并且受噪声干扰严重。

根据以上的分析,运用小波包进行分解提取小波包能量特征是对柴油机进行监测的有效手段。本文采用双树复小波包[11-12]进行3 层分解,阈值降噪后,提取频带能量特征如图4所示,所提取的特征能够较好的表征柴油机运行工况,具有较好的可分性。

图4 不同工况频带能量特征Fig.4 Energy spectrum features of different conditions

2.2 异常检测模型参数分析

超球分类器异常检测模型中参数的优化选择对于提高柴油机在线异常检测精度具有重要影响,需要对各参数进行详细分析。对于上述超球分类器,核函数的选择具有最好描述性能的高斯核,因此,需要选择的参数有3 个:高斯核σ,控制错分比例v,分离比例K.

高斯核σ 决定了样本映射到高维空间的聚集性,当σ 越小,超球体越小,对应分类面投影复杂程度越高,体现为支持向量的个数也越多,描述精度高,而泛化能力则较差。可见,该核参数主要影响样本间的分布距离,从而影响分类器的泛化能力,同时支持向量的个数又影响了在线异常检测的执行效率。

控制错分比例参数的意义:对于检测的数据样本在空间的分布往往存在野点,超球分类器数据描述为了将所有正常样本包含在超球体内,必然要增大超球半径,导致描述精度的下降。引入控制错分比例v 使得超球分界面能够提供一种软间隔,将偏离某一类别的奇异点排除在超球外,作为支持向量,提高描述的精度。控制错分比例代替了传统的惩罚参数,具有具体的物理含义,即为边界支持向量比例的上界和支持向量比例的下界,更有利于参数的取值。

而本文介绍的最大间隔超球分类器在结合异常类训练样本信息,引入分离比例参数K,从正常样本和异常样本之间的边界距离角度出发,综合权衡两类样本交界处2d 范围内的分布情况,以最大分离间隔分离目标样本和非目标样本,通过改变K 可以得到从球面到平面变化的灵活的决策边界,增大K 也势必增加了支持向量的数量。

2.3 模型参数分步优化及结果分析

建立柴油机异常模型,最为重要是考察模型的泛化性能。取正常工况训练样本120 个,异常类训练样本30 个(单缸失火、喷油器压力过小、进气门漏气工况各10 个),另外取相同数量的样本作为测试样本。

由于特征维数(8 维)较高,无法直接观察特征空间的分布情况,可以由ROC 曲线进行评价,它是以正常样本正确判别的个数与所有目标数据样本个数的比值(正检率)为横坐标,以异常样本被误判的个数与所有异常样本个数的比值(虚警率)为纵坐标的二维图,并通过匹配不同的阈值水平得到的不同点,从而连成一条曲线来全面刻画模型分类性能。因此,曲线越接近坐标的左上方模型性能越好,AUC越大。

通过以上对各参数的分析,本文在综合考虑模型描述精度和泛化性能的同时兼顾模型的复杂度,以AUC 和支持向量个数为评价指标对超球分类器异常检测模型参数进行分步优化。

根据经验初始化{v=0.01;σ=1;K=10},根据AUC 和支持向量的个数,调节σ 初步确定合适的取值区间为[0,0.5],对其进行进一步细化搜索,模型的评价指标随核参数变化如图5所示。当σ <0.15 时,支持向量的个数将迅速增加;当σ >0.15时,支持向量的分布趋于平稳,是比较合理的选择,同时考查ROC 曲线的评价指标发现当σ 取0.2 时,能获得较好的泛化性能。

图5 高斯核参数的选择Fig.5 Choose of Gaussian kernel parameter

为保证检测精度,一般v 取较小的值,观测其在[0,0.1]间的变化规律如图6所示,可见随着其增长,支持向量数量基本成线性增加,泛化检测性能下降,由图中曲线可确定v 的值为0.01 为宜。

图6 控制比例参数的选择Fig.6 Choose of control proportion parameter

在获得σ 和v,调整K,如图7所示。随着K 的增大,支持向量个数随着增多,当K >30,迅速增大,ROC 曲线评价指标也显示分类器的性能在逐步提高,综合考虑,确定K=30.然后再重复按以上步骤进行微调,直到AUC 变化小于1%停止,最终模型的最优参数如表1所示。

用同样的参数选择方法确定SVDD 模型的参数,并对比2 种模型的分类效果,如表1所示。经对比可看出,本文模型引入K 后,分类效果要好于SVDD 模型,对柴油机异常检测具有明显的优势。

表1 分类器检测效果对比Tab.1 Detection effects of different classifiers

图7 分离比例参数的选择Fig.7 Choose of radius to separation margin ratio

3 结论

1)该模型能够结合2 类样本分布信息和SVM分类超平面所具有最大分类间隔的特点,能够很好解决柴油机异常检测故障样本分布不平衡问题,体现了优良的检测性能。

2)柴油机异常检测需要同时兼顾检测精度和检测效率,本文所提评价指标和分步优化能够用最小的代价迅速找到次优参数,具有实用意义。

3)引入分离比例参数,异常检测模型具有更好的灵活性,缺点是最优参数的确定复杂度相对要高一点。

References)

[1] 潘志松,陈斌,缪志敏.One-class 分类器研究[J].电子学报,2009,37(11):2496-2503.PAN Zhi-song,CHEN Bin,MIAO Zhi-min.Overview of study on one-class classifiers[J].Acta Electronica Sinica,2009,37(11):2496-2503.(in Chinese)

[2] Scholkopf B.Estimating the support of a high-dimensional distribution[J].Neural Computation,2001,13(7):1443- 1471.

[3] David M J T.Support vector data description[J].Machine Learning Research,2004,54(1):45-66.

[4] 王自营,邱绵浩,安钢.基于支持矢量聚类的机械故障诊断[J].机械工程学报,2009,45(4):226-230.WANG Zi-ying,QIU Mian-hao,AN Gang.Fault diagnosis of machine based on support vector clustering[J].Journal of Mechanical Engineering,2009,45(4):226-230.(in Chinese)

[5] David M J T,Robert P W.Duin.Uniform object generation for optimizing one-class classifiers[J].Machine Learning Research,2001,2:155-173.

[6] 李凌均,韩捷,王昆,等.基于单分类的机械故障诊断研究及其应用[J].机械强度,2008,30(5):697- 701.LI Ling-jun,HAN Jie,WANG Kun,et al.Mechamcal fault diagnosis based on one-class classification and its application[J].Journal of Mechanical Strength,2008,30(5):697-701.(in Chinese)

[7] 王自营,邱绵浩,安钢,等.基于一类超球面支持向量机的机械故障诊断研究[J].振动工程学报,2008,21(6):553-558.WANG Zi-ying,QIU Mian-hao,AN Gang,et al.Fault diagnosis investigation of machine based on one-class hyperspherical SVM[J].Journal of Vibration Engineering,2008,21(6):553-558.(in Chinese)

[8] Wang J,Neskovic P,Cooper L N.Pattern classification via single spheres[J].Discovery Science,2005,3735:241-252.

[9] 曹建军,张培林,张英堂,等.基于提升小波包变换的发动机缸盖振动信号特征提取[J].振动与冲击,2008,27(2):34-38.CAO Jian-jun,ZHANG Pei-lin,ZHANG Ying-tang,et al.Feature extraction of an engine cylinder head vibration signal based on lifting wavelet package transformation[J].Journal of Vibration and Shock,2008,27(2):34-38.(in Chinese)

[10] 曹龙汉.柴油机智能化故障诊断技术研究[M].北京:国防工业出版社,2001:64-68.CAO Long-han.Intelligent fault diagnosis technique of diesel engine[M].Beijing:National Defense Industry Press,2001:64-68.(in Chinese)

[11] Wu D H,Zhang P L,Ren G Q,et al.Study on engine vibration signal denoising method of SURE Block threshold based on DTCWPT[C]∥Proceedings of International Conference on Measuring Technology and Mechatronics Automation.Hunan,China:IEEE 2009,1:719-722.

[12] Baraniuk R G,Kingsbury N,Selesnick I W.The dual-tree complex wavelet transform-a coherent framework for multiscale signal and image processing[J].Signal Processing Magazine,2005,22(6):123-151.

猜你喜欢
分类器间隔柴油机
基于朴素Bayes组合的简易集成分类器①
间隔问题
基于特征选择的SVM选择性集成学习方法
美国FCA 推出第三代EcoDie s e l V6 柴油机
间隔之谜
谭旭光:柴油机50年内仍大有可为
基于差异性测度的遥感自适应分类器选择
现代柴油机的技术发展趋势
基于层次化分类器的遥感图像飞机目标检测
上楼梯的学问