1、基于 EMD 和 SVM 的传感器故障诊断方法(20 字以内) (二号黑体) 题目冯志刚 1,王 祁 2,信太克规 2(四号楷体) 作者名(1.沈阳航空工业学院 自动化学院,沈阳 110136,;2.哈尔滨工业大学 自动化测试与控制系,哈尔滨 150001)摘 要:为了解决自确认压力传感器的故障诊断问题,提出了一种基于经验模式分解(EMD)和支持向量机(SVM )的传感器故障诊断方法,该方法对传感器输出信号进行经验模态分解,将其分解为若干个固有模态函数(IMF),对每个 IMF 通过一定的削减算法增 强故障特征,然后 计算每个 IMF 和残余项的能量以及整个信号的削减比作为特征向量,以此作 为
2、输 入来建立支持向量多分类机,判断 传感器的故障类型。通过压力传感器的故障 诊断结果表明, 该方法能有效的 应用于传感器的故障诊断中。关键词:经验模态分解;支持向量机;特征提取;传感器故障诊断中图分类号:TH133; TP183 Sensor fault diagnosis based on empirical mode decomposition and support vector machinesFENG Zhi-gang1, WANG Qi2, SHIDA Katsunori2(1.Department of Automation, Shenyang Institute of Aero
3、nautical engineering, Shenyang 110136, China, ; 2.Department of Automatic Measurement and Control, Harbin Institute of Technology, Harbin 150001, China )Abstract: To solve the fault diagnosis problem of self-validating pressure sensor, a sensor fault diagnosis approach based on empirical mode decomp
4、osition (EMD) method and support vector machines (SVM) is proposed. The EMD method is used to decompose the sensor output signal into a number of intrinsic mode function (IMF) components and a residue component. With some cutting algorithm, the IMFs with fault character are strengthened. After that,
5、 the energy of each IMF and residue component, and the average cutting ratio of all the IMFs and residue component are calculated, which are regarded as the feature vector. Then, the support vector machines for multi-classification used as fault classifiers are established to identify the condition
6、and fault pattern of the sensor. Practical example of pressure sensor shows that the proposed approach can be applied to the sensor fault diagnosis effectively. Key words: Empirical mode decomposition; Support vector machines; Feature extraction; Sensor fault diagnosis传感器作为信息获取的源头,在自动的、智能的系统中发挥着重大的作
7、用。它的测量结果直接影响系统的运行,影响分析、决策的正确性,特别是在化工,航天测试系统中,一旦传感器发生故障,后果将不堪想象,因此,对传感器故障进行检测和诊断就显得非常重要。 当传感器发生故障时,传感器输出信号主要表现为以下几种形式:偏差,冲击,周期性干扰,噪声干扰,漂移和输出恒定值。此时,传感器输出信号是非平稳的,信号频率成分比较丰富,采用单纯的时收稿日期:2008-01-23基金项目:国家自然科学基金资助项目 (60572010).作者简介:冯志刚(1980-),男,讲师;王 祁(1944-),男,教授,博士生导师;信太克规(1943-),男,教授,博士生导师.域分析或者频域分析都不能有效
8、的检测出信号的故障特征。为此国内外学者将时-频分析方法应用于传感器故障信号的特征提取中,文献1对传感器输出信号进行小波变换,在不同的尺度上计算信号发生故障前后能量的变化率来检测压力传感器的各种故障。文献2利用小波包分解提取各个节点的能量,然后利用RBF(径向基函数) 神经网络进行传感器故障诊断。经验模态分解方法(empirical mode decomposition, EMD)3是最近提出的一种新的信号时-频分析的方法,该方法基于信号的局部特征时间尺度,可以把信号分解成若干个固有模态函数(intrinsic mode function, IMF)之和,分解出的各个 IMF 分量突出了数据的局
9、部特征,对其分析可以更准确有效的把握传感器信号的故障特征信息,并且 EMD 分解方法已经成功的应用于机械故障诊断的特征提取中 4,5。本文利用 EMD 方法,将传感器输出信号分解为若干个 IMF 分量,对每个 IMF 分量通过一定的削减算法增强故障特征,计算每个 IMF分量和残余项的能量以及整个信号的削减比作为特征向量,然后利用支持向量多分类机识别传感器故障类型,该方法有效的改善了传统分类方法的缺陷,如文献2中神经网络结构的选择、易陷入局部极小点、过学习问题等,具有非常优异的泛化、推广能力,特别是在小样本输入情况下,体现出更大的优势。1 经验模态分解与特征提取1.1 经验模态分解EMD 方法由
10、 Norden E. Huang 于 1998 年提出 3,该方法适用于分析和处理非线性、非平稳随机信号,并且迅速在水波研究、地震学及机械设备故障诊断中得到了应用。该方法可将任意信号分解为若干个本征模态分量和一个残余项,使本征模态分量成为满足以下 2 个条件的函数或信号:(1) 在整个数据序列中,极值点的数量与过零点的数量必须相等或者至多相差一个。(2) 在任何一点,由数据序列的局部极大值点确定的上包络线和由局部极小值点确定的下包络线的均值为零,即信号关于时间轴局部对称。EMD 分解的本质是一个筛选过程,具体的步骤见文献3-4 。经过分解后,原始信号可表示为:)()(1trctxnni即 EM
11、D 可将任何一个信号 分解为 个基本tx模态分量和一个残余项之和,分量分别包含了信号从高到低不同频率)(,),(21tctcn段的成分, 则表示信号 的中心趋势。r)(tx1.2 特征提取本文以传感器故障时,输出信号的六种典型形式为例进行研究,包括:偏差(bias),冲击(spike),周期性干扰(cyclic),噪声干扰(erratic),漂移(drift) 和输出恒定值(stuck) 。具体的信号表现形式如图 1 所示。( a ) 偏差 ( b i a s ) 故障表现形式( b ) 冲击 ( s p i k e ) 故障信号形式( c ) 周期性干扰 ( c y c l i c ) 信号
12、形式 ( d ) 漂移 ( d r i f t ) 故障信号形式( e ) 噪声干扰 ( e r r a t i c ) 信号形式( f ) 输出恒定值 ( s t u c k ) 信号形式t / st / st / st / st / st / sv/Vv/Vv/Vv/Vv/Vv/V图 1 传感器故障时输出信号的六种典型表现形式传感器发生故障时,输出信号会产生一些瞬变,表现在频域上就是某种或者某几种频率成分能量的改变,因此可以提取 EMD 分解后各个 IMF 分量的能量作为特征。图 2 是具有偏差故障的传感器信号经过EMD 分解后各个 IMF 分量和残余项的波形图。可以看出偏差信号特征在各个
13、 IMF 分量上都有反映,为了增强特征,对分解后的各个 IMF 分量和残余项进行了削减,图 3 是对图 1 的削减结果,可以看出,偏差信号的特征在各个 IMF 分量上都得到了增强。signalimf1imf2imf3imf4imf5res. v/Vt / s图 2 具有偏差故障的传感器信号 EMD 分解波形图signalimf1imf2imf3imf4imf5res. t / sv/V图 3 IMF 分量和残余项经过削减后的波形图为了使提取的特征不受传感器输出信号幅值的影响,在进行 EMD 分解之前,对信号进行了标准化。具体的特征提取步骤如下:(1) 对传感器信号 进行标准化:X)(1ED其中
14、, 表示传感器输出信号序列, 为)(XE对应的均值, 为 的标准差。XX(2) 对 进行 EMD 分解,提取前 5 个 IMF 分量,以 分别表示 5 个 IMF 分量序列,以54321C,表示残余序列。6(3) 为了增强 IMF 分量的故障特征,对 IMF 分量和残余项进行了削减。a) 计算各个 IMF 分量和残余项的削减阈值:mjjiiCThr1,其中 表示 IMF 分量和残余项的长度, 表示mji,第 个 IMF 分量第 点的取值。ijb) 对各 IMF 分量和残余项进行如下削减处理,并且求取各 IMF 分量和残余项的削减比。,ijiijijiji ThrCC,0 mCNutDjijii
15、 )(,其中 为削减后的 IMF 分量和残余项,ji,为对应分量的削减比,为其被削减掉的点数与iutD其总点数之比。(4) 计算各 IMF 分量及残余项的总能量 ,并iEC且进行归一化,得到归一化能量 ,以利于模式分i类。, mjjii CdtEC122i 612|iiiiEC(5) 计算总的削减比 ,构造特征向量utD,用于传感器故, 654321 ET障诊断。61iiCutDt1.3 特征评估为了对所选特征对于故障类型的可分性进行评估,计算了特征间的距离大小来对特征敏感度进行评估,其评估原则是:同一类的类内特征距离最小,不同类的类间特征距离最大,即某一特征同一类的类内距离越小,不同类的类间
16、距离越大,则这一特征越敏感,该特征区分这些类别的能力就越强 6。特征评估的步骤如下:(1) 计算第 类第 个特征的类内距离:jiMjKinmNnnpdjijiji ,21,2,1,2,1)()(12,2, 其中 表示样本个数, 表示特征个数, 表示类别个数, 和 分别表示第 类第)(,pji )(,ji j个和第 个样本的第 个特征值。由此可计算第mn个特征值 个类的类内距离的平均值:iMMjjiidD1,(2) 计算第 类 个样本第 个特征值得平均值:jNiNnjijipq1, )(然后,可得第 个特征 个类的类间距离的平M均值:wuwuqDwiuii ,2,1)()(12, 其中 和 分别
17、表示第 个和第 个类 个uiq,i, N样本的第 个特征的平均值。(3) 计算第 个特征的评估因子:iiiiD/的大小反映了第 个特征对 个类进行分类iM的难易程度, 越大,表示第 个特征越敏感,越i i容易对 个类进行区分。M按照以上方法利用训练样本对所选取的特征进行了评估,可得对应的七个特征的评估因子为:,均大于 2,即能将,2.18,.374,4.126.37七个类别区分开。同时也对文献2中的小波包能量特征进行了评估,其对于正常和输出恒定值故障两类的类间平均距离为 0.0038,而对于正常类的类内平均距离为 0.017,对于输出恒定值故障类的类内平均距离为 0.028,所以文献2中的特征
18、不能区分正常和输出恒定值故障。本文所提特征削减比 对于CutD正常和输出恒定值故障两类的类间平均距离为0.150,对于正常类的类内平均距离为 0.013,对于输出恒定值故障类的类内平均距离为 0.057,类间平均距离大于类内平均距离之和,所以能够区分正常和输出恒定值故障,随后的实验结果也证明了这一点。2 支持向量多分类机设计支持向量机(SVM)方法由 Vapnik 等人提出 7,被看作是对传统学习分类方法的一个好的替代,特别是在小样本、非线性情况下,具有较好的泛化性能。SVM 方法建立在统计学习理论的 VC 维(Vapnik-Chervonenkis Dimension)理论和结构风险最小化原
19、理基础上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折中,以获得最好的泛化能力。作为一种新的学习分类方法,SVM 已经在故障诊断领域得到了成功的应用 4,5。关于支持向量分类机的基本原理可参考文献 7,8,9。支持向量机是针对两分类问题提出的,对于多分类问题,主要有两种解决方案,一是一次性求解法,即直接建立多分类目标函数,进行优化求解,该种方法在求解最优化问题过程中使用的变量非常多,因计算复杂度过高而不实用。二是将多分类问题转化为多个两分类问题进行求解。该种方案主要包括一类对余类法,成对分类法,纠错输出编码方法和层次 SVM 多类分类法 10,11。前三种方法都需要构造较多的 SVM
20、 两分类机,并且存在不可识别域,因此本文针对传感器故障诊断问题设计了层次支持向量机多类分类机。本文所研究的传感器状态包括正常,偏差,冲击,周期性干扰,噪声干扰,漂移和输出恒定值七种,所以需要建立了六个支持向量两类分类机(SVM1-SVM6),利用 k-均值聚类算法,确定了层次多分类支持向量机的拓扑结构如图 4 所示。其中,SVM1 为偏差与漂移对对其它类分类机,SVM2 为偏差对漂移分类机,SVM3 为冲击与周期干扰对剩余其他类分类机,SVM4 为冲击对周期干扰分类机,SVM5 为正常与输出恒定对噪声干扰分类机,SVM6为正常对输出恒定分类机。将六个两类分类机按照图 4 所示的形式组合,便成为
21、 1 个可以分离七种状态的多分类机。该种多类分类机不存在不可识别域,分类时也不需要遍历所有的两分类机,具有较高的分类效率。S V M 1g ( x ) = + 1 ?输入特征向量S V M 3g ( x ) = + 1 ?S V M 5g ( x ) = + 1 ?S V M 4g ( x ) = + 1 ?冲击 周期干扰YN N NY NYY噪声干扰S V M 2g ( x ) = + 1 ?偏差 漂移YNS V M 6g ( x ) = + 1 ?正常 输出恒定Y N图 4 支持向量多故障分类机3 应用实例与分析基于 EMD 和 SVM 的传感器故障诊断方法框图如图 5 所示,首先将原始信
22、号标准化,然后采用EMD 方法对标准化后的信号进行分解,对每一个IMF 分量和残余项进行削减,计算削减后各个分量的归一化能量和总的削减比组成特征向量,最后利用设计的支持向量多分类机对传感器故障类型进行识别。输 入 原始 信 号标 准化E M D分 解各 分 量削 减提 取特 征支 持 向 量多 分 类 机故 障识 别图 5 基于 EMD 和 SVM 的传感器故障诊断流程图本文以对所设计的自确认压力传感器的七种状态进行识别为例来对提出的算法进行验证。得到了压力传感器在七种状态下的各 50 组数据,按照 1.2节中的步骤提取特征向量,随机选取七种状态下的数据各 30 组对所建立的支持向量多分类机进
23、行训练,表 1 给出的是七种状态下传感器输出信号的各一个特征向量。表 1 传感器各种状态下的特征向量传感器状态 特征向量正常 0.518,0.368,0.499,0.414,0.292,0.288,0.676偏差 0.079,0.064,0.085,0.090,0.100,0.981,0.764冲击 0.365,0.308,0.470,0.439,0.381,0.434,0.824漂移 0.008,0.006,0.007,0.007,0.009,0.999,0.736周期干扰 0.328,0.550,0.658,0.272,0.184,0.173,0.700噪声干扰 0.729,0.457,0
24、.338,0.257,0.189,0.197,0.764输出恒定 0.526,0.369,0.491,0.413,0.290,0.285,0.757对余下的七种状态各 20 组数据输入到由七个支持向量机组成的多分类机中进行故障模式识别,结果表明,可以准确地区分出七种传感器故障状态,验证了该方法的有效性。为了比较本文所提取特征与文献2中所提取特征的分类性能,对七种状态下各 50 组数据进行了 3层小波包分解,提取了 8 个能量特征,然后利用七种状态下各 10 组对支持向量多分类机进行训练,利用余下的各 40 组进行验证,与本文方法的比较结果如表 2 所示。表 2 不同特征分类结果比较分类结果特征
25、提取方法 训练样本 测试样本正常 偏差 冲击 漂移 周期干扰 噪声干扰 输出恒定本文方法 各 10 组 各 40 组 40 40 39 39 40 39 39文献2方法 各 10 组 各 40 组 32 40 37 38 40 38 19比较结果可以看出,文献2所提出的小波包能量特征不能区分正常与输出恒定两种传感器状态,而本文提出的特征可以区分,这与 1.3 节中,特征评估给出的结果相同。为了比较支持向量机与 RBF 神经网络的收敛速度和分类性能,取相同的 30 组训练样本对两种分类器进行训练,然后对剩下的 20 组测试样本进行检验,结果如表 3 所示。所给结果是在奔腾 2.0GHz 处理器上
26、,Matlab 编程实现的环境下给出的。结果表明,在训练样本较多的情况下,支持向量机和 RBF 神经网络对故障类别的识别率相当,但支持向量机与RBF 神经网络相比,收敛速度较快。表 3 支持向量机与 RBF 网络分类性能比较分类结果分类方法 训练样本 测试样本 训练时间正常 偏差 冲击 漂移 周期干扰 噪声干扰 输出恒定SVM 多分类机 各 30 组 各 20 组 0.47 s 20 20 20 20 20 20 20RBF 网络 各 30 组 各 20 组 2.53 s 19 20 19 20 20 20 19为了说明支持向量机更加适应小样本分类情况,取相同的 10 组训练样本对两种分类器进
27、行训练,然后对剩下的 40 组测试样本进行分类,结果如表 4 所示。结果表明,当训练样本减少时,RBF 网络分类性能急剧下降,而支持向量机仍然能够对测试样本具有较高的识别率,这也验证了支持向量机在小样本情况下仍然具有良好的预测和推广能力。表 4 小样本情况下支持向量机与 RBF 网络分类性能比较分类结果分类方法 训练样本 测试样本 训练时间正常 偏差 冲击 漂移 周期干扰 噪声干扰 输出恒定SVM 多分类机 各 10 组 各 40 组 0.16 s 40 40 39 39 40 39 39RBF 网络 各 10 组 各 40 组 0.52 s 22 22 26 39 38 22 154 结论1
28、)对传感器输出信号进行 EMD 分解,分解出的各个 IMF 分量突出了信号的局部特征,通过对各IMF 分量和残余项进行削减,进一步增强了传感器输出信号的故障特征,本文在此基础上计算各 IMF分量和残余项的归一化能量和削减比作为特征向量,用于传感器状态识别。特征评估的结果表明,所提取的特征对于所研究的七种传感器状态具有很好的可分性。2)设计了支持向量多分类机对七种传感器状态进行识别,将所设计方法应用于自确认压力传感器的故障诊断中,对本文所设计的特征提取方法与小波包分解特征提取方法进行了比较,结果表明基于EMD 分解的特征提取方法在传感器故障状态识别中是有效的、实用的。3)对支持向量机与 RBF
29、网络的分类性能进行了比较,结果表明,支持向量机与神经网络相比,具有训练时间短和鲁棒性强等优点,并且能有效的解决故障诊断中少样本问题。参考文献:1 ZHANG Jian Qiu,YAN Yong. A wavelet-based approach to abrupt fault detection and diagnosis of sensorJ. IEEE Transactions on Instrumentation and Measurement. 2001, 50(5): 1389-1396.2 徐涛,王祁. 基于小波包神经网络的传感器故障诊断方法J.传感技术学报. 2006,19(4)
30、: 1060-1064.3 HUANG N E, ZHEN Shen, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysisJ. Proc. R. Soc. Lond. A. 1998, 454: 903-995.4 PENG Zhi Ke, PETER W.T. A comparison study of improvedHilbertHuang transform and wavelet
31、transform:Application to fault diagnosis for rolling bearing J. Mechanical Systems and Signal Processing. 2005,19(5): 974-988.5 程军圣,于德介,杨宇. 基于内禀模态奇异值分解和支持向量机的故障诊断方法. 自动化学报J. 2006, 32(3): 476-480.6 雷亚国,何正嘉,訾艳阳,湖桥. 基于特征评估和神经网络的机械故障诊断模型J. 西安交通大学学报. 2006,40(6): 558-562.7 VAPNIK V. The nature of statisti
32、cs learning theoryM. New York: Springer Verlag, 1995: 20-60.8 ZAHO Qun, PRINCIPE J C. Support vector machines for SAR automatic target recognitionJ. IEEE Transactions on Aerospace and Electronic Systems. 2001, 37(2): 643-654.9 GENTON M G. Classes of Kernels for Machine Learning: a Statistics Perspec
33、tiveJ. Journal of Machine Learning Research. 2001,2: 299-312.10 宋乃华,邢清华. 基于支持向量机的空中目标大类别分类J. 系统工程与电子技术. 2006, 28(8): 1279-1281.11 赵晖,荣莉莉,李晓. 一种设计层次支持向量机多类分类器的新方法J. 计算机应用研究. 2006,6: 34-37.需要说明的是:(1)摘要的撰写:摘要内容(200 字左右) ,杜绝背景信息,直奔目的、方法、结果、 结论。 (小五仿宋)目的研究、研制、调查等的前提、目的和任务,所涉及的主 题范围。方法所用的原理、理论、条件、对象、材料、工艺、结构、手段、装备、程序等。结果实验的、研究的结果、数据,被确定的关系, 观察结果,得到的效果、性能等。结论结果的分析、研究、比较、 评价、 应用,提出的问题等。(2)篇幅:全文(计空格、图表占位)一般不超过6000 汉字。