1、基于变分模态分解和排列熵的滚动轴承故障诊断 郑小霞 周国旺 任浩翰 符杨 上海电力学院自动化工程学院 上海东海风力发电有限公司 摘 要: 滚动轴承早期故障信号特征微弱且难以提取, 为了从轴承振动信号中提取特征参数用于轴承故障诊断和识别, 提出基于变分模态分解 (Variational Mode Decomposition, VMD) 和排列熵 (Permutation Entropy, PE) 的信号特征提取方法, 并采用支持向量机 (Support Vector Machine, SVM) 进行故障识别。对轴承振动信号进行变分模态分解, 得到不同尺度的本征模态函数;计算各本征模态函数的排列熵
2、, 组成多尺度的复杂性度量特征向量;将高维特征向量输入基于支持向量基建立的分类器进行故障识别分类。通过滚动轴承实验数据分析了算法中参数选取问题, 将该方法应用于滚动轴承实验数据, 并与集合经验模态分解和小波包分解进行对比, 分析结果表明, 基于变分模态分解和排列熵的诊断方法有更高的诊断准确率, 能够有效实现滚动轴承的故障诊断。关键词: 变分模态分解; 排列熵; 支持向量机; 滚动轴承; 故障诊断; 作者简介:郑小霞, 女, 博士, 副教授, 1978 年生收稿日期:2016-03-21基金:国家自然科学基金 (51507098) A rolling bearing fault diagnosi
3、s method based on variational mode decomposition and permutation entropyZHENG Xiaoxia ZHOU Guowang REN Haohan FU Yang School of Automation Engineering, Shanghai University of Electric Power; Shanghai Donghai Wind Power Co., Ltd.; Abstract: The incipient fault characteristic of rolling bearing vibrat
4、ion signals is weak and difficult to extract. In order to extract the characteristic parameters from a bearing vibration signal for bearing fault diagnosis, a signal characteristics extraction method based on the variational mode decomposition and permutation entropy was proposed. The support vector
5、 machine was used for fault recognition. Firstly, the bearing vibration signal was decomposed by the variational mode decomposition, and the intrinsic mode functions were obtained in different scales. Secondly, the permutation entropy of each intrinsic mode function was calculated and used to compos
6、e the multiscale feature vector.Finally, the high-dimensional feature vector was input to the support vector machine for bearing fault diagnosis. The comparison is made with EEMD and WPD ( wavelet packet decomposition) . The experimental results show that the proposed method can be used to diagnose
7、bearing faults effectively.Keyword: variational mode decomposition; permutation entropy; support vector machine; rolling bearing; fault diagnosis; Received: 2016-03-21滚动轴承是机械设备中广泛应用的零部件, 其运行状态好坏将直接影响设备的生产效率和安全。在机械设备实际运行中, 若不能及时发现滚动轴承早期故障, 其故障产生的冲击会加速滚动轴承的损坏, 最终导致滚动轴承失效, 对机械正常运行带来严重影响。因此, 对滚动轴承运行状态监测
8、与诊断, 尤其是滚动轴承早期故障诊断具有十分重要的意义1。变分模态分解 (Variational Mode Decomposition, VMD) 是由Dragomiretskiy 等2提出的一种自适应信号处理方法, 通过迭代搜寻变分模态的最优解, 不断更新各模态函数及中心频率, 得到若干具有一定带宽的模态函数。与经验模态分解 (Empirical Mode Decomposition, EMD) 3递归筛选方法不同, VMD 通过求解变分模态最优解实现模态分解, 有坚实的理论基础;并且与小波变换不同, 不用选取基函数;VMD 实质是多个自适应维纳滤波器组, 对噪声有较好的鲁棒性;在信号分离方
9、面, VMD 能成功分离两个频率相近的纯谐波信号。已有学者将 VMD 法应用到了机械故障诊断领域, Wang 等4研究了 VMD的等效波器组效应, 并将其应用到转子系统碰摩故障检测, 通过仿真信号和实际燃气轮机振动信号分析表明了 VMD 方法能更好的提取信号的特征信息;唐贵基等5通过参数优化的变分模态分解对振动信号进行分解, 得到若干本征模态函数分量, 对各分量包络谱分析实现了滚动轴承故障的有效判别。Christoph 等6提出的排列熵 (Permutation Entropy, PE) 算法是一种检测时间序列随机性和动力学突变的方法, 它具有计算简单、抗噪声能力强等特点。而振动信号往往具有非
10、线性、非平稳性特征, 已有学者将排列熵用于机械振动信号突变检测并取得较好效果。刘永斌等7研究了不同工作状态下轴承振动信号的排列熵, 结果表明排列熵可以有效地检测出机械设备状态变化。由于机械系统振动信号中包含丰富的特征信息, 仅在单一尺度上很难提取到微弱的故障特征信息, 有必要对振动信号进行多尺度分析8。排列熵与其他算法相结合对信号进行多尺度分析成为研究的热点, 如与小波变换9、集合经验模态分解10结合对滚动轴承进行故障诊断分析。由于轴承早期故障特征信息微弱, 仅检测原始信号的动力学突变不能全面反映信号各模态的细节特征。针对滚动轴承故障振动信号特征的特点, 将变分模态分解与排列熵信息测度相结合应
11、用于滚动轴承故障信号特征提取。将原始振动信号用 VMD 方法分解得到若干本征模态函数, 提取各模态分量的排列熵, 可以更好的反应信号在不同尺度上的细节复杂度特征。并采用支持向量机 (Support Vector Machine, SVM) 进行故障状态识别, 从而实现滚动轴承故障类别的诊断。该方法集合了 VMD 算法在信号分解方面的优势和排列熵检测复杂系统动力突变的特点, 并将其应用于轴承实验数据, 结果表明, 提出的方法能够有效的区分滚动轴承故障类型, 是一种有效的故障诊断方法。1 VMD 原理VMD 是一种比 EMD 和 LMD (Local Mean Decomposition) 有更好
12、时频分布的信号分解估计方法, 其整体框架是变分问题, 根据预设模态分量个数对信号进行分解。将原始信号 f (x) 分解为 K 个中心频率为 k模态函数 uk, 其中 K 为预设模态分量个数。VMD 算法中, 重新定义本征模态函数 (Intrinsic Mode Function, IMF) 为一个调幅-调频信号式中:相位 k (t) 为非递减函数, k (t) 0;包络线非负, A k (t) 0;并且包络 Ak (t) 和瞬时频率 k (t) = k (t) 对于相位 k (t) 来说是缓变的。为了得到具有一定带宽频率的 K 个模态分量, 首先对每个模态函数 uk, 通过Hilbert 变换
13、得到边际谱;然后对各模态解析信号混合一预估中心频率, 将每个模态的频谱调制到相应的基频带;再计算解析信号梯度的平方 L 范数, 估计出各模态信号带宽, 受约束的变分问题为式中:u k=u1, u2, , uK为分解得到的 K 个模态分量; k= 1, 2, , K为各分量的频率中心; (t) 为脉冲函数。为求取上述约束变分问题的最优解, 引入二次惩罚因子和拉格朗日乘法算子, 并采用了乘法算子交替方向法 ADMM (Alternate Direction Method of Multipliers) 解决以上变分问题, 通过交替更新 uk、 k和 寻求扩展拉格朗日表达式的鞍点。模态函数 uk的取
14、值问题可表达为式中: 为惩罚参数; 为 Lagrange 乘子。利用 Parseval/Plancherel 傅里叶等距变换, 将式 (2) 转变到频域经进一步转换可以得到二次优化问题的解为式中, k为当前模态函数功率谱的重心, 从式 (5) 可知, 维纳滤波器被嵌入了 VMD 算法中, 算法有更好的噪声鲁棒性。对于中心频率 k的取值问题可表达为根据同样的过程, 首先将中心频率的取值问题转换到频域中心频率二次优化问题的解为VMD 算法步骤如下:步骤 1 初始化 和 n;步骤 2 根据式 (5) 和式 (8) 更新 uk和 k;步骤 3 更新 步骤 4 重复步骤 2 和步骤 3, 直到满足迭代停
15、止条件 , 结束循环, 输出结果, 得到个模态分量。2 排列熵原理熵是源于物理学的概念, 是对系统内部紊乱程度的度量, 熵值越大, 表明系统越复杂。排列熵是一种衡量一维时间序列复杂度的平均熵参数, 它与 Lya Punov 指数、分形维数等复杂度参数相比, 具有计算简单、抗噪声能力强、计算值稳定等优点11-12。排列熵算法原理如下:对于一个时间序列X (i) , i=1, 2, , N进行相空间重构, 得到矩阵式中:m 为嵌入维数; 为延迟时间;G 为重构相空间中重构向量个数, G=N- (m-1) 。矩阵中的每一行可看作一个重构分量, 共有 G 个重构分量。将重构矩阵中的第 j 重构分量x
16、(j) , x (j+) , , x (j+ (m-1) ) 按照升序重新排列, 即式中, j 1, j2, , jm为重构分量中各元素所在列的索引。如果重构分量中存在相等的值, 如 x (i+ (jp-1) ) =x (i+ (j q-1) ) , 则按照 jp和 jq原来的顺序, 即当 jpjq时, 有 x (i+ (jp-1) ) x (i+ (j q-1) ) 。所以对于重构相空间中的任意一个重构向量 X (j) 都可以得到一个反映其元素大小顺序的符号序列 S (l) =j1, j2, , jm, 其中 l=1, 2, , g, 且 gm!。m 维相空间映射不同符号序列j 1, j2,
17、 , jm共有 m!个, S (l) 是其中的一种排列形式。构造序列 P1, P2, , Pg, Pg为第 g 种符号序列出现的概率大小。对于一个时间序列X (i) , i=1, 2, , N的 g 个重构向量对应的符号序列的排列熵 (PE) , 可以按照 Shannon 熵的形式定义为当 Pl=1/m!时, PE (m) 达到最大值 ln (m!) 。通常情况下, 可通过 ln (m!) 将 Hp (m) 标准化, 即式中, PE 的取值范围为 0PE1。PE 值的大小表示时间序列X (i) , i=1, 2, , N的复杂和随机程度:PE 值越大, 时间序列越接近随机;PE 值越小, 时间
18、序列越规则。3 基于 SVM 的轴承故障诊断SVM 是在统计学理论基础上发展起来的一种通用机器学习方法13。SVM 法实质是寻找一个最优分类超平面, 使得从这个超平面到两类样本集的距离之和最大。SVM 本身是一个二类问题判别方法, 对于多类问题需要对二分类问题进行转换。文中采用“一对多”的方法14对实现 SVM 多分类问题的转换。其基本思想是对于 n 个类别的分类问题需要构造个 n 两分类机, 其中第 i 个分类机能把第 i类同余下的各类划分开。本文结合 VMD 对信号分解的优点和排列熵能检测时间序列随机性和动力学突变特点, 提出基于 SVM 的滚动轴承故障识别方法。首先将原始振动信号进行 V
19、MD分解, 得到若干个本征模态分量, 再计算各模态分量的排列熵, 最后将排列熵值作为特征向量输入支持向量机分类器进行故障分类识别。基于变分模态分解和排列熵的滚动轴承故障诊断流程图, 如图 1 所示。具体步骤如下:步骤 1 在滚动轴承正常状态、内圈故障、外圈故障、滚动体故障状态下, 按照一定的采样频率分别进行重采样, 得到各状态下的振动数据样本。步骤 2 对轴承四种状态下的振动信号数据进行 VMD 分解, 得到各状态下的不同尺度模态分量。步骤 3 计算各尺度模态分量复杂度特征的排列熵测度 PEi (i=1, 2, , K) , 并构建高维特征向量步骤 4 将得到的高维特征向量输入 SVM 进行训
20、练, 得到每一类型故障的 SVM 预测模型。步骤 5 采集测试信号, 按照步骤 1、步骤 2、步骤 3 构建测试样本高维特征向量, 分别输入训练好的 4 个 SVM 预测模型, 通过 SVM 分类器的输出结果来确定轴承的故障类型和工作状态。图 1 滚动轴承故障诊断流程图 Fig.1 Flow chart of rolling bearing fault diagnosis 下载原图4 算法关键参数选取及实验分析为了验证变分模态分解和排列熵方法的有效性, 采用美国凯斯西储大学电气工程实验室的滚动轴承数据进行实验数据分析。选用的滚动轴承为 6205-2RS JEM SKF 型深沟球轴承, 振动数据
21、采样频率为 12 k Hz、电机负载为 1 HP。试验用电火花加工技术在轴承上布置单点故障, 故障点的直径为 0.177 8 mm, 故障深度为 0.279 4 mm。采集正常状态、内圈单点电蚀、外圈单点电蚀、和滚动体单点电蚀四种状态的振动信号。4.1 模态个数确定用 VMD 算法进行信号分解时, 需要首先确定模态个数 K, 不同的分解个数对分解的结果会产生影响, 从而影响最终的诊断。模态分解个数较少时, 由于 VMD算法相当于自适应维纳滤波器组, 原始信号中一些重要信息将会被滤掉丢失;信号的分解个数较多时, 相邻模态分量的频率中心则会相距较近, 产生频率混叠。选用滚动体单点电蚀故障信号进行
22、VMD 分解, 不同 K 值下的中心频率如表 1 所示。从表中可以看出, 在模态分量个数为 5 时, 中心频率 3 213 Hz 和 3 415 Hz 相距较近, 可能会出现模态混叠, 模态个数选为 4 较适宜。表 1 不同 K 值对应的中心频率 Tab.1 Center frequency corresponding to different K 下载原表 4.2 惩罚参数的选取VMD 算法中惩罚参数对分解结果也有较大影响, 研究发现:惩罚参数 越小, 得到的各 IMF 分量带宽越大, 反之, 越大各分量带宽越小。本文引入信噪比概念, 用来分析惩罚参数对 VMD 算法分解结果的影响。信噪比指
23、原始信号能量与噪声能量的比值, 记为 SNR式中:f (i) 为原始信号; 为分解后重构信号。从式 (15) 中可知, 信噪比大小也可以反映原始信号与重构信号的关系。信噪比越大, 分解后重构信号越能真实的还原原始信号, 信噪比越小, 分解后重构信号滤除的被认为是噪声的成分越多。对轴承振动信号做不同征罚参数的 VMD 分解, 并计算其信噪比值, 如图 2 所示。从图 2 可知, 信号的信噪比随着惩罚参数 的增大而减小, 并趋于平稳。信噪比的变化与各模态分量带宽范围随 的改变相一致。从信号分解的角度来说, 重构后的信号能真实的还原原始信号, 这就要求选取较大的信噪比。从信号滤波角度来说, 希望分解
24、算法有一定的噪声鲁棒性, 对信号分角重构后能滤除噪声, 此时又要求信噪比不能过大。通过对大量轴承振动信号测试分析, 本文选取惩罚参数 =2 000, 以保证 VMD 分解过程中的去噪能力和细节保留度。对轴承振动信号的分解结果如图 3 所示。图 2 不同惩罚参数下振动信号信噪比 Fig.2 The SNR of vibration signal with different penalty parameter 下载原图图 3 轴承振信号 VMD 分解结果 Fig.3 VMD decomposition results of the rolling bearing vibration signal
25、 下载原图4.3 排列熵参数的选取在排列熵的计算中, 需要考虑和设定 3 个参数值, 即时间序列长度 N, 嵌入维数 m 和时延 , 不同参数的选取对熵值的计算结果会产生影响。为了研究时延 对排列熵计算数值的影响, 以长度为 1 024 的轴承振动信号为例, 在不同 下的排列熵值随嵌入维数的变化关系, 如图 4 所示。由图 4 可知, 当时延 在 16 变化时, 信号的排列熵数值变化很小, 时延 对排列熵值影响较小, 论文中计算排列熵时取 =1。Christoph 等建议, 嵌入维数 m 的取值为 37。因为, 如果 m=1 或 m=2 时, 重构向量状态个数较少, 不能精确检测信号动力学突变
26、;当 m 取值过大, 相空间的重构将会均匀化时间序列, 这时排列熵的计算量增大并且不宜反映时序列的微小变化。Cao 等15研究指出当嵌入维数 m=5, m=6 或 m=7 时, 排列熵的值能够很好的表征时间序列的动态特性。论文中, 选取嵌入维数 m=6。图 4 振动信号在不同时延下的排列熵 Fig.4 The PE of vibration signal with different time delays 下载原图图 4 为在时延 =1 时, 不同数据长度的振动信号在不同嵌入维数下的排列熵值, 振动信号的数据长度分别为 256, 512, 1 024, 2 048 和 4 096。从图 5
27、可知, 在嵌入维数 m5 时, 除了数据长度为 256 时的排列熵外, 其他数据长度的排列熵值随嵌入维数的增加变化较小, 排列熵值也十分接近。当嵌入维数 m=6 时, 其不同长度的振动信号排列熵及其差值, 如表 2 所示。从表 2 可知, 随信号长度的增加, 其排列熵差值减小, 排列熵值在数据长度大于 1 024 时趋于稳定, 选择数据长度为 2 048 较为合适。图 5 不同长度的振动信号的排列熵 Fig.5 The PE of vibration signal with different lengths 下载原图表 2 不同长度的振动信号排列熵及其差值 Tab.2 The PE and
28、PE differences of vibration signal with different lengths 下载原表 4.4 轴承故障诊断对正常、内圈故障、外圈故障、滚动体故障四种状态轴承的振动信号, 每种状态取 40 组数据, 数据样本长度为 2 048, 共 160 组数据。从每种状态样本数据中随机抽取 25%的数据, 即 10 组数据作为训练样本, 将剩下的正常、内圈故障、外圈故障、滚动体故障四种状态轴承振动信号各 30 组数据作为测试样本。对训练样本数据进行 VMD 分解, 每个训练样本得到的 4 个模态分量提取排列熵, 共可得到 404 个排列熵值。将每个训练样本得到的 4
29、个排列熵组成一个特征向量, 得到 40 个特征向量的平均值如图 6 所示。将 40 个特征向量作为输入量, 输入 SVM 分类器进行训练。构造 4 个两分类 SVM, 依次取每种状态下的排列熵特征向量作为正类, 剩余三种状态的排列熵特征向量作为负类, 输入 SVM 分类器进行训练, 得到 4 个训练好的 SMV 预测模型。图 6 特征向量排列熵值 Fig.6 The PE of the feature vectors 下载原图将四种状态轴承振动信号测试样本共 120 组用训练好的 SVM 分类器进行分类, 识别准确率达 97.5%, 其分类结果如表 3 所示。从表 3 可知, 有一个内圈故障被
30、诊断为滚动体故障, 两个外圈故障被诊断为内圈故障, 但对于正常状态和滚动体故障状态的识别准确率为 100%。由于美国凯斯西储大学滚动轴承信号为实验室环境采集的较为规整信号, 而实际工况中轴承振动信号中含有很强的噪声。本文通过对轴承振动信号加入高斯白噪声, 研究所提出方法对噪声的鲁棒性。对四种状态轴承振动信号分别添加信噪比为 6 d B 的高斯白噪声, 再用本文所提出的方法对信号进行分解和特征提取, 对轴承状态进行识别, 其结果如表 4 所示。由于噪声的影响, 内圈故障识别率较低, 有 6 个样本被识别为外圈故障。但其他状态的正确率为 100%, 平均识别正确率也能达到 95%, 说明所提出的方
31、法对噪声有一定的鲁棒性。为了研究采用不同比例训练样本时, 对滚动轴承运行状态分类识别结果的影响, 选取上述美国凯斯西储大学滚动轴承四种状态下振动数据共 160 组, 在正常状态、内圈故障、外圈故障和滚动体故障样本数据中随机抽取20%、30%、40%、50%、60%的数据作为训练样本数据, 将剩下的样本数据作为测试样本。表 5 为不同训练样本下的分类结果, 可以看出当训练数据为样本数据的 50%时, 所提出方法的诊断正确率可达到 100%。当训练样本增大时, 建立的分类模型较准确, 识别度较高, 但会增加算法的计算量。为了对比 VMD 的分解在故障诊断方法中的作用, 对上述滚动轴承四种类型振动信
32、号采用集合经验模态 (Ensemble EMD, EEMD) 和小波包进行分解。振动信号数据源选取和特征提取方法与本文所用处理过程相同。为了方便比较, 对于EEMD 分解得到的模态分量选取包含主要信息的前 4 个模态分量, 小波包分解采用两层分解得到 4 组小波系数。计算分解得到的各分量和排列熵, 并组成特征向量。将特征向量输入 SVM 进行训练和测试, 其结果如表 6 和表 7 所示。表 3 基于 VMD 和排列熵的滚动轴承故障识别结果 Tab.3 Classification results of the rolling bearing fault based on VMD and PE 下载原表