1、基于 TSVM 的矿用钻机变速箱故障智能诊断 申中杰 中煤科工集团西安研究院有限公司 摘 要: 为解决矿用钻机变速箱因典型案例少而故障诊断困难的问题, 提出一种基于多分类直推式支持向量机 (TSVM) 的智能诊断方法。通过经验模式分解提取变速箱振动信号中的微弱故障信息, 随后计算时域和频域统计特征, 选取敏感特征作为输入, 最后输入 TSVM 模型中自动识别钻机变速箱故障类型。即使在未知状态样本数目是已知故障样本数目 50 倍的极端条件下, 该智能诊断方法的分类准确率仍能达到 91.62%5.31%。实验结果表明, 基于 TSVM 智能诊断方法能较好识别钻机变速箱故障, 具有较强的工程使用价值
2、和通用性。关键词: 直推式支持向量机; 经验模式分解; 智能诊断; 钻机变速箱; 作者简介:申中杰 (1985-) , 山东菏泽人, 博士, 助理研究员, 2012 年毕业于西安交通大学机械工程专业, 中煤科工集团西安研究院有限公司任职, 从事钻机故障诊断及电气化改造, 电子信箱:.收稿日期:2017-06-20基金:“十三五”国家科技重大专项项目 (2016ZX05045003-002) Intelligent Fault Diagnosis of Transmission for Mine Drilling Rig Based on TSVMSHEN Zhong-jie Xian Rese
3、arch Institute Co., Ltd., China Coal Technology and Engineering Group; Abstract: How to diagnose the faults occurring in transmission of mine drilling rig becomes a troublesome problem in case of insufficient labeled samples or excess unlabeled samples. Presents a novel model for the transmission fa
4、ult diagnosis based on multiclass transductive support vector machine (TSVM) .Firstly, the weak fault information is extracted by Empirical Mode Decomposition. Then the time-domian and frequency-domain statistical characteristics are calculated and sensitive features are selected as input. Finally,
5、TSVM is used to diagnose the transmission fault intelligently. Even though the number of unlabeled samples is 50 times as that of labeled samples, the testing accuracy of the novel diagnosis method based on TSVM can reach at 91.62%5.31%, which validates that the proposed method has the practical val
6、ues and generality.Keyword: transductive support vector machine; empirical mode decomposition; intelligent diagnosis; drilling rig transmission; Received: 2017-06-200 引言在故障诊断中, 获取足够的典型故障样本是一件非常困难的问题。以 ZDY 系列钻机变速箱为例, 因其井下工作环境恶劣, 受力情况复杂, 变速箱极易损坏。由于钻机变速箱的零部件多, 且一直在煤矿井下工作, 监测数据很难获取, 典型的故障样本更是匮乏。因此针对钻机变速
7、箱故障诊断, 需要开发一种仅需要少量的典型故障样本便能识别大量未知状态样本故障类型的智能诊断方法。支持向量机 (SVM) 是由 Vapnik 等人提出的专门处理小样本条件下分类问题的新型机器学习方法。它通过训练样本集寻找最优分类面从而将测试样本最大间隔分离。SVM 在测试样本集和训练样本集样本分布相似、数目接近的条件下性能卓越, 但利用少量的已知故障样本识别大量的未知状态样本时会显得力不从心。而 SVM 只通过学习训练样本构造最优分类面, 不考虑测试样本集的样本分布信息。直推式支持向量机 (TSVM) 是支持向量机与直推式学习理论的有效结合, 可以实现将未知状态数据的样本分布信息引入到分类器的
8、学习中, 从而改进其分类性能。TSVM 的特色是同时训练少量的已知故障样本和大量的未知状态样本, 在混合学习的过程中, 将测试样本集的样本分布信息转移到最终的分类器中, 实现分类准确率的大幅提升。1 直推式支持向量机给定一组独立同分布已知标签样本集另一组与已知标签样本服从同一分布的未知标签样本集TSVM 要寻找合适的分类结果 y1, y2, L, yM, 使得不等式成立, 且目标函数最小。直推式学习的关键是设计一定的启发式规则来实现未知标签样本中样本分布信息的转移。TSVM 算法的训练过程即为求解式 (4) , 分为以下几步进行:(1) 给定惩罚因子 C 和 C, 并利用归纳式学习对已知标签样
9、本进行初始学习, 得到一个初始的分类器;同时按照规则设定一个未知标签样本集中正标签样本数N;(2) 利用初始分类器对未知标签样本进行分类, 计算每个未知标签样本的判别函数输出, 并对输出值中最大的 N 个未知标签样本暂时标识为正标签值, 其余的标识为负标签值;同时设定一个临时惩罚因子 Ctemp;(3) 对所有样本再次训练, 得到新的分类器;检验所有测试样本的标签, 当满足下面条件时交换 2 个样本标签, 即式中 m赋予正标签样本的松弛因子, m0; l赋予负标签样本的松弛因子, l0。交换标签可使优化问题公式中目标函数值最大程度地下降。反复执行交换步骤, 直至符合交换条件的样本对找不出为止;
10、(4) 增加临时惩罚因子 Ctemp, 返回步骤 (3) 训练;当 CtempC 时, 算法结束, 输出最终结果。步骤 (3) 中标签交换保证了交换后的解强于交换前的解。步骤 (4) 中临时惩罚因子由小到大逐步增加, 从试图逐渐增加未知标签样本对算法的影响的角度追求尽可能小的未知标签样本分类误差。由于步骤 (1) 中 C 是事先定好的有限数, 根据步骤 (4) 的结束准则可知, 算法在有限次执行之后结束, 输出其最终结果。2 基于 TSVM 的智能诊断模型针对钻机变速箱典型故障样本匮乏的问题, 鉴于 TSVM 不受样本比例影响的优良特性, 提出一种基于 TSVM 的智能诊断模型, 如图 1 所
11、示。该模型不以准确提取齿轮啮合频率为故障特征, 而是利用经验模式分解处理齿轮振动信号, 计算每个基本模式分量 (IMF) 的时域、频域统计特征, 然后利用距离评估技术从基本模式分量的时域、频域特征中选取对故障敏感的特征, 利用直推式支持向量机训练敏感特征自动识别和诊断变速箱故障。图 1 基于 TSVM 智能诊断模型 下载原图3 实验验证(1) 变速箱实验变速箱故障模拟实验台如图 2 所示, 它由直流电机、负载电机、直流调速加载系统、齿轮箱减速器等部分构成。齿轮箱减速器分两级齿轮传动, 包含 7 个齿轮。齿轮分为正常、偏心、点蚀和剥落 4 种状态。图 2 变速箱试验台结构示意图 下载原图1.直流
12、电机 2.齿轮箱 3.正常的滑动齿轮 4.一级齿轮传动 5.负载电机 6.正常的滑动齿轮 7.二级齿轮传动试验时电机转速为 1 000 r/min, 采样频率为 6.4 k Hz, 数据记录时间为 3 min, 测点布置在 2 轴的轴承座上。数据记录为 sony EX 采集器, 可实现低通滤波。现对记录数据进行截取分段, 连续的 6400 个点 (1 s 的记录数据) 组成 1个样本。每种状态下可截取 153 个样本, 其中 3 个用作训练样本, 另外 150 个作为测试样本。(2) 结果分析为检验基于 TSVM 的智能诊断模型的有效性, 将按照四类样本集-全部原始特征集、全部 IMF 特征集
13、、敏感原始特征集、敏感 IMF 特征集进行 3 组对比试验。为减小由训练样本选取带来的测试精度的随机性, 拟采用蒙特卡洛抽样法则多次选取训练样本, 多次计算、然后求取平均值与方差作为最终的诊断结论。随机选取训练样本 20 次, 分别计算其测试精度, 以 20 个测试精度的平均值和方差作为最终的分类结果。其中, 测试精度为分类正确的样本数目与测试集中全部样本数目之比。(1) 全部原始特征集计算 4 种变速箱状态的振动信号时域统计特征和频域统计特征, 输入到 SVM 和TSVM 中, 结果如表 1 和图 3 所示。在表 1 中, n、e、p、s 分别表示正常、偏心、点蚀和剥落 4 种状态下的测试样
14、本数目。对比表 1 和图 3 中的各组数据, 可以看出:测试精度随样本增多而减小。“n=5;e=5;p=5;s=5”、“n=50;e=50;p=50;s=50”和“n=150;e=150;p=150;s=150”之间的结果对比说明了这一规律。其次, 测试精度还与样本分布有关, 当某一种或几种容易被区分的样本在整个样本集中所占比例较大时, 测试精度也较高。“n=50;e=5;p=5;s=5”和“n=50;e=30;p=15;s=5”中, 当正常状态样本和偏心状态样本所占比例增多时, 测试精度较高。然而, 无论何种比例的测试样本集, TSVM 的测试精度总是优于标准 SVM。图 3 全部原始特征集
15、测试精度均值 下载原图1.原始特征 SVM 2.原始特征 TSVM表 1 全部原始特征诊断结果对比 下载原表 (2) 全部 IMFs 特征集对变速箱振动信号进行 4 层经验模式分解, 并计算每个基本模式分量的时域统计特征和频域统计特征, 输入 SVM 和 TSVM 中进行分类, 结果如图 4 和表 2 所示。可以看出:TSVM 的优秀模式识别能力再次被证明。与表 1 和图 3 相比, 全部 IMF特征的测试精度明显高于全部原始特征测试精度。结果表明经验模式分解可以有效处理非平稳、非线性信号, 有效提取信号中微弱的故障特征。基于经验模式分解的特征提取来提高诊断精度。图 4 全部 IMFs 集测试
16、精度均值 下载原图1.IMF 特征 SVM 2.IMF 特征 TSVM表 2 全部 IMF 特征诊断结果对比 下载原表 (3) 敏感原始特征集和敏感 IMF 特征集利用距离评估技术选取全部原始特征和全部 IMF 特征中的敏感特征, 得到敏感原始特征和敏感 IMF 特征, 将新得到的两类特征分别输入标准 SVM 和 TSVM 中, 得到表 3 和图 5 所示的测试精度。其中敏感 IMF 特征的 TSVM 模型即本文的基于TSVM 机的智能诊断模型。在表 3 和图 5 中, 与支持向量机相比, 直推式支持向量机分类效果始终占据优势。与全部特征集和全部 IMF 特征集的测试结果相比, 敏感特征集和敏
17、感 IMF 集的测试精度均有很大程度的提高。因此利用距离评估技术选择敏感特征也是提高诊断精度的一种有效手段。图 5 敏感原始特征集和敏感 IMFs 特征集测试精度均值 下载原图1.敏感原始特征 SVM 2.敏感原始特征 TSVM 3.敏感 IMF 特征 SVM 4.敏感 IMF 特征 TSVM表 3 敏感原始特征和敏感 IMFs 特征诊断结果对比 下载原表 在所有诊断模型中, 基于 TSVM 的智能诊断模型 (敏感 IMF 特征+TSVM) 的测试精度最高。无论选取测试样本集的任何样本组成, 基于 TSVM 的智能诊断模型的测试精度均值均在 91%以上。即使测试样本集样本数是训练样本的 50
18、倍, 基于TSVM 的智能诊断模型的测试精度依然达到 91.62%5.31%。基于 TSVM 智能诊断模型可以有效地处理训练样本不足或测试样本过量的情况下故障诊断问题。4 结语直推式支持向量机是一种解决训练样本不足或测试样本过多等问题的有效方法。与其他分类器不同, TSVM 不是通过训练已知标签样本总结出对所有样本都有效的通用规律, 再对未知标签样本进行分类, 而是直接建立一种从已知样本出发对特定的未知样本识别和分类的方法和原则。基于 TSVM 可以较好地解决矿用钻机变速箱因监测数据不足导致诊断困难的问题, 即使在未知状态样本数目是已知故障样本数目 50 倍的极端条件下, 依然能够获得很高的诊
19、断精度。参考文献1冷军发, 荆双喜, 禹建功, 等.EMD 与能量算子解调在提升机齿轮箱故障诊断中的应用J.煤炭学报, 2013, 28 (2) :530-535. 2宫少琦, 张伟, 国明笛.基于 FTA 和 SVM 优化算法的矿井提升机故障诊断方法研究J.煤矿机械, 2017, 38 (4) :180-183. 3张曹, 陈珺, 刘飞.基于 EMD 近似熵和 TWSVM 的齿轮箱故障诊断J.煤矿机械, 2017, 38 (4) :142-145. 4丛蕊, 曾张博, 李洪标, 等.基于 LCD 和倒频谱齿轮箱故障诊断J.煤矿机械, 2017, 38 (4) :146-148. 5孙继平, 佘杰.基于支持向量机的煤岩图像特征抽取与分类识别J.煤炭学报, 2013, 38 (2) :508-512.