1、面向再制造服务的回转类表面缺陷识别 刘翔 夏绪辉 王蕾 武汉科技大学工程训练中心 武汉科技大学机械自动化学院 摘 要: 再制造活动现场复杂的环境对获取清晰的再制造目标表面缺陷图像造成了困难, 针对这一问题提出一种结合频域与空域特征进行回转类表面缺陷识别的方法。首先使用非下采样 Contourlet 变换提取原始图像中各尺度下的 Contourlet 系数特征, 并与图像中的灰度纹理特征组合;再采用基于径向基核函数的 PCA 分析方法对原始特征进行降维处理;最后, 利用最小二乘概率分类方法对降维后的特征进行分类。通过对现场采集的图像进行案例分析, 所提出的分类识别方法对4 类再制造轧辊缺陷的分类
2、平均正确率达到 92%以上。关键词: 再制造服务; 表面缺陷识别; 非下采样轮廓波变换; 核主成分分析; 作者简介:刘翔 (1983) , 硕士, 工程师。主要研究方向为图像处理与模式识别。作者简介:夏绪辉, 博士, 教授。主要研究方向为制造系统工程、制造/再制造服务、 (逆向) 供应链管理。作者简介:王蕾, 博士, 工程师。主要研究方向为制造系统工程、制造/再制造服务。收稿日期:2017-03-02基金:国家自然科学基金 (71471143) 资助项目Surface defect recognition of rotational parts oriented for remanufactu
3、ring serviceLIU Xiang XIA Xuhui WANG Lei Engineering Training Centre, Wuhan University of Science and Technology; School of Machinery and Automation, Wuhan University of Science and Technology; Abstract: For the complex environment in remanufacturing activity fields, it is difficult to acquire the c
4、lear image with surface defect in the remanufacturing target. Aiming at this problem, a surface detect recognition method of rotational parts is proposed, which is based on the characteristics of frequency domain and spatial domain. The nonsubsampled Contourlet transform is used to extract the Conto
5、urlet coefficient characteristics of original image under different dimensions, and then the characteristics are combined with the gray textural characteristics in the image. The PCA method based on radial basis kernel function is adopted to perform the dimension reduction for the original character
6、istics. The least square probability classification method is employed to classify the characteristics after dimension reduction. The case analysis is carried on for the image acquired on site.By using the proposed classification and recognition method, the average classification accuracy of the fou
7、r types of the remanufacturing roll surface defect is higher than 92%.Keyword: remanufacturing service; surface defect recognition; nonsubsampled contourlet transform; kernel principal component analysis; Received: 2017-03-020 引言按照不同的表面缺陷制定有针对性的再制造方案是再制造服务活动能否成功的关键。提高物体表面缺陷的识别率, 是解决这一关键问题的有效途径。目前, 很
8、多学者在如何提高表面缺陷的识别率上开展了深入的研究。文献1为提高钢芯缺陷的识别率, 提出一种基于属性数据标准差的邻域粗糙集特征约简算法, 该方法有效克服了前向贪心属性约减算法达不到最小约减的缺点, 不仅有效地降低特征维数, 还提高了分类识别准确率。文献2将时域峰值特征与小波包能量特征结合构成表征图像的混合特征, 通过实验证明, 混合特征具有比单一小波包能量特征更强的可分离性, 将其用于SVM 分类具有识别泛化误差小, 正确率高的特点。文献3采用盲信号 ICA 分析法提取冷轧带钢表面缺陷特征, 并采用 PCA 对特征进行降维, 提高了 SVM 分类器的识别正确率。文献4将 DS 证据理论引入 S
9、VM 分类框架, 设计了一种多特征 SVM-DS 决策规则, 在缺陷识别正确率和泛化性方面都比 SVM 有优势。文献5针对 SVM 分类器在多类识别问题中效率较低的问题, 采用最优有向无环图支持向量机 (DAG-SVM) 对带钢表面缺陷进行分类识别, 在识别率、识别速度及抗噪性等方面都有较大改善。考虑到再制造服务现场生产环境恶劣使图像中混入过多的噪声形成“伪缺陷”的实际情况, 上述一些方法可能会由于“伪缺陷”的存在使分类识别的性能恶化。本文从提取图像中较为稳定的变换域特征着手, 利用非下采样 Contourlet变换提取缺陷的变换域特征, 采用基于核函数的 PCA 分析法对提取的特征进行降维处
10、理, 利用处理的结果作为最小二乘概率分类器的输入对样本进行分类。最后以轧辊表面缺陷分类识别为案例对该算法进行验证, 验证的结果表明, 本文提出的算法对于轧辊表面缺陷的分类识别具有较高的识别率。1 缺陷特征提取与选择特征提取就是用一组符号或数字将样本的特征表示出来以便于后续处理, 特征提取的优劣程度强烈地影响到分类器的设计及其分类性能。而特征选择则是寻找最重要的特征, 并忽略掉对正确分类贡献率较低的特征, 进一步对所提取的特征进行优化, 改善分类器的性能。1.1 非下采样 Contourlet 变换为提取较为完整的缺陷变换域信息, 本文采用了文献6-7提出的 Contourlet变换 (CT)
11、的改进方法非下采样 Contourlet 变换 (NSCT) , 该方法不仅克服了小波变换在处理二维信号“奇异线”时由于缺少方向性而无法将信号精确表示出来的缺陷, 对存在各向异性的图像也能很好地进行多尺度分析;还克服了标准 Contourlet 变换不具备平移不变性, 容易导致伪吉布斯 (Gibbs) 现象的缺点。非下采样 Contourlet 变换采用非下采样金字塔结构 (NPS) 和非下采样方向滤波器组 (NDFB) 替换标准 Contourlet 变换中使用的拉普拉斯塔式滤波器 (LP) 与方向滤波器组 (DFB) , 其原理可用图 1 表示。图 1 NSCT 变换结构图 下载原图原始图
12、像先经过 NPS 滤波分解成了一个低通子带和一个带通子带, 其中的低通子带是原始图像的逼近, 带通子带则是原始图像中的中高频细节;再对带通子带采取 NDFB 滤波得到图像在各个方向上的细节;同时, 对低通子带继续采用如上方法滤波可实现图像多尺度分析。由于 NSCT 对 CT 的改进使其具有更好的空域与频域性质, 因此能够更好地表征与提取原始图像中缺陷的几何特征。1.2 基于核函数的 PCA 分析主成分分析 (PCA) 8是一种将高维特征映射为低维综合特征的统计分析方法, 在模式识别问题中有着广泛的应用。其思想是使降维后的数据与原始数据相比具有最小的信息损失, 即降维后的数据是原始数据的正交投影
13、。设 是一个 n 维向量, 是一个 m 维向量, 其中 nm;T 是 mn 维正交变换矩阵, 并且满足 TT=Im, 其中 Im表示 mm 的单位矩阵。那么, x 与 y 之间的距离可表示为:式中:C 为 x 的协方差矩阵, 。一般情况下, 可用式 (2) 表示 PCA的学习过程:设 C 的特征值与特征向量分别为 和 , 按照 由大到小的顺序对其进行排列 , 与之相对应的特征向量为 。那么式 (2) 的解可以通过下式求得:当样本特征空间的维度 n时, PCA 算法在计算 nn 维协方差矩阵 C 的特征值与特征向量时的计算量会显著增加。文献9在 PCA 算法中用核函数 (Kernel) 矩阵代替
14、样本的协方差矩阵 C, 由于核函数矩阵的维度与特征空间维度无关, 能够有效地克服因特征空间维度太大造成计算困难的缺点。与标准 PCA 类似, 假设核函数矩阵的特征值与特征向量分别为 和 , 它们满足 K=。其中, K 是核函数矩阵。那么, 基于核函数的 PCA 分析算法可描述为下面的几个步骤:(1) K 中心化: , In是 n 阶单位矩阵, 1 nn是元素全部为 1 的 n 阶方阵;(2) 求中心化后 K 的特征值 与特征向量 , 并按照从大到小的顺序重新排列;(3) 选择前 m 个较大的特征值对应的特征向量得出结果。核函数 K 是满足 Mercer 条件10的任意对称函数。在本文案例分析中
15、选择的是高斯径向基核函数, 定义如下:2 基于最小二乘原则的概率分类方法基于概率的分类识别方法是指对与模式 x 所属的类别 y 的后验概率 p (y|x) 进行学习, 模式 x 所属的类别为其后验概率达到最大值时所对应的类别。即:。采用概率分类的方法可以在模式 x 属于类别 y 的后验概率较低时不强行分类, 这样就避免了一些错误的分类, 提高分类的准确性。除此以外, 与 SVM 分类器相比, 基于概率的分类器可以直接对多类别问题进行分类, 无需设计多个分类器。设 x 表示训练样本, 样本共分为 c 类, 各类别的后验概率为 p (y|x) , 与各个类别 y 对应的参数为 , 其中 b 为基函
16、数的个数。则可定义与参数 相关的线性模型为:根据最小二乘原则, 对式 (7) 进行学习, 使下式的平方误差最小。显然, 式 (8) 中的第三项是与参数 无关的, 因此只需考虑前两项即可。通过引入正则化项, 可得到下面的准则函数:式中:n 表示样本总数; 为学习常数; 定义的 n 维向量。通过观察, 式 (9) 是关于 的凸二次式, 对其取偏微分并令其结果等于0, 可解得:这样, 后验概率的估计值可以用式 (11) 计算:在式 (11) 中加入了 max (0, *) 约束条件, 目的是保证后验概率的值始终非负。3 案例分析本文选取国内某大型钢铁企业 CSP 车间现场采集的 752 幅 4 大类
17、轧辊表面缺陷图像作为样本与测试集对文中所提方法进行验证分析, 为了后期处理方便, 已预先将所有图像统一成 8080 大小的分辨率。这 4 大类缺陷 752 幅图像的具体情况如表 1 所示。表 1 样本及缺陷说明 下载原表 为客观验证所提方法的有效性, 采用交叉验证的方法。即将样本分为两部分:一部分作为训练样本集;另一部分作为测试集。具体验证过程为:Step1:从训练样本集中提取特征, 构成样本集特征矩阵。对每个样本共进行 5 种尺度下的非下采样 Contourlet 变换, 如图 2 所示 (以一种夹渣缺陷为例) 。按照原始图像、低尺度图像、高尺度图像的顺序将各图像依次排列, 再依先后次序依次
18、提取各图像的灰度均值与方差, 最后将这些均值与方差做归一化处理组合起来, 作为样本特征。由于每种尺度下的非下采样Contourlet 变换最多可有 2 个子图, 因此每个样本可用一个 126 维的向量表示。图 2 五种尺度下的非下采样 Contourlet 变换 下载原图为了减少计算图像纹理特征的复杂度, 将样本图像由原来的 256 个灰度级重新量化成 16 个灰度级。接下来, 提取图像中 0, 45, 90与 135四个方向上的灰度共生矩阵11 (Gray Level Co-occurrence Matrix, GLCM) 。再从此矩阵中计算出可以表征图像内容的统计量 (能量、熵、二阶矩与相
19、关量) 作为纹理特征。由于每一种纹理统计量均有 4 个方向上的值, 对每个方向上的各纹理统计量计算均值与方差可得到一个 8 维向量。将该 8 维特征向量与上述 126维特征向量进行组合可得 134 维特征向量。因此, 样本集可以表示为一个376134 维的特征矩阵。Step2:对样本特征进行降维。按照基于核函数的 PCA 分析方法对原始特征进行降维, 提取前 m 个主要成分作为原始样本特征的替代。图 3 表示的是基于核函数的主成分累积贡献率。由该图可知, 若考虑主成分积累效应0.8, 只需提取前面的 3 个主成分分量构成新的特征矩阵, 但此时描述不同样本的特征数太少, 会大大影响分类的准确性;
20、若考虑主成分积累效应0.9, 则需提取前 37 个主成分分量作为新的特征矩阵, 此时描述样本的特征数较多, 会增加分类器的复杂程度。综合考虑以上因素, 本文选取主成分积累效应0.85, 这样只需提取前面的 18 个主成分, 大大降低了分类器的复杂程度。经过降维, 样本的特征矩阵从 376134 降为 37618, 特征数据被压缩了 86.56%。图 4 反映的是标准 PCA 与核 PCA 方法在处理本文特征向量时耗时的情况。由图 4 可知, 核 PCA 方法在处理样本数量大于特征数量的情况下计算速度较快。图 3 基于核函数的主成分累积贡献率 下载原图图 4 PCA 与 KPCA 降维耗时对比
21、下载原图Step3:设计分类器, 对降维后样本特征进行分类。表 2 列出了本文方法得到的分类结果。其中, 测试 1 的结果是将全部样本的前 1/2 作为训练集, 后 1/2 作为测试集得到的;测试 2 的结果是将测试 1 的训练集与测试集交换后得到的。另外, 为了验证本文方法的有效性, 设计了两组对照组试验。对照组 1 采用的是“混合特征+SVM”的方法, 对照组 2 采用的是“变换域特征+概率分类”的方法。4 结论针对回转类零部件表面缺陷再制造活动现场复杂的环境对表面缺陷需进行分类识别的要求, 利用非下采样 Contourlet 变换提取样本图像中较为稳定的变换域特征与纹理特征构成分类的特征
22、集, 采用基于核函数的 PCA 分析方法对提取的特征进行降维, 最后利用基于最小二乘分类器对测试样本进行分类。从工业现场采集的轧辊样本案例分析结果可知, 在样本数不大的情况下, 本文所提出的方法对于常见的 4 种轧辊表面缺陷的平均识别正确率达到 92%以上, 缺陷识别效果较好。表 2 测试样本的分类识别结果 下载原表 参考文献1毛清华, 马宏伟, 张旭辉.改进邻域粗糙集的输送带缺陷特征约简算法J.仪器仪表学报, 2014, 35 (7) :1676-1680. 2孙红春, 谢里阳, 邢海涛.基于混合特征和支持向量机的抽油杆缺陷识别J.东北大学学报 (自然科学版) , 2009, 30 (2)
23、:266-269. 3段志娟, 周新星, 陈分雄, 等.基于独立成分分析的冷轧带钢表面缺陷识别J.钢铁研究学报, 2011, 23 (10) :63-66. 4车红昆, 吕福在, 项占琴.多特征 SVM-DS 融合决策的缺陷识别J.机械工程学报, 2010, 46 (16) :101-105. 5任海鹏, 马展峰.基于复杂网络特性的带钢表面缺陷识别J.自动化学报, 2011, 37 (11) :1407-1412. 6CUNHA A L D, ZHOU J P, DO M N.The nonsubsampled contourlet transform:theory, design, and
24、applicationsJ.IEEE transactions on image processing, 2006, 15 (10) :3089-3101. 7DO M N, VETTERLI M.The contourlet transform:an efficient directional multiresolution image representationJ.IEEE transactions on image processing, 2005, 14 (12) :2091-2106. 8JOLLIFFE I T.Principal component analysisM.Berl
25、in:Springer, 2002. 9SCHOLKOPF B, SMOLA A J, MULLER K R.Nonlinear component analysis as a kernel eigenvalue problemJ.Neural computation, 1998, 10 (5) :1299-1319. 10MULLER K R, MIKA S, RATSCH G, et al.An introduction to kernel-based learning algorithmsJ.IEEE transactions on neural networks, 2001, 12 (2) :181-201. 11PASARIBU D P.An investigation of textural characteristic for geological purposesC/Proceedings of 1996 Geoscience and Remote Sensing Symposium.S.l.:IEEE, 1996:372-373.