1、基于深度学习的零件分类研究 岳孙平 广东工业大学机电工程学院 摘 要: 深度学习是近年来人工智能领域的热点技术, 它通过对复杂内容的提取, 模拟人脑的分层结构, 通过训练不断调整参数来达到简化的目的。介绍了深度学习的实现方法, 利用自动编码器的方法进行图像分类的研究, 并利用该模型对零件进行了分类实验。实验结果显示, 通过增加训练样本可以增加识别的准确率, 但对于实际应用环境, 单纯的无监督深度学习方式还不能满足高准确度识别的需要。关键词: 深度学习; 自动编码器; 图像分类; 作者简介:岳孙平 (1990-) , 男, 河南新郑人, 在读硕士研究生, 研究方向:精密及超精密加工。收稿日期:2
2、017-03-28Research on Part Classification Based on Deep LearningYUE Sun-ping School of Electromechanical Engineering, Guangdong University of Technology; Abstract: Deep learning is a hotspot technology in the field of artificial intelligence in recent years.Through the extraction of complex content,
3、it simulates the hierarchical structure of the human brain and adjusts the parameters through training to achieve the purpose of simplification.This paper introduces the method of deep learning, uses the method of auto-encoder to realize the image classification, and uses this model to classify the
4、parts.The experiment results show, it is possible to increase the accuracy of recognition by increasing the training sample.However, for the practical application environment, the unsupervised training mode cannot meet the needs of high accuracy.Keyword: deep learning; auto-encoder; image classifica
5、tion; Received: 2017-03-280 引言深度学习作为人工智能领域的最新成果之一, 受到了业界的广泛关注, 已经成为图像搜索、语音识别、自然语言处理的优秀解决方案, 也是近年来机器学习领域重要的研究方向之一。不同于传统的神经网络, 深度学习具有更深的模型结构, 在每一层中通过对特征的变换达到更加抽象的特征结构, 解决了人工特征提取耗时耗力的问题。深度学习有类似人类大脑的结构特征, 通过对底层的特征提取来表达图像所代表的含义。1 深度学习机器学习 (Machine Learning) 是利用计算机模拟人类学习行为处理问题的科学。计算机通过模拟人脑的思维结构获得新的知识, 或者通
6、过重新组织已获得的知识来提升自身的性能1。机器学习在解决图像识别、语音识别、数据预测、无人驾驶、基因组认知方面具有一定的优势。图像识别的过程一般是:首先通过传感器获得数据, 经过预处理、特征提取、特征选择来获得图片的特征;再利用这些特征进行分析、识别、推理以及预测。传统手工选取特征是一种非常费时费力的方法, 因为提取的正确率在很大程度上取决于个人的经验以及运气。深度学习 (Deep Learning) 就是用来完成特征选取的, 它是一种不需要人参与的特征选取过程。深度学习的本质是构建一种具有多种隐藏层的机器学习模型, 通过进行海量的数据训练, 获取具有价值的特征, 最终实现正确的分类或准确的预
7、测2。与传统的浅层学习相比, 深度学习具有以下特征: (1) 注重模型结构的深度, 通常具有 5 层6 层隐藏节点, 多的甚至有 10 多层节点; (2) 将特征学习作为最重要的部分, 通过逐层特征变换的方式将原样本的特征变换到一个新的特征空间, 从而提高分类或预测的可能性。图 1 为含多个隐藏层的深度学习模型, 系统是由输入层、隐藏层、输出层组成的多层神经网络, 只有相邻层节点之间有连接, 同一层节点以及跨层节点之间相互无连接。2 自动编码器自动编码器 (Auto-Encoder) 是深度学习的一种典型模型, 最早由 Bourlard 提出3, 它具备了人工神经网络的特点。人工神经网络本身就
8、是层次结构的系统, 如果给定一个神经网络, 为了实现输入与输出尽可能的相同, 需要不断训练调整参数, 得到每一层中的权重。通过这种方式就可以得到输入 Input 的几种不同表示, 这些表示就是特征, 自动编码器就是一种尽可能复现输入信号的神经网络。为了实现这种复现, 自动编码器需要找到其中最具代表性的部分, 提取原信息当中的主要成分4。图 1 含多个隐藏层的深度学习模型 下载原图图 2 为有标签的特征学习, 输入的样本中包含一组标签, 通过对比当前输入与输出之间的差别来调整参数从而最终达到收敛。图 2 有标签的特征学习 下载原图图 3 是一种无标签的特征学习, 在输入 Input 时增加一个
9、Encoder 编码器, 从而得到一个 Code;在 Code 之后添加一个 Decoder 解码器, 从而获得输出的信息;将输出的信息与输入信号进行比较, 通过调整 Encoder 和 Decoder 的参数, 使得输出信息与输入信号尽可能相似。当不断调整使得重构误差最小时, 就会得到输入信号的第一层表示。由于是无标签数据, 因此误差的来源就是重构后的信号与原输入信号之间的变化, 这个变化量越小越好5。第二层和第一层的训练方式是相同的, 将第一层的输出信号作为第二层的输入信号, 使用同样的方法最小化重构误差, 从而得到第二层的参数及第二层输入的 Code, 也就是原输入信号的第二个表达。通过
10、不断的迭代, 将上一层的输出信号作为下一层的输入信号就可以获得其他层的参数6。图 3 无标签的特征学习 下载原图3 实验分析及结论本文实验采用的数据集是为不同零件拍摄的照片, 共 1 000 个训练样本和 100个测试样本, 采用 MATLAB R2015a 操作平台, 图片分辨率为 800600, 将每一幅图像转换为灰度图像, 即像素的值为 0255。样本包含 9 种不同类型的零件, 每种零件的样本数量不完全相同, 训练集和测试集不相交, 图 4 给出了该样本集的一些样图。图 4 零件样本集示例 下载原图为了探寻训练样本量与识别准确度的关系, 我们分别从训练集中选取一定数量的样本进行训练,
11、再利用测试集测试识别的准确率。分别进行 6 次实验, 第一次实验时从训练集中选取 500 个样本作为训练样本, 第二次实验选取 600 个样本, 每次增加 100 个样本, 直到取满 1000 个样本为止。根据实验结果, 做出测试样本平均准确率的特征曲线, 如图 5 所示。从实验结果中可以看出:随着样本数量的增加, 识别准确率会不断地增加, 在样本空间达到 1 000 时, 准确率接近 80%。由于样本集较小, 得到的准确率还不能满足现代工业的生产需求。4 结语本文介绍了深度学习的理论与实现方法, 使用自动编码器的方式完成图像分类, 并应用于零件的识别。实验证明在样本数量增加时对识别准确度具有
12、一定的帮助, 在训练样本数量为 1 000 时, 准确率为 80%左右, 但是还不足以满足目前应用的要求。达不到超高准确率的原因主要有: (1) 样本数量过少, 由于零件种类多, 单个种类的零件样本数量明显不足, 准确率很大程度取决于测试样本与训练样本的相似程度; (2) 采用了无监督的训练方法, 样本空间中没有包含标签数据, 由于算法的限制, 无法达到更高的准确率。图 5 样本数量与测试准确率特征图 下载原图本文使用基于深度学习的图片分类法为工业中的零件识别提出了一种有效的解决方法。探索合适的深度学习模型是值得研究的方向之一, 在生产过程中不断地得到更高的样本改进效率也是值得探索的方向。参考
13、文献1Yang Zhijuan, Niu Wennan, Peng Xiaojiang.An imagebased intelligent system for pointer instrument readingC/IEEE International Conference on Information Science and Technology.s.l.:IEEE, 2014:780-783. 2Dong Yu, Hinton G, Morgan N, et al.Introduction to the special section on deep learning for speec
14、h and language processingJ.IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20 (1) :4-6. 3Bourlard H, Kamp Y.Auto-association by multilayer perceptions and singular value decompositionJ.Biological Cybernetics, 1988, 59 (4-5) :291-294. 4尚丽.稀疏编码算法及其应用研究D.合肥:中国科技大学, 2006:19-22. 5Hinto
15、n G, Zemel R.Autoencoders, minimum description length, and Helmholtz energyC/Advances in Neural Information Processing Systems.Burlington, USA:Morgan Kaufmann, 1994:3-10. 6Vincent P, Bengio Y, Larochelle H, et al.Stacked denoising autoencoders:learning useful representations in a deep network with a local denoising criterionJ.Machine Learning Res, 2010, 11 (12) :3371-3408.