基于卷积神经网络的水稻虫害识别.doc-道客多多

资源描述

1、基于卷积神经网络的水稻虫害识别梁万杰曹宏鑫江苏省农业科学院农业经济与信息研究所摘要：针对水稻虫害识别问题, 提出一种基于卷积神经网络模型的水稻二化螟虫害识别方法。图像预处理后, 选择包含水稻二化螟成虫、幼虫、卵或蛹的图片 1 658 张作为正样本, 不含水稻二化螟的农作物图片 1 652 张作为负样本构建了模型训练测试数据集。设计一个 10 层的卷积神经网络模型, 采用 Torch 7 在Ubuntu 14.04 系统上实现模型系统的开发和运行。Holdout 交叉验证结果显示, 模型命中率、精度分别为 86.21%、89.14%, 误测率 8.67%, AUC (area und

2、er the receiver operating characteristic curve) 值 0.95。试验结果表明, 模型可有效地提取图像的特征, 对水稻二化螟害虫识别具有很好的抗干扰性和鲁棒性。关键词：深度学习; 卷积神经网络; 水稻虫害识别; 二化螟; 作者简介：梁万杰 (1980) , 男, 河南商丘人, 博士, 副研究员, 研究方向为农业物联网关键技术及其应用。Tel: (025) 84390193;E-mail:。作者简介：曹宏鑫, 博士, 研究员, 研究方向为作物品质生理生态、数字农业。E-mail:。收稿日期：2017-06-29基金：江苏省农业科技自主创新资金编号:C

3、X (15) 1002;江苏省农业科技自主创新资金探索类项目编号:CX (13) 5060Received： 2017-06-29梁万杰, 曹宏鑫.基于卷积神经网络的水稻虫害识别J.江苏农业科学, 2017, 45 (20) :241-243, 253.随着农业信息化技术的飞速发展, 农作物图像及其处理和模式识别技术逐步在农作物病虫害诊断、农作物营养元素缺失识别诊断、农作物草害识别、监测农作物生长等农业领域得到了广泛应用研究, 并取得了较好的应用成果1-4。随着物联网、图像采集等技术的发展, 农业相关的视频、图像数据迅速进入大数据时代。植物病虫灾害是中国三大自然灾害之一, 对其识别、监测、预警

4、、防控具有重要的信息支撑作用5。农作物病虫害自动化识别可以为防治赢得时间, 最大限度地减少经济损失, 同时可以为精确施药提供信息支持, 从而减少农业残留, 提高农产品品质6-7。因此, 基于大数据的深度学习算法在农作物病虫害识别方面的研究具有重要的理论和实际意义。近年来, 深度学习作为机器学习的新兴研究领域越来越受到人们的关注, 通过深度学习构建的深度网络在无监督特征提取方面表现出优异性能8-9。卷积神经网络 (convolutional neural network, CNN) 模型是深度学习中一种有效的自主学习特征的方法, 可以从原始图像中重构图像的高层语义特征, 利用权值共享提高训练性能

5、。目前, 该模型已成功应用于手写字符识别10、人脸识别11、MNIST 识别12等领域。同时在农业上也有较好的应用, 并受到很多农业研究者的关注。王琨等把卷积神经网络模型应用于茶叶嫩芽的识别, 取得了较好的识别效果, 提高了茶产业的规模化、产业化水平13。张帅等提出一个8 层卷积神经网络深度学习系统用于植物叶片识别, 对单一叶片取得 90%以上的识别率, 并对复杂背景的叶片取得较好的识别效果14。刘云等采用卷积神经网络对苹果缺陷进行检测, 取得了 5 个/s 的检测速度、高达 97.3%的正确率15。本研究针对水稻虫害识别, 提出了一种基于卷积神经网络的识别方法并对图像预处理方法、训练和测试样

6、本集、卷积神经网络模型架构进行了详细的设计和论述。采用 Torch7 实现模型算法、模型训练、模型测试及模型性能结果统计分析和输出。最后对水稻虫害识别方法进行综合讨论和评价, 提出未来发展方向。1 卷积神经网络卷积神经网络最早出现于 20 世纪 80 年代16-17, 并在数字手写体识别18方面取得显著进展, 但因计算复杂, 运算量大, 在硬件条件下影响了其推广应用。Hinton 等认为, 多层神经网络具有优异的学习能力, 学习到的特征能对数据进行更本质的表示, 有利于模式分类, 深度神经网络在训练上的难度, 可通过逐层初始化来有效克服19。2012 年, Krizhevsky 等将卷积神经网

7、络的结构进行多层扩展20, 建立深层卷积神经网络, 并在 Image Net 视觉竞赛中取得成功。卷积神经网络的关键是网络结构 (卷积层、下采样层、全连接层等) 和反向传播算法等。其中卷积和反向传播算法如下:卷积以上一层的特征图 (feature map) 为输入与可学习的卷积核进行卷积, 然后通过激活函数 (activation function) 运算得到输出特征图。每个输出特征图可以卷积多个特征图的值21:式中:y j是卷积后输出值;f () 是激活函数, 常用 sigmoid、tanh、Re LU 等函数;z j是卷积层 l 的第 j 个通道的净激活 (netactivation) ;

8、x i是 l-1 层输出特征图;M j是输入特征图子集;k ij是 l 层卷积核矩阵;“*”是卷积符号;b j是偏移量。反向传播算法是神经网络有监督学习中的一种常用方法, 其目标是根据训练样本期望输出值与真实值之间的误差, 反向调整网络各层的参数。反向传播算法主要基于梯度下降方法, 网络参数首先被初始化为随机值, 然后通过梯度下降法向训练误差减小的方向调整。其中误差损失函数定义为21:式中:t 是第 n 个样本的类别标签真值;y 是第 n 个样本通过前向传播网络预测输出的类别标签。2 材料与方法2.1 数据预处理本研究以水稻二化螟为研究对象。首先收集含有二化螟成虫、幼虫、卵或蛹的图片, 然后把

9、图片分割成 6464 大小的图片, 从中挑选出含有二化螟不同生长阶段图像的图片作为水稻虫害识别训练和测试正样本。收集水稻、小麦、玉米等主要农作物的图像资料, 分割成 6464 大小的图片, 作为水稻虫害识别训练和测试负样本。处理后的部分图像见图 1。从图 1 可以看出, 正样本图像只含有二化螟的部分部位, 图像分辨率、害虫占图像的比例等不同, 图像背景复杂, 这些都对虫害的识别具有很大的干扰。2.2 卷积神经网络模型设计本研究设计的水稻虫害识别卷积神经网络模型结构见图 2。模型共有 10 层, 包括 1 个输入层、3 个卷积层、3 个下采样层、2 个全连接层、1 个输出层。输入为 3 通道、大

10、小 6464 的图像;C1 和 C2 卷积层的卷积核大小为 55, C5 卷积层采用 44 大小的卷积核;激活函数采用修正线性单元 (rectified linear unit, Re LU) 函数, 该函数具有单侧抑制、较宽阔的兴奋边界及稀疏激活性的特点, 更加符合神经元信号激励原理。每层特征图个数和大小详见图 2。输出值为 1 和 2, 其中“1”代表正样本 (有虫害) 、“2”代表负样本 (无虫害) 。2.3 数据集数据集是构建识别模型的基础, 同时也是测试构建的识别模型的基础数据集, 本研究在图像预处理的基础上, 构建了一个用于模型训练和测试的数据集。数据集包含 3 310 个 646

11、4 的彩色图片, 其中包含水稻二化螟成虫、幼虫、卵或蛹的图片 1 658 张 (正样本) , 不含水稻二化螟的农作物图片 1 652 张 (负样本) 。整理分类后, 把正样本图片转换为 36464 的矩阵, 并标记为“1”;把负样本图片转换成矩阵后, 标记为“2”。最后把所有数据保存到数据文件中用于模型的训练和测试。3 结果与分析3.1 识别模型实现深度学习能够广泛应用于众多研究领域, 离不开许多优秀的开源深度学习仿真工具。目前, 常用的深度学习仿真工具有 Caffe、Torch、Theano 等。Torch 是一个支持机器学习算法的科学计算框架。它是采用 Lua 脚本语言和 C 语言编写。T

12、orch 为设计和训练机器学习模型提供了一个灵活的环境, 可支持Linux、Andriod、Mac OS X、i OS、Windows 等平台。最新版本 Torch 7 使 CNN的训练速度得到大幅度提升。综合对比后, 本研究选择 Torch 7 在 Ubuntu 14.04 系统上实现模型系统的开发和运行。基于 Torch 主要实现了原始图片的预处理、数据集生产、模型训练和测试、性能参数统计等功能。3.2 试验结果为了验证模型的稳定性和性能, 本研究采用 Holdout 交叉验证22方法对识别模型进行交叉验证。每次从数据集随机抽取 1 000 个样本作为测试样本, 剩下的样本作为训练集, 重

13、复运行 20 次, 并统计模型的命中率、误测率、精度和AUC 值, 最后求 4 个性能评价指标的平均值。模型交叉验证的结果见表 1, 从表1 可以看出, 模型的命中率和精度分别为 86.21%和 89.14%, 误测率 8.67%, 表明模型达到较高的识别能力同时能保证较低的误测率。AUC 值的意义是其值越接近 1 表明模型的识别性能越好。本研究提出的识别模型 AUC 值达到 0.95, 表明模型具有较好的识别性能。模型的 ROC 曲线左边越靠近 y 坐标轴, 上面越靠近 y=1 直线, 模型的性能越好。模型各层输出特征图见图 3, 从图 3 可以看出, 模型提取的水稻二化螟成虫的特征较为明显

14、, 说明模型通过局部感受野和权值共享, 能够有效地提取图像的特征, 具备一定的平移不变性23。模型的 ROC曲线见图 4, 从图 4 模型的 ROC 曲线可以看出, 模型具有较好的识别性能。表明本研究提出的识别模型具有 10 个层次, 结构较为复杂, 可以有效学习数据集中隐含的特征信息, 从而达到较好的识别效果。4 结论从图像预处理和数据集的构建过程可知, 用于模型训练和测试的数据集有如下特点: (1) 图片光线、拍摄角度、取景远近各不相同; (2) 仅对原始图片进行简单的分割, 并没有做进一步的处理; (3) 选择的负样本干扰性较大。这些特点对模型的训练和测试具有较大的挑战性。本研究提出了一

15、种基于卷积神经网络的水稻二化螟害虫识别方法, 并详细阐述了数据预处理、数据集构建、识别模型结构设计以及模型开发实现技术等。通过交叉验证和模型性能评价指标分析, 可知此识别模型可有效地提取图像的特征, 也可有效学习数据集中隐含的特征信息, 从而达到较好的识别效果, 模型具有很好的抗干扰性和鲁棒性。为了达到推广应用的效果, 今后还需要开展以下方面的研究: (1) 丰富正样本集, 并进一步研究图像预处理方法, 减少噪音干扰, 提高模型训练效果, 达到提高模型识别水平; (2) 研究模型对害虫不同生育阶段的识别能力, 从而提高模型的应用能力和水平。参考文献1管泽鑫, 姚青, 杨保军, 等.数字图像处理

16、技术在农作物病虫草识别中的应用J.中国农业科学, 2009, 42 (7) :2349-2358. 2杨倩, 高晓阳, 武季玲, 等.基于颜色和纹理特征的大麦主要病害识别研究J.中国农业大学学报, 2013, 18 (5) :129-135. 3田有文, 陈旭, 郑鹏辉.基于嵌入式的农作物叶部病害分级系统J.沈阳农业大学学报, 2014, 45 (6) :756-760. 4吴露露, 马旭, 齐龙, 等.改进 Hough 变换的农作物病斑目标检测方法J.农业工程学报, 2014, 30 (10) :152-159. 5曹乐平.基于机器视觉的植物病虫害实时识别方法J.中国农学通报, 2015,

17、31 (20) :244-249. 6赵春江, 陈天恩, 陈立平, 等.迁飞性害虫精准施药决策分析方法研究J.农业工程学报, 2008, 24 (增刊 2) :149-154. 7张震, 高雄, 陈铁英, 等.农业自动化喷雾机械标靶害虫自动识别系统的研究J.农机化研究, 2016, 38 (8) :126-130. 8胡正平, 陈俊岭, 王蒙, 等.卷积神经网络分类模型在模式识别中的新进展J.燕山大学学报, 2015, 39 (4) :283-291. 9周飞燕, 金林鹏, 董军.卷积神经网络研究综述J.计算机学报, 2017, 40 (6) :1229-1251. 10高学, 王有旺.基于

18、CNN 和随机弹性形变的相似手写汉字识别J.华南理工大学学报 (自然科学版) , 2014, 44 (1) :72-76, 83. 11汪济民, 陆建峰.基于卷积神经网络的人脸性别识别J.现代电子技术, 2015, 38 (7) :81-84. 12余萍, 赵继生.基于线性叠加特征和 CNNs 的图像分类方法J.微电子学与计算机, 2015 (10) :36-40. 13王琨, 刘大茂.基于深度学习的茶叶状态智能识别方法J.重庆理工大学学报 (自然科学版) , 2015, 29 (12) :120-126. 14张帅, 淮永建.基于分层卷积深度学习系统的植物叶片识别研究J.北京林业大学学报,

19、2016, 38 (9) :108-115. 15刘云, 杨建滨, 王传旭.基于卷积神经网络的苹果缺陷检测算法J.电子测量技术, 2017, 40 (3) :108-112. 16Rumelhart D E, Hinton G E, Williams R J.Learning representations by back-propagating errorsJ.Nature, 1986, 323 (6088) :533-536. 17Lecun Y, Boser B, Denker J S, et al.Backpropagation applied to handwritten zip c

20、ode recognitionJ.Neural Computation, 1989, 1 (4) :541-551. 18Lauer F, Suen C Y, Bloch G.A trainable feature extractor for handwritten digit recognitionJ.Pattern Recognition, 2007, 40 (6) :1816-1824. 19Hinton G E, Salakhutdinov R R.Reducing the dimensionality of data with neural networksJ.Science, 20

21、06, 313 (5786) :504-507. 20Krizhevsky A, Sutskever I, Hinton G E.Image Net classification with deep convolutional neural networksC/International Conference on Neural Information Processing Systems.Curran Associates Inc.2012:1097-1105. 21Lecun Y, Bengio Y, Hinton G.Deep learningJ.Nature, 2015, 521 (7553) :436-444. 22Devroye L, Wagner T J.Distribution-free performance bounds for potential function rulesJ.IEEE Transaction in Information Theory, 1979, 25 (5) :601-604. 23易超人, 邓燕妮.多通道卷积神经网络图像识别方法J.河南科技大学学报 (自然科学版) , 2017, 38 (3) :41-44.

展开阅读全文