收藏 分享(赏)

基于knn算法的手写数字识别研究.doc

上传人:无敌 文档编号:173182 上传时间:2018-03-23 格式:DOC 页数:6 大小:96.50KB
下载 相关 举报
基于knn算法的手写数字识别研究.doc_第1页
第1页 / 共6页
基于knn算法的手写数字识别研究.doc_第2页
第2页 / 共6页
基于knn算法的手写数字识别研究.doc_第3页
第3页 / 共6页
基于knn算法的手写数字识别研究.doc_第4页
第4页 / 共6页
基于knn算法的手写数字识别研究.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、基于 KNN 算法的手写数字识别研究 赵卫东 刘永红 鄢涛 于曦 成都大学模式识别与智能信息处理四川省高校重点实验室 成都大学信息科学与工程学院 摘 要: KNN 算法用于手写数字识别的时候, 需要将待识别的手写数字图像 (测试集) 与一些已知的手写数字图像 (训练集) 联合在一起求向量之间的最短距离, 才能判断待识别数字图像的分类.设计了一种将测试集图像中的数据与尺寸转换为与训练集图像完全相似的转换算法, 并在此基础上, 将测试集和训练集都转换成有相同列数量的一维向量, 进而求出向量之间的距离, 并通过编写 Python 程序对该算法进行了验证.测试结果表明, 该方法对手写数字图像的正确识别

2、率能够达到 95%以上.关键词: KNN; Python; 训练集; 测试集; 作者简介:赵卫东 (1968) , 男, 硕士, 副教授, 从事软件工程与模式识别研究.收稿日期:2017-11-23基金:四川省科技厅软件科学研究计划 (2017ZR0198) ;四川省科技厅应用基础计划 (2016JY0255) 资助项目Research on Handwritten Numeral Recognition Based on KNN AlgorithmZHAO Weidong LIU Yonghong YAN Tao YU Xi Key Laboratory of Pattern Recogni

3、tion and Intelligent Information Processing of Sichuan Province, Chengdu University; Abstract: When KNN algorithm is used for handwritten numeral recognition, it is necessary to combine the handwritten numeral images ( test set) to be recognized with the known handwritten numeral images ( training s

4、et) to find the shortest distance between vectors, so that we can identify the classification of digital images to be recognized. This paper designs a transformation method that transforms the data and size of the test set into a completely similar image to the training set. Based on that, the test

5、set and training set are transformed into one-dimensional vectors with the same number of columns, and then the distance between vectors is obtained. Finally, the algorithm is verified by writing Python program. Experimental results show that the correct recognition rate of handwritten digital image

6、s can reach over 95%.Keyword: KNN; python; training set; test set; Received: 2017-11-230 引言KNN 算法也称 K 近邻算法 (K-nearest neighbor, KNN) , 是一种基本分类与回归方法, 也是手写数字识别的基础算法之一1-3.在实际应用中, KNN 算法的输入为实例的特征向量, 对应于特征空间的点, 输出为实例的类别.KNN 算法假设已经准备好 1 个训练数据集, 其中每个实例的类别是预先指定的.分类时, 对新的实例 (测试数据集) , 根据 K 个最近邻的训练实例的类别, 通过多数表

7、决等方式进行预测.K 值的选择、距离度量及分类决策规则是 KNN 算法的 3 个基本元素4.在通常情况下, 训练集图像是已经剪裁成统一规格且四周没有空白空间的二值化图像, 而测试集可以是任意图像, 不能直接与训练集进行比较.目前, 针对图像转换方面的研究比较少, 对此, 本研究设计了一种将测试集的数据转换为与训练集相同规格的数据的算法.1 训练集和测试集不失一般性, 假设训练集是由多个文本文件组成的集合, 每个文件表示 1 个已知的数字 (09) , 每个文件的格式是 1 个 3232 的文本文件.文件中的 0 表示白色, 是底色;1 表示黑色, 是数字的笔迹.图 1、图 2 分别为数字 8

8、的手写笔迹图像与文本文件.尽管采用文本格式存储图像不能有效地利用内存空间, 但为了方便理解, 还是应将图像转换为文本格式2.在实际识别算法中, 需要将每个文件的 32 行按首尾顺序连接, 合并为 1 行, 形成 1 个 11 024 的特征向量.训练集的主要特点是, 由于数字的高度通常大于宽度, 所以有些数字左右两边需要用全 0 的列填充, 数字 1 构成的形状处于图像的横向正中间, 训练集的上下部分没有空白区域.图 1 数字 8 的手写笔迹图像 下载原图图 2 数字 8 的文本文件 下载原图一般情况下, 测试集是普通的二进制图像文件, 多数情况下, 图像尺寸不可能刚刚为 3232 像素, 而

9、且图像的上下左右都可能有空白, 与训练集的特征不符合, 因此在识别的开始阶段, 需要将图像文件的有效部分转换为训练集格式的3232 文本文件 (否则会大大降低识别精度) , 进而转换为 11 024 的特征向量.2 手写图像转换为训练集的算法2.1 图像转换为二值数组 (img2Array) 首先, 需要将灰度图像转换为只有 0 与 1 数字的“数组 1”, 数组 1 的尺寸与图像尺寸一样大.该算法的函数是 img2Array.算法的关键是根据图像的像素值把数组对应坐标的值设置为 0 或 1, 此根据像素的亮度值 (brightness) 来定.式 (1) 与式 (2) 都可以确定亮度值, b

10、rightness 值的范围是0, 255, 所以, brightness127 时认为是黑色的笔迹, 对应坐标的数组值设置为 1, 否则设置为 0.其次, 需要去掉“数组 1”的上下与左右的空白行, 只留下有效的“净”数字数据, 这样就生成了“数组 2”.事实上, 数组 2 的尺寸仍然不是 3232 的标准测试集尺寸.数字图像的二值化如图 3 所示.图 3 数字图像的二值化 下载原图2.2 数组 2 缩放为长宽一致的数组 3假设“数组 2”高度大于宽度, 由于测试集高度与宽度相等, 所以必须扩展数组 2 的宽度, 使其等于高度.具体方法为, 首先生成 1 个全 0 的数组 3, 高度和宽度都

11、等于数组 2 的高度, 然后将数组 2 的值复制到数组 3 的中间, 结果如图4 所示.2.3 数组 3 缩放为数组 4 (3232 的标准测试集) “数组 3”是高度和宽度相同的二维数组, 但却不是 3232 的.测试集要求是3232 的数组, 所以需要新生成 1 个 3232 的全 0 数组 4, 然后设置数组 4 中每个的数值, 结果如图 5 所示.图 4 生成长宽一致的数组 3 下载原图图 5 数组 3 通过卷积算法变换为数组 4 下载原图不失一般性, 为了简化描述, 假设数组 3 的尺寸是 (17, 8) , 数组 4 的尺寸是 (5, 3) , 如图 6 所示, 计算数组 4 中每

12、个点的值.假设数组 4 中 P4 点的坐标是 (row, col) = (1, 2) , 即第 2 行, 第 3 列, 则数组 P4 点的值是 0 还是 1 呢?对此, 本研究利用卷积法 (见图 6) , 即用数组3 的 1 个区域的平均值汇总为 P4 点的值.图 6 卷积算法示意图 下载原图首先, 计算 2 个方向的比例, 然后, 计算数组 3 区域的起点坐标, 最后, 计算数组 3 区域的终点坐标, 有了数组 3 区域 (灰色区域) 之后, 就可以求出该子区域的平均数.如果平均数0.5, 则数组 4 中的 P4 点的值为 1, 否则为 0.3 算法实现与测试本算法在测试时, 首先通过 Py

13、thon 编程实验, 选取了 1 936 个训练集数字图像3, 并对 1 000 个手写数字进行了识别.测试结果表明, 正确率大于 95%.由于实验中采用了连续数字, 而不是单个数字, 因而更贴近实际应用.对于连续数字, 只需要根据数字之间的空行和空列将数字图像分开, 再分别识别即可.图 7 是 6组数字的识别实验结果.从测试结果看, 只错了 1 个数字, 8 识别成了 3.4 结语基于 KNN 算法的数字识别准确率依赖于训练集规模及训练集和测试集的相似度, 训练集图像越多, 训练集与测试集相似度越高, 识别率就越高5.数字识别算法的评判指标之一是识别速度, 而 KNN 算法的识别速度也与训练

14、集规模有关, 训练集越多, 识别速度越慢.事实上, 若要高的识别准确率, 就必须有大量的测试集图像, 而若要快速的识别速度, 又不能有太多的测试集图像.因此, 在实际应用中, 通常采用折中的办法, 即, 取合适的训练集数量, 同时使用速度更快的硬件设备, 以此来满足实际需求.图 7 连续手写数字识别效果 下载原图参考文献1田绍兴, 陈劲杰.基于 KNN 的手写数字的识别J.农业装备与车辆工程, 2017, 55 (10) :96-98. 2Harrington P.机器学习实战M.李锐, 李鹏, 曲亚东, 等译.北京:人民邮电出版社, 2011. 3赵永科.深度学习 21 天实战M.北京:电子工业出版社, 2016. 4Sebastiani F.Machine learning in automated text catagorizaitionJ.ACM Comput Surv, 2002, 31 (2) :1-17. 5李志荣, 杨丹, 周奇.基于模板匹配的脱机手写数字识别研究J.哈尔滨师范大学学报 (自然科学版) , 2009, 25 (4) :86-95.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报