1、复杂背景下二维条码图像的研究识别复杂背景下二维条码图像的研究识别目录摘要 .IABSTRACT .II引言 .11 绪论 .21.1 课题研究背景和意义 .21.2 国内外研究现状 .31.3 本课题研究内容 .42 图像的预处理 .62.1 图像灰度化 .62.2 图像滤波 .72.2.1 图像滤波技术 .72.2.2 高斯滤波 .72.2.2 中值滤波 .82.3 二值化阈值选取 .92.3.1 直方图的峰谷法 .92.3.2 一维最大熵法 .102.3.3 Otsu 法 .112.3.4 阈值算法的选取 .132.4 数学形态学操作 .132.4.1 腐蚀 .132.4.2 膨胀 .14
2、2.4.3 开操作 .152.4.4 闭操作 .152.5 最大连通分量提取 .152.6 本章小结 .163 DM 码定位 .163.1 边缘检测 .173.1.1 Roberts 算子 .173.1.2 Sobel 算子 .173.1.3 log 算子 .183.1.4 边缘检测算子的选取 .183.2 HOUGH 变换线段检测 .193.2.1 Hough 变换检测直线原理 .193.2.2 Matlab 中的 Hough 变换 .203.3 图像校正 .203.3.1 倾角计算 .20复杂背景下二维条码图像的研究识别3.3.2 图像旋转 .223.3.3 精确裁剪 DM 条码 .223
3、.4 本章小结 .234 MATLAB 实验结果分析 .244.1 DM 码识别 .244.2 DM 码解码 .314.3 实验结果分析 .324.4 本章小结 .335 结论与展望 .34致 谢 .35参考文献 .36复杂背景下二维条码图像的研究识别I摘要Data Matrix 二维条码(DM 码)的外观是一个由许多小方格所组成的正方形或长方形符号,其资讯的储存是以浅色与深色方格的排列组合,以二位元码(Binary-code)方式来编码,故电脑可直接读取其资料内容,而不需要如传统一维条码的符号对映表(Character Look-up Table)。然而在实际的 DM 码采集工作中,因为各种
4、因素的综合作用,采集到的图像质量并不如预期,而且不光只包含有 DM 码图案,还会混入其他各种背景,所以 DM 码图案所在图像有个比较复杂的背景。针对以上问题,本文讨论了复杂背景下二维条码的识别,根据 Data Matrix 二维条码的特征,形成一个解决方案:使用图像滤波技术去除原图像噪声,Otsu 算法对图像进行二值化,利用数学形态学对图像进行膨胀、腐蚀操作,然后确定最大连通区域,把条码图案分割出来,其次根据 Hough 变换检测出图像中的两条最长线段,也就是L 型特征图案,最后使用L型特征图案,计算出条码的倾斜角度,对条码图像进行旋转,使其达到标准位置。通过对多个有复杂背景的 DM 码的实验
5、,该方案能够从复杂背景中分割出 DM条码区域,并且能够进行旋转校正。关键词:Data Matrix;Otsu 算法;Hough 变换;图像旋转复杂背景下二维条码图像的研究识别IIABSTRACTThe appearance of a two-dimensional bar code is a square or rectangular symbol which made up of many small squares, the information is stored in light and dark colored squares in some way, the computer c
6、an read the data directly in the two-dimensional code, without the need for the corresponding table of unified dimensional bar code symbol.However, in the practice of DM code acquisition , because of various factors, the quality of image collected is not as good as expected ,it not only contains the
7、 DM code pattern, but also sneaks into a various of backgrounds, so the image of DM code pattern has a complicated background. In view of the above problems, this paper discusses the recognition of 2D barcode in complex background, according to the characteristics of two-dimensional bar code, the so
8、lution is as follows :firstly, wipe off the original image noise using Gauss filtering algorithm, binary images via Otsu algorithm, expand and deprive the images using mathematical morphology erosion operation, and then determine the maximum connected region, segment barcode pattern, secondly, test
9、the two longest lines of images based on the Hough transform , that is the characteristics of “L“ pattern, finally ,calculate the tilt angle of bar code using “L” type pattern , achieve the standard position via the rotation of bar code.Through the experiment of many complex backgrounds of DM codes,
10、 the scheme can be segmented the DM bar code regions from complex background, and can achieve the standard position via rotation and correctionKeywords: Data Matrix; Otsu algorithm; Hough transform; image rotation复杂背景中二维条码图像的识别研究 1引言现如今二维条码技术已经得到了广泛的应用,二维条码中的 Data Matrix 二维条码(简称 DM 码)更是如此,所以本文选取 DM
11、码作为研究对象。DM 码通常会被印表机印在不同材质表面上。由于 DM 码只需要读取资料的 20%即可精确辨读,因此很适合应用在条码容易受损的场所,例如印在暴露于高热、化学清洁剂、机械剥蚀等特殊环境的零件上。所以识别研究复杂背景中二维条码图像的课题是非常有必要的。本论文对复杂背景中二维条码的识别是在 matlab7.1 软件平台上完成的。matlab软件的功能很强大,特别是在矩阵运算方面,并且 matlab 读取的图像信息也是保存在矩阵之中。matlab 的图像处理工具箱对图像处理很有帮助,比如本文所用到的一些方法,动态阈值查找的 otsu 算法,最大连通区域的确定以及用 Hough 变换查找最
12、长线段等等,大大的方便了处理的过程。针对复杂背景中 DM 码图像识别的过程,本文有一个完整而详细的论述。在图像识别处理的每个环节都会分析可能会用到的方法,并且比较各个方法的优缺点,根据原图像特性找到最适方法。复杂背景中二维条码图像的识别研究 21 绪论1.1 课题研究背景和意义二维码技术是在一维码技术基础上发展起来的,其在我国的研究还处于起步阶段。相比较一维码而言,在同样的面积上二维码可包含的信息量比一维码多几十倍,而且具有更可靠、抗损坏(破损 25%仍可识读)的特色,同时用条码标签打印机打在纸上有 100%的对比度,识读效果非常好,甚至可达到一秒钟读取 50 个二维码的速度。正是由于二维码所
13、独具的以上优势,国内对二维条码这一新技术的需求与日俱增。正如大家所知,目前国际上最常用的 DATAMATRIX 二维码由于用点阵的方法组成数据,可在一个数据矩阵里包含 2300 个数据信息,所以十年前一经发表就引起全球轰动,但是十年来它的应用和推广却进展缓慢,究其原因,正是因为DATAMATRIX 二维码的应用需跨越二个技术障碍:首先,如何高效、准确的将其打印出来;其次,如何高效、准确的识读它。为了解决这两个关键问题,作为一种智能图像识别技术,机器视觉由此显示出其独一无二的重要性。尽管今天的二维码技术已经有了许多根本性的突破,但在打刻和识读方面存在的技术局限性也正是二维码技术发展的瓶颈之所在。
14、金属有黑色金属及有色金属二种,有色金属又分黄色、白色、银灰色等,同时,金属的表面分为加工面及毛坯面,而加工面也分为多种加工等级。在这种复杂的加工条件之下,对打刻就提出了非常个性化的要求,打刻机不仅要求质量稳定,而且需要逐个调整打刻参数。根据美国条码管理委员会(AIM)及美国汽车协会(AIAG)的规定,直接金属零部件打刻二维码后必须评定打刻的质量级别,分别为 A、B、C 、D 、E、F 或 1、2、3、4、5、6,只有 A、B、C 级的质量才能流到下一步工序,正是上述看似严苛的要求才保证了加工工序的识读效率,因为在加工过程中,工件表面会遇到机油、冷却水甚至划伤,部分磨损又会增加识读的难度。目前,
15、在白纸上用条码标签打印机打出 DATAMATRIX 二维码后再进行识读,已经不存在任何技术问题了,同时,在光洁的金属表面用激光或浮针也能获得优良的品质。但是,遇到毛坯或深色金属时,用激光或浮针打出的 DATAMATRIX 二维码是人眼极难识别的,此时就必须借助智能图像识别技术,也就是机器视觉技术。也正因此,国外几家著名的条码扫描器公司及光学识别设备公司都分别推出了自己的机器视觉产品,例如 Motorola-Symbol 公司、Microscan 公司、 Cognex 公司以及 Datalogic 公司等。目前一些条码扫描设备都被外国的企业垄断着,而且价格昂贵。二维码的扫描识别都是基于智能图像识
16、别技术,而机器视觉技术目前正处于发展阶段,具有一定的缺陷。况且如果采集到的二维码图像由于光照,距离,复杂背景等产生具有复杂复杂背景中二维条码图像的识别研究 3背景的二维条码图像,那么扫描设备可能就不会准确的识读出二维条码中的数据信息。因此可以从用一个算法从复杂背景中把条码区域识别并分离出来,再送到计算机中让软件进行识别,这样就可以很准确的读出其中的数据。并且如果将这种技术做成产品也会成本很低,所以复杂背景中二维条码图像的识别研究是很有意义的!1.2 国内外研究现状复杂背景中的二维条码识别研究,其实最主要的就是目标的识别工作,目标识别是机器视觉领域的核心问题之一。目前国内外使用的主要目标识别方法
17、有:(1) 统计模式识别:统计模式识别方法就是把整个目标区域集合化,然后可以分割成若干互不相交的子集合,子集合从分类的角度来看是有某方面的共性的。选定一个基本的性质集合,从而可以用它来描述目标的一些基本特性,图 1-1 统计模式识别模型同一子集合的各个模式存在一定的差异,有些是由于噪声和采集设备的性质造成的,而有些却是模式本身性质而引起的随机变化。第一个因素就如写一个字时纸张的选择、使用何种笔芯对字的影响;第二个因素表现为即使是自己写同一个字时,虽可能看起来极其相似,但也不可能是百分之百完全相同的。因此当用特征向量来描述这些字在形状上的相似性时,这些特征向量所对应的特征空间中的点就不会相同,而
18、是聚集在特征空间的某个区域空间内。而此时此区域空间就能够用来表示该随机向量实现出的集合,图 1-1 给出了统计模式识别的模型。(2) 神经元网络的识别方法:神经网络(Neural Networks)的基本思路是神经元之间相互连接,一个神经元的输入同时也是其他神经元的输出,这就与大脑中的神经元高度相似,而人体神经元的这些特性被认为是人类防止损伤或者具有记忆力的来源。它反映出大脑的基本功能和特性,是一个高度复杂的非线性学习系统。神经元网络具有大规模的并行、分布式存储和处理、自组织、自适应和自学的能力,因此特别适合处理那些可能需要同时考虑多种原因和条件的、不够十分精确或者比较模糊的信息处理问题。神经
19、元网络能够不断的学习,并且归纳以及判断目标特性,复杂背景中二维条码图像的识别研究 4最后达到能够充分的逼近复杂目标特征的目的。图 1-2 给出了神经元网络的识别模型。图 1-2 神经元网络的识别模型由上面可以看到,前人已经对图像的识别做了很多的探索及其研究,但是每种方法都有自己的适用范围,因此在复杂背景中识别出二维码图案,明确所处环境,找到具体的适用方法尤为重要。1.3 本课题研究内容本论文是研究识别复杂背景中的二维条码图案,对图像进行预处理,识出图像特征“L ”型,对识别出的图像进行校正。(1)原始图像读入,将复杂背景中的 DM 码图像作为目标图像(2)图象预处理,对于 DM 码的图像特征。
20、将图像转换为灰度图像,采用高斯滤波,otsu 算法获得动态阈值对图像二值化,形态学操作,区域填充等方法,找出DM 码区域并提取出。(3)对提取出的 DM 码区域进行边缘检测,这里用的是 sobel 算子,因为经过它处理后直线会比较细。有助于后边用 Hough 变换检测线段。(4)用 Hough 变换可以检测图像中的所有线段,这里我们只需要检测出 DM 码区域的两条最长线段,因为这两条线段就是条码的特征图像所在的线段。(5)根据检测出来的两条线段确定 L 型区域,详细计算倾斜角度。对图像进行旋转校正,使它到达标准位置,然而经过旋转后,会出现黑色区域,因此再对黑色区域进行修正,使黑色区域变白。系统
21、框图如图 1-3 所示:待识别样本识别结果显示输入数据预处理神经网络识别复杂背景中二维条码图像的识别研究 5图 1-3 系统的整体框图计算倾斜角度图像校正 输出结果 旋转图像精确裁剪条码直线检测确定L型边缘检测提取条码区域 DM 码定位 原始图像 图像预处理 图像灰度化图像二值化形态学操作连通分量提取滤波去噪复杂背景中二维条码图像的识别研究 62 图像的预处理2.1 图像灰度化将彩色图转化成为灰度图的过程称为图像的灰度化处理。由采集设备采集到的图像为真彩图,真彩图的一个像素点有 1600 多万的颜色变化范围,因此需要更大存储空间存储,并且如果直接对真彩图处理时,处理过程中所花费的时间很长,而且
22、处理速度很慢,因此真彩图的灰度化处理,是预处理过程中必不可少的步骤。在真彩图中的每个像素点的颜色由 R、G、B 三个通道的值共同决定。灰度图像是具有从黑到白从 0 到 255 级灰度色域等级的单色调图像。在灰度图中每个像素用8 位数据表示,故而它的每个像素点的取值范围是黑白间的 256 种灰度中的一种。并且灰度图只有灰度等级,而没有颜色的变化。在真彩图中如果令 R、G 、B 三个通道分量的值相等,那么此时该真彩图就表示灰度图。常用的图像灰度化的方法有平均值法和加权平均法:平均值法:用真彩图的 R、G、B 三个分量值求平均数,见等式(2-1) 。(2-1)(,)(,)(,)(,)/3fijijijij加权平均法:根据人眼对三种原色的敏感度的不同,将三个分量以不同的权值进行加权平均,此时得到的就是比较合理的灰度图了,见等式(2-2)。(2-2)(,)0.3(,)0.59(,)0.1(,)fijRijGijBij在 Matlab 的图像处理工具箱中,有 RGB 真彩图转换成灰度图的函数 rgb2gray(),用此函数也是基于等式 2-2 的。图 2-1,给出了三种灰度化方法产生的灰度图像。(a) 原图 (b) 加权平均法(c) rgb2gray 函数灰度化 (d) 平均值法图 2-1 上述几种方法产生的灰度图像