1、工件打码图像中的字符倾斜矫正算法研究陈志强,王晨升,杨光, 杨 沐,陈亮(北京邮电大学自动化学院,北京 100876)【摘要】本文主要在模式识别领域,研究人工打码字符图像在图像预处理之后,识别之前的单个整体字符的倾斜矫正算法。对于实际的字符图像源,由于是人工逐个字符进行打码,难免会出现字符倾斜的状况,再加上工件背景比较复杂,拍摄光照不均等原因,使得对字符图像的处理和倾斜矫正愈加困难。本文结合实际应用,在对字符图像进行前期的预处理和字符分割之后,再对分割后的单个字符进行倾斜矫正,实验取得了良好的效果,为字符后期的识别创造了有利的条件。【关键词】模式识别;倾斜矫正;打码字符;图像预处理The Re
2、search of Tilt Correction Algorithm for the Workpiece Coding Character ImageChen Zhiqiang, Wang Chensheng, Yang Mu, Chen Liang ( Beijing University of Posts and Telecommunications Institute of Automation, Beijing 100876, China)【Abstract】In the area of pattern recognition, a tilt correction algorithm
3、 for artificial coding character image which is been preprocessed before recognition is researched and presented in this paper. Because of artificial coding, tilting character is unavoidable. And due to the complicated workpiece background and uneven lighting, the processing and tilt correction for
4、character image become much more difficult. Combined with practical application in this paper, tilt correction for single character is done after image preprocessing and character segmentation of character image. The experiment shows that the algorithm is effective, and creates a favorable condition
5、 for the subsequent character recognition.【Key words】Pattern Recognition; Tilt Correction; Coding Character; Image Preprocessing作者简介:陈志强(1989-),男,硕士研究生,计算机视觉通信联系人:王晨升,副教授,主要研究方向:工业设计,机械制造、计算机视觉。E-mail:。 电话:13911077219。0 引言现今,图像处理和模式识别技术正在飞速发展。其中,字符识别是模式识别领域中的重要研究对象之一。在工业生产中,需要对工件上的工件号进行记录和收集,以对产品进行统
6、计和服务跟踪 1。为了向自动化生产模式发展,对工件号的自动识别不可或缺。在工件人工打码字符识别中,打码字符的倾斜对后期的识别将产生重大影响。为了使字符在后期能够得到正确的识别,并且以提高识别率为目标,必须要对字符进行倾斜矫正。字符图像的倾斜矫正的关键在于如何检测出字符的倾斜方向和倾斜的角度 2。目前,常用的倾斜矫正方法主要有:常规线性角度检测的方法,基于字符投影的方法,基于Hough 变换的方法,还有进行傅里叶变换转换到频域来进行检测的方法。但这些方法主要对有明显整体倾斜趋势的图像有良好效果,例如,文档图像,有明显直线边界的图像。而对于单个字符的倾斜判断和角度检测,这些方法在某种程度上是不适用
7、的。人工打码字符图像在前期预处理和字符分割之后,得到单个字符的图像只存在整体倾斜。而不管字符是向哪个方向倾斜,其字符的宽度或高度都会发生变化,在小角度范围内,字符的倾斜将使字符的宽度变大 3。结合这个思想,本文结合实际的工程应用,对单个字符基于宽度比较的倾斜矫正算法进行了研究和实践测试。1 打码字符图像的预处理及字符分割为得到单个字符的图像,需对字符的原始图像进行预处理和字符分割 4。原始字符图像如图 1(Fig .1)所示。图 1 打码字符原图Fig .1 original character image本文所采用的处理流程如图 2(Fig .2)所示:二值化 图像去噪 空洞填充、去边框字符
8、分割图 2 预处理流程图Fig .2 flow chart image of preprocessing1.2 图像二值化对字符原彩色图像先进行灰度变换,得到像素的灰度值在0,255的灰度图像,在进行二值化处理,使其变成单通道二值图像,可减少运算数据量和系统的开销,提高了运算的效率。结合实际图像光照不均和背景复杂的特性,本文采用局部自适应二值化的方法进行处理,选取一个特定大小的窗口在源图像中进行滑动,对窗口中的每个像素周围 3*3 区域的像素值进行加权平均,得到自适应阈值。1.2 图像去噪针对所得到的二值图像进行噪点的去除,本文采用对图像进行中值滤波结合基于连通域的去噪方法。其中,中值滤波采用
9、 3*3 窗口,由于噪声成分很难被放入到计算之中,所以几乎不会影响到输出的结果,且不会使图像模糊,字符的边缘得到了很好的保留。对滤波后的图像采取基于连通域的去噪方法,先提取图像中所有连通域,通过限定连通域的面积,将图中小区域的噪点置成白色以达到噪点删除的目的。1.3 空洞填充、去边框及字符分割本文采用漫水填充算法进行字符孔洞的填充,通过统计图像水平前景像素,若此行前景像素个数大于背景像素个数,则将此行和上下两个像素行的像素点置为背景色,以此进行上下边框的去除,以达到对字符影响最小化的目的。字符分割采取基于连通的分割方法,限定连通域的长度、宽度和面积性质。将满足条件的连通域认为是字符,并将其从图
10、像中截取出来,并将截取的字符逐个放入 150*150 大小图像的中间位置,以达到字符分割和提取的效果。字符图像连通域截取如图 3(Fig .3)所示:图 3 字符图像连通域截取图Fig .3 connected domain extracting of character image所得到的五个字符的图像如图 4(Fig .4)所示:图 4 分割后的单个字符的显示图Fig .4 single character images after segmentation2 单个字符的倾斜矫正本文所示的打码字符为人工逐个打码,所以字符基本都存在小角度范围内(-5 0+50)的倾斜,这种倾斜属于字符的整体
11、倾斜,字符的原有结构性质没有发生太大的变化。进行倾斜矫正的步骤从概念上来讲为三步:1、判断倾斜方向。2、求出倾斜角度。2.图像反向旋转,像素传递。在新缓冲区中与原图没有对应像素点的值用黑色代替。如图 5(Fig .5)所示,点(x 0,y 0)经过旋转 角之后变成(x,y)。其坐标变化为:(3-0coscos( ininxraray1)可推出:(3-00cosiinsxyy2)这里的旋转是围绕坐标原点进行的,也就是在最常见的笛卡尔坐标系内完成的旋转,它的坐标原点即为图像的中心位置。然而,数字图像的坐标系的原点是在图像的左上角(0,0)位置,其 X 轴向右增长, Y 轴向下增长。如图 6(Fig
12、 .6)所示,X 1 Y1 为图像坐标系,X2 Y1 为笛卡尔坐标系。本文对图像的旋转,先将字符图像坐标系转换到笛卡尔坐标系中,即按 x0(-width/2 ,width/2 ,y 0(-height/2,height/2 范围遍历源图像的前景像素,再平移回原图像坐标系。旋转后的像素坐标的公式如(3-3)所示:(3-00cosin/2cos()/2isinwidthrawidthyxyegeg3)其中 width,height 为源图像的宽度和高度,r 即为像素点离图像中心的距离。图 5 像素旋转示意图 图 6 坐标系对比图 Fig .5 Pixel rotating schematic di
13、agram Fig .6 Coordinate system contrast diagram这样,若字符顺时针倾斜,向字符倾斜的方向进行旋转,第一象限内(x 00,y 00)的像素在小角度范围内,(a- )0,/2,余弦函数在0,/2上是单调减函数,所以,旋转角度越大, 越大,(a- )越小,旋转后 x 值变大。对应地,在第三象限内(x00,y 00)的像素在小角度范围内,旋转后的 x 值将变小。从而,整个字符图像在垂直方向上的投影范围区域,也即字符的投影宽度将变大。相应的,与字符倾斜的方向进行反向旋转,字符的投影宽度将减小。同理,字符逆时针倾斜存在同样的状况。所以,在倾斜角度为 0 时,字
14、符的投影宽度最小。因此,对于处理后得到的字符图像,判断其倾斜方向后,进行反向旋转,取旋转后投影宽度最小的那幅图像对应的字符就是矫正后的字符。依此分析,本文对分割得到的字符图像在(-5 0+50)范围内采取如下步骤进行字符图像的倾斜矫正:(1) 判断倾斜方向。将字符图像顺时针旋转 0.1 度,计算旋转后字符的宽度,若相对于旋转前的宽度发生减小,则倾斜方向即为顺时针,否则向逆时针防线旋转 0.1 度,若宽度发生减小,则倾斜方向为逆时针,否则判断字符不发生倾斜。(2) 若判断字符存在倾斜,则在倾斜方向上,以 0.1 度为步进进行旋转,同时计算旋转后字符的投影宽度,与上次的结果进行比较,直到投影宽度比
15、上一次的宽度结果大为止。在此时的旋转前的图像即是矫正后的图像。其中,计算旋转后字符的宽度采用如下的方法:以 x0(-width/2,width/2 ,y 0(-height/2,height/2 为坐标范围遍历待旋转图像,对该范围内的前景像素(本文为白色)坐标利用公式(3-3)对旋转后的坐标信息进行统计比较,取得旋转后 x 坐标的最大值 Max(x)和最小值 Min(x)。则投影字符宽度即为 Max(x)-Min(x)。另外,结合实际情况,本文矫正步骤(2)中,若连续 15 次旋转的字符图像宽度的整数位相同,则认为当前倾斜度影响很小,停止旋转。对本文例子中分割得到的单个字符利用上述方法得到的矫
16、正结果图像如图 7 所示:图 7 字符矫正后的结果图像3 结论对人工打码的字符图像使用本文讲述的方法进行倾斜矫正,效果良好,适应性强。本文也对其他的打码图像进行了测试,矫正结果正确、明显,为后期的字符识别奠定了良好的基础。但是,对于个别字符图像由于有毛刺的影响,使得宽度的判断上出现误差,影响矫正的结果,可以在此方面进行优化以达到更好的效果。参考文献 (References)1 洪汉玉等复杂背景下的字符识别新方法研究第十四届全国图象图形学学术会议 ,2008,317320Hong Hanyu etc. Study on New Method of Character Recognition un
17、der Complex Background. The 14th National Conference on Image and Graphics(NCIG), 2008, 317320.2 李庆峰,付忠良,刘琴一种高效的倾斜图像校正方法计算机工程 2006,32(21) :194196Li Qingfeng, Fu Zhongliang, Liu Qin. An Effective Skew Image Correction Method. Computer Engineering. 2006, 32(31): 194196.3 乐宁,翁世修基于单个字符区域的倾斜字符校正技术的研究图像识别
18、与自动化2000 年第 2期:17Le Ning, Weng Shixiu. Study of Tilt Character correction technology based on single character region. Image Recognition and Automation. 2000, 2:17.4 陈志强,王晨升,杨光,杨沐,张稳铸件表面工件号识别的预处理及分割算法研究.第七届图像图形技术与应用学术会议,2012,32:208213Chen Zhiqiang, Wang Chensheng, Yang Guang, Yang Mu, Zhang Wen. Stu
19、dy on algorithm of Preprocessing and Division of Character Recognition on The Surface of Casting. IGTA, 2012, 32: 208213.5 戴海港,宫宁生,张德金基于二值图像连通域的车牌定位方法通信技术2011 年 8 期 44 卷,116117Dai Haigang, Gong Ningsheng, Zhang Dejin. License-plate Location Method based on Interconnected Domain of Binary Image. Comm
20、unications Technology. 2011, 8(44), 116117.6 Feng Yang, Fan Yang. Character recognition using parallel BP neural network. Audio, Language and Image Processing, ICALIP, International Conference. 7-9 July 20087 Meng Qingyuan, Hu Hongping, Bai Yanping. A method of character recognition based on general characteristic and connected regions. Multimedia and Signal Processing (CMSP), International Conference.14-15 May 2011. 8 Meng Qingyuan. The Study of Vehicle Template Character Recognition Technology Based on Connected Domain Characteristic, Journal of Test and Measurement Technology, in press.