1、大 连 民 族 学 院 本 科 毕 业 设 计(论 文)字符预处理及分割算法实现学 院(系): 计算机科学与工程 专 业: 软件工程 学 生 姓 名: 学 号: 指 导 教 师: 评 阅 教 师: 完 成 日 期: 大连民族学院字 符 预 处 理 及 分 割 算 法 实 现- I -摘 要傣文是傣族人民的传统文字,也是一种具有悠久历史的古文字。最初是伴随着佛教的传入而产生,属于古印度字母系统的一种拼音文字。在中国的云南省,由于使用的地区不同,有四种文字的形式:四双版纳傣文,金平傣文,傣绷文,德宏傣文,他们与老挝,柬埔寨和缅甸的语言同属一个系统。一直以来,傣族人民通过自己的民族文字,写了许多美丽
2、的故事,神话,传说和诗歌,记载了他们过去的生活,自己的佛经,和农田水利,还记录天文学,医学,政治历史,语言学的等研究内容方面,这些有助于科学技术的发展,文学,艺术的传播。本文主要从事傣文字分割及样本库构建研究,并西傣文的作为研究对象。因为书籍保存时间较长且在传输和保存过程中难免会被各类噪声的污染,使得字迹变得模糊,需要运用现代电子信息科学技术将图片文档进行去噪,平滑,二值化,倾斜矫正等预处理,从而形成满足人们需要的特性图像,然后通过阈值法将字符图像分割成单个字符。最后将这些分割出来的单个字符按照字号的大小,进行归一化分类处理。西傣文是我国少数民族语言的一种,从事这方面的研究对于我国发掘和保存少
3、数民族文化具有重要的意义。关键词:字符预处理;字符分割;西傣文字 符 预 处 理 及 分 割 算 法 实 现- II -Implementation of Character Preprocessing and Segmentation MethodAbstractDai characters is the traditional script of Dai people and also an ancient script with a long history.It comes into being with the incoming of Buddhism and it belongs
4、to a alphabetic writing of the alphabet ancient India. In Yunnan province of China,there are four word format of the Xishuangbanna Dai in different region of the province: xishuangbanna dai wen, jin dai, dai stretched, dehong dai wen,which belongs to the same language systems as Laos,Cambodia and My
5、anmar.In the long history of Dai people, they write a lot of beautiful stories mythologies and poems with Dai script to record their life, Sutra, Irrigation,Astronomy ,Medicine,Political history,Research and linguistics and other aspects, which advances the development of science and technology as w
6、ell as the spread of literature and art.This paper is mainly engaged in the research of the Dai text segmentation and sample library , regarded the West Dai as the research subjects. The books had been saved for a long time and it will inevitably be contaminated by all kinds of noise in the transmis
7、sion and preservation process, which made the writing blurred, required using the modern electronic information science and technology to de-noising, smoothing, binarization, tilt correction preprocessing about the document image , forming the image of properties to meet the needs of people, then ch
8、ange the character image into individual characters by the threshold method . Finally, according to the font size, normalized classification these split up individual characters.West Dai is one of our countrys minority language , so engaged in research in this area is of great significance for the e
9、xcavation and preservation of minority cultures.Key Words:JPretreatment characters ;Character segmentation;West Dai字 符 预 处 理 及 切 割 算 法 实 现目 录摘 要 .IAbstract II1. 绪论 .11.1 图像预处理概述 .11.2 图像分割概述 12. 系统分析 .22.1 研究现状 22.2 本论文主要研究内容和解决的问题 23. 字符预处理及分割算法实现 .43.1 系统开发环境 43.2 中值滤波去噪 43.2.1 中值滤波器简介 43.2.2 中值滤波
10、器的基本理论 43.3 灰度图像二值化 63.3.1 图像二值化概念 .63.3.2 全局阈值法 .83.4 图像的倾斜校正 113.4.1 图像的倾斜角度矫正概述 113.4.2 Radon 变换法 .113.5 字符阀值分割技术研究 133.6 分割字符的归一化处理 184. 系统测试 .204.1 预处理集成测试 204.2 系统集成测试 20结 论 .23参考文献 .25致 谢 .26字 符 预 处 理 及 切 割 算 法 实 现- 1 -1.绪论1.1图像预处理概述图像预处理技术是在图像处理之前,所需要做了一系列的修正操作,这是由于图像在传输过程和保存过程中总难免会遭到各类程度的破损
11、以及许许多多的噪声的污染,致使目标图片偏离了人们的需求。图像预处理技术可分为图像增强和图像还原技术。在图像预处理中,图像增强技术占有一大比例,是图像处理一个必要的步骤,和图像还原是不同的,它通常是用于图像的原始自然恢复,字符图像增强是突出的是人需要的特征和弱化一些非必要为原则的。图像增强的方法有许多种,通常有图像的平滑去噪、倾斜校正、灰度变换、图形增强、直方图修复等等。直方图修复通过灰度变换而得的,可以使图像得到不错的处理和显示。而灰度变换是图像增强技术中比较单一的点运算处理技术,不过上述两种去噪功效比较弱,通常只能够处理一些要求不高的图像,图像增强的主要通过图像平滑减噪实现的,这使得其成为比
12、较普遍的预处理方法,例如用于图像平滑和去噪,是现代社会图像预处理研究中非常重要的实现形式。1.2 图像分割概述作为一个整体的图像,包括色彩丰富的内容,我们将需要的目标、背景和整个网络的混合在一起,不利于图像的处理,所以,应当是将图像先划分为多个区域,并和物体目标相对应的,然后对选中图像的目标和背景运用预先的知识进行定位、标识。使目标图像离开背景或其他虚假的目标,这种方法就称为图像分割。分割出来的图像区域和包所含的信息要包括了区分,每个分区的描述,另外还有一些局部特征,并且使用这些特征,例如灰度差、局部纹理、颜色差异、不同的局部统计特征或局部差谱特性,通过这些来区分整幅图像中有差别的目标物体,该
13、区域可叫做感兴趣区域。因为我们是将要使用的图像信息的局部特征分割,因此这样的分割方法具有通用性。 字 符 预 处 理 及 分 割 算 法 实 现- 2 -2.系统分析2.1 研究现状当前人类已步入一个飞快发展的信息时代。大部分的讯息来自图像,科研探索和技术应用中,图像处理技术现已成为一种非常的重要手段。数字图像处理技术最早出现在二十世纪50年代的发达国家,如美国和欧洲,当时电子计算机技术已经有了一定水平的发展,人们开始用它来处理信息图像。从二十世纪六十年代开始,数字图像处理开始一门独立的学科的出现。最初的图像处理是以改善图像的质量为主,赢得了第一次真正的成功的是美国喷气推进实验室的应用。他们使
14、用空间探测器发回了月球的相片,然后将这些照片的图像进行几何校正,灰度变换,去噪,直方图修正。然后通过这些处理好的相片试着绘制出月球表面的外观地图,并取得成功。为人类的登月梦想提供良好的现实基础,同时也推进数字图像处理该学科的发展。此后越来越多的机构也开始对图像处理技术的进行深入研究,因而它的应用范围开始从空间研究扩展到各个领域,特别是在字符分割,太空探测上取得了巨大的成就。2.2 本论文主要研究内容和解决的问题字符图像预处理技术是为了从原始图像中得到效果良好的图像所需要做的一系列修正操作。因为这过程中噪声的污染,一定程度的破坏,字符图像在传输过程和保存过程中产生的图像丢失了原来的本质或背离人们
15、的需要,因而需要一系列的预处理操作来完成图像修复损失有用的信息。图像预处理技术分为图像增强技术和图像复原技术两大方面。在图像预处理中,图像增强技术占据越来越重要的位置,并是已发展为不可忽视的步骤,以人为因素为主,突出人们需要的特征,弱化那些不是很重要的特征。图像复原主要是用来还原图像最初的本质。图像增强是强调的是人们需要的特征和弱化不需要的特征为原则的。字符分割是一种重要的图像分析技术。字符类型图像分割是图像分割的一个重要应用领域,也具有很大的应用,至今已有很多种的切割方法。本文主要研究和结合现有字符分割的算法,并在此基础上进行改进和进行整合形成新的算法用于实现西傣文预处理及文字分割,首先对傣
16、文字符图片进行预处理,接着对西傣文字符图片进行分割,然后再对切割后的字符做归一化处理,从而形成新的样本库。具体地说,就是将扫描进来的西傣族文图像使用图像中值去噪理论算法将图片去噪。目前大多数的滤波方法可以产生模糊的边缘,边缘失真,细节废弃等后果,因字 符 预 处 理 及 分 割 算 法 实 现- 3 -此还必须采用二值化操作,可进一步对图像进行处理,获得图像或者其他更多功能的一些几何特征。字 符 预 处 理 及 切 割 算 法 实 现- 4 -在将字符扫描成图像的过程中,难免会出现字体倾斜的状况,所以还需最后一项处理实现对图像的倾斜校正。将预处理的图像运用阀值分割技术将字符分割出来,并将分割出
17、来的图片安照字号的大小进行归一化处理,最后形成样本库。如图2.1所示为主要流流程图。图2.1系统主要流程图字 符 预 处 理 及 分 割 算 法 实 现- 5 -3.字符预处理及分割算法实现3.1 系统开发环境仿真程序是在matlab12.0 集成开发环境运行,matlab 具有强大的绘制图形功能。本身提供了能够绘画出很多各种二维和多维图形的库函数。这些图形可以在计算机打印设备上打印出来,使技术数据可视化。在其他语言的使用程序,往往会在算法的选择上很麻烦,但是,MATLAB本身带有许多函数提供了有自适应能力的算法,它会依据情行选择最合适的算法,如此,当使用其他语言编写时,因为算法上的选择不恰当
18、。设计复杂,运行效率低甚至会出现一些不可预知的错误,可是MATLAB 本身就还有很多图像处理高效算法,直接调用即可。所以用MATLAB 在字符预处理及分割算法实现会达到事半功倍的效果。3.2 中值滤波去噪3.2.1中值滤波器简介目前,图像滤波可分为线性滤波技术和非线性滤波技术两种。线性滤波因以完善的理论基础、数学处理简单等长处,使其在图像滤波范畴中一直占据重要的地位,也是源于此使在那些低频分量加性高斯噪声的平滑中能取得令人满意的结果。相反在抑制脉冲信号及高频分量的未能发挥很好的作用。非线性滤波是一种非线性映射关系,主要是基于对输入信号序列的,在处理过程中往往可以将特定的噪声近似地映射为零,继而
19、保留信号的重要特性,从而在一定程度上可以弥补线性滤波器的一些不足之处。由于图像的很多噪声是高斯噪声及椒盐噪声,通过中值滤波器可实现图像降噪。3.2.2中值滤波器的基本理论中值滤波属于非线性平滑滤波技术。该方法不仅可以保护图像的细节信息,可以有效地过滤图像处理领域中的噪声,所以深受欢迎。中值滤波是图像处理中的一个步前提,它主要用于散斑噪声和椒盐噪声。保留边沿的特征使它在不希望出现边缘模糊的情景也能发挥作用。在图像处理中,在进行如边缘检测这样的进一步处理之前,首先往往需要进行一定程度的降噪。中值滤波是一种非线性滤波技术,已被广泛应用于在图像或其他信号的噪声去除。该设计原理是通过检查输入信号中的采样
20、并检查其是不是信号,采用技术个采样组成的观察窗实现这项功能。观察窗口中的数值进行排序,处于观察窗中间的中值作为输出。然后,丢弃最早的计算值,取出了新的采样,计算并重复上述过程。字 符 预 处 理 及 分 割 算 法 实 现- 6 -邻域平均算法去消除噪声的同时往往会模糊掉图像中的一些细节。那么如果有必要消除噪声和保留图像细节,你可以使用中值滤波。中值滤波是一种可以很好地抑制图像中噪声的非线性信号处理技术。中值滤波算法的设计原理是通过计算图像像素点的邻域内的灰度值中值来代替该邻域像素点的灰度值。因为它与邻域内的那些与典型值差别很大的值并不存在依赖关系。使其不仅去除了脉冲噪声、椒盐噪声,还能很好的
21、保留图像边缘细节。中值滤波消除孤立的噪声点的主要方式是先找出周围像素灰度差值比较大的像素点,接着将这些的像素改为与周围像素值接近的值。中值滤波的算法描述:设 是输入图像在坐标 处的像素,在其周围开一个ijxji,的矩形窗口。假设窗口从第一行开始由左向右水平扫描,接着跳到下一行重复扫nm描。将每一个窗口得到的全部像素按其灰度值的大小进行排序,求出中值 替换 。Mxij(1)matlab仿真程序 -对有椒盐噪声的图像处理function quzhao()I,map = imread(011.bmp);J=rgb2gray(I);% 变为二维灰度图像figure;subplot(2,2,1);ims
22、how(I);title(原始 图像 );J2=imnoise(J,salt % 叠加密度为0.05 的椒盐噪声subplot(2,2,2);imshow(J2);title(加有椒 盐噪声图 像 );h2=fspecial(average,3,3);%生成一个3*3邻域平均窗函数B2=filter2(h2,J2);%邻域平均subplot(2,2,3);imshow(B2, );title(邻域平均法 滤波 );K=medfilt2(J2);subplot(2,2,4);imshow(K);效果图如图3.1 所示(2)matlab仿真程序 -对有高斯噪声的图像处理function quzha
23、o2()字 符 预 处 理 及 分 割 算 法 实 现- 7 -I,map = imread(011.bmp);J=rgb2gray(I);% 变为二维灰度图像figure;subplot(2,2,1);imshow(J);title(原始 图像 );J1=imnoise(J,gaussian,0,0.04);% 叠加密度为0.04的高斯噪声subplot(2,2,2);imshow(J1);title(加高斯噪声 图像 );h2=fspecial(average,5,5);%生成一个5*5邻域平均窗函数B2=filter2(h2,J1);%邻域平均subplot(2,2,3);imshow(
24、B2, );title(邻域平均法 滤波 );K=medfilt2(J1);subplot(2,2,4);imshow(K);title(中值滤 波 );3.3 灰度图像二值化3.3.1 图像二值化概念二值化是图像处理中的预处理过程的一个基本技术。图像平滑去噪过程中难免会出现损失原图像的许多有用信息的状况,因此在进行二值化预处理过程中,十分关键就是保留好原图的主要特征。在不同的目标背景下,对图像二值化时阈值选择是有差别的。字 符 预 处 理 及 分 割 算 法 实 现- 8 -人为选择是比较困难和难以把握的,由此我们选择自适应图像阈值的选取方法。进行图像二值化操作包括彩色图像灰化和增强两部分。
25、因为选定的阈值需要参考直方图,因此在图像处理中,我们可以参考得到的直方图来选取阈值。整个流程如下所示: 读取图像灰度图像图像增强图像直方图二值化处理图像二值化是图像预处理中一个重要技术,如果再选择过程中阈值选择不当将大量的有用原始信息损失掉。图像二值化处理的方法包括全局阈值法、局部阈值法。图 3.1 对有椒盐噪声的图像处理图字 符 预 处 理 及 分 割 算 法 实 现- 9 -图3.2对有高斯噪声的图像处理3.3.2 全局阈值法全局阈值法是指在二值化过程在二值化过程中,运用全局阈值法设定一个全局阈值 T,将图像的各个点像素的灰度值与 T 进行比较,若小于 T,则取为背景色;否则,取为前景色。
26、阈值 T 依据图像的直方图或灰度空间分布来确定,通过该阈值实现灰度文本图像到二值图像的转化。阈值分割法主要以阈值的选择为主,它很大程度上绝对决定着图像的分割效果。算法容易理解,对于 Otsu 方法、最大熵方法为常用的全局阈值法。全局阈值法能在直方图分布呈双峰、目标和背景明显分离的图像能取得良好效果。但因噪声干扰较大、光照不均匀等原因破坏的图像,并由此造成直方图分布未呈双峰的,二值化效果明显变差。Otsu 方法是一种全局化的动态二值化方法,它是基于整幅图像的统计征,实现阈值的自动选取。其设计原理是通过某一灰度值将图像直方图分割成两类,各自计算这两类的像素点数以及灰度平均值,然后计算两者的类间方差
27、。当被分割成的两类间方差最大时,此灰度值就作为图像二值化处理的阈值。 对图像 Image,设 为目标与背景的分割阈值, 为目标像素数占图像比例值,t 0设为平均灰度;背景像素数占图像比例为 ,平均灰度为 。图像的总平均灰度为:0 11。从最小灰度值到最大灰度值遍历 ,当 使得值)()(10tt t最大时 即为分割的最佳阈值。22g t设 图像 点处的灰度值为 , 设为灰度级,不妨假定 取值MN,ji ),(jif ),(jif。记 为灰度值为 k 的频率,则有:1,m)(kp字 符 预 处 理 及 分 割 算 法 实 现- 10 -(1)kjifMNkp),(1)(假定用灰度值 t 为阈值分割
28、出的目标与背景分别为: 和 ,于),(tjif),(tjif是 目标部分比例: , (2)tip0)()(目标部分点数: (3)ti背景部分比例: (4)11)()(mitp背景部分点数: (5)itPMN目标均值: (6)tipt00)(/)(背景均值: (7)111mit ti总均值: (8)()(0t大津法指出求图像最佳阈值 g 的公式为:(9)()( 21201-mt0 tttMaxArg从上式子可知类间方差值是通过(9)的右侧中括号的算式计算的,整幅图像分别阈值 g 分割出的背景和目标两部分构成,而概率为 ,目标值 ,概率为 ,背)(1t)(0t)(0t景取值 ,总均值为 ,这是通过
29、方差的定义得到的。因方差是灰度分布均匀性的)(1t一种度量,方差值的大小直接反应构成图像的两部分的差别,其成正比的关系,当部分目标被错分为背景时或部分背景错被错分分为目标时都会导致两部分差别变小,所以如果你想错分概率最小,那么你就该使类间方差最大的分割。如图 3.3 为读入的原始图,图 3.4 为灰度图像由 Otsu 方法得到的二值图像。字 符 预 处 理 及 分 割 算 法 实 现- 11 -图3.3原始图像图 3.4Otsu 方法得到的二值图像字 符 预 处 理 及 分 割 算 法 实 现- 12 -3.4 图像的倾斜校正3.4.1图像的倾斜角度矫正概述倾斜图像的校正是图像预处理的一部分,
30、一个字符正确被分割重要的前提。通过扫描得来的印刷字体图像将不可避免一定程度的倾斜。这种倾斜会对后面字符分割带来严重的困难,因此为了后面工作的顺利进行需要提前给倾斜的图像给予纠正,这一节主要讨论的是图像倾斜角度矫正的算法,包括算法的原理,算法步骤,具体的程序实现过程,仿真结果。在此之前先讨论一下常用的矫正倾角的方法:Hough 变换法、Radon变化法、线性回归法和两点法。Hough变换法和Radon变化法相似,其抗干扰能力比较强且进行倾角检测的最大精度为1度,因而运算量大,程序执行较慢。其优点是直线倾角可以断点计算。最小二乘法容易受到噪声的污染,且其干扰能力很很差,但是它的运算量小,但。两点法
31、采样点比较多并且这些点需要服从随机分布,不仅理论简单,而且计算均值后能有效抑制干扰。故,综合现实条件和自己水平出发比较适合本人的是Radon变化法。3.4.2 Radon变换法 定义:设二元函数 f(x,y)的投影为在某一方向上的线积分,投影可沿任意角度进行。例如 f(x,y)沿 y 方向上的投影是其水平方向上的线积分,f(x,y)沿 x 方向上的投影是其在垂直方向上的线积分,沿 y方向的线积分是沿 x方向上的投影。通常 f(x,y)的 Radon 变换是 f(x,y)平行于 y轴的线积分.。图3.5矩形函数在水平垂直方向和沿角方向的投影字 符 预 处 理 及 分 割 算 法 实 现- 13
32、-图3.5矩形函数在水平垂直方向和沿 角方向的投影一幅图像在任意点 上的相对线性衰减系数 与该点灰度值的成正比关系(.)xy(,)xy的。因而,可以将重建算 法为基础的理论称为“由投影重建图像”。所谓投影是测量值,是吸收系数 沿着射线经过直线的积。事实上,(,)(,)spxd (,)是沿着若干条直线的积分估算值来计算值。在某种意义上说,Radon 在 1917 年y就已经解决了这个问题。通常所说的 Radon 变换式是一种投影表达式。也就是说,函数 (,)(cosin,scos)fxyfyxy的Radon变换定义为:(,)(,)(i,ncs)fpfxyd即 在 角的 射线的一维投影信号。如图3
33、.4倾斜校正前原始图,图3.7为倾斜xyx校正后的图像。字 符 预 处 理 及 分 割 算 法 实 现- 14 -图3.6 倾斜校正前原始图图3.7倾斜校正的图像3.5 字符阀值分割技术研究字符分割是一种重要的图像处理技术,已广泛应用于各个领域。图像分割是把图像中人们需要的特征区域提取出来。阈值分割是一种简单有效的图像分割方法。区分物体和背景是通过确定一个或多个灰度值来完成的,用像素的灰度值同门限值进行比较来划分像素到物体区或背景区。该分割法能够在物体与背景之间存在明显区别的景物取得很好的效果。但近些年随着对阈值法的不断探索,以及不少的新方法的出现,使得图像中的物体与背景之间差异并不是十分明显
34、的分割也取得很好的效果。事实上,在许多的实用图像处理系统中,最后都会用到阈值化技术。设给定的灰度图像为f(x,y)t1,t2,用某种确定的方法得到一个或多个阈值子集t t1,t2。为了说明图像阈值化分割,现以子集 t为例,由于利用一个或多个阈值的原理跟它是等同的。根据个像素是否属于t将其进行分类,即:(1),(yxg),(tyxfab其中,axy,bxy 分别为指定的灰度值或原灰度值。若取axy=1,bxy=0 ,图像分割成二值图像。背景和目标具有最大的对比度。如果取axy=f(x,y),bxy=0,则图像分割后的背景为0,目标保留原灰度,且目标图像的背景是干净的。由图像二值话可知,阈值法的难
35、点是对阈值的选取,所以对阈值化方法的研究,选取阈值的方法的探索是关键。为了加深阈值法的理解,我们需要看看几个不同的阈值方法的原理。常用的有三种,直接阈值法,间接阈值法,多阈值法,全局阈值和自适应阈值,阈值化方法中阈值的确定,其中阈值化方法中阈值的确定法又可分为边界灰度作为阈值,根据直方图谷点确定阈值,基于统计学的方法。根据现实条件和个人水平限制本文主要以根据直方图谷点确定阈值作为研究。它源于全局阈值分割方法中的直方图双峰法。假如各自处于不同灰度级的物体和背景,字 符 预 处 理 及 分 割 算 法 实 现- 15 -所在的图像被零均值高斯噪声污染。图像的灰度分布曲线与用两个正态分布概率密度函数
36、相似,可用来表示目标和背景的直方图,利用这个函数的合成曲线拟合整体图像的直方图,图像的直方图将会出现两个分离的峰值。该方法适用于具有双峰性质良好的图像,但需要数值近似计算,然而许多图像直方图是离散的、不规则的。那么可以先图像的灰度直方图作出来,找到图中的双峰,看双峰间是否有明显的谷底,若有那么可以将谷底点所对应的灰度值作为阈值T,然后根据该阈值进行分割,即可将目标从图像中分割出来。如图3.8所示水平垂直投影的运算效果图,如图3.9所示为切割字符的前15个字符。Matlab 仿真程序集及结果如下:%I2为灰度图像 ,并以完成去噪二值化,倾斜校正Imax=double(max(max(I1); %
37、返回最大值Imin=double(min(min(I1); %返回最小值T=round(Imax-(Imax-Imin)/2); %确定阀值I2=(I1)=T;width, length = size(I2); %求图片长宽marRow = ones(width, 1); %存储行的像素值的 width*1 矩阵marCol = ones(1, length); %存储列的像素值的 1*length 矩阵% 求行的投影 值 %for row = 1 : widthrFlag = 0; % 记录行的像素点for col = 1 : lengthif I2(row, col) = 0rFlag =
38、 rFlag + 1; %记录 像素点endendmarRow(row, 1) = rFlag; %记录投影点R+1;endbottomR = ;n1 = 1;for row = 1 : width-1if (marRow(row, 1) = 0) n1 = n1 + 1;endend字 符 预 处 理 及 分 割 算 法 实 现- 16 -% 求列的投影 值 % numC = 1;for col = 1 : lengthcFlag = 0; % 记录列的像素点for row = 1 : widthif I2(row, col) = 0cFlag = cFlag + 1; %记录 像素点end
39、endmarCol(1, col) = cFlag; %记录投影点endrightC = ;n2 = 1;for col = 1 : length-1if (marCol(1, col) = 0) n2 = n2 + 1;endendrow = 1;col = 1;top = 1;% bottom = 1;xflag = 1;left = 1;% right = 1;file = ;r = 1; c= 1;% 分 割 %for r = 1:n1-1for c = 1:n2-1bottom = bottomR(r);right = rightC(c);for rpix = 1 : bottom
40、- topfor cpix = 1 : right - leftfile(rpix, cpix) = I2(top + rpix -1, left + cpix -1);endendnewName = sprintf(images/char%ld.bmp, xflag);imwrite(file, newName);xflag = xflag + 1;left = right;end字 符 预 处 理 及 分 割 算 法 实 现- 17 -top = bottom+1;end图 3.8 水平垂直的投影图图 3.9 切割后的单前 15 个字符字 符 预 处 理 及 分 割 算 法 实 现- 18
41、 -3.6 分割字符的归一化处理归一化的目的是将3.5中的切割而来的字符按字号大小逐渐地放大,matlab图像处理工具箱中的imresize 函数和imrote函数。不用自己写算法就可以对图像进行放大、缩小,旋转等多种处理操作。然后在放大过程中,有些像素值分布不均匀会出现一些失真现象,matlab图像处理工具箱也提供了最近邻点法和双线性插值法可以很好的解决非整数点灰度值的校正。图3.11为运行效果图图3.11其中一个字符归一下放大的效果Matlab仿真程序为及结果为:%采用插值的方法为,即最近邻插值(默认)、双线性插值、双三次插值J=imresize(I,0.5);p=imresize(I,3
42、,bilinear);q=imresize(I,3,bicubic);figure,imshow(J);字 符 预 处 理 及 分 割 算 法 实 现- 19 -title(将原图像缩小0.5倍 );figure,imshow(p);title(双线性插值放大3倍);figure,imshow(q);title(双三次插值放大3倍);字 符 预 处 理 及 分 割 算 法 实 现- 20 -4.系统测试4.1 预处理集成测试图4.1预处理测试效果4.2 系统集成测试图 4.1 所示为运行之时的效果图,其中将分割后的字符按字号的大小放在工作目录下的 images 文件中,图 4.2 是字符预处理
43、完分割处理过程图,图 4.3 为字符预处理完分割后的效果。字 符 预 处 理 及 分 割 算 法 实 现- 21 -图 4.2 为字符预处理完分割处理过程图图 4.3 为字符预处理完分割后的效果字 符 预 处 理 及 分 割 算 法 实 现- 22 -图 4.3 归一化后的目录结构图字 符 预 处 理 及 分 割 算 法 实 现- 23 -结 论本文主要从事西傣文字分割及样本库构建研究,对扫描的西傣文档图片进行去噪,平滑,二值化,倾斜矫正等预处理及字符分割,从中能找到较好的图像预处理技术,将模糊的字符修复完整变清晰并将其完整的切割出来。现在主要得出种图片的预处理方法和切割方法。预处理的三种方法
44、1.图像灰度化 事实上 RGB 并未能反映图像的形态特征,它只是以光学的原理上对颜色的进行调配。但如今大多数的彩色图像都是采用 RGB 颜色模式。处理图像的时候,要分别对RGB 三种分量进行处理。因此人们在处理和预处理时可以先处理灰度图像,方便对图像的后续化处理,降低图像的复杂度和信息处理量。2.直方图变换图像的灰度直方图是反映图像的像素灰度级与这种灰度级出现的概率之间的相对关系的图形。假如图像的视觉效果差或者未能满足人们特殊需要,常常需要对灰度级图像进行修正,即对图像的直方图进行转换。3.图像平滑去噪灰度变换、直方图修正都是简单的图像预处理, 然而这些预处理是以图像未受到污染为前提,即未由于
45、各种原因产生噪声或受到不规则的破坏。此时灰度变换和直方图就不能达到我们预期的效果了,对于图像的复杂处理就必须采用平滑减噪方法三种分割法1.基于阀值的分割不同的目标值的灰度值是通过阀值来区分的。在图像只有目标和背景的情况下,只需选取单阀值分割,将图像每个像素的灰度值和阀值比较,灰度值大于阀值的像素和灰度值小于阀值的像素分别归类。2.基于区域的分割它包含区域生长和分裂合并两种基本形式。区域生长的原理是从单像素出发,逐渐合并并慢慢得到所需的分割结果。分裂合并的原理是从整个图像出发,逐渐分裂或合并过程中得到想要的的分割结果。与阀值方法有差别的是,该方法不仅考虑了像素的邻接性,而且考虑了空间上的相似性,因此可以有效地消除孤立噪声的干扰,具有很强的鲁邦性。3.基于边缘的分割字 符 预 处 理 及 分 割 算 法 实 现- 24 -在图像中不同的区域的像素灰度不连续的,这些特征可以帮助检测出区域的边缘,从而实现图像分割。图像的像素灰度值变化较剧烈一般是在边缘,可以先从图像中的边缘点,接着以一定策略连接成轮廓,最后构成分割区域。