1、基于图像分割的维语文字识别的研究 杨丽 西南民族大学计算机科学与技术学院 摘 要: 人工智能的不断发展带动着图像识别技术的飞速发展, 各种研究图像识别的方法不断涌现, 目前维吾尔语的研究尚处于初步探索阶段, 因此寻找一个可靠软件对维语字符的识别很关键, 文章重点讨论了维语图像的分割以及识别技术, 包括图像归一化、傅里叶变换、模糊匹配法等关键技术, 应用 MATLAB 软件, 数学模型与计算机技术巧妙结合实现对数字图像的识别及处理, 仿真结果对维吾尔语文字识别研究具有一定意义。关键词: 维吾尔语; 图像分割; 傅里叶函数; 模糊匹配; 作者简介:杨丽 (1994-) , 女, 四川南充人, 硕士
2、研究生, 研究方向:软件工程, 算法。收稿日期:2017-06-15Research on Uighur text recognition based on image segmentationYANG Li School of Computer Science and Technology, Southwest Minzu University; Abstract: The development of artificial intelligence led the rapid development of the technology of image recognition, image
3、 recognition methods continue to emerge, the Uighur study is still in the preliminary stage, so looking for a reliable identification of Uighur character software is the key, this paper focuses on the segmentation of Uighur image and recognition technology, including image normalization, Fourier tra
4、nsform, fuzzy matching method, key technology, application of MATLAB software, mathematical model and computer technology combined and recognition of digital image processing, the simulation result has a certain significance to the study of word recognition in Uyghur language.Keyword: Uyghur; image
5、segmentation; Fourier function; fuzzy matching; Received: 2017-06-15文化是一个民族的代表, 而语言是构成文化的重要工具, 是民族的重要特征之一, 是人们进行交流的基本表达符号, 人们通过语言传递感情, 因此一个民族语言的发展很大程度上反映了民族的发展。新疆以维吾尔族为主体, 占总人口60%左右, 维语是他们所使用的的主要语言, 维语属阿尔泰语系突厥语族西匈语支, 现代维吾尔语共有 32 个字母, 其中有 8 个元音, 24 个辅音, 新疆本地人民现大多数使用两种形式的维语:维吾尔拉丁字母和维吾尔阿拉伯文, 维吾尔阿拉伯文是维吾
6、尔人主要使用的语言, 维吾尔拉丁字母作为补充, 本文的研究对象是维吾尔阿拉伯文字符, 选取任意的字符进行识别, 具有广泛性。1 图像分割图像分割是图像识别和图像分析的前提条件, 分割质量的好坏直接影响到后续图像处理的效果。识别主要经过以下几个步骤:(1) 图像获取:获取主要是通过我们现在普遍使用的手机自带相机或者是平板, 目前手机发展迅速, 相机像素质量较高, 通过将手机上传将获取的照片存储在计算机中, 此时存储的照片是彩色图像。(2) 图像处理:获取的图像是彩色图像, 不利于图像处理, 因此利用 MATLAB 软件中自带的转换函数 (rgb2gray) 将彩色 RGB 图像转换成灰度图像,
7、这样更有利于识别图像的特征及处理分析。(3) 图像分割:即对目标与背景进行标记、定位、生长、分裂等将待识别的目标从背景中或者其他相干扰的噪声中提取出来, 传统的分割方法主要有边缘检测分割法、阈值分割法、区域分割法等, 研究最多的是阈值分割法;并且随着算法及人工智能的发展, 更多的是将智能算法与这些方法相结合进行研究, 能够较好地分割出图像特征, 只有有效的分割, 才能进一步对图像进行识别, 甚至是翻译。(4) 图像识别:对于维吾尔语数字图像的识别, 本文采用模糊匹配法与傅里叶函数相结合的方法进行研究。2 傅里叶变换图像是在连续空间上采样得到的一系列点的集合, 一般将这些点在二维空间上用矩阵的形
8、式表示, 但空间是三维的, 因此需要将物体的维度改变以方便进行研究, 而傅里叶变换就是将图像从频率域转换到空间域或者是说将图像的频率分布函数变换为灰度分布函数, 在频谱图上我们可以看到不同亮度的点, 图像上某点与邻域差异的强弱就是梯度大小, 通过梯度值可以判断图像的性质柔和或尖锐, 若暗的点数多即为柔和, 亮的点数多即为尖锐。在本文中我们利用二维离散傅里叶变换函数, 形式如下:(u, x=0, 1, 2, , M-1;v, y=0, 1, 2, N-1) ;x, y 为时域变量, u, v 为频域变量。其中, 傅里叶频谱、相位谱、能量谱分别为:R (u, v) 和 I (u, v) 分别是 F
9、 (u, v) 的实部与虚部。本文采用傅里叶的可分离变换性质, 即正向变换与反向变换, 结合 MATLAB 软件中自带的黑白色素可相互取反函数, 即用两次一维变换来实现, 先对 f (x, y) 的每一行进行一维变换得到 F (x, y) , 再沿 F (x, v) 每一列取一维变换得到变换结果 F (u, v) , 相反地也可以先对 f (x, y) 的每一列进行一维变换得到F (y, v) , 再沿 F (y, v) 每一行取一维变换得到 F (u, v) , 其最终结果是一样的。3 图像识别图像在人类的感知中扮演者非常重要的角色, 其传递的信息比任何其他形式更加丰富形象, 图像识别属于人
10、工智能研究领域的一大重要方向, 也是模式识别与图像处理的研究热点, 图像识别主要包括人脸识别、指纹识别、文字文本识别、数字图像识别等。文献3研究深度学习与支持向量机结合的方法对图像进行识别, 对卷积限制性玻尔兹曼机构成的卷积深度信念网络的训练过程进行改进, 证明此方法的可行性与有效性;文献4将图像识别应用到工程电子手薄系统的实际需求完成环境信息的自动录入到智能手机上, 实现地面图片的自动判别并对地面环境进行拍摄存储、识别、分类等操作;文献5提出基于 K_L 变换的水下目标图像的识别方法, 通过降维处理、提取特征等有效的对水下目标图像进行识别, 较好地解决了海洋不可测问题。图像识别应用这么广泛,
11、 但大多数都是基于汉字语言展开的研究, 对于特殊语言, 如维语的研究较少, 因此, 本文采用计算机与数学模型相结合的研究方法, 利用模糊匹配法及数学建模工具 MATLAB 对维吾尔语进行识别分析。以下将基于 MATLAB 2016b 软件对数字维语及字符进行识别研究分析, 如图 1 所示:图 1 图像识别流程图 下载原图模糊匹配是将字符图像与事先建立的标准模板比较, 若输入图像与此模板匹配得好就可以把它确定为这个模板对应的图像, 本文采用 MATLAB 中自带函数对维语中的字母以及字符进行灰度转换、二值化、归一化, 显示结果如图2、3、4、5、6 (本文所采用的图像样本来自于一位维吾尔族同学的
12、笔迹) , 从最终分割处理的结果来看, MATLAB 软件的识别能力很好, 可用于更多的图像识别。图 2 字母 a 转换为灰度图像 下载原图图 3 字母 b 转换为灰度图像 下载原图图 4 字母 c 转换为灰度图像 下载原图图 5 字符“你好吗”转换为灰度图像 下载原图图 6 字母 a、b 归一化处理 下载原图图 7 字符“你好吗”归一化处理 下载原图在进行傅里叶变换前, 将图像 (以下操作只选取字母 a 进行仿真, 因为维语字符是由各种字母构成的) 进行取反变换, 方便后续进行傅里叶变换, 如图 8 所示:图 8 字母 a 取反操作 下载原图如图 9、10 所示, 对图像进行快速傅里叶变换,
13、 并给予峰值谱与相位谱得出各自的零频中央谱, 可以看出图像大部分能量集中在低频区域, 即中间位置, 此图像相对噪声较少, 因此识别效果更佳。图 9 傅里叶变换 下载原图图 1 0 字母 a 能量谱 下载原图图 9 中的识别结果显示看不清楚, 因此我们将最后一副图像单独提取出来利用边缘检测再上图像增强方法重新进行识别, 如图 11 可以看出识别效果很好。图 1 1 识别结果 下载原图5 结束语图像识别技术的发展使得图像分割迅速发展, 作为图像数据分析处理的重要步骤, 在计算机知识中融合数学理论显得格外重要, 并且数学软件 MATLAB 功能之强大, 在一定程度上可以帮助数学专业出身的人更好地了解
14、软件知识, 也使一些向往计算机方面发展的数学人才更好地将数学理论与计算机实践相结合。本文不采用研究热点-阈值分割, 而选择归一化分割算法对图像进行处理, 并通过傅里叶函数本身特性得出的结果识别性能较高。参考文献1阳树洪.灰度图像阈值分割的自适应和快速算法研究D.重庆大学, 2014. 2王冰, 职秦川, 耿国华, 等.基于函数映射的快速傅里叶变换算法J.光子学报, 2002 (10) :1233-1237. 3丰晓霞.基于深度学习的图像识别算法研究D.太原理工大学, 2015. 4王明潇.图像识别算法研究及其智能终端上的实现D.北京邮电大学, 2010. 5肖璐, 冯西安.KL 变换在水下目标
15、声图像识别中的应用研究A.中国造船工程学会电子技术学术委员会.中国造船工程学会电子技术学术委员会2012年水下复杂战场环境目标识别与对抗及仿真技术学术交流论文集C.中国造船工程学会电子技术学术委员会:, 2012:4. 6冯阿瑞.图像归一化分割方法研究D.重庆大学, 2014. 7余成波.数字图像处理及 MATLAB 实现M重庆:重庆大学出版社, 2000 8Iianbo Shi, Jitendra Malik.Normalized Cuts and Image SegmentationJ.IEEE Tramsaction on Pattern Analysis and Machine Intelligence, 2000, 22 (8) :888-905.