收藏 分享(赏)

联机手写汉字识别的设计与实现.pdf

上传人:精品资料 文档编号:11132827 上传时间:2020-02-08 格式:PDF 页数:69 大小:1.37MB
下载 相关 举报
联机手写汉字识别的设计与实现.pdf_第1页
第1页 / 共69页
联机手写汉字识别的设计与实现.pdf_第2页
第2页 / 共69页
联机手写汉字识别的设计与实现.pdf_第3页
第3页 / 共69页
联机手写汉字识别的设计与实现.pdf_第4页
第4页 / 共69页
联机手写汉字识别的设计与实现.pdf_第5页
第5页 / 共69页
点击查看更多>>
资源描述

1、 Civil Aviation University of China 毕 业 设 计 (论文 ) 专 业: 计算机科学与技术 学 号: 070341115 学生姓名: 刘 光 泽 所属学院: 计算机科学与技术学院 指导教师: 李 春 利 二 一一 年 六 月 中国民航大学本科生毕业设计 (论文 ) 联机手写汉字识别的设计与实现 The Design And Implementation Of Online Handwritten Chinese Character Recognition 专 业 : 计算机科学与技术 学生姓名 : 刘光泽 学 号 : 070341115 学 院 : 计算机科

2、学与技术学院 指导教师 : 李春利 2011 年 6 月 创见性声明 本人声明:所呈交的毕业论文是本人在指导教师的指导下进行的工作和取得的成果,论文中所引用的他人已经发表戒撰写过的研究成果,均加以特别标注并在此表示致谢。与我一同工作的同志对本论文所做的任何贡献也已在论文中作了明确的说 明并表示谢意。 毕业论文作者签名: 签字日期: 年 月 日 本科毕业 设计( 论文 ) 版权使用授权书 本毕业 设计( 论文 ) 作者完全了解中国民航大学有关保留、使用毕业 设计(论文) 的规定。特授权中国民航大学可以将毕业 设计(论文) 的全部戒部分内容编入有关数据库进行检索,并采用影印、缩印戒扫描等复制手段保

3、存、汇编以供查阅和借阅。同意学校向国家有关部门戒机构送交 毕业设计(论文) 的复印件和磁盘。 (保密的毕业论文在解密后适用本授权说明) 毕业论文作者签名: 指导教师签名 : 签字日期: 年 月 日 签字日期: 年 月 日 -i- 摘 要 随着计算机技术特别是互联网技术日新月异的发展,人类步入了信息时代。在中国,个人计算机已进入千家万户。在计算机上使用汉字,首先遇到的问题是如何有效地输入汉字,汉字输入直接影响着计算机中文信息处理的应用与发展。 在计算机上输入汉字,大都使用拼音法输入,常常不是拼不出,就是读不准,想用类似五笔法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎

4、。该方法完全符合人们的日常书写习惯,与平常书写汉字时一样 ,差别仅仅是使用 者需要将输入的汉字写在“手写板”上,计算机通过捕获书写笔迹的 点进行汉字识别, 从 而完成汉字输入。 论 文 论述了一种基于汉字笔 划 的联机手写汉字识别系统的研究与实现,在设计上通过实时捕获书写笔 划 的轨迹,识别出汉字的笔 划 ,再根据笔 划 序列查找对应的汉字 ; 当存在多个相似的笔 划 序列时 再根据输入笔 划 的像素统计结果给出最可能的结果。 在实现上不 需专用的“书写板”,仅用鼠标作为手写汉字输入的工具。 论 文所采用的笔 划 识别方法是以笔 划 方向码的概念为基础。笔 划 可以细分成笔划 段,本文将这些笔

5、 划 段分别用 8 个笔 划 方向码来表示。 在书写笔 划 的过程中,笔划 轨迹是由一系列坐标点组成 , 这些坐标点是离散的。本文用 8 个笔 划 方向码标记每 1 段最小直线所属的方向。每 1 个笔 划 的书写轨迹都可以产生出 1 个方向码序列即当前笔 划 的笔段序列。算法通过对 方向码进行噪声处理、归并之后得到笔 划 的方向码序列;并通过对笔 划 的像素进行统计得到分区处理后的像素比例。 论文设计了基于汉字笔 划 的联机手写汉字识别系统的工作流程。汉字识别中主要讨论了 以下几 个问题 :(l)单一笔 划 的识别方法 ; (2)汉字笔 划 串的匹配 ; (3)图像统计 特征 的匹配 以及相关

6、问题。 在书写工整的情况下系统识别率 可达到 90%左右。 关键词 :联机手写汉字识别 ;笔 划 ;方向码 ;模式识别 ;统计 特征 -ii- ABSTRACT With the computer technology, especially the rapid development of internet technology, mankind entered the information age. In China, many families have personal computers. The use of Chinese characters in computers, th

7、e first encountered the problem is that how to effectively input Chinese characters. Chinese character input directly affecting the computer and information processing application development. Many Chinese keyboard input methods, mainly boil down to two categories: Pinyin input method and Codes inpu

8、t method. When people input Chinese words into computer they have such worries. When using of phonetic input method, user pronunciation is not correct. When using of Codes input method, user dont know how to split the Chinese characters. In light of this situation, handwritten input method has becom

9、e increasingly popular. People can write entirely in accordance with their daily habits. When writing characters, users only need to input the Chinese characters in “tablet”, and computer captures the points of handwriting to accomplish Chinese characters recognition, and then complete inputting Chi

10、nese characters. Paper discusses an online handwritten Chinese character recognition system and its implementation based on strokes. The system identifies the Chinese character strokes by real-time capturing the trajectory of strokes, and then identifies the corresponding Chinese character stroke se

11、quence. When there are several similar stroke sequences, it use the pixel statistics to give the most possible results. In realization, special input tool is not needed but a mouse. The method of stroke recognition which is taken by this thesis is based on the concept of the code of stroke direction

12、. Stroke can be broken down into stroke sections, which are coded by eight directions. In the process of writing strokes, stroke path consist of a series of coordinate points, and these coordinates are discrete. In this paper, eight directions are used to mark the smallest section of the stroke. Eac

13、h stroke is marked by a code sequence of direction. First the algorithm processes the noise of the direction, and then gives the most simple code sequence by merging the direction of strokes. And through the pixel statistics of strokes the proportion of pixels is given after partition. Thesis design

14、s the workflow of the online handwritten Chinese character recognition system based on strokes. Chinese character recognition focuses on the -iii- following issues: (l) the identification of a single stroke; (2) the matching of Chinese characters strokes sequence; (3) the matching of pixel statistic

15、s and some related issues. Written neatly the systems identification rate can achieve around90%. Key words: On-line handwritten Chinese character recognition; Stroke; Direction code; Stroke segment; Pattern recognition; Pixel statistics -iv- 目 录 引言 . 1 1 联机手写汉字识别概述 . 3 1.1 模式识别 3 1.1.1 模式识别 的 基本概念 3

16、 1.1.2 模式识别的基本方法 3 1.2 联机手写汉字识别 4 1.2.1 联机手写汉字识别的基本概念 4 1.2.2 联机手写汉字识别的原理框图 4 1.2.3 联机手写汉字识别的两类基本方法 5 1.2.4 联机手写汉字识别技术的发展与现状 7 1.2.5 联机手写汉字识别的一般方法及其难点 8 2 基于笔划方向和统计特征的手写汉字识别 . 11 2.1 基于笔划方向的联机手写汉字识别 11 2.1.1 笔划识别前的预处理 11 2.1.2 笔划方向码的合并 13 2.2 笔划串的匹配方法 15 2.2.1 笔划串间的距离 15 2.2.2 小结 16 2.3 基于图像统计的手写汉字识

17、别算法 16 2.3.1 算法描述 17 3 联机手写汉字识别系统的设计 . 18 3.1 可行性研究 18 3.2 需求分析 20 3.3 总体设计 21 3.4 详细设计 23 4 联机手写汉字识别的具体实现 . 26 4.1 开发环境分析 26 4.2 系统模块设计分析与实现 27 4.2.1 系统模块分析 27 4.2.2 系统各模块的实现 27 -v- 4.3 实验结果总结分析 30 5 总结与展望 . 32 5.1 论文总结 32 5.2 算法的前 景展望 32 参考文献 . 33 致谢 . 34 附录:外文翻译资料 中国民航大学本科生毕业设计 (论文) 1 引言 21 世纪是信息

18、的世纪,信息时代得到了进一步的发展 。在中国, 越来越多的人开始接触计算机,涉及到工作、生活、休闲 、 娱乐等各方面 。鉴于大多数中国人使用的是汉语和接受教育的不同程度 ,首先遇到的问题是如何 使大家 有效地 输入汉字,汉字输入直接影响着计算机中文信息处理的应用与发展。 在计算机上输入汉字,大都有这样的烦恼 :使用拼音法输入,常常不是拼不出,就是读不准 ;想用形码法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎。这个方法完全符合人们 的书写习惯,使用者只要像平常书写汉字时,将需要输入的汉字写在“手 写 板”的设备上,计算机通过捕获书写的笔迹轨迹点从而进行识别汉字, 而

19、完成汉字输入。 联机手写汉字识别的输入方法具有的优 点如下 : (l)手写输入完全符合人们的书写 习惯,人一边写、一边修改,机器一边识别。这种方法简单直观,方便实 用 。 (2)手写汉字识别技术可作为一种高速信息自动录入手段,也可作为未来计算机的重要智能接口,还可作为办公自动化、机器翻译、新闻出版等领域理想的输入方式,有着广阔的应用前景。 (3)汉字识别后将庞大的点阵图像压缩成机器内码表示,或者以 别的形式代替点阵图像, 能减少存储容量和通讯交流的信息量。 (4)手写汉字输入方式可以代替或部分代替键盘编码的汉字输入方法,该方法无需学习训练和记忆汉字编码规则,是一种最直接 和自然的输入方法。 (

20、5)联机手写汉字识别的应用 范围很大,只要具备一定的识别率和识别速度,它可以用在各种电子设备上以取代键盘输入。 从学科上来说,汉字识别属于模式识别与图像处理的范畴,还涉及到人工智能、形式语言与自动机、统计决策理论、模糊数学、信息论、语言文字学、计算机科学等学科,是一门综合性技术科学。由于汉字数量多,结构复杂,相似字很多,所以汉字识别是难度较大的文字识别。近年来,随着模式识别技术及计算机科学技术的发展,汉字识别也取的了极大的进展。 手写识别技术从样本采集的方式可分为联机识别与脱机识别两种 。联机识别能够记录笔在书写时的轨迹,故其较之脱机识别,优势在于样本中不但包含有汉字的形状信息,还包含有样本构

21、成的时序信息。如 :从汉字的联机识别样本中,我们可以获得汉字输入时的笔顺信息。近些年来,各种新式的联机输入笔不断出现,使书中国民航大学本科生毕业设计 (论文) 2 写轨迹更加容易捕获,书写更加舒服、容易。故联机样本的采集并不比脱机样本的采集困难。因此,我们有理由相信,联机手写字符识别将可采用更多的识别方法和具有更好的识别效果。 联机 (也称实时或在线 )手写汉字识别系统的识别对象虽然也是方块汉字,但是构成汉字的笔 划 在书写时是按照书写顺序依次送入计算 机的, 人一边使用输入设备在“手写板”上书写,计算机一边记录笔迹,以备 接下来的 识别使用 。 这样就将二位的图像转化为了一维的笔 划 串序列

22、 。联机识别利用书写板把笔 划 变为一维电信号,输入计算机的是以坐标点序列表示的笔尖移动轨迹,因而被处理的是一维的笔划 串。这种笔 划 串 含有笔 划 数目、笔 划 走向、笔顺和书写速度等信息, 这些信息的获取都要比脱机的手写识别输入方式要容易。 这是一种方便的汉字输入手段,用户面向计算机,可以利用交互方式进一步提高系统识别率。联机识别时,识别结果 具有实时性 ,显示在屏幕上,识别错了可以重写,从而对识别率的要 求可以降低。在各种自动识别输入的方法中, 联机手写汉字识别是 一种相对来说 能够 代替人工编码输入 方法 的 最理想的方法。 论文讨论的是联机手写汉字的识别输入方法。 联机手写输入的实

23、现相 对于脱机的方法来说要较容易实现。论文首先对手写汉字识别作了概述, 接下来 简介了联机手写汉字识别输入方法的发展现状和常用的方法; 接着介绍了论文使用的两个相关的方法及两者的在本题目中的使用方式;接着阐述了系统的具体实现方法和平台;最后对实验数据及结果作了总结及展望。 中国民航大学本科生毕业设计 (论文) 3 1 联机手写汉字识别概述 1.1 模式识别 1.1.1 模式 识别 基 的 本概念 模式识别 (Pattern Recognition)是人类的一项基本的智能,在日常的生活中人们经常进行“模式识别”。随着 20 世纪 40 年代计算机的出现以及 50 年代人工智能的兴起,人们当然也希

24、望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在 20 世纪 60 年代初迅速发展并成为一门新科学 1。 模式识别 (Pattern Recognition)是指对表征事物或现象的各种形式的 (数值的、文字的和逻辑关系的 )信息进行处理和分析 ,以对事物或现象进行描述、辨认、分类和解释的过程 ,是信息 科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,分为有监督的模式识别方法 和无监督 的识别方法 两种。 这两种模式识别方法的 主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在

25、实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。 1.1.2 模式识别的 基本 方法 1.决策理论方法 2 决策理论方法又称统计方法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一 个模式常常要用很大的信息量来表示。许多模式识别系统在数字化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这时,模式可用特

26、征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别 对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。 2.句法方法 句法方法又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的中国民航大学本科生毕业设计 (论文) 4 结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相

27、当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句 法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。 模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法;被识别对象不很复杂或不含明显的结构信息,一般采用决策理论方法

28、。这两种方法不能截然分开 ,在句法方法中,基元本身就是用决策理论方法抽取的。在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。 1.2 联 机手写汉字识别 1.2.1 联机手写汉字识别 的 基本概念 联机手写汉字识别 3-5就是指用户一边写字,机器一边识别处理,是一种实时识别方式。识别以笔 划 为单位,然后根据一个汉字的笔 划 组合、笔 划 之间的相对位置和关系,最终识别出汉字。 联机手写汉字识别是一种良好的人机通信方式,具有简捷、自然的特点,一直是智能计算机接口的研究重点,是一种人工实时把汉字输入计算机的方法。这种方法 在操作上和击键输入不同,使用者只要在专用书写板上按

29、常规方法书写,就可以把汉字输入计算机。书写者不必学习击键的编码方案,可减轻学习一种操作方法的负担,书写方法和日常习惯基本相同。这对普及计算机应用,促进办公自动化,都很有好处。从模式识别的角度看,联机和脱机两种情况在本质上有重要区别,识别方法也有所不同。脱机手写体与印刷体汉字识别的识别对象是已经写好或印好的方块汉字,也就是说,待识 别 模式是一种特殊形式的二维汉字点阵图形或图像。 1.2.2 联机手写汉字识别的 原理框图 联机字符的识别原理框图如 图 1-1 所示 ,这样的 原理框图对于脱机字符识别也是适用的,只要把手写输入板换成扫描仪或其他的图像输入设备即可。 由图 1-1 可见汉字经过手写输

30、入板后,形成了一个点坐标序列(按时间先后顺序),有的系统中还包括压力大小的序列。前处理过程可能包括规范化、去噪、去除毛刺等。在特征提取出来后,需要将它与存储在字典中的已知汉字的特征集对比,以用来识别出是哪个汉字;系统的后处理部分是将单字的识别结果变为文本输出,中国民航大学本科生毕业设计 (论文) 5 这里面包括利用语言知识对识别结果进行进一步的加工 ,自动纠错和发现错误,以不断提高系统的识别率。 手 写 输 入 板 前 处 理模 式 表 达( 特 征 抽 取 或 基 元分 割 识 别 )判 别( 分 类 或 句 法 分析 )后 处 理字 典 库( 特 征 模 板 集 合 或句 法 规 则 集

31、合 )学 习( 聚 类 分 析 或 文法 分 析 )汉 字 样 本汉 字 汉 字 代 码图 1-1 联机字符识别原理框图 汉字的模式表达形式 和相应的字典形式有多种,每一种形式可选择不同的特征(或基元),每种特征(或基元)又有不同的抽取方法。这些就使得判别方法和准则以及所用的数学工具不同,形成了种类繁多、形式各异的汉字识别方法。这些方法可以归结为两类一般性处理方法 统计决策方法和句法结构方法( 其实也是模式识别的两类基本方法 ) 。 使 用时通常还需要加入模糊数学和人工智能的方法。 下面一节将讨论一下这两种方法。 1.2.3 联机手写汉字识别的两类基本方法 1.统计决策方法 统计 决策方法 是

32、提取待识别输入模式(例如汉字)的一组统计特 征,形成该模式的多维特征向量,再依据一定的准则确定的决策函数,跟 已存储在机器中的一批标准的需要识别模式( 例如 3755 个汉字 ) 的多维特征向量的集合匹配判别,找出其特征最接近输入模式的标准模式,该模式就被作为输入模式。例如把输入的点序列按照位置分成 M*N 块,每块为 P*Q 点阵。取每块中黑点数目为特征量 xi,共有M*N 个特征量 xixm*n 形成该字的 M*N 维特征向量 X=(x1, x2, ., xm*n)。 如果要在国标一级汉字(共 3755 个)范围内识别该字,需预先把 3755 个汉字 M*N 块中的黑点数目 即特征量 Gi

33、 求出来, i 从 1 到 3755。 把 特征量 相同的归为一类,设共有 Q类 (Q3755)。每一类一个模板。 把 Q 类模板放进字典,每个模板都是一个 M*N 维的向量。识别就是判断输入文字的特征向量属于字典中哪一类。如果 X 和字典中的l 特征向量相同,当第 l 类中的向量多于一个的时候,判别的结果就是分类,即判断出输入文字是 Q 类中的第 l 类,当第 l 类中的向量只有一个的时候,判别的结果就中国民航大学本科生毕业设计 (论文) 6 是识别结果,即识别出输入文字属于第 l 类中 Gi 向量所代表的汉字。 以上讨论的是 理想情况。事实上,每个类别的标准模板 往往不止一个,而是要用一批

34、互有差别的模板来表示该类文字受到各种干扰后的变形。判别输入文字属于哪一类,也不是只有当字典模板和输入文字特征完全相同时才能做出判别,而是根据某种准则,相似到一定程度而且彼此又能区分时就可以判别分类。所有这些都需要用统计决策的概念、理论、方法来指导,这就产生了汉字识别的统计决策方法。用统计决策方法分类判别时,主要的判别准则是距离 D 和类似度 R。距离 D 通常是绝对值距离 D(X,G): (1-1) 式( 1-1) 中, X 是输入汉字的特征向量, G 是存储在字典 库中的某个标准汉字的特征向量: X=(x1, x2, ., xm) G=(g1, g2, ., gm) 两个向量 X 和 G 相

35、似度 R(X,G)定义为: 1122211.( , )miiimmiiiixgR X Gxg(1-2) 相似度 R(X,G)的物理意义是 X, G 两向量在 m 维空间的夹 角 的余弦值R(X,G)=cos。当两个向量完全相同时, D(X,G)=0, R(X,G)=1。 2.句 法结构方法 句 法结构方法汉字是一种特殊的二维图形,结构信息丰富且有规律性。所以,在统计决策方法中,如果仅 把汉字看成一般的二维图形,而不利用其特殊的结构信息是很可惜的。在汉字识别中,应当充分提取汉字结构信息和组字规律 。结构方法就是把被识别的模式看成是有若干较简单的子模式按一定的规律构成的集合。这些子模式又可继续按一

36、定规律分解为更简单的子模式,直到最后分解为基元为止。基元是组成一个模式的最简单的而且是不可在分的子模式,这和一个句子由单词、短语等按语法规则组成类似。 数学的一个分支 形式语言学,对句子的生成做了严格的描述和规定,它用句法规则检验句子是否符合某类语言的文法。我们可以借形式语言学的文法 (它包含了句法规 则 )来描述和分析汉字结构, 从而识别汉字,所以 这种方法也叫句法结构方法。但是,由于汉字 变形的随意性和各种干扰的存在,严格按句法结构方法识别汉字是很困难的。 1( , ) | |,m iiiX G x g中国民航大学本科生毕业设计 (论文) 7 3.小结 统计方法是以识别有噪声的文字,它可以

37、把局部噪声和微小畸变“淹没”在多维特征值得累加和里,但是,可以用来区分结构的敏感部位的差异也随之被淹没了,所以它不能很好地利用汉字的字形结构信息;而结构法可以利用字形的结构规律来识别,对文字变体、变形适应性好,但是也正是因为它对结构特征的敏感性,导致了它的不稳定性和抗干扰能力低。 所以,把统计方法和结构方法两者结 合起来 6,存优去劣,在统计法中,汉字特征的选择和抽取充分考虑字形结构信息,在结构法中应用统计方法的模式分布性质,这是当前汉字的识别方法的主要发展方向 。 1.2.4 联机手写汉字识别技术的发展与现状 科学技术领域中对新问题的探讨不少是从大学研究生的研究工作开始的,联机手写汉字识别研

38、究似乎也是如此。 1966 年美国麻省理工学院研究生 J.Lin 的学位论文,大概是最早的关于联机手写汉字识别研究的文章之一。 20 世纪 70 年代美欧等国在这方面发表的论文较少,可能是他们习惯于用打字机打字的缘故。 80 年代中期以后:“个人数字 助理” ( PDA) 袖珍型处理器问世。这种装置体积很小,可以随身携带,但无法用键盘来输入字符,笔输入方式才重新在西方受到重视 10。 日本对联机手写汉字研究较为重视。在日本政府的支持推动下,大学和公司做了很多工作,发表了不少文章。 80 年代研制成若干种联机手写汉字识别系统,除英文字母、日本假名、数码和标点符号外,能识别的汉字字数约有 2000

39、 3000 个。1992 年夏普公司推出笔输入电子笔记本,可识别 5000 多个汉字,识别率达 95 ,使用者可按常规笔顺书写,但对连笔限制较严。该产品代表了日本当时联机手写汉字识别技 术的最高水平。 我国关于汉字识别技术研究开展较晚。 80 年代初个人计算机才在国内逐步得到应用。一些大学和研究机构认识到汉字输入的重要性,积极开展有关研究。 1983 年中文信息学会第二届全国学术会议在武汉召开,哈工大、江西冶金工程学院、上海仪器仪表研究所等单位在大会宣读了有关联机手写汉字识别的论文,开我国汉字识别研究的先河。 1984 年 11 月在北京举办的高科技成果展览会上,哈工大和总参 61所联合展出了

40、联机手写汉字识别实验系统,引起了与会学者的高度重视,大大促进了这方面的研制工作。此后哈工大、总参通信部、清华大学与西 安交大等单位均有研究成果通过鉴定,但大都属于实验系统,识别汉字字数采用我国国标 GB2312-80基本字符集所规定的两级汉字,即 3755 个或 6763 个,大大超过当时日本研制的系统所能识别的字数,使我国自己研制的系统较接近于实用要求。 1992 年由总参通信部与中科院自动化研究所联合研制成功的联机手写汉字识别系统,以“汉王笔”为名正式投入市场,识别字数为 676312000 字。用户初次使用时识别率约为 80 ,经中国民航大学本科生毕业设计 (论文) 8 常使用后可达到

41、95 ,对笔顺要求也不严格,部分字连笔书写时也能正确识别。在当时计算机速度尚不太高的情况下,识 别速度基本上能跟上书写速度。这种产品当时不但在我国内地和香港销售,还销往台湾地区,以至新加坡等国。我国实行改革开放政策以来,国家对汉字识别研究十分重视,先后把它列入国家“七五”、“八五”等重点攻关项目和 “ 863” 高科技研究计划中,大大促进我国有关研究工作的发展。90 年代以来,若干种联机手写汉字识别系统,如上述中自公司的汉王笔,以及后来的北大方正的如意笔、清华文通公司的文通笔和哈工大的万通笔等纷纷投入市场,取得了很好的社会效益和经济效益。 近几年来,台湾的“蒙恬笔”、美国摩托罗拉的“慧笔”等笔

42、输入装置,也先后 进入我国市场。尤其是摩托罗拉公司仗其雄厚资本,开展巨大宣传攻势,企图抢占我国笔输入的市场,对我国有关企业增加了不小压力。值得我们引以为荣的是:在 1995 年 12 月和 1998 年 4 月前后两次由我国“ 863 计划智能组主题专家组”组织的实测评比中(这种评比由 863 专家组主持,每两年举办一次),清华文通笔和中自公司的汉王笔的性能都居于领先地位;对 329309 个汉字测试的综合结果,我们的识别率比台湾蒙恬笔和摩托罗拉的慧笔高 5 6 个百分点。但是,竞争的帷幕刚刚揭开,我国研制的系统目前已有的优势不大,而境外公司,包括台湾地区 的有关单位,却已大张旗鼓,投入更大的

43、人力物力,在研究和宣传方面和我们竞争 。他们除了在改进笔输入系统性能方面下功夫之外,还配合语音输入,进一步改善人 机接口的功能,抢占我国市场更大的份额。我国宋代诗人杨万里诗云:“莫言下岭便无难,赚得行人错喜欢。正人万山圈子里,一山放出一山拦。”今后将困难重重,任重而道远。我们必须做更艰苦的工作,才能保持我们在汉字识别方面研究工作的优势。 值得注意的是,国外一些大公司也开始注意联机手写汉字识别这一领域。Motorola, Microsoft, Apple 等大公司均已经投资于该方 向的研究。由于资金雄厚,并且具有很强的软、硬件优势,其势头不可小视。国内研究人员应该奋起努力,把这一具有浓厚文化特色

44、的研究课题的主流掌握在中国人自己手中。 1.2.5 联机手写汉字识别的一般方法及其难点 联机手写汉字识别,作为模式识别的一个分支,它所识别的对象,也即识别系统的输入,是表示成一系列坐标点的手写汉字。这些坐标点是对书写时笔尖运动的轨迹进行时域采样得到的。每一个坐标点除了 x-y 轴的坐标以外,还附加有笔尖的状态信息,反映该时刻笔尖 是 正在 “ 纸 ” 上书写,还是抬起,由此可以获得汉字的笔划信息。 与脱机手写汉 字识别相比,联机手写汉字识别的对象不是二维图 像 点阵,而是中国民航大学本科生毕业设计 (论文) 9 一维的坐标序列,因此,更加容易从中获得对于汉字识别十分重要的结构信息。这也是目前联

45、机手写汉字识别更加接近实用的原因之一。 目前,大量的联机手写识别系统采用的都是结构识别方法。所谓结构识别方法,其基本思路是把复杂的汉字模式分解为简单的子模式直至基本模式元 字根、笔划、笔段等。通过对子模式的判定(用相对简单的方法),以及基于符号运算的匹配算法,达到对复杂模式的识别。 结构识别中非常重要的是基元的选取。汉字识别最常使用的基元有笔划和笔段两种。一个笔划指的是 书写时从落笔到抬笔笔尖所走过的轨迹,对于楷书书写,笔划的种类是有非常限的,可以分成几种到几十种;笔段则是指构成笔划的小直线段,根据其书写方向,常被量化为四类或八类。前文介绍的两种方法就分别基于这两种基元。对于一个典型的基于结构

46、方法的联机手写识别系统,可以划分为以下基本部分: (1)预处理(平滑、去噪声) ; (2)基元提取和判定(笔段、笔划的抽取和识别) ; (3)与识别字典进行符号匹配,计算匹配距离(常用的是串匹配) ; (4)识别结果输出(一般基于最小距离准则或最大相似度准则) 。 以上是联机手写汉字识别所采用 的一般方法。对于工整书写的汉字,目前的识别技术均已经能够达到很高的识别率。但是,要联机手写汉字识别技术真正达到实用水平,必须能够对人们自然书写的汉字具有相当的识别率。这也正是联机手写汉字技术的难点所在 7。具体地说: (1)笔顺问题 由于不同人具有不同的书写习惯,笔划的书写顺序经常发生变化,因此,单纯通

47、过串匹配进行识别难以达到理想效果。对汉字进行描述时,仅仅采用一维串也就显得不够,必须利用一些二维方法来描述,从而又极大地增加了匹配的难度 9。 (2)连笔问题 一般人写字时都不会一笔一划的书写,为了节省时 间,连笔字是自然而然的事情,一些行书连笔甚至完全脱离了楷书的框架。从实用角度讲,连笔问题比笔顺问题具有更重要的意义。对于结构识别而言,连笔一方面使笔划种类大大增加,甚至达到难以归纳的程度;另一方面,连笔又使得笔段抽取难度大增,因为连笔会增加一些冗余笔段,连笔造成的畸变又会使笔段方向严重离散。总之,连笔不论对于基于哪种基元的结构识别都是严峻的挑战。 (3)相似字区分 汉字种类繁多,很多汉字彼此

48、之间非常相似,例如 “ 己、已、巳 ” 三个字相差只在 细 微之间。手写汉字的变形十分严重,怎样能使识别系统透过大幅度的变化,中国民航大学本科生毕业设计 (论文) 10抓住 微小的差别,还是一个非常值得研究的问题。 (4)对抗干扰能力的要求 抗干扰能力,也称为鲁棒性,对于联机手写识别系统的性能是非常重要的。书写时候,笔划的畸变、丢失,多余笔段(如笔锋)的插入,字的倾斜,部件间相对位置、大小的变化,这些都是经常发生的现象。对于结构识别来说,会造成基元提取和识别的错误。传统的结构识别方法恰好在鲁棒性上是薄弱环节。因此,要想取得好的性能,必须对传统识别方法进行改进,增强其鲁棒性,从而增加实用性 10

49、。 中国民航大学本科生毕业设计 (论文) 112 基于笔 划 方向 和统计特征 的手写汉字识别 2.1 基于笔划方向的联机手写汉字识别 2.1.1 笔划识别前的预处理 当用户在“手写板”上写下汉字时,系统就记录了汉字的笔划的信息,即一系列的坐标点。 预处理的工作主要是由于在原始笔划点坐标数据中,有大量的冗余和噪声点,必须对 这些输入数据进行预处理以达到消除这些冗余和噪声的目的。处理的方法有很多,这里根据汉字的 特点,把笔划的行笔方向进行 8 方向编码,如图 2-1 所示,将坐标平面的分为 8 个区,按顺序一次编号为 1、 2、 3、 4、 5、 6、 7、 8。原始数据的滤波处理分为两步:第 1 步是对原始点坐标的滤波;第 2 步是对由 这些点的坐标所计算出来的方向码的滤波 8,10,11。 12345678图 2-1 各个点的八方向示意图 1.原始坐标数据的滤波 ( 1)平滑滤波处理 由于同一笔划中相邻的点具有一定的相关关系,不可能出现距离较大的相邻点,这里可以用一种有限的平

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报