收藏 分享(赏)

基于模糊支持向量机的笔迹验证研究.doc

上传人:weiwoduzun 文档编号:1894076 上传时间:2018-08-29 格式:DOC 页数:50 大小:8.44MB
下载 相关 举报
基于模糊支持向量机的笔迹验证研究.doc_第1页
第1页 / 共50页
基于模糊支持向量机的笔迹验证研究.doc_第2页
第2页 / 共50页
基于模糊支持向量机的笔迹验证研究.doc_第3页
第3页 / 共50页
基于模糊支持向量机的笔迹验证研究.doc_第4页
第4页 / 共50页
基于模糊支持向量机的笔迹验证研究.doc_第5页
第5页 / 共50页
点击查看更多>>
资源描述

1、 级:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的研究成果,也不包含为获得塑宴垦王堡盘堂或其他教育机构的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人和集体,均己在论文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律结果由本人承担。 枷敏 签字日期:学位论文版权使用授权书有关保留、使用学位论文的规绛蒡极翩虢铆叼为机器学习和数据挖掘中的标准工具之一。笔迹具有类内变化大的特性,在进行关键词笔迹验证;笔迹鉴定;方向线素;模糊支持向量机 琱 , ; 瓾 甇 , ,猈籪 笔迹分类识别 目

2、目前,具有法律效力的可在法庭使用的笔迹鉴别是由笔迹专家人工完成的。鉴定的准确性主要依靠笔迹专家的知识和经验判断来保证。由于笔迹风格往往呈现为字符结构的微弱变化,对笔迹风格的识别理解具有较大的特殊性和困难程度,笔迹专家的工作非常繁重,而且很难避免主观人为因素的影响。随着现代计算机技术的发展,尤其是机器学习技术的发展,计算机经过分析、理解和识别,已经可以做到从文本图像中获得其包含的内容信息。相应的,书写风格信息自动分析和识别的研究也获得了很大发展。计算机笔迹验证能够避免人工操作的主观性,同时效率得到极大提升,将笔迹鉴定的应用范围拓展到了电子设备登陆、电子商务等活动中。机笔迹识别的研究作了详细的阐述

3、。上。因此,研究者们将笔迹鉴别分为文本相关畇将篇章笔迹图像作为一个整体,从中提取出一致的风格特征。 文本相关的方法通过比较相同文本内容的笔迹,以去掉文本内容的影响,达到突出笔迹风格差异的目的。对英文笔迹,以每个字母作为特征字,来描述笔画。小波变换被用于从字符图像中提取多尺度结构信息。】从笔迹文本中珼】、 三个区域的高度比、字符宽度、字符倾斜角度及文本无关笔迹识别方法不需要考虑笔迹文本的内容,一般用于大规模的笔迹检索。但文本无关方法要求笔迹文本有一定的篇幅,当篇幅过短时,文本无关方法的性能会受到较大影响。文本相关方法从较少的文本中,就可以提取出反映不同书写者书写风格的特征,其识别正确率也常常比文

4、本无关的方法高。本文中使用文本相关方法应用于计算机笔迹验证。第二章为计算机笔迹验证方法的概述,介绍了在笔迹验证的三个环节中使用第六章为对论文的总结与对未来的展望。计算机笔迹验证基本流程计算机笔迹验证是指使用计算机对两份或多份手写笔迹样本进行比对,判断是来自同一人所写还是来自不同书写者的技术。笔迹验证通常包含两个过程:一是样本库的形成,二是对待测样本的验证。样本库的形成过程,主要是将己知的样本输入计算机,通过程序提取出样本的书写风格特征,形成特征空间输入笔迹模板库;待测样本的验证过程,首先是输入待测样本,在提取出待测样本的笔迹特征之后,与模板库中的笔迹特征进行比对,以识别待测样本与己知样本是否为

5、同一书写者所写【】。图给出了验证过程的图示。 对于笔迹验证的研究主要集中于三个方面:图像二值化的目的是去除扫描图像中多余的信息,以提高处理速度。扫描的, 、直接线性归一化的基本原理是把原始图像中的像素点通过线性映射到归一如下:一一几,前图像的重心映射到归一化后图像的中心处,则,刀的关系为:阶段的影响更小。】。语义信息表示的是文本表如果用两个简单的符号蚦来表示内容和风格,则有来写法;画长短比例关系、偏旁的大小、宽窄比例关系;图像的中心矩有其特定的物理意义。其中。表示图像中所有点的像素值之根据特征字图像前景点掷5愫头锹掷5的局部笔画方向,赋予一个型的监督学粲谕焕啵褂米钚【嗬敕掷嗥鞫訥。海珿。进行分

6、类的思想是,当 椋珿 本章小结预处理和汉字轮廓提取根据研究第二章叙述过的预处理方法得到的经验,本文选取中值滤波法进行去噪处理,该算法既能有效去除扫描图像中分布广泛不均匀的孤立噪声和扫描带来的脉冲噪声,也避免了线性滤波器带来的图像边缘模糊。在笔迹图像二值化中使用阙值判定法,综合考虑到图像质量和处理速度因素,采用最大类间方差法选取二值化处理中使用的阙值。在二值化和归一化之后,特征字图像其笔画所对应的点变成黑像素点,背景谟颍邻域像素是指屯 图崛”咴抵 邻域示意图提取归一化后的特征字图像蠱。,得到轮廓图像陋,。方向线素特征提取于手写字符来说,字符图像的笔画分布差异既包括汉字本身结构不同而导致的差别,也

7、包括由于书写者书写风格的不同而带来的差异。因此在方向线素特征中,既包含了进行字符识别的有效信息,同时也包含了书写者的书写风格。我们知道,对于不同书写者所写的相同特征字,其基本结构是相同的,只是由于不同书写者的不同书写方式的差异,导致了特征字偏旁笔画之间搭配比例的不同和特征字笔这里给像素点赋予的方向属性有图所示,图中琋缺旰疟硎究楹。分别统计第撸饫堍,琧,琧占。然后再将轮廓图像陋,。划分成立个小图像块,其所包含的子块为撸珼。表示如下子块构成的集合: 七,司特征如下:痓,少 蕎萞是蒯栅数,其中仃一。上 上彩 钐影钐图枷窨閎,的构成示意图 小图像块,因为对整个特征字轮廓图像最终可得到簦晃奶卣飨蛄縳,即

8、机,提高鉴别性能。主分量分析,算法的核心这组正交基展开为:,一宕,蕖,一岛,狤獂的协方差矩阵。川佟弧蝗恕弧佟弧唬】其中,窭嗜粘耸樱佟肴恕直鹗莕鲆籱猰一将式对。一。求导,得到佟弧。一。人,在笔迹验证中,我们将方向线素提取得到的特征向量设为琍变换的恪眑以图像的轮廓中提取的特征,为每个二值特征字图像的轮廓点分配横、竖、撇、捺四种方向属性,再对特征字进行分块划分,统计每个字块中分别出现横、竖、撇、捺四种方向属性的轮廓点的数目,并采用高斯函数进行模糊处理,最后得到特征向量。为克服维数危机,使用主分量分析法,对原始特征进行降维。方向线素特征能够很好地反映笔画分布情况和结构特点,对笔迹特征进行参数化描述。和离群值有更好的适应能力。由于手写笔迹样本具有类内变化大的特点,模糊支持向量机较适合对笔迹样本进行分类识别。,原理的基础之上的机器学习算法,拥有通用性较好,分最佳折中,以获得最好的泛化能力为目的。算法的本质是解决一个二次规划问题到全局最优解。从而避免了局部极值问题与过拟合等问题。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报