1、以贝叶斯定理为架构的基于手写字体应用的可形变模版识别张国伟 ,电器和电子工程师协会学生成员杨秩炎 ,电器和电子工程师协会成员罗兰T秦, 电器和电子工程师协会成员摘要有见于可变模型对大形变对象的处理能力,最近人们对于许多模版识别应用都提议运用可变模版技术。此法就是将模版或形状作为可变模型,靠改变自身去迎合输入的图像,然后将萃取的信息导入分类器。这三个部分建模,匹配和分类经常被视为独立的任务过程。而在此论文中,我们将学习如何把可变模型集成于贝斯定理架构内,从而使其成为一个对形状建模、匹配、分类的统一方法。并以手写字体识别作为评价这一方法的试验平台。通过对我们系统的使用,无论是仿射变换或其他笔迹变化
2、,都能识别无误。甚至不需要预处理和过多的手工参数设置(如对参数的归一化和字体长度的调整)。除此之外,我们还研究这一问题:如何结合模型适应性约束、加速和子部检测。即便使用只有23个原形的模型集,且无须让软件对识别手迹进行学习,我们的精确度亦可达94.7%,并对NIST SD-1数据集中任何手写阿拉伯数字都不加拒认。索引条目可变模型,贝叶斯推理,笔迹辨识,预期最大化,NIST数据库。1.介绍1.1.可变模版识别基于模型库识别是靠在输入图像中查找预模型而实现的,它的表现和定位有决定性作用,然后才能对其类别分类。通过对具有改变形状能力的 可形变模型 (DM)的使用,此方法可被用于柔性模版中,如人脸、细
3、胞、手势或手写字体。藉由可形变匹配中提取柔性形状,模型形变 和 数据失配 的量化将由两个判别函数进行:其一负责量度其模型形变程度,其二负责量度数据和形变模型的差别。而最佳匹配就是在此二判别标准的估量总和中取最小值。这估量因数是所谓的 正则化 参数,它令模型形变和数据失配之间产生一个平衡。通过定义一堆这样的模型,达到区分多种模型类别,而每个模型都包含与其相关的的形状信息,形状的允许形变范围则由预信息或通过软件学习而确定。在现有文献中,这些识别过程的步骤时常被视为分离的,仿佛它们是独立的部分。1.2. 基于可形变模型库的笔迹辨识的前期工作由于我们可以使用大量现实数据和很多不同风格的笔迹,所以笔迹识
4、别已被用作基于可形变模型库的识别的绝好试验平台,而且在这论文中亦用于评价我们提出的这一系统。在现有文献中,对基于可形变模型库手写数字识别,已有不错的研究。Wakahara提出用于匹配字体形状骨架的 局部仿射变换 (LAT),这一方法是通过加入一系列点而表现出来的。字体的形变通过邻近的局部仿射变换参数的平滑度来测量,这种测量对球状仿射数据是不变的。数据的错配通过每个数据点到模型的设定数据点的最小距离来测量。Least-squares设置用于最小化,而规则化参数是人手设定的。分类基于差异点的测量。每个原形分类的数字就是一个如此的东西。通过对2,400个数字映象的测试达到的识别率、置换率和拒绝率分别
5、为96.8%、0.2%和3% 。Revow et al的研究则把数字模拟成弹性的齿条模型。可变性的模型是通过齿条控制点和涉及向量的Mahalanobis距离测定的。假定输入为二值图,黑像素的分布由高斯分布以及均匀分布的齿条模拟而成,数据的不匹配被定义为反对数的似然函数。最小化的计算通过最大期望值算法来计算,手动设置正则化参数。经BP神经网络的分类,它要萃取一些输入分量,如可形变模型、数据错配和仿射变换参数。每个分类原形就是一个如此的东西。基于CEDAR数据库,最好结果:好的bs的测试组得到1.5%替代率,bs得到3.14% 替代率,并且无拒绝。在单独学习时, Jain et al. 5从智能像
6、素边界模版模拟数字。由一系列置换功能系数构成的平方数来测量。数据错配被定义为模版和输入之间的边缘差异量。经确定斜率算法完成最小化,亦由正则化参数手动设置而成。两个不同量的加权总量达到分类。每一个分类原形大约为二百个,它大大地给此方法一个最邻近分类器的非参特性。根据二千个数字图的NIST SD-1数据集子集,最低的替代率可以达到0% 、拒绝率为0.75%。以上的简要说明并无尽述详情,但体现出以下两点:1) 可形变模型库方法对手写识别应用非常见效。2) 不同的可形变模型库识别部分通常单独处理,而不整合为一个完整统一的计算架构。1.3.论文概述本文中,我们以Revow et al. 8提出的可形变模
7、型库识别系统作为基础,研究可形变模型库如何完整地代入贝叶斯模型,提供一个用于建模、匹配、分类独立手写字体的完整计算架构。为将我们的系统区别于Revow et al的,我们应用的组合不需手动输入超参数的预处理。此参数值自动设定为集成架构的一部分。这种改进使我们的系统比其他的应用系统更有适应力和移植能力。并且不同于那些用有辨别能力分类器如BP神经网络似然模型(或以后称为evidence)。p(D|Hi)作为分类的公制,本质地适用于贝叶斯架构。除此之外,关于约束合成的模型适应性,子部的检测和提速会进一步的研究。下文结构为:第二部分详述贝叶斯架构;第三部分是将此架构应用于字体识别的过程;第四部分显示实
8、验的结果;第五部分将讨论本方法的优劣性;第六部分总结全文。作者:香港清水湾,香港科技大学计算机科学系。电邮:william, dyyeung, rolandcs.ust.hk.初稿:1997年5月19修正:1998年9月15推荐人:R. Plamondon欲获取再版此文章的信息, 请电邮至tpamicomputer.org和向IEEECS Log Number 108059垂询。2 针对可形变模型的贝叶斯结构以下提供了在手写字体识别中使用的贝叶斯结构的大致总体看法。2.1 三个级别的推论以 表示第 i 个字体类的模型,D 表示输入的图像,w 为表征字体形状的参数矢量,iH为规则化参数, 为笔画
9、宽度。 和 是作为高级参数使用。第一级 建模:许多参考模型 ,每一个种类 i 都是建基于从先前的知识中所得的具有代表性的i模型。训练的过程在模型识别中尤其棘手。第二级 匹配:每个模型 的理想化参数 都以与输入图像 D 最匹配的 进行评估。i *,wiH此过程相当于先取条件概率密度 的最大值,再取 的最大值,(|)ipDHip(w|,)得到的结果是 的最大值。(,|,)ip第三级 分类:最佳的模型是通过选择所有可能的 i 中具有最大条件概率 的 模型决定的。Pr(|)ii根据第三级,为了分类,需要计算所有模型的 。使用贝叶斯定理并假设平均条Pr(|)i件概率 :Pr(|)iHD称为模型的根据。(
10、|)ip根据贝叶斯定理将 再次展开,并假设 D 独立于 ,w 独立于 ,(|)ip是条件参数的贡献, 是可能性函数, 是数(|,)ipwH(|,)ipDwH(|,)ipwDH据 D 的条件参数的贡献。通过拉普拉斯近似,(2)变为:和 是 和 的有效范围,分别地,最大的posteriori(MAP)评估logl在第二级的推论中计算,所使用的模型来自于第一级中训练结果*,w3 基于可变模型的汉字识别在这一部分, 可变模型是在贝叶斯定理的架构下进行公式运算以创造出一个统一的运算方法从而为可变形模板识别建模、匹配和分类。3.1 模型阐述如8所示, 手写数字以三次B取样函数阐述, 每函数以一批量的k 控
11、制点为参数,而相应的模型参数向量w 2k 则是通过连接所有k 控制点的x 和 y 左边形成,譬如, w = (x1, y1, x2, y2, ., xk, yk)t. 要达到仿射的恒定性 , 每个 模型框架 里的字模型都映射到输入字的图象的图象框架 ,这种映射通过参量为A , T的仿射变换完成, 其中A是一个2 2矩阵而T 是一个二维向量. 要表示以分开笔划构成的数字,像和 | 构成的 “4,” 上述的单取样函数模型仍然适用,通过 隐藏 笔划将断开笔划连在一起,沿线不置黑色象数。图1显示含隐藏笔划的“4”的数字模型。使用取样函数表示,每个分类至少要建一个参考模型。不同的人即便写同一个数字的差别
12、也会很大,更莫论不同类别的数字。这种差别有时是形态学上的,而用一个单数字模型的弹性变形难以理想地表达, 譬如, “7” 和 “ ” 都表示数字分类“七”。再者, 一个分类的模型参数分布也许无法很好地以单一平均参考向量表示。上述两点说明要得到更好的结果,使用多重参考原型是不可避免的。从练习数据中获得分类并非无意义。在这个研究中,我们分析了在现实生活中的手写数据的一般差别,并人手建立的初步模型( 参看 5.1的进一步讨论)。用于考虑(或估计)可变取样函数表征的模型参数包括控制点k 的数量和w的平均向量和协方差矩阵。运用priori知识, 每个数字模型的k的固定值应谨慎选取以使数字型能容易表示。基于
13、 最大相似性 (ML) 法的练习, 如8所示, 继而使用真实手写数据提炼模型参量。为了使练习数据自动归类到多重内分类原型,我们将每个练习样例与所有内分类原型匹配,以模型证据的最高值p(D|Hi)将其赋值于原型。图表 2 列出所有练习后的数字模型。4. MAP估算需要w * 以接近p(w|D, , , Hi)。3.2 最优化标准的运算3.2.1 模型可变标准变型的程度,以 ith 模型 Hi的模型变型标准Ew (w)量化,界定为自一个预设平均向量 h 2k 的控制点向量 w的Mahalanobis 距离,表述如下: 其中S是H i 的w 的2k 2k协方差矩阵而 wt 表示w的置换阵。因此,w分
14、布的优先概率如下,其中|决定 而 是规则化参量。h 和的构成部分, 正如在3.1节所讨论的,是在练习阶段(第一级推算)以ML估算计算。3.2.2 数据不匹配标准将输入图象二元化。 黑象素的分布以一个统一的高斯加权混合建模,其平均数统一沿花键的可见部分放置。5 以数据不匹配标准判断的模型与数据不匹配,界定如下,相似性功能由下提供其中Sj 是2k 2矩阵, 包含相应的三次 B取样函数系数, 和 是一个2k 2k 对角线矩阵,而 k A 子阵置于其对角线,并且一个2k 1向量由k T 子向量串连形成,分别地,是5. 注意在Revow et al.的研究,一个附加的统一干扰数据处理将用于模拟一些由劣质
15、分割做成的结构干扰数据。由于我们使用的数据组的分割是相对好的,是否使用干扰数据处理都没关系。如果要了解关于劣质分割的详细研究,读者情参看2. jth高斯的平均数, N 图象中黑象素的数目,N g 是沿花键的 Gaussians数目, 6 是用于建字的笔划宽度的高斯变异的相反数,y l 是个别黑象素的定位向量,而D 表示y l|1 l N。使用单一的球形表示所有的Gaussians导致一个潜在的假设即字的笔划宽度的统一的。为简化起见,仿射变型参量的优先分布是假定整张纸里都是统一的,除非那些仿射变型参量会导致很大的剪切和收缩(如难以辨认的字体)而被阻止,而相应的模型构建在分类前被拒绝。这避免模型退
16、化成一行片断,因而常常仅能很好地匹配数字“1”。这种过多的剪切或收缩在现实中并不多见。3.2.3 混合标准功能结合模型变型标准和数据不匹配标准,全面标准功能如下, 其中是规则参量。The joint posterior distribution of w的联合在后分布和 A, T的表示如下其中并假设p(w, A , T|D, , , Hi) . p(w, A*, T*|D, , , Hi) 和A * 和 T* 是A 和 T 的ML估算数。3.3 匹配3.3.1 最优控制点和仿射转换参数的估算取样函数控制点向量w和仿射变型 A, T的MAP估算数是通过最大化在(11)的p( w, A, T|D,
17、 , , Hi)获得(或相同地通过最小化(10)中的E M(w, A, T; D)。 EM 3,和8的法则相似,但这里加入了一个仿射转换初始化步骤. 我们的实践中使用了EM运算法则, (13), (14), (15)和(16)分别给出E- 步骤和 M s步骤: 图. 2. 经过调整以后的字节模型.6.注意N g 的值会根据 值的变化而变化 (比画宽度估计也会因此变化).上述公式中, 和 是从第n次重复中得到的控制点向量和仿射转换的估算值. 图. 3 说明使用附加的仿射转换初始化步骤的优点,包括可以更好地检查出全球变形,并随后带来一个更好的最终匹配结果。 3.3.2 正则化和笔画宽度参数的估算通
18、过最大化后验概率密度 p( , |D, Hi), 可以决定MAP估算的 *和 *. 如7中所示, 它依赖于Z M( , )近似值,这个近似值是:式中 wwEM(w, A, T; D) = 1 + wwED(w, A, T; D). 通过, 并假设当w接近MAP估算值w *, 的值对所有的 j 和l 都 保持不变,对 wwED(w, A, T; D)取近似值 。可以显示MAP 估算值 * 和 *必须满足。式中因为这里不存在 *和 * 封闭形式的解, w*, A*, T* 和 * , * 的估算步骤是通过重复的方式来完成,而(18)就是收敛的标准. 一些 和 的初始值是必需的。7 所有的匹配运算法
19、则在图. 5.中归纳。图4 说明了不同程度的变形导致 * 的不同值和不同的笔画宽度导致 * 的不同值的效果. 请注意一个更小的 * 值是较高变形程度的结果. 这与以下的说法一致:模型变形标准较小的权重因数使模型具有与图象数据匹配的更高的灵活性。另外,一个更小的自动估计的 * 值代表一个更宽的笔画.3.3.3 模型灵活性约束可变取样函数模型的灵活性由协方差矩阵S和规则参量 控制,其中S通过练习取得,适应地基于输入估算。在框架中,是假定具有统一的在先分布,譬如,所有的值是相等的可能。然而这是不合需要的,因为极端小的值可能。从实验中,我们发现运算法则的集中对和的初始值并不十分敏感。图 3. 仿射转换
20、初始化的重要性的图解. 在每一个图的左上角的小字符是一个仿射转换前的模型. (a) 模型的初始位置。 (b) 模型使用的建议的EM程序以求得仿射转换参数的初始化. (c)和(d) 使用或没有没有建议的仿射转换的初始化步骤的最后匹配. 图. 4. (a), (b) * 的值是在输入字符的程度的基础上自动估算的, 这两种情况下 * 0.9. (a) * = 3.54. (b) * = 0.89. (c), (d)当 * 的估计值减少时(与笔画宽度负相关),字符笔画的宽度增加。(c) * = 1.72. (d) * = 0.52.导致严重变形的模型与输入的但不属于该类型的字符之间能够很好地匹配(见图
21、. 6). 这个观察报告表示在假定以前便统一化是不合适的,这使模型具有过多的灵活性.一般来说,在的分配以前获得一个精确值是不容易的,并可能会导致一个更加复杂的匹配程序, 根据(18), 通过限制模型变形标准E w(w),限制的值可能被间接地实现 . 这意味着灵活性限制可以通过直接对每一个单独的模型的E w(w)加入一个硬约束来强制实行.任何一个导致E w(w)值高于值域的匹配反复会被禁止.对每一个单独的模型l, 比如一个值域可以在E w(w)的上限基础上预先计算.图. 6 阐明了对模型灵活性的约束的结合怎么可以避免一个“5”的模型和一个“4”的图象之间不合适的匹配。3.4 分类3.4.1 证据
22、比较分类涉及以下内容:从每一个候选模型获得的w *, A*, T*, *, *,对在此基础上得到证物的p(D| Hi)取近似值。(5) 和 (8)可以转换为(3),如下所示: 根据(6), (9), 和(17) ,可以分别计算出Zw( *), ZD( *), 和 ZM( *, *)的值。最后,通过找出 i* = argmaxip(D|Hi)来确定分类,字符被分类为Hi *. 模糊的输入拒绝通过后期的分类概率P (Hi|D)计算完成, 如下所示:将它与一个预先定义的置信区间做比较。3.4.2 可能性错误贝叶斯推论的成功主要依赖于模型的精确性。在我们的实验中发现,估算值的任何错误,从而导致可能性估
23、算的错误会很容易使不多的最好候选证物的比较中出现混淆。为了纠正这样的错误,可以通过以下方法来改良分类原则:首先计算最大证据值P(D |Hi*) ,然后形成较少的候选模型,这些候选模型的P(D |Hi) 值都足够地接近 P(D|Hi*)(由事先定义好的值域来决定)。面对这些数量较少的候选模型,我们假设不同的候选模型之间的数据不相配的差别可以忽略,因此具有最大前期p(w |Hi)的候选模型就是分类结果。3.4.3 标准化过滤“1”根据NIST组的报告4, 在NIST SD-1数集中分割的字符形象首先被标准化为20 32,然后被放置成32 32 的中心。这导致在数集中出现很多厚的 “1” 字节,并引
24、起严重的错分类,使所有的模型似乎都可以找到很好的与之相陪的。因为标准化步骤引起上述的困难,而实际上对于我们的方法来说,标准化又不是必需的,因此,我们通过构造一个简单的筛选来预先将所有厚“1”字节分类,以此代替收集新的“1”类型的数据。该运算法则如图7所示:图. 6. 通过加入模型弹性限制来避免一个不适宜的配合。(a)不受约束的配合。(b) 受约束的配合。对于任何一个输入的字符,: (h = 图象高度; w = 图象宽度 )1) 建造一个黑象素的垂直突出轮廓p i。通过计算第一个连续的黑象素片段里的黑象素的数量来计算这个轮廓;2) 通过检测左边和右边pi 0.6 h的边缘计算ll 和rl ;3)
25、 如果ll 0.5 w, 返回“Not thick ONE”; /* 避免与“7”混淆 */4) 其他a) 厚度 := 0,b) 从ll 到rl , 对于每一个位置,i) 如果 pi 0.6 h, 把厚度加一 ; 否则,打破;5) 如果厚度 6, 返回“Thick ONE”; 否则返回 “Not thick ONE”.图. 7. 厚“1” 过滤运算法则 .对于候选模型集合中的每一个字符模型:1. 设置方柱控制点w到预先制定的位置 (通过培训).2. 计算字符形象框架,因此通过缩放模型得到一个大致的仿射转换A , T3. 使用一个EM程序初始化 A, T.a) E-step: 如(13) 中定义
26、的,对所有的j 和l,计算 b)M-step: 在模型框架中固定 w并通过最大化( (15)中的Q方程计算 ,c) 重复初始化过程直到收敛.4. 使用EM程序来配合形象数据和模型.a) E-step: 对于j 和l计算 ,b)M1-step: 通过最大化Q方程计算 并计算$ w ,c) M2-step: 根据 ( 和 ),在图象框架中通过最大化Q方程固定 w 并计算 ,d) 重复初始化过程直到收敛.5. 根据(18)计算 *.6. 对特殊的字符重复步骤4和5直到收敛.图. 5.配合运算法则.3.4.4 子部分检测当模型集里的一些模型是其他模型的子部分的时候,就会产生子部分问题.比如, 模型 “
27、0” 和“2” 有时候很相似,几乎达到一个“0”字节图象 (见图 . 8).没有明显的区别,“2” 模型在空白地方的出现一些高斯, 这种情况可以通过加入以下的检查法则来检查出来:如果排列在第一等级的是“2” , 但在空白的地方有高斯,而其他等级是 “0” 空白地方没有高斯,然后输出结果是“0.”在我们的研究中, 根据先验,我们建造一个规则基础,包括四个规则以区分下面各对字节(前面一个字符都是后面一个字符的子部分):1) “0” 和“2”;2) “4” 和 “9”;3) “7” 和 “9”; 4) “3” 和 “8,”4 NIST手写数字的实验结果为了评估其性能,早先提出的框架被应用于识别NIS
28、T特殊数据库中的手写数字的识别。NIST数据的三个子集,表示为S1,S2和S3,被独立地运用于我们的实验。S1是包含有由100个不同的人(NTST SD-1中的f0000-f0099)所书写的11,660个数字(32*32的二进制样式)的训练级。S2和S3是两个包含有由另外100个人(NTST SD-1中的f0100-f0199)所书写的数字的测试集。其大小分别为1,000和11,791。实验结果总结为表1。提出的方法增加了对于不同范围的识别准确度,在我们的实验中,这些范围的模型适应性是最有效的。通过综合这些方法,我们获得了94.7%的准确率和0%的拒绝率。 5 局限性和未来的工作5.1 模型
29、设置总结尽管提出的结构通用与任何字体的识别应用,但对于其他应用仍需要手动操作和做一个参照字体分类的智能化程序。为了使程序自动化,我们仍有以下的欠缺:1) 用于不同类别的构造字体表现(像我们这里的 Bsplines 立方)的运算法则2)构造最佳设置参照模型的运算法则。在极端的情况下,所有训练数据都作为参照模型时,Jain et al. 5在 NIST 的手写字体子集中,精确率可达到 99.25%。尽管如此,这种最接近的计算方法在实际应用中费用太大了。而我们现在只需用 23 个模型(当然,这不是最理想的),就可以达到 94.7%的精确率(基于另一个 NIST 数据子集,但比 Jain et al.
30、 5的大).5.2 快速执行重复可形变配对过程计算起来的费用相当高昂是众所周知的。同样地,如果一个多种基于可形变模型的多种分类识别系统直接在依序排列的各个电脑上执行,很明显扩大的问题使这个处理方法承受更大的负荷,也就是计算量随着模型的数量线形增加。这不同于硬件解决方案像平行的或者有特定用途的硬件,一些效率高的软件技术如几何散列法6就被提议用来解决这种问题。但是,这些技术多数需要物体由先萃取的突点呈现,像是角,可形变到目前为止受到很大限制。至于快速配对,当记录到输入的图象有多余的信息,二次提取技术将发挥作用。我们对两个二次提取技术进行了测试:图8:子部t问题图解 参见 3.4.4注释 (a) M
31、odel “0.” (b) Model “2.”表 1: 不同方法组合的识别精确率缩写:B基本架构 ( 3.4.1), R模型弹性限制(3.3.3) , O重写“I”的过滤(3.4.3),; P最后决定中优先考虑(Section 3.4.2), S子部惩罚(3.4.4), Rj-4.9 4.9 的拒绝率,Nn在最优模型 n 的正确分类。极限在通过训练在方法 R 中应用:1) 统一随机取样(数据样本中的 50%)和2) 同样是统一随机取样的再加上所有边界像素达到加速的因数为 1.69 和 1.2,分别有 0.9%和 0.2%的精确失败率。为减缓扩大的问题,我们也测试了一个有相当竞争力的混合可形变
32、模型,基本上是用早期的排除办法去避免配对时对不相关模型的计算。在一个特别的实验中1,运用这种方法 10 个模型中的 7 个会在仿射初始化后消除,我们获得一个加速因数,随之是 1.2%精确率的下降。相信会有更好的程序值得我们去研究获得更高的速度和更低的精确下降率。6 总结基于贝叶斯推理的统一架构用于建模、配对和分类式样,用一定方式展现大量的变化。可形变模型作为贝叶斯架构的手写字体识别的一个重要组成部分,为可形变模型架构提供了一个有意义和现实的测试。对于来自 NIST SD-1 数据的手写字体,只需要用到 23 个原型,就可在 11,791 个测试模型中达到 94.7 的精确率。整个架构不需要任何
33、判别训练,同样的方法可很好地应用于其他形式的识别问题。构造一个自动化模型、设定构建运算法则,配对、分类的快速执行都有利于进一步的研究。运用这个方法,下一个显然的步骤就是清晰地分割草书的手写字2,这是整个架构的一部分,所以字体分割和独立书写的手写字体识别可以紧紧地联系在一起,这么一来可以有更好的相互作用和反馈以达到更高水平的运作。鸣谢研究部分得到香港研究基金委员会(HKUST 614/94E and HKUST 746/96E)的支持,和Sino软件研究中心(SSRC 95/96.EG12)的赞助。参考文献:1 K.W. 张, D.Y. 杨, and R.T. 秦, “Competitive M
34、ixture of Deformable Models for Pattern Classification,” 613-618页。Proc. IEEE CS Conf. Computer Vision and Pattern Recognition。 1996年六月。加州三藩市(旧金山)。2 K.W. 张, D.Y. 杨, and R.T. 秦, “Robust Deformable Matching for Character Extraction,” Proc. Sixth Intl Workshop Frontiers in Handwriting Recognition. 韩国大田,
35、1998年八月。3 A.P. Dempster, N.M. Laird, and D.B. Rubin, “Maximum- Likelihood From Incomplete Data Via the EM Algorithm,” J. Royal Statistical Soc., Series B, 第 39卷, 1-38 页, 1977年。4 J. Geist, R.A. Wilkinson, S. Janet, P.J. Grother, B. Hammond, N.W. Larsen, R.M. Klear, M.J. Matsko, C.J.C. Burges, R. Cree
36、cy, J.J. Hull, T.P. Vogl, and C.L. Wilson, “The Second Census Optical Character Recognition Systems Conference,” Technical Report NISTIR 5452, U.S. Natl Inst. of Standards and Technology, 1994年。5 A.K. Jain and D. Zongker, “Representation and Recognition of Handwritten Digits Using Deformable Templat
37、es,” IEEE Trans. Pattern Analysis and Machine Intelligence, 第19卷,No.12,1,386- 1,390页,1997年十二月。6 Y. Lamdan and H.J. Wolfson, “Geometric Hashing: A General and Efficient Model-Based Recognition Scheme,” Proc. Second Intl Conf. Computer Vision, 238-249页, 美国佛罗里达州坦帕市,1988年十二月.7 D.J.C. MacKay, “Bayesian I
38、nterpolation,” Neural Computation, 第4卷, no.3, 415-447页, 1992年。8 M. Revow, C.K.I. Williams, and G.E. Hinton, “Using Generative Models for Handwritten Digit Recognition,” IEEE Trans. Pattern Analysis and Machine Intelligence,第18卷, no. 6, 592-606页, 1996年六月。9 T. Wakahara, “Shape Matching Using LAT and Its Application to Handwritten Numeral Recognition,” IEEE Trans. Pattern Analysis and Machine Intelligence,第 16卷, no. 6, 618-629页, 1994年六月。