1、1,Digital Image Processing,数字图像处理,http:/ E-MAIL:,姚 敏,2,第十一章 图像识别,3,11.1 概 述,4,数据获取,判决分类,待识图像,数据处理,结果输出,图11.1 图像识别系统框图,图像识别系统,5, 统计法(Statistical Approach) 句法法(Syntactic Approach) 模糊法(Fuzzy Approach),识别方法,6,11.2 统计图像识别,7,统计模式表示,特征向量的第i个分量就是模式的第i个特征的测量值,模式的特征向量,8,统计模式表示,图11.2特征空间划分示意图,9,统计模式识别系统,图11.3统
2、计模式识别系统结构图,10,图像模式的特征, 图像模式本身自然含有的如图像的象素灰度级、目标的边缘轮廓及纹理区域等。 通过某种测量或变换操作人工地得出的如图像象素灰度级分布的直方图,图像的各种变换(如傅里叶变换、余弦变换、沃什变换、哈达码变换等正交变换)系数特征等,图像模式的特征是图像模式场明显可分的本原的特性或属性,11,特征的分布状态,距离,向量x与特征集之间,两向量之间,12,特征的分布状态,距离,类内距离,类间距离, 特征选择的准则1:类内距离小,类间距离大,13,特征的分布状态,似然比,散度,条件概率,条件概率,14,特征的分布状态,散度,将两类互相区分的平均量度,散度, 特征选择的
3、准则2:最大散度,15,特征的分布状态,熵, 特征选择的准则3:总体熵最小,第i类的概率密度,类内异样性的总体熵,向量的各分量统计独立,第i类的总体熵,16,特征抽取,特征抽取就是对图像模式进行物理测量或变换,得到一组反映其特性的数字值。特征抽取方法与实际问题是紧密联系的。 特征抽取有两种类型:一种是对识别对象的各个重要特性都有充分的理解,然后把这种特性转换为数字。与此相反,另一种并不需要充分了解识别对象的各个重要特性,而是根据某些原理进行特征抽取。 要得到某类模式的足够的特征,那么来自该模式类的样本数就不能太少。 特征抽取应对识别对象的各种特性加以考虑,但不等于说特征空间维数越高越好,识别精
4、度并不随着特征数量的增多而提高。在地球资源卫星ERS-1可以取得十二个波段的遥感数据,但从识别精度来看,三个或四个波段的组合效果最好。,17,特征选择, 特征选择是在特征抽取以后,从中挑选出有代表性的或有效的成份来,使得分类判决的问题能够更有效地进行。 特征选择可以在前述距离准则,最大散度准则或最小熵准则的指导下进行。,18,特征选择,特征选择就是决定变换矩阵 Amm(mn),使得,代表输入模式,并用于分类判决,19,特征选择,令,正交归一向量,满足 AT=A-1 ATA=I,正变换,反变换,20,特征选择,取,均方误差,有,正交归一向量应该如何选取,才能使,21,特征选择,ej 为x的协方差
5、矩阵Cx的特征向量 同时令式(3.7.9)中的mx=0,则由3.7节关于霍特林变换的讨论知,在最小化x与x(v, m)之间的均方误差的意义上来说,霍特林变换是最优的。,取,22,线性分类器,统计图像识别是用一定的分类判决规则将待识图像模式指派到某个已知的模式类中去。采用不同的分类判决规则,可以得到不同类型的分类器。 采用线性判决函数的分类器就称为线性分类器 采用Bayes决策函数的分类器就是Bayes分类器,23,线性分类器,判别函数,判别边界,二维模式,24,线性分类器,判别函数,判别边界,n维模式,25,线性分类器,确定线性判别函数 d(x),学习,从待识模式中挑选一批有代表性的样本,经过
6、人工判别成为已知类别的样本,这样的样本集合就称为训练样本集;, 把训练样本集中样本逐个输入到计算机的“学习”算法中去,通过反复的迭代,最后得到正确的判别函数。所谓“正确”就是能将训练样本集中的样本正确分类。,26,线性分类器,学习算法,全体训练样本集,线性可分,必存在权向量w,使得, 线性分类器的“学习”算法实际上就是确定上式中的权向量w这是一线性联立不等式的求解问题,其解不一定是单值的。 正因为如此,就有一个按不同条件取得最优解的问题,因而出现了多种不同的算法。,27,线性分类器,奖惩算法,基本思想是将联立不等式求解问题转化为求函数极小问题,准则函数,在,有,由给定的训练样本集,求出满足上式
7、的w就是对上述不等式方程组求出的一个最优化的解,28,线性分类器,奖惩算法,准则函数,梯度下降算法通过反复迭代来寻求使准则函数J达到最小的权向量w,c0为有助于收敛的校正系数,或称学习率,J 的梯度,29,线性分类器,奖惩算法,令,30,线性分类器,奖惩算法,有,即,31,Bayes分类器,略,32,11.3 句法识别,33,概 述,句法法又称为结构法(Structural Approach) 结构法的识别过程不仅能够把模式分类,而且还可以描述模式的结构形态,而统计法只有模式分类的能力 句法法特别适合用来解决图片识别(Picture Recognition)和景物分析(Scene Analys
8、is)问题 结构法以形式语言理论为基础,34,基本思想,一个复杂的模式可以由一些简单的模式递归地描述。换言之,对于每个复杂的模式,可以用一些较简单的子模式来描述,而每一个比较简单的子模式再用一些更为简单的子模式来描述,最后用一些最简单的识别起来比模式本身容易得多的称为模式基元(Pattern Primitive)的子模式来表示,35,基本思想,36,基本思想,37,基本思想, 自然语言:单词由语法规则连接起来构成短语,短语最后再根据语法规则构成一个完整的句子。 模式的多级结构描述:模式基元按一定的规则构成子模式,子模式再按照一定的规则构成一个完整的模式。 在句法模式识别中,模式是用一种类似于自
9、然语言的“模式描述语言” 来描述的。由基元组成模式所遵循的那些规则则称为模式文法或简称文法。,模式的多级结构描述与日常所用的句子分析有明显的相似之处,38,系统结构,图11.9句法模式识别系统结构图,39,系统结构, 基元选择(Primitive Selection)是对所考虑的模式集选取那些能够通过一定的结构关系紧凑而方便地对模式结构加以描述,并且容易用统计方法加以抽取和识别的基本元素作为模式基元。 基元抽取(Primitive Extraction)由两部分组成:模式分割和基元及关系识别 文法推断(Grammar Inference)是根据相当数量的已知结构信息的模式样本,推论出分类的文法
10、规则。然后,再用训练样本对获得的分类文法进行检测,并改进文法规则。 句法分析(Syntax Analysis)是的任务是判断输入模式是否属于给定的文法描述的模式类。,40,模式基元,在句法模式识别中,输入模式用一个句子(字符串)来描述。句子的基本单位就是文法中的终止符,而终止符对应模式的基元。基元是一个模式的基本成份。所以在用句法法处理模式识别问题时,首先要选好基元、抽取基元和识别基元。 基元选择注意点 基元应该是基本的模式元素,能够通过一定的结构关系(如连接关系、位置关系等)紧凑地、方便地对模式加了描述 基元用现有的非句法方法(如统计方法)加以抽取、识别。,41,模式基元, 着眼于边界(轮廓
11、)和骨架的基元,如Freeman链码 着眼于区域的基元,如帕夫里迪斯多边形,例如手写汉字识别采用笔划作为基元比较方便,对于一般的图像、图形模式基元有两种类型,42,程序文法,一个程序文法Gp是一个五元组 Gp =(VN,VT,J,P,S) 其中VN、VT和P分别是非终止符、终止符和产生式的有限集,S是起始符,J是产生式的标号集。P中产生式的形式:,(1)r 是产生式的号 (2) 是产生式的核 (3)S(u)表示使用产生式(r)成功后的去向范围 (4) F(u)表示使用产生式(r)失败后的去向范围,43,程序文法,程序文法的特点是:在一个导出式中,对中间句型使用了一个产生式以后,下一次再用什么产
12、生式就要受到限制。 推导规则 必须从标号为(1)的产生式开始; 目前的链中包含子链,如果可以用产生式 来重写子链,而下一个产生式从中S(u)选取;如果目前的链中不包含子链,则不能用产生式 (即链不变),而下一个产生式从F(u)中选取 如果可用的转移区包含,则导出过程停止。,44,程序文法,45,属性文法,属性文法 就是一些属性加给模式基元和关系,从而把语义信息包括到模式描述中去。在属性文法中,每一个模式基元都有一个符号名称和一个属性向量,而每一条产生式都有一条语义或属性规则与之相联系。, 一个非属性文法可以变换成一个句法复杂性较低的属性文法。这样一种句法语义折衷应能使一个模式识别系统具备恰当地
13、调节句法和语义的相对复杂性以获得计算效果的灵活性。此时,句法规则往往十分简单,而语义信息或属性规则在一定程度上被用作一种控制策略(或语义约束)来选择和解释适用于这种分析的句法规则。,46,文法推断,文法推断:通过句子的训练样本集合来学习文法,模式类,模式文法,训练样本集,47,文法推断,文法,文法推断 算法,训练样本集,图11.11 文法推断示意图,48,文法推断,写出终止符集VT; 对于每一个句子逐个写出能生成此句子的文法; 构成文法; 合并重复的产生式和非终止符,其规则为: 如果G中任何产生式出现多次,则保留一个,去除其它; 找出这样一对变量(即非终止符),如果在G中到处以其中一个替换另一
14、个,就会使某些产生式多次出现,进行代换并用进行简化 找出这样一对变量(A,a),如果在G中补充产生式,并在某些有选择的情况下以A代替a,将导致产生式的数目由于消去出现多次的产生式而减少。,由训练样本集R推断文法G的方法,49,句法分析,模式类,模式文法,未知模式由句子 x 表示,其识别问题实质上就由“未知模式是否属于,句法分析,自动机识别,50,句法分析,已知一句子(字符串)x和上下文无关文法G,构成一个三角形,并以一个自身相容的导出树将三角形内部填满。,将三角形内部填满的方法: 自上而下的剖析 自下而上的剖析,成功 否则,51,句法分析,给定x和上下文无关文法G,自上而下的剖析从S开始,应用
15、重写最左非终止符的产生式,推导得句型y,自上而下的剖析,直到串x,并找到x的最左推导。因为上下文无关文法中,因此应用产生式时,句型中的符号数不可能被减少,故而可废弃所有长度超过x的句型,需要研究的只是长度等于或小于x的句型的有限集合。,52,句法分析,自下而上的剖析从串x本身开始,应用反向的产生式,试图将x归结到起始符S。自下而上的剖析从x到S,以x的最右推导反推出产生式序列。 给定和上下文无关文法G,从x着手构成中的一些符号串,这些符号串是应用可能出现在x的推导过程中的产生式的反向推演而得到的。但在推导过程中不知道哪些序列的串可能是正确的,因此必须同时研究所有可能的序列。,自下而上的剖析,5
16、3,句法分析,CKY剖析算法, 采用树结构的剖析算法本质上是穷举试探,它对任意上下文无关文法所需的剖析时间可能按字符串长度作指数增加 CKY剖析算法的时间则正比于输入串长度的三次方 CKY算法要求文法是一个上下文无关文法,其产生式必须是乔姆斯基标准形,54,句法分析,CKY剖析算法,55,句法分析,CKY剖析算法,56,句法分析,CKY剖析算法,57,句法分析,CKY剖析算法,58,句法分析,CKY剖析算法,59,句法分析,CKY剖析算法,60,句法分析,CKY剖析算法,61,自动机识别,基本方法:对于文法 Gi 构造一个相应的自动机 Mi ,使自动机 Mi 接受的语言等于文法 Gi 产生的语
17、言,T(Mi)=L(Gi),将字符串x作为自动机的输入链,如果x被自动机,接受 否则,62,自动机识别,有限状态自动机,63,自动机识别,有限状态自动机,64,自动机识别,有限状态自动机,65,自动机识别,有限状态自动机,66,自动机识别,有限状态自动机,由有限状态文法构造对应的自动机,67,自动机识别,有限状态自动机,68,自动机识别,下推自动机,69,自动机识别,下推自动机,图11.18下推自动机示意图,70,自动机识别,下推自动机,由终止状态接受的语言,对于来自+的输入串x,M从q0开始,下推表顶上的符号为z0,按照映射的序列,扫描完整个符号串x,若机器停止在终态,则串x为M所接受。,由
18、下推表变空接受的语言,对于来自+的输入串x,M从q0开始,下推表顶上的符号为z0,按照映射的序列,扫描完整个符号串x,若下推表变空,则串x为M所接受,71,自动机识别,下推自动机,由上下文无关文法构造对应的自动机,72,自动机识别,下推自动机,73,有噪声、畸变模式的句法识别,识别方法 用相似性和误差校正剖析 采用随机语言与随机自动机 运用模糊技术,74,相似性测度,符号串,转换,代换误差转换TS,删除误差转换TD,插入误差转换TI,75,相似性测度,符号串,Levenshtein距离定义为从x导出y所需的最小转换数目,J是从导出过程所用到的转换序列,分别表示J中的代换、删除和插入转换的数目,
19、加权Levenshtein距离,76,相似性测度,例 11.10 x=cbabdbb,y=cbbabbdb,求,77,误差校正剖析,则称x是y的最小距离校正,L(G)是一个给定的语言(描述一类模式),y是一个待剖析的句子(待识别模式),最小距离误差校正剖析的实质就是在L(G)中寻找一个句子x L(G),使其满足下述最小距离准则,78,误差校正剖析,设y是一个句子(一个模式),L(G)是一类语言(一类模式) y与L(G)之间的距离,就是y与其在L(G)中的最小距离校正之间的距离,k=1,79,误差校正剖析,最小距离分类准则,模式,描述文法,对于未知模式y,计算,如果,80,随机语言, VN和VT
20、分别是非终止符和终止符的有限集 SVN是起始符, Ps是随机产生式的有限集,每个产生式的形式,81,随机语言,82,随机语言,如果对于输入串x有nx条推导路径,其生成概率分别为,生成x的概率为,随机文法Gs产生的随机语言,83,随机语言, 因为一个随机文法的产生式除了指派的概率以外,实际上和非随机的文法一样,故由一个随机文法所产生的语言的集合和以非随机的方式产生的相同,84,随机自动机, 有限集D,是赋予映射的一组概率值,设当前状态为q,当前输入符号为a,它的下一状态为 q1, q1, qn, (q,a)= q1, q1, qn,如果,Ms是正确的随机有限状态自动机,85,随机自动机,Ms从q0开始,扫描完串x以后停在终止状态F,则接受串x 如果Ms有nx条不同的状态转换序列来接受输入串x,其接受概率分别为,Ms接受的语言,则Ms识别输入串x的总概率,86,随机自动机,例,87,随机自动机,例,Ms接受x的概率为p(x),Ms拒绝x的概率1- p(x),当输入串为x=aabb时,Ms检查x的过程,