收藏 分享(赏)

数字图像处理-6章.ppt

上传人:pw17869 文档编号:8254654 上传时间:2019-06-17 格式:PPT 页数:115 大小:2.71MB
下载 相关 举报
数字图像处理-6章.ppt_第1页
第1页 / 共115页
数字图像处理-6章.ppt_第2页
第2页 / 共115页
数字图像处理-6章.ppt_第3页
第3页 / 共115页
数字图像处理-6章.ppt_第4页
第4页 / 共115页
数字图像处理-6章.ppt_第5页
第5页 / 共115页
点击查看更多>>
资源描述

1、第六章 图像分割和分析,图像增强和图像复原是对整幅图像的质量进行改善,输入输出均为图像。图像分析研究并描述组成一幅图像的各个不同部分的特征及其相互关系,输入为图像、输出为从这些图像中提取出来的属性。图像分析的结果不是一幅完美的图像,而是用数字、文字、符号、几何图形或其组合表示的图像内容和特征,对图像景物的详尽描述和解释。,6.1 图像分割(Image Segmentation),在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分一般称为目标或前景。 为了辨识和分析目标,需要将有关区域分离提取出来,在此基础上对目标进一步利用,如进行特征提取和测量。 图像分割是把图像分成各具特性

2、的区域,并提取出感兴趣目标的技术和过程。这里特性可以是灰度、颜色、纹理等,目标可以对应单个区域,也可以对应多个区域。,图像分割基本策略:基于灰度值的两个基本特性 基于边界的算法:基于灰度的不连续性检测边界 间断分割(非连续性分割) 边缘连接法 基于区域的算法:基于灰度的相似性进行聚类 阈值分割法 基于区域的分割,1、间断分割(非连续性分割),根据图像像素灰度值的不连续性,找到图像中的点、线(宽度为1)、边(不定宽度) 点检测 线检测 边缘检测,1) 点检测(Point Detection),R = (-1 * 8 * 8 + 128 * 8) / 9 = (120 * 8) / 9 = 960

3、 / 9 = 106 设 :阈值:T = 64 R T,基本思想:如果一个孤立点(此点的灰度级别和其背景的差别相当大,并且其所在的区域是一个均匀的或近似均匀的区域)与周围的点不同,用模板检测。,模板响应记为:,输出响应RT时对应孤立点。,可以指定模板为:,线检测比点检测稍微复杂,其基本思想一致。 使用模板(注意确定模板的条件或者基本假设) 对输出响应决策,需要合适的决策方法。,2) 线检测(Line Detection),依次计算4个方向的典型检测模板,得到Ri i=1,2,3,4 如果 |Ri| |Rj| ,ji,则该点更接近模板i 所代表的线。 当只对某一检测方向上的线感兴趣时,使用特定模

4、板给出输出响应,通过域值法将响应最强烈的点提取出来。设计任意方向的检测模板 可能大于33 模板系数和为0 感兴趣的方向的系数大。,用4种模板分别计算R水平 = -6 + 30 = 24R45度 = -14 + 14 = 0R垂直 = -14 + 14 = 0 R135度 = -14 + 14 = 0,3) 边缘检测(Edge Detection),边缘检测首先检出图像局部特性的不连续性,然后再将这些不连续的边缘像素连接成完整的边界。边缘的特性是沿边缘走向的像素变化平缓,而垂直于边缘方向的像素变化剧烈。所以,从这个意义上说,检测边缘的算法就是检出符合边缘特性的边缘像素的数学算子,目前,边缘检测常

5、采用边缘算子法和模板匹配法等。,3) 边缘检测(Edge Detection),边缘:图像中灰度发生突变或不连续的微小区域(一组相连的像素集合),即两个具有相对不同灰度值特性的区域的边界线。在一幅图像中,边缘有方向和幅度两个特性。一般认为沿边缘走向的灰度变化较为平缓,而垂直于边缘走向的灰度变化剧烈。即灰度梯度指向边缘的垂直方向。,边缘检测基本思想:计算局部微分算子。,a)局部微分算子:一阶微分,用梯度算子计算特点:常数部分为零;左图中左侧的边是正的(由暗到亮),右侧的边是负的(由亮到暗);右图结论相反。 用途:用于检测图像中边的存在。,梯度算子(Gradient operators) 函数f(

6、x,y)在(x,y)处的梯度为一个向量: f = f / x , f / yT 计算这个向量的大小为: |f| = mag(f ) = (f / x)2 +(f / y)21/2 近似为: |f| |Gx| + | Gy | 梯度的方向角为:(x,y) = arctan(Gy / Gx),Roberts交叉梯度算子| Gx | = |z5 - z9| | Gy |= |z6 - z8|梯度值: | f | | Gx | + | Gy |,Prewitt梯度算子3x3的梯度模板 Gx = |(z7 +z8 + z9) - (z1 + z2 + z3) | Gy = |(z3 +z6 + z9)

7、- (z1 + z4 + z7) | 梯度值: |f | | Gx | + | Gy |,Sobel算子:Gx = (z7 + 2z8 + z9) - (z1 + 2z2 + z3)Gy = (z3 + 2z6 + z9) - (z1 + 2z4 + z7) 梯度值: |f | | Gx | + | Gy |,b)局部微分算子:二阶微分,用拉普拉斯算子计算 特点:常数部分为零;拉普拉斯算子的结果在亮的一边是正的,在暗的一边是负的。 用途:二次导数的符号用于确定像素是在亮的一边,还是暗的一边;0跨越(零交叉),确定边的准确位置。,二维函数f(x,y)的拉普拉斯算子定义为:2f = 2f / x2

8、 + 2f / y2对33区域,经验上被推荐最多的形式是:2f = 4z5 (z2 + z4 + z6 + z8),马尔(Marr)算子2h :定义2-D高斯函数h(x,y):,其中是高斯分布的均方差。如果令r2=x2+y2, 那么根据求拉普拉斯的定义式,有,马尔(Marr)算子2h通常称为高斯型的拉普拉斯算子(Laplacian of a Gaussian, LoG)。,是一个轴对称函数:,由图可见,这个函数在r=处有过零点,在r时为负。,由于图像的形状,马尔算子有时被称为墨西哥草帽函数。用2h对图像做卷积,等价于先对图像做高斯平滑,然后再用2对图像做卷积。因为2h的平滑性质能减少噪声的影响

9、,所以当边缘模糊或噪声较大时,利用2h检测过零点能提供较可靠的边缘位置。,如图是一个与2h近似的55模板。这种近似不是唯一的。其目的是得到2h本质的形状: 一个正的中心项; 周围被一个相邻的负值区域围绕(这个负值区域从原点开始作为距离的函数在值上是增加的); 并被一个零值的外部区域所包围; 系数的总和必须为零,以便在灰度级不变的区域中模板的响应为零。,2、边缘连接(Edge Linking),在边缘图像的基础上,需要通过平滑、形态学等处理去除噪声点、毛刺、空洞等不需要的部分,再通过细化、边缘连接和跟踪等方法获得物体的轮廓边界。 将检测的边缘点连接成线就是边缘跟踪。线是图像分析中一个基本而重要的

10、内容,它是图像的一种中层符号描述。 局部连接处理(边界闭合) Hough变换,1) 局部连接处理(边界闭合),针对边缘图像,目的是连接间断的边。原理:1) 分析每个边缘点(x,y)邻域内像素。2)分析在一个小的邻域(33或55)中进行。3)比较梯度算子的响应强度和梯度方向确定两个点是否同属一条边。,比较梯度:点(x,y)与邻域内的点 (x,y)相似,当|f (x,y)| |f (x,y)| T,其中T是一个非负的阈值。比较梯度向量的方向角:点(x,y) 与邻域内的点 (x,y)的方向角相似,当| (x,y) (x,y)| A,其中A是一个角度阈值。当梯度值和方向角都是相似的,则点(x,y),与

11、边点界(x,y)是连接的。,2) Hough变换,对于图像中某些符合参数模型的主导特征,如直线、圆、椭圆等,可以通过对其参数进行聚类的方法,抽取相应的特征。,在参数空间不超过二维的情况下,有较理想的效果。,例:检测任意方向和位置的直线。该直线在原始图像空间(x,y)的直线方程为:y=kx+q (斜截式),它与参数空间上的一个点(k,q)相对应。,过(x0,y0)的一组直线,在参数空间中可用一条直线q=(-x0)k+y0表示。,由于图像中的一条直线对应参数空间的一个点,在参数空间找到这个点,就可以找到在x-y空间对应直线的两个参数。,点(xi,yi)在直线y=kx+b上; 过第i个点的一组线对应

12、k,q坐标中直线q=b=-(xi) k+yi;过n个点的直线对应k,q坐标中直线族这些直线交于一点(k0,q0),k0,q0值就是点(xi,yi)所在直线的参数,即这n个点在直线y= k0 x+q0 上。,q=b=-(x1) k+y1 q=b=-(xi) k+yi q=b=-(xn) k+yn,对分布在两条直线上的点,可以在参数空间中找到两个聚类点。,76年由Duda和Hart作了改进,基于斜率和截距的表示变成用法线和法线与X轴的夹角表示。即: = xcos + ysin,如果这条直线通过图像上的点(x0,y0),则:= x0cos+ y0sin,而这条直线上的点在极坐标系中所对应的点(、)构

13、成图(c)中的一条正弦曲线(取02或- )。反之,在极坐标系中位于这条正弦曲线上的点,对应直角坐标系中过点(x0,y0)的一条直线,如图 (d)所示。,设平面上有若干点,过每点的直线族分别对应于极坐标上的一条正弦曲线。若这些正弦曲线有共同的交点(,),如图(e),则这些点共线,且对应的直线方程为 =xcos+ysin 这就是Hough变换检测直线的原理。,程序实现时,对-空间定义二维数组,计算得到-空间一条曲线,相应数组元素值加1,所有边缘点计算完成后,具有较大值的数组元素就是边缘。即使图像中的边缘是不连续的, Hough变换也能有效地检测出直线,抗噪声性能较好。,Hough变换不只对直线,也

14、可以用于圆:(x c1)2 + (y - c2)2 = c32 这时需要三个参数的参数空间。,3、阈值分割法(相似性分割),根据图像像素灰度值的相似性 通过选择阈值,找到灰度值相似的区域 区域的外轮廓就是对象的边,阈值分割法(thresholding)的基本思想: 确定一个合适的阈值T(阈值选定的好坏是此方法成败的关键)。 将大于等于阈值的像素作为物体或背景,生成一个二值图像。,阈值分割法的特点: 适用于物体与背景有较强对比的情况,重要的是背景或物体的灰度比较单一。 这种方法总可以得到封闭且连通区域的边界。,两个问题:阈值选定:交互方式、灰度直方图、局部特征图像阈值化,1)阈值选定,a) 交互

15、方式 基本思想:以交互方式获取对象的灰度值(也称样点值)f(x0,y0), 满足下式的像素(x,y)组成对象区域: |f(x,y) f(x0,y0)| R 其中R 是容忍度,可通过试探获得。,b) 利用灰度直方图选阈值 A. 状态法(the mode method )(双峰法) 基本思想:边界点的灰度值出现次数较少。 取值的方法:取直方图谷底(最小值)的灰度值为阈值T。,设灰度直方图为RHST(z),0 z N-1 (1) 在 0 N-1的范围内变化z,对于每一个灰度值z,在比z小的灰度范围NL内,求RHST(z1)-RHST(z) (0 z1z),其中的最大值为L; (2) 同理,在比z大的

16、灰度范围NH 内,对于每一个灰度值z,求RHST(z2)-RHST(z) (z z2 N-1), 其中的最大值为 H; (3) 当 L和 H的积为最大时的灰度Z即为所求阈值Zm。,缺点:易受到噪声干扰偏离期望的值。 改进:取两个峰值之间某个固定位置,如中间位置上。由于峰值代表的是区域内外的典型值,一般情况下,比选谷底更可靠,可排除噪声的干扰。,B. 最佳阈值(Optimal Threshoding):使图像中目标物和背景分割错误最小的阈值。有时目标和背景的灰度值有部分交错,用一个全局阈值并不能将它们绝对分开。这时常希望能减小误分割的概率,选取最优阈值是一种常用的方法。设一幅图像仅包含两类主要的

17、灰度值区域(目标和背景),它的直方图可看成灰度值概率密度函数p(z)的一个近似。这个密度函数实际上是目标和背景的两个单峰密度函数的混合。,设一幅图像中,背景和目标物的灰度级分布概率密度p1(z)和p2(z)均为高斯函数,它的混合概率密度是:,其中1和12 分别是某一类像素(如背景)的高斯密度的均值和方差,2和 22分别是另一类的均值和方差,P1和P2分别是背景和目标区域两类像素出现的概率。根据概率定义有P1+P2=1,所以混合概率密度中有5个未知的参数。如果能求得这些参数就可以确定混合概率密度。,总的误差概率是,最优阈值就是E(T)最小时的T。,如图假设1 2,定义一个阈值T使得灰度值小于T的

18、像素分割为背景,而使得灰度值大于T的像素分割为目标。这时错误地将目标像素划分为背景的概率和将背景像素错误地划分为目标的概率分别是:,为求得使该误差最小的阈值可将E(T)对T求微分,并令微分式等于零,结果是P1p1(T)=P2p2(T)将这个结果用于高斯密度,可得到解一元二次方程的根判别式的系数:,该二次式在一般情况下有2个解,如果2个区域的方差相等,则只有一个最优阈值:,c) 利用局部特征自动选阈值 通过边界特性(Boundary Characteristics)选择阈值 基本思想: 直方图的各个波峰很高、很窄、对称,且被很深的波谷分开时,有利于选择阈值。 为了改善直方图的波峰形状,只把区域边

19、缘的像素绘入直方图,而不考虑区域中间的像素。 用微分算子处理图像,使图像只剩下边缘中心两边的像素的值。,优点: 1)在前景和背景所占区域面积差别很大时,不会造成一个灰度级的波峰过高,而另一个过低。 2)边缘上的点在区域内还是区域外的概率是相等的,因此可以增加波峰的对称性。,算法的实现: 1)对图像进行梯度计算,得到梯度图像。 2)计算梯度值最大的部分像素(如10%)的直方图。 3)基于直方图的谷底,得到阈值T。,2)图像阈值化,a) 简单全局阈值分割 基本思想:基于获得的阈值T产生一个二值图,区分出前景对象和背景。 算法实现: 逐行扫描图像。 凡灰度级大于T的,灰度置为较大(或0)的值(如25

20、5);凡灰度级小于T的,灰度置为0(或较大的值)。 适用场合:亮度图像可控的情况,例如工业监测系统。,b ) 可变阈值法(动态阈值处理)对不均匀光照图像,单一阈值无法兼顾亮区与暗区,需要可变阈值。阈值的选择:将图像分成许多小块,先对每个小块定一 个阈值,各小块的阈值可以不同,然后进行适当的平滑,以消除块间阈值的突变。如果某小块包含两类的像素(从直方图有双峰,直方图方差较大等判断),则用前面的任一种方法定阈值。如果某小块只包含一类像素,其直方图较集中,呈单峰状,仅从该小块的信息难于确定阈值。基于其四周直方图呈双峰小块的阈值,通过内插来求得该块的阈值。为了使阈值变化缓慢,不出现假轮廓线,可以对阈值

21、进行平滑处理等。,c )基于多变量的阈值分割(Thresholds Based on Several Variables) 彩色图像的分割 基本思想:把前面的方法扩展到多维空间,则寻找波谷的过程,变为寻找点簇的过程。 应用场合:有多个分量的颜色模型,如RGB模型、CMYK模型、HSI模型。,分割策略: 测量空间聚类法建立一个“3-D直方图”,用一个3-D网格表示。这个3-D网格中的每个元素代表具有给定3个分量值的像素的个数。阈值分割的概念可以扩展为在3-D搜索像素的聚类,并根据聚类来分割图像。, 对彩色图像不同分量进行序列分割当对彩色图像的分割在HSI空间进行时,由于H、S、I三个分量是相互独

22、立的,所以有可能将这个3-D搜索问题转化为三个1-D搜索问题。下面是一种对不同分量进行序列分割的方法:,原始图像,图像灰度阈值分割技术没有考虑像素空间的连通性。区域增长把图像分割成特征相同的若干小区域,比较相邻小区域特征的相似性,若足够相似则作为同一区域合并,以此方式将特征相似的小区域不断合并,直到不能合并为止,最后形成特征不同的各区域。这种分割方式也称区域扩张法。区域内像素的相似性度量可以包括平均灰度值、纹理、颜色等信息。,区域增长要解决三个问题:确定区域的数目;选择有意义的特征;确定相似性准则。,4、基于区域的分割(Region-Based Segmentation, 相似性分割),1)

23、基本概念,目标:将区域R划分为若干个子区域R1, R2, , Rn,子区域满足5个条件: 1)完备性: 2)连通性:每个Ri都是一个连通区域 3)独立性:对于任意ij,RiRj= 4)单一性:每个区域内的灰度级相等,P(Ri) = TRUE,i = 1,2,n 5)互斥性:任两个区域的灰度级不等,P(RiRj)= FALSE,ij,2) 区域生长(Region Growing),算法实现: 1)根据图像的特点选择一个或一组种子,最亮、最暗或位于点簇中心的点。 2)选择一个描述符(条件)。 3)从种子开始向外扩张,首先把种子像素加入结果集合,然后不断将与结果集合中各个像素连通、且满足描述符的像素

24、加入集合。 4)以上过程进行到不再有满足条件的新结点加入集合为止。,3)区域分裂与合并(Region Splitting and Merging),算法实现: 1)对图像中灰度级不同的区域,均分为四个子区域。 2)如果相邻的子区域所有像素的灰度级相同,则将其合并。 3)反复进行上两步操作,直至不再有新的分裂与合并为止(即直至将图像分割为数量最少的区域为止)。,4) 统计检测法(statistical detection method),前述方法把灰度差作为区域合并的判定标准,此外还有根据小区域内的灰度分布相似性进行区域合并的方法。1) 把图像分割成相互稀疏的、大小为nn的小矩形区域。2) 比较

25、邻接区域的灰度直方图,如果灰度分布情况相似,就合并成一个区域。3) 反复进行2)的操作,直至区域合并完为止。,设h1(z)、 h1(z)为相邻的两个区域的灰度直方图,从这两个直方图求出累积灰度直方图H1(z) 、H2(z),根据,或,求出两者之差,如果这个差值在某一阈值以下。就把两个区域合并。这里,灰度直方图h(z)的累积灰度直方图H(z)被定义为:,上述基于灰度分布相似性的区域扩张法,也可用于分割具有相同纹理特性的区域。以nn矩形区域作为单位时,n过大则小的对象就会漏过;n过小则可靠性减弱。实际中,n常取值5-10。,6.2 特征表示与描述,分割(目标(边界或区域)提取) 特征提取表示-数据

26、结构描述-特征提取,边界表示区域表示,边界描述:几何区域描述:几何、灰度、纹理关系描述:边界与边界,区域与区域,6.2.1 特征表示,特征表示要使数据变得更有利于下一步的计算工作。下一步工作是基于所选的表达方式描述这个区域,一般情况下: 关注焦点是形状特性,选择边界表示 链码;多边形逼近;外形特征;边界分段 关注焦点是反射率特性,如颜色、纹理,选择区域表示 区域骨架 所选表示方式,应对尺寸、变换、旋转等变量尽可能的不敏感,1、 链码(Chain Codes),用边界的方向作为编码依据,简化边界的描述。一般描述的是边界点集。,4-链码:000033333322222211110011,4-链码:

27、000033333322222211110011,问题1:链码过长;噪声会产生不必要的链码。 改进1:加大网格空间;依据原始边界与格点的接近程度,确定新点的位置。,4-链码:003332221101,问题2:起点不同,编码不同;旋转角度不同,编码不同。 改进2: 1)通过使用链码的循环一阶差分代替链码本身,解决旋转问题。 2)重新定义起点,使得到的循环差分链码对应的整数值最小。这样得到的最小循环差分链码称为形状数。,循环一阶差分链码:用相邻链码的差代替链码。 例如:4-链码 10103322 循环一阶差分为: 33133030 循环一阶差分:1 - 2 = -1(3) 3 - 0 = 30 -

28、 1 = -1(3) 3 - 3 = 0 1 - 0 = 1 2 - 3 = -1(3)0 - 1 = -1(3) 2 - 2 = 04-链码 10103322 的形状数 :03033133(数值最小),优点:(a) 数据压缩 (b)可由链码直接计算图形的某些参数,链码平滑:将原始的链码序列用较简单的序列代替虚线箭头:原始的在象素p和q之间的8-连通链码 实线箭头:用来替换原始序列的新序列,空心圆平滑,2、 多边形逼近(Polygonal Approximations),基本思想:用一包含尽量少线段的多边形刻画边界形状的本质。 寻找最小基本多边形的方法一般有两种:1)点合并法2)边分裂法,点合

29、并法: 沿边界选相邻点对,计算首尾连接直线段与原始折线段的误差R。 如果误差R小于阈值T,去掉中间点,选新点对与下一相邻点对,重复(1);否则存储线段参数置误差为0,选被存储线段的终点为起点,重复(1)、(2)。 当另一个端点或第一个起点被遇到,程序结束。,存在问题:顶点可能不对应于边界的拐点(如拐角)。因为新的线段直到超过误差的阈值才开始。,边分裂法: 连接边界线段的两个端点(如果是封闭边界,连接最远点); 如果最大垂直距离大于阈值,将边界分为两段,最大值点定位一个顶点。重复(1); 如果没有超过阈值的垂直距离,结束。,3、 外形特征,用一维函数表达边界。 质心角函数:边上的点到质心距离r,

30、作为夹角的函数r() 。,问题:函数过分依赖于旋转和缩放变换。 改进: 对于旋转两种改进: a.选择离质心最远的点作为起点。 b.选择从质心到主轴上最远的点作为起点。 对于缩放变换:对函数进行归一化,使函数值总是分布在相同的值域里,比如说0,1。,4、 边界分段(Boundary Segments),基本概念: 任意集合S(区域)的凸壳H是:包含S的最小凸集。 H-S的集合被称为集合S的凸残差D。,分段算法: 标记进入和离开D的变换点来划分边界段。 优点:不依赖于方向和比例的变化。,算法改进:在保证产生正确骨架的同时,改进算法的效率。比较典型的是一类细化算法,它们不断删去边缘,但保证删除满足:

31、 (1)不移去端点 (2)不破坏连通性 (3)不引起区域的过度腐蚀,5、 区域骨架(Region Skeletons),平面区域削减成图形,即区域骨架。 定义骨架的中轴变换方法。设R是一个区域,B为R的边界,对R中的点p,找p在B上“最近”的邻居。如果p有多于一个的这样的邻居,称它属于R的中轴(骨架)。,提取区域骨架的细化二值区域的算法 假设区域内的点值为1,背景值为0 对给定区域边界点连续进行两个基本操作(基本操作1、基本操作2),直到没有点可删除。 边界点指任何值为1且至少有一个8邻域上的点为0的象素,基本操作1:标记满足以下四个条件的边界点,准备删除: (a) 2N(p1)6,N(p1)

32、是点p1邻域中1的个数,即: N(p1)=p2+p3+p9 (b) S(p1) = 1,S(p1)是按p2,p3,p9顺序,0-1转换的次数 (c) p2 * p4 * p6 = 0 (p2 、p4 、p6 至少有一个0) (d) p4 * p6 * p8 = 0 (p4 、p6 、p8 至少有一个0),举例:N(p1) = 4S(p1) = 3p2*p4*p6 = 0p4*p6*p8 = 0 第2个条件不满足,不标记,基本操作2 条件(a)、(b)与操作1相同 条件(c)、(d)改为: c) p2* p4* p8= 0 d) p2* p6* p8= 0,1、简单描述符1)边界的周长:曲线长度

33、或区域轮廓的周长。2)边界的直径:边界上相隔最远的两点间的距离3)边界的曲率:相邻边界线段的斜率差,6.2.2 边界描述符(Boundary Descriptors),2、 傅立叶描述符(Fourier Descriptors),图像空间边界点的坐标用复数表示为 s(k) = x(k) + jy(k),k=0,1,N-1。进行离散傅立叶变换a(u)称为边界的傅立叶描述符。,选整数 MN-1,进行逆傅立叶变换(重构)基于上式在重构每一个点所需要的计算项大大减少。边界点数很大时,M一般选为2的整数次幂。上述方法对u M-1部分舍去不予计算,而傅立叶变换高频部分对应细节,因此M越小细节部分丢失越多。

34、,1)较少的傅立叶描述符(如4个),就可以获取边界的整体轮廓。2)使用复数作为描述符,对旋转、平移、放缩等操作和起始点的选取不十分敏感。3)几何变换的描述符可通过对函数作简单变换来获得。下表表示傅立叶描述符的基本性质:,3、 矩(Moments) 将描述形状的任务减化为描述一个一维函数。 矩的定义:连接边界的两个端点,并将得到的线段旋转到水平方向得到函数g(r)。注意边界点的坐标旋转相同角度。,n(r)是边界的n阶矩:,1、 简单描述符 面积:区域内像素数。 周长:区域边界点数量。 复杂度:区域形状的复杂程度,常使用e = (周长)2/面积。图形形状接近圆形时e最小(为4),形状复杂时值较大。

35、其它用做简单区域描述符的量包括:灰度的均值和中值、最小和最大灰度级值、大于和小于均值的像素数等。,6.2.3 区域描述符(Regional Descriptors),2、 拓扑描述符(Topological Descriptors)拓扑学研究图形不受畸变变形(不包括撕裂或粘贴)影响的性质,拓扑性质是全局性质,与距离无关。 1)区域内孔洞数H 2)区域内连通分量的数目C 3)欧拉数:E=C-H,对一幅二值图象A,可以定义两个欧拉数(1)4-连通欧拉数E4(A):4-连通的目标个数减去8-连通的孔数 (2)8-连通欧拉数E8(A):8-连通的目标个数减去4-连通的孔数,多边形网:由直线段(包围)构

36、成的区域集合 欧拉公式 V:顶点数B:边线数F:面数 V=26, B=33, F=7, C=3, H=3, E=0,3、 纹理,纹理是图像分析中常用的概念,但目前尚无对它正式的(或者说尚无一致的)定义,一般说,可以认为是由许多相互接近的、互相编织的元素构成,它们常富有周期性。直观来说,纹理描述可提供区域的平滑、稀疏、规则性等特性。常用的三种纹理描述方法是: 统计法; 结构法; 频谱法。,1)统计法:借助区域灰度的共生矩阵描述纹理。设S为目标区域R中具有特定空间联系的像素对的集合,则共生矩阵P定义为:,分子:具有某种空间关系、灰度值分别为g1和g2的像素对的个数,分母:像素对的总和个数。“#”代

37、表数量,实例:位置算子和共生矩阵纹理统计描述中,可借助位置算子计算共生矩阵。设W是一个位置算子,A是一个kk矩阵,其中每个元素aij为具有灰度值gi的点相对于由W确定的具有灰度值gj的点出现的次数,这里有0i, jk-1。下图是只有3个灰度级的图像(g1=0, g2=1, g3=2),定义W为“向右一个像素和向下一个像素,即右下方”的位置关系,得到矩阵A如下 :,如果设满足W的像素对的总个数为N,则将A的每个元素都除以N就可得到W关系的像素对出现概率的估计,并得到相应的共生矩阵。,在共生矩阵的基础上可定义几个常用的纹理描述符:,(2) 熵,(1) 角二阶矩,(3) 对比度(反差),(4) 逆差

38、分矩(均匀性),WE给出一个图像内容随机性的量度;,WM对应图像的均匀性或平滑性,当所有P(i,j)都相等时, WM达到最小值;,WC是共生矩阵各元素灰度差的一阶矩,当P中大的元素远离矩阵的主对角线时,WC较大(表明图像中的近邻像素有较大的反差);,WH在一定程度上可看作是WC的倒数(k的作用是避免分母为零,WH的大小受k值影响较大)。,2)结构法:认为复杂的纹理可由一些简单的纹理基元(基本纹理元素)以一定的有规律的形式重复排列组合而成。如果我们能定义出一些排列基元的规律,就有可能将某些纹理基元按照规定的方式组织成所需的纹理方式。这里的规则和方式可用形式语言来定义。,3)频谱法:借助傅立叶频谱

39、的频率特性描述周期的或近乎周期的2-D图像模式的方向性。常用的性质有: 傅立叶频谱中突起的峰值对应纹理模式的主方向; 这些峰在频域平面的位置对应模式的基本周期;,为方便起见可把频谱转化到极坐标系中。此时频谱可用S(r,)表示,这里S是频谱函数,r和是坐标系中的变量。对每个方向, S(r,)可以看作一维函数S(r);对每个频率r, Sr()也是一个一维函数。对固定的值分析S(r),得到沿着自原点的辐射方向上的频谱所表现的特性(比如存在的尖峰)。反之分析固定r值的Sr (),得到沿着以原点为圆心的圆形上的特性。一种更具有整体性的描述通过对下列函数进行积分(对于离散变量为求和)得到:,和,这里R0是

40、以原点为圆心的圆半径。也可以从S(r)和S()的曲线,计算它们最大值的位置等来作为特征。,6.2.4 关系描述符(Relational Descriptors),分割出来的对象可能由多个成分(或区域)组成。需要描述各个成分之间的结构关系。常用方法:将结构关系用符号串来描述,或用一树形结构描述。,提取的图元图元间的操作一组特定的图元生成一个结构,1、 骨架关系编码,2、 树结构关系编码,树结构中每个结点的意义和结点之间的关系(如包含关系)最为重要,例:,6.3 图像分析,图像分析是发现、辨认和理解模式的过程,这些模式都与图像数据相关。计算机图像分析的主要目的之一是,赋予机器某种感觉能力,例如OC

41、R。 获取、发现信息:从背景中提取有关信息。 学习、应用知识:抽象、归纳信息特征并应于新对象。 构造、推理知识:从不完整的信息中构造推论出新知识并应用。,6.3.1 模式与模式类,模式的定义 模式是对图像中的某个对象或某些感兴趣本质的数量或结构的描述。 模式由一个或多个描述符组成,即模式是一个描述符序列(一组描述符)。 模式是一组特征(名词“特征”经常被用来代指描述符) 。模式类是具有某些公共特征的模式的系列,用w1,w2,wM表示,M是类的个数。模式识别根据图像中对象的特征组成的模式,确定对象是属于哪一个模式类。,模式:汽车的长、宽、高(L,W,H) 模式类(w大, w小, w卡) :大客车

42、: (L,W,H)大小轿车: (L,W,H)小卡 车: (L,W,H)卡 模式实例:图像中发现的一个对象(L1,W1,H1) 模式识别:判断对象(L1,W1,H1),是大客车、小轿车、还是卡车。,三种模式序列: 模式特征向量;模式串;模式树,1、模式特征向量描述符构成的向量,xi代表第i个描述符,n是描述符的数量。模式特征向量常表示为列向量或 (x1, x2, , xn)T。,模式特征向量用粗体小写字母表示,如x,y和z:,假设通过测量花瓣的宽度和长度描述三种蝴蝶花(多毛的、维吉尼亚、多色的)。这里涉及一个两维的模式特征向量,x1、x2分别对应花瓣的长和宽,三种模式类用w1、w2、w3表示。,

43、花瓣长宽特征成功地将多毛的蝴蝶花与其它两种分离,但对于分离维吉尼亚和多色的是失败的。这个结论说明了分类的特征选择问题,在这个问题中,类的可区别性的程度,完全依赖于对应用的描述符的选择。,模式特征的选择: 可区别性:对不同类别对象特征值差异明显。 可靠性 :对同类对象特征值比较接近。 独立性 :所用的各特征之间彼此统计独立。 数量少 :过多的特征数,会使系统复杂度提高。一般特征向量的选择方法: 尽量不选择带噪声和相关度高的特征。 先选择一组直觉上合理的特征,然后逐渐减少到最佳。,2、 模式串:对象特征的结构或空间关系。,3、 模式树:分层有序结构。,6.3.2 决策论法,设:模式特征向量:x =

44、 (x1, x2, ,xn)T,对M个模式类 w1,w2,wM,寻找M个决策函数d1(x), d2(x), , dM(x),如果di(x) dj(x) j = 1, 2, , M; j i,那么模式实例x属于模式类wi即如果一个未知模式对象x属于第i个模式类,把x代入所有的决策函数,di(x)的取值最大。,对模式特征向量x,如果di(x) - dj(x) = 0 则x向量称为wi与wj的决策边界。通常用单一函数dij(x)标识两个类之间的决策 边界,定义为dij(x) = di(x) - dj(x) = 0如果 dij(x) 0 x 属于类wi如果 dij(x) 0 x 属于类wj,1 、分类

45、器的设计和训练,1 )分类器一般设计方法 每一模式类给出一个典型模板。 计算待分类对象与不同典型模板之间的相似程度。 相似值是对象的函数,函数值决定对象属于哪一模式类。,2) 分类器一般设计规则 分类器规则转换为阈值规则; 将测量空间划分成互不重叠的区域; 每一个模式类对应一个区域(或多个); 对象的分类函数值落在哪个区域,对象就属哪类; 某些情况,某些区域为“无法确定”类。,3) 分类器的训练 决策规则决定后,需要确定分类器的阈值; 用一组已被正确表示类别的对象训练分类器,这些训练对象称为训练集; 通过对这些对象确定能够将决策面划分成不同区域的合理阈值。,以蝴蝶花的例子为例: (1) 为多色

46、(w1)和多毛(w2 )两种蝴蝶花,确定两个原形(或称模板)m1和m2。(2) 判断未知模式向量x与m1和m2的距离,如果与m1的距离小于与m2的距离,则x属于w1,否则属于w2 。,2、最小距离分类器,1计算模式类wj的原形模式特征向量:,Nj是属于模式类wj的模式向量的个数。M是模式类的数目。,2计算x 与 mi的距离dj(x) = | x mj | j = 1, 2, , M其中 | a | = (aTa)1/2是欧几里德范式| x mj | = (x mj )T (x mj ) 1/2 j = 1, 2, , M 3 如果di(x) = min(dj(x) j = 1, 2, , M,

47、则x 属于wi,为便于计算,改写成求最大的标准形式,决策函数为:dj(x) = xTmj 1/2mjTmj j = 1,2, , M 如果,di(x) = max(dj(x) j = 1, 2, , M 则x 属于wi,4 用上式得到的类wi和wj之间的决策边界是:dij(x) = di(x) - dj(x)= xT(mi mj) 1/2(mi mj)T(mi + mj) = 0,m1=(4.3, 1.3)Tm2=(1.5, 0.3)T,3、 相关匹配分类器,基本思想: a. 用样板子图像直接作为模式特征(不是用描述符)。 b. 通过子图像与原图像直接进行相关计算,把相关计算作为决策函数。 c

48、. 相关计算获得最大值的位置,就被认为匹配成功。,决策函数是相关函数,问题1:在边界处失去准确性,误差与子图像尺寸成正比。,改进:相关函数对振幅的变化太敏感,f(x,y)加倍,c(s,t)也加倍。用相关系数函数代替相关函数,这里x=0,1,2,M-1, y= 0,1,2,N-1。 是w中像素的平均值(只计算一次), 是f 中与w当前所在位置重合的子图像像素平均值,总和的值通常由f和w两者的坐标代入后求得。 相关系数(s,t)的值域为(-1,1)。,问题2:当被匹配图像中,对象的尺寸和角度与模式不一致,此方法将失效。 改进: 尺寸的正则化,解决空间比例的问题。正则化模板与原图。 如果知道原图像的

49、旋转角度,我们可以通过旋转原图像,对齐模式解决。 结论:如果被匹配的对象角度任意,此方法不能用于这种问题。,1、匹配形状数,通过比较两个对象边界的形状数的相似程度,来匹配对象。例如:未知模式 原形模式类,6.3.3 结构法,利用不同模式类的内在结构关系进行模式识别。,两个区域边界的相似级别k用相同形状数的最大序号表示。即当考虑用4向链码表示的封闭区域边界的形状数时,A和B具有相似级别k,当且仅当满足:s4(A) = s4(B), s6(A) = s6(B), s8(A) = s8(B), sk(A) = sk(B),sk+2(A) sk+2(B), sk+4(A) sk+4(B), ,s表示形状数,下标表示序号。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报