收藏 分享(赏)

第2章_数字图像处理基础.ppt

上传人:yjrm16270 文档编号:4664989 上传时间:2019-01-06 格式:PPT 页数:48 大小:1.69MB
下载 相关 举报
第2章_数字图像处理基础.ppt_第1页
第1页 / 共48页
第2章_数字图像处理基础.ppt_第2页
第2页 / 共48页
第2章_数字图像处理基础.ppt_第3页
第3页 / 共48页
第2章_数字图像处理基础.ppt_第4页
第4页 / 共48页
第2章_数字图像处理基础.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

1、1,数字图像处理 (Digital Image Processing),信息科学与工程学院,2,第二章 图像和视觉基础,2.1 光的特性 2.2 视觉系统 2.3 颜色模型 2.4 图像的表示 2.5 邻域、连通、距离,3,2.1 光的特性,光的本质是电磁波。在电磁波谱中,可见光仅占很窄的一个波谱范围。其波长在0.380.76m之间。下图示出电磁波谱的大致划分。可见光的低频率端是红色,高频率段是紫色。从高频到低频的光谱颜色的变化分别是紫、蓝、青、绿、黄、橙、红。,4,太阳或灯泡:白色光。当白色光投射到一个物体上时,某些频率被反射,某些则被物体吸收了。除了频率以外,描述光的各种性质还需要另一些特

2、征。在观察光源时,我们的眼睛对颜色(或主频率)和另外两个基本的感觉作出反应。其中之一是亮度,即感受到的光明度。第二个感受的特征是光的纯度或饱和度。一般来说可见光的人的眼睛只能看到可见光部分(波长为0.380.76m). 可成像的射线已有多种,如:射线:0.0030.03nm; X射线:0.033nm;紫外线:3300nm; 红外线:0.8300m;微波:0.3100cm。这些射线均可以成像。利用图像处理技术把这些不可见射线所成数据加以处理并转换成可见图像,实际上大大延伸了人类视觉器官的功能,扩大了人类认识客观世界的能力。,5,2.2 视觉系统,2.2.1 视觉基础眼睛中的光接受器主要是视网膜中

3、的视觉细胞。有两种类型的视觉细胞,分别称为锥状体和杆状体。锥状体只有在光线明亮的情况下才起作用,它具有辨别光波波长的作用,因此对颜色非常敏感。每个眼睛的锥状体大约有700万个。杆状体比锥状体的灵敏度高,在较暗的光线下就能起作用,但是它没有辨别颜色的能力,又叫夜视觉,所以黑暗中看到的东西没有颜色,其数量大约有1亿三千万个。当眼睛接受到的光包含所有可见光信号,且其强度大体相近时,人们感觉到的是没有颜色的白光。在光源为白光的照射下,若物体能反射80%以上的入射光,则看上去是白色的。若反射光小于3%,物体看上去是黑色的,中间值对应不同程度的灰色。为了表示方便,光强度可以规一化到01之间,0对应黑色,1

4、对应白色,中间值对应灰色。,6,光能本身是无颜色的,颜色是人们眼睛感知光后产生的生理和心理现象。眼睛对光的感觉称为光觉,对颜色的感觉称为色觉,这是眼睛的基本特性。光觉的门限值大约为110cd/m(尼特),人眼感觉光的范围的最大值和最小值之比达到1010以上。但人的眼睛并不能同时对这样大范围的明亮程度都作出反应。某一时刻眼睛只能感知很小范围的明亮度。一般情况下,在相同亮度的刺激下,背景亮度不同所感觉到的明暗程度也不同,例如白天我们看不见星星,而夜晚却能看到。同样,在观察颜色时,在图形的色度一样,但背景颜色不一样时,感觉到的图像的色度也不一样。这种现象叫做对比现象。对比现象包括亮度对比和颜色对比。

5、实验表明,在背景亮度比目标亮度低的场合,感觉目标有一定亮度。当背景亮度比目标亮时,看到的目标就有亮的多的感觉。同时,对比效果在背景大的场合比较显著。,7,2.2.2 视觉过程,1光学过程,15 / 100 = 2.55 / 17,8,2化学过程 主要有锥细胞和柱细胞两种细胞起作用。锥细胞数量少,对颜色很敏感,它在明视觉或亮光视觉中起到主要作用。柱细胞数量多,分辨率比较低不感受颜色并对低照度较敏感,它在暗视觉或微光视觉中起到主要作用。 3神经处理过程 每个视网膜接收单元都与一个神经元细胞借助突触(synapse)相连,每个神经元细胞借助其它的突触与其它细胞连接,从而构成光神经(optical n

6、erve)网络,光神经进一步与大脑中的侧区域(side region of the brain)连接,并到达大脑中的纹状皮层(striated cortex),对光刺激产生的响应经过一系列处理最终形成关于场景的表象,从而将对光的感觉转化为对景物的知觉。,9,?,这两个图形在视网膜上是固定不动的,但你对它的感觉却是在两种可能图形中动摇。同时感觉到两种有意义的图形是很困难的!,10,2.2.4 视觉系统对光的感知特点,1.人眼适应的亮度范围(1)总体范围大:从暗视觉门限到眩目极限之间的范围在1010量级(2)具体范围小:一般范围在102量级,11,2. 亮度变化的感知人类视觉系统对亮度变化的感知比

7、对亮度本身要敏感,而且对光强度的响应不是线性的,而是对数形式的(即:对暗光时亮度的增加比对亮光时亮度的增加更敏感)。因此,有时会产生一些错觉,如马赫效应等。,视觉错觉,12,2.3 颜色模型,白光通过棱镜,就会折射出颜色的光谱。一般可以分解成红、橙、黄、绿、蓝、青、紫七色。可见光谱的每部分都有它自己唯一的值,它被称之为颜色,理论上可以选择几百万种颜色。可见光谱可以由多种颜色构成,但是人们一般只看到一种颜色,它是多种颜色混合后结果。因为人眼有把多种颜色相混合的能力。在心理生物学上,颜色由其色彩、色饱和度和明度决定。色彩即颜色的“色彩”,它是某种颜色据以定义的名称。色饱和度是单色光中掺入白光的度量

8、,单色光的色饱和度为100%,白光加入后,其色饱和度下降,非彩色光的色饱和度为0%,明度为光的强度值。在心理物理学上,与色彩、色饱和度和明度相对应的是主波长、色纯和亮度。在可见光谱上,单一波长的电磁能所产生的颜色是单色的。光的颜色由其主波长决定,亮度与光的能量成比例,它是单位面积上所接受的光强。纯的单色光在实际生活中是少见的,人们所看到的颜色都是混合色。彩色图形显示器(CRT)上每个像素都是由红、绿、蓝三种荧光点组成,这是以人类视觉颜色感知的三刺激理论为基础设计的。三刺激理论基于这样一个假设:人类眼睛视网膜中的锥状视觉细胞,分别对红、绿、蓝三种光最敏感。实验表明,对蓝色敏感的细胞对波长为440

9、nm左右的光最敏感;对绿色敏感的细胞对波长为545nm左右的光最敏感;对红色敏感的细胞对波长为580nm左右的光最敏感。实验还显示,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。,13,色度图,14,2.3.2 常用颜色模型 1). RGB颜色模型 国际照明委员会选择红色(波长=700.00nm)、绿色(波长=546.1nm)、蓝色(波长=435.8nm)三种单色光作为表色系统的三基色,这就是CIE的RGB(Red,Green,Blue)颜色表示系统。我们通常使用的彩色光栅显示器采用的就是RGB颜色模型系统。RGB颜色模型是相加混色,称为加色系统。白光可以由RGB三种基本色相加得到。产生

10、1lm(流明)的白光所需要的三基色近似值可以用下面的亮度方程来表示: 1lm(白光)0.30lm(红)0.59lm(绿)0.11lm(蓝) 即产生白光时,三基色的比例关系不等,这给实际使用带来一些不方便。为了克服这一缺点,使用了三基色单位制,即所谓的T单位制。在使用T单位制时,其方程可以改写如下:1lm(白光)1T(红)1T(绿)1T(蓝) 即1T单位红光=0.30lm,1T单位绿光=0.59lm,1T单位蓝光=0.11lm。由不同的RGB分量相加就可以产生其他的颜色,即:CrRgGbB 式中C为混合色,r,g,b为使用T单位制时,所需要RGB三基色的量值,取值范围在01之间。然而,仍然有不少

11、颜色无法用RGB表示出。下图中三角部分标出了RGB颜色模型系统所能表示的颜色区域。,15,RGB加色系统,16,RGB颜色模型,17,2). CMY颜色模型以品红、青、黄(Cyan,Magenta,Yellow)作为三基色所构成的颜色模型也是一种常用的颜色表示系统。它是一种减色系统。CMY减色系统和RGB加色系统颜色互为补色。所谓某颜色的补色是从白色中减去这种颜色后所得的颜色。品红是绿色的补色,青色是红色的补色,黄色是蓝色的补色。即相加系统的补色就是相减系统的基色(R+G=黄,G+B=青,R+B=品红)。,18,与彩色光栅显示器RGB三支电子枪轰击屏幕荧光粉组合光颜色不同,打印机和绘图仪之类的

12、硬拷贝设备是通过往纸上涂颜料来生成彩色图片。我们通过反射光来看见颜色,这是一种减色处理。正如白色光经过品红色物体表面的反射或透射后,光谱中绿色部分被吸收和减去,人们看到物体呈现品红色,是一个减色过程。摄影的滤光镜也是利用这一原理。打印、绘图、印刷、胶卷以及非发光显示器等反射体通常采用CMY减色系统。使用CMY减色系统的打印处理通过四个墨点的集合来产生颜色点。三种基色(品红、青和黄)各使用一点,黑色也使用一点。因为品红色、青色和黄色墨水的混合通常生成深灰色而不是黑色,所以黑色单独包括在其中,使颜色效果更好。通过三种基色的墨水相互混合,产生不同颜色的组合。加上黑墨水后的颜色系统也称为CMYB模型。

13、,19,3).HSI模型也称为视觉生理模型。色调(H,Hue)、色饱和度(S,Saturation) 以及明度(I,Intensity),(Museum,孟塞尔颜色系统)在特定应用环境中,用于图像分析有特殊的优势。比如,在只有光照亮 度发生变化的应用中,不考虑明度,只使用色度进行区域分割。,圆锥体模型:,20,1). RGB到HIS模型的转换,2.3.3 颜色模型间的转换,21,2). HIS到RGB模型的转换,22,2.4.1 图像表示为了对图像施以有效的处理,就要了解图像的内在特性。同时,为了方便地处理图像,用适当的数字模型去表征图像的特性也是十分必要的。在图像处理中常用的数字表征法有两种

14、,一种是确定性的,一种是统计性的。用确定性的图像表征法可方便地研究图像的点的性质,而用统计表征法可用统计平均参数反映图像的特性。,2.4 图像的表示,物体,23,当用数学方法描述一幅图像时,常着重考虑它的点的性质。例如,一幅图像可以被看成是空间各个座标点上强度的集合。它的最普遍的数学表达式为:I=f(x,y,z,t) 其中,x、y、z是空间坐标,是波长,t是时间,I是图像点的光强度。对静态图像,t为常数。对单色图像,为常数。对平面图像, z为常数。例如,对于静态平面单色图像,其数学表达式可以简化为:I=f(x,y) 并且0=f(x,y),24,人们所感受的图像一般是由物体的反射光构成的。 f(

15、x,y)可以看成是由两个分量构成,一个是照射到景物上的入射光分量,另一个是反映物体反射特性的量,若分别用i(x,y)、r(x,y)表示,则 f(x,y)= i(x,y).r(x,y) 其中 0=i(x,y) , 0=r(x,y) =1,25,2.4.2 数字图像的数字化一般的图像(即模拟图像)是不能直接用数字计算机来处理的。为使图像能在数字计算机内进行处理,首先必须将各类图像(如照片,图形,X光照片等等)转化为数字图像。采样、量化所谓将图像转化为数字图像或图像数字化,就是把图像分割成如图所示的称为象素的小区域每个象素的亮度或灰度值用一个整数来表示。 把图像分割成象素的方法可以是多种多样的,如图

16、所示。即每个象素所占小区域可以是正方形的,六角形的或三角形的。与之相对应的象素所构成的点阵则分别为正方形网格点阵、正三角形网格与正六角形点阵。上述各象素分割方案中,正方形网格点阵是实际常用的。,26,图像数字化,27,28,1). 采样采样就是把在时间上和空间上连续的图像转换成为离散的采样点(即象素pixel)集的一种操作。由于图像是一种 二维分布的信息,为要对它完成采样操作,就需要先将二维信号变为一维信号,再对一维信号完成采样。具体做法是,先沿垂直方向,按一定间隔以上到下顺序地沿水平方向直线扫描的方式,取出各水平行上浓淡(灰度)值的一维扫描线。而后再对该一维扫描线信号按一定间隔采样得到离散信

17、号。即先沿垂直方向抽样,再沿水平方向抽样两步完成采样操作。对于运动图像(即时间域的连续图像),还需先在时间轴上采样,即先在时间轴上采样,再沿画面垂直方向采样,最后再沿画面水平方向上抽样这样三步完成采样操作。,29,30,均匀采样,非均匀采样,31,在进行采样时,采样点间隔的选取是一个非常重要的问题。它决定了采样后的图像忠实地反映原图像的程度。或者说,采样间隔大小的选取要根据原图像中包含何种程度的细微浓淡变化来确定。一般来说,图像中细节越多,则抽样间隔应越小。根据一维采样定理,若一维信号g(t)最大频率为,若用T1/(2)为间隔进行抽样后,则根据抽样结果g(iT)i=-1,0,1能完全恢复g(t

18、)。采样定理,32,设在x方向以等间隔x、y方向以等间隔y进行空间采样,则可得离散的图像,此时空间某一点的坐标可表示为(i x ,j y ),一般情况下x = y ,且省略不写,此时图像可表示为分f(i,j)。 若采样结果每行(即横向)象素为M个,每列(即纵向)象素为N个,则整幅图像大小为MN个象素。 i=0,1,M-1, j= 0,1,N-1 习惯上将f(i,j)写为f(x,y)。注意什么?,33,34,2).量化经过抽样,模拟图像已在时间、空间上离散化为象素。但抽样结果所得的象素的值(即浓淡值或灰度值)仍是连续量。把抽样后所得的这些连续量表示的象素值离散化为整激值的操作叫量化。即若连续浓淡

19、(灰度)值用L来表示,则对于满足LiLLi+1的L值都量化为整数值Li, Li称为象素的灰度值。L与Li的差称为量化误差。一般每个象素的灰度值量化后用一个字节(8位二进制码或8比特)来表示,如把由白一灰一黑的连续变化的灰度值,量化为0255共256个灰度级。量化后的灰度值,代表了相应的浓淡程度。,35,3)图像的矩阵和向量表示 经过数字化过程(采样、量化)得到矩阵:,若按行的顺序,后一行的第一个元素紧接着前一行的最后一个元素,使所有的元素连接在一起构成一个向量,(行堆积) f=f0,f1,fM-1T, fi=f(i,0), f(i,1), f(i,N-1) T(列堆积?),36,灰度图像:单色

20、,一元组,彩色图像:RGB三色,三元组,37,4)数字图像的数据量 一幅数字化后的图像其总数据量是:每行象素数(M)每列象素数(N)灰度量所占用位数(Bits),图像(垂直)尺寸 M:图像(水平)尺寸 N:象素灰度级数 G (k-bit):图像所需的位数 b:,38,下面举例给出若干常用的M、N值。几种常用的图像大小如下:汉字:取决于字的大小,每个字可以从1616到256256象素;显微镜图像:256256或512512象素;电视图像:500700480象素;卫星图像:(单波殷)32402340象素;SAR(合成孔径雷达)80008000象素;CRT显示器:一般640480或10241024象

21、素,20482048象素等,39,5). 图像质量与采样和量化,图像空间分辨率变化所产生的效果,图像幅度分辨率变化所产生的效果,空间和幅度分辨率同时变化所产生的效果,40,2.5 邻域、连通、距离,41,1)像素的邻域Neighbors 对一个坐标为(x,y)的像素p,它有4个邻近像素(沿水平和竖直方向),它们的坐标分别是: (x+1,y),(x-1,y),(x,y+1),(x,y-1) 这些像素称为像素p的4-邻域,N4(p).,42,坐标为(x,y)的像素p,它有4个沿对角线的邻近像素,它们的坐标分别是: (x-1,y-1),(x-1,y+1),(x+1,y-1),(x+1,y+1) 这些

22、像素称为像素p的对角-邻域,ND(p). 4-邻域和对角-邻域统称为p的8-邻域, N8(p),43,2)连通性Connectivity 像素间的连通性在建立图像中目标的边界和确定区域的元素时是一个最重要的概念。进一步分为连接(毗邻adjacency)和连通,连接是连通的一个特例。 令V表示定义连接的灰度值集合。 (a) 4-连接:2个像素p和q在V中取值且q在N4(p)中,则称它们为4-连接 (b) 8-连接:2个像素p和q在V中取值且q在N8(p)中,则称它们为8-连接 (b) m-连接(Mixed adjacency):2个像素p和q在V中取值且满足下列条件之一,则称为m-连接。q在N4

23、(p)中, q在ND(p)中且N4(p)与 N4(q)的交集为空。,44,45,从具有坐标(x,y)的像素p到(s,t)的像素q的一条通路是由一系列具有坐标为(x0,y0), (x1,y1),, (xn,yn)的独立像素组成的, 其中(xi,yi), (xi+1,yi+1)相毗邻,根据毗邻的定义,分别称为4-、8-、m-毗邻。 若从p到q有一条通路,则称它们相连通。,46,3)距离量度 给定三个像素p(x,y), q(s,t), r(u,v),如果下列条件满足的话,D是距离量度函数。 (a)D(p,q)=0,( D(p,q)=0 iff p=q ) (b) D(p,q)= D(q, p) (c) D(p,r)= D(p,q)+ D(q,r)能数出几种距离?,47,欧氏(Euclidean)距离 点p和q之间的欧氏距离 DE(p,q)=(x-s)2+(y-t)21/2 D4距离(城区City-block) D4(p,q)= |x-s|+|y-t| D8距离(棋盘Chessboard) D8(p,q)= max(|x-s|,|y-t|) 当考虑D4 、D8时,不需考虑两个像素间是否真有一条通路。 *m连通时距离测量:需要考虑实际的通路。,48,m-连通时的距离测量,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 通信信息 > 电子电气自动化

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报