1、第二章 数字图像基础,本章内容,2.1 视觉感知要素2.2 光和电磁波谱2.3 图像感知和获取2.4 图像取样和量化2.5 象素间的一些基本关系2.6 线性和非线性操作,本章要求,了解图像数字化过程及分辨率变化对图像的影响; 了解数字图像的表示形式和特点 掌握像素间的关系:相邻、领域、邻接性、连通性、距离的度量 掌握图像的代数运算以及应用,2.1.1 人眼的构造(自学) 2.1.2 眼睛中图像的形成(自学)2.1.3亮度适应和鉴别 人眼对不同亮度的适应和鉴别能力 亮 暗 适应慢 暗 亮 适应快,2.1 视觉感知要素,(1)视觉适应性,2.1.3亮度适应和鉴别,亮度适应范围:1010量级(10-
2、6mL(夜视域)104mL(强闪光); 与整个适应范围相比,人眼在某一时刻能鉴别的亮度级别范围很小(以该环境的平均亮度为中心的一个小的亮度范围);,亮度适应级(视觉系统当前的灵敏度级别):人眼适应了某一环境后,该环境的平均亮度; 亮度适应现象:人眼并不能同时在整个范围内 工作,而是利用改变灵敏度来实现大的动态范围内的变动; 当平均亮度适中时,能分辨的最大亮度和最小亮度之比为1000:1;当平均亮度很低时,这个比值只有10:1 主观亮度是进入人眼的光强度的对数函数;,(2)辨别光强度变化的能力,2.1.3亮度适应和鉴别,当背景光保持恒定时,改变其他光源亮度,从不能察觉到可以察觉间变化,一般观察者
3、可以辨别12到24级不同强度的变化.,图2.5 亮度辨别特性的基本实验,图2.6 作为强度函数的典型韦伯比,韦伯定理:如果一个物体的亮度与其周围背景的亮度I有刚可察觉到的差别 ,则 (韦伯比) 是 的函数且 在一定的亮度范围内近似不变;,韦伯定理说明: 人眼视觉系统对亮度的对比度敏感而非对亮度本身敏感;,低照度,韦伯比高,亮度辨别能力差;高照度,韦伯比低,亮度辨别能力强;,(3)人眼感觉亮度并不是简单的强度函数,2.1.3亮度适应和鉴别,即感觉的亮度(主观亮度)不是简单地取决于光强度。,韦伯费赫涅尔定理:亮度感觉S与实际亮度B的对数成线性关系。,因此, 重现景物的亮度范围无需与实际景物的亮度范
4、围相同,只需保持二者的对比度相同; 人眼不能辨别的亮度差别也无需重现出来,只需保持二者的亮度差别级数相同即可;,同时对比效应(Simultaneous Contrast),2.1.3亮度适应和鉴别,即人眼对某个区域感觉的亮度(主观亮度)不仅依赖于他自身的亮度,还与它的背景有关;,背景变亮,相同强度的方块变暗。,马赫带效应,感觉亮度不是简单的强度函数的;视觉系统有趋于过高或过低估计不同亮度区域边界值的效应。,2.1.3亮度适应和鉴别,图中各色带亮度恒定,但实际感觉条带边缘亮度有变化:边缘处,亮的一边更亮,暗的一边更暗;,(4)视觉错觉(Optical Illusions),在错觉中,眼睛填上了不
5、存在的信息或错误地感知物体的几何特点。,2.1.3亮度适应和鉴别,电磁波谱可以用波长( )、频率( )或能量( )来描述,2.2 光和电磁波谱,c-光速 h-普朗克常量,光 可以被人眼感知的电磁波。,2.2 光和电磁波谱,电磁波是能量的一种,任何有能量的物体,都会释放电磁波。,若所有反射的可见光波长均衡,则物体显示白色 有颜色的物体是因为物体吸收了其他波长的大部分能量,从而反射某段波长范围的光。 没有颜色的光叫单色光或消色,灰度级通常用来描述单色光的强度,其范围从黑到灰,最后到白。 在原理上,如果可以开发出一种传感器,能够检测由一种电磁波谱发射的能量,就可以在那一段波长上对感兴趣的物体成像。,
6、2.2 光和电磁波谱,人从物体感受的颜色由物体反射光决定,2.2 光和电磁波谱,灰度和色彩:,彩色模型: RGB 加色法 CMY,CMYK 减色法 HSB(色泽,饱和度,明亮度),彩色光源的三个基本属性:,发光强度从光源流出的能量的总量。单位:瓦特(W),光通量观察者从光源感受到的能量。单位:流明(lm),亮度光感受的主观描绘子。单位:不能测量,2.2 光和电磁波谱,2.3 图像的感知和获取,2.3.4 简单的图像成像模型,图像系统的线性模型,我们感兴趣的各类图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收相结合而产生的。,图像形成模型 在特定坐标(x,y)处,通过传感器转换获得
7、的f值为一正的标量。 函数f(x,y)由:入射到观察场景的光源总量; 场景中物体反射光的总量组成。,0f(x,y),0i(x,y),0r(x,y)1,平均反射系数(reflectance),白光强度(illumination),灰度(Intensity),2.3.4 简单的图像成像模型,入射分量,反射分量,单色图像在任何坐标(x0,y0)处的强度为图像在该处的灰度级 lf(x0,y0),显然有 ,可以规定灰度级范围为0,L-1,获取图像的目标是从感知的数据中产生数字图像,但是传感器的输出是连续的电压波形,因此需要把连续的感知数据转换为数字形式。这一过程由图像的取样与量化来完成。数字化坐标值称为
8、取样数字化幅度值称为量化。,2.4 图像取样和量化,图像的取样率:单位距离的取样数目(在两个空间方向上),2.4 图像取样和量化,2.4 图像取样和量化,模拟图像信号,(1)空间采样,(2)灰度级(强度)量化,均匀采样和量化 非均匀采样和量化,坐标的数字化称为采样,幅度值的数字化称为量化。,2.4 图像取样和量化,黑白图像,灰度图像,彩色图像,2.4 图像取样和量化,黑白图像的数字化,2.4 图像取样和量化,灰度图像的数字化,2.4 图像取样和量化,彩色图像的数字化,2.4 图像取样和量化,图像的非均匀采样:在灰度级变化尖锐的区域,用细腻的采样,在灰度级比较平滑的区域,用粗糙的采样。图像的非均
9、匀量化:非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化.具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些. 由于图像灰度值的概率分布函数因图像不同而异,所以不可能找到可用于所有图像的最佳非等间隔量化方法.,2.4 图像取样和量化,2.4.2数字图象的表示,M,N必须为正数,L为灰度级,灰度的取值范围为0,L-1。灰度级的取值范围一般称为图像的动态范围。,一般,M、N和L取值为2的整数次幂。,L=2k,称为k位图像,(1)直角坐标系,图像的坐标系的表示,2.4.2数字图象的表示,(
10、2)矩阵坐标系(MATLAB),2.4.2数字图象的表示,(3)像素坐标系(显示),1、坐标原点位于左上角 2、数据先沿x轴增加 3、然后再沿y轴增加 4、坐标轴为整数,2.4.2数字图象的表示,思考:,1、为什么图像经常用512512、256256、128128等形式表述;,答: 因为当图像的大小是2的次幂时,图像的许多计算可以得到简化。,答: 存储一幅大小为MN,有2k个不同灰度级的图像所用的Bit数为: b=MNk (2.4-4) 因此,存储一幅512512 ,有256个灰度级(k=8)的图像需要5125128=2097152(Bit) 或 512512=256K(Byte),2.4.2
11、数字图象的表示,2、存储一幅512512,有256个灰度级的图像需要多少比特?,2.4.3 空间和灰度分辨率,空间分辨率(spatial resolution),b)10 km/pixel,a)20 km/pixel;,图像中可分辨的最小细节,主要由采样间隔值决定,采样间隔值越小,空间分辨率越高,空间分辨率 (低),空间分辨率 (高),空间分辨率变化对图像视觉效果的影响,灰度级L不变,灰度级别中可辨别的最小变化,通常也把灰度级L称为灰度分辨率,灰度分辨率,灰度级分辨率对图像视觉效果的影响,灰度级分别为256,128,64,32的数字图像,256,128,64,32,16,8,2,4,灰度级从2
12、56到2的数字图像,空间分辨率MN不变,图像的分辨率表示的是能看到图像细节的多少,显然依赖于MN和L 保持MN不变而减少L则会导致假轮廓 保持L不变而减少MN则会导致棋盘状效果 图像质量一般随着MN和L的增加而增加,但存储量增大。 实验表明图像的细节越多,用保持MN恒定而增加L的方法来提高图像的显示效果就越不明显,因此,对于有大量细节的图像只需要少数的灰度级。,小结:,2.4.3 空间和灰度分辨率,阅读例2.2,2.4.4 图像的收缩与放大,(1)、图像的收缩 行、列删除,最近邻域内插方法在原图像上寻找最靠近的像素并把它的灰度值赋给栅格上的新像素。,(2)图像的放大创立新的象素位置;给新象素赋
13、灰度值,2.4.5 图像的收缩与放大,双线性内插方法,用最近领域内插法(上一行)和双线性内插法(下一行)得到的放大图像分别将128128,6464, 3232放大到10241024,(2)图像放大的效果比较(例2.4),2.4.5 图像的收缩与放大,主要内容 相邻像素 邻接性、连通性、区域和边界 距离度量 基于像素的图像操作 图像的代数运算性、连通性、区域和边界,2.5 像素间的一些基本关系,2.5 像素间的一些基本关系,对于像素p(m,n) 4邻域 (m+1,n),(m-1,n),(m,n+1),(m,n-1) N4(p) 对角邻域 (m+1,n+1),(m+1,n-1),(m-1,n+1)
14、,(m-1,n-1) ND(p) 8邻域 N4(p) + ND(p) N8(p),4邻域,8邻域,2.5.1 相邻像素,像素的相邻仅说明了两个像素在位置上的关系,若再加上取值相同或相近,则称两个像素邻接。,2.5.2 邻接性、连通性、区域和边界,1、两个像素p和q邻接的条件,(1)位置相邻p(m,n)和q(s,t)位置上满足相邻,即,(2)灰度值相近,即称为灰度值相近(似)准则。,称为灰度值相近(似)准则。,2.5 像素间的一些基本关系,2、邻接性,令V是用于定义邻接性的灰度值集合(相似性准则),存在三种类型的邻接性: (1)4邻接:若像素p和q的灰度值均属于V中的元素,且q在N4(p)中,则
15、p和q是4邻接的. (2)8邻接:若像素p和q的灰度值均属于V中的元素,且q在N8(p)集中,则p和q是8邻接的. (3)m邻接(混合邻接):若像素p和q的灰度值均属于V中的元素,q在N4(p)中,或者q在ND(p)中且集合N4(p)N4(q)没有V值的像素,则具有V值的像素p和q是m邻接的.,2.5 像素间的一些基本关系,4邻接必8邻接,反之不一定成立。两种邻接及其关系见下图所示,相似性准则为V=1,p与q: 4邻接,也8邻接; q与r :8邻接但非4邻接。,2.5 像素间的一些基本关系,4邻接与8邻接的关系,m邻接可以消除8邻接所带来的(通路)二义性,(b)中心像素p的8邻接像素:q1,q
16、2,p,q1,p,q1,q2,q2,V=1,2.5 像素间的一些基本关系,q1和p:8邻接,非m邻接,q2和p:8邻接,又m邻接,只定义8邻接,则q2和q1之间的通路有两条(二义)见 (b); 定义了m邻接,则q2和q1之间的通路就只有一条(m通路)见(c),(a) 像素安排,(b),(c),(c)中心像素p的m邻接像素:q2,不满足条件:N4(p)N4(q1)没有V值的像素,3、通路,像素p(x0,y0)到像素q(xn,yn)的通路(path)定义为特定的像素序列:(x0,y0),(x1,y1), (x2,y2) ,(xn,yn), st.(xi,yi)和(xi-1,yi-1)(对于1in)
17、是邻接的. n是通路的长度.若(x0,y0)=(xn,yn),则通路是闭合通路.,2.5 像素间的一些基本关系,(b)图中,q1和q2 之间存在2条通路;,(c)图中,q1和q2 之间只有1条通路;(m通路),若S是图像中的一个象素子集,对任意的p,qS,如果存在一条由S中像素组成的从p到q的通路,则称p在图像集S中与q连通,连通也分为4连通和8连通。,2.5 像素间的一些基本关系,4、连通性,连通分量:,连通集:,如果S中仅有一个连通分量,则S叫连通集;,黄色部分为S,区域:R是图像中 的像素子集。如 果R是连通集,则 称R为一个区域 (黄色部分)。,2.5 像素间的一些基本关系,5、区域(
18、region),邻接区域:两个 区域。如果联合 (并)为一个区 域,则称这两个 区域为邻接区 域。如图Ri和Rj,注意:,定义区域时,必须指明灰度相似性准则V= ;,定义邻接区域时,还必须指明邻接类型;,(a)中,Ri和Rj是4邻接区域,且RiRj为连通集; (b)中, Ri和Rj是8邻接区域,但RiRj为非连通集;,灰度相似性准则V不一样,则区域就不一样;,2.5 像素间的一些基本关系,6、区域的边界(boundary),假设一副图像S中有K个不连接区域,且它们都不接触图像边界。即:,前景:定义为 背景:定义为,内边界:一个区域的边缘或轮廓线叫做边界。(即:该区域中和其背景相邻接的点的集合)
19、,外边界:对应于背景边界。,2.5 像素间的一些基本关系,注意:,前景(黄色区域):V=1,内边界就是它自身; 背景(兰色区域):V=0,一个区域和其背景中的点之间的邻接要根据8连通来定义!,左图中,被圈出的点如果在区域及背景间使用4连通,就不是1值区域边界的成员,左图中,1值区域的内边界就是区域自身(不是闭合通路),而外边界是一个围绕该区域的闭合通路,则D是距离的度量函数.,. 距离的度量,欧氏距离: D4距离(城市街区距离): D8距离(棋盘距离):,2.5 像素间的一些基本关系,三种距离的关系为,通过D4和D8的计算,可以大大减少运算量,以适应数字图像数据量很大的特点,.距离的度量,.距
20、离的度量,Dm距离:,V=1,2.6 图像处理的数学工具介绍,2.6.1 矩阵操作(复习) 2.6.2 线性和非线性操作,线性算子H:,非线性算子:不满足(2.6-1)的算子,2.6 .3 图像处理的算术操作,算数运算是指对两幅或多幅输入图像进行点对点的加、减、乘、除计算而得到输出图像的运算,算术运算只涉及一个空间位置(象素)的运算; 算术运算在相同大小的图像之间进行;,算术运算:加、减、乘、除,两幅图像的相除看成用一幅的取反图像与另一幅图像相乘.图像的乘法不仅可以用于对二进码模板进行处理,而且可以直接用于灰度处理. 减法处理主要用于增强两幅图像的差异。,2.6.3 图像的算数运算,加法:,作
21、用一、去除“叠加性”噪音,K个图像的均值定义为:,2.6.3 图像的代数运算,有一个噪音图像集,当噪音 为互不相关,且均值为0的白噪声时,上述图象均值将降低噪音的影响,K增加时,在各个(x,y) 处像素值的噪声变化率将减少。即:随着在图像均值处理中噪声图像使用量的增加, 越来越趋近于f(x,y),2.6.3 图像的代数运算,加法:,我们可以得到各种图像合成的效果,也可以用于两张图片的衔接,会得到二次曝光的效果。,推广这个公式为:,作用二、生成图像的叠加效果,对于两个图像 和 求均值:,2.6.3 图像的代数运算,加法生成图象的叠加效果,减法,减法的定义主要应用举例 去除不需要的叠加性图案; 检
22、测两幅图像之间的差别; 计算物体边界的梯度(差分运算);,2.6.3 图像的代数运算,去除不需要的叠加性图案 设:背景图象b(x,y),前景背景混合图象f(x,y)g(x,y) = f(x,y) b(x,y)g(x,y) 为去除了背景的图象。电视制作的蓝屏技术就基于此,2.6.3 图像的代数运算,减法,检测两幅图像之间的差别,增强细节,2.6.3 图像的代数运算,减法,(b)图的获取:将(a)图的每个pixel的最低阶bit位置0;(低阶bit位包含更多图像中的微小细节),(c)图是差值图像。可能出现负灰度值,所以要进行标定。,=,检测同一场景两幅图像之间的变化 设: 时间1的图像为T1(x,
23、y),时间2的图像为T2(x,y)g(x,y) = T2 (x,y) - T1(x,y),2.6.3 图像的代数运算,减法,计算物体边界的梯度 在一个图像内,寻找边缘时,梯度幅度(描绘变化陡峭程度的量)的近似计算,2.6.3 图像的代数运算,减法,以后还会讲到,3.4 用算术/逻辑操作增强,减法处理:计算两幅图像对应像素点的差.,3.4.1 图像减法处理,减法处理的主要作用:增强两幅图像的差异。,差值图像的显示问题:,方法一:,方法二:,乘法:,乘法的定义主要应用举例图象的局部显示 (用二值模板图像与原图像做乘法),注意:在MATLAB中要用点乘运算,2.6.3 图像的代数运算,2.6.3 图
24、像的代数运算,乘法:,2.6.3 图像的代数运算,乘法:,2.6.3 图像的代数运算,图像算术操作的实现小结:,给定一幅图像f,保证图像间算术操作的结果的整个值域落入某个固定bit数的方法如下:,生成一幅灰度最小值为0的图像fm:,生成一幅灰度值在0,K范围内的图像fs:,例如:处理8bit图像时,K255,注意:执行除法时,需将一个较小的灰度值加到除数图像的像素上,以避免除数为0。,2.6 .4 图像处理的逻辑操作,图像中的逻辑操作主要以像素对像素为基础在两幅或多幅图像间进行.逻辑运算:与、非、或 (象素灰度值作为二进制串处理),与操作,或操作,“与”、“或”操作可用来从一幅图像中提取子图像
25、。,2.6 .5 图像处理的空间操作,空间操作直接在给定图像的象素上执行;分为以下三大类:,单象素操作; 邻域操作; 几何空间变换;,单象素操作:,原图像中象素的灰度值; 处理后图像中象素的灰度值,2.6.5 图像的空间操作,邻域操作:,邻域处理的局部平均:,2.6.5 图像的空间操作,几何空间变换:,几何空间变换(橡皮模变换)要改变图像中象素间的空间关系。,几何变换的两个基本操作:坐标的空间变换;灰度内插;,2.6.5 图像的空间操作,几何空间变换:,前向映射:,扫描输入图像的象素(v,w); 在每个位置(v,w)应用(2.623)计算(x,y);,反向映射:,扫描输出图像的象素(x,y);
26、 在每个位置(x,y)应用 计算(v,w); 内插方法决定输出图像(x,y)处的灰度值;,2.6.5 图像的空间操作,例2.9 反向映射法,2.6 .8 图像处理的概率方法,概率方法应用的前提:直将图像的灰度值看成是随机变量,均值和方差对于图像的视觉特性有明显的直接关系,高阶距更敏感!,例2.12 标准差比较,例如: 表示灰度倾向于比均值高; 表示灰度倾向于比均值低; 表示灰度均匀分布在均值周围;,图像显示函数主要有imshow、subimage。 1、imshow(I,n) 显示灰度级为n的图像,n缺省为256。 2、subimage 多图显示多个调色板的图像。 【例】load trees;
27、 m2,map2=imread(forest.tif); subplot(2,1,1),subimage(m,map);colorbar subplot(2,1,2),subimage(m2,map2);colorbar,附录I: MATLAB 命令,3、图像数据格式转换,double():其他格式转double格式 Uint8():其他格式转uint8格式 Uint16():其他格式转uint16格式,附录I: MATLAB 命令,4、imhist 功能:显示图像数据的柱状图。 语法: imhist(I) 【例】 I = imread(pout.tif); imhist(I),附录I: MA
28、TLAB 命令,5、imfinfo 功能:返回图形文件信息。 info = imfinfo(filename,fmt) info = imfinfo(filename),【例】 info = imfinfo(canoe.tif) info = Filename:canoe.tif FileModDate: 25-Oct-1996 22:10:39 FileSize: 69708 Format: tif FormatVersion: Width: 346 Height: 207 BitDepth: 8 。,附录I: MATLAB 命令,实验一、计算图象统计参数,在matlab软件编写程序: 读取图像(文件名为cameraman.tif); 最大值 最小值 均值 直方图(要求不能调用imhist函数,只能用该函数来验证自编直方图程序块的正确性)。,