1、数字图像处理,前言,数字图像处理(Digital Image Processing)是一门关于如何用计算机对图象进行处理的学科。本课程既讲解基本原理和方法,也强调编程实践(MATLAB实现)。,教材:数字图像处理及MATLAB实现,余成波编著,重庆大学出版社,2003,参考书: Digital Image Processing, R. C. Gonzalez, Prentice Hall, 2002.(中文版,阮秋琦译,电子工业出版社) 2. 数字图像处理,许录平,科学出版社,2007 3. Matlab 图像处理与应用,董长虹等,国防工业出版社,2004 4. 数字图像处理学 Visual
2、C+实现,郎锐编,北京希望电子出版社,2002,1.1.1 图像图像是自然界景物的客观反映,是人类认识世界和人类本身的重要源泉。 “图”是物体反射或透射光的分布,它是客观存在的,而“像”是人的视觉系统所接收的图在人脑中所形成的印象或认识。总之,凡是人类视觉上能感受到的信息,都可以称为图像。照片、绘画、影视画面是图像;照相机、显微镜的光学成像也是图像。汉字也可以说是图像的一种;图形也属于图像的范畴。通过某些传感器变换得到的电信号图,如脑电图、心电图等也可看做是一种图像。,1.1 图像,第1章 图像与计算机图像处理,视频(Video):视频图像又称为动态图像、活动图像或者说运动图像。它是一组图像在
3、时间轴上的有序排列,是二维图像在一维时间域上构成的序列图像。如NTSC制式电视30帧秒,PAL制式是25帧秒,电影则是24帧秒。,图形(Graphics):图形是图像的一种抽象,它反映图像的几何特征,例如点、线、面等。图形是描述产生图像中的点的过程和方法。,除常见的静态图像以外,图像还包含以下几个重要内容:,动画(Animation):动画属于动态图像的一种。它与视频的区别在于视频的采集来源于自然的真实图像,而动画则是利用计算机产生出来的图像或图形,是合成动态图像。动画包括二维动画、三维动画等多种形式。,符号(Symbol)与文字(Character):符号可以表示许多信息。符号包括各种描述量
4、、数据、语言等。其中最重要的是数值、文字等有结构的符号组。符号是用特定值表示的,如ASCII码、中文国标码等。,什么是数字图象?,数字图象是指由被称作象素的小块区域组成的二维矩阵。对于单色即灰度图象而言,每个象素的亮度用一个数值来表示,通常数值范围在0到255之间,即可用一个字节来表示,0表示黑、255表示白,而其它表示灰度。如下图所示:,125,153,158,157,127,70,103,120,129,144,144,150,150,147,150,160,165,160,164,165,167,175,175,166,133, 60,133,154,158,100,116,120, 9
5、7, 74, 54, 74,118,146,148,150,145,157,164,157,158,162, 165,171,155,115, 88, 49, 111,114,114,123,126,121,116,110,107,116,116,129,135,134,131,120,126,121, 85, 32, 29, 43, 33, 37, 52, 32, 105,114,117,118,123,122,116,113,118,112,104,108,111,105,113,126,123,107, 51, 27, 25, 34, 40, 35, 39, 36,灰度图象(128x12
6、8)及其对应的数值矩阵(仅列出一部分(26x31)),图像是一种空间信息,它具体地表明了事物的形态、位置和色彩等,以便人们进行观察、测量和识别。图像包含了丰富的信息,它直观地提供了景物的颜色、亮度、纹理、位置和形状等。上述信息成为人们理解该图像所表现的事物的基础。,图像在人类接收和传递信息中都起着重要的作用。因为图像比起声音、文字信息有其突出的长处,那就是图像的直观性、客观性,它能原封不动地将客观事物的原形展现在眼前。而声音、文字信息则是通过描述来表达事物,即属于描述性的信息。会受到描述者的许多因素的影响,诸如主观、片面、专业、情绪、状态等都会使描述偏离客观事物。,1.1.2 图像信息的重要性
7、,图像信息的重要性还在于人们的视觉系统有着瞬间获取图像、分析图像、识别图像和理解图像的能力。从视觉接受信息的角度看,可认为图像是空间客观景物在眼球视网膜上形成的像。视觉系统和大脑具有高超的能力,能区分图像中的物体与背景;能感知颜色、亮度、形状、方向、位置、运动等信息的细微差别;能将有意义的信息综合成一体;有很强的信息存储能力;具有高效地进行平行处理的能力等等。其实,人们在生活和非自动化生产中,都离不开用视觉获取图像和处理图像。,人类通过眼、耳、鼻、舌、身 接受信息,感知世界。约有75%的信息是通过视觉系统获取的。 数字图象处理是用数字计算机处理所获取视觉信息的技术。,1.2 图像技术及图像的分
8、类,图像技术在广义上是各种与图像有关的技术的总称。数字图像,主要应用的是计算机图像技术。这包括利用计算机和其他电子设备进行和完成的一系列工作。例如:图像的采集、获取、编码(压缩)、存储和传输。图像的合成、绘制和生成、图像的显示和输出。图像的变换、增强、恢复(复原)和重建、分割、目标的检测、表达和描述、特征的提取和测量。 ,1.2.1 图像技术,图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。图像分析则进入了中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的对目标的描述。图像理解主要是高层操作,操作对象基本上是从描述中抽象出来的符号,其处理过程和方法与人类的思
9、维推理有许多类似之处。,(1) 灰度分类按灰度分类有二值图像(如图文传真、文字、图表、工程图纸等)和多灰度图像。多层次灰度图像按应用的不同,有各种不同的灰度层次。如计算机打印机中有灰度层次的图像,一般为16、25灰度级,工业电视、可视电话为64灰度级(6bit),气象数字图像为7灰度级,广播电视图像为256灰度级(8bit),医学图像一般为1024灰度级(10bit)。,1.2.2 图像的分类,黑白图像 是指图像的每个像素只能是黑或白,没有中间的过渡,故又称为二值图像。二值图像的像素值为0或1。例如,灰度图像 灰度图像是指每个像素由一个量化的灰度值来描述的图像。它不包含彩色信息。,(2) 色彩
10、分类 按照色彩分类,可分为单色图像和彩色图像。单色图像指只具有某一谱段的图像,一般为黑白灰度图;彩色图像,包括真彩色、合成彩色、伪彩色等。 彩色图像是指每个像素由R、G、B三原色像素构成的图像,其中R、 G 、 B是由不同的灰度级来描述的。,(3) 运动分类图像可分为静态图像和动态图像。静态图像包括静止图像和凝固图像。每幅图像本身都是一幅静止图像。凝固图像是动态图像中的某一帧。动态图像的快慢以帧率量度,帧率反映了画面运动的连续性。可以看出,动态图像实际上是由一幅幅静态图像按时间排列组成的。,(4) 按时空分布分类图像可分为二维图像和三维图像。二维图像即平面图像,其数学表示为 f(x,y) ,f
11、为光强,x,y为二维空间坐标。三维图像即立体图像,其数学表示为 f(x,y,z),f为光强,x,y,z为三维空间坐标。,1.3 图像系统的构成,1.3.1 图像系统的线性模型,由于h(x,y)是当系统的输入为函数或理想点光源时系统的输出,是对点光源的响应,因此也称为点扩展函数。当输入的单位脉冲函数延迟了,单位后,若有L(x-,y-)=h(x-,y-)成立,则称此系统为二维线性位移不变系统。,实际中通常把传输或处理图像信号的系统近似为二维线性位移不变系统。当输入为单位脉冲函数(x,y)时,输出便为脉冲响应,1.3.2 图像处理系统的构成,实际的图像处理系统是一个非常复杂、既包括硬件又包括软件的系
12、统。其工作过程如下:对象物反射的光在摄像单元被转换成电信号(模拟信号),再由AD转换器把其转换成数字信号,被存储在图像存储器中,通过计算机接口送入计算机,做进一步的处理。根据需要再输出、控制。,(1)照明方法摄影的时候,给对象物照明用的光源、对象物以及摄像装置三者之间的位置如图1.4所示,其中(a)是背面照明方式、(b)为正面照明方式、(c)为斜射照明方式。,1) CCD图像传感器CCD(Charge Coupled Devices:电荷耦合器件)图像传感器由光电转换单元构成,光电传感单元的排列分为线阵排列和面阵排列两种。图像传感器的工作原理是把光能量转换为电荷,并且具有将转换得到的电荷进行存
13、储的能力,以及使电荷向输出电极移动的扫描能力。一维图像传感器(线阵式传感器)结构模型图中,光电转换部分是由PD1到PDm的m个单元构成,输出经过门驱动开关MOSFET与CCD连接在一起。,(2) 摄像单元,(b)所示为二维CCD传感器,它是由图(a)中的线阵传感器单元从CCD1到CCDn n个单元并列配置而成,并经过一个合成其输出的水平CCD移位寄存器,再经过一个增幅放大器,得到图像信号。,2) CCD彩色摄像光学系统的构成对象物反射的光通过透镜和光学低通滤波器之后由三棱镜把光分为RGB三原色,再由3个CCD图像传感器把红R、绿G、蓝B的光信号变换为3个电信号。,(3) 图像的数字化,般的图像
14、都是模拟图像,即图像上的信息是连续变化的模拟量。对于模拟图像只能采用模拟处理方式进行处理,例如按光学原理用透镜将照片放大。只有将连续的模拟信号变为离散的数字信号,或者说将模拟图像变换为数字图像计算机方能接受。为此,常将计算机图像处理称为数字图像处理。,所谓采样指的是空间坐标的离散化,即将图像平面分割成离散点的集合,就是把一幅连续图像在空间上分割成MN 个网格。,图像的数字化方法,包括两个方面:采样和量化。,采样使连续图像在空间上离散化,但采样点上图像的亮度值还是某个幅度区间内的连续分布。把采样点上对应的亮度连续变化区间转换为单个特定数码的过程,称为量化,即样点亮度的离散化,或者叫做像素的灰度离
15、散化。,为了方便计算机进行数据处理,有限个离散值的个数常用2n 表示,这个过程是把每一个离散样本的连续灰度只分成有限多的层次,称分层量化。把原图像灰度层次从最暗至最亮均匀分为有限个层次成为均匀量化,如果采用不均匀分层就称为非均匀分层量化。但是,用有限个离散灰度值来表示无穷多个连续灰度的量时,必然产生误差,这种误差称为量化误差(也称为量化噪声),1.4 图像质量的评价,1.4.1 人类的视觉,视觉所感受到的图像可看做是三维光辐射场对人眼的影响。目前,在语音、数据、图像三种主要的通信方式中,图像通信起到主要作用。听觉获取的是时间信息,视觉获取的是时空信息;在相同条件下,常规的视频图像的数据量比语音
16、的数据量大600-2500倍。视觉信息是人类从外界获取信息的主要方式。,1.4.2 人类视觉局限性和机器视觉产生的必然性,人的视觉系统可看成是一种神奇的、高度自动化的生物图像处理系统,但是,还存在许多不足之处。,3) 缺乏持久性:长时间、连续进行相同的视觉处理,人们就会感到单调、疲劳、厌倦、甚至遗忘,以致效率降低或者判别错误。,2) 局限性:人的视觉系统也有它的局限性。因为只能看到物体表面,不能看到物体内部的结构。,1) 主观性:人类属于主观动物,在大脑处理图像过程中难免带有主观片面性。,4) 模糊性:视觉系统的图像处理是一种模糊处理,对处理结果很少能进行定量描述。,计算机图像处理是一种能够部
17、分模拟人的视觉系统,而又能部分超越它的性能的新兴技术。,1.4.3 图像质量的评价方法,对于图像处理系统,衡量它的重要指标就是图像的质量。图像质量的含义包括两方面内容:一是图像的逼真度(被评价图像与原标准图像的偏离程度);一是图像的可懂度(指图像能向人或机器提供信息的能力)。主要的评价方法有:(1) 图像的主观评价这种方法就是通过人来观察图像,对图像的优劣做出主观评定,然后对评分进行统计平均得出评价结果。这种评价出的图像质量与观察者的特性及观察条件等因素有关。,(2) 图像的客观评价,尽管质量的主观评价是最权威的方式,但是在一些研究场合,或者由于实验条件的限制,也希望对图像有一个定量的客观描述
18、。图像质量的客观评价由于着眼点不同而有多种方法,这里介绍的是一种经常使用的所谓的逼真度测量。对于彩色图像逼真度的定量表示是一个十分复杂的问题。当前,对灰度图像逼真度的定量表示应用较多。对于连续图像,设f(x,y)为定义在矩形区域的连续图像, 其降质图像为 ,它们之间的逼真度可用归 一化的互相关函数 K 来表示:,归一化的互相关函数:,其中,运算符Q表示在计算逼真度前,为使测量值与主观评价的结果一致而进行的某种预处理(如对数处理、幂处理等)。,对于数字图像,设f(j,k)为原参考图像, 为其降质图像,逼真度可定义为归一化的均方误差值NMSE:,对于数字图像,另外还有一种常用的方法即峰值均方误差P
19、MSE:,其中,A为Qf(j,k)的最大值,实际应用中,还常采用简单的形式Qf=f。此时,对于8bit精度的图像,A255;M、N为图像尺寸。,峰值信噪比PSNR:,1. 5 数字图像处理的基本概念,151 基本处理过程数字图像信息可看成是一个二维数组f(i,j),对它处理的基本过程按照由左到右,由上到下的顺序进行并在扫描过程中逐点对各像素进行帧处理。这样的扫描过程称为顺向扫描。与此相对的就是由下到上,由右到左的逆向扫描。,152 基本运算形式,(1) 点运算在对图像各像素进行处理时,只输入该像素本身灰度的运算方式称为点运算。输入图像F上某像素的灰度为f(i,j),现采用点运算方式作某种p处理
20、,得到输出图像G上该像素的灰度为g(i,j),即g(i,j) = p(f(i,j)对图像作点运算处理时各象素间不发生关系,各象素的处理是独立进行的。,(2) 领域运算在对图像各像素进行处理时,不仅输入该像素本身的灰度,还要输入以该像素为中心的某局部区域(即领域)中的一些像素的灰度进行运算的方式,称为领域运算。将处理的像素f(i,j)写作 ,该像素的处理结果写作 。设像素 组成像素 的领域; 此时对输入图像各像素所进行的处理就是领域运算。,领域运算有:平滑、滤波、边缘检测、细化等,Lena:,edge:,如:边缘检测,并行运算指的是对图像上各象素同时进行相同处理的运算方式。这种运算方式处理速度快
21、,但只能用于处理结果与处理顺序无关的场合。点运算处理中,由于各象素的处理与其他象素无关,因而可采用并行运算方式。对于领域运算的处理能否采用并行方式则不能一概而论。领域运算的处理可分为两种情况,一种情况是尽管各像素的处理与领域像素发生了关系,但是这种关系和处理顺序无关,不论采用何种处理顺序,其结果是不变的,因此可以采用并行运算。,(3) 并行运算,另一种情况如图111所示,图中f,g分别代表输入、输出图像的灰度,对输入图像像素f0 进行领域运算的d处理,得到输出结果g0。d处理的特点是运算中采用了领域中像素的灰度输出值,如图111(a)中的g1, g2, g3, g4 (顺向扫描)或图111(b
22、)中的 g5, g6, g7, g8(逆向扫描),而不是原灰度 。这里对各像素进行处理是在领域中的部分像素已经被处理的基础上进行的,不同的处理顺序将会得到不同的处理结果。显然,这类领域处理不能采用并行运算形式。,(4) 串行运算串行运算是相对于并行运算而言的,指的是在图像上按照规定的顺序逐个对像素进行处理的运算形式。图1.11所示的领域运算形式就是串行运算的典型实例,若d处理内容为将该像素领域中已处理的4个像素的灰度输出值分别加1后,取最小值作为该像素的输出值,那么,当采用顺向扫描时(图1.11(a),d处理运算式为:当采用逆向扫描时(图l.11(b),d处理运算式为:,可以说,凡是对像素的处
23、理在领域像素处理的基础上进行的处理方法,都必须采用串行运算形式,并同时规定处理顺序。,(5) 迭代运算反复多次进行相同处理的运算,称为迭代运算。迭代运算常用于一次运算不能达到处理目的的情况。迭代运算的反复次数可以在处理前设定,也可在处理过程中根据是否达到处理目的由计算机自动判别后确定。,(6) 窗口运算图像的信息量很大,为减少处理时间,在可能的情况下,常常采用窗口运算来替代全图像运算。所谓窗口运算是指对图像特定的矩形区域进行某种运算的形式。一般,矩形区域由矩形左上角S点的坐标(a,b)和矩形所包含的行数m和列数n确定。矩形区域可以是图像中存在某对象物的位置,也可以是图像中具有代表性特征的区域。
24、,(7) 模板运算对图像中特定形状的区域进行某种运算的方式称为模板运算。这里的模板就是指特定形状的区域,它常常是与图像中存在的对象物有相同特征的一个局部的子图像。图1.13(a)中是一幅对象物为洋葱的图像,而模板(图1.13(b)就是一个与对象物完全一样的子图像。通过对图像上各像素的模板运算,可以找到图像上与模板特征相同的对象物的存在位置。,(8) 帧运算通常一幅完整的图像被称为一帧,在两幅或多幅图像之间进行运算产生一幅新图像的处理称之为帧运算。帧运算可看成是一种图像合成处理。运算时,将两幅或多幅图像中的对应点用位逻辑运算或算术运算方法进行合成。合成函数的种类很多,图1.14是用算术减(Sub
25、tract)将含有米粒的摄影和米粒两幅图像的帧运算的实例。将图1.14(a)图像与图1.14(b)图像中对应像素的灰度相减,得到图1.14(c)图像,即得到摄像图像。,图1.15是用逻辑运算“异或”(XOR)进行微小结构的测试实例。所谓“异或”运算,其数学含意是当两个二进制数对应位上的值相同时,该位的运算结果为0,不同时为1。本例中的图像是二值图像,像素的灰度只是一位二进制数,即白色的灰度为1,黑色的为0。当两幅图像进行“异或”运算后,可得到两幅图像中灰度不同的像素的集合,即图像的微小结构(图1.15(c)。,图像处理中的帧运算还有算术加、逻辑“或”、逻辑“与”等多种。,(1) 图像输入图像处
26、理的第一步,是获取处理对象的可见模拟图像,并将其转换为计算机能接受的数字图像,再输入计算机。(2) 图像存储与检索为了保存、处理或者传递图像信息,需要将原图像或经过处理的图像信息在计算机中按某种规律存储,必要时可以方便地找到它们,即进行图像的检索。,1.6.1 基本内容,1.6 数字图像处理的基本内容和特点,(3) 图像增强图像增强是一种将输入图像变换成便于获取所需信息的状态的各种处理的总称,也可理解为一种改善图像品质的处理内容。例如噪声(即各种干扰信号)减弱、对比度改善、变形修正、模糊消除等都属于图像增强的内容。由于种种原因,图像的品质常常是不理想的,因此图像增强成为图像处理中的重要环节。(
27、4) 图像特征提取通过图像信息去测量、识别或理解其中的对象物,依赖于一些能表征对象物的图像物征,如线、边缘、区域、形状、颜色、纹理等等。通过各种处理方法,将包含图像信息中的必要的特征显露出来,并加以量化的处理称之为图像的特征提取。,医学图象,(5) 图像识别与理解图像识别可以理解为利用提取的图像物特征对事物进行分类处理。所谓图像理解是利用图像信息实现模拟人的视觉系统理解客观事物。图像识别实际上可看做是一种简单的、仅仅涉及分类的图像理解,而图像理解则是包含更高层次的、达到某些智能化程度的处理。两者间的关系密切,有时也很难严格区分。已成为在图像处理的基础上发展起来的一门新兴学科。但从广义角度来看,
28、它们仍然属于图像处理的范畴。(6) 图像输出用计算机再现输入的、输出的以及中间处理结果的图像内容即称为图像输出。图像处理还有图像复原、图像编码、图像重构、图像传送等等。,1.6.2 数字图像处理的特点(1) 再现性只要输入图像和处理方法不变,数字图像的处理结果是不会变的,能很好地再现,即重复性好。不存在人们视觉处理的随意性,也不存在模拟图像(如照片)处理中图像质量的不一致。(数字图像更易长期保存,见下页)(2) 定量性数字图像处理很容易得到定量的结果,这是其他处理方式无法比拟的优点。(3) 适应性数字图像处理既适用于可见光图像,又适用于其他波谱图像;既可处理静态图像又可处理动态图像;处理对象可
29、小到显微图像,大到航空乃至卫星照片,涉及各行各业。,Lena 1972年,1997年,(4) 灵活性对同一幅图像,只要处理程序稍作改变,就可得到不同的处理结果。(5) 精度高数字图像处理的精度随着图像像素数和量化数的增加而提高。(6) 处理速度较慢一般来说,与人的视觉处理速度相比,数字图像处理的速度还比较慢,而且随着处理精度的提高,处理所需的时间更长。这一点已成为数字图像处理实用化的关键问题。但是,图像处理软件技术和计算机硬件以及图像专用硬件的发展,将使处理速度不断提高。,(7) 存储容量大数字图像处理需要计算机配有足够的内、外存储空间,而且处理精度越高,所需存储空间越大,这也是一个不容忽视的问题,不过,随着新型存储器的不断推出,存储容量可望得到迅速提高,或者说,处理的精度得以进一步提高。,