1、第一章基本概念:“图”是物体投射或反射光的分布, “像” 是人的视觉系统对图的接受在大脑中形成的 印象或反映。 模拟图像 数字图像:由被称作象素的小块区域组成的二维矩阵。数字图像处理:数字图像处理就是利用计算 机系统对数字图像进行各种目的的处理。数字图像处理框架:图像变换 图像 编码压缩 图像增 强 图像恢复重建 图像分割 图像理解识别 计算机视觉图像的表示:图像的数学描述 f(x,y,z,t)简化的二维函数 f(x,y)二维矩阵 Am,n 分类:按研究对象:二值图像 灰度图像 彩色及多光谱图像 图像序列分析 双目图象分析按应用方式分:图像压缩 与编码 图像增强 图像恢复 图像重建 边缘检测与
2、分割 图像测量与分析 图像识别与理解数字图像处理系统:数字图像处理特点:精度高 再现性好 通用性 灵活性高第二章视觉的动态范围:1. 将真实世界场景中较高的动态范围映射到显示或输出设备较低的 动态范围区间,要求能够保持场景的亮度序列和整体 视觉效果; 2. 模拟感知特性,获得和真实场 景一致的局部对比的视觉 响应。亮度适应能力:明亮-较暗 逐渐能够看清物体 暗光适应(2030s) 较暗-明亮 逐渐能够看清物体 亮光适应(12s)连续图象数学表达式: g=f(x,y,t)彩色图像的一般表达:静止单色图象的数学表示:I=f(x,y)i(x,y)r(x,y) 其中,i(x,y)表示照射分量, 0i(
3、x,y);r(x,y)表示反射分量,0r(x,y)1。连续图像(离散化)数字图像图像数字化:将一幅连续的画面转化成离散的点集的过程。图像的数字化包括采样和量化两个过程采样:图像在空间上的离散化称为采样。采样间隔 采样孔径 采样方式 采样保持量化:量化是将各个像素所含的明暗信息离散化后,用数字来表示。量化可分为均匀量化和非均匀量化。数字图像的描述:矩阵坐标系二值图像:二值图像(黑白图像)。指 图像的每个像素只能是黑或者白,没有中间的过渡,故又称为值图像。灰度图像:指每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息。彩色图像:指每个像素的信息由 RGB 三原色构成的图像,其中 RBG 是
4、由不同的灰度级来描述的。 运动图像:运动图像 采样间隔越大,所得图像象素数越少,图像空间分辨率低,质量越差,数据量小 量化等级越多,所得图像层次越丰富,图像灰度分辨率越高,质量越好,但数据量大图像数字化设备:采样孔 图像扫描机构 光传感器 量化器 输出存储装置性能:像素大小 图像大小 线性度 动态范围 噪声水平图像灰度直方图:性质:每一灰度级的像素个数可直接得到;所有的空间信息全部丢失;不能反映图像象素的位置关系一幅图像对应唯一的灰度直方图,但是多幅影像可以对应同一个直方图;一幅图像分成多个区域,多个区域的直方图之和为原图像的直方图。应用:评价图像是否量化恰当;确定图像二值化的阈值;简单计算;
5、图像信息熵统计。图像直方图:定义:一个灰度级别在范围0,L-1的数字图象的直方图是一个离散函数。p(rk)= nk/n n 是图象的像素总数 nk 是图象中第 k 个灰度级的像素总数 rk 是第 k 个灰度级,k = 0,1,2,L-1定义 2: p(rk)= nk (k = 0,1,2,L-1)算法形式:单幅图像-单幅图像 多幅图像-单幅图像 单(或多)幅图像-数字或符号 图像数据结构与文件格式:组合方式 比特面方式 分层结构 树结构 多重图像数据存储数字图像类型:静态图像:矢量图 栅格图像视频、序列图 像等术语:像素 点 样点分辨率 图像分辨率 屏幕分辨率 打印机分辨率 扫描仪分辨率(每英
6、寸样点数)BMP 图像:每一行的字节数必须是 4 的整数倍,如果不是,则需要补齐。 BMP 文件的数据存放是从下到上,从左到右的。第三章图像变换:将图像从空域变换到其它域如频域的数学变换。正交变换特点:变换域中图像能量主要集中分布在低频成分上,边缘、 线信息反映在高频成分上。 点源 狄拉克函数特性:偶函数 位移性 可分性 采样性傅里叶变换:一维连续傅立叶变换:二维连续傅里叶变换:一维离散傅里叶变换:f(x) = f(x0+ x deltax)二维离散傅里叶变换:特性:可分离性 周期与共轭对称 平移性 旋转特性 线性与相似性 均值性 卷积与相关可分离性:二维 DFT 可分离为两次一维 DFT离散
7、傅里叶变换的显示:值域压缩傅里叶变换应用:图像滤波 图像压缩 卷积运算第四章 图像增强图像增强:图像增强是采用一系列技术去改善图像的视觉效果, 或将图像转换成一种更适合于人或机器进行分析和处理的形式。图像增强的目的主要包括:消除噪声,改善 图像的视觉 效果;突出边缘,有利于识别和处理。分类:空间域增强是直接对图像各像素进行处理; 频率域增强是将图像经傅立叶变换后的频谱成分进行处理,然后逆傅立叶变换获得所需的图像。空间域:点运算:灰度变换:调整图像的灰度动态范围或图像对比度。线性变换:分段线性变换:对数变换:灰度分布与人的视觉特性相匹配。指数变换:直方图修正法:直方图均衡化:P72 例 1图像的
8、空间域平滑:局部平滑法:可用邻域内各像素的灰度平均值代替该像素原来的灰度值,实现图像的平滑。超限像素平滑法:灰度最相近的 K 个邻点平均法最大均匀性平滑有选择保边缘平滑法空间低通滤波法多幅图像平均法滤波中值滤波图像的空间域锐化:图像锐化就是增强图像的边缘或轮廓。 梯度锐化法:梯度算子:Roberts 梯度算子 Prewitt 梯度算子 Sobel 梯度算子第一种输出形式:g(x,y)=grad(x,y)Laplacian 增强算子高通滤波法频率域:频率域增强:假定原图像为 f(x,y),经傅立叶变换为 F(u,v)。频率域 增强就是选择合适的滤波器 H(u,v)对 F(u,v)的频谱成分进行
9、处理,然后经逆傅立叶变换得到增强的图像g(x,y)。频率域平滑:由于噪声主要集中在高频部分, 为去除噪声改善 图像质量, 滤波器采用低通滤波器 H(u,v)来抑制高频 成分,通 过低频成分,然后再进行逆傅立叶变换获得滤波图像,就可达到平滑图像的目的。理想低通滤波器Butterworth 低通滤波器指数低通滤波器梯形低通滤波器频率于锐化:图像的边缘、细节主要位于高频部分,而图像的模糊是由于高频成分比较弱产生的。频率域锐化就是 为了消除模糊,突出 边缘。因此采用高通滤波器让高频成分通过,使低频成分削弱,再经逆傅立叶变换得到边缘锐化的图 像 。理想高通滤波器巴特沃斯高通滤波器指数滤波器梯形滤波器彩色
10、增强技术:彩色增强技术是利用人眼的视觉特性,将灰度图像变 成彩色图像或改变彩色图像已有彩色的分布,改善图 像的 可分辨性。彩色增 强方法可分为伪彩色增强和假彩色增强两类。 伪彩色增强:是把黑白图像的各个不同灰度级按照线性或非线性的映射函数变换成不同的彩色,得到一幅彩色图像的技术密度分割法:是把灰度图像的灰度级从 0(黑)到 M0(白)分成 N 个区间Ii(i=1,2,N),给每个区间 Ii 指定一种彩色 Ci,从而把一幅灰度图像变成一幅伪彩色图像。空间域灰度级一彩色变换:根据色度学原理,将原图像 f(x,y)的灰度范围分段,经过红、绿、蓝三种不同变换 TR()、TG()和 TB(),变成三基色
11、分量 IR(x,y)、IG(x,y)、IB(x,y),然后用它们分别作为红、 绿、蓝分量合成颜色,以合成一幅彩色图像。频率域伪彩色增强彩色增强技术:假彩色增强:假彩色增强是对一幅自然彩色图像或同一景物的多光谱图像,通过映射函数变换成新的三基色分量,彩色合成使感兴趣目 标呈现出与原图像中不同的、奇异的彩色。 图像运算:算术运算 逻辑运算第五章 图像的复原与重建图像的退化:图像的退化是指图像在形成、 传输和记录过程中,由于成像系统、传输介质和设备的不完善,使图像的质量变 坏。找退化原因建立退化模型反向推演恢复图像图象退化的原因:(1)摄影时照相机镜头的移动; (2)放大镜凸透变形; (3)成像系统
12、的性能等。图像复原和图像增强的区别:图像增强不考虑图像是如何退化的,而是试图采用各种技术来增强图像的视觉效果。因此,图像增强可以不顾增强后的图像是否失真,只要看得舒服就行。是一个主观过程。而图像复原就完全不同,需知道图像退化的机制和过程等先验知识,据此找出一种相应的逆 处理方法,从而得到复原的图像。是一个客观过程。如果图像已退化,应先作复原处理,再作增强处理。二者的目的都是为了改善图像的质量。 二维线性不变系统:线性位移不变系统的输出等于系统的输入和系统脉冲响应(点扩散函数)的卷积。若受加性噪声 n(x,y)的干扰,则退化图像可表示为g(x,y)= f(x,y)* h(x,y)+ n(x,y)
13、图像的退化:白噪声:图象平面上不同点的噪声是不相关的,其 谱密度为常数。 不相关时,噪声是加性的。代数恢复方法:图像复原的目的是在假设具备有关 g、H 和 n 的某些知识的情况下,寻求估计原图像 f 的某些方法。无约束恢复约束最小二乘复原频率域恢复方法:逆滤波恢复法 去除由匀速运动引起的模糊图像的几何校正:即将存在几何失真的图像校正成无几何失真的图像。图像在获取过程中,由于成像系 统本身具有非线性、拍 摄角度等因素的影响,会使获得的图像产生几何失真。系统失真是有规律的、能 预测的;非系统 失真具有随机的。 方法:1、图 像空间坐标变换 直接法 间接法:像素灰度内插方法:最近邻元法 双线性内插法
14、 三次内插法确定个像素的灰度值图像重建:投射模型 发射模型 反射模型 计算机断层扫描的二位重建 三维形状的复原(Voxel 法、分块的平面近似法)第六章 图像编码与压缩 一幅图像存在数据冗余和主观视觉冗余。第一代压缩编码:像素编码 预测编码 变换编码 其他编码第二代压缩编码:子带编码 分层编码 分型编码 模型编码图像压缩技术:无损压缩:霍夫曼编码 行程编码 算术编码有损压缩:预测编码 变换编码 其他编码保真度:检测图像系统的一种量度。统计编码的方法:冗余:虽然表示图像需要大量的数据,但图像数据是高度相关的,或者 说存在冗余。空间冗余、时间冗余、视觉冗余、信息熵冗余、结构冗余和知识冗余。 去除冗
15、余的方法:利用二维 DCT 减少空间域冗余度。利用运动补偿减少时间域冗余度。 利用视觉加权量化减少图像“灰度域”冗余度。 利用熵编码减少图像“频率域”上统计特性冗余度。哈夫曼编码:基本原理:为了达到大的压缩率,提出了一种方法就是将在 图像中出现频度大的像素值,给一个比较短的编码,将出 现频度小的像数 值,给一个比较长的编码。哈夫曼树:概率大的为 0,概率小的 为 1.图像编码的国际标准简介:JPEG 算法:顺序编码 累进编码 无失真编码 分层编码第七章 图像分割图象分割将图象划分为若干互不相交的小区域的过程。连通的概念是指集合中任意两个点之间都存在着完全属于该集合的连通路径。边缘分割技术:边缘
16、: 边缘可定义为在局部区域内图象的差别。灰度级突变:阶跃边缘 脉冲状边缘 阶跃脉冲状边缘边缘检测: 当物体与背景有明显对比度时,物体的 边界处于图象梯度最高的点上,通过跟踪图象中具有最高梯度的点的方式 获得物体的 边界,可以 实现图象分割。先平滑。梯度算子:Prewitt 算子 Sobel 算子 方向算子(Laplacian 算子) Marr 算子 Canny 算子 沈俊边缘检测 方法 曲线拟合法 边缘连接边缘跟踪:边缘点:在亮度显著变化的位置上的点 边缘段:对应于边缘点坐标及其方位 边缘检测器:从图像中抽取边缘集合的算法 轮廓:边缘列表或一条表示边缘列表的拟合曲线 边缘连接:从无序边缘表形成
17、有序边缘表的过程 边缘跟踪:一个用来确定轮廊的图像搜索过程光栅跟踪 全向跟踪区域分割:简单图像:1、基于灰度 2、基于灰度直方 图 3、基于图像邻域特性复杂图像:自动多阈值分割技术 分块分割再合并第八章 二值图像处理与形状分析二值图像:假定二值图像大小为 m*n,其中物体像素 值为 1,背景像素值为 0;获取:图像阈值4 邻点(4-neighbors):有公共边关系的两个像素 8 邻点(8-neighbors):两个像素至少共享一个顶角 4 邻域:一个像素的 4 个 4 邻点 8 邻域:一个像素的 8 个 8 邻点一个像素与其 4 邻点互为 4 邻接 一个像素与其 8 邻点互为 8 邻接 4
18、连通(4-connected):一个像素与其 4 邻 点的关系 8 连通(4-connected):一个像素与其 8 邻 点的关系路径:从像素到像素的一个像素序列。前景:图像中值为 1 的全部像素的集合,用 S 表示。连通性:已知像素,如果存在一条从 p 到 q 的路径,且路径 上的全部像素都包含在 S 中,则称 p 与 q 是连通的。连通成份:一个像素集合 S ,如果 S 内的每一个像素与集合内其它像素 连通, 则称该集合为一个连通成份。对物体和背景应使用不同的连通.如果对 S 使 用 8 连通, 则对 S 应使用 4 连通。欧拉数:连通成分数-空洞数可删除性:删除后不改变连接性,像素的可
19、删除性可用像素的 连接数来检测。像素 p 的连接数 Nc(p)为与 p 连接的连接成分数。孤立点:B(p)= 1 的像素 p,在 4-/8-邻接的情况下,当其 4-/8-邻接的像素全是 0 时,像素 p 叫做孤立点。孤立点的连接数 Nc(p)=0。 内部点:B(p)= 1 的像素 p,在 4-/8-邻接的情况下,当其 4-/8-邻接的像素全是 1 时,叫做内部点。内部点的连接数 Nc(p)=0 。 边界点:在 B(p)= 1 的像素中,把除了孤立点和内部点 以外的点叫做边界点。在边界点上,1Nc(p)4。 Nc(p)的像素为可删除点或端点;Nc(p)的像素 为连接点;Nc(p) 的像素为分支点
20、;Nc(p)的像素为交叉点。 距离:欧氏距离。de(i,j),(h,k)=(i-h)2+(j-k)21/2 街区距离,4邻距离。d4(i,j),(h,k)=|ih|+|j-k| 棋盘距离,8邻距离。d8(i,j),(h,k)=max(|ih|,|j-k|) 它的等距离线呈 八角形。d8(i,j),(h,k)=max|i-h|,|j-k|,2(|ih|+|j-k|+1)/3 连接成分的变形处理:标记:对属于同一个像素 连接成分的所有像素分配相同的 编号,对 不同的连接成分分配不同的编号的操作,叫做 连接成分的 标记。膨胀和收缩:膨胀:把连接成分的边界扩大一层的处理。收缩:把连接成分的边界点去掉从
21、而缩小一层的处理。线图形化:把图像转换为线划图。形状特征提取与分析:图像面积:中心:周长:在区域的边界像素中, 设某像素与其上下左右像素间的距离为 1,与斜方向像素间的距离为。周长 就是这些像素间距离的总和。将边界的像素总和作为周长。 圆形度:测量区域形状常用的量。当区域为圆形时, R 最大(R=1);如果是细长的区域,R 则变小。 R=4(面积)/(周长)2直径:两个像素间的最长距离。密集度:密集度=面积/周长2 圆最密集体态比:最小外接矩形的长宽比。投影:截口长度区域外部形状特征提取与分析:八链码 周长 1/根号 2第九章 影像纹理分析纹理:一种反映一个区域中像素灰度级的空间分布的属性。局
22、部区域内呈现不规则性,而在整体上表 现出某种规律性。人工纹理 自然纹理特性:局部不规律,整体具有一定 规律性的特性 基本单元的重复性 粗糙性 方向性灰度共生矩阵:0 度 45 度 90 度 135 度特征:角二阶矩(能量)。反映了 图像灰度分布均匀程度和 纹理粗细度。因 为它是灰度共生矩阵各元素的平方和,又称 为能量。其 值大时纹理粗,能量大;反之其值小时纹理细,能量小。 对比度(惯性矩)。可理解 为图像的清晰度。纹理的沟纹深,其值大,效果清晰;反之其值 小则沟纹浅,效果模糊。 相关。用来衡量灰度共生矩阵 元素在行或列方向上的相似程度。例如水平方向纹理,在 =0 方向上的其 值大于其他方向上的其 值。 熵。图像信息量的量度。无纹理则其值为 0;满纹理则其值 最大。 逆差矩。