1、西安电子科技大学 研究生课程考试试题 (答案必须写在答题纸上或在答题卡上填涂) 考试科目: 图像 系统原理 课程编号: 0421019 考试日期: 2015 年 06 月 26 日 考试时间: 2: 30-4: 30 分 考试方式: (闭卷 ) 任课教师: 孙 伟 导师 学生姓名: 学 号: 一、填空题 (每空 0.5 分, 本题 共 12 分 ) 1. 图像工程按照抽象程度由低层至高层可分为 图像分析 , 图像处理 , _图像 理解 。 2. 图像处理中的三基色是指 红绿蓝 , 显示应用中常采用的图像颜色模型为 RGB。 3. HSI 颜色模型的 3 个分量分别表示 _色调 , 饱和度 ,
2、亮度 。 4. 模拟图像转换到数字图像必须经过 采样 _和 _量化 _。 5. 数字图像的分辨率分为 空间分辨率 和 幅度分辨率 。 6. 列出两种常用的图像插值算法: 最近邻域插值 , 双线性插值 。 图像平滑的 8-邻域平均模板 。 7. 图像编码所 采用 的主要冗余 有: 编码冗余 , 像素间冗余 , 心里视觉冗余 。 8. 数字图像处理中 常用的客观保真度准则为 RMS(均方根误差 )和 PSNR(峰值信噪比) 。 9. JPEG 编码中使用的变换方式为 _DCT(离散余弦变换 )_,常用的子图像尺寸为 _8 * 8_。 10. 采用对数变换进行图像对比度增强的效果是 对数变换使得图像
3、的低灰度范围得以扩展而高灰度范围得以压缩 。 11. 存储 一幅 512512 大小 的 256 灰度级的数字图像 所需 字节为 256KB。 二、名词解释 ( 每小题 2 分 ,本题共 10 分 ) 1. 数字图像 处理 : 将一副二维图像通过有限个离散点来表示就成了数字图像,其中每个点称为图像元素,即像素。(一幅图像可以定义为一个二维函数 f(x,y),其中 x 和 y是 空间坐标,而 f 在任意 一对坐标处的幅度成为该点处图像的亮度或灰度。当 x, y和 f的值都是离散值时,称该图像为数字图像 ) 2. 8-连通的定义 : 两个像素 p和 r在所定义连接的灰度值集合中取值且 r在 N8(
4、p)中 ,则为 8-连通。 3. 灰度直方图 : 是灰度级的函数,他表示图像中 具有每种灰度级的像素的个数,反映了图像中每种灰度出现的频率,概括了一幅图像的灰度级内容。 4. 中值滤波 : 一种非线性平滑技术,他将每一个像素点的灰度值设置为该点的某邻域窗口内所有像素点灰度值的中值。 5. 像素的邻域 : 对一个坐标为 (x,y)的像素 p, 它可以有 4 个水平和垂直的近邻像素,简称 4-邻域,记为 N4(p);像素 p 的 4 个对角紧邻像素记为 ND(p); ND(p)和 N4(p)合称为 p的 8-邻域,记为 N8(p)。 三 、简答题 (工硕 53 分,工学 66 分 ) 1. 设一幅
5、数字图像原始像素坐标为 (, )xy ,分别写出 其经过 平移 (x, y),旋转 角和等比例缩放 倍新像素坐标 ( , )xy。 (5 分 ) 2. 对一幅 NN 的数字图像 ( , )f xy , 试写出 其 二维离散傅立叶变换 (2D-DFT)及反变换 公式 ,并 至少 列 出 4 种 2D-DFT 的 性质。 (5 分 ) 主要性质:( 1)变换核的可分离性( 2)平移不变性( 3)周期性( 4)共轭对称性( 5)旋转不变性( 6)尺度缩放( 7)平均值特性 3. 对一幅 NN 的数字图像 ( , )f xy , 试写出其二维离散余弦变换 (2D-DCT)及反变换公式,并简要说明 2D
6、-DCT 系数的特点 。 (5 分 ) = 0,1, N-1 = 0,1, N-1 2D-DCT 系数特点 : (1) 最左上交的系数为直流 ( DC)分量,其余为交流分量;( 2)从左上角到右下角对应从低频到高频信息,且系数逐渐减小。 4. 解释对图像进行如下灰度变换能够实现何种处理效果。 (5 分 ) L - 1L - 1T ( r )L - 1L - 1L - 1L - 1T ( r )T ( r )L - 1L - 1T ( r )stststst(a) (b) (c) (d) ( a)图像二值化 ( b)灰度反转 ( c)对比度增强 ( d)压缩动态范围 5. 试阐述 灰度 图像 直
7、方图 均衡化的 原理及 处理效果。 (8 分 ) 直方图是图像灰度级的函数 , 是灰度级的函数,他表示图像中具有每种灰度级的像素的个数,反映了图像中每种灰度出现的频率,直方图均衡化后图像直方图呈现均匀分布的形式,增加了动态范围和对比度,改善了图像主观视觉效果。 6. 试写出 Prewitt 算子, Sobel 算子和 Laplacian 算子。 (10 分 ) 7. 简述 直线 检测 的 Hough 变换的原理, 写出 实现步骤 。 (7 分 ) 在原始图像 坐标系下的一个点对应了参数坐标系中的一条直线,同样参数坐标系的一条直线对应了原始坐标系下的一个点,然后,原始坐标系下呈现直线的所有点,它
8、们的斜率和截距是相同的,所以它们在参数坐标系下对应于同一个点。这样在将原始坐标系下的各个点投影到参数坐标系下之后,看参数坐标系下有没有聚集点,这样的聚集点就对应了原始坐标系下的直线。 (1)读入一幅 256级灰度图 (虽然是 256级灰度 ,但实际上仅有 0和 255两个灰度等级 ) 。 (2)根据图像尺寸决定 Hough变换累加器的大小并分配内存。 (3)对图像作 Hough变换 ,并将变换 结果存入 Hough变换累加器。 (4)设定阈值 ,并根据阈值大小将 Hough变换累加器中累加值小于阈值的点清零 ,即认为这些点并不对应图像域中的一条直线。 (5)查找 Hough变换累加器中累加值最
9、大的点 ,记录该点并将其领域清零 ,继续查找并记录下一个累加值最大的点 ,直到累加器中所有的累加值都为零 ,记录的这些点即对应了检测到的图像中的直线。 (6)根据检测到的点在图像域中绘出直线。 8. 简述 MSRCR 图像增强算法的原理及实现步骤。 (工 硕 题, 8 分 ) Retinex理论主要包含了两个方面的内容:物体的颜色是由物体对长波、 中波和短波光线的反射能力决定的,而不是由反射光强度的绝对值决定的;物体的色彩不受光照非均匀性的影响 ,具有一致性 。 根据 Retinex理论,人眼感知物体的亮度取决于环境的照明和物体表面对照射光的反射,其数学表达式为: I(x,y)=L(x,y)*
10、R(x,y) (2-1) 式中: I(x,y)代表被观察或照相机接收到的图像信号; L(x,y)代表环境光的照射分量 ; R(x,y)表示携带图像细节信息的目标物体的反射分量 。将 (2-1)式两边取对数,则可抛开入射光的性质得到物体的本来面貌,即有关系式 : LogR(x,y)=LogI(x,y)-LogL(x,y); (2-2) 对上面的理论的进行一个简单的注释吧。把这个技术运用到图像处理上,就是针对我们现在已经获得的一副图像数据 I(x,y),计算出对应的 R(x,y),则 R(x,y)认为是增强后的图像,现在的关键是如何得到 L(X,Y)。 Retinex理论的提出者指出这个 L(x,
11、y)可以通过对图像数据I(x,y)进行高斯模糊而得到,很多论文中都列出了那个中心 /围绕函数以及需要归一化的 K值,搞的很多新手都不明白是什么了,其实就是一个模糊而已。从实际运用的角 度来说,也可以用均值模糊来代替高斯模糊。 1、输入 : 原始图像数据 I(x,y),尺度(也就是所谓的模糊的半径) 2、处理: (1) 计算原始图像按指定尺度进行模糊后的图像 L(x,y); (2) 按照 2-2式的计算方法计算出 LogR(x,y)的值。 (3) 将 LogR(x,y)量化为 0到 255范围的像素值,作为最终的输出。 9. 简述暗原色通道去雾算法的原理及实现步骤 。 (工学题, 16 分 )
12、基本原理 : 暗原色先验是对户外无雾图像库的统计得出的规律 。 即 在不包括天空的绝大部分 区域 , 总会存在一些我们称之为 “暗像素”的像素,至少有一个颜色通道具备很低的强度值。这些像素组成的通道我们称之为“暗影通道”。在被雾干扰的图像里,这些暗像素的强度值会被大气中的白光成分所充斥而变得比较高。这些像素可以帮助我们确定大气透射率,用暗像素来直接估计有雾图像的投射信息,然后利用图像修补的方法可以得到清晰地图像。然而,当场景在很大区域与大气光在本质上很相似,且表面光滑没有阴影时,暗原色就会失效。 算法步骤 :( 1) 首先将雾图像在 RGB 空间进行分解,在局部块中取最小值操作,求得 R, G
13、,B 三通道中最小 分量,然后采用 Marcel van Herk 的快速算法对最小分量值进行局部区域最小滤波,也即灰度腐蚀操作。求取暗原色的数学表达式描述如下: 其中, Jdark 称为图像的暗原色( dark-channel pixel),其强度值总是很低并且趋近于 0, c为的 R, G ,B 三通道中一个颜色通道 , y 是以 x 为中心的局部块区域。 ( 2)大气光 A 的估计 ( 3) 使用暗影通道估测透射率分布 为了使去雾之后的图像有层次感,显得自然,通常会添加一个系数,即 这就是我们得到的粗略的传输图或者透射率图,通过各种方法细化该图就可以达到去雾的目的。在He 的论文中采用了
14、 Soft Matting 的方法。 ( 4) Soft Matting 对透射图进行优化 。 ( 5)复原物体亮度 由于 A 值通常很大 , 所以恢复的图像往往偏暗 , 可增大参数 t0( = 0.1)来提高图像的曝光率。 10. 简述 H.264 编 解 码算法的 原理 (编码和解码 )。 (工学题, 5 分 ) H.264 是基于像素块的混合编码方法 , H.264/AVC 标准压缩系统是是由视频编码层 和网络提取层两部分组成 。 VCL 包括 VCL 编码器和 VCL 解码器 。 主要功能是视频压缩和解码 。 它包括运动补偿变换编码 , 熵编码等压缩单元 。 NAL 则用于为 VCL
15、提供一个与网络无关的统一接口 , 负责对视屏数据进行封装打包后使其在网络中传递 。NAL 采用统一的数据格式 , 包括单个字节的包头信息 、 多个字节的视频数据与组帧 、逻辑信道信令 、 序列结束信号等 。 通过 NAL 单元 , H.264 可以支持大部分基于包的网络 。 四、 综合应用题( 工学 12 分,工硕 25 分) 1. 根据所学过的图像处理和分析方法,设计一套算法流程来实现汽车牌照的定位和数字的识别。 (工学题, 12 分 ) ( 1) 粗定位和灰度化 车牌定位是整个系统的关键问题之一,它直接影响了后续的分割以及识别的准确率。考虑到整个图像车牌部分 的字符颜色和车牌背景颜色差别很
16、大,其灰度级别分布有一定规律和范围,兼之车牌的宽度有一定的比例,因此可以将车牌从背景图片中分离出来。 我国现有的车辆主要有蓝底白字牌照、黄底黑字牌照等四种类型。鉴于车牌前景、背景色的颜色特征,可以通过对颜色通道的分析来大致的确定车牌所在的位置以完成车牌位置的粗定位。在确定参数的时候,除了要考虑主色的下限参数以外还要考虑另外二个通道的上限参数。经过反复的试验对比后得出经验参数值为:以蓝底白字的车牌为例,在 RGB 三个通道中: R100110110000,由以上参数为扫描阈值,自动剔除车牌位置之外的其他图像部分,完成粗定位。 ( 2) 中值滤波处理 中值滤波法是一种非线性平滑技术,它将每一象素点
17、的灰度值设置为该点某邻域窗口内的所有象素点灰度值的中值。 粗定位后的车牌首先进行灰度化处理以减小数据量利于实时处理。其次为了抑制车牌图像在采集时产生的椒盐噪声等脉冲噪声影响,改善图像质量,本文对灰度化后的车牌图像进行中值滤波处理。 ( 3) 二值化处理 因为车牌定位和字符分割都是基于车牌区域的二值化结果进行,所以二值化的效果直接影响到车牌识别的效果。由于要从待检测的车牌图像区域截取图像的背景不会很复杂。前景区域和背景区域的差异比较明显, 所以车牌图像的灰度直方图将有明显双峰效果。本文通过直方图的双峰法的方法来求取阈值,对车牌图像进行二值化处理。 一幅图像包括目标物体、背景还有噪声,要想从多值的
18、数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值 T,用 T 将图像的数据分成两部分:大于 T 的像素群和小于 T 的像素群。这是研究灰度变换的最特殊的方法,称为图像的二值化( BINARIZATION)。图像的二值化,就是将图像上的像素点的灰度值设置为 0 或 255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。 ( 4) 车牌检测 在对采集到的车牌 图像二值化处理以后,一帧图像的大小大幅度减小,约为 400k 左右,下面就是把该二值化车牌图像传输至 NIOS II 软核内进行分割等后续处理,考虑到 NIOS II 软核中资源丰富的特点,本文通过增加输入输出口的数量来提升数据
19、传入的速度,从而满足系统的实时性处理要求。根据数据传输需求,本文设计通过 22 个 32bit 的输入输出口来传送数据,虽然 22 32=704bit 相比一帧图像的一行 720bit 少了 16bit,但考虑到车牌图像的边缘是非字符目标区域的背景图像,对最终识别结果的影响甚小,故可以近乎忽略。 ( 5) 基于车牌字母及数字特征的准确定位 通过车牌的彩色特性对车牌进行预定位后,再根据车牌号码的字母和数字在二值化后的特性准确定位出车牌的位置,如果此时定位出车牌的位置在彩色通道预定位的车牌区域内,则说明车牌位置已经确定,如果不在彩色通道定义的车牌位置范围之内,则需要重新判断。 ( 1)定位牌照的上
20、下边界:若某一行的 0 1(白到黑)和 1 0(黑到白)变化次数大于设定的阈值,则设其为待测车牌的最低点,继续扫描直至 0 1 和 1 0 变化次数小于阈值,将该阈值设为待测车牌的最高点。若最高点与最低点之差大于 15,则认为目标已检测到,否则继续进行扫描;如果未检测到符合上述条件的目标,则自动门限值重复以上的操作,直到找到目标为止。 ( 2)定位牌照的左右边界:在找到车牌的上下限后,利用二值图像在竖直方向上的投影作为特征,从左到右寻找目标的中心点坐标。车牌定位效果如图 3-1 所示: ( 6) 基于垂直灰度法的字符分割 在对车牌进行定位后,考虑到车牌字符的排放特点与字符间的微小间隙,采用垂直
21、灰度法进行车牌字符的分割。主要思想是设定一个垂直投影的阈值,判断投影大于阈值则标记并保存,遇到空隙则分割,最后判断字符区域的长度是 否满足字符的长度,满足字符长度的则记录为有效字符,不满足将剔除继续扫描下一个知道扫描完整行为止。 ( 7) 模板匹配 我国的车牌,字符标志的首位为汉字的省名缩写,次位为英文字母,再次位为英文字母或阿拉伯数字,末四位均为数字。由于实际可能出现的英文字母和数字字符数目不多,再基于 NIOS II 软核的运算能力考虑,采用模板匹配方法进行字符识别。即将待识别的车牌字符矩阵与库内的标准字符矩阵(标准模版)对比,相似度最大的则认为一致。 首先将标准模板入库,按国家车牌标准的
22、大小、字体、字符间距等打印出数张样品,其 前景、背景清晰,字符没有断续,很少噪声、且包含了所有可能的车牌字符,作为 “标准车牌 “,用以采样制作标准字符矩阵库。把每一张 “标准车牌 “分割出来的字符归一化 7,接着将归一化后的模板矩阵存入 FPGA 中作为标准模板库,根据实验情况,模板越大识别率越高,但同时会带来运算数据量的大大增加,于是在综合考虑准确度和 NIOS II 软核的工作效率后采用 20 15 bit 大小的数组作为标准模板。 2. 请根据所学过的图象分析方法,设计一套算法流程,来实现如下图所示的普通信封上邮政编码的定位和识别。只给出算法思想即可。 (工 硕 题, 12 分 ) 1
23、、 彩色图像变为灰度图像 使用 MATLAB 进行处理时,所读入的信封图像是 RGB 三维矩阵,在以后的处理中用到的是灰度图像和二值图像,因此,必须经过处理变成灰度图像。由于邮政编码框的附近像素值变化明显,因此选取合适的阈值,将图像的边缘提取出来,根据邮政编码的位置特征,选取合适的区域,便可将只含有邮政编码区域的灰度图像提取出来。首先将彩色图像转换成二值图像,再将二值图像转换成灰度图像 2、灰度图像二值化 一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个 阈值 T,用 T 将图像的数据分成两部分:大于 T 的像素群和小于 T 的像素群。这是
24、研究灰度变换的最特殊的方法,称为图像的二值化。灰度图像二值化处理是将图像上的点的灰度值置为 0 或 1,也就是将整个出现明显的黑白效果。将灰度图像通过适当的阈值选取而获得可以反映图像整体和局部特征的二值图像。图像 f(x,y)的灰度级范围是( zl,zh) ,设 T 是 zl 和 zh 之间的一个数,合理选取 T 的值就可以将灰度图像变成二值图像。 3、邮政编码位置的定位 由于邮政编码框的附近像素值变化明显,因此选取合适的阈值,将图像的边缘提取出来,根据邮政编码 的位置特征,选取合适的区域,便可将邮政编码的位置图像提取出来。 4、手写邮政编码提取 根据投影法得到的位置信息可以对信封中手写邮政编
25、码的位置位置进行定位,从而提取出仅包含有手写邮政编码的单个数字图像,从而为后续的图像识别做准备。 5、超出红方框的情况 当手写的数字超出红色方框时,因为此时的手写数字部分不完全包含在红色方框内,因此不能用上述方法进行定位。因为手写数字超出方框的部分不会太多,在初步选取大致范围可采取同上的方法。最后进行区域定位的时候可以选取比邮政编码方框略大的部分作为定位信息,从而扩大定位范围 ,将超出的部分包含在定位区域内,从而在后续的提取过程中可以提取到完整的手写数字信息。 3. 对于下面这幅 偏暗及含有椒盐噪声的 图像,请问可以通过那些图像增强的手段,达到改善视觉效果的目的?并将这些图象增强手段组织成一个
26、处理流程(先做什么,后做什么),并解释各处理手段可达到什么预期的增强效果。 (工硕题, 13 分 ) A=imread(a.png); imshow(A); A=rgb2gray(A); A=double(A); h,w=size(A); B=zeros(h,w); %图片中有大量的 椒盐噪声 ,使用中值滤波平滑 for i=2:h-1 for j=2:w-1 B(i,j)=(A(i-1,j-1)+A(i-1,j)+A(i-1,j+1)+A(i,j-1)+A(i,j)+A(i,j+1)+A(i+1,j-1)+A(i+1,j)+A(i+1,j+1)/9; end end B=uint8(B); figure,imshow(B); %由于整张图像偏暗使用均衡化 C=histeq(B); figure,imshow(C);