1、参考解答(姚敏著)第一章 略第 2 章2.2一阶矩或平均值; 二阶矩或自相关函数;自协方差;方差2.5压缩能力更强,码书控制着量化失真量的大小,计算量大,定长码,容易处理。2.7二进制图像,索引图像,灰度图像,多帧图像,RGB 图像。可以。2.8采样间隔是决定图像空间分辨率的主要参数。2.9如果 中的某些像素与 中的某些像素连接,则两个图像子集是相连接的。1S2S在图 2.9 中, 和 在 V 中取值,且 q 在 中,因此 p 和 q 是 8 连接的,1pq)(8N和 也是 8 连接的。12q 在 中,且 是空集,即满足 m 连接条件,因此 p 和 q 是 m 连接的,)(ND)(44Np 和
2、 q 是 8 连接的, 和 也是 8 连接的。也是 m 连接的。1S2但是, 和 中所有像素之间都不存在 4 连接,因此 和 不是 4 连接的。12 1S22.10当 V=0, 1时,p 与 q 之间不可能存在 4 通路,下图(a)中的红色箭显示是没有办法到达 q 的。最短的 8 通路可在图中看出(蓝色),它的最短长度是 4。m 通路(黑色)的最短长度是5。 qp3101211022qp3101211022当 V=1, 2时,最短的 4 通路的一种可能显示在图(b)中(红色箭),它的长度是 6。最短的 8 通路的一种可能显示蓝色箭,它的长度是 4。m 通路(黑色)的长度是 6。这些从 p 到
3、q 的同样长度的 4、8、m 通路不是唯一的。2.11 p 和 q 之间的 D4 和 D8 距离与任何通路无关,仅与点的坐标有关。对于像素 p, q 其坐标分别为(x, y) ,(s,t),D4(p, q) = | x - s | + | y t | = 6D8(p, q) = max ( | x - s | , | y t | ) = 3然而,如果选择考虑 m 邻接,则两点间的 Dm 距离用点间最短的通路定义。在这种情况下,两像素间的距离将依赖于沿通路的像素值以及它们的邻点值。Dm(p, q) = 6。第 3 章3.1FFT(Fast Fourier Transformation),即为快速
4、傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。它利用 DFT 系数的特性,合并 DFT 运算中的某些项把长序列 DFT 变成短序列 DFT,从而减少运算量。3.2 3.5(1) NuxjvyjNuveFyxf /2/2102),(),( NxujyvjuNv ef /)(2/)-(21020 00,(),( = NvyuxjNxjyjNuv eeF/)(2/2/2102 0.),( = Nvyuxj/)(20),(同理,=vyuxjeF/)(20),(#2#1f(0,0,0,0)f(0,0,0,1)f(0,0,1,0)f(
5、0,0,1,1)f(0,1,0,0)f(0,1,0,1)f(0,1,1,0)f(0,1,1,1)f(1,0,0,0)f(1,0,0,1) f(1,0,1,0) f(1,0,1,1)f(1,1,0,0)f(1,1,0,1)f(1,1,1,0)f(1,1,1,1)W0f1(0,0,0,0)W0f1(0,0,0,1)W0f1(0,0,1,0)W0f1(0,0,1,1)W0f1(0,1,0,0)W0f1(0,1,0,1)W0f1(0,1,1,0)W0f1(0,1,1,1)-W0f1(1,0,0,0)-W0f1(1,0,0,1) -W0f1(1,0,1,0) -W0f1(1,0,1,1)-W0f1(1,
6、1,0,0)-W0f1(1,1,0,1)-W0f1(1,1,1,0)-W0f1(1,1,1,1)W0f2(0,0,0,0)W0f2(0,0,0,1)W0f2(0,0,1,0)W0f2(0,0,1,1)-W0f2(0,1,0,0)-W0f2(0,1,0,1)-W0f2(0,1,1,0)-W0f2(0,1,1,1)W4f2(1,0,0,0)W4f2(1,0,0,1)W4f2(1,0,1,0)W4f2(1,0,1,1)-W4f2(1,1,0,0)-W4f2 (1,1,0,1)-W4f2 (1,1,1,0)-W4f2 (1,1,1,1)W0f3(0,0,0,0)W0f3(0,0,1,0)-W0f3(0
7、,0,1,0)-W0f3(0,0,1,1)W4f3(0,1,0,0)W4f3(0,1,0,1)-W4f3(0,1,1,0)-W4f3(0,1,1,1)W2f3(1,0,0,0)W2f3(1,0,0,1)-W2f3(1,0,1,0)-W2f3(1,0,1,1)W6f3(1,1,0,0)W6f3(1,1,0,1)-W6f3(1,1,1,0)-W6f3(1,1,1,1)W0f4(0,0,0,0)-W0f4(0,0,0,1)W4f4(0,0,1,0)-W4f4(0,0,1,1)W2f4(0,1,0,0)-W2f4(0,1,0,1)W6f4(0,1,1,0)-W6f4(0,1,1,1)W1f4(1,0,
8、0,0)-W1f4(1,0,0,1) W5f4(1,0,1,0) -W5f4(1,0,1,1)W3f4(1,1,0,0)-W3f4(1,1,0,1)W7f (1,1,1,0)-W7f4(1,1,1,1)=F(0,0,0,0)=F (0,0,0,1)=F (0,0,1,0)=F (0,0,1,1)=F (0,1,0,0)=F (0,1,0,1)=F (0,1,1,0)=F (0,1,1,1)=F (1,0,0,0)=F (1,0,0,1) =F (1,0,1,0) =F (1,0,1,1)=F (1,1,0,0)=F (1,1,0,1)=F (1,1,1,0)=F (1,1,1,1)#3 #4=
9、Nvyuxjef/)(20),( NvyuxjNuxjvyjuNv eeF/)(2/2/2102 0.),( = =NxjyvjNuvF/)(2/)-(2102 00,( ),(0f vyuxjeyxf /)(200),(),( (2) NuxjvyjNxyfvuF/2/210),(),( Nxujyvjxyef /)(2/)(2100 00,(),( = =NvujeF/)(20, yvxujf/)(20),同理:=yvxujf/)(20),( ),(),(, 0/)(2/)(210/)(2 000 vuFeyxfeF NxujNyvjNxyyvxuj 3.6 ),(),f1),(, 012
10、 myxgnNyxgfuv ,GvuF ),(),f1),(,012 yxgnyxgfNuv ,vu3.7需要 次乘法N2log*3.11一维沃尔什反变换核 可得:10)()(1),(Ni ubxiniuxh1 - 1- -1 - 1 1 1 - - - 1 1 1 - 1 - 1 - 1 6G13.12由一维哈达玛反变换核 可得:)(10)(,ubxiNiuxh1- -1 -1 - 1- 3H3.13N=16 时的 FHT 流程图:3.143.15(1)Ex=1/3(x1+x2+x3)=(1/3,1/3,1/3)T 9/219/31kTxxmC(2)Cx特征值为:1/3,1/3,0对应的特征
11、向量: TTT ),(,),(,),( 3/1/6/6/2/1-0/ 321 eee 3/1/-) (321#2#1f(0)f(1)f(2)f(3)f(4)f(5)f(6)f(7)f(8)f(9) f(10) f(11)f(12)f(13)f(14)f(15)f1(0)f1(1)f1(2)f1(3)f1(4)f1(5)f1(6)f1(7)-f1(8)-f1(9)-f1(10)-f1(11)-f1(12)-f1(13)-f1(14)-f1(15)f2(0)f2(1)f2(2)f2(3)-f2(4)-f2(5)-f2(6)-f2(7)f2(8)f2(9)f2(10)f2(11)-f2(12)-f2
12、(13)-f2(14)-f2(15)f3(0)f3(1)-f3(2)-f3(3)f3(4)f3(5)-f3(6)-f3(7)f3(8)f3(9)-f3(10)-f3(11)f3(12)f3(13)-f3(14)-f3(15)f4(0)-f4(1)f4(2)-f4(3)f4(4)-f4(5)f4(6)-f4(7)f4(8)-f4(9)f4(10)-f4(11)f4(12)-f4(13)f4(14)-f4(15)B(0)B(1)B(2)B(3)B(4)B(5)B(6)B(7)B(8)B(9)B(10)B(11)B(12)B(13)B(14)B(15)#3 #4B(0)=0B(1)=0B(2)=0B
13、(3)=0B(4)=1B(5)=0B(6)=-4/8B(7)=4/81012-10-1-2000020240000440-4000080-44#3#2#111118/ ,06/12,06/2,06/13yyy第 4 章4.3首先,对原始图像的直方图进行均衡化:用式(4.2.12)t0=0.19, t1=0.44, t2=0.65, t3=0.81, t4=0.89,t5=0.95, t6=0.98, t7=1.0变换函数:t0=1, t1=3, t2=5, t3=6, t4=78 个灰度级合并成 5 个灰度级,结果如下:pt(t0)=0.19, pt(t1)=0.25, pt(t2)=0.21
14、, pt(t3)=0.24, pt(t4)=0.11同样用式(4.2.12),对规定花的图像进行直方图均衡化处理:v0=0, v1=0, v2=0, v3=0.2, v4=0.2, v5=0.8, v6=0.8, v7=1.0用式(4.2.16),找与 vk 最接近的 tk 来代替 vk,得如下结果:灰度级 rk 0 1 2 3 4 5 6 7结果直方图概率 pu 0 0 0 0.19 0.25 0.21 0.24 0.114.9可以。巴特沃斯高通滤波器的传递函数是 ,nhvuDvuH20),(/1),(其对应的低通滤波器的传递函数是l 0/,高通滤波器的传递函数与其对应的低通滤波器的传递函数
15、之间存在如下的关系:,),(1),(vuvuHhl即 ),(/),(1),(/1 ,/)(1,/)(,/),( 2020 12020vuHDvuvuDlnn nnh 4.10式 的两边进行傅里叶变换,从空域转移到频域,得到如下),(),(yxfyfGx1F ),(/2exp(1)/2ep(, vuFNiNuivuvH第 5 章5.1根据退化模型位置(空间)不变性,当该退化系统的输入为 时,求系统的响),(byax应为: )()(22),(),( byaxebyaxHbyaxh 5.2根据退化模型的齐次性、叠加性、线性和位置(空间)不变性,当该退化系统的输入为时,求系统的响应为:),(3),(5
16、byaxbyax ),(3),(5H byaxHbyaxH)()()()( 222235byaxbyaxee5.4图像在x方向和y方向都做匀速直线运动,即bt/T)(0a则 )(0/2)( )(sin)( ),(0 vbuajTTvbuatjtytxj edevuH5.5把 代入 可得:2/)(0atx dtevuHTvytuxj0)(20),(tdtevuHajTatj/ 2,5.6忽略噪声时,维纳滤波器退化成理想的滤波器,则 ),(),(),(),( 2222 /)(/ vuGeevuGvHuFvu5.13三角形有三个顶点,把三个点作为对应点分别代入8765 4321 kyxkxyjiji
17、j jijii可解得看 k1k2k3k4k5k66 个系数,即可得变幻式第 6 章6.1 1. 自然界中可见颜色都可以用三种原色按一定比例混合得到;反之,任意一种颜色都可以分解为三种原色;2. 作为原色的三种颜色应该互相独立,即其中任何一种都不能用其他两种混合得到;3. 三原色之间的比例直接决定混合色调的饱和度;4. 混合色的亮度等于各原色的亮度之和。6.4由于在印刷时 CMY 模型无法产生真正的黑色,因此在印刷业中实际上使用的是 CMYK 彩色模型,K 为第四种颜色,表示黑色。6.5 BGRYMC16.6 BGHRRSI2),min()(316.7全彩色图像处理中,被处理的图像一般是从全彩色
18、传感器中获得。伪彩色处理将黑白图像转化为彩色图像,或者是将单色图像变换成给定彩色分布的图像。6.11伪彩色增强处理将黑白图像转化为彩色图像,或者是将单色图像变换成给定彩色分布的图像。由于人眼对彩色的分辨能力远远高于对灰度的分辨能力,所以将灰度图像转化成彩色表示,就可以提高对图像细节的辨别力。其主要目的是为了提高人眼对图像的细节分辨能力。第 7 章7.1每幅图像大小:24/8*640*480B=921600B=900KB每秒钟视频大小:24*900KB=21600KB=21.1MB不进行压缩存储视频的时间:10GB/21.1MB=485s压缩后每秒视频大小:21.1MB/40.5=533.3KB
19、存储视频的时间:10GB/533.3KB=19662s7.4如果是 2 单位的信息,以 2 为底,则为 log22=1b如果是 2 单位的信息,以 e 为底,则为 ln2=0.69nat如果是 2 单位的信息,以 10 为底,则为 log102=0.30 哈特利则 1 奈特=1/0.69 比特=1.44 比特1 哈特利=1/0.3 比特=3.3 比特7.5I(a)= I(c)= I(d)=log28=3, I(b)=log2(8/5)=0.2H(X)= 1/8*3+5/8*0.2+1/8*3+1/8*3=1.257.6经过直方图均衡化的图形落在每一个灰度值统计区内的概率差不多大,此时使用变长编
20、码方法进行压缩效果将不太理想。7.711100100100000110000001101110000000111000000110110解码后:S2S1S1S5S5S1S1S1S3S1S1S1S1S1S3S2S1S1S1S1S1S1S1S2S1S1S1S1S1S1S3S37.8由于 0.0624 在0,0.2区间,所以可知第一个信源符号为 a,得到信源符号 a 后,由于已知信源符号 a 的上界和下界,利用编码可逆性,减去信源符号 a 的下界 0,得 0.0624,再用信源符号 a 的范围 0.2 去除,得到 0.312,由于已知 0.312 落在信源符号 b 的区间,所以得到第二个信源符号为
21、b。同样再减去信源符号 b 的下界 0.2,除以信源符号 b 的范围0.2,得到 0.56,已知 0.56 落在信源符号 c 区间,所以得到第三个信源符号为 c解码操作过程综合如下:(0.0624-0)/1=0.0624 = a(0.0624-0)/0.2=0.312 = b(0.312-0.2)/0.2=0.56 = c(0.56-0.4)/0.4=0.4 = c(0.4-0.4)/0.4=0 = end所以解码结果为:abcc第 8 章8.1 双尺度方程如下: )12()2()( xnxpxZn q8.2 cA = (3-1+6+2)/2= 5cH = -(-3+1+6+2)/2= -3c
22、V = -(-3-1-6+2)/2= 4cD = (3+1-6+2)/2= 08.6正交小波变换是一种能量守恒的变换。第 9 章9.1Roberts 算子:当模板覆盖图像以下像素值时0 0 00 0 00 1 1Gx=Z9-Z5=1-0=1, Gy=Z8-Z6=0-1=-1mag(f)=( Gx2+ Gy2)1/2=21/2(x,y)=arctan(Gx/Gy)=arctan(-1)=135Sobel 算子:当模板覆盖图像以下像素值时0 0 01 1 11 1 1=4)2()2( 31987 ZZGx =07463ymag(f)=( Gx2+ Gy2)1/2=4(x,y)=arctan(Gx/
23、Gy)=arctan(4/0)=90Prewitt 算子:当模板覆盖图像以下像素值时0 0 00 0 01 1 1Gx=(Z7+Z8+Z9)-(Z1+Z2+Z3)=3Gy=(Z3+Z6+Z9)-(Z1+Z4+Z7)=0mag(f)=( Gx2+ Gy2)1/2=3(x,y)=arctan(Gx/Gy)=arctan(3/0)=909.3Canny 算子并不只是简单的进行梯度运算来决定像素是否为边缘点,在决定一个像素是否为当前边缘点时,需要考虑其他像素的影响;也不是简单的边界跟踪,在寻找边缘点时,需要根据当前像素及前面处理过的像素来进行判断。由于 Canny 算子具有独特的性能,使得其边缘检测和
24、定位的结果要优于其他算子。9.4非二值图像可通过设置阈值先转换为二值图像,再应用 Roberts 算子、Sobel 算子、Prewitt算子、Laplacian of Gaussian 算子 Canny 边缘检测算子等算法实现边界跟踪。如果图像有噪声,经过预处理得到的边缘图像往往会出现原本连接的边界局部断裂的现象,使得边界跟踪算法无法越过这些断点继续向下跟踪。9.6背景的像素点的灰度值的分布概率密度: 其 他064/)5(13)(2xxxp物体的像素点的灰度值的分布概率密度: 其 他 93/)7(4)(2背景和物体在图像中占的像素点比例为 2:4,由 9.4.6 式可得,1/3p0(T)=(1
25、-2/3)p1(T)时,T 是的是使总的错误概率最小的阈值即 p0(T)= p1(T) = = = T=5.8(T=3.6 时会误判所有背4/)5(13232/)7(3景为物体)9.8(1)分成四部分 R1,R2,R3,R4, P(Ri)=FALSE, (i=1,2,3,4), 继续分裂R-R1,R2,R3,R4(2) R1,R2,R3,R4 各自继续分裂R1-R11,R12,R13,R14R2-R21,R22,R23,R24R3-R31,R32,R33,R34R4-R41,R42,R43,R44R1 R2R3 R4R12R11R13 R14R22R21R24R23R31 R32R33R41R
26、34 R43 R44R42(3)R14,R24,R34,R42,R44 各自继续分裂R14-R141,R142,R143,R144R24-R241,R242,R243,R244R34-R341,R342,R343,R344R42-R421,R422R44-R441,R442,R443,R444到此各区域都满足一致性,分裂完毕。9.11找出多幅对应像素点灰度值变化在一定阈值范围内的部分为基准图像,可通过检测图像序列相邻两帧之间的变化,保留对应像素点灰度值变化在一定阈值范围内的部分,再与下一帧的图像对比,重复上述过程,最终取得基准图像。9.12图像帧与帧之间没有配准,则会出现不同像素点之间进行查分
27、,得到像素值的差值可能都会超过阈值,使得大多数的像素点都被认定为运动目标,造成误差。R141 R142R143 R144R242R241R244R243R341 R342R343 R344R421R441R422R443R442R444第 10 章10.2 4 链码:011011003033330323221221128 链码:121200766676544342310.610.7 4 链码: 01101100303333032322122112(0)一阶差分码: 10310303130001331303103012形状数: 0001331303103012103103031310.9面积 A
28、=43中心 ,4318,RyxA4319,RyxA10.12膨胀结果如下:0 0 0 0 1 1 1 1 1 0 0 0 1 1 1 1 1 0 0 0 1 1 1 1 1 1 00 1 1 1 1 1 1 0 00 1 1 1 1 1 0 0 01 1 1 1 1 0 0 0 0 第 11 章11.5基于遗传算法的特征选择主要步骤:(1)初始特征群体 P(0)的生成令染色体个体的位串长度为 n,根据染色体基因为取 1 或 0 决定是否选取相应的特征。随机地将 0 或 1 赋值给染色体个体的各个基因位,得到候选的特征子集,由若干个染色体个体生成了初始特征群体 P(0)。(2)适应度函数的确定假
29、定染色体个体 x 的适应度函数采用基于类内和类间距离的可分离性判据,则fF(x)=tr(SW(x)-1SB(x) (3)下一代特征群体 P(t+1)的获取上一代特征群体 P(t)经过选择、交叉和变异算子作用后,得到下一代特征群体 P(t+1)。与传统的特征选择方法相比,基于遗传算法的特征选择既能对单一特征逐个地进行判别,又能对一个候选的特征子集进行优劣性能评价,因此,可以保证得到的特征子集是最优的。11.8主要步骤:LLE:(1) 寻找输入数据集 X=x1,x2,xN中每一个样本点 xi(i=1,2,N)的 k 个近邻点,即将相对于 xi 距离最近的 k 个样本点作为 xi 的近邻点(k 为一
30、个预先给定的固定值);(2) 由 X 中每一个样本点 xi 的 k 个近邻点,计算局部重建权值矩阵 W;(3)由 W 和 X 中每一个样本点 的 k 个近邻点计算输出数据集 Y=y1,y2,yN,需要定义损失函数,以使 Y 中的每一个样本点在低维空间中保持原有的拓扑结构,并且在映射过程中确保损失函数的值最小。LE:(1) 建立最近邻图 G,若输入数据集 X 中的两个样本点 xi 和 xj 互为 k 近邻,则在图 G 中对应的两个顶点之间用一条边相连接;(2) 确定权值矩阵 W,若图 G 中两个顶点 xi 和 xj 之间用一条边相连接,则它们之间的权值 Wi,j=1,否则,Wi,j=0;(3)
31、若图 G 是完全连通的,应用 计算特征值与特征向量,令 是根据按有序排列的特征值对应的特征向量,考虑到 时, ,则剔除,依次用后面 m 个特征向量0T)1,.(0作为特征空间中的 m 维映射, yi=(vi,1,vi,2, vi,m)T,其中是特征向量 的第 j 个分量。),.21,.,(, jNij iISOMAP:(1) 建立输入数据集 X 的邻接图 G,即首先计算 X 中两个样本点 xi 和 xj 之间的欧氏距离(i,j=1,2,N;i j),然后将图 G 中的每一个顶点用与距离它最近的 k 个样本点用一条边相连接,用 dO(xi,xl)(l=1,2,k)作为相邻的两个样本点之间边的权值
32、;(2) 计算 X 中任意两个样本点 xi 和 xj 之间的最短路径,即在图 G 中,令顶点 xi 和 xj 之间的最短路径为 dG(xi,xj),则若两者之间存在一条边,则 dG(xi,xj)的初始值设为 dO(xi,xj),否则,设为 ;然后,用 mindG(xi,xj),dG(xi,xl)+dG(xl,xj)依次替代所有的 dG(xi,xj) (i,j=1,2,N;ij) ,图 G 中所有顶点之间最短路径的图距矩阵为 DG=dG(xi,xj);(3)将 MDS 算法应用到图距矩阵 DG 上,当误差值减少到最小时,得到的 m 维的特征向量就是高维观测空间中的输入数据集 X 在低维特征空间中
33、的输出数据集 Y。异同点:LLE 算法、 LE 算法和 ISOMAP 算法都属于非线性降维方法,在降维后,仍能在低维空间中呈现出输入数据集中样本点之间的内在拓扑结构。LLE 算法是一种局部优化方法,能够较好地保持样本点之间的局部拓扑结构的特性,即高维空间中的近邻点映射到低维流形中也互为近邻点,但由于它是局部最优的,因而发现的低维流形发生了一定程度的扭曲。LE 算法能够较好地保持了输入数据集的整体低维流形,在将互为近邻点的两个样本点映射到低维流形中,为了尽可能接近原有数据集的拓扑结构,反而出现了样本点聚集的现象。ISOMAP 算法是一种全局优化方法,能够完好地保存输入数据集的拓扑结构特性,即在高
34、维空间中存在的两个相距较近的样本点,映射到低维空间中,它们之间的距离仍较近。第 12 章12.3 在训练样本集中,设 类有 N1 个样本 ,满足 ; 类有 N2),1()Nix0)1(iTxw个样本 ,满足 。为讨论方便,将 类中 N2 个增 1 模式向量),1(2)2ix0)2(iTw都换成 ,则全体训练样本集记作)(i )(i ,)2()(21)()1(2NNExx 21 , 如果 和 线性可分,必存在权向量 w,使得12),1( 0NiiTx线性分类器的学习算法实际上就是确定上式中的权向量 w。12.10 最大隶属原则、最大关联隶属原则与择近原则。12.11 若有 ,使sn,12rris
35、iinmax,12则认为 相对隶属于 。uiAs按最大隶属原则,如果元素 的隶属向量 与完全隶属于 的元素 的隶属向量uiBi Asus0的关联度 或加权关联度 最大,则认为 相对隶属于 。Bs0risriswui s第 13 章13.2利用图像的底层视觉特征,包括颜色、纹理、形状等,进行图像的相似性匹配,输出特征相似的图像作为检索结果。13.3基于语义的图像检索将图像内容从传统的仅由视觉特征集合组成延伸至三层结构,即特征层、对象层和场景层,分别对应特征语义、对象空间关系语义和场景语义,完成语义描述,然后利用基于学习的方法,人工交互的方法,和利用外部信息源的方法进行语义抽取,最后度量语义相似性。13.4定义了一个语义层次模型,采用一种多示例学习的方法,实现从底层特征到简单语义的映射,以及从简单语义到复合语义的映射。