1、第七章 图象数据结构与数据压缩 7.1概述1、图象数据压缩是为了检索、存储、传输的需要。图象经常用到搜索(查找分区、判别边界都要搜索)如何搜索算法。为了提高搜索速度涉及两个问题:存贮分式及存贮结构(图象的数据结构)。存贮方式有两大类:一类为文件管理系统下数据结构,即作为标准的数据文件;另一类为在系统的外部卷,即作为系统驱动程序下直接读写,其卷结构由设计者自己规定,这种结构有两个好处:一是空间节省(可更充分利用存贮介质),二是读写速度快(由于节省了文件结构的一些辅助空间及省去了一些不必要的检查手续)。文件结构:提供一种能快速搜索到所需数据文件组织方式。 逐点查找 先粗后细查找方式:* 四叉树(地
2、图逐级放大,世界国省县)* 二叉树,2图象一大特点是数据量大,为其存贮、传输带来困难,需压缩。例:电话线传输速率一般为56Kbits/s(波特率)一幅彩色图像51251224bit = 6M bits大小。传一幅图象需2分钟左右。 实时传送更难:51251224bits25帧/秒=150Mbits/S如压缩20倍,传一幅图6秒左右,可以接受,实用。实时,要专用信道(卫星、微波网、专线网等技术)。 另外,大量资料需存贮遥感、故宫、医学CT、MR。从统计观点出发,简单直观地讲,就是某一象素的灰度值,总是和周围其他象素灰度值有某种关系,应用某种编码方法提取并减少这些相关特性,便可实现图象信息的数据压
3、缩。 图象数据压缩的目的可以是节省图象存贮器容量,也可以是减少传输信道容量,还可以是为了缩短图象加工处理的时间。,(1)压缩方法:按时间分:静图:静止图象(要求质量高)动图:活动的序列图象(相对质量要求低,压缩倍数要高)压缩比未压缩的图象的存贮字节数压缩后图象存贮字节数失真与否分:无失真压缩:经压缩后再恢复图象与原图象无任何区别,一般压缩倍数 2有限失真压缩:单帧(静)420倍。图象序列(x、y、t)50200倍,(2)压缩失真度衡量标准: a客观:输出与输入之差:e(x,y) = g(x,y)f(x,y)整图:均方差:量纲:灰度级。 亦也将输出与输入之差看作噪声。 输出图象均方信噪比定义为:
4、 g2(x,y) / e2(x,y),常用:峰值信噪比,一般2,或PSNR40dB 人眼看不出来 30 dB 的图象不能用 35dB 可接受到目前为上,国际上没有一个通用的评价图象压缩的客观标准,b主观(人判别)专家投票的方法,实用方法。人的视觉的主观亮度是光强的对数函数。人眼对黑暗区误差比明亮区更敏感。人眼对灰度突变边缘比较敏感。(3)图象压缩的技术指标: a保真度与用途有关,例如侦察与体育比赛关心内容不同 b压缩比:原图象数据量压缩后数据量或0.3bit/pixel c误码扩散程度 d实时性与压缩算法、系统速度有关 e保密性传输中防止被盗,SPOT 是数据需解码(高明压缩方法,压缩后仍是一
5、幅图)数字水印技术watermarking,7.2 四叉树与二叉树(金字塔pyramid或Quad tree)适用于N = 2n 图象 四叉树:,0层 1层 2层 n层 象素数: 40 41 42 4n,四叉树全部保留,总数据量为:,全分辨率图:4n点数,数据量增加1/3,对搜索有好处,找到有关兴趣区域后再提取感应趣的下一层图象。,二叉树(能解决余位问题) 如右图所示可作二叉树表示其优点是灰度变化平缓一些,且数据量相同,另一优点数据位数不增加,计算方法如下:其f0、f1与g0、g1关系由查表决定若右侧f=07,则g亦在07范围的灰度为例定义g0、g1 1与f0、f1关系。由查表关系,f0、f1
6、、g0、g1之间是11对应关系,所以不会丢失精度和误差,7.3 信息有关的基本概念 1信息的度量7月份天气报:“明天下雨”, 信息量小 10月份天气报:“明天下雪”概率事件发生,信息量大概率低信息量大 概念高信息量小 怎么定量?戈壁滩一年下雨概率1/128,睛概率127/128 。对天气预报的信息量多少引入-log2p 代表信息量 如: -log21/128 = 7 有雨-log2127/128 0 晴,信息具有可加性:一个99方阵,一个士兵在某一位置的概率1/81, 信息 = -log21/81 = 6.34在特定行上的概率1/9:信息 = -log21/9 = 3.17在特定列上的概率1/
7、9:信息 = -log21/9 = 3.17行、列信息量和: 3.17+ 3.17 = 6.34引入一个信息度量 I(P) 特点: 0 p P2,I(P2)I(P1) I(p q) = I(p)+I(q)I(P)= -logbp 一般 b = 2,2信息熵(Entropy)预期能得到的平均信息量,I(Pi)的数学期望值 。 对于M个灰阶: Pi i= 1,2,., m,例1, 当Pi = 1/4 , i= 1,2,3,4 H = 2当P1 = 1/2, P2 = 1/4, P3 = P4 = 1/8 H = 1.75,例2,二值图象, xi = 0, 1 0值概率:p1值概率:1-p,H p
8、变化关系可以发现,当p=0.5时熵最大。,0 0.5 1 p,H,1.0,一般讲,对M个灰值,,求H的条件极值,即:,M = 256时, Hmax = 8 注意熵H的特点:H 0Hmax = log2MH Hmax,3互信息量(信息损失的度量),7.4 可逆保真编码(无失真压缩) 熵:平均信息量 一般图象压缩模式:,孤立地考察每个象素点出现概率。,去相关 (去冗余),量化,无失真编码,S=8大,S小,0 255 灰度,百分比,注意:恰当做变换熵可以减小。 例:熵变小,把信息转移到变换模型中(高阶熵概念)结论:不作变换时无失真编码压缩极限是熵,一幅图(3bits) 4 4 4 4 4 4 0 4
9、 5 5 5 5 4 0 4 5 6 6 6 4 0 4 5 6 7 6 4 0 4 5 6 6 6 4 0 4 5 5 5 5 4 0 4 4 4 4 4 4 0 4 4 4 4 4 4 0,灰度 频数 概率 熵 0 8 0.125 0.375 1 0 0 0 2 0 0 0 3 0 0 0 4 31 0.484 0.507 5 16 0.25 0.50 6 8 0.125 0.375 7 1 0.016 0.096 和 64 1.0 1.853,1Huffman码紧凑编码n个由(m1mn)信息,概率为P1Pn, 基本思想:对概率大的信息分配短码,小的分配长码。 步骤:先作直方图统计,按出现
10、概率由大到小排队。而后反向编码:概率大的赋0,概率小的赋1。 实现:可以按块、按总体统计或自适应边统计边修正。 此码变长,不易实现,当概率变,则编码方式亦变化。,2B码: 每个码分成两部分,即延续比特和信息比特。分割码字 代表有效信息 CCCC(0或1表示) C相同的表示同一个码字C变号表示前一个码字结束。3移位码2位码可有00,01,10,而11作为移位码,超过3的倍数用11 的次数表之。,4行程编码(Run-Length Coding)由灰度长度对组成,即(灰度,长度),根据前图按垂直方向扫描,可编为: (4,9) (5,5) (4,3) (5,1) (6,3) (5,1) (4,3) (
11、5,1) (6,1) (7,1) (6,1) (5,1) (4,3) (5,1) (6,3) (5,1) (4,3) (5,5) (4,10) (0,8)结果:64个数据压成到40个。,通常扫描走向:,另一种扫描方向线选取,Helbert曲线行程编码。 递归算法:A: D A A BB: C B B AC: B C C DD: A D D C,D,D,D,A,C,1级,2级,对前图用Helbert曲线扫描结果:4 4 5 4 4 4 5 5 6 6 7 6 5 5 4 44 5 5 4 4 4 4 4 4 4 4 4 5 5 6 66 5 5 5 4 4 4 4 4 4 0 0 0 4 4 0
12、0 0 4 4 5 6 6 5 5 5 4 4 4 4 0 0得:(4,2) (5,1) (4,3) (5,2) (6,2) (7,1)(6,1) (5,2) (4,3) (5,2) (4,9) (5,2)(6,3) (5,3) (4,6) (0,3) (4,2) (0,3)(4,2) (5,1) (6,2) (5,3) (4,4) (0,2) 242=48目前算术编程码效率最高,计算量大,7.5 有限失真编码 1插值编码 量化: 灰度分辨率 采样: 空间分辨率 仅保留部分灰值其它部分值求得,2按块取齐编码将NN图像分成MM大小之块,MN然后分别对每个MM块内之数据压成一位长,按力矩不变原则选
13、阈值并二值化而得到,同时还需保留恢复力矩必须的信息。 步骤:由中值分割成二值图,由一、二次力矩计算出分别之A,B值,保留二值图像及f,。例:小范围内恢复后的灰度值近似取为一样,看不出差别,主要特征保留。优点:按块等长编码,防误码扩散。缺点:四行才能计算,需要行存贮。,3变换编码概念:将空间域里的图象,经过某种变换(通常用正交变换,如付氏变换,沃尔什变换等),在某种变换域里描述,一般来说,在变换域里描述要比空间域里简单,而且图象相关性明显下降,这样变换本身就能实现编码率的压缩。若再对变换域图象进行某种处理(如频域中的二维滤波)以及熵编码,则可进一步压缩图象的编码比特率。对变换处理后的图像信号施以
14、上述的反变换,即可获得空间域图象。变换目的是去相关、相邻象素相关性强,变换运算量与N2成正比。 一般N取88块或1616块(块小压缩倍数少,没意义;块大,相关性弱)。,4预测编码:由前m点预测当前点,存预测值与实际值的差值 典型:相邻象素灰值相减,存差值。预测结果:多米诺骨牌,误码扩散严重。分块后边缘损失。,5矢量编码简化描述:全图n个点,有A0 A1 A2 An,有m 个组,近似归纳为有限个模式,如k组,全图有n/m组 ,n/mk,存k组 + n/m个组号。,7.6 图象帧间编码序列图象(动图)帧间相关性强 1静止运动部分的关系:Bell实验室研究成果,人对静止部分分辨率强,对运动部分分辨率
15、弱要求不高。即:空间分辨率高,时间分辨率低一些。2传送帧间差对帧间差压缩传输,两幅之间对应象素的灰度差某一阈值,取为零。3运动检测:图象分成一定大小的块(MN-1616)子块,在(M+2L,N+2L)范围内到前一帧图上搜索与某相关性最大的子块。相关函数:,7.7 JPEG与MPEG (Joint Photographic Expert Group, Motion Picture Expert Group)90年代初期制定。1JPEG:8791年初制定的一系列标准。 基本方案:,DCT,量化,编码压缩,DCT:88块做DCT变换,统计分析表明,图象局域相关性较强。量化:人的感觉对低频敏感,各系数
16、对人眼的重要程度区别对待,即非均匀量化。沿长编码:(锯齿形编码)后半很多都是零有利编码。88块,每块做DCT直流分量,按块作预测编码,交流分量量化后作延长编码。对沿长编码结果作Huffman编码。,多波段问题: 地物波谱224波,彩色R、G、B三波段,各波段间存在相关性,如彩色,人眼对亮度最敏感,对颜色分辨率较弱。R、G、B) 亮度、色调、饱和度(理论:主分量分解最佳)R、G、BY.U.V(PAL西德)Y.I.Q(NTSC 美国),2MPEG基本思想:帧间编码: 第一帧用JPEG(帧内编码),隔8帧有一帧作帧内编码1,9,17, 25, P帧做预测编码,用前后两帧(1, 9)作预测。例:开窗与否。双向预测、运动检测,希望误差小。 双向补插:2,3,4可由1,5两帧按时间线性插值得到。压缩后存贮顺序:1,9,5,2,3,4,6,7,8其它压缩方法: 分形、小波等。,