1、第9部分 图象压缩编码,9.1 基本概念9.2 基础理论9.3 变长编码 9.4 位平面编码 9.5 预测编码9.6 变换编码9.7 子带编码 9.8 小波变换编码9.9 编码标准,动机/原因:表达数字图象所需数据量通常很大例: 灰度图象:彩色图象:视频(运动图象):传输:在ISDN(码率为64k bps-2M bps),无压缩传输上述每秒的视频信号约需要75秒(码率2Mbps)存储:软盘(存储容量1.4MBytes),无压缩最多存储2幅彩图 VCD (存储容量 680MBytes),无压缩只能存储30多秒视频,9.1 基本概念,图象编码: 采用对图象的新的表达方法以减小所需的数据量 数据和信
2、息:数据是信息的载体 数据压缩:对给定量的信息可用不同的数据量来表示对给定量的信息,设法减少表达这些信息的数据量称为 图象压缩(编码)和图象解压缩(解码),图象压缩方法的分类 :信息保存型:在压缩和解压缩过程中没有信息损失压缩率一般在2 10之间信息损失型:常能取得较高的压缩率(几十几百)压缩后并不能经解压缩恢复原状 准无损(near-lossless):,一、数据冗余,1、数据冗余的概念数据是信息的载体同量的数据可表达不同量的信息同量的信息可用不同量的数据表达冗余数据表达了无用的信息数据表达了已表达的信息,相对数据冗余数据冗余可定量描述,相对冗余:压缩率: CR 在开区间 (0, ) 中取值
3、n1和n2代表2个数据集合中的信息载体单位的个数,2、数据冗余类别 (1) 编码冗余与灰度分布的概率特性有关 (2) 象素相关冗余空间冗余,几何冗余 (3) 心理视觉冗余与主观感觉有关 减少/消除其中的一种/多种冗余,就能取得数据压缩的效果,(1) 编码冗余编码:需建立码本来表达数据码本:用来表达一定量的信息或一组事件所 需的一系列符号(如字母、数字等)码字:对每个信息或事件所赋的码符号序列码字的长度(字长):每个码字里的符号个数,图象中灰度出现的概率不同灰度出现的概率不同平均比特数用较少的比特数表示出现概率较大的灰度级用较多的比特数表示出现概率较小的灰度级,(2) 象素间冗余直接与象素间相关
4、性联系,规则 冗余大,不规则冗余小,(3) 心理视觉冗余主观:因人而异,因应用要求而异其存在与人观察图象的方式有关眼睛对某些视觉信息更敏感人对某些视觉信息更关心心理视觉冗余与实在的视觉信息有联系(损失不可逆转),1、图象保真度 信息保存型/信息损失型 描述解码图象相对于原始图象的偏离程度 对信息损失的测度 主观保真度准则 主观测量图象的质量,因人而异,应用不方便 客观保真度准则 用编码输入图与解码输出图的某个确定函数表示损失的信息量, 便于计算或测量,二、图象保真度和质量,2. 客观保真度准则点误差图误差均方根误差均方信噪比,(归一化)信噪比:令单位:分贝(dB)峰值信噪比,3. 主观保真度准
5、则观察者对图象综合评价的平均 电视图象质量评价尺度,图象编解码系统模型两个通过信道级连的结构模块 输出图是输入图的精确复制? 信息保持型:是,无失真 信息损失型:不是,有一定的失真,三、图象编码模型,1、信息量概率为P(E)的随机事件 E 的信息量I(E )称为E的自信息(随概率增加而减少)特例:P(E ) = 1(即事件总发生),那么I(E ) = 0信息的单位:比特(log以2为底)1个比特:即2个相等可能性的事件之一发生,一、信息论简介,9.2 基础理论,离散平稳随机序列信源的熵,可以证明,2、信息系统信源通过信道与信宿(即信息用户)连通以传递自信息 。信源符号集:A = a1, a2,
6、 , aJ概率矢量:u = P(a1) P(a2) P(aJ )T用(A, u)可以完全描述信源,平均信息产生单个信源符号的自信息:I(aj) = logP(aj)产生k个信源符号,符号aj平均来说将产生kP(aj)次 信源的熵或不确定性:观察到单个信源符号输出时所获得的平均信息量,3、互信息条件熵平均条件熵(平均信息)互信息信道容量,v = P(b1) P(b2) P(bJ )T,1、无失真编码定理(香农第一定理)确定每信源符号可达到的最小平均码字长度 信息传输系统 如果信道和传输系统都没有误差,传输系统的主要功能就是尽可能紧凑地表达信源(数据压缩),二、基本编码定理,块信源符号集:A =
7、a1, a2, , aJnP(a i) = P(aj1) P(aj2) P(ajn) 概率矢量:u = P(a1) P(a2) P(aJn)T信源熵: 产生块随机变量的(零记忆)信源的熵是对应单符号信源的 n 倍,扩展信源平均码长第一定理:编码效率: (H (u)是Lavg / n的下限),2、信源编码定理(为率失真定理 )信道没有误差但传输过程有失真(Q是传输矩阵)此时传输系统的主要功能就是“信息压缩” 目标:平均误差被限制在某个最大允许的水平D在给定保真度准则的前提下,确定最小的R,失真(随机变量 )的平均值d(Q) 允许失真为D的编码解码过程的集合率失真函数,非负的失真量度函数(代价函数
8、),需要合理选择Q以求取I (u, v)的最小值 (1) Q的元素必须是正的(2) Q的任1列之和为1(3) 如果允许最大可能的失真,就会产生 最小的信息率,零记忆二元对称信源的率失真函数特点:R(D)总是正的,单减的在0, Dmax区间下凸R(D)在D 0时不存在D Dmax时有R(D) = 0,实际区域,1、哈夫曼编码步骤 (1) 缩减信源符号数量将信源符号按出现概率从大到小排列,然后结合,一、哈夫曼编码,9.3 变长编码,(2) 对每个信源符号赋值从(消减到)最小的信源开始,逐步回到初始信源,2、哈夫曼编码结果平均长度信源熵编码效率,哈夫曼编码计算量信源:N个符号信源消减次数:N 2码赋
9、值次数:N 2 亚最优的变长编码方法牺牲编码效率来换取编码速度,二、亚最优变长码,变长编码技术,其码字中的0和1是独立的, 并且基本上等概率出现主要步骤为: (1) 将信源符号依其概率从大到小排列 (2) 将信源符号分成概率和接近的两部分 (3) 分别给两部分的信源符号组合赋值 (4) 如果两部分均只有一个信源符号,编码结束, 否则返回(2)继续进行,三、香农-法诺编码,算术编码示例编码来自1个4-符号信源a1, a2, a3, a4的由5个符号组成的符号序列:b1b2b3b4b5 = a1a2a3a3a4,四、算术编码,0.068,将多灰度值图象分解成一系列二值图对每一幅二值图再用二元压缩方
10、法,9.4 位平面编码,图象的位面表示,一、位平面的分解,1.常数块编码(CAC) 用专门的码字表达全是0或1的连通区域将图象分成全黑,全白或混合的m n尺寸块出现频率最高的类赋予1 bit码字0其它两类分别赋予2 bit码字10和11压缩:原需用mn比特表示的常数块现在只用 1 bit或2 bit码字表示,二、位平面的编码,2. 1-D游程编码(RLC) 设每行均由白色(0)游程开始 对第2位平面(最高位):4 2 2,3 3 2,3 4 1,4 2 2,9.5 预测编码,空域方法,消除象素间的冗余象素间的相关性使得预测成为可能仅提取每个象素中的新信息并对它们编码,一、无损预测编码(信息保存
11、型),1、无损预测编码系统编码器 + 解码器(有相同的预测器),无损预测编码过程输入序列: fn (n = 1, 2, )预测输出: (舍入成整数)预测误差:误差编码:在符号编码器中用变长码编误差解压序列:哪里取得了压缩?,(消除了象素间冗余),m阶线性预测:1-D线性预测:一阶1-D线性预测:预测误差的概率密度函数:,二、有损预测编码(信息损失型),1、有损预测编码系统增加了1个量化器,预测器放在1个反馈环中,输入序列: fn (n = 1, 2, )量化输出:预测输入:解压序列:编码误差:哪里又取得了压缩?,(量化,减少了心理视觉冗余),2、最优预测 最小化编码器的均方预测误差差值脉冲码调
12、制法(DPCM),二维线性预测,预测误差信号的统计性质,例:三阶预测,解得,实际应用中的几点说明 (a)预测系数 与图象的统计特性有关,通常用一组典型图象来确定 (b) (c)预测阶数的选择-对平稳m阶马尔可夫过程,m阶预测 (d)(e)典型失真斜率过载灰度突变点,预测值偏小,量化步长偏小,产生边缘模糊颗粒噪声-灰度慢变点,预测值偏大,量化步长偏大 (f)优缺点-简单,易于硬件实现.抗误码性能差,4阶线性预测器,3、最优量化,判别,重建,最小均方量化误差重建电平是p(s) 曲线下面积的重心判别值为2个重建值的中值,q(s)奇函数,输入概率密度函数,偶函数,4. 帧内编码(类似静态图像编码),分
13、块:将图像平面分成88图像快; 变换:通常是进行DCT(整数变换); 量化:对DCT系数按照特定的量化表进行量化; Z形扫描:将量化的交流分量系数按照Z字形顺序扫描排列; 游程编码:对交流系数用游程编码,对相邻快的直流系数采用预测编码(DPCM); 熵编码:用哈夫曼或算术编码对游程编码后的数据进行熵编码。,5. 帧间编码(帧间预测编码) 目前主要采用运动估计和运动补偿算法。,在帧间预测编码中,为了达到较高的压缩比,最重要的是得到尽可能小的帧间预测误差。 对运动物体区域进行预测,首先要估计运动物体的位移(运动矢量),然后再根据运动矢量找出物体在前一帧的区域位置,计算前后帧运动物体相应点之间的差值
14、。,运动估计算法的一般步骤(编码端使用): 对当前帧中的某一宏块,按照一定的准则在参考帧的窗口中寻找匹配部分,从中找到运动矢量; 根据运动矢量,将参考帧位移,求得当前帧的估计; 将这个估计和当前帧相减,求估计的残差值; 将运动估计和残差传送到接收端。,运动补偿算法的一般步骤(解码端使用): 根据接收的运动矢量将参考帧作位移,得到对当前帧的估计; 将上述估计和接收到的残差相加,得到当前帧的补偿结果。 运动补偿的关键是运动估计。,运动估计技术的分类: 像素递归法 相位相关法 块匹配法(常用的方法):对当前帧图像的每一块,在上一帧的一定范围内搜索最优匹配块,并认为本块就是从上一块最优匹配块位置处平移
15、过来的。设可能的最大偏矢量为dxmax,dymax,则搜索范围为(M+2dxmax)(N+2dymax)。,块匹配算法,匹配块,匹配块位置与MN块位置的坐标偏移量即为所估计的运动矢量。,(1)最优匹配准则,最小平均绝对差(不需要作乘法、实现简单、方便)最小均方误差归一化互相关函数,(2)搜索方法,一次一个方向搜索法 二维对数法 三步法 新三步法,三步法:,基本思想是采用一种由粗到细的搜索模式,从原点开始,按一定步长取周围8 个点构成每次搜索的点群,然后进行匹配计算,跟踪最小误差MBD点,算法具体描述如下: 1) 从原点开始,选取最大搜索长度的一半为步长,在周围距离步长的8 个点处进行块匹配计算
16、并比较; 2)将步长减半,中心点移到上一步的MBD 点,重新在周围距离步长的8 个点处进行块匹配计算并比较; 3)在中心及周围8个点处找出MBD 点,若步长为1,该点所在位置即对应最佳运动矢量,算法结束;否则,重复2)。,新三步法:,第1 步同时搜索中心和距中心网格步长为4 和网格步长为2 的各8个点,计算比较取得最小MBD 的点作为下一步的中心点; 第2步修改为,如果第一步的最佳匹配点在距中心网格步长为4的8个点中,则以该点为中心点,以步长为2,进行搜索,找最小的MBD点,如果第一步的最佳匹配点为其它9个点,则直接进人第3步; 第3步,在中心及周围8个点处找出最小的MBD点,该点所在位置即对
17、应最佳运动矢量。,一、变换编码系统,图象分解:减少变换的计算复杂度图象变换:解除每个子图象内部象素之间的 相关性,或者说将尽可能多的信息集中到尽可能少的变换系数上压缩不是在变换中而是在量化变换系数时取得的,9.6 变换编码(非信息保持型 ),二、子图象尺寸选择,影响变换编码误差和计算复杂度(压缩量和计算复杂度都随子图象尺寸的增加而增加 )两个条件: 相邻子图象之间的相关(冗余)减 少到某个可接受的水平; 子图象的长和宽都是2的整数次幂最常用的子图象尺寸:8 8和16 16,变换编码重建误差与子图象尺寸的关系,三、变换选择,一个能把最多的信息集中到最少的系数上去 的变换所产生的重建误差最小 不同
18、变换的信息集中能力不同 KLT最优,但计算量非常大(依赖于图象)正弦类变换(如DFT和DCT)较优非正弦类变换(如WHT)实现简单小波变换计算快且有局部性质(不需分解),信息集中能力: KLT DCT DFT WHT所需计算量:KLT DCT DFT WHTDCT是较好的(综合)选择,四、比特分配,比特分配:对变换子图象的系数截断、量化和编 码的全过程。 截断误差与两个因素有关: 截除的变换系数的数量和相对重要性 用来表示所保留系数的精度(量化) 保留系数的2个准则: 最大方差准则,称为分区编码 最大幅度准则,称为阈值编码,1、分区编码具有最大方差的变换系数带有最多的图象信息,事先确定模板,保
19、留一定的系数(如左下图)。典型的分区模板和分区比特分配,2、阈值编码根据子图象特性自适应选择保留系数将系数排队,与阈值比较确定去舍。典型的阈值模板和取阈值系数序列,随子图象不同而保留不同位置的变换系数 常用对变换子图象取阈值的方法:(1) 对所有子图象用一个全局阈值压缩的程度随(不同)图象而异。(2) 对各个子图象分别用不同的阈值舍去同数量系数,码率是个常数。,根据子图象中系数的位置选取阈值将取阈值和量化结合起来.,给出F的一个截断近似。,上式中 用 代替,是 的取值和量 化(归一化)后的近似。是变换归一化数组。,9.7 子带编码,子带:由图象分解得到的一系列带限分量的集合 将它们重新组合起来
20、可以无失真地重建原始图象将图象分解为子带后进行编码的主要好处: (1) 不同子带内的图象能量和统计特性不同,可 以采取不同的变长码甚至不同的编码方法分 别进行编码,提高编码效率。 (2) 通过频率分解,减少或消除了不同频率之间 的相关性,有利于减少图象数据的冗余。 (3) 量化等操作可在各子带内分别进行,避免了 互相干扰和噪声扩散。,1、子带分解输出序列x*(n)是先通过将x(n)用分析滤波器h0(n)和h1(n)分解为y0(n)和y1(n),再借助合成滤波器g0(n)和g1(n)进行重建得到的 。h0(n)和h1(n)都是半带(half-band)滤波器,其中h0(n)对应一个低通滤波器,其
21、输出是x(n)的近似部分, h1(n)对应一个高通滤波器,其输出是x(n)的细节部分 。,序列x(n),n = 0, 1, 2, 的Z-变换在时域中以2为因子的抽样 在时域中以2为因子的内插,序列x(n)先被抽样再被内插,得到x*(n) 根据Z-变换来考虑子带编码和解码系统系统的输出为:其中第2项(依赖于z)表达了由于抽样和内 插过程而引入的混叠,2、子带重建重建无失真,x*(n) x(n)和X*(z) X(z) 结合进一个矩阵表达式,假设Hm(z)是非奇异的(行列式不为零) 分析滤波器和合成滤波器是交叉调制的对有限冲击响应(finite impulse response, FIR)滤波器,d
22、etHm(z) = az(2k+1),一、小波变换编码系统,与采用正交变换(如DCT)的编解码系统不同, 小波变换编解码系统中没有图象分块的模块 小波变换的计算效率很高,且本质上具有局部性 小波变换编码不会产生使用DCT变换在高压缩比 时的块效应,9. 8 小波变换编码,小波变换编码需考虑的几个因素 1. 小波选择如:双正交小波 2. 分解层数选择影响小波编码计算的复杂度和重建误差 3. 量化设计对小波编码压缩和重建误差影响最大在不同尺度间调整量化间隔,等级树集分割编码方法(SPIHT),空间方向树定义:除最低分解级的三个高频子带和最高分解级的一个低频子带外,每一个树节点都有四个直接后代,这四
23、个直接后代在同方向的下一级子带中以22大小连结在一起的像素块组成;最低分解级三个高频子带无后代;最高分解级的最低频子带中的像素点称为树根,树根的直接后代和其他各节点的直接后代的形成有所不同,树根以22大小连结在一起的像素块为一组,一组中有一个像素点无后代,另外三个像素点分别在同一分解级、不同方向的高频子带中产生四个直接后代,箭头表示各节点产生后代的方向。带“*”号的像素不产生后代。,三个表:不重要集合表(LIS):放置的小波系数的位置坐标表示不重要集合; 不重要像素表(LIP):放置不重要小波系数的位置坐标; 重要像素表(LSP):其中是重要小波系数的位置坐标。对应某个树节点的小波系数超过某一
24、阈值称该系数为重要系数。 两个集合: A类:(i,j)表示其所有的后代; B类:(i,j)代表的集合中不包括其直接后代。,SPIHT算法步骤: (1)初始化:将最高分解级的低频子带的根节点的小波系数的坐标放入LIP,有后代的节点的坐标放入LIS中,作为A类集合;LSP初始化为空集。 (2)扫描排序:将LIP中重要系数的坐标移到LSP中。对LIS中的A类集合,如果后代中有重要系数,则将A类集合分为直接后代和一个B类集合,根据直接后代是否是重要系数,坐标被移入LIP或LIS中。对LIS中的B类集合,如果后代中有重要系数,则将直接后代坐标放入LIS最后,作为A类集合。 (3)细化:按递减次序输出LS
25、P中每个系数在相应码平面的上的比特。 (4)量化系数更新:比较阈值减半,回到步骤(2)。,二、基于提升小波的编码,可以在当前位置实现整数到整数的变换,运算速度快且节约内存。它包括三个步骤: 1. 分裂(split)将图象数据 分解成偶数部分 和奇数部分 S uj(x, y) := uj1,k(x, y), vj1,k(x, y),2. 预测(predict) 保持偶数部分不变并用偶数部分来预测奇数部分,然后用奇数 部分与预测值的差 (称为细节系数) 替代奇数部分vj1,k(x, y) := vj1,k(x, y) P uj 1,k(x, y),3. 更新(update) 构造一个作用于细节函数
26、的算子U,并叠加到偶数部分上以 获得近似图象, 这里要保持原始 图象的一些特性 uj 1,k(x, y) := uj 1,k(x, y) +U vj 1,k(x, y),重建过程 三个运算: (M 合并) (1) uj1,k(x, y) := uj1,k(x, y) U vj1,k(x, y) (2) vj1,k(x, y) := vj1,k(x, y) + P uj1,k(x, y) (3) uj,k(x, y) := M uj1,k(x, y), vj1,k(x, y),1980年以来,国际标准化组织(ISO)、国际电工委员会(IEC)和国际电信联盟(ITU)下属的国际电报电话咨询委员会(
27、CCITT)陆续完成了各种数据压缩与通信的标准和建议,如面向静止图像压缩的CCITTT.81及ISO10918(JPEG)标准,在运动图像方面用于视频会议的CCITTH.261(Px64)标准、用于可视电话的CCITTH.263标准、用于VCD的 MPEG-1及用于广播电视和DVD的 MPEG-2标准,适用于低传输速率的 MPEG-4方案等。,9.9 图象编码国际标准简介,1、JPEG:Joint Photographic Experts Group (联合影象专家小组) (1)四种操作模式a.顺序编码-基本系统,基于分块DCT技术,仅支持有失真编码b.累进编码-图象从粗到细(从模糊到清晰)逐
28、步浮现(a)频谱选择方式; (b)逐次逼近方式(从幅值高位低位)c.无损编码-基于无损DPCM技术d.分层编码-不同空间分辨率层次,(2)JPEG基本系统彩色空间转换:系统框图,a.分块DCTb.量化器,亮度量化表 色度量化表 11 10 16 24 40 51 61 17 18 24 47 99 99 99 99 12 14 19 26 58 60 55 18 21 26 66 99 99 99 99 13 16 24 40 57 69 56 24 26 56 99 99 99 99 99 14 17 22 29 51 87 80 62 47 66 99 99 99 99 99 99 22
29、37 56 68 10910377 99 99 99 99 99 99 99 99 35 55 64 81 10411392 99 99 99 99 99 99 99 99 49 64 78 87 103121120101 99 99 99 99 99 99 99 99 72 92 95 98 11210010399 99 99 99 99 99 99 99 99亮度色度水平样本数 2:1 , 8bits图象建议使用,c.熵编码器DCT系数按之字形扫描重新排序,得到根据频率增加的顺序排列的1_D序列,系数量化后,排序的结果得到值为0的长游程.系数位置排序0 1 5 6 14 15 27 282
30、 4 7 13 16 26 29 423 8 12 17 25 30 41 439 11 18 24 31 40 44 5310 19 23 32 39 45 52 5420 22 33 38 46 51 55 6021 34 37 47 50 56 59 6135 36 48 49 57 58 62 63,DC系数的编码-采用差值编码(考虑块间的相关性)AC系数的编码-行程编码 差值和行程进行熵编码-Huffman编码,分两步进行(a)产生一种中间符号格式序列(b)对中间符号格式序列进行变字长编码,交流系数AC(前缀码+尾码)符号-1 行程,尺寸行程-非零系数前的零值系数的个数 (规定0-1
31、5)尺寸-对幅值编码的比特数(原图8位精度时,1-10)符号-2 幅值幅值-非零AC系数的幅值行程,尺寸用Huffman编码表作变长编码(前缀码),幅度尾码 差值DC系数(前缀码+尾码)符号-1 尺寸(原图8位精度时,0-11)符号-2 幅值尺寸用Huffman编码(前缀码),幅度尾码(尾码直接采用自然二进码),2. MPEG视频压缩方法 帧内压缩是删除空间的数据冗余,帧间压缩则是删除帧与帧之间的时间冗余。 1)空间域压缩和时间域压缩 MPEG在空间域的压缩,类似于JPEG,每一帧被作为独立的图像获取,且压缩步骤与JPEG标准步骤一样。要消除帧与帧之间的时间冗余,通过帧间编码完成。,2)帧间编
32、码 帧间编码的基本思想是仅存储运动图像从一帧到下一帧的变化部分,而不是存储全部图像数据,这样能极大地减少运动图像数据的存储量,达到帧间压缩的目的。把帧序列划分成I帧、P帧、B帧,通过使用参照帧由运动补偿技术来实现。 I帧:在解码时,无需参照任何其他帧的帧称为I帧,或称内编码帧,它是利用自身的相关性进行帧内压缩编码的。 P帧:在帧编码时,仅使用最近前一帧(I帧或P帧)作为参照帧的帧称为P帧,或称为预测帧。 B帧:在帧编码时,要使用前、后帧作为参考帧的帧称为B帧,或称为双向预测帧。,3)运动补偿技术 在帧编码中,运动补偿技术是提高帧间压缩的有效方法,它主要用于消除P帧和B帧在时间上的冗余。在对P帧
33、和B帧进行编码时,以宏块为基本编码单位。 对于B帧,每一宏块有4种类型:帧内宏块,简称I块;前向预测宏块,简称F块;后向预测宏块,简称B块;平均宏块,简称A块。对于B帧,每一宏块仅有I块和F块。无论B帧还是P帧,I块编码均与I帧编码技术一致。F块、B块、A块都采用了基于块的运动补偿技术。,基于块的运动补偿技术是在参照帧中寻找与当前编码块最佳匹配的宏块。所谓最佳匹配是指这两个宏块之间差值最小,通常可用AE(Absolute difference)最小作为匹配依据: 其中,f是参照帧宏块,g为当前编码宏块,dx、dy是参照宏块在x和y方向上的运动矢量,它反映了从一帧到另一帧时,宏块仅仅是位置发生了
34、改变,而内容并没有改变。,3. MEPG标准 1) MPEG-1 MPEG-1制定于1992年,可适用于不同带宽的设备,如CDRO M、VideoCD、CD-i等,它的目的是把221 Mb/s的NTSC图像压缩到1.2 Mbs,压缩率为2001。这是图像压缩的工业认可标准。它可针对SIF标准分辨率(对于NTSC制为352240;对于PAL制为352288)的图像进行压缩,传输速率为1.5 Mb/s,每秒播放30帧,具有CD音质,质量级别基本与VHS(广播级录像带)相当。 MPEG的编码速率最高可达45 Mb/s,但随着速率的提高,其解码后的图像质量有所降低。,应用 MPEG-1技术最成功的产品
35、为VCD。VCD作为价格低廉的影像播放设备得到普及。 MPEG-1也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)以及教育网络等。,2) MPEG-2 MPEG-2制定于1994年,其设计目标是高级工业标准的图像质量以及更高的传输率。 MPEG-2所能提供的传输速率为310 MB/s间,在NTSC制式下的分辨率可达720 480。 MPEG-2能够提供广播级的视像和CD级的音质。 MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道和多达七个伴音声道。 MPEG-2的另一特点是可提供一个较广范围的可变压缩比,以适应不同的画面质量、存储容量
36、以及带宽的要求。,MPEG-2技术就是实现DVD的标准技术,现在DVD播放器也已经在家庭中普及了。除了作为DVD的指定标准外, MPEG-2还可用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。由于 MPEG-2的出色性能表现,已能适用于HDTV(高清晰度电视),使得原打算为HDTV设计的 MPEG-3还没有产生就被抛弃了。,3) MPEG-4 MPEG-4专家组成立于1993年。在1995年3月的Florence会议上初步定义了一个音频验证模型,并于1996年1月在Munich会议上定义了第一个视频验证模型(Verification Model,VM),它提供了支持基于内容的
37、视频表达环境。VM描述了编码和解码方法,主要用于软件模拟,以优化编解码的性能。1997年7月的会议后发布了VM8.0。 MPEG征集到的技术建议经评估后,如认为可行,就会被加到VM中。,MPEG-4比 MPEG-2的应用更广泛,最终希望建立一种能被多媒体传输、多媒体存储、多媒体检索等应用领域普遍采纳的统一的多媒体数据格式。由于所要覆盖的应用范围如此广阔,同时,应用本身的要求又如此不同,因此, MPEG-4不同于过去的 MPEG-2或H.26X系列标准,其压缩方法不再是限定的某种算法,而是可以根据不同的应用进行系统裁剪,选取不同的算法。例如对Intra帧的压缩就提供了DCT和Wavelet两种变
38、换。 比起 MPEG-2及H.26X系列, MPEG-4新变化中最重要的三个技术特征是:基于内容的压缩、更高的压缩比和时空可伸缩性。,MPEG-4于1998年11月公布,它不仅是针对一定比特率下的视频、音频编码,而且更加注重多媒体系统的交互性和灵活性。这个标准主要应用于视像电话、视像电子邮件等,对传输速率要求较低,在480064000 b/s之间,分辨率为176144。 MPEG-4利用很窄的带宽,通过帧重建技术和数据压缩,以求用最少的数据获得最佳的图像质量。 MPEG-4用运动补偿消除时域冗余,用DCT消除空域冗余,与以往视频编码标准相同。为支持基于对象的编码, MPEG-4还采用形状编码和
39、与之相关的形状自适应DCT(SA-DCT)技术以支持任意形状视频对象(VideoObject,VO)的编码。,另外, MPEG-4用视频对象来表述视频内容的基本单元,如:一个站立的人(脱离背景)就是一个VO,VO与其他的AVO(音视频对象)组合成一个特定的场景。传统的矩形图像只能被认为是将整个图像作为一个对象,是这种视频对象的一种特例。,4) MPEG-7 MPEG针对基于内容的问题启动了一个新的工作项目。这个 MPEG家族的新成员是“多媒体内容描述界面”( Multimedia Content Description Interface),简称为 MPEG-7。它的目标是扩展现在有限的查询能
40、力,使其包括更多的信息形式,即 MPEG-7将确立各种类型的多媒体信息标准的描述方法。这种描述与内容密切相关,并支持对用户感兴趣的材料的快速、高效搜索。 所谓“材料”包括静止的画面、图形、声音、运动视频以及上述元素如何结合成多媒体信息(“剧情”、合成信息),还包括上述一般形式中较为特殊的情况,如面部表情、人物特点等。,这种描述可以附加到任何种类的多媒体材料上,而不管其具体形式如何,例如含有这种信息的存储材料可以很方便地进行检索和查询。 MPEG-7对行信息的描述方法不依赖于材料的具体表示形式,并建立在 MPEG-4基础之上。 MPEG-4提供了将视听材料编码成具有特定时空关系物体(Objects)的手段。 准确说来, MPEG-7并不是一种压缩编码方法,而是一个多媒体内容描述接口。继 MPEG-4之后,要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。 MPEG-7就是针对这个矛盾的解决方案。 MPEG-7力求能够快速且有效地搜索出用户所需的不同类型的多媒体影像资料。,5) MPEG-21 MPEG-21由 MPEG-7发展而来,才刚开始启动。据资料透露, MPEG-21主要规定数字节目的网上实时交换协议。 可以预见,在今后相当长的一段时间内,运动图像压缩领域的研究、开发活动仍将十分活跃。,