收藏 分享(赏)

多媒体技术第三章4.ppt

上传人:dcs1276 文档编号:5164961 上传时间:2019-02-11 格式:PPT 页数:20 大小:175KB
下载 相关 举报
多媒体技术第三章4.ppt_第1页
第1页 / 共20页
多媒体技术第三章4.ppt_第2页
第2页 / 共20页
多媒体技术第三章4.ppt_第3页
第3页 / 共20页
多媒体技术第三章4.ppt_第4页
第4页 / 共20页
多媒体技术第三章4.ppt_第5页
第5页 / 共20页
点击查看更多>>
资源描述

1、3.7 静态图像压缩标准JPEG,JPEG Joint Photographic Experts Group 压缩方法: 1.基于DPCM的无失真编码 低压缩比 2.基于DCT的有失真压缩 (顺序方式) 3.基于DCT的累进操作方式 4.基于DCT的分层操作方式,一、基于DPCM的无失真编码,压缩比2:1,二、基于DCT的有失真压缩(顺序方式),DCT,量化器,量化表,图像按顺序分成88子块,并将取值范围0,2P-1变换为- 2P-1, 2P-1-1(有符号数),进行DCT变换。 P:样本定义的精度。 对基于DCT的编码,p取8或12 对基于DPCM的编码,p取216。,三、基于DCT的累进操

2、作方式 对DCT系数进行多次扫描,分批编码。图像通过累进由粗 至细。 频谱选择法:按频带分批编码。一次扫描,只对64个DCT系数中某些频带的系数进行编码,传递,在随后的扫描中,对其他频带的系数编码、传递,直到全部系数处理完毕为止。 按位逼近法:按位分段编码。沿着DCT量化系数有效位方向分段累进编码。第一次扫描只取最高有效位的n位编码、传递,然后对其余位进行编码、传递。,四、基于DCT的分层操作方式 (1)将原图像分辨率降低; (2)按对降低分辨率的图像进行编码; (3)对低分辨率的编码图像解码插值重建,升高分辨率; (4)将分辨率升高的图像作为原图像的预测值,取其差值进行编码; (5)重复(3

3、)(4),直到达到完整的分辨率。适于用低分辨率设备处理高分辨率图像。,JPEG-2000主要特点,单分量(如灰度)和多分量(如彩色)数据的有失真或无失真压缩; 特定区域编码; 按照逼真度或分辨率的分层图像恢复; 图像中特定区域的随机访问; 优异的压缩性能,特别是在高压缩比时; 良好的误差恢复特性。 与JPEG相比,有更大的灵活性。特别是对原始数 据和压缩比特流的组织,实现直接从压缩比特流 中提取并恢复低分辨率或高分辨率图像,不必对 全部比特流解码。,3.8运动图像压缩标准MPEG,MPEG-Moving Picture Experts Group 运动图像:静态图像的序列。 一、MPEG1视频

4、数据流的结构,图像,切片,宏块,Y,亮度像素,色度像素,图像序列层:由序列头、一个或多个图像组和序列结束码组成。 图像组层:由头信息、一帧或连续若干图像组成的可以随机访问的一段以及结束码组成。 图像层:包含头信息和一帧图像所有的编码数据。 切片层:由一个或多个相邻的宏块组成。 宏块层:由四个亮度块和两个色度块构成。 块层:MPEG-1中最小的编码单位。包括DCT系数和块结束标志。,二、MPEG-1视频编码方法 MPEG-1:图像及伴音的压缩传输速率:1.5Mbps亮度分辨率:亮度360240,色度180 120 1.帧的类型 I(intra picture)帧:图像数据流的随机存取点,帧内空间

5、压缩,基于DCT的编码,1-2比特/像素。 P(predicted picture)帧:由前一个I帧或P帧预测得到的帧。 B(bidirectional picture)帧:前后作参照进行预测,双向预测帧,图像组帧结构,2.运动序列流I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B显示顺序不同于编解码顺序。在B帧之前必须先恢复参照帧。解码顺序为:I P B B P B B P帧和B帧采用运动补偿。,运动补偿预测是一种降低时间冗余度的有效方法。 该技术假设每一帧图像都是以过去某一帧图像为原型并经过变换得到的。这种变换是局部的,

6、即图像上各点的位移方向和大小不必相同。要求运动向量值必须正确编码。 改善了随机访问性能,提高了运动视频图像的质量。,P帧的编码:P帧允许以前一个I帧或P帧为参考进行运动补偿预测。 B帧的编码:一种双向预测或插值编码,可以看作一种时间上的多分辨率技术。先对I帧和P帧进行编码,然后通过从重建的I帧和P帧插值得到其余的帧,并对插值误差进行DCT变换编码。,MPEG-1视频编码器框图,图像序列,MPEG流,三、MPEG的发展,MPEG-1(ISO/IEC 11172) 输出速率:1.5Mbps 标准交换格式(SIF)的图像:亮度360240/ 360288,色度180 120/ 180144 源输入格

7、式的电视:NTSC 352像素240行/帧30帧PAL 352像素288行/帧25帧 ISO/IEC 11172-1规定图像、声音及其他相关数据的同步 ISO/IEC 11172-2规定视频图像的编码和解码 ISO/IEC 11172-3规定声音的编码和解码 ISO/IEC 11172-4测试 ISO/IEC 11172-5软件模拟,2. MPEG-2(ISO/IEC 13818) 高质量图像和声音编码标准,图像基本编码算法与MPEG-1 相同。 标准分成10个组成部分,规定了 数据的同步 数据流的组合 图像数据的编码解码 声音数据的编码解码(MPEG-1声音的扩充) 一致性测试、 软件模拟

8、软件管理 数据流的存储媒体命令和控制扩展协议、 多声道声音的编码算法标准(先进声音编码)、 解码器实时接口扩展标准(适应网络传输的数据流)等。,MPEG-2主要特点,允许隔行扫描和逐行扫描输入,高清晰度输入,以及三种不同的色度亚取样方案(4:2:0、4:2:2、4:4:4); 空间和时间上的分辨率可调整编码; 适应隔行扫描的预测方法和块扫描方式。,MPEG-2的电视图像配置见下表:,3. MPEG-4 (ISO/IEC 14496) 目的:建立可应用于移动通信和PSTN低速率多媒体通信 标准,支持可视电话、电子邮件等。 特点:提供基于内容的交互、高效压缩和通用访问性。 原理:视频场景为视频对象

9、的组合。视频对象具有形状、 运动和纹理等属性。因而在运动补偿、DCT和变长编码的基础上采用形状编码,编码器的输入不是视频帧,而是视频对象平面(VOP)。,视频码流的语法分成五个层次:视频会话(VS):视频序列由若干VS组成。视频对象(VO) : VS由若干VO组成。视频对象层 (VOL): VOL对应一个VO的不同空间和时间分辨率, 一个VO可有若干个VOL。视频对象平面组(GOV):可选层,提供随机访问、重同步和数据恢复能力,由若干VOP 组成。视频对象平面(VOP):为VO或VOL特定时刻的瞬像,分为I、P、B和S四种。S- VOP为全景图编码。,MPEG-4算法方框图,4. MPEG-7多媒体内容描述接口 目的:用于多媒体信息的管理和检索。建立与内容相联系的标准化的描述。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 网络科技 > 多媒体

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报