1、数字电视视频压缩技术原理摘要:视频压缩通过减少和去除冗余视频数据的方式,达到有效发送和存储数字视频文件的目的。在压缩过程中,需要应用压缩算法对源视频进行压缩以创建压缩文件,以便进行传输和存储。要想播放压缩文件,则需要应用相反的解压缩算法对视频进行还原,还原后的视频内容与原始的源视频内容几乎完全相同。压缩、发送、解压缩和显示文件所需的时间称为延时。在相同处理能力下,压缩算法越高级,延时就越长。关键词:视频、压缩、技术、标准Principles of digital television video compression technologyInformation science and eng
2、ineering college Telecom 07-2 class Gan Linzhong School No. 3071818233Abstract:Video compression by reducing and removing redundant video data means to achieve an effective transmit and store digital video files purpose. In the compression process, the need to apply the compression algorithm to comp
3、ress the source video to create a compressed file for transmission and storage. To play compressed files, you need to apply the opposite solution to restore the video compression algorithm, the restored original source video content and video content are almost identical. Compression, transmission,
4、decompression and display the time required is called latency. Under the same processing power, the more advanced compression algorithm, the longer the delay.Keywords: video, compression, technology, standards 传 统 的 压 缩 编 码 是 建 立 在 香 农 ( Shannon) 信 息 论 基 础 上 的 , 它 以 经 典 的 集 合 论为 基 础 , 用 统 计 概 率 模 型
5、来 描 述 信 源 , 但 它 未 考 虑 信 息 接 受 者 的 主 观 特 性 及 事 件 本 身 的具 体 含 义 、 重 要 程 度 和 引 起 的 后 果 。 因 此 , 压 缩 编 码 的 发 展 历 程 实 际 上 是 以 香 农 信 息 论为 出 发 点 , 一 个 不 断 完 善 的 过 程 。 从 不 同 角 度 考 虑 , 数 据 压 缩 编 码 具 有 不 同 的 分 类 方 式 。 按 信 源 的 统 计 特 性 可 分 为 预 测 编 码 、 变 换 编 码 、 矢 量 量 化 编 码 、 子 带 小 波 编 码 、神 经 网 络 编 码 方 法 等 。 数 眼 的
6、 视 觉 特 性 可 能 基 于 方 向 滤 波 的 图 像 编 码 、 基 于 图 像 轮 廓 纹 理 的 编 码 方 法等 。 按 图 像 传 递 的 景 物 特 性 可 分 为 分 形 编 码 、 基 于 内 容 的 编 码 方 法 等 。视 频 压 缩 技 术 是 计 算 机 处 理 视 频 的 前 提 。 视 频 信 号 数 字 化 后 数 据 带 宽 很 高 , 通 常在 20MB/秒 以 上 , 因 此 计 算 机 很 难 对 之 进 行 保 存 和 处 理 。 采 用 压 缩 技 术 以 后 通 常 数 据 带宽 右 以 降 到 1-10MB/秒 , 这 样 就 可 以 将 视
7、 频 信 号 保 存 在 计 算 机 中 并 作 相 应 的 处 理 。 常 用的 算 法 是 由 ISO 制 订 的 , 即 JPEG 和 MPEG 算 法 。 JPEG 是 静 态 图 像 压 缩 标 准 , 适 用 于连 续 色 调 彩 色 或 灰 度 图 像 , 它 包 括 两 部 分 : 一 是 基 于 DPCM(空 间 线 性 预 测 )技 术 的 无失 真 编 码 , 一 是 基 于 DCT(离 散 余 弦 变 换 )和 哈 夫 曼 编 码 的 有 失 真 算 法 , 前 者 压 缩 比 很小 , 主 要 应 用 的 是 后 一 种 算 法 。 在 非 线 性 编 辑 中 最 常
8、 用 的 是 MJPEG 算 法 , 即 Motion JPEG。 它 是 将 视 频 信 号 50 帧 /秒 (PAL 制 式 )变 为 25 帧 /秒 , 然 后 按 照 25 帧 /秒 的 速 度使 用 JPEG 算 法 对 每 一 帧 压 缩 。 通 常 压 缩 倍 数 在 3.5-5 倍 时 可 以 达 到 Betacam 的 图 像质 量 。 MPEG 算 法 是 适 用 于 动 态 视 频 的 压 缩 算 法 , 它 除 了 对 单 幅 图 像 进 行 编 码 外 还 利 用图 像 序 列 中 的 相 关 原 则 , 将 冗 余 去 掉 , 这 样 可 以 大 大 提 高 视 频
9、 的 压 缩 比 。 前 MPEG-I用 于 VCD 节 目 中 , MPEG-II 用 于 VOD、 DVD 节 目 中 。数据压缩的理论基础是信息论,从信息论的角度来看,压缩就是去掉数据中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。数字图像和视频数据中存在着大量的数据冗余和主观视觉冗余,因此,图像和视频数据压缩不仅是必要的,而且也是可能的。视频数据压缩方法根据不同的依据可产生不同的分类。最常见的是根据质量有无损失可分为有失真压缩编码和无失真压缩编码。按照压缩冗余信息的机理不同,目前的图像压缩编码方法大致可以分为三类:一是,着
10、眼于图像信源的统计特征的压缩方式,主要采用统计编码法、预测编码法、变换编码法、矢量量化编码法、神经网络编码法等;二是,着眼于人眼视觉特性的压缩方式,主要采用基于方向滤波的图像编码法,基于图像轮廓-纹理的编码法;三是,着眼于图像传递的景物(内容)特征的压缩方式,主要采用基于模型的(分形)编码法。视频编解码器(编码器/解码器)是指两个协同运行的压缩-解压算法。使用不同标准的视频编解码器通常彼此之间互不兼容;也就是说,使用一种标准进行压缩的视频内容无法使用另外一种标准进行解压缩。例如,MPEG-4Part2 解码器就不能与 H.264 编码器协同运行。这是因为一种算法无法正确地对另外一个算法的输出信
11、号进行解码,然而我们可以在同一软件或硬件中使用多种不同的算法,以支持对多种格式的文件进行压缩。 由于不同的视频压缩标准会使用不同的方法来减少数据量,因此压缩结果在比特率、质量和延时方面也各不相同。 此外,由于编码器的设计者可能会选择使用某个标准所定义的不同工具集,因此,即使是使用相同压缩标准的编码器之间,其压缩结果也可能会存在差异。不过,只要编码器的输出信号符合标准的格式以及解码器的要求,就可以采用不同的实施方式。这是非常有利的,因为不同的实施方式可实现不同的目标,满足不同的预算要求。对用于管理光介质存储的非实时专业软件编码器来说,应该能够比用于视频会议的集成在手持设备中的实时硬件编码器提供质
12、量更高的编码视频。因此,即使是某个指定的标准也无法保证提供指定的比特率或质量。而且,如果不事先确定实施方式,一个标准就无法与其它标准进行正确的性能对比,甚至也无法与同一标准的其它实施方式进行正确的性能对比。 与编码器不同,解码器必须实施某个标准的所有必需部分,才能对符合标准的比特流进行解码。这是因为标准中明确规定了解压缩算法应如何对压缩视频的每个比特进行还原。压缩技术与电视有很大的关系,交织技术是最简单的压缩形式,它使带宽以 2:1 的比例降低。人的视觉系统总要用一定时间才能识别图像元素,如果在一定的刷新频率下,每帧图像的停留时间长于人眼观察所需要的时间,那么在下一帧图像的显示过程中,第一幅图
13、像仍然会残留在人的视觉印象中。这种视觉残留可以消除画面的闪烁现象,将连续的画面呈现在人们眼前。电影的帧速率为 24 帧/秒,但在显示每一帧画面的中间有一次中断,所以实际的刷新率是 48 帧/ 秒。因此对电影而言画面更新率是 24 而刷新速率是 48。电视则采用隔行扫描以获得同样的效果。电视没有采用电影的 24 帧而是采用了 25 帧与 30 帧是为了和电网频率同步降低对电源的要求。用色差信号代替 GBR 信号是另一种压缩形式,利用了人眼对色彩细节不敏感的特性。YUV(亦称 YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(PAL) 。YUV 主要用于优化彩色视频信号的传输,使其向后兼容老式
14、黑白电视。与 RGB 视频信号传输相比,它最大的优点在于只需占用极少的带宽(RGB 要求三个独立的视频信号同时传输) 。其中“Y”表示明亮度(Luminance 或 Luma) ,也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance 或 Chroma) ,作用是描述影像色彩及饱和度,用于指定像素的颜色。 “亮度”是通过 RGB 输入信号来创建的,方法是将 RGB 信号的特定部分叠加到一起。 “色度”则定义了颜色的两个方面色调与饱和度,分别用 Cr 和 CB 来表示。其中,Cr 反映了 GB 输入信号红色部分与 RGB 信号亮度值之间的差异。而 CB 反映的是 RGB 输入信号蓝
15、色部分与 RGB 信号亮度值之同的差异。PAL、NTSC、SECAM 都是压缩的形式,称为复合视频系统(CVBS?),他们在保留了黑白电视的频道结构的同时增加了色彩信号。信号的细节取决于应用的视频标准或者“制式”-NTSC(美国全国电视标准委员会,National Television Standards Committee) 、PAL(逐行倒相,Phase Alternate Line)以及 SECAM(顺序传送与存储彩色电视系统,法国采用的一种电视制式,SEquential Couleur Avec Memoire) 。NTSC 和 PAL 彩色视频信号是这样构成的-首先有一个基本的黑白视
16、频信号,然后在每个水平同步脉冲之后,加入一个颜色脉冲和一个亮度信号。因为彩色信号是由多种数据“叠加”起来的,故称之为“复合视频” 。S-Video 则是一种信号质量更高的视频接口,它取消了信号叠加的方法,可有效避免一些无谓的质量损失。它的功能是将 RGB 三原色和亮度进行分离处理。一般说来,在帧内以及帧与帧之间,众多的视频序列均包含很大的统计冗余度和主观冗余度。视频源码的最终目标是:通过挖掘统计冗余度和主观冗余度,来降低存储和传送视频信息所需的比特率;并采用嫡编码技术,以便编制出“最小信息组”一个实用的编码方案,是在编码特性(具有足够质量的高压缩)与实施复杂性之间的一种折衷。对于 MPEG 压
17、缩算法的开发来讲,涉及到这些标准的寿命周期应考虑到现代超大规模集成电路技术的能力,这一点是最重要的。根据应用的要求,我们也许会想到视频数据的“无损失”编码和“有损失”编码“无损失”编码的目的在于:在保持原图像质量(即解码后的图像质量等同于编码前的图像质量)情况下,来减少需要存储和传送的图像或视频数据。与此相反, “有损失”编码技术(该技术跟 MPEGl 和 MPEG2 视频标准未来的应用有关) 的目的是,去符合给定的存储和传送比特串。重要的一些应用包括;利用限定的带宽或很窄的带宽,通过通信频道采传送视频信息;有效地存储视频信息。在这些应用中,高的视频压缩是以降低视频质量的办法来实施的,即跟编码
18、以前的原始图像相比,解码后的图像“客观”质量有所降低(也就是取原始图像和再现图像之间的均方差,作为评定客观图像质量的标准)频道的目标比特率越低;那么视频所必须进行的压缩率就越大,通常可察觉的编码人工产物也越多。有损失编码技术的最终目的是:在指定的目标比特串条件下,获取最佳的图像标准。这里应服从“客观”或“主观”上的最佳标准。这里应该指出,图像的降级程度(指客观降低以及可察觉到的人工产物的数量)取决于压缩技术的复杂性对于结构简单的画面和视频活动少的图像来讲,就是采用简单的压缩技术,也许能获得根本不带可察觉人工产物的良好的再现图像。目 前 监 控 中 主 要 采 用 MJPEG、 MPEG1/2、
19、 MPEG4(SP/ASP)、 H.264/AVC 等 几 种 视 频编 码 技 术 。 对 于 最 终 用 户 来 言 他 最 为 关 心 的 主 要 有 : 清 晰 度 、 存 储 量 ( 带 宽 ) 、 稳 定性 还 有 价 格 。 采 用 不 同 的 压 缩 技 术 , 将 很 大 程 度 影 响 以 上 几 大 要 素 。 MJPEGMJPEG( Motion JPEG) 压 缩 技 术 , 主 要 是 基 于 静 态 视 频 压 缩 发 展 起 来 的 技 术 , 它的 主 要 特 点 是 基 本 不 考 虑 视 频 流 中 不 同 帧 之 间 的 变 化 , 只 单 独 对 某
20、一 帧 进 行 压 缩 。 MJPEG 压 缩 技 术 可 以 获 取 清 晰 度 很 高 的 视 频 图 像 , 可 以 动 态 调 整 帧 率 、 分 辨 率 。 但由 于 没 有 考 虑 到 帧 间 变 化 , 造 成 大 量 冗 余 信 息 被 重 复 存 储 , 因 此 单 帧 视 频 的 占 用 空 间 较大 , 目 前 流 行 的 MJPEG 技 术 最 好 的 也 只 能 做 到 3K 字 节 /帧 , 通 常 要 820K! MPEG-1/2MPEG-1(19881992),可以提供最高达 1.5Mbps 的数字视频,只支持逐行扫描。MPEG-1 标 准 主 要 针 对 SI
21、F 标 准 分 辨 率 (NTSC 制 为 352X240; PAL 制 为 352X288)的 图 像进 行 压 缩 . 压 缩 位 率 主 要 目 标 为 1.5Mb/s.较 MJPEG 技 术 , MPEG1 在 实 时 压 缩 、 每 帧 数据 量 、 处 理 速 度 上 有 显 著 的 提 高 。 但 MPEG1 也 有 较 多 不 利 地 方 : 存 储 容 量 还 是 过 大 、清 晰 度 不 够 高 和 网 络 传 输 困 难 。 MPEG-2(19901994),支持的带宽范围从 2Mbps 到超过 20Mbps,MPEG-2 后向兼容MPEG-1,但增加了对隔行扫描的支持,
22、并有更大的伸缩性和灵活性;M PEG-2 在 MPEG-1基 础 上 进 行 了 扩 充 和 提 升 , 和 MPEG-1 向 下 兼 容 , 主 要 针 对 存 储 媒 体 、 数 字 电 视 、 高清 晰 等 应 用 领 域 , 分 辨 率 为 : 低 (352x288), 中 (720x480), 次 高 (1440x1080), 高(1920x1080)。 MPEG-2 视 频 相 对 MPEG-1 提 升 了 分 辨 率 , 满 足 了 用 户 高 清 晰 的 要 求 , 但由 于 压 缩 性 能 没 有 多 少 提 高 , 使 得 存 储 容 量 还 是 太 大 , 也 不 适 和
23、 网 络 传 输 。 MPEG-4MPEG-4(19941998),支持逐行扫描和隔行扫描,是基于视频对象的编码标准,通过对象识别提供了空间的可伸缩性;M PEG-4 视 频 压 缩 算 法 相 对 于 MPEG-1/2 在 低 比 特 率 压缩 上 有 着 显 著 提 高 , 在 CIF( 352*288) 或 者 更 高 清 晰 度 ( 768*576) 情 况 下 的 视 频 压缩 , 无 论 从 清 晰 度 还 是 从 存 储 量 上 都 比 MPEG1 具 有 更 大 的 优 势 , 也 更 适 合 网 络 传 输 。另 外 MPEG-4 可 以 方 便 地 动 态 调 整 帧 率
24、、 比 特 率 , 以 降 低 存 储 量 。 MPEG-4 由 于 系 统 设 计 过 于 复 杂 , 使 得 MPEG-4 难 以 完 全 实 现 并 且 兼 容 , 很 难 在 视频 会 议 、 可 视 电 话 等 领 域 实 现 , 这 一 点 有 点 偏 离 原 来 地 初 衷 。 另 外 对 于 中 国 企 业 来说 还 要 面 临 高 昂 的 专 利 费 问 题 , 目 前 规 定 : 每 台 解 码 设 备 需 要 交 给 MPEG-LA 0.25 美 元 。 编 码 /解 码 设 备 还 需 要 按 时 间 交 费 ( 4 美 分 /天 =1.2 美 元 /月 =14.4 美
25、 元 /年 ) 。H.264/AVC视 频 压 缩 国 际 标 准 主 要 有 由 ITU-T 制 定 的 H.261、 H.262、 H.263、 H.264 和 由MPEG 制 定 的 MPEG-1、 MPEG-2、 MPEG-4, 其 中 H.262/MPEG-2 和 H.264/MPEG-4 AVC 由ITU-T 与 MPEG 联 合 制 定 。 从 简 单 来 说 H.264 就 是 一 种 视 频 编 码 技 术 , 与 微 软 的 WMV9 都 属 于 同 一 种 技 术 也就 是 压 缩 动 态 图 像 数 据 的 “编 解 码 器 ”程 序 。 一 般 来 说 , 如 果 动
26、 态 图 像 数 据 未 经 压 缩 就 使 用 的 话 , 数 据 量 非 常 大 , 容 易 造 成通 信 线 路 故 障 及 数 据 存 储 容 量 紧 张 。 因 此 , 在 发 送 动 态 图 像 时 、 或 者 把 影 像 内 容 保 存在 DVD 上 时 、 以 及 使 用 存 储 介 质 容 量 较 小 的 数 码 相 机 或 相 机 手 机 拍 摄 映 像 时 , 就 必 须使 用 编 解 码 器 。 虽 然 编 解 码 器 有 许 多 种 类 , 但 DVD-Video 与 微 波 数 字 电 视 等 使 用 的 主要 是 MPEG2, 数 码 相 机 等 摄 像 时 主
27、要 使 用 MPEG4。 既 然 作 为 压 缩 视 频 编 码 技 术 , H.264 最 大 的 作 用 对 视 频 的 压 缩 了 。 我 们 熟 悉 的MPEG2 也 就 是 最 常 用 的 DVD 视 频 编 码 技 术 已 经 比 较 落 后 。 对 于 最 希 望 看 到 的 HDTV 的 节 目 如 果 播 放 时 间 在 2 小 时 左 右 的 话 , 使 用 MPEG2 最小 只 能 压 缩 至 30GB, 而 使 用 H.264、 WMV9 这 样 的 高 压 缩 率 编 解 码 器 , 在 画 质 丝 毫 不降 的 前 提 下 可 压 缩 到 15GB 以 下 。 上
28、面 的 例 子 可 以 看 出 H.264 的 技 术 优 势 了 , 一 般 来 说 H.264 的 数 据 压 缩 率 在MPEG2 的 2 倍 以 上 、 MPEG4 的 1.5 倍 以 上 。 从 理 论 上 来 说 , 在 相 同 画 质 、 相 同 容 量 的 情况 下 , 可 比 目 前 的 DVD 光 盘 多 保 存 2 倍 以 上 时 间 的 影 像 。 有 望 作 为 电 影 与 音 乐 会 等 映像 内 容 与 便 携 设 备 的 编 解 码 器 广 泛 使 用 。 预 计 支 持 该 技 术 的 产 品 与 服 务 将 于 2004 年内 问 世 。 大 家 是 否 都
29、 能 记 得 当 年 的 视 频 解 压 卡 , 也 就 是 我 们 说 的 DVD/VCD 解 压 缩 卡 , 这 个东 西 的 原 理 很 简 单 , 就 是 板 卡 上 安 装 了 DSP 芯 片 , 而 这 个 芯 片 唯 一 的 功 能 就 是 用 来 针对 特 殊 格 式 的 编 码 进 行 解 压 缩 , 当 后 来 显 卡 的 性 能 逐 渐 增 强 可 以 满 足 视 频 播 放 需 要 的时 候 , 视 频 解 压 缩 卡 也 就 消 失 的 不 见 了 。 而 ATI 的 做 法 就 是 最 新 的 R520 VPU 内 就 包 含 了 H.264 解 码 技 术 , 这
30、 种 特 殊 的 算法 直 接 交 给 显 卡 VPU 来 运 算 , 而 不 是 完 全 交 给 CPU 处 理 , 这 样 就 可 以 解 放 出 CPU 进行 更 多 其 他 复 杂 的 运 算 。 H.264 集 中 了 以 往 标 准 的 优 点 , 在 许 多 领 域 都 得 到 突 破 性 进 展 , 使 得 它 获 得 比 以 往标 准 好 得 多 整 体 性 能 : 和 H.263+和 MPEG-4 SP 相 比 最 多 可 节 省 50 的 码 率 , 使 存 储 容 量 大 大 降 低 ; H.264 在 不 同 分 辨 率 、 不 同 码 率 下 都 能 提 供 较 高
31、 的 视 频 质 量 ; 采 用 “网 络 友 善 ”的 结 构 和 语 法 , 使 其 更 有 利 于 网 络 传 输 。 H.264 采 用 简 洁 设 计 ,使 它 比 MPEG4 更 容 易 推 广 , 更 容 易 在 视 频 会 议 、 视 频 电 话中 实 现 , 更 容 易 实 现 互 连 互 通 , 可 以 简 便 地 和 G.729 等 低 比 特 率 语 音 压 缩 组 成 一 个 完整 的 系 统 。 MPEG LA 吸 收 MPEG-4 的 高 昂 专 利 费 而 使 它 难 以 推 广 的 教 训 , MPEG LA 制 定 了 以 下低 廉 的 H.264 收 费
32、标 准 : H.264 广 播 时 基 本 不 收 费 ; 产 品 中 嵌 入 H.264 编 /解 码 器 时 ,年 产 量 10 万 台 以 下 不 收 取 费 , 超 过 10 万 台 每 台 收 取 0.2 美 元 , 超 过 500 万 台 每 台收 取 0.1 美 元 。 低 廉 的 专 利 费 使 得 中 国 H.264 监 控 产 品 更 容 易 走 向 世 界 。参考文献1. 卢官明,宗昉数字电视原理M 北京:机械工业出版社, 20082. 姜秀华,柴剑平,等现代电视原理M 北京:高等教育出版社, 2008.3. 刘毓敏,等数字视音频技术应用M 北京:机械出版社, 2003.4. http:/ http:/ http:/ http:/