1、H.264 可扩展视频编解码器应用详解http:/ 2009 年 9 月 27 日 13:42 DVBCN 数字电视中文网 编解码器被用于压缩视频,以减小传输视频流所需要的带宽,或者,降低把视频文件存档所需要的存储空间。这种压缩的代价就是增大计算要求:压缩比越高,对计算能力的要求就越高。在带宽与计算要求之间做出折中,对于定义承载编码视频流所需要的最小信道带宽以及编码设备的最小指标均有影响。在传统的像广播电视机这样的视频系统中,解码器的最小规范(在机顶盒的情形下)易于被定义。然而,目前视频被越来越多地由各种各样的应用所采用,相应地,有各种各样的客户设备,这些设备包括从计算机观看互联网视频,到便携
2、式数字助理(PDA)以及小巧的蜂窝电话。针对这些设备的视频流必需是不同的。为了更好地兼容特定的观看设备以及信道带宽,必须采用不同的设置对视频流多次编码。每一个设置的组合必须向用户产生一个满足视频流传输所需带宽的视频流以及对观看设备进行解码的能力。如果原始解压视频流不可用,那么,编码视频流必须首先被解码,然后采用新的设置进行解码。这种做法是十分昂贵的。在理想的情形下,视频仅仅以高效率的编解码器被编码一次。如果经过解码的话,得到的视频流会产生全分辨率的视频。此外,在理想的情形下,如果较低分辨率或带宽的视频流需要被进一步延伸至网络之中,以锁定较低性能的设备,那么,可以不必采取附加的处理,就能够发送一
3、小部分的编码视频。这种较小的视频流便于解码并产生较低分辨率的视频。以这种方式,编码视频流自身就能够适应它需要经过的信道带宽以及目标设备的性能。这些就是可扩展视频编解码器的品质所在。H.264 可扩展视频编解码器扩展至 H.264 的可扩展视频编解码器(H.264SVC),被设计来传递上述理想情形的各种好处。它以 H.264 先进视频编解码器标准(H.264AVC)为基础,并高度利用了原始编解码器的各种工具以及概念。然而,它产生的编码视频是空间上临时可扩展的,并且是在视频质量方面可扩展的。也就是说,它能够产生不同帧速率、分辨率或质量等级的解码视频。SVC 扩展引入了一种原始 H.264AVC 编
4、解码器在编码视频内的各层不存在的概念。基础层对视频流的最低临时、空间和品质表现进行编码。增强各层利用基础层作为起点,对附加信息进行编码,从而在解码过程中把编码结果用于重构高质量、高分辨率或;临时的视频版本。通过对基本层以及仅仅是所需要的后来增强层进行解码,解码器能够以所希望的特征产生一种视频流。图 1 所示为 H.264SVC 流的分层结构。在编码的过程中,要利用仅仅对较低级各层的参考,小心地解码一个特殊层。以这种方式,编码流可以在任意点被删节,但是,仍然维持有效的、可解码的视频流。这种分层方法让所生成的一个编码流能够被删节以限制所消耗的带宽或者降低解码计算的要求。删节过程完全通过从编码视频流
5、提取所需要的各层而构成。这个过程甚至能够在网络中执行。也就是说,随着视频流从高带宽转换为较低带宽的网络(例如,通过 WiFi 链路从以太网转换至手持),要针对可用的带宽调节视频流的大小。在上述例子中,要针对无线链路的带宽调节视频流的大小以及手持解码器的解码能力。图 2 显示了个人电脑把低带宽的视频流转为为移动设备视频流的例子。H.264SVC 揭秘为了实现临时的可扩展性,H.264SVC 链接其参考帧以及预测帧,这与传统的 H.264AVC编码器稍微不同。SVC 采用分层预测结构,如图 3 所示,而不是传统的内帧(I 帧)、双向帧(B 帧)以及预测帧(P 帧)的关系。分层结构定义最终视频流的临
6、时分层。图 4 描述了可能的分层结构。在这个特殊的例子中,各帧仅仅根据上次出现的各帧进行预测。这就确保该结构不仅仅展示临时的可扩展性,而且显示了低的延迟。这个方案具有四个嵌套的临时层:T0(基础层)、T1、T2 和 T3。由 T1 和 T2 各层构成的帧仅仅由 T0 层中的各帧预测。在 T3 层中的各帧仅仅由 T1 或 T2 各层中的各帧来预测。为了以 3.75 帧每秒的速度播放编码帧,仅仅构成 T0 的各帧需要被解码。所有的其它各帧可以被丢弃。为了以 7.5fps 的速度播放,要对构成 T0 以及 T1 的各层进行解码。在T2 和 T3 中的各帧被丢弃。类似地,如果构成 T0、T1 和 T2
7、 的各帧被解码,所得到的视频流将以 15fps 的速度播放。如果所有帧均被解码,那么,完全的 30fps 视频流被恢复。相比之下,在 H.264SVC(对于 BaselineProfile 来说,仅仅双向预测帧被应用)中,不管需要的显示率是什么,所有帧均需被解码。为了转换至一个低带宽网络,整个视频流均需要被解码,不需要的帧可以被丢弃,然后,重新编码。在 H.264SVC 中的空间可扩展性遵循类似的原则。在这一情形下,较低分辨率的各帧被编码为基础帧。经解码和上行采样的基础帧被用于对较高阶各层进行预测。重构原始场景细节所需要的附加信息被编码为一个独立的增强层。在某些情形下,重用运动信息能够进一步增
8、加编码效率。同时联播与 SVC在 H.264SVC 中存在于可扩展性相关的开销。正如我们在图 3 中所看到的那样,参考帧与预测帧之间的距离在时间(例如从 T0 至 T1)上比传统的帧结构要长。在具有高运动图像的场景中,这能够导致效率稍低的压缩。为了对视频流各层级结构进行管理,也存在相关的开销。整体而言,跟不具备可扩展性的全分辨率以及全帧速率视频构成的 H.264 视频流相比,具有三层临时可扩展性以及三层空间可扩展性的 SVC 视频可能要大 20%以上。如果采用H.264 编解码器对可扩展性进行仿真,就需要多个编码视频流,从而导致更高的带宽要求或贯穿网络的昂贵解码和二次编码。SVC 的额外好处:误码恢复误码恢复的传统实现方法是把附加的信息添加至视频流之中,以便监测和校正误码。SVC 的分层方法意味着不需要增加大的开销,就可以在较小的基本层上执行高级别的误码监测和校正。如果要把相同程度的误码监测和校正功能应用于 AVC 视频流中,那就需要把整个视频流保护起来,从而导致视频流更大。如果在 SVC 视频流中监测出误码,那么,就可以逐渐让分辨率和帧速率退化,直至如果需要的话只有高度受保护的基础层才可以使用。按照这一方式,在噪声条件下的退化要比在 H.264AVC 环境下更让人可以接受。