数字视频信号源的编码器和解码器的设计.doc-道客多多

资源描述

1、 1 数字电视的优点和发展概况1.1数字电视的优点(1) 清晰度高、音频效果好、抗干扰能力强。数字电视信号在传输过程中不会出现噪声积累效应，几乎完全不受噪声干扰，电视信号的强度衰减与失真度很低，电视画面十分逼近演播室水平。数字电视的音频效果很好，支持五声道的杜比数码（AC-3）5.1环绕立体声家庭影院服务； (2) 数字频道数成倍增加。基于现有模拟电视频道，可同时传输6-8套DVD质量或15-18套VCD质量的数字电视节目。如全部采用数字电视技术传输，可同时传送大约200套DVD质量或500多套VCD质量的电视节目。电视频道资源利用率高，可完全满足用户自由收看电视节目的个性化要求； (3) 数

2、字业务功能极大拓展。随着有线电视传输和用户接收的数字化，以前模拟方式无法提供的服务都将成为可能，如电视网站、交互电视、股票行情与分析、视频点播等，电视互动数字新业务的开展将变得更加容易； (4) 数字电视信号容易加密，保密性好，便于采用现代数字信号处理。总之，数字电视替代模拟电视的趋势是现代科技发展的必然结果。1.2数字电视机的发展随着经济和社会的发展进步，广播电视的受众需求日益高涨和多元化，点对面单一模式的模拟电视已经无法满足人民群众日益增长的精神和文化需求。模拟电视改为数字电视信号播送，不但能为电视用户提供全业务、多层次的高清晰度的数字电视信号，满足当今不同领域、不同阶层、不同家庭与个体用

3、户不同的精神文化的固定与移动、单向与交互的多元化、个性化服务，同时也为广播电视市场提供新的发展契机。接收数字电视信号的数字电视用户必须更换购买数字电视或购置与原有电视机配用的接收数字电视信号的机顶盒解码器。数字电视在欧美地区已应用多年，技术上非常成熟，在国家863计划支持下，我国在积极参与MPEG/JVT国际标准制定的基础上，提出并完成了具有我国自主知识产权的数字音视频编解码技术AVS。AVS是我国自主创新所构建的自主标准，可在一定程度上规避专利费，数字电视是一个信息化系统工程，从电视节目的采集、制作到信号的发射、传输以及最终接收的全过程全部采用数字化，是整个广播电视事业链条的一次大变革。数字

4、电视节目内容的广播传送采用数字信息传输网络，数字节目的接收是提供端到端的数字电视内容的一个过程。因此，数字电视的信息提供端和传输网络都将面临全面的建设和设备更新，信息网络建设的需求将稳定增加，这是一项涉及万户千家的数字信息化系统工程。数字电视与因特网结合，将各家各户与因特网连接到一起，大大加快了社会信息化进程2 数字视频压缩编码视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像，因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处，但是运动的视频还有其自身的特性，因此在压缩时还应考虑其运动特性才能达到高压

5、缩的目标。目前有多种视频压缩编码方法，但其中最有代表性的是MPEG数字视频格式和AVI数字视频格式。2.1数据压缩编码的分类(1) 有损压缩编码方式：有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息，而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩，这样才能达到低数据率的目标。丢失的数据率与压缩比有关，压缩比越小，丢失的数据越多，解压缩后的效果一般越差。此外，某些有损压缩算法采用多次重复压缩的方式，这样还会引起额外的数据丢失。(2) 无损压缩编码方式：无损压缩也即压缩前和解压缩后的数据完全一致，多数的无损压缩都采用RLE行程

6、编码算法。2.2数字视频压缩编码的标准常用名称制定机构发布日期标准编号标题典型应用领域H261ITU-T1990年ITU-T H261运动图像编码标准可视电话和会议电视，窄宽ISDNMPEG-1ISO/IEC1991年ISO/IEC 11172运动图像和伴音的通用编码第2部分视频VCD等JPECISO/IEC1992年ITU-TT.81ISO/IEC 10918静止图像编码数码相机、图像库等MPEG-2ISO/IECITU-T1994年ITU-T H262ISO/IEC 13818-2运动图像和伴音的通用编码第2部分视频数字电视传输等H.263ITU-T1995年ITU-T H263运动图像编

7、码标准多媒体通信等MPEG-4ISO/IEC2000年ISO/IEC 14496-2基于对象的视/音频编码第2部分视频网络/视音频等JPEG2000ISO/IEC2000年ISO/IEC 15444-3静止图像编码图像库、数字电影等H.264/AVCMPEG-4-10ITU-TISO/IEC2003年ITU-T Rec.H.264ISO/IEC 14496-10高级视频编码数字电视、多媒体通信等VC-1SMPTE2006年SMPTE421M电视压缩视频格式和解码处理数字电视等AVS中国国家标委会2006年GB/T20090-2006先进视/音频编码第2部分视频数字电视、网络视频等表1.数字视频

8、压缩编码标准3 MPEG -2概述MPEG-2制定于1994年，设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486，MPEG-2也可提供并能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道，和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理，使得大多数MPEG-2解码器也可播放MPEG-1格式的数据，如VCD。同时，由于MPEG-2的出色性能表现，已能适用于HDTV，使得原打算为HDTV设计的MPEG

9、-3，还没出世就被抛弃了。(MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间，但这将使画面有轻度扭曲)。除了做为DVD的指定标准外，MPEG-2还可用于为广播，有线电视网，电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。MPEG-2的另一特点是，其可提供一个较广的范围改变压缩比，以适应不同画面质量，存储容量，以及带宽的要求。对于最终用户来说，由于现存电视机分辨率限制，MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显，到是其音频特性(如加重低音，多伴音声道等)更引人注目。3.1系统的定义MPEG-2系

10、统是将视频、音频及其它数据基本流组合成一个或多个适宜于存储或传输的数据流的规范，如图1所示。由图2可见，符合ITU-R. 601标准的、帧次序为I1B2B3P4B5B6P7B8B9I10数字视频数据和符合AES/EBU标准的数字音频数据分别通过图像编码和声音编码之后，生成次序为I1P4B2B3 P7B5B6I10 B8B9视频基本流（ES）和音频ES。在视频ES中还要加入一个时间基准，即加入从视频信号中取出的27MHz时钟。然后，再分别通过各自的数据包形成器，将相应的ES打包成打包基本流（PES）包，并由PES包构成PES。最后，节目复用器和传输复用器分别将视频PES和音频PES组合成相应的节

11、目流（PS）包和传输流（TS）包，并由PS包构成PS和由TS包构成TS。显然，不允许直接传输PES，只允许传输PS和TS；PES只是PS转换为TS或TS转换为PS的中间步骤或桥梁，是MPEG数据流互换的逻辑结构，本身不能参与交换和互操作。由系统的定义，可知MPEG-2系统的任务。系统的要点是根据数字通信信息量可以逐段传输的机理，将已编码数据流在时间上以一定重复周期结构分割成不能再细分的最小信息单元，这个最小信息单元就定义为数据包，几个小数据包（Data Packet）又可以打包成大数据包（Data Pack）。用数据包传输的优点是：网络中信息可占用不同的连接线路和简单暂存；通过数据包交织将多个

12、数据流组合（复用）成一个新的数据流；便于解码器按照相应顺序对数据包进行灵活地整理。从而，数据包为数据流同步和复用奠定了基础。因此，MPEG-2系统规范不仅采用了PS、TS和PES三种数据包，而且也涉及PS和TS两种可以互相转换的数据流。显然，以数据包形式存储和传送数据流是MPEG-2系统的要点。为此，MPEG-2系统规范定义了三种数据包及两种数据流。图2.MPEG-2系统框图3.2 MPEG-2的型和级MPEG-2按照不同的型和不同的级的组合，有20种组合方式，但是在实际应用中只有其中的11种组合可以应用。MPEG-2型和级的定义及其组合如图表3所示，表中越是右上方的编码档次越高，MPEG-

13、2标准规定，凡是能解码某一组合点上比特流的解码器，必须能解码其左方和下方组合点上的比特流，这是MPEG-2标准所要求的解码兼容性能。型profile级level 简单型SP 主型MP 信杂比可级SNRP 空间可分级SSP 高型HP高级（HL）19201080301920108025 MPHLHPHL全部层底层高1440级（H1440L）14401080301440108025 MPH1440LSSPH1440L全部层底层HPH1440L全部层底层主级（ML）7204803072057625 SPML(无B帧)MPMLSNPML全部层底层HPML全部层底层低级（LL）3522483035224

14、825 MPLLSNPLL全部层底层图表3.MPEG-2的型和级3.3 MPEG-2的编码码流分为六个层次从上至下依次为：视频序列层(Sequence)，图像组层(GOP：GroupofPicture)，图像层(Picture)，像条层(Slice)，宏块层(MacroBlock)和像块层(Block)。除宏块层和像块层外，上面四层中都有相应的起始码(SC：StartCode)，可用于因误码或其它原因收发两端失步时，解码器重新捕捉同步。因此一次失步将至少丢失一个像条的数据。 (1) 序列指构成某路节目的图像序列，序列起始码后的序列头中包含了图像尺寸，宽高比，图像速率等信息。 (2) 序列层下是

15、图像组层，一个图像组由相互间有预测和生成关系的一组I、P、B图像构成，但头一帧图像总是I帧。GOP头中包含了时间信息。 (3) 图像组层下是图像层，分为I、P、B三类。PIC头中包含了图像编码的类型和时间参考信息。 (4) 图像层下是像条层，一个像条包括一定数量的宏块，其顺序与扫描顺序一致。MPML中一个像条必须在同一宏块行内。 (5) 像条层下是宏块层。MPEG-2中定义了三种宏块结构：4:2:0宏块4:2:2宏块和4:4:4宏块，分别代表构成一个宏块的亮度像块和色差像块的数量关系。(6) 宏块层之下是像块层，像块是MPEG-2码流的最底层，是DCT变换的基本单元。MPML中一个像块由8x8

16、个抽样值构成，同一像块内的抽样值必须全部是Y信号样值，或全部是Cb信号样值，或全部是Cr信号样值。另外，像块也用于表示8x8个抽样值经DCT变换后所生成的8x8个DCT系数。3.4 MPEG-2编码器原理图4.MPEG-2压缩编码原理框图MPEG-2图像压缩的原理是利用了图像中的两种特性：空间相关性和时间相关性。一帧图像内的任何一个场景都是由若干像素点构成的，因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系，这种关系叫作空间相关性；一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成，一个图像序列中前后帧图像间也存在一定的关系，这种关系叫作时间相关性。这两种相关性使得图像中

17、存在大量的冗余信息。如果我们能将这些冗余信息去除，只保留少量非相关信息进行传输，就可以大大节省传输频带。而接收机利用这些非相关信息，按照一定的解码算法，可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。(1) MPEG-2中编码图像被分为三类，分别称为I帧，P帧和B帧 I帧图像采用帧内编码图（ICP）利用了单帧图像内的空间相关性，而没有利用时间相关性。I帧主要用于接收机的初始化和信道的获取，以及节目的切换和插入，I帧图像的压缩倍数相对较低。I帧图像是周期性出现在图像序列中的，出现频率可由编码。器选择特点是：数据量最大；帧内中等程度压缩；无

18、运动预测，可采用自相关性，即帧内相邻像素、相邻行的亮度、色度信号都具有渐变的空间相关性，可作静止图像处理，无条件传送；图像可随机进入压缩图像数据序列，进行编码。 P帧图像采用前向预测编码图（PCP）P帧图像采用前向时间预测，可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分，即P帧中的每一个宏块可以是前向预测，也可以是帧内编码。P图的特点是：本身是前I图或P图的前向预测（FP-Forward Prediction）结果，也是产生下一个P图的基准图像；高编码效率，与I图相较，可提供更大的压缩比；前一个P图是下一个P图补偿预测的基准，如果前者存在误码，则后者会将编码误差积累起来、传播下去

19、。 B帧图像采用双向预测编码图目前对B图有两种趋同的理解：其一，B图是同时以前面的I图或P图和后面的P图或I图为基准进行运动补偿预测所产生的图像，称为双向预测编码图。其二，由于帧序列相邻帧画面间的运动部分具有连续到时间相关性，可将当前画面看成是前一画面某一时刻图像的位移，当然位移方向及幅值在帧内各处未必相同，只要用前面最近时刻的I图或P图及代表运动的位移信息，便可预测出当前图像，称为前向预测（FP）。值得注意的是，由于B帧图像采用了未来帧作为参考，因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。4 数字视频压缩解码4.1 MPEG-2解码图5.MPEG-2解码框图由图5可见，接受

20、到的码流经过TS流解复用和视/音频PES包解复用后输出视频基本流(ES)和运动矢量(MV)。ES经饭量化(IQ)和反DCT(IDCT)后输出重建的宏块差值MB。解码框图中没有复杂的运动估计电路，它直接用码流中传输来的运动矢量(MV)进行运动补偿，从帧储存器中读出匹配宏块MB0，在加法器中与宏块差值MB相加，还原出相应的P、B图像块。在帧重排内得到一组GOP解码图像后，重排成编码时输入显示图像的原始序列。由于编码器中都有帧重排，结果使显示图像比原始图像产生一定的延时，相对于声音编码会导致画面滞后于声音，故需相应的延时补偿。MPEG-2中编码与解码电路不是一一对应的，编码复杂，解码简单。因为解码所

21、需的许多参数如运动预测值和量化矩阵等都在传输码流中以规定的句法元素格式提供给接收端，由解码器直接使用就可以。因此，不同厂家的设计人员可以设计制造各具特点的编解码器，它们可能各有差异，然而，任一个解码器应该对任何编码器给出的码流都能正确地解码。4.2 MPEG-2视频压缩方案中包含以下关键技术环节(1) 余弦变换DCT DCT是一种空间变换，在MPEG-2中DCT以8x8的像块为单位进行，生成的是8x8的DCT系数数据块。DCT变换的最大特点是对于一般的图像都能够将像块的能量集中于少数低频DCT系数上，即生成8x8DCT系数块中，仅左上角的少量低频系数数值较大，其余系数的数值很小，这样就可能只编

22、码和传输少数系数而不严重影响图像质量。 (2) 量化器量化是针对DCT变换系数进行的，量化过程就是以某个量化步长去除DCT系数。量化步长的大小称为量化精度，量化步长越小，量化精度就越细，包含的信息越多，但所需的传输频带越高。不同的DCT变换系数对人类视觉感应的重要性是不同的，因此编码器根据视觉感应准则，对一个8x8的DCT变换块中的64个DCT变换系数采用不同的量化精度，以保证尽可能多地包含特定的DCT空间频率信息，又使量化精度不超过需要。DCT变换系数中，低频系数对视觉感应的重要性较高，因此分配的量化精度较细；高频系数对视觉感应的重要性较低，分配的量化精度较粗，通常情况下，一个DCT变换块

23、中的大多数高频系数量化后都会变为零。 (3) 之型扫描与游程编码 DCT变换产生的是一8x8的二维数组，为进行传输，还须将其转换为一维排列方式。有两种二维到一维的转换方式，或称扫描方式：之型扫描(Zig-Zag)和交替扫描，其中之型扫描是最常用的一种。由于经量化后，大多数非零DCT系数集中于8x8二维矩阵的左上角，即低频分量区，之型扫描后，这些非零DCT系数就集中于一维排列数组的前部，后面跟着长串的量化为零的DCT系数，这些就为游程编码创造了条件。游程编码中，只有非零系数被编码。一个非零系数的编码由两部分组成：前一部分表示非零系数前的连续零系数的数量(称为游程)，后一部分是那个非零系数。这样

24、就把之型扫描的优点体现出来了，因为之型扫描在大多数情况下出现连零的机会比较多，游程编码的效率就比较高。当一维序列中的后部剩余的DCT系数都为零时，只要用一个“块结束”标志(EOB)来指示，就可结束这一8x8变换块的编码，产生的压缩效果是非常明显的。 (4) 熵编码量化仅生成了DCT系数的一种有效的离散表示，实际传输前，还须对其进行比特流编码，产生用于传输的数字比特流。简单的编码方法是采用定长码，即每个量化值以同样数目的比特表示，但这种方法的效率较低。而采用熵编码可以提高编码效率。熵编码是基于编码信号的统计特性，使得平均比特率下降。游程和非零系数既可独立的，也可联合的作熵编码。熵编码中使用较多的

25、一种是霍夫曼编码，MPEG-2视频压缩系统中采用的就是霍夫曼编码。霍夫曼编码中，在确定了所有编码信号的概率后生产一个码表，对经常发生的大概率信号分配较少的比特表示，对不常发生的小概率信号分配较多的比特表示，使得整个码流的平均长度趋于最短。 (5) 信道缓存由于采用了熵编码，产生的比特流的速率是变化的，随着视频图像的统计特性变化。但大多数情况下传输系统分配的频带都是恒定的，因此在编码比特流进入信道前需设置信道缓存。信道缓存是一缓存器，以变比特率从熵编码器向里写入数据，以传输系统标称的恒定比特率向外读出，送入信道。缓存器的大小，或称容量是设定好的，但编码器的瞬时输出比特率常明显高于或低于传输系统

26、的频带，这就有可能造成缓存器的上溢出或下溢出。因此缓存器须带有控制机制，通过反馈控制压缩算法，调整编码器的比特率，使得缓存器的写入数据速率与读出数据速率趋于平衡。缓存器对压缩算法的控制是通过控制量化器的量化步长实现的，当编码器的瞬时输出速率过高，缓存器将要上溢时，就使量化步长增大以降低编码数据速率，当然也相应增大了图像的损失；当编码器的瞬时输出速率过低，缓存器将要下溢出时，就使量化步长减小以提高编码数据速率。 (6) 运动估计运努估计使用于帧间编码方式时，通过参考帧图像产生对被压缩图像的估计。运动估计的准确程度对帧间编码的压缩效果非常重要。如果估计作的好，那么被压缩图像与估计图像相减后只留下

27、很小的值用于传输。运动估计以宏块为单位进行，计算被压缩图像与参考图像的对应位置上的宏块间的位置偏移。这种位置偏移是以运动矢量来描述的，一个运动矢量代表水平和垂直两个方向上的位移。运动估计时，P帧和B帧图像所使用的参考帧图像是不同的。P帧图像使用前面最近解码的I帧或P帧作参考图像，称为前向预测；而B帧图像使用两帧图像作为预测参考，称为双向预测，其中一个参考帧在显示顺序上先于编码帧(前向预测)，另一帧在显示顺序上晚于编码帧(后向预测)，B帧的参考帧在任何情况下都是I帧或P帧。 (7) 运动补偿利用运动估计算出的运动矢量，将参考帧图像中的宏块移至水平和垂直方向上的相对应位置，即可生成对被压缩图像的

28、预测。在绝大多数的自然场景中运动都是有序的。因此这种运动补偿生成的预测图像与被压缩图像的差分值是很小的。4.3声音图像要同步显示由于时分多路复用中的位时隙、路时隙、帧之间具有严格的时间关系，这就是同步。区分各路信号以此为据。为了恢复节目，先对ES进行解码。声音、图像信号的重现需要同步显示，从而要求收发两端数据流要达到同步。为此，MPEG-2系统规范通过在数据中插入时间标志来实现：SCR或PCR为重建系统时间基准的绝对时标；在有效PS和TS产生前，已插入PES的DTS和PTS为解码和重现时刻的相对时标。4.4 数字图像质量的主观评价主观评价的条件包括：评价小组结构，观察距离，测试图像，环境照度

29、和背景色调等。评价小组由一定人数观察人员构成，其中专业人员与非专业人员各占一定比例。观察距离为显示器对角线尺寸的3-6倍。测试图像有若干具有一定图像细节和运动的图像序列构成。主观评价反映的是许多人对图像质量统计评价的平均值。总结本次课程设计让我对现代电视机原理有了更进一步的熟悉，主要了解了数字电视的优点和发展概况，掌握数字电视的基本组成。熟悉视频压缩编码的各种方法，掌握MPEG-2编码器原理和视频压缩解码原理。实际操作和课本上的知识有很大联系，但又高于课本，应该把课本上所学到的知识和实际联系起来。通过课程设计，不但巩固了所学知识，也使我们把理论与实践从真正意义上结合起来，增强了学习的兴趣，考

30、验了我们借助互联网络搜集、查阅相关文献资料，和组织材料的综合能力。致谢通过本次课程设计，我学到了很多新的知识，让我了解到理论和实践是分不开的，同时也发现了自己的不足。在设计过程中，老师在百忙中对我的设计进行了指导。老师首先细致地为我解题；当我迷茫于众多的资料时，他又为我提纲挈领、梳理脉络，使我确立了本文的框架。感谢老师对我的课程设计不厌其烦的细心指点。我才能更快更准确地完成。在以后的学习中，只有把所学的理论知识与实践相结合起来，从理论中得出结论，从而提高自己的实际动手能力和独立思考的能力。而且我还从老师那里学到了严谨、务实、认真的工作态度和极强的敬业精神。我再次为老师的耐心付出表示感谢。参考文献 1. 蒋秀华.现代电视机原理M. 北京高等教育出版社，2008. 2. 裴昌辛.电视原理与现代电视系统M. 西安.西安电子科技大学出版社，1997. 3. 赵坚勇.电视原理与接收技术M. 北京：国防工业出版社，2007 4. 刘达.数字电视技术M. 北京：电子工业出版社，2007 5. 解玉琢.MPEG-2运动图像编码国家标准及MPEG的新进展M. 北京：清华大学出版社，2002

展开阅读全文