多媒体技术原理及应用(第二版马华东).doc-道客多多

资源描述

1、简答题1.什么是媒体？信息的载体。可以分为视觉类媒体,听觉类媒体, 触觉类媒体,活动媒体,抽象事实媒体。2.什么是多媒体信息？文本图形和图像音频动画和视频3.什么是多媒体技术?利用计算机技术把文本、图像、图形、动画、音频及视频等多种媒体综合一体化，使之建立起逻辑上的联系，并能够对它们获取，编码，编辑，处理，存储，传输和再现。4.它有什么特点？多样性：信息媒体的多样性，即能综合处理文本、图形、图像、动画、音频及视频等多种信息。交互性:指用户可以与计算机的多种信息媒体进行交互操作，从而为用户提供更加有效地控制和使用信息的手段。集成性: 集成性是指以计算机为中心综合处理多种媒体，它包括信息媒体的集成

2、和这些媒体设备的集成。实时性:多媒体系统对声音和视频等时基媒体提供实时处理的能力。第五章思考练习题参考答案1.自适应脉冲编码调制（APCM）和差分脉冲编码调制（DPCM）的基本思想是什么？答：APCM：根据输入信号幅度大小改变量化阶大小的一种波形编码技术。DPCM：对预测的样本值与原始的样本值之间的差值进行编码。2.对信源Xx1=0.25,x2=0.25,x3=0.2,x4=0.15,x5=0.10,x6=0.05进行 Huffman 编码答：(1) 将信源符号按概率递减顺序排列 ;(2) 把两个最小的概率加起来 , 作为新符号的概率 ;(3) 重复步骤 (1) 、 (2), 直到概率和达到

3、 1 为止 ;(4) 在每次合并消息时，将被合并的消息赋以 1 和 0 或 0 和 1；(5) 寻找从每个信源符号到概率为 1 处的路径，记录下路径上的 1 和 0；(6) 对每个符号写出“1“、“0“序列（从码数的根到终节点）。3.已知信源 Xx1=1/4,x2=3/4,若 x1=1,x2=0,试对 1011 进行算术编码。答：由题意知：编码的数据串为 x1x2x1x1。令 high 为编码间隔的高端 ,low 为编码间隔的低端 , range 为编码间隔的长度 ,rangelow 为编码字符分配的间隔低端 ,rangehigh 为编码字符分配的间隔高端。则得出范围：字符 x1 x2概率 1

4、/4 3/4范围 0,1/4) 1/4,1)初始 high=1,low=0,rangehigh-low=1, 一个字符编码后新的 low 和 high 按下式计算 :low =lowrange rangelowhigh =lowrangerangehigh(1) 在第一个字符 x1 被编码时,range=1 ,x1 的 rangelow0,rangehigh=1/4, 因此 :low0 + 1 0 0high=0 + 1 1/4 1/4range=highlow=1/40=1/4此时分配给 x1 的范围为 0,1/4 。(2)第二个字符 x2 编码时使用新生成范围 0,1/4,range=1/

5、4,x2 的 rangelow=1/4, rangehigh=1, 因此：low=0 十 1/41/4=1/16high=0 + 1/41=1/4range=3/16范围变成 1/16,1/4 。(3) 对下一个字符 x1 编号,x1 的 rangelow=0,rangehigh=1/4, 则：low=1/16 3/160=1/16high=1/16 3/161/4=7/64range=3/64范围变成 1/16,7/64(3) 对最后一个字符 x1 编号,x1 的 rangelow=0,rangehigh=1/4, 则：low=1/16 3/640=1/16high=1/16 3/641/4

6、=19/256范围变成 1/16,19/256 即用1/16,19/256 表示数据 1011。4.简述 JEPG 算法的主要计算步骤，并详细说明每个步骤。答：JPEG 算法的基本思想：a. 分块：按序分块，将图像分成 8 * 8 的子块。b. DCT 变换(离散余弦变换)：对每一个子块，进行 DCT 变换，得到 DCT系数矩阵。DCT 变换，即离散余弦变化。DCT（x,y）= f（像素（x，y）。为了压缩 RGB 彩色图像，这项工作必须进行 3 遍，因为 JPEG 分别处理每个颜色成分。c. 量化：量化说起来很简单，是一种降低整数精度的过程，因此就减少了存储整数所需的位数。量化的过程：试图

7、确定什么信息可以安全地消去，而没有任何明显的视觉保真度损失。DCT 系数矩阵被量化以减少系数的精度，因此提高了压缩率。 d. 对量化后的值进行 Z 扫描：量化后的矩阵，右下角的部分接近 0，把这个矩阵中的值重新排列游程，可以使游程中 0 值的长度增加，以此进一步提高压缩率。JPEG 提出用之字形序列的方法为量化后的 DCT 系数排序。e. Huffman 算法或算术编码：对扫描后的数列进行 Huffman 编码。算术编码：对于算术编码，JPEG 没有要求编码表。当它对图像编码时，它能随图像的统计特性进行调整。对量化后的系数矩阵，矩阵（0，0）位置上的系数称为 DC 系数，矩阵中其他 63 个系

8、数称为 AC 系数。DC 系数与 AC 系数分别进行压缩。DC 系数编码：在 DC 系数被压缩之前，首先处理 DC 预测。差分 DC 系数= DCx-DCx-1AC 系数编码：游程或长度，值。5.游程编码的思想和方法答：游程编码(简写为 RLE 或 RLC)是一种十分简单的压缩方法 ,它将数据流中连续出现的字符 ( 称为游程 ) 用单一的记号来表示。例如,字符串a b a C C C b b a a a a可以压缩为a b a 3c 2b 4a6,MPEG-Video 图像压缩技术的依据是什么？MPEG 采用了哪三种运动图像类型？简述它们之间的关系和含义。答：MPEG-Video 图像压缩

9、技术的依据:因为数据存在冗余，包括：空间冗余：空间上占据位置，但不载有有效信息；时间冗余：动态媒体信息，视频，音频等和时间相关的媒体信息，不同时刻的信息内容相同或相似；编码冗余：不合理的编码。结构冗余：如对称的内容；MPEG 采用了哪三种运动图像类型：I 帧：(Intra pictures )帧内图:不用以任何图片为参考就可以对这种类型的帧编码。帧内图片可以放在序列中的任何位置，并可用于对序列的随机访问。帧内图片由于是独立编码的，所以它的压缩率相对来说要小一些。预测图片：预测图片分为两种，单向预测图片和双向预测图片。预测图片的编码要参考以前的图片，被参考的图片可以是帧内图片也可以是单向预测图片

10、。双向预测图片永远也不能作为参考图片。我们通常把帧内图片和单向预测图片称为锚图片。P 帧：（Predicted Pictures）：称为单向预测图片。对某一个 P 帧进行编码时，在它之前（可以是相邻的也可以不相邻）的帧内图片或单向预测图片就作为参考，P 帧就被对照着参考图片进行编码，提高 P 帧压缩率的方法我们 B 帧：（Bi_directional Predicted Picures）称为运动补偿。B 帧：（Bi_directional Predicted Picures）：双向预测图片。被放在锚图片之间。双向预测图片通过对前面和后面的锚图片的运动补偿方法来编码。它可以使用 3 种运动补偿技术：正向运动补偿，反向运动补偿和内插补偿。正向运动补偿使用前面锚图片的信息，反向运动补偿使用为了锚图片的信息。内插补偿使用过去和将来锚图片信息的平均。

展开阅读全文