1、简答题1.什么是媒体?信息的载体。可以分为视觉类媒体,听觉类媒体, 触觉类媒体,活动媒体,抽象事实媒体。2.什么是多媒体信息?文本图形和图像音频动画和视频3.什么是多媒体技术?利用计算机技术把文本、图像、图形、动画、音频及视频等多种媒体综合一体化,使之建立起逻辑上的联系,并能够对它们获取,编码,编辑,处理,存储,传输和再现。4.它有什么特点?多样性:信息媒体的多样性,即能综合处理文本、图形、图像、动画、音频及视频等多种信息。交互性:指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用信息的手段。集成性: 集成性是指以计算机为中心综合处理多种媒体,它包括信息媒体的集成
2、和这些媒体设备的集成。实时性:多媒体系统对声音和视频等时基媒体提供实时处理的能力。第五章 思考练习题参考答案1.自适应脉冲编码调制(APCM)和差分脉冲编码调制(DPCM)的基本思想是什么?答:APCM:根据输入信号幅度大小改变量化阶大小的一种波形编码技术。DPCM:对预测的样本值与原始的样本值之间的差值进行编码。2.对信源Xx1=0.25,x2=0.25,x3=0.2,x4=0.15,x5=0.10,x6=0.05进行 Huffman 编码答:(1) 将信源符号按概率递减顺序排列 ;(2) 把两个最小的概率加起来 , 作为新符号的概率 ;(3) 重复步骤 (1) 、 (2), 直到概率和达到
3、 1 为止 ;(4) 在每次合并消息时,将被合并的消息赋以 1 和 0 或 0 和 1;(5) 寻找从每个信源符号到概率为 1 处的路径,记录下路径上的 1 和 0;(6) 对每个符号写出“1“、“0“序列(从码数的根到终节点)。3.已知信源 Xx1=1/4,x2=3/4,若 x1=1,x2=0,试对 1011 进行算术编码。答:由题意知:编码的数据串为 x1x2x1x1。令 high 为编码间隔的高端 ,low 为编码间隔的低端 , range 为编码间隔的长度 ,rangelow 为编码字符分配的间隔低端 ,rangehigh 为编码字符分配的间隔高端。则得出范围:字符 x1 x2概率 1
4、/4 3/4范围 0,1/4) 1/4,1)初始 high=1,low=0,rangehigh-low=1, 一个字符编码后新的 low 和 high 按下式计算 :low =lowrange rangelowhigh =lowrangerangehigh(1) 在第一个字符 x1 被编码时,range=1 ,x1 的 rangelow0,rangehigh=1/4, 因此 :low0 + 1 0 0high=0 + 1 1/4 1/4range=highlow=1/40=1/4此时分配给 x1 的范围为 0,1/4 。(2)第二个字符 x2 编码时使用新生成范围 0,1/4,range=1/
5、4,x2 的 rangelow=1/4, rangehigh=1, 因此:low=0 十 1/41/4=1/16high=0 + 1/41=1/4range=3/16范围变成 1/16,1/4 。(3) 对下一个字符 x1 编号,x1 的 rangelow=0,rangehigh=1/4, 则:low=1/16 3/160=1/16high=1/16 3/161/4=7/64range=3/64范围变成 1/16,7/64(3) 对最后一个字符 x1 编号,x1 的 rangelow=0,rangehigh=1/4, 则:low=1/16 3/640=1/16high=1/16 3/641/4
6、=19/256范围变成 1/16,19/256 即用1/16,19/256 表示数据 1011。4.简述 JEPG 算法的主要计算步骤,并详细说明每个步骤。答:JPEG 算法 的基本思想:a. 分块:按序分块,将图像分成 8 * 8 的子块。b. DCT 变换(离散余弦变换):对每一个子块,进行 DCT 变换,得到 DCT系数矩阵。DCT 变换,即离散余弦变化。DCT(x,y)= f(像素(x,y)。为了压缩 RGB 彩色图像,这项工作必须进行 3 遍,因为 JPEG 分别处理每个颜色成分。c. 量化:量化说起来很简单,是一种降低整数精度的过程,因此就减少了存储整数所需的位数。量化的过程:试图
7、确定什么信息可以安全地消去,而没有任何明显的视觉保真度损失。DCT 系数矩阵被量化以减少系数的精度,因此提高了压缩率。 d. 对量化后的值进行 Z 扫描:量化后的矩阵,右下角的部分接近 0,把这个矩阵中的值重新排列游程,可以使游程中 0 值的长度增加,以此进一步提高压缩率。JPEG 提出用之字形序列的方法为量化后的 DCT 系数排序。e. Huffman 算法或算术编码:对扫描后的数列进行 Huffman 编码。算术编码:对于算术编码,JPEG 没有要求编码表。当它对图像编码时,它能随图像的统计特性进行调整。对量化后的系数矩阵,矩阵(0,0)位置上的系数称为 DC 系数,矩阵中其他 63 个系
8、数称为 AC 系数。DC 系数与 AC 系数分别进行压缩。DC 系数编码:在 DC 系数被压缩之前,首先处理 DC 预测。差分 DC 系数= DCx-DCx-1AC 系数编码:游程或长度 , 值。5.游程编码的思想和方法答:游程编码(简写为 RLE 或 RLC)是一种十分简单的压缩方法 ,它将数据流中连续出现的字符 ( 称为游程 ) 用单一的记号来表示。例如,字符串a b a C C C b b a a a a可以压缩为a b a 3c 2b 4a6,MPEG-Video 图像压缩技术的依据是什么?MPEG 采用了哪三种运动图像类型?简述它们之间的关系和含义。答:MPEG-Video 图像压缩
9、技术的依据:因为数据存在冗余,包括:空间冗余:空间上占据位置,但不载有有效信息;时间冗余:动态媒体信息,视频,音频等和时间相关的媒体信息,不同时刻的信息内容相同或相似;编码冗余:不合理的编码。结构冗余:如对称的内容;MPEG 采用了哪三种运动图像类型:I 帧:(Intra pictures )帧内图:不用以任何图片为参考就可以对这种类型的帧编码。帧内图片可以放在序列中的任何位置,并可用于对序列的随机访问。帧内图片由于是独立编码的,所以它的压缩率相对来说要小一些。预测图片:预测图片分为两种,单向预测图片和双向预测图片。预测图片的编码要参考以前的图片,被参考的图片可以是帧内图片也可以是单向预测图片
10、。双向预测图片永远也不能作为参考图片。我们通常把帧内图片和单向预测图片称为锚图片。P 帧:(Predicted Pictures):称为单向预测图片。对某一个 P 帧进行编码时,在它之前(可以是相邻的也可以不相邻)的帧内图片或单向预测图片就作为参考,P 帧就被对照着参考图片进行编码,提高 P 帧压缩率的方法我们 B 帧:(Bi_directional Predicted Picures)称为运动补偿。B 帧:(Bi_directional Predicted Picures):双向预测图片。被放在锚图片之间。双向预测图片通过对前面和后面的锚图片的运动补偿方法来编码。它可以使用 3 种运动补偿技术:正向运动补偿,反向运动补偿和内插补偿。正向运动补偿使用前面锚图片的信息,反向运动补偿使用为了锚图片的信息。内插补偿使用过去和将来锚图片信息的平均。