1、一. 简答(5x6)1. 什么是多媒体技术?它有哪些主要特性?答:多媒体是计算机综合处理文本、图形、图像、音频、视频等多种媒体信息,使多种信息建立逻辑连接,集成为一个系统并具有交互性和实时性的崭新技术。多媒体有多样性、集成性、交互性2. 多媒体应用领域主要包括哪些方面?答:多媒体应用领域主要包括:(1)娱乐(2)教育和培训(3)电子出版物(4)咨询、信息服务与广告(5)工业控制与科学研究(6)医疗影像与远程诊断(7)多媒体办公系统(8)多媒体技术在通信系统中的应用3. 简述多媒体所涉及的核心问题有哪些?答:多媒体信号数字化与计算机获取技术;多媒体数据压缩编码与解码技术;多媒体数据的实时处理和特
2、技效果技术;多媒体数据的输出与回放技术4. 设想一下未来,多媒体技术可能渗透和应用到哪些领域?答:教育与培训 (形象教学、模拟展示);过程模拟(生物、人类智能模拟) ;商业广告(科技合成、大型演示) ;影视娱乐业(电影特技、变形效果) ;咨询服务、旅游业(景点介绍) ;国际互联网(远程诊断、远程手术)5. 音频压缩编码的标准有哪些?答:从数据通信的角度看,音频编码标准主要有 3 种:一是在电话传输系统中应用的电话质量的音频压缩编码技术标准,如 PCM(ITU G.711)、ADPCM(ITU G.721)等,可满足电话级的语音质量要求;而是窄带综合服务数据网传送中应用的调幅广播质量的音频压缩编
3、码技术标准,如G.722,可提供调幅广播级的语音质量要求;三是在电话传输系统、视频点播系统中应用的音频编码标准,如 MPEG 音频标准,可提供立体声声音质量。6. 模拟视频与数字化视频的区别?答: 普通的广播电视信号是一种典型的模拟视频信号。电视摄像机通过电子扫描将时间、空间函数所描述的景物进行光电转换后,得到单一的时间函数的电信号,其电平的高低对应于景物亮度的大小,即用一个电信号来表征景物。这种电视信号称为模拟电视信号,其特点是信号在时间和幅度上都是连续变化的。模拟视频信号经过数字化处理后,就变成了一帧帧由数字图像组成的图像序列,即数字视频信号,它用二进制数字表示,是计算机能够处理的数字信号
4、。每帧图像由 N 行、每行 M 个像素组成,即每帧图像共有MN 个像素。 与模拟视频相比,数字化视频具有以下优点:适和网络应用,再现性好,便于计算机编辑处理。7. 说明 DCT(离散余弦变换 )变换编码的基本方法.答:在 DCT 为主要方法的变换编码中,一般不直接对整个图像进行变换,而是首先对图像分块,将 M*N 的一幅图像分成不重叠的 K*K 块分别进行变换。分块大小通常选 8*8 和 16*16.采用 DCT 进行变换编码时,通常首先将原始图像分成子块,对每一子块经正交变换得到变换系数,并对变换 系数经过量化和取舍,然后采用熵编码等方式进行编码后,再由信道传输到接收端,经过解码、反量化、逆
5、变换后,得到重建图像。8. 简述 JPEG 编码有那几个步骤?答:颜色变换;正向离散余弦变换(FDCT) ;量化(quantization);Z 字形编码(zigzag scan);使用差分脉冲编码调制(differential pulse code modulation,DPCM);直流系数(DC)进行编码;使用行程长度编码(run-length encoding,RLE) 对交流系数(AC) 进行编码;熵编码(entropy coding);组成位数据流9. 在 JPEG 编码计算步骤中,哪些计算是有损的?哪些计算是无损的?答:有损的有:量化;(波形编码、参数编码、混合编码)无损的有:正向
6、离散余弦变换(FDCT) ; Z 字形编码(zigzag scan);使用差分脉冲编码调制;直流系数(DC)进行编码;使用行程长度编码对交流系数(AC)进行编码;熵编码;(霍夫曼编码、算术编码、行程编码、LZW 编码)10. MPEG-1,MPEG-2,MPEG-4 和 MPEG-7 的目标是什么?答:MPEG-1 :是针对具有 1.5Mbps 以下数据传输率的数字存储或传输媒体的视频及其伴音编码、解码的国际标准。MPEG-2:制定 MPEG2 的初衷是得到一个针对广播电视质量(CCIR601 格式, 720576)的视频信号的压缩标准。但实际上得到是一个通用的标准,它能够在很宽范围内对不同分
7、辨率和不同输出比特率的图像信号进行压缩。适用于高清晰度电视 HDTV 信号的传送与播放MPEG-4:第一个目标是制定一个通用的低码率(64kb/s 以下)压缩标准,并采用第二代压缩算法,以有效的支持甚低码率(very low bit rate)应用,比如移动通信中的声像业务,和窄带多媒体通信等等;第二个目标是实现基于内容的压缩编码,以提高可靠性,支持多媒体数据的集成,和交互式多媒体业务等等。MPEG-7:旨在解决对多媒体信息描述的标准问题,并将该描述与所描述的内容相联系,以实现快速有效的搜索。11. 什么是 OCR?OCR 系统由哪几个部分组成?答: 光学符号识别(OCR): OCR 技术实际
8、上是计算机认字,也是一种文字输入法,它通过扫描和摄像等光学输入方式获取纸张上文字方式图像信息,利用各种模式识别算法,分析文字形态特征,判断出文字的标准码,并按通用格式存储在文本文件中。 一个 OCR 系统可分为以下 3 部分:预处理部分:首先把待识别的文本通过扫描设备输入系统,由硬件,软件完成数字图像处理,把待识别文本中的照片,图形与文字分离开来,并将分离出的文字分割成单个符号图像,以便识别.识别部分:把分割出文字图像规格化,提取文字的几何特征和统计特征,并将特征送入识别器,得到待识别文字的内码作为结果.后处理部分:将识别结果以及预处理部分的某些因素进行综合考虑,生成具有一定格式的识别结果,然
9、后对整个识别结果进行语言学方面的检查,纠正误识成分,从而产生 OCR 系统对该识别文本的最终结果.12. 计算机与外部设备的常用接口标准有哪些?答: 常用接口标准有:IDE 接口, EIDE 接口, SCSI 接口, IEEE1394 接口, USB 接口13. 结合当前计算机技术的发展趋势,谈谈多媒体系统的最新进展。答: 1 家庭教育和个人娱乐是目前国际多媒体市场的主流2 内容演示和管理信息系统是多媒体技术应用的重要方面。3 多媒体通信和分布式多媒体系统是多媒体技术今后的发展方向。多媒体信息成为企业文化的最好载体与呈现,为企业风采提供了良好的展示平台,为企业文化建设提供了新的利器。企业可以在
10、电梯、休息厅等各种场所安装显示屏,在指定时间播放公司领导讲话、公司活动及有关培训等内容,实现企业内刊电子化,充分利用员工闲暇时间,营造学习型的企业文化氛围。不同行业、不同规模的企业都可以建设起这种属于企业自身的“网络电视台”,市场之广阔不言而喻。政府机构则是多媒体信息发布的又一重要应用领域。政府机构与相关公共场所的各种显示终端,包括液晶、等离子、LED等显示屏,是政府信息公开的重要载体,是保障人民群众获知政务信息、方便群众办事的重要渠道。最典型的是2008北京奥运会上多媒体系统的的应用,通过各式各样的显示屏幕,与场景、灯光互动的巧妙设计,带来美轮美奂的视觉盛宴。14. 扫描仪的工作原理?答:扫
11、描仪是一种计算机输入设备,它可将各种图片、图纸等资料扫描输入到电脑,转换成数字化图像数据保存和使用。 扫描仪的工作原理扫描仪是光机电一体化的产品,主要由光学成像部分、机械传动部分和转换电路部分组成。扫描仪的核心是完成光电转换的电荷耦合器件(CCD)。扫描仪自身携带的光源将光线照在欲输入的图稿上产生反射光(反射稿) 或透射光( 透射稿) ,光学系统收集这些光线将其聚焦到 CCD 上,由CCD 将光信号转换为电信号,然后再进行模数(A/D)转换,生成数字图像信号送给计算机。扫描仪采用线阵 CCD,即一次成像只生成一行图像数据,当线阵 CCD 经过相对运动将图稿全部扫描一遍后,一幅完整的数字图像就送
12、入到计算机中去了。15. 数码相机的工作原理?答:数码相机是一种能够进行拍摄并通过内部处理把拍摄到的景物转换成以数字格式存放的特殊照相机。 数码相机是由镜头、CCD、A/D(模数转换器)、MPU(微处理器)、内置存储器、LCD(液晶显示器)、PC 卡(可移动存储器)和接口(包括计算机接口、电视机接口)等部分组成,数码相机中只有镜头的作用与普通相机相同,其余部分则完全不同。数码相机在工作时,外部景物通过镜头将光线会聚到感光器件 CCD 上,并被转换成电荷 ,然后通过 A/D 器件进行从模拟信号到数字信号的转换,接下来 MPU 对数字信号进行压缩并转化为特定的图像格式,如 JPEG格式。最后,图像
13、文件被存储在内置存储器中。 16. CRT 与 LCD 的区别?答:CRT 的工作原理可以简单理解为:高速的电子束由电子枪发出,经过聚焦系统、加速系统和磁偏转系统就会到达荧光屏的特定位置。荧光物质在高速电子的轰击下会发生电子跃迁,即电子吸收到能量从低能态变为高能态。由于高能态很不稳定,在很短的时间内荧光物质的电子会从高能态重新回到低能态,这时将发出荧光,屏幕上的那一点就会亮了。LCD 显示器原理:液晶是一种介于液体和固体之间的特殊物质,它具有液体的流态性质和固体的光学性质。当液晶受到电压的影响时,就会改变它的物理性质而发生形变,此时通过它的光的折射角度就会发生变化,而产生色彩。液晶屏幕后面有一
14、个背光,这个光源先穿过第一层偏光板,再来到液晶体上,而当光线透过液晶体时,就会产生光线的色泽改变,从液晶体射出来的光线,还得必须经过一块彩色滤光片以及第二块偏光板。由于两块偏光板的偏振方向成 90 度,再加上电压的变化和一些其他的装置,液晶显示器就能显示想要的颜色了。17. 视频会议的主要组成及部分功能?答:一般的视频会议系统包括 MCU 多点控制器(视频会议服务器)、视频会议终端(会议室型硬件终端、PC 桌面型硬件终端、软件视频会议终端)、网关(Gateway)、Gatekeeper(网闸)等几个部分。各种不同的终端都连入MCU 进行集中交换,组成一个视频会议网络。(1 )MCU 是视频会议
15、系统的核心部分,为用户提供群组会议、多组会议的连接服务。(2) 网关(Gateway) 在基于 IP 网的视频会议系统中,网关是跨接在两个不同网络之间的设备,把位于两个不同网络上的会议终端连接起来组成一组会议。(3) Gatekeeper(网闸)网闸有以下三个主要的功能:用户别名和运输层地址的翻译.用户进入会场许可的管理和控制。网络带宽的管理和控制。18. 视频信号获取的流程?答: 彩色全电视信号经过采集设备分解成模拟的 R、G、B 信号或Y、U、V 信号; 各个分量的 A/D 变换、解码、将模拟的 R、G、B 或 Y、U、V 信号变换成数字信号的 R、G、B 或 Y、U、V 信号,存入帧存储
16、器; 主机可通过总线对帧存储器中的图像数据进行处理,帧存储器的数据R、G、B 或 Y、U、V 经过 D/A 变换转换成模拟的 R、G、B 或Y、U、V 信号; 经过编码器合成彩色电视信号,输出到显示器上。 19. 什么是 MIDI 接口?什么是 MIDI 消息?MIDI 系统的合成器、音序器、音源各起什么作用?答: MIDI是乐器数字化接口(Musical Instrument Digital Interface)的缩写。Midi最初应用在电子乐器上用来记录乐手的弹奏,以便后来重播。随着在电脑里面引入了支持MIDI合成的声音卡之后,MIDI才正式地成为了一种音频格式。简述MIDI的工作过程?
17、MIDI电子乐器通过MIDI接口与计算机相连。计算机可通过音序器软件来采集MIDI电子乐器发出的一系列指令。这一系列指令可记录到以.MIDI为扩展名的MIDI扩展文件中。在计算机上音序器可对MIDI文件进行编辑和修改。最后,将MIDI指令送往音乐合成器,由合成器将指令符号进行解释并产生波形,然后通过声音发生器送往扬声器播放出来。音乐合成的方式根据一定的协议标准,使用音乐符号来记录和解释乐谱,并组合成相应的音乐信号,这就是 MIDI(Musical Instrument Digital Interface 乐器数字接口)。 泛指数字音乐的国际标准。它是音乐与计算机结合的产物。(1)MIDI 电子
18、乐器它是能产生特定声音的合成器,如电子键盘、吉他、萨克斯管等;它们相互间的数据传送符合 MIDI 的通信约定。(2)MIDI 消息(message)或指令MIDI 软件通信协议,实际上是用数字指令描述的音乐乐谱,其中包含音符、强度、定时及乐器的指派等。(3)MIDI 接口(interface)MIDI 硬件通信协议,可使电子乐器互连或与计算机硬件端口相连,可发送和接收 MIDI 消息。(4)MIDI 通道(channel)MIDI 标准提供了 16 个通道,每种通道对应一种逻辑的合成器,即对应一种乐器的合成。(5)音序器(sequencer)它指可用来记录、编辑和播放 MIDI 文件的计算机程
19、序。MIDI 接口和计算机的连接 MIDI 接口由三个端口组成:输入端口(In)、输出端口(0ut)和直达端口(Thru) 。 直达端口对 MIDI 数据只是进行简单传输,来自直达端口的数据仅仅是来自输入端口数据的拷贝,在离开直达端口前数据不会发生任何的改变。 二. 计算题(2x15)1.哈夫曼编码信源出现的概率极其编码元素 xi X1 X2 X3 X4 X5 X6概率 P(xi) 0.4 0.3 0.1 0.1 0.06 0.04编码 wi 1 00 011 0100 01010 01011经霍夫曼编码后,平均码长为: 61()iiiBPwn=0.410.3020.13+0.14+0.065
20、+0.045=2.2 (bit) 例 2 设一幅灰度级为 8(分别用 S0、S1、S2 、 S3、S4、S5 、 S6、 S7 表示)的图像中,各灰度所对应的概率分别为0.40、 0.18、 0.10、 0.10、 0.07、 0.06、 0.05、0.04。现对其进行哈夫曼编码编码过程具体步骤如下: (1) 首先对信源概率从大到小排序, 选出最小的两个概率(0.04 和 0.05) ,相加得 0.09,与其他概率组成新的概率集合0.40, 0.18, 0.10, 0.10, 0.07, 0.06, 0.09。 (2) 对新的概率集合重新排序, 选出最小的两个概率( 0.06和 0.07) ,
21、相加得 0.13,组成新的概率集合0.40, 0.18, 0.10, 0.10, 0.09, 0.13。(3) 对新的概率集合重新排序, 选出最小的两个概率( 0.10和 0.09) ,相加得 0.19, 组成新的概率集合0.40 , 0.18, 0.13, 0.10, 0.19。(4) 对新的概率集合重新排序,选出最小的两个概率( 0.13和 0.10) ,相加得 0.23,组成新的概率集合0.40,0.19 ,0.18, 0.23。(5) 对新的概率集合重新排序, 选出最小的两个概率( 0.19和 0.18) ,相加得 0.37,组成新的概率集合0.40, 0.23, 0.37。(6) 对
22、新的概率集合重新排序, 选出最小的两个概率( 0.23和 0.37) ,相加得 0.60,组成新的概率集合0.40, 0.60。(7) 直到最后两个概率(0.60 和 0.40)相加和为 1。(8) 分配码字。从最后一步反向进行, 首先给最后相加的两个概率(0.60 和 0.40)分配码字,由于 0.60 大于 0.40,于是给0.60 赋 “0”,给 0.40 赋“1” 。如此依次给每次相加的两个概率分配码字。(9) 最后写出每个符号的哈夫曼编码。以符号 S1(对应的概率为 0.18)为例,在从 0.18 到 1.0 的路径上, 它所遇到的赋值(“0”或“1”)依次为 1、 0、 0, 将其
23、反向排列成“001”,于是就形成了符号 S1 的哈夫曼码字 “001”。编码 字符 概率 1S0 0.400.180.100.100.070.060.050.04 0.090.13 0.190.23 0.37 0.601.001111110 00 00 0101010001001010010001S1S2S3S4S5S6S7上 述 哈 夫 曼 编 码 方 法 形 成 的 码 字 是 可 识 别 的 , 即 能 够 保 证一 个 符 号 的 码 字 不 会 与 另 一 个 符 号 的 码 字 的 前 几 位 相 同 。 比 如说 , 如 果 S0的 码 字 为 1, S1的 码 字 为 01,
24、而 S2的 码 字 为 01,则 当 编 码 序 列 中 出 现 0时 , 就 不 能 判 别 它 是 2的 码 字 还 是 S1的 码 字 后 面 跟 了 一 个 S0的 码 字 1。 下 面 来 看 一 下 哈 夫 曼 编 码 的 编 码 效 率 。 平 均 码 长 R为 6.24.57.38NkPB2.算术编码设一待编码的数据序列(即信源)为“dacab” , 信源中各符号出现的概率依次为 P(a)=0.4,P(b)=0.2,P(c)=0.2, P(d)=0.2。首先,数据序列中的各数据符号在区间0, 1内的间隔(赋值范围)设定为 a=0, 0.4), b=0.4, 0.6), c=0.
25、6, 0.8), d=0.8, 1.0)为便于讨论, 再给出一组关系式: StartN=StartB+LeftCL EndN=StartB+RightCL 式中,StartN 、EndN 分别表示新间隔(或称之为区间)的起始位置和结束位置,StartB 表示前一间隔的起始位置,L 为前一间隔的长度, LeftC、RightC 分别表示当前编码符号的初始区间的左端和右端。第一个被压缩的符号为“d”,其初始间隔为0.8, 1.0); 第二个被压缩的符号为“a”,由于前面的符号“d”的取值区间被限制在0.8, 1.0)范围内,所以“a”的取值范围应在前一符号间隔0.8, 1.0)的0, 0.4)子区
26、间内, 根据上式可知 StartN=0.8+0(1.0-0.8)=0.8EndN=0.8+0.4(1.0-0.8)=0.88 即“a”的实际编码区间在0.8, 0.88)之间。 第三个被压缩的符号为“c”, 其编码取值范围应在0.8, 0.88)区间的0.6, 0.8)的子区间内,据上式可知 StartN=0.8+0.6(0.88-0.8)=0.848EndN=0.8+0.8(0.88-0.8)=0.864第四个被压缩的符号为“a”,同理,根据上式可知 StartN=0.848+0(0.864-0.848)=0.848EndN=0.848+0.4(0.864-0.848)=0.8544 第五个
27、被压缩的符号为“b”,同理,根据上式可知 StartN=0.848+0.4(0.8544-0.848)=0.85056EndN=0.848+0.6(0.8544-0.848)=0.85184 至此,数据序列“dacab”已被描述为一个实数区间0.850 56, 0.851 84 ,或者说在此区间内的任一实数值都惟一对应该数据序列。这样,就可以用一个实数表示这一数据序列。我们把区间0. 850 56, 0.851 84用二进制形式表示为0.110110011011, 0.110110100001 。 从这个区间可以看出,0.1101101 位于这个区间内并且其编码最短,故把其作为数据序列“dac
28、ab”的编码输出。考虑到算术编码中任一数据序列的编码都含有“0.”,所以在编码时,可以不考虑“0.”,于是把 1101101 作为本例中的数据序列的算术编码。由此可见, 数据序列“dacab”用 7 比特的二进制代码就可以表示, 平均码长为 1.4比特字符。解码是编码的逆过程,根据编码时的概率分配表和压缩后数据代码所在的范围,确定代码所对应的每一个数据符号。由此可见,算术编码的实现方法要比哈夫曼编码复杂一些。 例子:对一个 5 符号信源 Aa1,a2 ,a3 ,a2,a4,各字符出现的概率和设定的取值范围如下表 4.2: 字符出现的概率和设定的取值范围字符 概率 范围A3 0.2 0 0.2A
29、1 0.2 0.2 0.4A2 0.4 0.4 0.8A4 0.2 0.8 1.0为讨论方便起见,假定有 Ns=Fs+Cl*L Ne=Fe+Cr*L式中 Ns 为新子区间的起始位置;Fs 为前子区间的起始位置,Cl当前符号的区间左端; Ne 为新子区间的结束位置;Cr 当前符号的区间右端;L 为前子区间的长度。按上述区间的定义,最终结果如表 4.3: 输出结果字符 概率 范围A1 0.2 0.2 0.4A2 0.08 0.28 0.36A3 0.016 0.28 0.296A2 0.0064 0.2864 0.2928A4 0.00128 0.2915 0.2928给定事件序列的算术编码步骤如
30、下: (1)编码器在开始时将“当前间隔” L,H 设置为0,1) 。(2)对每一事件,编码器按步骤(a )和(b)进行处理(a)编码器将 “当前间隔”分为子间隔,每一个事件一个。(b)一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔” 。最后输出的“当前间隔” 的下边界就是该给定事件序列的算术编码。三. 论述题(2x20)1. 听觉系统的感知特性,在 MPEG 音频编码中的作用?人的听觉特性a. 人可听声音的频率范围为 16.4Hz 20KHz,可听声音的强度范围是 0 120dB(声压级)。b. 人耳对不同频率纯音的
31、听辩灵敏度不同。人对声音响度的感觉,与声音的强度和频率有关。c. 听阈是指人能听到的最低声压级。d. 纯音的听阈与频率有关。1KHz 纯音的听阈约为 4dB, 10KHz 时约为 15dB。e. 痛阈是指人耳会感到不适(不适阈)或疼痛时的声压级。掩蔽效应定义:当两个响度不同的声音作用于人耳时,响度较高的频率成分会影响对响度较低频率成分的感受。这种现象称为人耳的掩蔽效应。f. 从频率角度来看,低频成分容易掩蔽高频成分。g. 掩蔽效应使被掩蔽频率成分的听阈上升。h. 噪声的存在影响纯音的接收,即对纯音产生掩蔽。i. 当掩蔽声出现时,被掩蔽声就听不到。要想听到掩蔽声,就要提高它的阈值。“低于 1.5
32、Mbit/s 的用于数字存储媒体的活动图像和相关声音之国际标准ISO/IEC”(MPEG-1)与 1992 年 11 月完成。其中 ISO11172.3 作为“MPEG 音频”标准,称为国际上公认的高保真立体声音频压缩编码,一般称为“MPEG-1 音频”。MPEG-1 音频第一和第二层次编码是将输入音频信号以采样频率为48kHz、44.1kHz、32kHz 进行采样,经滤波器组将其分为 32 个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算个频率分量的人儿屏蔽门限,选择各子带的量化参数,获得高的压缩比。MPEG 第三层次是在上述处理后再引入辅助子带、非均匀量化和熵编码技术,再进一步提高压缩
33、比。MPEG 音频压缩技术的每声道数据传输速率为32448kbit/s,适合 CD-DA 光盘应用。2. 多媒体计算机系统结构多媒体计算机系统的层次结构是如何划分的?答: 多媒体计算机系统是对基本计算机系统的软、硬件功能的扩展,作为一个完整的多媒体计算机系统包括五个层次结构:最底层为多媒体计算机硬件系统;第二层为多媒体的软件系统;第三层为多媒体应用程序接口;第四层为多媒体著作工具及软件;第五层是多媒体应用系统,这一层直接面向用户,是为满足用户的各种需求服务的。 制定MPC标准的意义何在?答:MPC标准对技术开发人员来说,是用来指导多媒体个人计算机及其软件的设计;对于用户来说,它是把有PC机升级
34、为MPC的一个指导原则;对于经销商来说,它可以作为判别多媒体的性能及其兼容性的尺度。 简述MPC所涉及的关键技术 答:多媒体信号数字化与计算机获取技术;多媒体数据压缩编码与解码技术;多媒体数据的实时处理和特技效果技术;多媒体数据的输出与回放技术1. 多媒体数据压缩编码与解码技术 2.多媒体数据存储技术 3.多媒体数据库技术 4.超文本和超媒体技术 5.智能多媒技术 6.多媒体信息检索技术 7.虚拟现实技术 8.人机交互技术 9.多媒体网络与通讯技术 10.分布式多媒体技术试分析多媒体计算机的存储系统模型,指出各层次存储设备的特点答:多媒体存储系统中,最高层次的存储设备是随机存储器,紧跟着是磁盘
35、驱动器,它们均提供联机服务。光存储设备提供下一个存储层次,它们在某些情况下是联机设备,但在大多数情况下是邻机的,比如自动换片光盘库(Jukeboxs)。存储层次的最低段是脱机存储设备,包括磁带、光盘等。它们提供最高的存储容量和持久性,但存取速度方面的性能也最差。多媒体数据存储要从存储介质的容量、速度和价格等多方面考虑。目前信息存储方式占主导地位的仍然是磁记录方式。3. JPEG 编/解码图,原理,为什么要使用”Z”字形编码?量化后的系数要重新编排,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,方法是按照 Z 字形的式样编排,这样就把一个 8 8 的矩阵变成一个 1 64 的矢量,
36、频率较低的系数放在矢量的顶部。DCT 系数量化后,构成一个稀疏矩阵,用Z(Zigzag )形扫描将其变成一维数列,将有利于熵编码。Z 形排列后的 AC 系数,更有可能出现连续 0 组成的字符串,从而对其进行行程编码将有利于压缩数据。4. 假定语音信号的带宽是 50Hz10kHz,而音乐信号的是15Hz20kHz。采用奈奎斯特频率,并用 12 位表示语音信号样值,用 16位表示音乐信号样值,计算这两种信号数字化以后的比特率以及存储一段 10 分钟的立体声音乐所需要的存储器容量。解:语音信号:取样频率=2 x 10kHz=20kHz;比特率=20k/s x 12bit=240kbit/s音乐信号:
37、取样频率=2 x 20kHz=40kHz;比特率=40k/s x 16bit x 2=1280kbit/s (立体声是双声道)所需存储空间:1280kbit/s x 600s/8bit=96MB公式:数据传输速率(bit/s)=采样频率(Hz) x 量化位数(bit) x 声道数数据量(MB)= 数据传输速率(bit/s) x 时间(s) / 8bit例 1.高保真立体声数字音频的量化位数为 16,试计算其数据传输率。 解:高保真立体声数字音频采样频率为 44.1kHz,双声道,其数据传输率为 :数据传输率 =44.1(kHz)16(bit)2(声道)=1411.2(kbps) 如果采用 PC
38、M 编码,数字音频文件所占用的空间可用如下的公式计算: 音频数据量(Byte)= 数据传输率 持续时间8(bit/Byte) 其中数据量以字节(Byte)为单位;数据传输率以每秒比特(bps)为单位;持续时间以秒(s) 为单位。 例 2. 计算 1 分钟未经压缩高保真立体声数字声音文件大小。 解:高保真立体声数字音频采样频率为 44.1kHz,16 位量化,双声道,其数据传输率为: 数据传输率 =44.1(kHz)16(bit)2(声道)=1411.2(kbps) 1 分钟这样的声音文件的大小为 :音频数据量 =1411.2(kb/s )60 (s)/8(bit/Byte)=10584kB未经
39、压缩的 4 分钟的歌曲文件约 42M 数据,128M 的 MP3 播放器只能存放 3 首这样的歌曲。 5. MP3 与 MP4MP3 文件是采用 MP3 算法压缩生成的数字音频数据文件,以“.MP3”为文件后缀。MP3 利用 MPEG 制定的 MPEG-1 Audio layer 3 的压缩标准,将音频信息用 10:1 甚至 12:1 压缩率变成容量较小的数据文件。虽然 MP3 是一种利用了人类心理声学特性的有损压缩,人耳基本不能分辨出失真,音质几乎达到了 CD 音质标准。按照这种算法,10 张 CD-DA 的内容可以压缩到 l 张 CD-ROM 中,而且视听效果相当好。 MP4 是 GMO
40、公司针对 MP3 侵犯音乐出版物的版权,采用了 AT&T 授权的基于 MPEG-2 AAC(Advanced Audio Coding)的 A2B 音乐,并将其命名为 MP4,其用意大概是想表明 MP4 是继 MP3 之后的一种升级换代技术.容量: 容量表示 MP4 播放器用于存储文件的空间大小,是 MP4 播放器的重要参数,容量越大,就表示 MP4 可以存储的音乐或者电影越多。接口: 接口指 MP4 播放器与电脑的连接方式。接口的速度、方便程度自然也会影响到音乐或者视频文件的上传或下载速率,由于视频文件可能比较大,使用快速的接口比较便于使用。 MP4 播放器常见接口有 USB 接口和IEEE1394 接口 .视频播放: 视频播放是指 MP4 播放器可以播放的视频格式。MP4 播放器和 MP3 播放器相比,最大的区别就是可以播放视频文件.6. 影响数据压缩性能的主要因素有哪些?答: 影响数据压缩性能的主要因素有:(1)压缩比要大(2)实现压缩的算法要简单,压缩、解压速度快(3)恢复效果要好,要尽可能地完全恢复原始数据(4 )冗余程度7. JPEG2000 标准的特点?答:(1)能够实现无损压缩:(2).容错性好、稳定性高:(3).开放的框架结构:(4).渐进传输(5).码流的随机访问和处理这一特征允许用户在图像中随机地定义感兴趣区域