1、 多媒体技术基础巩固复习1、多媒体技术概要1、超链接:两个对象或文档元素之间的定向逻辑链接,也称为“热链接”或“超文本链接”。2、多媒体压缩技术可分为两种类型:无损压缩(用于要求重构的数据与原始数据完全一致的应用)和有损压缩(适用于不一定非要和原始数据完全相同的应用) 。3、在压缩技术,编码技术可分为三种类型:熵编码(属于无损压缩) 、源编码(有损压缩)和混合编码(有损压缩) 。练习与思考题1、多媒体是什么?2、无损压缩是什么?3、有损压缩是什么?4、组成万维网的 4 个核心部分是什么?2、数据无损压缩1、数据可被压缩的依据是数据本身存在冗余。所有无损压缩的算法的共同特点都是利用数据本身的冗余
2、性,其差别主要体现在压缩比上,压缩比越高表示冗余数据消除得越多,压缩比的上限值由数据集的熵限定。2、无损压缩方法:统计编码(给已知统计信息的符号分配代码)香农-范诺编码霍夫曼编码(“从下到上”的熵编码方法)词典编码(用词在词典中表示位置的号码代替词本身)利用数据本身包含重复代码的特性生成编码词典。它适用于编码数据的统计特性事先不知道或不可能知道场合,比如:文本文件、电视图像就具有这种特性。;LZ78 算法。1.编码算法:LZ78 的编码思想是不断地从字符流中提取新的缀-符串。3、无损压缩技术:算术编码(给已知统计信息的符号分配代码)行程长度编码(RLE 编码)它利用连续数据单元有相同数值这一特
3、点对数据进行压缩。在编码时,对相同的数值只编码一次,同时计算相同数值连续重复的次数,称为“行程程度” 。RLE 尤其适用于计算机生成的图像,对减少图像文件存储空间非常有效。练习与思考题1、LZW 算法和 LZ78 算法的核心思想是什么?它们之间有什么差别?3、数字声音编码1、声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音信号种类:复合信号(由许多频率不同的信号组成)分量信号(单一频率的信号)2、人们常见的声音的频率范围:高保真声音:2020000Hz;声音:2020000Hz;话音:3003400Hz;亚音:20000Hz。3、声音信号的数字化模拟信号:在时间和幅度上都是
4、连续的信号数字信号:在时间和幅度上都用离散的数字表示的信号4、脉冲编码调制(PCM)采样:在某些特定的时刻对模拟信号进行测量的过程量化:幅值连续的模拟信号转化成幅值离散的数字信号的过程均匀量化:在量化时,信号幅度的划分是等间隔的量化非均匀量化:在量化时,信号幅度的划分是非等间隔的量化练习与思考题1、声音信号的频率范围大约是多少?话音信号的频率范围大约是多少?2、什么叫做模拟信号?什么叫做数字信号?3、什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?4、采样频率根据什么原则来确定?5、选择采样频率为 22.050kHz 和样本精度为 16 位的录音参数。在不采用压缩技术的情况下
5、,计算录制 2 分钟的立体声需要多少 MB(兆字节)的储存空间(1MB=10241024B) 。4、彩色数字图像基础1、图像数据压缩所根据的两个基本事实:图像数据中有许多重复的数据,使用数学方法来表示这些重复的数据可以减少数据量;人眼对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉也就达到了压缩数据的目的。2、图像的三个基本属性图像分辨率像素深度像素深度是指存储每个像素所用的位数。像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。真/伪彩色(与直接色)3、JPEG 压缩编码、JPEG 是什么JPEG 是一个适用范围很广的静态图像数据压缩标准,既可用
6、于灰度图像又可用于彩色图像。JPEG 基本压缩算法以离散余弦变换为基础的有损压缩算法(压缩比 25:1)以预测技术为基础的无损压缩算法JPEG 概要通常认为,JPEG 是采用数据有损压缩算法的标准,它利用了人的视觉系统的特性,使用变换、量化和熵编码相结合的方法,以去掉或减少视觉的冗余信息和数据本身的冗余信息。JPEG 标准的压缩算法大致分成三个步骤:使用正向离散余弦变换(FDCT)把空间域表示的图变换成频率域表示的图。使用加权函数对 DCT 系数进行量化,这个加权函数对于人的视觉系统是最佳的。使用霍夫曼可变字长编码器对量化系数进行编码。联系与思考题1、什么叫做真彩色和伪彩色?2、什么叫做屏幕分
7、辨率和图像分辨率?3、一个像素的 RGB 分量分别用 3、3、2 位表示的图像,该幅图像的颜色数目最多是多少?如果有一幅 256 色的图案,该图的颜色深度是多少?4、BMP、GIF、JPG 和 PNG 格式的特性?九、数字电视基础1、模拟彩色电视制NTSC 制 PAL 制 SECAM 制 ;三者互不兼容2、电视扫描和同步电视的扫描方式:隔行扫描 逐行扫描(也称非隔行扫描)3、图像子采样如果对色差信号使用的采样频率对亮度信号使用的采样频率低,这种采样就称为图像子采样。基本依据:人的视觉系统所具有的两个特性,一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信
8、号去掉一些而使人不易察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。4、数字电视数字电视是用数据压缩技术和数字传输技术的远程通信系统。数字电视图像使用 MPEG-2 Video 标准,声音则使用 MPEG-2 Audio 标准或杜比数字标准。目前传输数字电视用得最多的方式是使用卫星、地面广播和电缆。练习与思考题1、电视是什么?电视剧是什么?世界上主要的彩色电视制有哪几种?2、隔行扫描是什么意思?非隔行扫描是什么意思?3、电视机和计算机的显示器各使用什么扫描方式?4、对彩色图像进行子采样的论理依据是什么?5、图像子采样是在哪个彩色空间进行的?
9、6、一幅 YUV 彩色图像的分辨率为 720576 像素。分别计算采用 4:2:2、4:1:1 和4:2:0 子采样格式采样时的样本数。7、数字电视是什么?十、MPEG 概要1、MPEG-1 标准的组成部分MPEG 视频MPEG 音频MPEG 系统11、MPEG 声音1、听觉系统的感知特性响度听阈:声音弱到人的耳朵刚刚可以听见痛阈:声音强到人的耳朵刚刚感到疼痛音高掩蔽效应一种频率的声音(掩蔽声音)阻碍听觉系统感受另一种频率的声音(被掩蔽声音)现象称为掩蔽效应频域掩蔽:一个强纯音会掩蔽在其附近同时发声的弱纯音,也称为同时掩蔽。时域掩蔽:除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间
10、也有掩蔽现象。除了同时掩蔽外,时域掩蔽又分为超前掩蔽和滞后掩蔽。2、感知声音编码1、感知编码:一种声音数据压缩技术,他处理 1020000HZ 范围里的声音数据,数据压缩的主要根据是人耳朵的听觉特性,使用“心理声学模型”来取消人耳感觉不到的声音数据,以此来达到压缩声音数据的目的。2、MPEG 声音的压缩依据在心理声学模型中,一个基本概念是听觉系统存在听觉阈值电平,低于这个电平的声音信号就听不到,因此就可把这部分信号去掉。心理声学模型中的另一个基本概念是听觉隐蔽特性。MPEG 声音主要采纳两种感知编码算法:一种叫做感知子带编码,另一种是杜比数字编码,他们都利用人的听觉系统的特性来压缩数据,只是压
11、缩算法不同。3、MPEG-1 Audio子带编码MPEG-1 使用子带编码来达到既压缩数据又尽可能的保留声音原有质量的目的。子带编码的理论依据是听觉系统的掩蔽特性,并且主要是利用频域掩蔽特性。中心思想:的基本想法就是在编码过程中保留信号的带宽而扔掉被掩蔽的信号,其结果是编码之后还原的声音,也就是解码或者重构的声音信号与编码之前的声音信号不相同,但人的听觉系统很难察觉到它们之间的区别。编码层第一层:子带是频带相等的子带,该层使用频域掩蔽特性。第二层:除了使用频域掩蔽特性之外,第二层编码还使用时间掩蔽特性。第三层:除了使用频域掩蔽和时间掩蔽特性之外,第三层使用了临界频带滤波器,并且把声音分成非等带
12、宽的子带。练习与思考题1、什么叫做听阈?什么叫做痛阈?2、什么叫做频域掩蔽?什么叫做时域掩蔽?3、MPEG-1 的层 1、2 和 3 编码分别使用了听觉系统的什么特性?4、MPEG-1 的层 1、2 和 3 编码器的声音输出速率范围分别是多少?12、MPEG 现象1、视像数据的冗余视像数据之所以能够被压缩,主要是视像数据中存在大量的冗余数据。在保证视像质量相同的情况下,谁挖掘和利用的冗余数据越多,谁的视像数据速率就越低。视觉冗余2、MPEG-1 视像视像数据的压缩算法(基本方法)(1)在空间方向上,采用与 JPEG 类似的算法来去掉空间冗余数据;(2)在时间方向上,采用移动补偿算法来去掉时间冗
13、余数据。MPEG 专家组为此开发了两项重要技术,一项是定义了视像数据的结构,另一项是定义了图像的三种类型。3、MPEG 三种图像压缩后的典型值图像类型 I P B 平均数据量(b)/帧 150000 50000 20000 38000MPEG-1 CIG 格式(1.15Mb/s) 近似压缩比 7:1 20:1 50:1 27:1练习与思考题1、电视图像数据中有哪些冗余数据可去掉,目前分别采用什么方法减少冗余数据?2、在 MPEG 视像数据压缩技术中,目前利用了视觉系统的哪两种特性?3、MPEG-1 编码器输出的视像的数据速率大约是多少?4、MPEG 专家组在制定 MPEG-1/-2Video
14、标准时定义了哪几种图像?哪种图像的压缩率最高?哪种图像的压缩率最低?5、电视图像的空间分辨率和时间分辨率是什么意思?6、在 MPEG-1 和 MPEG-2 中,典型的宏块由多少个像素组成?子采样为 4:2:0 的宏块分成多少个亮度图块、红色差图块和蓝色差图块?每个图块由多少个像素组成?14、光盘存储器1、CDCD 的结构(光道结构)CD 的光道是螺旋形的在光盘的内外区,CD 转动的角速度是不同的,而它的线速度是恒定的,就是光盘的光学读出头相对于盘片运动的线速度是恒定的,通常用 CLV 表示。由于采用了恒定线速度,所以内外光道的记录密度(位数/英寸)可以做到一样,这样盘片就得到充分利用,可以达到
15、它应用的数据存储量,但随机存储性变得较差,控制也比较复杂数据是怎样写入到 CD 上的CD 是借助激光来写入和读出数据的。激光唱盘既不同于磁光盘的记录原理,也不同于相变光盘的记录原理,而是利用在盘上压制凹坑的机械办法,利用凹坑的边缘来记录“1” ,而凹坑和非凹坑的平坦部分记录“0” ,使用激光来读出。2、CD-Audio采样频率和样本大小激光唱盘音乐信号的样本位数为 16;在激光唱盘上 1 秒钟的声音需要占据的存储空间为:1 秒44100 样本/秒 2 字节/ 样本2(左右两个通道) =176.4 千字节声音数据的通道编码物理盘上记录的数据和真正的声音数据之间需要做变换处理,这种处理统称为通道编
16、码。激光唱盘使用的通道编码叫做 8 到 14 位调制编码(EFM) ,就是把一个 8 位(1B)的数据用 14 位表示。为什么要做通道编码为了改善读出信号的质量,使得读出信号的频带变窄为了在记录信号中提取同步信号3、DVD 的存储容量是怎样提高的.使用波长较短的激光 .加大光盘的记录区域 使用双面和多层记录 .改进调制和纠错方法练习与思考题1、只读光盘是如何记录“0”和“1”的?2、CD-DA 的音乐信号的采样频率为什么选择 44.1kHz?3、为什么物理线路上传输的数字信号都需要采用通道编码?4、CD 中的 EFM 是什么意思?5、从 CD 过度到 DVD,科学和工程技术人员采取了哪些主要技
17、术?15、光盘存储格式光盘存储格式包含逻辑格式和物理格式。 逻辑格式实际上是文件格式的同义词,它规定如何把文件组织到光盘上以及指定文件在光盘上的物理位置,包括文件的目录结构、文件大小以及所需盘片数目等事项;物理格式则规定数据如何放在光盘上,这些数据包括物理扇区的地址、数据的类型、数据块的大小、错误检测和校正码等。1、CD-ROM 文件系统文件系统或称文件格式是在存储媒体上组织数据的方法,包括文件命名、文件目录、卷和文件检索。用 CD-ROM 作计算机存储媒体的文件系统称为 CD-ROM 文件系统。ISO9660 就是为 CD-ROM 制定的文件系统。ISO9660 概要ISO9660 是 IS
18、O 发布的 CD-ROM 文件系统标准,定义卷描述符、目录结构和路径表三种类型的数据结构。格式有“逻辑格式”和“物理格式” ,把 CD-ROM 文件系统称为“逻辑格式” ,而文件在 CD-ROM 盘上的存储格式称为“物理格式” 。 CD-ROM 物理格式的标准化意味着所有 CD-ROM 生产厂家都应遵循这种标准,这也就意味着 CD-ROM 上的信息可在不同的信息处理系统之间交换,但只能在这个物理层上实现交换。由于 CD-ROM 面对用户的是文件,如文本文件 、图像文件、声音文件、影视文件等,这就需要一个文件系统和文件 管理系统,这就可使用户把 CD-ROM 当成一个文件 集来看待,而不是让用户
19、从物理上去看待 CD-ROM 盘。因此,仅有物理格式标准化还不够,还需要有一个如何把文件和文件 目录放到 CD-ROM 盘上的逻辑格式标准,这就是文件系统标准。CDROM 的逻辑结构逻辑结构设计定义 CD-ROM 的逻辑格式与定义磁盘的逻辑格式要考虑的因素不同。最主要因素是,CD-ROM 是只读存储器,而磁盘是可读写存储器,因此对 CD-ROM 盘上的文件和文件目录就不需要有删除、添加和重命名等与“写”操作有关的功能。目录结构CD-ROM 没有采用这种显式分层目录结构,而是采用隐式分层目录结构,但也把目录当作文件看待,并且把整个目录包含在 1 个或少数几个文件中。包含目录的文件称为目录文件。练习与思考题、试论 CD 标准的重要性、什么叫做 CD 盘的物理格式?、CD-ROM 的扇区地址“00:10:65”表示什么差别?、CD-ROM 的逻辑格式是什么意思?、试论 CD-ROM 的文件目录结构与磁盘的文件结构有何差别?