多媒体技术基础(大学计算机基础课件).ppt-道客多多

资源描述

1、多媒体技术基础,大学计算机基础精品课程组,2019/7/3,桂林航专,2,1多媒体基本概念（1）媒体、多媒体及多媒体技术。（2）多媒体信息的类型。（3）多媒体信息处理的关键技术。（4）多媒体计算机的硬件系统和软件系统。 2音频信息处理（1）模拟音频信号的数字化。（2）常用的声音压缩标准。（3）声音文件格式。（4）Windows XP的“录音机”使用初步。,教学目标,2019/7/3,桂林航专,3,3图形和图像信息处理（1）矢量图和位图。（2）图像的分辨率、色彩深度、色彩模型。（3）图像数据的容量、图像压缩。（4）图像文件格式。（5）Windows的画图程序及其使用方法。 4视频信息处理基本知识

2、（1）视频信号及其数字化（2）视频压缩和视频文件格式（3）Windows的媒体播放器及其使用方法。,教学目标,2019/7/3,桂林航专,4,5PowerPoint及多媒体作品制作（1）PowerPoint的工作界面（2）使用设计模版创建演示文稿（选择版式；文字的输入与格式化；插入图片、声音或影片；插入表格或图表；选择配色方案与背景）（3）幻灯片的插入、移动与删除（4）设置幻灯片的切换方式（5）设置自定义动画与超链接（6）设置演示文稿的放映方式,教学目标,2019/7/3,桂林航专,5,多媒体技术不是各种信息媒体的简单复合，它是一种把文本(Text)、图形(Graphics)、图像(Image

3、s)、动画(Animation)和声音(Sound)等形式的信息结合在一起，并通过计算机进行综合处理和控制，能支持完成一系列交互式操作的信息技术。,多媒体技术的基本概念,2019/7/3,桂林航专,6,1媒体(Medium，复数Media)又称介质，是存储、传播、表现信息的载体。根据获得媒体的途径，可将媒体分为视觉媒体、听觉媒体、触觉媒体、嗅觉媒体等。其中视觉媒体包括位图图像、矢量图形、动态图像和文字等；听觉媒体包括声响、语音和音乐；触觉媒体包括振动、运动等。按照CCITT(国际电报电话咨询委员会)的定义，媒体分为：1.感觉媒体，指图形、图像、语音等。2.表示媒体，指图像编码、声音编码。

4、3.显示媒体，主要是表达用户信息的物理设备，如显示器、打印机、扬声器、鼠标、扫描仪。 4.存储媒体，指存储数据的物理设备，如软盘、硬盘、光盘等。 5.传输媒体，指传输数据的物理设备，如同轴电缆、双绞线、光纤、无线链路等。,多媒体和多媒体技术,多媒体技术的基本概念,2019/7/3,桂林航专,7,在计算机信息领域中泛指一切信息载体，此时有两种具体含义：1.指信息的存储实体，如磁带、磁盘、光盘和半导体存储器；2.指信息的表现形式或多种信息的载体（媒介），概括为声（声音）、文（文字）、图（静止图像和动态视频）、形（波形、图形、动画）、数（各种采集或生成的数据）5 类。在计算机领域中，文字、图形、图

5、像、声音、动画和视频等都可以称为媒体。,多媒体和多媒体技术,多媒体技术的基本概念,2019/7/3,桂林航专,8,2多媒体多媒体（Multimedia）通常指的是感觉媒体的组合。可以理解为文字、图形、图像、声音、动画和视频等多种媒体合成的人-机交互、信息交流和传播媒体。计算机能处理的多媒体信息从时效上可分为两大类：（1）静态媒体包括文字、图形、图像。（2）动态媒体包括声音、动画、视频。,多媒体和多媒体技术,多媒体技术的基本概念,2019/7/3,桂林航专,9,3多媒体技术多媒体技术(Multimedia Technology)是指利用计算机综合处理多种媒体信息（文字、图形、图像、声

6、音、动画和视频等），使多种信息建立逻辑连接，并集成为具有实时的交互性系统的技术。多媒体技术是一种基于计算机的综合技术。,多媒体和多媒体技术,多媒体技术的基本概念,2019/7/3,桂林航专,10,1文本文本（Text）是用得最多的一种符号媒体形式，它包括了字母、数字以及各种专用符号。超文本是一种文本，与传统的文本文件相比主要差别是，传统文本是以线性方式组织的，而超文本是以非线性方式组织的。超文本(Hypertext)是用超链接的方法，将各种不同空间的文字信息组织在一起的网状文本。超文本更是一种用户介面范式，用以显示文本及与文本之间相关的内容。,多媒体信息的类型,多媒体技术的基本概念,2

7、019/7/3,桂林航专,11,2图形图形（Graphics）指利用相关的绘图软件提供的绘图功能绘制直线、圆、圆弧、任意曲线等组成的形状。在图形文件中只记录生成图的算法和图上的某些特征点，因此也称矢量图。微机上常用的矢量图形文件有：“.3DS”（用于 3D 造型）、“.DXF”（用于CAD）、“.WMF”（用于桌面出版）等等。由于图形只保存算法和特征点，因此占用的存储空间很小。但显示时需经过重新计算，因而显示速度相对慢些。,多媒体信息的类型,多媒体技术的基本概念,2019/7/3,桂林航专,12,3图像图像（Image）指凡是能为人类视觉系统所感知的信息形式或人们心目中的有形想像。可

8、由扫描仪、数字照相机、摄像机等设备进行画面录入，数字化后以位图形式存储。图像文件在计算机中的存储格式有多种，如 BMP、PCX、TIF、TGA、GIF、JPG 等，一般数据量都较大。,多媒体信息的类型,多媒体技术的基本概念,2019/7/3,桂林航专,13,4音频音频（Audio）包括音乐、话语以及各种动物和自然界（如风、雨、雷等）发出的各种声音。属于听觉类媒体，其频率范围大约在20Hz20kHz之间。,多媒体信息的类型,多媒体技术的基本概念,2019/7/3,桂林航专,14,5动画动画（Animation）可以认为是运动的图画。动画是利用人的视觉暂留特性，当一系列形或像的画面按一定的时

9、间在人的视线中经过时，人脑就会产生物体运动的印象。计算机动画就是利用计算机生成一系列可供实时演播的画面技术。,多媒体信息的类型,多媒体技术的基本概念,2019/7/3,桂林航专,15,6视频视频（Video）是一系列的静态图像或图形在一定时间内连续变化的结果。通常可通过录像带、摄像机、影碟机等视频信号源设备获取。,多媒体信息的类型,多媒体技术的基本概念,2019/7/3,桂林航专,16,多媒体强调的是交互式综合处理多种信息媒体。从本质上看，它具有多样性、集成性、交互性和实时性这四个主要特征。 1多样性所谓“多样性”是指媒体多样化或多维化，这些媒体包括文字、声音、图形、图像、动画、视频等。多

10、媒体信息的多样化不仅仅是指输入，而且还指输出。,多媒体的基本特征,多媒体技术的基本概念,2019/7/3,桂林航专,17,2集成性多媒体技术将各类媒体的设备集成在一起，同时也将多媒体信息或表现形式以及处理手段集成在同一个系统之中。多媒体的集成性包括两方面，一是多种信息媒体的集成，二是处理这些媒体的设备和系统的集成。在硬件上，具有能够处理多媒体信息的高速并行处理机系统、大容量的存储、适合多媒体、多通道的输入输出能力及外设、宽带的通信网络接口。在软件上，有集成一体化的多媒体操作系统，适合多媒体信息管理和使用的软件系统、创作工具和高效的应用软件等。,多媒体的基本特征,多媒体技术的基本概念,201

11、9/7/3,桂林航专,18,3交互性交互性是多媒体技术的关键特性。它使用户可以更有效地控制和使用信息，增加对信息的注意和理解。在多媒体系统中，除了操作上控制自如之外，在媒体综合处理上也可以随心所欲，这种交互操作也必然要求多媒体具有实时性，要求整个系统的软硬件系统都能实时响应。从数据库中查找某人的相貌、声音及文字材料，这是初级交互应用。通过交互特性使用户介入到信息过程中，不仅仅是提取信息，这是中级交互应用。当我们完全地进入到一个与信息环境一体化的虚拟信息空间中时，这是高级交互应用。,多媒体的基本特征,多媒体技术的基本概念,2019/7/3,桂林航专,19,4实时性多媒体技术的“实时性

12、”，是由于多种媒体集成时，其中的声音及活动的视频图像是和时间密切相关的。因此多媒体技术必然要支持实时处理，例如电视会议系统的声音和图像不允许存在停顿，必须严格同步。,多媒体的基本特征,多媒体技术的基本概念,2019/7/3,桂林航专,20,多媒体数据压缩/解压缩技术多媒体数据存储技术多媒体专用芯片技术多媒体输入/输出技术多媒体软件技术多媒体通信技术虚拟现实技术,多媒体信息处理的关键技术,多媒体技术的基本概念,2019/7/3,桂林航专,21,1多媒体数据压缩/解压缩技术多媒体信息数字化后的数据量非常庞大，必须对数据进行压缩编码，既可节省存储空间，又可提高传输效率，使得计算机能够实

13、时处理和正常播放视频和音频信息。,多媒体信息处理的关键技术,多媒体技术的基本概念,2019/7/3,桂林航专,22,2多媒体数据存储技术多媒体数据量非常大，如何实现大容量信息的存储是多媒体技术关键所在，实现这一技术主要还是依靠数据的压缩和解压缩技术，利用数据压缩技术，在一张CD-ROM光盘上能够存取70多分钟全运动的视频图像或者十几个小时的语言信息或数千幅静止图像。,多媒体信息处理的关键技术,多媒体技术的基本概念,2019/7/3,桂林航专,23,3多媒体专用芯片技术。多媒体信息的处理需要大量的计算，只有采用专用芯片，才能取得满意的效果。多媒体计算机专用芯片可归纳为两种类型：一种是固定功能

14、的芯片；另一种是可编程的数字信号处理器（DSP）芯片。,多媒体信息处理的关键技术,多媒体技术的基本概念,2019/7/3,桂林航专,24,4多媒体输入与输出技术多媒体输入/输出技术包括媒体变换技术、媒体识别技术、媒体理解技术和媒体综合技术。 5多媒体软件技术多媒体软件技术主要包括：多媒体操作系统、多媒体素材采集与制作技术、多媒体编辑与创作工具、多媒体数据库技术、超文本/超媒体技术和多媒体应用开发技术。,多媒体信息处理的关键技术,多媒体技术的基本概念,2019/7/3,桂林航专,25,6多媒体通信技术多媒体通信技术包含语音压缩、图像压缩及多媒体的混合传输技术。 7虚拟现实技术虚拟现实就是

15、利用计算机技术生成的一个逼真的视觉、听觉、触觉及嗅觉等的感觉世界，用户可以用人的自然技能对这个生成的虚拟实体进行交互考察。,多媒体信息处理的关键技术,多媒体技术的基本概念,2019/7/3,桂林航专,26,多媒体计算机系统(Multimedia Computer System)是指能综合处理多种媒体信息，使信息之间能建立联系，并具有交互性的完整的计算机系统。多媒体计算机系统一般由多媒体硬件系统和多媒体软件系统组成。,多媒体计算机系统的构成,多媒体技术的基本概念,2019/7/3,桂林航专,27,交互式多媒体计算机协会 IMA Interactive Multimedia Associatio

16、n，由多媒体产业供应商和最终用户组成，主要支持者是Microsoft、Tandy、NEC等公司，负责发布MPC(多媒体个人计算机)规范 1991年发布MPC1.0版规范 1993年发布MPC2.0版规范 1995年发布MPC3.0版规范 1996年发布MPC4.0版规范,多媒体计算机技术规格,多媒体技术的基本概念,2019/7/3,桂林航专,28,MPC1MPC4技术规格,多媒体技术的基本概念,2019/7/3,桂林航专,29,多媒体计算机多媒体个人计算机是在现有PC机基础上加上一些硬件板卡及相应软件使其具有综合处理声、文、图信息的功能。 (1)声/像输入设备：光驱、刻录机、音效卡、话筒、扫

17、描仪、录音机、摄像机等。 (2)声/像输出设备：刻录光驱、音效卡、录音录像机、投影仪、打印机等。 (3)功能卡：电视卡、视频采集卡、视频输出卡、网卡、VCD压缩卡等。 (4)软件支持：音响、视频和通讯信息以及实时、多任务处理软件。,MPC实质,多媒体技术的基本概念,2019/7/3,桂林航专,30,多媒体计算机的硬件系统,多媒体技术的基本概念,2019/7/3,桂林航专,31,1. 数码相机的结构,(1)CCD矩形网格阵列CCD是数码照相机的成像部件，可以将照射于其上的光信号转变为电压信号。CCD芯片上的每一个光敏元件对应将来生成的图像的一个像素，CCD芯片上光敏元件的密度决定了最终成像的分辨

18、率。,资料：多媒体输入输出设备数码照相机,数码相机（Digital Camera,DC）是将模拟图像输入转换为数字图像的设备。,多媒体技术的基本概念,2019/7/3,桂林航专,32,(2)存储介质数码照相机内部有存储部件，通常存储介质由普通的动态随机存取存储器、闪速存储器或小型硬盘组成。存储部件上可存储多幅图像，它们无需电池供电也可以长时间保存数字图像。,资料：多媒体输入输出设备数码照相机,多媒体技术的基本概念,2019/7/3,桂林航专,33,2. 数码照相机的工作过程,目前数码相机的核心成像部件有两种：一种是广泛使用的CCD（电荷耦合）元件；另一种是CMOS（互补金属氧化物导体）器件，C

19、CD的感觉比CMOS更为灵敏，在昏暗环境下有更好的效果，而CMOS的造价低，并且更为省电。用数码照相机拍照时，进入照相机镜头的光线聚焦在CCD上。当照相机判定已经聚集了足够的电荷（即相片已经被合适地曝光）时，就“读出”在CCD单元中的电荷，并传送给模数转换器，模数转换器把每一个模拟电平用二进制数量化。从模数转换器输出的数据传送到数字信号处理器中对数据进行压缩后存储在照相机的存储器中。,资料：多媒体输入输出设备数码照相机,多媒体技术的基本概念,2019/7/3,桂林航专,34,3. 数码照相机的主要技术指标,(1)CCD像素数。数码相机的CCD芯片上光敏元件数量的多少称之为数码相机的像素数，是目

20、前衡量数码相机档次的主要技术指标，决定了数码相机的成像质量。 (2)色彩深度。色彩深度用来描述生成的图像所能包含的颜色数。数码照相机的色彩深度有 24Bit、30Bit、高档的可达到36Bit。 (3)感光度。是衡量数码相机感光灵敏度高低的一项指标。 (4)存储功能。影像的数字化存储是数码相机的特色，在选购高像素数码相机时，要尽可能选择能采用更高容量存储介质的数码相机。 (5)输出形式。输出接口为串形口、USB接口、TV接口等。,资料：多媒体输入输出设备数码照相机,多媒体技术的基本概念,2019/7/3,桂林航专,35,数码摄像机(Digital Video Recorder,DV)j是最主要

21、的数字视频输入设备，可以直接生成数字视频信息保存到数字格式的磁带存储设备（DC带），也能将数字视频信息保存到大容量的XD和SD卡或光盘、硬盘等存储设备上。它的优点是动态拍摄效果好，电池容量大，DV带也能支持长时间的拍摄。由于数码摄像机使用的小尺寸电荷耦合器件CCD与其镜头不匹配，在拍摄静止图像时的效果不如数码相机。,资料：多媒体输入输出设备数码摄像机,多媒体技术的基本概念,2019/7/3,桂林航专,36,1系统软件（1）多媒体操作系统又称多媒体核心系统。具有实时任务调度、多媒体数据转换和同步控制机制，对多媒体设备的驱动和控制以及具有图形和声像功能的用户接口等。（2）多媒体素材制作软件及多

22、媒体函数库为多媒体应用程序进行数据准备的，作为开发环境的工具库，供开发者调用。,多媒体计算机的软件系统,多媒体技术的基本概念,2019/7/3,桂林航专,37,1系统软件（3）多媒体创作工具与开发环境在多媒体操作系统上进行开发的软件工具，用于生成多媒体应用软件。（4）多媒体外部设备驱动程序和接口程序直接与计算机硬件相关，完成设备初始化、设备的打开和关闭设备操作，基于硬件的压缩/解压缩、图像快速变换及功能调用等。,多媒体计算机的软件系统,多媒体技术的基本概念,2019/7/3,桂林航专,38,2应用软件多媒体应用软件又称多媒体应用系统。它是由各种应用领域的专家或开发人员利用多媒体开发工具软件

23、或计算机语言，组织编排大量的多媒体数据而成为最终多媒体产品，是直接面向用户的。,多媒体计算机的软件系统,多媒体技术的基本概念,2019/7/3,桂林航专,39,基于流程图的创作工具。这类工具的代表是MacroMedia公司的Authorware。基于时间序列的创作工具。这类工具的代表是MacroMedia公司的Action、Director。基于描述语言或描述符号的创作工具。这类工具的代表是Macitosh的Hypercard(超卡)及Asymetrix公司的Multimedia ToolBook。,多媒体创作工具,多媒体技术的基本概念,2019/7/3,桂林航专,40,二、音频信息处

24、理,多媒体信息处理是指对文字、声音、图形、静态影像、活动影像等多媒体信息在计算机运算下的综合处理。,音频信息处理,2019/7/3,桂林航专,41,1、音频音频（Audio）可分为波形声音、语音和音乐。波形声音实际上已经包含了所有的声音形式，它可以将任何声音都进行采样量化，相应的文件格式是WAV 文件。语音也是一种波形，所以和波形声音的文件格式相同。音乐是符号化了的声音，乐谱可转变为符号媒体形式。对应的文件格式是CDA文件。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,42,2.数字音频数字音频是指用一系列的数字来表示音频信号，即把模拟音频信号转换成有限个数字表

25、示的离散序列，从而实现音频数字化。数字音频的质量取决于采样频率、量化位数和声道数三个因素。在这一处理技术中，要考虑采样、量化和编码的问题。音频信号数字化过程如下: (1) 选择采样频率，进行采样； (2) 选择分辨率，进行量化； (3) 编码形成声音文件。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,43,1）采样（sampling）采样就是把时间上连续的信号，通过抽取样本，变成在时间上不连续的信号序列，即A/D模数转换，其功能是将模拟信号变换成数字信号。采样频率是指一秒钟时间内采样的次数。根据采样定理，采样的频率至少高于信号最高频率的2倍。采样的频率越高，声音

26、“回放”出来的质量也越高，但是要求的存储容量也越大。在计算机多媒体音频处理中，采样频率通常采用三种：11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。其中22kHz和44kHz采样频率是最常采用的频率。常见的CD唱盘的采样频率即为44.1KHz。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,44,采样示例,音频信息处理,2019/7/3,桂林航专,45,2）量化将采样后得到的音频信息数字化的过程称为量化。它是指把采样所得的值（通常为反映某一瞬间声波幅度的电压值）数字化，即用二进制来表示模拟量。用来表示一个电压模拟值的二进数

27、位越多，音频的分辨率也越高，声音越精细。一个1bit可以提供两个台阶(两种状态)，并且增加6dB的动态范围。国际标准的语音编码采用8位，即可有28即256个状态(量化级)，对应6*848dB的动态范围。在多媒体中，对于音频，分辨率(量化的位数)可采用16位，它对应216即65536个量化级，对应96dB的动态范围。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,46,2）量化,数字音频信息处理基础知识,在多媒体个人计算机中往往采用字长16bit或32bit进行采样，以获得好的音质。,在多媒体个人计算机中往往采用字长16bit或32bit进行采样，以获得好的音质。,音

28、频信息处理,2019/7/3,桂林航专,47,3)编码编码是指将采样后量化的数据按照一定的数据格式编排(含数据压缩). 对模拟音频信号进行采样、量化、编码后便得到数字音频（数字化的波形声音）。数字音频是一种用二进制表示的串行比特流，其数据是按时间顺序组织的，其质量取决于采样频率、采样精度、声道数目、使用的压缩编码方法以及比特率。声音通道的个数表明声音记录是只产生一个波形（单声道）还是产生两个波形（立体声双声道）。立体声的声音有空间感，但需要两倍的存储空间。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,48,比特率也称为码率，它指的是每秒钟播放（传送）的数据量。数字未

29、压缩前，码率的计算公式为波形声音的码率=采样频率量化位数声道数以字节为单位，模拟波形声音被数字化后音频文件的存储量(假定未经压缩)为：存储量=采样频率量化位数/8声道数时间数字化声音的数据量很大。例如，用44.1KHz的采样频率进行采样，量化位数选用16位，则录制1秒的立体声节目，其波形文件所需的存储量为：4410016821=176400(字节),数字音频信息处理基础知识,10分钟呢？,需要100MB的硬盘空间,音频信息处理,2019/7/3,桂林航专,49,由于音频数据存在着很大的冗余，加上人类听觉只可以听到20Hz20KHz范围内的声音，因而可实现高压缩比的压缩存储。实际使用的

30、编码方法都是与压缩算法联系在一起的。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,50,3.常用的声音压缩标准压缩编码算法包括有损压缩和无损压缩。有损压缩算法指解压后数据不能完全复原，要丢失一部分信息。压缩比越大，丢掉的信息越多，信号还原后失真越大。无损压缩算法指解压后数据能够完全复原。目前应用最为普遍的全频带声音的压缩编码方法是MPEG-1、MPEG-2、杜比数字AC-3和MPEG-4。,数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,51,MPEG-1国际标准化组织(ISO)的运动图像专家组（Moving Picture Experts

31、Group,MPEG）1992年制订的数字存储运动图像及伴音编码标准。 MPEG-1声音压缩编码标准分为三个层次层1（layer1）的编码较简单，主要用于数字盒式录音磁带；层2（layer2）的算法复杂度中等，其应用包括数字音频广播( DAB )和VCD等；层3（layer3）的编码较复杂，主要用于在因特网上高质声音的传播。当今流行的MP3音乐就是一种采用MPEG-1层3编码的高质量数字音乐，它能达到10倍左右的压缩比，使一张普通CD光盘上可以存储大约100首MP3歌曲。在影像格式方面，由于受到CD传输速率(1.5Mbs)的限制，其影像分辨率比现行电视要差些。在声音格式方面，用256k

32、bs速率可进行与CD相同音质的立体声编码。,常用的声音压缩标准,音频信息处理,2019/7/3,桂林航专,52,MPEG-2MPEG-2制定于1994年，是MPEG-1的扩充、丰富和完善。可提供广播级的视像和CD级的音质。 MPEG-2的音频编码可提供左右中和两个环绕声道以及一个加重低音声道，多达7个伴音声道。除了做为DVD的指定标准外，MPEG-2还可用于广播、有线电视网、电缆网络以及卫星直播(Direct Broadcast Satellite)。 MPEG-2标准的视频数据速率为4.15Mbs，能提供720480(NTSC)或720576(PAL)分辨率的广播级质量的视像，适用于包括宽

33、屏幕和高清晰度电视(HDTV)在内的高质量电视广播。,常用的声音压缩标准,音频信息处理,2019/7/3,桂林航专,53,杜比数字AC-3AC-3是杜比数字公司(Dolby Digital)。 MPEG-2标准的视频数据速率为4.15Mbs，能提供720480(NTSC)或720576(PAL)分辨率的广播级质量的视像，适用于包括宽屏幕和高清晰度电视(HDTV)在内的高质量电视广播。,常用的声音压缩标准,音频信息处理,2019/7/3,桂林航专,54,MPEG-4MPEG-4于1998设计完成。该规范于2000年成为一项国际标准。适用于窄带可视电话，通过语音与图像的合成，利用分数几何、计算机显

34、示与人工智能技术以最少量的数据来建立精确的画面，是交互式基于内容的压缩标准。,常用的声音压缩标准,音频信息处理,2019/7/3,桂林航专,55,4.常用的声音存储格式 1）wave文件(*.wav) 2）midi文件(*.mid) 3）CD Audio (*.cda) 4）Mpeg-3 (*.mp3) 5）Real Audio(*.ra和*.rm) 6）Windows Media Audio格式(*.wma),数字音频信息处理基础知识,音频信息处理,2019/7/3,桂林航专,56,1）wave文件(*.wav) WAV文件也称为波形文件，是Windows所使用的标准数字音频，文件的扩展名是

35、WAV。该格式记录声音的波形，故只要采样率高、采样字节长、机器速度快，利用该格式记录的声音文件能够和原声基本一致，质量非常高。使用波形文件能够记录和重现各种声音，从不规则的噪声到美妙的音乐。波形文件最大的缺点就是文件太大，不适合长时间记录声音。,常用的声音存储格式,音频信息处理,2019/7/3,桂林航专,57,2）MIDI文件 (*.mid) MIDI是Musical Instrument Digital Interface（乐器数字接口）的缩写。是目前最成熟的音乐格式，已成为一种行业标准。MIDI文件不对音乐进行采样，记录的不是乐曲本身，而是对音乐的每个音符记录为一个数字，即记录的是一些描

36、述乐曲演奏过程中的指令。所以与波形文件相比文件要小得多，可以满足长时间音乐的需要。MIDI标准规定了各种音调的混合及发音，通过输出装置可以将这些数字重新合成为音乐。,常用的声音存储格式,音频信息处理,2019/7/3,桂林航专,58,3）CD Audio (*.cda) 唱片采用的格式，记录的是波形流，音质纯正，但无法编辑，文件长度大。 4）Mpeg-3 (*.mp3) 是现在最流行的声音文件格式，采用MPEG-1 Audio Layer 3压缩格式。压缩率高，在网络可视电话通信方面应用广泛，但音质稍逊于CD唱片。 5）Real Audio(*.ra和*.rm) 高压缩比，极小的失真。 6）W

37、indows Media Audio格式(*.wma)压缩比及音质方面均超过了MP3，更是远胜于RA，即使在较低的采样频率下也能产生较好的音质，支持流式播放。,常用的声音存储格式,音频信息处理,2019/7/3,桂林航专,59,“录音机”是用于数字录音的一个多媒体程序。使用“录音机”可以录制、混合、播放和编辑声音文件(.wav文件)，也可以将声音文件链接或插入到另一文档中。使用“录音机”程序，计算机必须安装声卡。如果要现场录音，还必须配一个话筒。启动“录音机”开始所有程序附件娱乐录音机,“录音机” 音频信息处理软件的使用,音频信息处理,2019/7/3,桂林航专,60,1.打开和播放声音文

38、件 2.录制声音文件 3.编辑声音文件（1）裁剪首、尾声音片段编辑删除当前位置之前/后的内容（2）裁剪中间声音片段（3）插入声音编辑插入文件（4）文件混音编辑与文件混合（5）改变音量效果加大音量或降低音量（6）添加回音效果添加回音 4.保存声音文件 5.音量控制开始所有程序附件娱乐音量控制,“录音机” 音频信息处理软件的使用,音频信息处理,2019/7/3,桂林航专,61,图形（Graph）一般指用计算机绘制的画面，如直线、圆、圆弧、任意曲线和图表等;图像（Image）则是指由输入设备（如数码相机、摄像机、扫描仪等）捕捉的实际场景画面或以数字形式存储的任意画图。 1矢量图和位图（

39、1）位图（bit-mapped Image）图像又称点阵图像或位图图像。位图式图像是由许多点组成的，这些点称为像素（pixel）。像素是构成位图图像的最小单位。当许许多多不同颜色和亮度的点(即像素)组合在一起便构成了一幅完整的图像。位图的清晰度与像素点的多少有关，单位面积内像素点数目越多则图像越清晰，否则越模糊。位图图像适用于逼真照片或要求精细细节的图像。,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,62,图 1 位图原始图图 2 放大后位图,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,63,1矢量图和位图（2）矢量图 (Vector-ba

40、sed Image) 图形又称矢量图形、几何图形或矢量图，与位图不同，矢量图没有分辨率，也不使用像素。通常，它的图形形状主要由点和线段组成。矢量图是用一系列计算机指令来描述和记录一幅图，如画点、画线、画曲线、画圆、画矩形等图元，分别对应不同的画图指令。,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,64,图 3 放大前矢量图图 4 放大后矢量图,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,65,2、图像分辨率和显示分辨率 1) 显示分辨率计量单位：像数/英寸(ppi) 显示分辨率是指屏幕的最大显示区域内，水平与垂直方向的像素数。例如：l0247

41、68 的分辨率表示屏幕可以显示 768 行像素，每行有 1024个像素。 2）图像分辨率计量单位：点数/英寸(dpi) 图像分辨率是指组成一幅图像的像素个数。例如：400300 的图像分辨率表示该幅图像由 300 行，每行 400 个像素组成。,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,66,图形和图像,3、图像色彩深度和色彩模型 1）色彩深度(又称像素深度) 是指位图中记录每个像素点的颜色所占的位数，它决定了彩色图像中可出现有最多顏色数。 2）色彩模型 (1) RGB 模式：用红(R)、绿(G)、蓝(B)三基色来描述颜色的方式叫 RGB 模式。 (2) CMYK 模

42、式：该模式是一种基于四色印刷的印刷模式，是相减混色模式。C 表示青色，M 表示品红色，Y表示黄色，K表示黑色。 (3) HSB 模式：该模式是利用颜色的三要素来表示颜色的，H 表示色调，S 表示饱和度，B 表示亮度,图形、图像和视频信息处理,2019/7/3,桂林航专,67,4、图像数据的容量图像数据量=图像的总像素图像色彩深度/8(Byte) 例如，一幅1024768真彩色（24位）的图像，其文件大小为：102476824/8=2.25MByte,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,68,5、图像压缩基本概念由于图像的数据量很大，需经过压缩后再进行存储和传

43、输。如果采用无损压缩，压缩比不会太高。采用有损压缩，则可能对图像的质量有影响，通常采用一种折衷的方案。在图像压缩中，要考虑实时性问题，压缩和解压都需要时间，为了减少压缩时间，通常采用硬件来完成，这样可以缩短由压缩和解压带来的延迟。图像压缩比,显然，压缩比越大，压缩后的图像文件数据量越小,图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,69,6、常用的图形和图像的文件格式（1）BMP格式(*.bmp) （2）GIF 格式(*.gif) （3）PNG格式(*.png) （4）TIF/TIFF格式(*.tif/*.tiff) （5）JPG/JPEG格式(*.jpg/*.jpeg

44、) （6）PSD 格式(*.psd) （7）WMF格式(*.wmf),图形和图像,图形、图像和视频信息处理,2019/7/3,桂林航专,70,“画图”程序是Windows XP自带的一个位图编辑器，用于绘制和编辑图像，对各种位图格式的图像进行简单的加工，例如改色、变形、裁剪、添加文字等，也可以对图像进行复制、移动、保存和打印等操作 “画图”程序较小，调用方便，其功能覆盖了图像处理的基本操作，可满足图像简单处理的需要，并为进一步使用专业的图像处理软件打下基础。,Windows XP的图像处理,图形、图像和视频信息处理,2019/7/3,桂林航专,71,1.“画图”软件的启动和关闭 2.“画图”窗

45、口的组成 3.“画图”的基本操作（1）新建或打开图像文件（2）确定图像属性图像属性（3）图像编辑（4）保存图像文件 4.图形绘制（1）使用工具箱（2）绘制直线、曲线、矩形、椭圆形和多边形,Windows XP的图像处理,图形、图像和视频信息处理,2019/7/3,桂林航专,72,5.图片的颜色处理（1）使用前景色和背景色（2）用颜色填充区域或对象（3）创造喷雾效果（4）创建自定义颜色（5）改变图像的色调（6）更改线条的颜色（7）在不同区域或对象之间复制颜色 6.图片的修改和变形（1）清除小块区域（2）清除大块区域（3）清除整幅图像（4）图形变形（5）改变图片的显示比例,Windows XP的

46、图像处理,图形、图像和视频信息处理,2019/7/3,桂林航专,73,7.图片的复制、剪切和粘贴（1）选择图片的一部分或全部（2）移动部分图片（3）复制图片到剪贴板（4）复制部分图片作为文件保存（5）粘贴图片从剪贴板粘贴粘贴文件 8.插入文字,Windows XP的图像处理,图形、图像和视频信息处理,2019/7/3,桂林航专,74,1、视频视频(Video)是由一幅幅内容连续的图像所组成的，每一幅单独的图像就是视频的一帧。当连续的图像(即视频帧)按照一定的速度快速播放时(25 帧/秒或 30 帧/秒)，由于人眼的视觉暂留现象，就会产生连续的动态画面效果，也就是所谓的视频。视频信号按其特

47、点可分为模拟和数字两种形式。早期的电视等视频信号的记录、存储和传输都是模拟信号；现在出现的VCD、SVCD、DVD、数字式便携摄像机都是数字信号。,视频信息处理基本知识,图形、图像和视频信息处理,2019/7/3,桂林航专,75,1、视频在模拟视频中常用的三种视频制式标准（1）NTSC制式(30帧/秒，525行/帧) ，称为正交平衡调幅制，1952年美国国家电视标准委员会定义的彩色电视广播标准。被美国、加拿大等大部分西半球国家及日本、韩国、菲律宾等国采用。（2）PAL制式(25帧/秒，625行/帧) ，称为逐行倒相正交平衡调幅制式，1982年制定的彩色电视广播标准。被德国、英国等一些西欧

48、国家以及中国采用。（3）SECAM制式，称为顺序传送彩色与存储制式，是法国制定的彩色电视广播标准。被法国、俄罗斯及东欧国家采用。,视频信息处理基本知识,图形、图像和视频信息处理,2019/7/3,桂林航专,76,2、视频的数字化将模拟视频转换为数字视频需要使用计算机和视频采集卡。视频采集卡负责将模拟信号数字化，并直接对数据进行压缩，编码成数字视频文件保存在硬盘上。,视频信息处理基本知识,图形、图像和视频信息处理,2019/7/3,桂林航专,77,3、视频压缩分辨率为640*480的24位真彩色数字视频图像的数据量大约为640*480*24/81MB/帧。视频压缩的途径：一是通过硬件，

49、如视频采集设备；另一种是通过软件，即视频编码器(Codes)。目前视频压缩标准有：MPEG-1(1992年正式发布的数字电视标准)、MPEG-2(数字电视标准)MPEG-4(1999年发布的多媒体应用标准)、MPEG-7(多媒体内容描述接口)MPEG-21(多媒体框架，管理多媒体商务)。,视频信息处理基本知识,图形、图像和视频信息处理,2019/7/3,桂林航专,78,4、视频文件的格式（1）影像视频文件格式 1) AVI 文件 (*. avi) ：音频视频交错格式，将视频和音频交织在一起进行同步播放。 2) MOV文件 (*.mov 及*.qt)：是QuickTime for Windows所使用的视频文件格式。MOV文件同AVI格式文件一样使用Intel公司的Indeo视频压缩技术把视频和音频信号混合交错在一起。 3) MPG文件(*.mpeg、*.mpg 及*.dat) ：是最新的数字视频标准文件，也称为系统文件或隔行数据流，是采用MPEG方法进行压缩的全运动视频图像。许多视频处理软件（如CorelDRAW等）都支持该文件格式。,视频信息处理基本知识,

展开阅读全文