1、第二章 数字声音及MIDI简介,本章学习目标,了解声音的特性、类型与处理,掌握声音数字化的两个基本概念,理解多媒体计算机中的声卡工作原理,了解系统与音乐合成 原理,连续波特性:,自然界中声音是靠空气传播 在空气中能引起非常小的压力变化 声源所引起的空气压力变化,被耳朵的耳膜所检测,然后产生电信号刺激大脑的听觉神经,从而使人们能感觉到声音的存在。 自然界的各种声音大都具有周期性的强弱变化的特性,因而也使得输出的压力信号周期变化,声音特性 :连续波,2.1、声音的特性、类型与处理,返回,声音的传播是以声波形式进行的。 由于人类的耳朵能够判别出声音到达左右耳的相对时差、声音强度,所有能够判别出声音的
2、方向以及由于空间使声音来回反射而造成声音的特殊空间效果。 现在的音响设备都在竭力模拟这种立体声效果和空间感效果。,声音特性 :方向性,2.1、声音的特性、类型与处理,方向感特性:,返回,补:术语,2.1、声音的特性、类型与处理,名词术语,曲线上的任一点再次出现所需时间间隔称为周期。,一秒钟内声音由高(压力强)到低(压力低)再到高(压力强),这样一个循环出现的次数称为频率。,系统能够接受的最低频率和最高频率之间的范围称为系统的带宽(Bandwidth)。人类能够接受的听觉带宽是从20Hz到20KHz。,返回,多媒体计算机主要的是人类听觉范围内的可听声。 声音的处理主要有:声音的录制、回放、压缩、
3、传输和编辑等,类型、处理,2.1、声音的特性、类型与处理,四种类型:,次声、可听声(20Hz20kHz)、超声与特超声,处理:,返回,基本概念,模拟(Analog)信号:在时间和幅度上连续的信号 数字(Digital)信号:时间和幅度都离散的数字表示的信号,基本概念:模拟信号、数字信号,2.2、声音数字化,在数字域而不在模拟域中做信号处理的优点: 数字信号计算是一种精确的运算方法,不受时间和环境变化的影响; 表示部件功能的数学运算不是物理上实现的功能部件,仅用数学运算区模拟,较易实现; 可以对数字运算部件进行编程,如欲改变算法或改变某些功能,可对数字部件进行再编程。,返回,模拟音频是一种连续的
4、模拟量,以电的、磁的等形式表示。当我们对着麦克风讲话时,麦克风能根据它周围空气压力的不同变化而输出相应连续变化的电压值,这种变化的电压值便是一种对我们讲话声音的模拟,是一种模拟量,称为模拟音频。 计算机不能直接处理模拟音频,模拟音频(Analog audio),模拟音频,2.2、声音数字化,返回,数字化音频的获得是通过每隔一定的时间间隔测一次模拟音频的值(如电压)并将其数字化。这一过程称为采样,每秒钟采样的次数称为采样率。 若采样率太低将失去原有声音的自然特性,这一现象称为失真。 由上述可知:数字音频是离散的,而模拟音频是连续的,数字音频质量的好坏与采样率密切相关。数字音频信息可以被计算机存储
5、、处理和播放。,数字音频(Digital audio),数字音频,2.2、声音数字化,返回,采样( Sampling ):在某些特定的时刻对模拟信号进行测量,由这些特定时刻采样得到离散的时间信号。此时,采样得到的幅值是无穷多个实数值中的一个每隔相等的一小段时间采样一次,称为均匀采样 量化( quantization /AD conversion ):把信号的强度划分成一小段一小段,即把信号幅度取值的数目加以限定,从而组成有限个数值的离散幅度信号。如果幅度的划分是等间隔的则称线性量化,否则称为非线性量化。,步骤:,数字音频,2.2、声音数字化,返回,声音的采样和量化,采样频率(fs):每秒钟需要
6、采集多少个声音样本?量化精度:每个声音样本的位数应该是多少?,补:术语,2.2、声音数字化,名词术语,返回,返回,客观质量的度量:信噪比 主观平均判分法 级别 评 价 失真级别 1 优(Excellent) 感觉不到声音失2 良(Good) 刚察觉但不讨厌3 中(Fair) 声音有些失真,有点讨厌4 差(Poor) 声音失真,不令人反感5 劣(Bad) 严重失真,令人反感,补:声音质量,2.2、声音数字化,声音质量:,返回,声卡主要组成部分: CD 音频连接器 CD音频连接器可以接收光盘机中的音乐信号 电子合成器电子合成器负责MIDI乐曲的合成可以及时创造各种音乐 AD/DA 转换器 AD /
7、 DA 转换器负责录音及播放*.WAV格式的波形文件 混音器(Mixer),声卡结构,2.3、计算机中的声卡工作原理,声卡结构,返回,电子乐器数字接口(musical instrument digital interface,MIDI)是用于在音乐合成器,乐器和计算机之间交换音乐信息的一种标准协议,MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其他装置让它产生声音或执行某个动作的指定。,MIDI简介,2.4、系统与音乐合成原理,MIDI简介,返回,返回,FM Synthesis, 调频合成法 FM英文全名为Frequenncy Modulation(调频),这是早
8、期所使用的技术。使用简单的硬件电路,利用几个乐器所产生不同的波型,定出取样频率、振幅,通过封装波形产生器和累加器,组合而成所需要的声音。不过由于取样的频率较少,加上乐器的数量有限制,所产生的声音效果并不好,以播放的感觉来说,仅有乐器发出的乐声间频率和音调上不同,很难去分辨之间的差别。,频率调制,2.4、系统与音乐合成原理,乐音合成原理:频率调制,返回,由以下五部分组成:数字载波器调制器声音包络发生器数字运算器模数转换器,FM声音合成器的工作原理,频率调制合成器,2.4、系统与音乐合成原理,频率调制合成器工作原理,返回,乐音样本合成法(波表合成法):Wavetable的技术,是将每种乐器的声音录
9、制取样一个或多个循环,加以适当的处理后存储成音色文件,记录在合成器的内存当中,当需要播出某个乐器的声音时,合成器就从内存中找出音色,同时并播放出来。Wavetable的声音播放会比较真实,而且可以做比较多的音效变化。,乐音样本,2.4、系统与音乐合成原理,乐音合成原理:乐音样本,返回,Wavetable合成器的工作原理,Wavetable合成器所需要的输入控制参数比较少,可控的数字音效也不多,大多数采用这种合成方法的声音设备都可以控制声音包络的ADSR参数,产生的声音质量比FM合成方法产生的声音质量要高。,乐音样本合成器,2.4、系统与音乐合成原理,乐音样本合成器工作原理,返回,思考:,1.采样频率为22.050kHz和样本精度为16位的录音参数.在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB的存储空间?,返回,2.激光唱盘音乐信号的样本位数是16位,它的信噪比SNR是多少?如果样本位数提高到20位,它的信噪比SNR是多少?,答案,1.数据量采样频率采样位数/8声道数时间 代入相应数据,得: 数据量2205016/82(602)/(1024*1024) =10.09MB,返回,2.16位:SNR20lg(216) (2分)=20x16x0.301=96.32dB 20位:SNR20lg(220) (2分)=20x20x0.301=120.4dB,