1、第五节、人耳的听觉感知特性,由于人耳听觉系统非常复杂,迄今为止人类对它的生理结构和听觉特性还不能从生理解剖角度完全解释清楚。 所以,对人耳听觉特性的研究目前仅限于心理声学和语言声学。 人耳对不同强度、不同频率声音的听觉范围称为可听域。,返回,在人耳的可听域范围内,声音听觉心理的主观感受主要有: 1、响度 2、音调 3、音色 4、掩蔽效应等听觉特性。,人耳的听觉特性,声音三要素,响度、音调、音色分别与声音的振幅、频率、频谱分布特性 (包络形状)相对应,称为声音的 “三要素”。 人耳的掩蔽效应是心理声学的基础,是感知音频编码的理论依据。,响度,(1)声压 (2)声压级 (3)响度 (4)响度级 (
2、5)等响度曲线 (6)听阈与痛阈,声压,由声波引起的交变压强称为声压,一般用 表示,单位是帕 ()。 声压的大小反映了声音振动的强弱,同时也决定了声波的幅度大小。 在一定时间内,瞬时声压对时间取均方根值后称为有效声压。 用电子仪器测量得到的通常是有效声压,人们习惯上讲的声压实际上也是有效声压。,声压是一个重要的声学基本量,在实际工作中经常会用到。 例如 混响时间是通过测量声压随时间的衰减来求得的; 扬声器频响是扬声器辐射声压随频率的变化; 声速则常常是利用声压随距离的变化 (驻波表)间接求得的。,声压级,为什么引入声压级? 1、人耳有一个很奇怪的特点,其主观感受的响度并不正比于声压的绝对值,而
3、是大致正比于声压的对数值。 2、人耳能听到的最低声压210-5(听阈值)到人耳感觉到疼痛20(痛阈值)的声压之间相差近万倍,因此用声压的绝对值来表示声音的强弱显然也是很不方便的。,基于以上两方面的原因,所以常用声压的相对大小 (称声压级)来表示声压的强弱。声压级用符号表示,单位是分贝 (), 可用下式计算:SPL20LgP/Pref (-) 为声压有效值;Pref为参考声压,一般取210-5,这个数值是人耳所能听到的声音的最低声压,低于这一声压,人耳就无法觉察出声波的存在了。,响度,人耳对声音强弱的主观感觉称为响度。 在客观的度量中,声音的强弱是由声波的振幅(声压)决定的。 声压越大则响度越大
4、。当人们用较大的力量敲鼓时,鼓膜振动的幅度大,发出的声音响;轻轻敲鼓时,鼓膜振动的幅度小,发出的声音弱。,响度与声波的振幅并不完全一致。 响度不仅取决于振幅的大小,还取决于频率的高低。 振幅越大,说明声压级越大,声音具有的能量也越大,而响度则说明对听觉神经刺激的程度。,注意,事实上: 即使在可听声的频率范围 ()内,对于声压级相同而频率不同的声音,人们听起来也会感觉不一样响。 对强度相同的声音,人耳感受之间频率的声音最响,超出此频率范围的声音,其响度随频率的降低或上升将减小。 对于同一强度的声波,不同的人听到的效果并不一致,因而对响度的描述有很大的主观性。,响度的单位是宋 ()。 国际上规定,
5、频率为的纯音在声压级为时的响度为宋 ()。 大量统计表表明,一般人耳对声压的变化感觉是,声压级每增加,响度增加倍,因此响度与声压级有如下关系: 为响度 (单位为),为声压级 (单位为)。,2宋比1宋响1倍,3宋比1宋响2倍,响度级,人耳对声音强弱的主观感觉还可以用响度级来表示。 响度级表示的是某响度与基准响度比值的对数值,单位为方 ()。 规定纯音声压级的分贝数定义为响度级的数值。,纯音的声压级为时,响度级定为; 声压级为时,响度级定为,响度为。 当其他频率的声音响度与纯音响度相同时,则把的响度级当作该频率的响度级。 从响度及响度级的定义中可知,响度级每增加,响度增加倍。,例如:,等响度曲线,
6、由于响度是指人耳对声音强弱的一种主观感受,因此,当听到其他任何频率的纯音同声压级为 的的纯音一样响时,虽然其他频率的声压级不是 ,但也定义为。 这种利用与基准音比较的实验方法,测得一组一般人对不同频率的纯音感觉一样响的响度级与频率及声压级之间的关系曲线,称为等响度曲线。-等响曲线,人耳听觉的等响度曲线图,曲线中每一条等响度曲线对应一个固定的响度级值,即纯音对应的声压级值。,等响度曲线具有的性质,)两个声音的响度级相同,但强度不一定相同,它们与频率有关。 )声压级越高,等响度曲线越趋于平坦;声压级不同,等响度曲线有较大差异,特别是在低频段。 )人耳对范围内的声音响度感觉最灵敏。,听阈与痛阈,响度
7、是听觉的基础。人耳对于声音细节的分辨与响度直接有关:只有在响度适中时,人耳辨音才最灵敏。 正常人听觉的声压级范围为2。超出人耳的可听频率范围的声音,即使声压级再大,人耳也听不到声音。,听阈,在人耳的可听频率范围内,若声音弱到一定程度,人耳同样是听不到的。 当声音减弱到人耳刚刚可以听见时,此时的声音强度称为最小可听阈值,简称为 “听阈”。一般以纯音为准进行测量,人耳刚能听到的声压级为(通常大于.即有感受)。 等响曲线中最下面的一条 (虚线)描述的是最小可听阈值。,痛阈,而当声音增强到使人耳感到疼痛时,这个听觉阈值称为 “痛阈”。仍以纯音为准来进行测量,使人耳感到疼痛时的声压级约达到2左右。 实验
8、表明,听阈和痛阈是随声压级、频率变化的。听阈和痛阈随频率变化的等响度曲线之间的区域就是人耳的听觉范围。,小于听阈和大于2痛阈时为不可听声,即使是人耳最敏感频率范围的声音,人耳也觉察不到。 人耳对不同频率的声音听阈和痛阈不一样,灵敏度也不一样。人耳的痛阈受频率的影响不大,而听阈随频率变化相当剧烈。人耳对声音最敏感,幅度很小的声音信号都能被人耳听到;而在低频区 (如小于)和高频区 (如大于),人耳对声音的灵敏度要低得多。,响度级较小时,高、低频声音灵敏度降低较明显,而低频段比高频段灵敏度降低更加剧烈,一般应特别重视加强低频音量。 通常语音声压级以为宜, 频率范围较宽的音乐声压级以最佳。,音调,音调
9、也称音高,表示人耳对声音调子高低的主观感受。 客观上音高大小主要取决于声音基波频率的高低,基波频率高则音调高,反之则声音显得低沉。 频率的单位用赫兹 ()表示。主观感觉的音调单位是 “美 ()”。,频率为、声压级为的纯音所产生的音调就定义为。与 是表示音调的两个不同概念而又有联系的单位。 音调大体上与频率的对数成正比,目前世界上通用的平分律等程音阶就是按照基波频率的对数值取等分而确定的。 声音的基频每增加一个倍频程,音乐上就称为提高一个 “八度音”。,除了频率之外,音调还与声音的响度及波形有关。 当声压级很大,引起耳膜振动过大,出现谐波分量时,也会使人们感觉到音调产生了一定的变化。, 音色,音
10、色是人耳对各种频率、各种强度的声波的综合反应。用音色表征声音的频率成分的组成。 与频谱相对应的一个主观感觉音色。 音色一般被定义为,人们在主观感觉上借以区别具有同样响度和音调的两个声音的特性。,在听胡琴和扬琴等乐器同奏一个曲子时,虽然它们的音调相同,但人们却能把它们的声音区别开来。这是因为,各种乐器的发音材料和结构不同,它们发出同一个音调的声音(也即基本频率相同的声音)时,振动情况是不同的。 我们每个人的声带和口腔形状不完全一样,因此,说起话来也各有自己的特色,使别人听到后能够分辨出谁在讲话。,例如:,音色主要是由声音的频谱结构决定的。 各种发声物体或乐器在发出同一音调的声音时,所发出的声音之
11、所以不同,就在于虽然基波相同,但谐波的多少不同,并且各次谐波的幅度各异,因而具有各自的声音特色。,声音的频率成分 (谐波数目)越多,音色便越丰富,听起来声音就越宽广、感人肺腑、扣人心弦、娓娓动听。 如果声音中的频率成分很少,甚至是单一频率,音色则很单调乏味、平淡无奇。,如果声音经传输后频谱有了变化,则重放出的声音音色就会改变。 为了使声音逼真,必须尽量保持原来的音色。 声音中某些频率成分过分被放大或压缩都会改变音色,从而造成失真。,在语音传输系统中,最重要的是保持良好的清晰度。 适当减少一些低音和增加一些中音成分,特别是鼻音或喉音很重的人,改变低频部分的音色,有利于改善语音清晰度。,表征声音的
12、其他物理特性还有时值,又称音长。 它是由振动持续时间的长短决定的,具有明显的相对性。 一个音只有包含在比它更短的音的旋律中才会显得长。 音长的变化导致旋律的行进,或平缓、均匀,或跳跃、颠簸,以表达不同的情感。,人耳的听觉特性并非完全线性。声音传到人的耳内经处理后,除了基音外,还会产生各种谐音及它们的 “和”音和 “差”音,并不是所有这些成分都能被感觉。 人耳对声音具有接收功能、选择功能、分析功能和判断响度、判断音调和判断音色的功能。,4、人耳的掩蔽效应,一个较弱的声音 (被掩蔽音)的听觉感受被另一个较强的声音 (掩蔽音)影响的现象称为人耳的听觉 “掩蔽效应”。,绝对听阈,被掩蔽音单独存在时的听
13、阈分贝值,或者说在安静环境中能被人耳听到的纯音的最小值称为绝对听阈。 实验表明,绝对听阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对听阈值要大得多。 在范围内听阈随频率变化最不显著,即在这个范围内语言的可懂度最高。,掩蔽听阈、掩蔽量,在掩蔽情况下,提高被掩蔽弱音的强度,使人耳能够听见时的听阈称为掩蔽听阈 (或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为掩蔽量 (或称阈移)。,例如:当两人正在马路边谈话时,一辆汽车从他们身旁疾驰而过,此时,双方均听不到对方正在说些什么,原因是相互间的谈话声被汽车发出的噪声所掩盖,也就是弱声音信号被强声音信号掩蔽掉了。,()掩蔽效应结论,)纯音间的掩蔽
14、: 对处于中等强度时的纯音最有效的掩蔽是出现在它的频率附近。 低频的纯音可以有效地掩蔽高频的纯音,而反过来则作用很小。,)噪声对纯音的掩蔽: 噪声是由多种纯音组成,具有无限宽的频谱。 若掩蔽音为宽带噪声,被掩蔽音为纯音,则它产生的掩蔽门限在低频段一般高于噪声功率谱密度,且较平坦;当频率超过时,大约每倍频程增大。 若掩蔽音为窄带噪声,被掩蔽音为纯音,则情况较复杂。其中位于被掩蔽音附近的由纯音分量组成的窄带噪声即临界频带的掩蔽作用最明显。,临界频带,所谓临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好能被听到时的功率等于这一频带内噪声的功率,那么这一带宽称为
15、临界频带宽度。,()掩蔽类型,人耳的听觉掩蔽效应是一个较为复杂的心理声学和生理声学现象,主要表现为频域掩蔽效应和时域掩蔽效应。 )频域掩蔽。 )时域掩蔽。,频域掩蔽,所谓频域掩蔽是指掩蔽音与被掩蔽音同时作用时发生掩蔽效应,又称同时掩蔽。 掩蔽音在掩蔽效应发生期间一直起作用,是一种较强的掩蔽效应。 频域中的一个强音会掩蔽与之同时发声的频率相近的弱音,弱音离强音越近,越容易被掩蔽;,例如:频率在300附近、声压级约为60的声音可掩蔽掉频率在150附近、声压级约为40的声音,也可掩蔽掉频率在400附近、声压级约为 30 的声音。 又如,同时发出两个不同频率的声音,一个是声压级为、频率为1000的纯音
16、,另一个是100的纯音,前者的声压级比后者高18,在这种情况下,人耳就只能听到那个1000的强纯音。 如果有一个1000的纯音和一个声强比它低18的2000的纯音同时发出,那么人耳将会同时听到这两个声音。要想让2000的纯音也听不到,则需要把它降到比1000的纯音低45。,低频的音容易掩蔽高频的音;,时域掩蔽。,除了同时发出的声音之间有掩蔽效应之外,在时间上相邻的声音之间也有掩蔽效应。即在一个强音信号之前或之后的弱音信号,也会被掩蔽掉。这种掩蔽效应称为时域掩蔽,也称异时掩蔽。 时域掩蔽又分为(1) 前掩蔽(2) 后掩蔽。,前掩蔽、后掩蔽。,在时域内,听到强音之前的短暂时间内,已存在的弱音可以被掩蔽而听不到,这种现象称为前掩蔽; 当强音消失后,经过较长的持续时间,才能重新听到弱音信号,这种现象称为后掩蔽。,掩蔽效应的应用,产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。时域掩蔽也随着时间的推移很快会衰减,是一种弱掩蔽效应。一般来说,前掩蔽很短,大约只有,而后掩蔽可以持续。 在音频编码时,将时间上彼此相继的一些采样值归并成 “块”,以调节量化范围和量化噪声而进行动态比特分配,就是基于人耳的时域掩蔽特性而采取的策略。,