1、 2009 大学生物理实验研究论文用 HRTF 进行虚拟声源定位实验摘 要: 介绍了传统的音频定位理论及存在的缺陷,引出了 HRTF 的定义,分析了 HRTF 包含的方位信息,并用我们开发的虚拟听觉空间系统 Vasaudio 对虚拟声源定位进行了实际测试,最后对测试结果做了分析。关键词: HRTF; ITD; IID; 虚拟声源定位Virtual Sound Source Position of HRTFAbstract:key words: Abstract: We introduce the traditional theory of audio position and its limi
2、tations first , then we give the definition of HRTF,analyse the position information in HRTF,we also do experiment using Vasaudio system, at last we make a analysis of the experiment result.key words: HRTF; ITD; IID; virtual sound source position我们日常听到的立体声录音,虽然有左右声道之分,但就整体效果而言,立体声音乐来自听者面前的某个平面。但希望的是
3、一个在虚拟环境中能辨别声源精确位置的声音系统,而当您听到三维虚拟声音时,音乐声是来自围绕您的一个球形中的任何地方,即声音出现在您头的上方、后方或者在您的鼻子前方。我们把在虚拟场景中的能使用户准确地判断出声源精确位置、符合人们在真实境界中听觉方式的声音系统称为三维虚拟声音。基金项目:国家 973 计划资助项目(2002CB312102)作者简介:xxx。 1 传统音频定位理论耳间时间差(ITD):从声源发出的声音到达人的左耳和右耳时,有一个先后的过程,这段时间差就是耳间时间差。耳间时间差与声音信号的频率有关,是声源角位置 ,头部半径 和声速r的函数,在人类听觉定位中占有重要位置。c耳间强度差(I
4、ID ):由于声音的传播媒质对声波的衰减作用,声音的强度随距离而变化,再加上耳廓和头部的遮挡,最终到达两耳的声音所经过的路径是不同的,使得距离声源近的耳朵听到的声音要强一些,这就是耳间强度差。在中、低频(f4 kHz), IID 起主要作用 1。传统的音频定位理论的缺陷:(1)无法解释单耳条件下的定位机理。(2)存在锥面模糊现象。ITD 和 IID 对左右方位的定位效果非常明显,但对前后和上下方位存在模糊现象。如图 1 中同一垂直面内的 X 和 Y到达两耳的路径是对称的,以及同一水平面内的A 和 B 到达两耳的路径也是对称的,这就无法依赖 ITD 和 IID 来进行准确定位。图 1 混淆锥示意
5、图2 用 HRTF 进行虚拟声源定位我们介绍一种更为完备的音频定位模型,这就是 HRTF。与头部关联的传递函数(Head-Related Transfer Function, HRTF)描述了声波从声源到双耳的传输过程。事实上从某一方位的声源发出的声信号在到达听者的耳膜之前经过了复杂的传输过程,声信号与听者的头部、肩部以及躯干,耳廓发生了反射、折射、衍射和散射等声学作用,人体的这些部位对声信号的调制作用可以统一的用一个函数来表示即与头部关联的传递函数 HRTF。与之相对应的时域表示称为与头部相关联的冲激响应(Head-Related Impulse Response,HRIR) 。国外很多科研
6、机构和高等院校都进行了 HRIR的测量工作,我们在本文中使用的数据来源于加州大学戴维斯分校图像处理和集成计算中心(CIPIC) 2,HRIR 数据长度为 200 点,采样频率为 44.1KHz。2.1 HRTF 数据中包含的方位信息我们在图 2 画出方位角-45 ,仰角 0时的左右耳 HRIR 波形及对应的频谱图。图 2 方位角-45,仰角 0时的左右耳 HRIR 及对应的HRTF(1)耳间时间差(ITD):由于声源靠近左耳,从图 2 可以看出右耳的 HRIR 比左耳的 HRIR有明显的时间延迟,体现了耳间时间差。(2)耳间强度差(IID ):左耳的 HRTF 比右耳的 HRTF 幅度要强一些
7、,体现耳间强度差。 (3)HRTF 会出现明显的峰值点和谷值点,有研究表明峰点频率、谷点频率对前后定位起关键作用,且谷点频率是进行定位的主要依据。(4)HRIR 在某些时刻变化剧烈,这是由于耳廓对入射声波的反射作用,左耳的 HRIR 波形较右耳的 HRIR 波形起伏变化更为剧烈。在频谱特性上则表现为左耳的 HRTF 高频分量要充足些。为了更加突出 HRTF 中的峰值点和谷值点,人们使用了一些方法对 HRTF 数据进行处理。文献 3中对不同频率的 HRTF 数据加权,来放大原HRTF 数据频率间的差异,设 为原 HRTF 数()Hx据, 为处理后的 HRTF 数据,则()Hx()()Wx2009
8、 大学生物理实验研究论文权函数 )()maxiHWHRTF 反映了人体结构对声音信号的不同响应,因此 HRTF 有明显的个体差异,人们总是希望使用个性化的 HRTF 数据进行 3D 音效的合成,然而对每个人进行 HRTF 数据的测量是不现实的,有学者建议使用非个性化(non-individualized)的HRTF 数据 4。2.2 虚拟听觉空间系统 Vasaudio将输入的音频信号分别与指定的方位和距离的左右耳 HRTF 数据进行卷积,然后通过耳机重发就可以得到具有方位信息的双通道音频信号,如式(1) 。基于这个原理我们用 VC+编程开发了虚拟听觉空间系统 Vasaudio5可以实时播放 w
9、av格式的音频文件,图 3 是我们的实现框图。(1)()()*LLRRynGxhnA式中 表示乘法, 表示卷积, 表示输()xn入的音频信号, 和 分别表示左右耳()LhnR的 HRIR 数据, 和 分别表示左右耳的增G益, 和 分别表示馈给耳机的左右声()LyR道信号。图 3 虚拟听觉空间系统实现框图3 虚拟声源定位测试实验测试设备为 1 台计算机、1 个高质量声卡、1 幅高质量耳塞式耳机。被测试人员为我们实验室的 5 名听觉正常的同学。同时我们选择音频测试常用的粉红噪声作为测试音源。测试所用的软件系统为本文前面介绍的 VasAudio。我们实验的目的有两个:一是通过测试比较HRTF 的个体
10、化差异,二是我们希望找出几套对大多数人都相对比较适合的 HRTF 数据,已备我们以后的实验使用。3.1 测试数据为了比较 HRTF 数据的个体差异,我们使用了 12 套数据进行测量,分别为(1)CIPIC 数据库提供的数据:hrir_final_003, hrir_final_162,hrir_final_163, hrir_final_165;(2)做回归分析得到的数据:hrir_final_h_003, hrir_final_h_162,hrir_final_h_163, hrir_final_h_165;(3)在时域做平均得到的数据:hrir_final_avg;(4)用 PCA 分析综
11、合出来的数据:hrir_final_large_6, hrir_final_middle_6,hrir_final_small_6。3.2 测试步骤和结果为减小辨别难度,只对水平面和中垂面上的角度进行定位测试,其中方位角是 15的倍数,角度从180到 180,共有 24 个方位。垂直方位角为 90(正上方) 、60、30、0、45共有 5 个方位。(1)水平方位角具体测试步骤:步骤 1:先给测试者听分布在前、后、左、右四个方向的声音信号,并告知实际方向;步骤 2:然后分别在这四个声源的附近位置选择一个方位,要求听者进行判断,并给出四个声源的位置(要求说出具体的方位角度) ;步骤 3:重新随机选
12、择分布在前、后、左、右四个方向的声音信号,重复步骤 1,步骤 2。 (2)垂直方位角具体测试步骤:步骤 1:对给定的一组数据先给测试者听垂2009 大学生物理实验研究论文方位 90、60、30、0、45五个方向声音信号;步骤 2:从上述五个方向随机给出一个方向的声音信号,要求听者指出其具体方向角度。重复该步骤五次直至测完一组数据;步骤 3:重复步骤 1,步骤 2,直至测完全部数据。我们给出了数据标号为 hrir_final_162 和hrir_final_163 的测试结果散点图,见图 4 和图 5。图 4 hrir_final_162 测试结果散点图图 5 hrir_final_163 测试
13、结果散点图我们给出水平方位最终的测试统计结果,见表1。同时我们给出垂直方位最终的测试统计结果,见表 2。表 1 水平方位测试结果统计表 表 2 垂直方位测试结果统计表3.3 测试结果分析(1)HRTF 数据包含了大量的方位信息,用HRTF 对声源进行定位可以提高定位的准确性,克服传统定位理论的不足。我们在测试中使用的HRTF 数据是非个性化的,因此 HRTF 数据并不一定对每个人都是适合的,这是造成错误率较高的一个原因,另外测试中只有被测试者认定的方位和我们实际使用的方位完全一致时,我们才认为辨别正确,对试验结果的要求有些苛刻(实际上2009 大学生物理实验研究论文5到 20的偏差是允许的)
14、,这是造成错误率较高的另一个原因。(2)测试中发现被测试者对标号为hrir_final_middle_6 的 HRTF 数据的辨别正确率较高,原因可能是 5 位被测试者的头部和外耳尺寸比较中等,与该数据的外耳参数比较吻合。(3)测试中发现声源定位的前后颠倒和上下颠倒比较严重。前后颠倒从图 5 和图 6 可以很明显的看出。垂直方位的测试结果尤为不好,如倾听者 1 号在使用标号为 hrir_final_165 和hrir_final_h_003 的 HRTF 数据处理过的音频信号进行垂直方位的辨别时,5 个方位完全辨别错误,其他被测试者也有这样的问题。(4)用耳机重放时存在“头中定位效应” ,倾听
15、者感到声像分布在人头内部,这也影响了定位的准确性。有文献 6指出,增加混响可以加强声像的立体感和深度感,从而改善定位效果,这也是音频定位、多媒体和虚拟现实发展的趋势。4. 结束语HRTF 包含了大量的方位信息,用 HRTF 进行虚拟声源定位是当前研究的热点,已经有很多相关成熟的产品和系统出现。本文介绍了 HRTF 包含的方位信息和个体差异,并用我们开发的Vasaudio 系统进行了虚拟声源定位的实际测试。测试结果表明用非个性化 HRTF 进行定位存在一些问题,如辨别错误率较高,声像的前后混淆和上下混淆比较严重,头中定位效应等,我们的工作仅是初步的,还要采取其他措施来提高虚拟声源定位的准确性。参
16、考文献:1 钟小丽,谢菠荪. 头相关传输函数的研究进展(一)J. 立体声与环绕声,2004,12:44-48.2 Algazi V. R., Duda R.O., Thompson D.M., Avendano C The CIPIC HRTF databaseC. Applications of Signal Processing to Audio and Acoustics, 2001 IEEE Workshop on the 21-24 Oct,2001, Page(s): 99 -102.3 赵自力,黄成伟,高宏,李庆祥. HRTF 在虚拟 3D 立体声中的应用及实验J.清华大学学报(
17、自然科学版),2001,41(11):7476.4 Elizabeth M. Wenzel, Marianne Arruda, Doris J. Kistler, and Frederic L. Wightman. Localization using nonindividualized head-related transfer functionsJ, J.Acoust. Soc. Am, ,July ,1993, 94 (1):111-123.5 王生九.虚拟听觉空间和虚拟环绕声技术的研究及其DSP 实现D.东南大学硕士学位论文,2006.3.6 张承云,谢菠荪,谢志文.立体声耳机重发中头中定位效应的消除J.电声技术,2000, 8: 4-6.