1、理工大学学士学位论文I摘 要确定一个声源在空间中的位置是一项有广阔应用前景的有趣研究,将来可以广泛的应用于社会生产、生活的各个方面。声源定位估计算法研究是声源定位技术中的重点内容。而基于声传感器的声源定位技术能够对拾取的带噪声信号进行有效的空域滤波和消噪处理,在一定程度上改善声源定位系统的性能。声源定位是通过测量物体发出的声音对物体定位,与使用声纳、雷达、无线通讯的定位方法不同,前者信源是普通的声音,是宽带信号,而后者信源是窄带信号。根据声音信号特点,人们提出了不同的声源定位算法,但由于信号质量、噪声和混响的存在,使得现有声源定位算法的定位精度较低。此外,已有的声源定位方法的运算量较大,难以实
2、时处理。为解决这些问题,本文系统地研究了基于传声器阵列的声源定位方法,主要做了以下一些工作:首先对传声器阵列及其研究现状进行了总体概述,讨论了基于传声器阵列的声源定位所面临的问题,重点分析了传声器阵列信号处理的特殊性和混响的产生原因及影响。其次总结归纳并比较了各种基于传声器阵列声源定位方法的优缺点。最后重点分析了基于时延估计(ITD)和强度差异(IID)的声源定位方法。关键词:传声器阵列;声源定位;ITD;IID ;Matlab理工大学学士学位论文IIAbstractIdentify a sound source location in space is an interesting rese
3、arch, has a broad application prospect in the future can be widely used in all aspects of the social production and life. Sound source localization estimation algorithm research is the key content in sound source localization technology. And of sound source localization based on acoustic sensor tech
4、nology to be able to pick up the belt noise signal spatial filtering and de-noising processing, effectively improves the performance of the beamformer system to some extent.Beamformer is determined by measuring the sound coming from an object to locate objects, and the use of sonar, radar, wireless
5、positioning method is different, the former source is normal voice, broadband signals, while the latter source is a narrowband signal. According to characteristics of voice signal, people put forward different sound source localization algorithm, but because of signal quality, noise and reverberatio
6、n, make existing positioning accuracy of sound source localization algorithm is low. In addition, the existing sound source localization method computational cost is larger, hard to real-time processing. To solve these problems, this paper systematically studied the method of sound source localizati
7、on based on microphone array, mainly done the following work:Firstly,the microphone array and its research present situation has carried on the overall overview, discussed the problem of sound source localization based on microphone array, and focuses on analyzing the particularity of microphone arr
8、ay signal processing and reverberation of causes and effects.The second,sums up and compares the advantages and disadvantages of various kinds of sound source localization based on microphone array method.Finally analyzed based on time delay estimation (ITD) and intensity difference (IID) of the sou
9、nd source locating method.Key words: Microphone Array; Sound Source Localization; ITD; IID; Matlab理工大学学士学位论文III目录1 绪 论 .11.1 研究背景和意义 .11.2 声源定位技术概述及国内外研究现状 .21.3 基于传声器阵列的声源定位系统的模型与难点 .31.4 本文的主要工作和内容安排 .52 几种定位方法的介绍 .62.1 声音信号分析 .62.2 声源定位方法的分类和比较 .62.2.1 基于最大输出功率的可控波束的声源定位 .62.2.2 基于高分辨率谱估计的声源定位 .7
10、2.2.3 基于时延估计的声源定位 .82.2.4 定位方法比较 .92.3 常用处理方法及分析 .102.3.1 经典波束形成器法 .102.3.2 最小均方自适应滤波器法 .103 基于时延(ITD)的方位估计 .123.1 传感器概述和声源的几何模型 .123.1.1 双传声器几何模型与分析 .123.1.2 传感器的特性与选择 .143.2 几何定位方法 .163.3 信息的采集与处理 .173.3.1 数据采集方法 .173.3.2 声音信号的处理 .183.3.3 声源到传声器间距离差的计算 .183.3.4 声源位置的计算与仿真 .193.4 程序测试与误差分析 .214 基于强
11、度差异(IID)的方位估计 .24理工大学学士学位论文IV4.1 方法概述与分析 .244.2 声源方位估计的实现 .254.2.1 数据的采集 .254.2.2 声压幅比的计算方法 .264.2.3 声源位置的计算与仿真 .274.3 程序测试与误差分析 .28结 论 .31致 谢 .32参考文献 .33附录 A 英文原文 .34附录 B 汉语翻译 .38附录 C 源代码 .40理工大学学士学位论文11 绪 论1.1 研究背景和意义声源定位多年来一直作为国内外研究的重点课题,被引起广泛的关注。声源定位起初主要应用在军事方面,如水下潜艇定位,直升机定位,雷达探测定位,导弹飞行定位等。而如今,随
12、着信息社会的发展和科技水平的进步,声源定位技术逐渐发展成熟,不仅在军事领域,而且在科学研究、日常生活中都得到了进一步的应用。目前,声源定位技术在水下目标定位、地震探测和非金属材料的无损检测中具有重要的实用价值,在视频会议、可视电话、监控系统、助听装置、鲁棒语音识别等领域都有着广泛的应用。在声源定位中,对声信号的获取、转换、显示和处理是定位系统的重要组成部分,也是进行定位的基础性环节。而在这个环节中,通过传感器、中间变换器等一些设备来接受声信号而导致声-电转换后的信号包含有丰富的信息内容,同时也在系统外部和内部各种因素的影响下必然在输出的信号中夹杂着很多不需要的成分,这就要求我们应尽量剔除混杂在
13、信号中的噪声和干扰,削弱信号中的多余内容,将有用信号强化、突出,以利于分析计算,尽量将信号变换成符合要求的形式,而传感器是承担获取信号的任务的重要器件,因此它也是整个定位系统的关键部分。在无干扰噪声、混响的情况下,距离声源很近的高灵敏度、高精确度和频率响应的传感器能够获得高质量的声源信号。但是,这要求声源和传感器之间的位置相对固定。若声源相对传感器运动或位于选择方向之外,就会引入大量的噪声,导致参数估计的精确度下降。此时可以使用多个传感器,对信号进行一定的处理而达到相应的要求,这些传感器通过测量声源定位算法中所需信号的相应参数,确定出声源位置。二维平面中,普遍采用的算法即测量到达两个传感器间时
14、延,确定一对以这两个传感器节点为焦点的双曲线,三个节点可形成两对双曲线,双曲线的交点即为声源位置。而在实际应用中,大多数情况是在的近场环境下进行的,由于阵列的空域滤波方法的差异及误差的存在,并且技术还有待完善,因此对声源定位问题的研究具有很强的理论价值和实践意义。理工大学学士学位论文21.2 声源定位技术概述及国内外研究现状20 世纪 80 年代以来,传感器阵列信号处理技术得到迅猛的发展,并在雷达、声纳及通信中得到广泛的应用。这种阵列信号处理的思想后来应用到语音信号处理中。在1985 年 Flanagan 将传声器阵列引入到大型会议的语音增强应用中,开发出多种实际产品。之后,Silverman
15、 和 Brandstein 将其应用于语音识别和声源定位中。进入 90 年代以来,基于传声器阵列的语音处理算法正逐渐成为一新的研究热点。基于传声器阵列的产品能够广泛利用于具有复杂背景的语音通信环境,例如会场、多媒体教室、车载免提电话和助听器等。目前国外从事传声器阵列相关研究的机构主要有:Intel、宝利通、东芝等。但是国内并没有类似的具有自主知识产权的产品,所以对于该技术的研究具有较为领先的意义。出现较早,并且在实际中应用的传感器阵列的信号处理方法是波束形成法1,在这种方法中,基阵的输出是各个阵元输出的简单的加权求和,通过调整权系数可以在希望的方向上形成波束,而对其余的方向产生较小的响应。然后
16、对整个观测空间做波束扫描即可确定信号的方位。但是,基阵的分辨率受瑞利准则的限制,是这种方法自身无法解决的问题。时延估计的理论和技术是由水声目标定位及信号处理发展脱颖而出的。现代声纳的研究始于 20 世纪初,到第二次世界大战时,各种声纳装置己经被广泛地用于水中兵器。自 20 世纪五十年代以来,随着信息论、信号检测理论和计算机技术的飞速发展,以及各个应用领域对时延估计的需求,时延估计理论得到了迅速的发展。进入上个世纪九十年代以来,除了对以往的方法进行扩展和深入研究以外,又发展了基于人工神经网络的时延估计方法,基于谱相关理论的时延估计方法和各种自适应时延估计方法等。新世纪以来,随着超大规模集成电路技
17、术的广泛使用,人们将传感器与测量系统电路制作在同一块硅片上,得到体积小、性能好、功能强的集成传感器,使传感器的信号处理功能大大提升,相应产品被广泛使用于具有复杂背景的通信环由走动。近半个世纪以来,随着军事装备需求、集成电路规模和制造工艺水平的发展,作为信号处理方向的一个重要分支,基于传感器的信号处理技术得到了人们空前的关注,其有关的理论和技术也越来越成熟。与常规波束形成法比较,改善后的这些高分辨算法都在一定程度上增强了基阵的分辨率,但这些处理方法有一个相同的问题,即对相干源的处理。声源定位是通过测量发声体的物理特性对物体进行定位。实际中,理工大学学士学位论文3根据对目标的定位方式不同可分为有源
18、和无源定位两种。有源定位是系统主动发射并接收返回信号,由信号的往返时间延迟差别来判断出估计目标的速度、距离或位置等参量,以此完成系统定位的方式。例如,声纳和雷达就是采用有源定位方式进行工作的。它们的工作原理是主动发出电磁波对估计目标进行搜索,当发射信号遇到目标后,其中一部分信号返回相应的设备处理系统并对信息进行算法分析,从而对被测物体进行定位。有源定位系统具有高精度、全天候等特点,但这种定位系统常常是靠发射大功率信号来实现,较容易受到外部环境的影响。相对而言,无源定位不主动发射探测信号,而是凭借对估计目标发出信号的采集处理来进行目标定位。其原理是将设备采集到的定位参数信息,如信号声场信息等,通
19、过处理运算而确定出估计目标的方位或距离参量来完成系统定位。无源定位的特点是一般很少存在系统干扰,具有较高的隐蔽性和安全性。但由于系统不发射电磁信号,所以必须要通过探测由估计目标发射出的信号或经一定区域反射回的信号才能够进行系统定位,否则不能定位。利用传感器等设备对目标发出的声音信号进行拾取,并使用现代信号处理技术对其进行分析处理,以此来判断目标的空间方位,是目前研究声源定位系统确定目标位置的关键技术。目前,国际上一些大公司如西门子、宝利通、东芝等早已成立了专门用于研究定位技术的一些部门。相比之下,国内对此方面的研究还不是很多,在声源定位方面的很多方法也仅能够提供仿真结果支持。1.3 基于传声器
20、阵列的声源定位系统的模型与难点在深入研究声源二维定位的实际应用时,可以知道系统有很多拟要解决的关键问题,要保证系统的高精度和实时性,还有很多难点需要处理,如下第一,严格意义上,声源的存在形式是空间三维的,但考虑到实际研究中,三维空间的背景环境和算法复杂度,又根据数学知识,三维空间可以看成是无数个二维平面的累积,即可以把其划分成对无数个二维平面的积分。对二维平面定位的研究也就是声源(空间)定位的基础,故本实验的研究重点是在二维平面中进行。第二,在声源定位系统中,单个传感器只能显示在某一时刻有声源信号发射,并不能确定声源的位置信息,而系统为提供足够的参量对声源的定位就要求多传感器协调工作。声源定位
21、系统的定位性能与声传感器摆放的位置有很大关系,由于环境噪声理工大学学士学位论文4及传感器性能等因素的影响,声源在远场或近场,同侧或异侧的定位效果是不同的,合理地安排调整传感器的布局,才能使系统的定位性能提高到一定标准。第三,声源发射的声信号一般是非平稳信号。在窄带信号条件下,各个传感器之间相位差可近似看成是发射信号源的位置函数,频率是一常量;而在宽带非调制信号条件下,各个传感器之间相位差是声信号源位置和频率的复合函数。又考虑到实验环境中存在一定的信号反射与混响,信号与噪声或噪声与噪声之间可能是相关的,信号在频域和时域互相叠加,此时需采用时频联合的方法进行处理,对不同方向的信号进行目标估计,而传
22、统的分析方法如傅立叶变换无法对其进行时域分析。为了说明基于传声器阵列的声源定位系统的模型与难点,图 1.1 详细描绘了一个传声器阵列声源定位应用的实际情况。由图 1.1 可知,传声器阵列系统定位声源的精度受多方面因素的影响。第一是噪声和反射的噪声;第二是声源的多重反射(即混响);第三是声源与传声器的相对位置。图 1.1 传声器阵列声源定位系统描述假定声音传播满足线性波动方程,且周围环境在一段时间内不变,则从声源到传声器之间可看成线性时不变系统。可设声源信号为 s (n),第 i 个传声器接收到的信号为 xi (n),若噪声为高斯白噪声,则xi (n)=hi (n)*si (n)+ i(n) (
23、1.1)其中 hi (n)是周围环境的脉冲冲激响应,i(n) 是高斯白噪声。一个高精度声源定位系统所面临的难点主要有:(1)由于声音的反射,传声器不仅收到声音信号的直接到达部分,还收到反射部分。而声音的反射会导致互相关函数或者波束的尖峰扩展,使得难以确定最大值,从而加大了定位的误差。理工大学学士学位论文5(2)定位系统不仅受到噪声的干扰,而且由于噪声的反射,会产生相关噪声。这样各传声器间噪声的互相关函数就不等于零,从而增大了定位的难度。(3)传声器位置的摆放。对于一个定位系统而言,传声器的数量越多,传声器的相对位置越多样化,提供的空间信息量越大,从而具有较高的定位精度。而在实际系统中,传声器的
24、摆放位置比较固定,数量也比较少。因此难点就是在尽量少的传声器和固定摆放位置条件下,提供高的定位精度。1.4 本文的主要工作和内容安排实现一个可仿真的二维声源定位系统是本论文的目的。在算法研究比较充分的基础上,设计系统结构,实现声源定位。本文对传声器阵列声源定位系统进行了系统的研究,主要工作如下:(1)介绍了几种声源定位方法,总结归纳了各种基于传声器阵列的定位方法的优缺点。(2)重点研究了时延估计方法,讨论了各种时延估计方法的优缺点。归纳比较了各种基于时延的方位估计方法。(3)设计并实现了可仿真的声源定位系统。详细介绍了系统结构,给出了实验结果,详细分析了各种影响因素对系统定位精度的影响,并给出
25、了改进方案。本论文的各章主要内容安排如下:第一章,介绍了系统的应用背景和研究现状。第二章,分析了声源定位原理和几种声源定位方法。第三章,给出了基于时间差(ITD)的声源定位设计,详细介绍了传声器的选择与布局、算法的实现过程及软件系统的设计和实现过程,并对存在的问题进行讨论。第四章,给出了基于声压差(IID)的声源定位设计,详细介绍了算法的改动及软件系统的设计和实现过程,并对存在的问题进行讨论。第五章,总结了本论文所完成的工作,分析了其中的长处和不足,并提出了对后续研究工作的建议。理工大学学士学位论文62 几种定位方法的介绍2.1 声音信号分析声源体发生振动会引起四周空气振荡,那种振荡方式就是声
26、波。声波借助空气向四面八方传播。在开阔空间的空气中那种传播方式像逐渐被吹大的肥皂泡,是一种球形的阵面波。除了空气,水、金属、木头等也都能够传递声波,它们都是声波的良好介质。在真空状态中声波就不能传播了。声音在不同的介质中的传播速度不同。声音的速度受温度影响,温度越高,速度越快。在 15时,声音在空气中的传播速度为340m/s,25 时为 346m/s。它和温度的关系可以用以下公式来表示:C =331.45 +0.61T(m/s) (2.1)在使用时,如果温度变化不大,则可认为声速是基本不变的。声波传输距离首先和大气的吸收性有关,其次是温度、湿度、气压等。2.2 声源定位方法的分类和比较声源定位
27、技术就是利用相关设备、方法对声源进行位置、距离或速度等一些参数进行确定。常用的声源定位技术主要有以下几类:基于最大输出功率的可控波束的声源定位、基于高分辨率谱估计的声源定位、基于时延估计的声源定位和基于波达方向估计的声源定位。根据不同的应用要求,有以下五种声源定位原理。2.2.1 基于最大输出功率的可控波束的声源定位基于最大输出功率的可控波束的声源定位方法通过使各个传感器阵元采集得到的信号时间移位进而来补偿声源到达不同传感器阵元之间的时延量。将补偿后获得的信号再相加,求其均值即为传感器系统(阵列)的输出。而此时,各路传感器的阵元信号中,存在与对应目标声源的信号成分同相的部分则相加,其他方位的信号则会导致阵列输出在该方位上存在不同程度的衰减,这样就可以通过对各路信号进行加权求和并调控权值找出使传感器的输出信号功率最大值处,在该系统满足最大似然准则的条件下,以搜索声源的估计位置的方式来形成波束,并使得波束对准声源点以获得此最