1、基于神经网络声全息方法对运动噪声源识别的研究高印寒 1,梁杰 1,钱鸣佳 2(1.吉林大学 测试科学实验中心,吉林省长春市 130022;2.吉林大学仪器科学与电气工程学院)摘要:采用声全息方法对运动噪声源进行识别是近年来新兴的噪声研究技术,声全息法是通过对测量信号进行多普勒效应的消除后,运用合适的声场重建公式,对声源面的声场信息进行重建,从而达到识别运动噪声源的目的。针对一般重建算法速度慢、误差大的缺点,提出了基于神经网络的声场重建算法,并通过仿真与实验,证明了该方法用于运动噪声源识别的准确性与可行性。关键词:声全息 运动声源识别 神经网络 多普勒效应中图分类号:O438.1 文献标识码:A
2、 文章编号:1671-0924 (2007) xx-xxxx-xStudy on Moving Noise Source Identification based on Acoustic Holography of Neural Network GAO Yin-han1, LIANG Jie1, QIAN Ming-jia2(1.Centre of Test Science, Jilin University, Changchun130022,China;2.College of Instrumentation 1n)式中: 为离散面上一个坐标方格的面积;等式s左侧的 表示它是 的一个估计。(
3、,)Umn,sn2 基于小波变换的声源识别模型基于声全息法的声源识别本质上是从采样面到重建面的声场空间转化问题,重建公式正好反映了两者的映射关系,但从重建公式中可以看到,公式本身比较复杂,在软件编程实现算法时就要用到循环,循环语句的执行时间通常都比较长,这样就会影响到整个数据处理的速度。且具有很强的非线性,所以只能用逼近的方法求得近似解。而神经网络恰好具有很好的函数逼近能力,并且对于训练好的网络,它能很快地计算出对应的输出。而且如果对神经网络采用好的学习算法,就能充分利用传感器在全息面上离散点的测量资源,把传感器在空间或时间上的冗余或互补信息进行组合,使抗干扰能力得到很大的提高,重建误差也将减
4、小。2.1 神经网络在声全息中的应用用一个前向神经网络逼近声场重建公式函数,实现从采样面到重建面的映射。也就是说利用样本来训练前向网络,使其输出收敛达到规定的误差范围内,此时学习好的前向网络就是一个很好的函数逼近器,再将采集到的声压信号作用于此网络,其输出能以规定误差逼近函数输出的精确值。示意图如图 2 所示。图 2 神经网络用于声全息示意图从图 2 可以看出,神经网络的作用就是代替声场重建公式函数,本论文采用的神经网络结构为前向网络结构,前向网络的第一层叫输入层,最后一层为输出层,中间层称为隐层。隐藏神经元的功能是以某种有用方式介入外部输入和网络输出之中,这样既减小计算复杂度,又可以保证神经
5、网络的推广能力 6。需要注意的是在将声压信号送入神经网络之前需要对信号先进行 K-L 变换,以降低神经网络的输入维数。2.2 改进型 BP 算法对前向网络一般采用 BP(Back Propagation反向传播) 学习算法。基本思想是:学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐含层处理后,传向输出层,若输出层的实际输出与期望的输出不符合要求,则转入误差的反向传播阶段。在误差反向传播阶段,网络先把第一阶段得到的网络实际输出值与期望的输出值进行比较,如果两者不相符,就将输出误差以某种形式通过隐含层向输入层逐层反向传播,并将误差分摊给各层的所有单元
6、,从而获得各层单元的误差信号,并根据此误差调节权值。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始地进行的。权值不断调整的过程,也就是网络的学习训练过程。针对基本 BP 算法收敛速度慢等缺点,本文在基本 BP 算法的基础上加以改进,提出了改进型 BP算法。基本 BP 算法的网络权值调整模式属于增量模式,具体是指在每输入一个样本后,都回传误差一次并调整权值。而我们提出的改进型 BP 算法属于批量模式,它是在所有的样本输入之后,计算网络的总误差,然后根据总误差计算各层信号并调整权值,批量模式遵循了以减小全局误差为目标的“集体主义”原则 7,因而可以保证总误差向减小方向变化。在样本数较
7、多时,批量模式比增量模式的收敛速度更快、误差也更小。设在改进后的 BP 神经网络中,为网络的输入向量;12,TnXx为隐层的输出向量;lYy为网络的输出向量;12(,)TmOo为输入层和隐含层之间的权值矩nWw阵; 为隐含层和输出层之间的权值12,lVv矩阵; 为迭代次数。改进型 BP 算法步骤如下:(l)网络状态的初始化:用较小的随机数对网络的权值 和 赋初值,将样本模式计数器 ,P训练次数计数器 都置为 1,误差 置为 0,学习qE率 设为 间小数,网络训练后达到的精度01:设为一正的小数。minE(2)输入训练样本,计算各层输出,用当前样本 对向量数组赋值,并计算 和 中的各分量。XYO
8、(3)计算网络输出误差:设共有 对训练样本,P网络对应不同的样本具有不同的误差 ,用pE作为网络的总误差。12PpEq(4)计算各层误差信号并根据误差按照式(3)调整各层权值。(3)()(1)() nynwliljljilji (5)判断当 时,则增大学习率1Eq值, 的变化按式(4)变化,并返回步骤(4),按式(5)重新计算 和 中各分量,如果误差 继续VWE减小,则继续增大学习率,其变化按式(6)变化,直到搜索 不再减小,并保留最小值时对应的权值 和 ;如果当 时,则减小学习1Eq率 值, 的变化按式(7)变化,返回步骤(4),按式(5)重新计算 和 中各分量,如果误差 还没VE有减小,则
9、继续减小学习率,其变化按式(8)变化,直到搜索到一个不大于 的误差 ,并保留 值时所对应的权值 和 。W(4)1.(5)ijijjinX(6).(7) /2(8)(6)在网络训练过程中适当调整神经网络的转移函数。(7)检查网络总误差是否达到精度要求,例如,当用 代表网络的总误差时,若 ,训练结EminE束;否则 置为 0,并返回步骤(2)。从以上步骤可以看出,改进型 BP 算法是在所有样本输入之后,计算网络总误差,然后根据总误差计算各层的误差信号并调整权值,因为采用了批处理方式,使得整个神经网络具有收敛速度快、误差小等优点。为了比较改进型 BP 算法与基本 BP 算法的优劣性,通过 MATLA
10、B 进行仿真,得到神经网络收敛曲线图 3 和图 4。由图 3 和图 4 可见,采用改进型 BP 算法迭代了 5486 次就达到了目标误差 0.01,实际误差为0.0096。而采用基本 BP 算法,当迭代次数达到9000 次时,误差也只能收敛到 0.1 附近。通过以上对比,可以很好地说明基于改进型 BP 算法的神经网络具有收敛速度快、误差小等优点。图 3 改进型 BP 算法收敛曲线图图 4 基本 BP 算法收敛曲线图3 实例验证与结果分析为验证方法的有效性,进行声全息法识别运动声源的实验,并且与传统方法的声源识别结果进行对比。实验在消声室里进行,实验所用基本设备为:两个尺寸为 18cm10cm8
11、cm 的音箱、信号发生器、传声器等。传声器个数为 66,阵元间距为 0.2m,呈十字形排列,放置两个音箱位于一辆轨道小车内,并分别位于坐标(-0.2m,0)和(0.2m,0)处。全息面的大小为 0.6m0.5m,距离音箱声源面 10cm。实验过程如下:先由信号发生器产生单频信号,经功率放大器放大驱动音箱发声,形成单频的稳态声场,并让轨道小车以一定速度通过固定的传声器阵列,传声器阵列在全息面测量声压时域信号。采样频率设置为 30KHz,信号发生器产生主频为 200Hz 和 500Hz 的信号进行实验。神经网络实现声场重建算法后的识别结果如图 5 所示。传统方法的识别结果如图 6 所示。其中在图
12、5 和图 6 中,左侧为 200Hz 声源,右侧为 1000Hz 声源。图 5 声源识别结果图(神经网络法)图 6 声源识别结果图(传统方法)通过识别结果图对比可以看出,采用神经网络方法能够有效地识别声源,并且比传统方法识别的位置更符合声源实际位置,提高了声源识别的准确度。通过图 5 和图 6 也能看到,随着频率的增大,声源识别的清晰度越来越低,为了进一步证实以上现象的存在,并排除掉双声源互相干扰等因素,以单音箱为研究对象,放置音箱于坐标(0,0)处,其他设置都保持不变。并通过信号发生器产生主频为 200Hz、500Hz、1000Hz 的信号进行实验。采用基于神经网络的声全息算法得到声场特征函
13、数等高线图如图 7,图 8 和图 9 所示。从图 7 至图 9 可以看出:200Hz 的低频声源识别结果准确,从图中能够很清晰地识别出声源的中心位置,且符合声源的实际坐标;500Hz 的声源也能分辨且准确,但声源以外的位置图像发散,识别图 7 200Hz 的识别结果图 8 500Hz 的识别结果图 9 1000Hz 的识别结果效果与精度没有 200Hz 的好;1000Hz 的声源在其周围出现了虚声源,且有旁瓣泄漏现象产生,因此已经不能分辨出哪个是真正的源。从音箱声源实验能得出以下结论:声全息具有优越的低频空间分辨能力,但高频空间分辨能力不是很理想,这主要是由声全息算法本身的空间分辨率决定的 8
14、。声全息是基于傅利叶变换的算法,因此必须符合抽样定律,即频谱的最高频率必须小于或等于抽样频率的二分之一。此外在全息测量中由于测量点的有限性,即测量传声器的数目限制,不可能得到测量平面上的所有信息。因此只有用有限的传声器规则地排列在测量面上进行采样。从原理上讲就是用传声器对全息面上 和 向声压xy进行二维空间抽样,所以在抽样的过程中传声器的间距也必须符合空间抽样定律。在全息测量中,大多数情况下声速 为定值,因此最大的重构频率c是 和 方向传声器间距 和 (一般取xyxdy= )的函数。见表达式(9):xdymax2cfd(9) 因此在重构过程中必须符合以上两个条件:一个由信号的时域抽样频率决定;
15、另一个由规则麦克阵列的间隔所决定的频率 (即信号的空间maxf抽样频率) ,取两者中的小者作为能准确重建的最大频率。以上面实验设置的参数为例,抽样频率为30KHz,且 11 个通道同时进行采集,则由时域抽样频率决定的最大重建频率为 1364Hz;麦克阵间距为 0.2m,根据式(5-1)计算得由空间抽样频率决定的最大重建频率为 850Hz。综合两项可知最大准确重建频率为 850Hz。这样就能很好地解释上面实验所发现的现象。在重建 1000Hz 声源时,因重建频率已经超过了最大允许准确重建频率,造成了重建结果不准确。4 结束语通过对运动声源的声全息识别理论的研究,建立了基于神经网络的声场重建算法,
16、该方法提高了全息重建的分辨率和准确率。模拟实验与分析表明,该方法能够在声源运动过程中完成声源的定位,为今后解决运动声源识别提供了一个有效的途径。参考资料:1 杨殿阁,郑四发,罗禹贡.运动声源的声全息识别方法J.声学学报,2002,27(4):357-362.2 Morigi S,Sgallari F. A regularzing L-curve Lanczos method for underdetermined linear systemsJ. Appl Math Compute,2001,121(3):55-73.3 邵威,孙民. 声场空间变换法在汽车噪声测试分析中的应用J.西安公路交通大
17、学学报,1996,16(4):83-87.4 何琳,朱海潮,邱小军等. 声学理论与工程应用M. 北京:科学出版社,2006.5 Richard J,David C. Planar near-field acoustical holography in a moving mediumJ. Acoustical Society of America,2002,112(2):420-429.6 焦李成. 神经网络系统理论M. 西安:西安电子科技大学出版社,1990.7 王守觉,李兆洲,王柏南等. 用前馈神经网络进行带噪声信号的去噪声建模J. 电路与系统学报,2000,5(4):21-26.8 罗禹贡,李克强. 平面近场声全息重建结果不准确性问题的研究J. 声学学报,2003,28(6):555-560.