1、.语音信号处理实验讲义时间:2011-12.目录实验一 语音信号生成模型分析.3实验二 语音信号时域特征分析.7实验三 语音信号频域特征分析12实验四 语音信号的同态处理和倒谱分析16.实验一 语音信号生成模型分析一、实验目的1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。2、编程实现声门激励波函数波形及频谱,与理论值进行比较。3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。二、实验原理语音生成系统包含三部分:由声门产生的激励函数 、由声道产生的调制函数()Gz和由嘴唇产生的辐射函数 。语音生成系统的传递函数由这三个函
2、数级联而成,()Vz()Rz即 ()()HVz1、激励模型发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z变换的全极点形式 12()cTGzez这里c是一个常数,T是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z变换相乘: 112()()()vcTAUzEzez这就是整个激励模型, 是一个幅值因子。vA2、声道模型当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为
3、共振峰。一个二阶谐振器的传输函数可以写成 12()iiAVzBCz实践表明,用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个 叠加可以得到声道的共振峰模型()iz 01211 1()() RrMiri Nki kbzAVzBzCa3、辐射模型.从声道模型输出的是速度波,而语音信号是声压波。二者倒比称为辐射阻抗,它表征了口唇的辐射效应,可用下式表示: 10()Rzz三、实验内容1、设声门脉冲单个三角波的数学表达式为 111122cos 0()() 0 nNgnn其 他试画出三角波波形图及其频谱。取 。12=53N,参考程序:%三角波及其频谱n=linspace(0
4、,25,125);g=zeros(1,length(n);i=0;for i=0:40if n(i+1)0.08a=fs/(LF+ind);elsea=0;endpitch=a%画图figure(1);subplot(3,1,1);plot(time1,y);title(语音波形);axis tightylim=get(gca,ylim);line(time1(startIndex),time1(startIndex),ylim,color,r);line(time1(endIndex),time1(endIndex),ylim,color,r);xlabel(样点数);ylabel(幅度);
5、subplot(3,1,2);plot(frame);axis(0,240,-0.5,0.5)title(一帧语音);.xlabel(样点数);ylabel(幅度);subplot(3,1,3);time2=-119:1:-1,0:1:120;plot(time2,cepstrum1);axis(-120,120,-0.5,0.5)title(一帧语音的倒谱);xlabel(样点数);ylabel(幅度);图4-1 对浊音信号进行基音检测2、利用同态处理计算给出语音信号的共振峰。y,fs,nbits=wavread(speech_dsp.wav);time1=1:length(y);time=
6、(1:length(y)/fs;frameSize=floor(30*fs/1000);startIndex=round(2080);endIndex=startIndex+frameSize-1;frame=y(startIndex:endIndex);%frameSize=length(frame);frame2=frame.*hamming(length(frame);rwy=rceps(frame2);ylen=length(rwy);cepstrum=rwy(1:ylen/2);%基音检测LF=floor(fs/500);HF=floor(fs/70);cn=cepstrum(LF:
7、HF);mx_cep,ind=max(cn);.%共振峰检测核心代码%找到最大的突起的位置NN=ind+LF;ham=hamming(NN);cep=cepstrum(1:NN);ceps=cep.*ham;%formant1=20*log(abs(fft(ceps);formant1=abs(fft(ceps);formant(1:2)=formant1(1:2);for t=3:NN%do some median filteringz=formant1(t-2:t);md=median(z);formant2(t)=md;endfor t=1:NN-1if t0.08a=fs/(LF+ind);elsea=0;end的作用是什么?3、解释共振峰的含义。不同人发同音时共振峰相同吗?.