1、第四章 语音信号的短时时域分析,4.1 概述,1,4.2 傅里叶变换的解释,4.3 滤波器的解释,3,4.4 短时谱的时域及频域采样率,4,4.5 短时综合的滤波器组相加法,5,2,4.1 概述,语音信号可被看作是短时平稳信号,其某一帧的短时傅里叶变换定义式如下:(4.1) 式中w(n-m)是窗函数。在式中,短时傅里叶变换有两个变量,它们是离散时间n及连续频率,若令 ,则得离散的短时傅里叶变换如下:(4.2)它实际上就是 的频率的取样。,4.1 概述,可以看出: (1)当n固定时,它们就是序列(-m+)的傅里叶变换或离散傅里叶变换。 (2) 当 或k固定时,它们是一个卷积,这相当于滤波器的运算
2、。因此,语音信号的短时频域分析可以解释为傅里叶变换或滤波器。下面分别讨论这两种情况。,4.1 概述,4.2 傅里叶变换的解释,1. 求x(n) 将式(4.1)写作(4.3)时变傅里叶变换是时间标号n的函数,当n变化时,窗w(n-m)沿着x(m)滑动。,傅里叶逆变换公式为:(4.4)令m = n, 则(4.5)可以看出,只有当w(0)0时,x(n)才能从 求出。,此外,由功率谱定义,可以写出短时功率谱与短时傅里叶变换的关系:(4.6) 功率谱 是自相关函数(4.7) 的傅里叶变换。,窗函数的作用,1. 选出x(m)序列中被分析部分;2.它的形状对时变傅里叶变换特性也有重要作用。,如果 被看成是w
3、(n-m)x(m)序列的标准傅里叶变换,同时假设x(m)及w(m)的标准傅里叶变换存在,为: (4.8)(4.9) 当n固定时,序列w(n-m)的傅里叶变换为:(4.10),根据卷积定理,有:(4.11) 写成卷积积分形式: (4.12) 将改换为-后,可以写成:(4.13),可见,为了使 能够充分地表现 的特性,要求对于 来说, 必须是一个冲激脉冲。,窗函数和窗宽对短时傅里叶谱的影响:由于矩形窗有较高的旁瓣,在语音频谱分析中,很少采用。实验表明,窗的主瓣宽度与窗宽度N成反比,选择窗宽时应根据应用需要,折衷考虑,要得到好的时间分辨率要求用窄窗,而要得到好的频率分辨率要求用宽窗。,4.3 滤波器
4、的解释(给定),1 短时傅里叶变换的滤波器实现形式一 由式(4.1)可得(4.14) 如果把w(n)看作为一个滤波器的单位取样响应,则短时傅里叶变换 就是该滤波器的输出, 为滤波器的输入。,用实数来运算的方法:(4.15),(4.16),结论:经调制后,其付里叶变换为 ,这说明调制使 的频谱在频率轴上向左移动了 ,线性滤波器输出端的频谱等于乘积 ,故为了使输出频谱准确等于 , 应当是一个冲激。即要求线性滤波器近似为一个窄带低通滤波器。,2短时傅里叶变换的滤波器实现形式二 令:(4.16)令 (4.17) 则有 (4.18),可以画出短时傅里叶变换的滤波器解释的另一种形式如图(4.3)所示,也分
5、为复数运算和实数运算两种。同样要求线性滤波器近似为一个中心频率为的窄带带通滤波器。,4.4 短时谱的时域及频域取样率,短时傅里叶变换 同时是时间n以及角频率的函数。由 来恢复x(n),首先遇到的就是时域取样率和频域取样率的问题。,1.时域取样率(为固定值),若将w(n)的傅里叶变换记为 ,对于大多数窗函数来说, 具有低通滤波器的特性,若它的带宽为BHz, 则具有与窗相同的带宽。低通滤波器的带宽是由 第一个零点位置决定的。因为是 -1的傅里叶变换,因而B的取值决定于窗口序列的长度N和形状。,若使用哈明窗, 的近似带宽为(4.20),2、频率取样率(n为固定值)此时, 是以2为周期的的连续函数,
6、用下述一组频率值来取样:(4.21)设w(n)为有限时宽N, 的短时付里叶反变换x(m)w(n-m)也应当是宽度为N有限时宽的。现在在频域内L个角频率上对 进行取样,根据这些取样所恢复出的时间信号应该是x(m)w(n-m)进行周期延拓的结果,延拓周期等于L。为使恢复的时域信号不产生混叠,要求 ,故频域最小取样数为窗宽 SRf=N。,3、总取样率的总抽样率(SR)等于(4.22) 在大多数实际窗中,B 可以表示为FS /N的倍数(4.23) 其中,C是比例常数, x ( n )的抽样频率即为(4.24) SR/FS即为与一般取样频率相比而得到的“过速率采样比”。,欠速率采样:x ( n )的短时
7、谱所要求的取样率比起一般波形表示来说,要增加到24倍。但有时在时域或频域用低于理论上最小值的取样率,而 x ( n )仍能从混叠的短时变换中准确地恢复。欠速率采样在短时谱估计,基音及共振峰分析,数字语谱图以及声码器中得到应用。,4.5 短时综合的滤波器组相加法,可表示为,(4.25),(4.26),若定义,则,(4.27),(4.28),式(4.28)的图形解释,定义 (4.29)可得(4.30)可见, 是一个冲激响应为 的带通滤波器的输出。,复数带通滤波器的频率响应为上式用图4.7(b)表示,中心频率为 ,带宽为 ,假定所有通道都使用了相同的窗函数,即,(4.31),(4.32),考虑整个带
8、通滤波器组时,其中每个带通滤波器具有相同的输入,其输出相加在一起,如图4.8所示,输出为y(n),输入为x ( n ),整个系统的复合频率响应为(4.33),如果 在频率域上正确抽样(NL,L为窗宽),可以证明对于所有都满足(4.34)上式证明如下:的傅里叶反变换是窗函数,如果在频率上以N个均匀间隔抽样,抽样形式的离散傅里叶反变换为(4.35),如果w(n)的宽度等于L个抽样,则w(n)=0, n0, nL (4.36)在式(4.35) 中取n=0,得到(4.37),从式(4.27)及式(4.34)可以推出复合系统的 冲激响应为:,(4.38),这时的复合输出为 (4.39) 于是,用滤波器组
9、相加法恢复的信号可以表示为:(4.40),上面已讨论到,当w(n)具有有限宽度L时,x ( n )完全能从时间及频率域抽样后的时变傅里叶变换准确地恢复。下面还能证明,如果 在频域内是频带受限的,则 x ( n )也能准确从 中恢复。,前面已指出,在有限宽度窗的情况下,为避免时间混叠, 必须至少在L个均匀分布的频率上取值,其中L为窗的宽度。宽度为L的窗的带宽一般在矩形窗)至 哈明窗)之间,而分析频率为 ,这时所得的带通滤波器在频率上叠接。,4.5.2 短时综合的滤波器组相加法的MATLAB程序实现,程序filterbank1.m对应于图4.6中的(b)图,先调制后滤波,实现流程图见图4.10。图
10、4.6中的(b)图,程序filterbank2.m对应于图4.6中的(a)图,先滤波后调制,实现流程图见图4.12,程序运行结果见图4.13。图4.6中的(a)图,(4.41) 式中r为一整数,0iN-1 ,上式的反变换为(4.42)又 (4.43)因而 (4.44),假设在时域上利用周期为R的取样对 取样得,4.5.3 短时综合的叠接相加法原理及MATLAB程序实现,将式(4.42)代入式(4.44)中,可得(4.45)如果R选得足够小,这时不论n为何值均可写出:因而,式(4.44)写成 (4.47) 上式说明,y(n)与x ( n )只差一个常系数,因而利用式(4.45)就能准确恢复x(n)。,(4.46),图4.15表示了按照式(4.44)的运算过程。当0nR-1时,y(n)可写成当Rn2R-1时,则y(n)可以写成:,(4.49),(4.50),滤波器组相加法与频率取样有关,它所要求的频率取样数应使窗变换满足下式:而重叠相加法要求时间抽样率应使窗满足下式:式(4.51)与式(4.52)构成对偶数关系。,(4.51),(4.52),下面给出短时综合的叠接相加法的MATLAB程序实现的运行结果,