1、语音清晰度的客观评测,中国传媒大学 传播声学研究所章斯宇 2010.5.21,主要内容,1. 语音清晰度的评测,语音的清晰度或可懂度是音质评价的重要指标反映厅堂或扩声系统的声音传输质量主观评价: 组织测试队伍实地测试(articulation test)优点:直接、真实缺点:耗费人力物力GB-T 15508-1995 声学 语言清晰度测试方法,语音清晰度的客观评价方法,尽可能反映真实的清晰度水平,清晰度指数 AI (Articulation Index),French ANSI Std. S3.5-196919861997特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引起的语音清晰度恶化
2、程度,不能反映混响、回声或削峰等时域或非线性失真的影响。,辅音损失率 %ALcon (articulation loss of consonants),能不能根据测量房间内的某些物理量估计语音清晰度?Knudsen(1932), Peutz(1971), Klein(1971)根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。,Peutz 公式(经验推导),D听音处距声源的距离。单位m。T60混响时间(1400Hz)。单位s。V房间的体积。单位m3。校准值。针对不同水平的听者。1.5%12.5%。Dc临界距离。单位m。,Klein对Peutz公式的补
3、充,当房间声学特性难以改善时,采用电声手段提高语音清晰度。声源个数n;声源指向性因子Q;,辅音损失率%ALcon的不足,根据实验结果的经验推导,物理基础不够;对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响;没有考虑早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响;,Jacob(1985),Hougast & Steeneken (197319801985)IEC Std. 60268-16充分反映声传递系统性能质量的优劣,输入端:说话人发音,语言传输指数STI (speech transmission index),输出端:
4、听者耳朵,语言传输系统:充分考虑传递过程中噪声、混响、回响、系统失真等各种干扰因素的影响,调制转移函数MTF (modulation transfer function),连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。传输过程中,噪声、混响、系统失真等会使得包络发生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。,MTF的计算,函数定义为声信号经传输后接收信号强度包络的调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。,STI的计算,14种调制频率;7种倍频带噪声 作为测试
5、信号计算98个MTF结果类似AI计算中的加权平均最终得STI 0,1根据房间脉冲响应可以直接计算MTF,STI与语音清晰度,Steeneken (1980),不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。,语言传输指数STI的简化算法,限制条件:无明显非线性失真;环境噪声无脉冲;混响时间频率特性平滑;宽带语言传输系统;1)RASTI (Rapid STI or Room acoustic STI)适用于不包括扩声系统的厅堂语音传输质量的评价选取了语言谱中比较有代表性的频带和调制频率,2
6、)STIPA (STI for public address)适用于包括扩声系统的厅堂或电声系统的语音传输质量评价选取了7种倍频带载波,每种载波对应2中调制频率,公共广播系统工程技术规范STIPA作为评价公共广播语言传输质量的重要指标,2.混响作用下STIPA与汉语清晰度的关系,对于“声韵调”结构语言汉语,情况是怎样的?目的:在实验室条件下对无噪声纯混响作用下STI-PA与普通话单音节清晰度之间的关系进行实验研究。以期对搞清楚在纯混响作用下普通话单音节清晰度与语言传输指数STI-PA的具体关系有所贡献和帮助。对汉语语音清晰度客观评测方法的发展有着积极的意义。,实验方法,实验室录音、模拟测试的方
7、法参照声学 语言清晰度测试方法GB-T 15508-1995,混响时间:0.5 s6.0 s,步长0.5 s,共12种混响条件;发音人2名,听音人11名;声场中心声压级65dBA;中、后音节受混响作用更明显;,实验结果,混响时间与清晰度、STIPA的关系,STIPA与普通话单音节清晰度的关系,在实验结果的基础上归纳导出了STI-PA与普通话单音节清晰度之间的关系,此关系对制定扩声系统的STI-PA指标具有实用意义。实验结果也揭示出汉语普通话单音节清晰度受混响的影响与英语清晰度受混响的影响程度有明显的不同。启示我们在实际工程应用中,在涉及到普通话语音清晰度的评测问题时,对直接引用已有的国际标准或
8、基于外语的研究结果要十分慎重。,,3.噪声条件下STIPA与汉语清晰度的关系,在实验室条件下分析了不同频带范围、不同信噪比的噪声环境下语音清晰度、STI-PA与信噪比的关系,并根据单音节清晰度与语言可懂度的关系,估计了在满足一定可懂度条件下的最低信噪比及相应的STI-PA。实验室录音、模拟测试的方法参照声学 语言清晰度测试方法GB-T 15508-1995采用了全频带白噪声和中心频率为250Hz,500Hz,1KHZ,2KHz,4KHz,8KHz的倍频带噪声作为干扰噪声,各频带噪声分别设置45种信噪比。,实验结果,1) 信噪比与清晰度、STIPA的关系(以白噪声为例),2) 等清晰度曲线不同的噪声条件可能有着相同清晰度水平,工作是在实验室条件下进行的,考虑到实际的应用情况,可能还有一些不完善的地方,比如房间冲击响应的结构是否会对STI-PA与清晰度的关系有明显的影响还需要探讨。实际环境中的噪声种类多样,频率范围丰富,由于条件限制无法一一进行测试。每个频带噪声的信噪比取值区间可以更加细致以获得更为全面的结果。另外本次实验只是在65dBA(标准说话声压级)的噪声水平下进行的,其它噪声水平下的语言清晰度和STI-PA、信噪比的关系是否同本次实验结果一致还需要进一步的研究。,,4. 展望,STI for Chinese?,Thank You !,