声码器.ppt-道客多多_道客多多docduoduo.com

资源描述

1、声码器,声码器是什么语音模型声码器技术声码器实现发展方向,声码器是什么,语音（声音）编解码器 Encoder、Decoder、Vocoder 声语音信号，8K采样，13PCM 码码本，码字器处理器：编码器，解码器,语音器官,喉：声带，声门声道：一个具有某种谐振特性的腔体，具体基音周期嘴整个系统是一个线性时变系统,语音谱特性,浊音短时谱特点：有明显的周期性起伏特性频谱中有明显的凸起点，出现频率与声道的谐振频率相对应；该频率为共振峰频率，一般为5个浊音的声带振动频率为基音频率，其不同轨迹为声调,语音模型,语音编码要求,在给定编码速率下，话音质量尽可能高在多音环境或强噪声下，

2、应有较好的编码效果，MOS评分不低于3.5 编码、解码延时不能过长，应控制在几十毫秒内算法具有较好的抗误码性能，计算量小，性能稳定,分类,波形编码器声源编码器混合编码器,波形编码器,时间和幅度均已离散的信号以最小军方差逼近原编码波形：取样、量化、编码话音频率：3003000Hz 采样率：8000Hz 脉冲编码调制（PCM）：64kbit/s S/N=41dB,波形编码器（续）,应用于有线传输模式其它波形编码器自适应预测编码器（APC）自适应变换编码器（ATC）子带编码器（SBC）速率从64kbit/s到16kbit/s,声源编码器,提取语音信号的特征参数，容易将编码速率压缩到

3、2.4kbit/s以下物理模型：声带振动脉冲激励声道滤波器较短时间段内的语音参数：清浊音比例、浊音周期、增益系数、滤波器参数线性预测编码（LPC）最成熟、应用最广泛,混合编码器,融合了波形编码和声源编码技术两种应用较多的方案：多脉冲激励线性预测编码器（MPLPC）：设置有N个激励脉冲样本的序列，选择其中的M个样本激励使与原始语音误差最小码激励线性预测编码（CELPC）：N个激励脉冲样值为一组，构成N维矢量的码字，K个码字形成一个码本（codebook）。选择与原话音误差最小的激励码字，并将其在码本中的位置编码传送，而不需要传输N个激励样值本身,RPE-LTP声码器,GSM系统中采用

4、的规则脉冲激励长期预测编码方案，属于混合编码中多脉冲激励线性预测编码主要特征：设置若干个脉冲位置固定、幅度变化的脉冲序列作为RPE激励序列 20ms分为4个子帧，在RPE激励序列对应的40个样值脉冲中，按3：1等间隔抽取13个样点，非抽取的样点设为0，选择一个使与语音信号误差最小的一个RPE序列，将其参数编码传输,RPE-LTP组成部分,LPC分析短期分析滤波 RPE参数编码 RPE译码长期分析滤波 LTP分析,线性预测编码(LPC)分析,一个8抽头横向滤波器对20ms语音进行分析根据输入语音信号与预测信号误差最小的原则求得线性预测滤波器系数将系数转换为LAR（对数面积比）信号（3

5、6bit/20ms）输出,短时分析滤波,使用预测滤波器系数，以5ms为间隔，求出预测值，并产生短时残差用短时残差估值去选择位置和幅度都优化了的脉冲序列来代替短时残差信号，将所选的RPE脉冲序列作为激励信号，其相应的编码参数（RPE）输出,长期预测（LTP）分析,在5ms子帧计算一次对长期分析滤波器的修正值 RPE参数馈至本地RPE译码，产生长期残差信号在5ms子帧内利用短期分析滤波器输出的40个残差样本与前面的120个残差样本相加来获得长期预测的时延（Lag）和增益（Gain）,长期分析滤波器,在5ms内，根据短时残差估计样本和长期残差中的40个残差样本相加值，产生新的短期残差样本估计，

6、使短期分析滤波输出残差估值更优化,RPE-LTP性能,合成波形尽量相似于原输入话音信号，计算量小，编码速率低，硬件实现容易相当好的语音质量，MOS评分为3.6 抗误码性能好：10-3误码率下质量不下降信道编码后为22.8kbit/s，在10情况下语音质量不下降,EFR声码器性能,用代数码激励线性预测(ACELP)算法编码速率为12.2kbit/s 信道编码后速率为22.8kbit/s 具有VAD和DTX功能 MOS评分比RPE-LTP高0.7左右,QCELP声码器,采用Qualcomm码激励线性预测使用与脉冲激励线性预测编码相同的原理，将激励脉冲的幅度和位置用一个矢量码表代替一个矢量被选定且被量化，形成码表对数子帧，同时生成音调特性参数子帧和线性预测滤波器参数子帧,GSM： FR EFR HR AMR CDMA QCELP8k,13k EVRC,声码器的发展,其它声码器,G.723.1:视频通信 G.729：SCDMA,发展方向,语音质量更好延时更短算法更复杂抗干扰能力更强带宽要求更小,

展开阅读全文