收藏 分享(赏)

声码器.ppt

上传人:hskm5268 文档编号:9841109 上传时间:2019-09-10 格式:PPT 页数:24 大小:208KB
下载 相关 举报
声码器.ppt_第1页
第1页 / 共24页
声码器.ppt_第2页
第2页 / 共24页
声码器.ppt_第3页
第3页 / 共24页
声码器.ppt_第4页
第4页 / 共24页
声码器.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、声码器,声码器是什么 语音模型 声码器技术 声码器实现 发展方向,声码器是什么,语音(声音)编解码器 Encoder、Decoder、Vocoder 声语音信号,8K采样,13PCM 码码本,码字 器处理器:编码器,解码器,语音器官,喉:声带,声门 声道:一个具有某种谐振特性的腔体,具体基音周期 嘴 整个系统是一个线性时变系统,语音谱特性,浊音短时谱特点: 有明显的周期性起伏特性 频谱中有明显的凸起点,出现频率与声道的谐振频率相对应;该频率为共振峰频率,一般为5个 浊音的声带振动频率为基音频率,其不同轨迹为声调,语音模型,语音编码要求,在给定编码速率下,话音质量尽可能高 在多音环境或强噪声下,

2、应有较好的编码效果,MOS评分不低于3.5 编码、解码延时不能过长,应控制在几十毫秒内 算法具有较好的抗误码性能,计算量小,性能稳定,分类,波形编码器 声源编码器 混合编码器,波形编码器,时间和幅度均已离散的信号以最小军方差逼近原编码波形:取样、量化、编码 话音频率:3003000Hz 采样率:8000Hz 脉冲编码调制(PCM):64kbit/s S/N=41dB,波形编码器(续),应用于有线传输模式 其它波形编码器 自适应预测编码器(APC) 自适应变换编码器(ATC) 子带编码器(SBC) 速率从64kbit/s到16kbit/s,声源编码器,提取语音信号的特征参数,容易将编码速率压缩到

3、2.4kbit/s以下 物理模型:声带振动脉冲激励声道滤波器 较短时间段内的语音参数:清浊音比例、浊音周期、增益系数、滤波器参数 线性预测编码(LPC)最成熟、应用最广泛,混合编码器,融合了波形编码和声源编码技术 两种应用较多的方案: 多脉冲激励线性预测编码器(MPLPC):设置有N个激励脉冲样本的序列,选择其中的M个样本激励使与原始语音误差最小 码激励线性预测编码(CELPC):N个激励脉冲样值为一组,构成N维矢量的码字,K个码字形成一个码本(codebook)。选择与原话音误差最小的激励码字,并将其在码本中的位置编码传送,而不需要传输N个激励样值本身,RPE-LTP声码器,GSM系统中采用

4、的规则脉冲激励长期预测编码方案,属于混合编码中多脉冲激励线性预测编码 主要特征:设置若干个脉冲位置固定、幅度变化的脉冲序列作为RPE激励序列 20ms分为4个子帧,在RPE激励序列对应的40个样值脉冲中,按3:1等间隔抽取13个样点,非抽取的样点设为0,选择一个使与语音信号误差最小的一个RPE序列,将其参数编码传输,RPE-LTP组成部分,LPC分析 短期分析滤波 RPE参数编码 RPE译码 长期分析滤波 LTP分析,线性预测编码(LPC)分析,一个8抽头横向滤波器 对20ms语音进行分析 根据输入语音信号与预测信号误差最小的原则求得线性预测滤波器系数 将系数转换为LAR(对数面积比)信号(3

5、6bit/20ms)输出,短时分析滤波,使用预测滤波器系数,以5ms为间隔,求出预测值,并产生短时残差 用短时残差估值去选择位置和幅度都优化了的脉冲序列来代替短时残差信号, 将所选的RPE脉冲序列作为激励信号,其相应的编码参数(RPE)输出,长期预测(LTP)分析,在5ms子帧计算一次对长期分析滤波器的修正值 RPE参数馈至本地RPE译码,产生长期残差信号 在5ms子帧内利用短期分析滤波器输出的40个残差样本与前面的120个残差样本相加来获得长期预测的时延(Lag)和增益(Gain),长期分析滤波器,在5ms内,根据短时残差估计样本和长期残差中的40个残差样本相加值,产生新的短期残差样本估计,

6、使短期分析滤波输出残差估值更优化,RPE-LTP性能,合成波形尽量相似于原输入话音信号,计算量小,编码速率低,硬件实现容易 相当好的语音质量,MOS评分为3.6 抗误码性能好:10-3误码率下质量不下降 信道编码后为22.8kbit/s,在10情况下语音质量不下降,EFR声码器性能,用代数码激励线性预测(ACELP)算法 编码速率为12.2kbit/s 信道编码后速率为22.8kbit/s 具有VAD和DTX功能 MOS评分比RPE-LTP高0.7左右,QCELP声码器,采用Qualcomm码激励线性预测 使用与脉冲激励线性预测编码相同的原理,将激励脉冲的幅度和位置用一个矢量码表代替 一个矢量被选定且被量化,形成码表对数子帧,同时生成音调特性参数子帧和线性预测滤波器参数子帧,GSM: FR EFR HR AMR CDMA QCELP8k,13k EVRC,声码器的发展,其它声码器,G.723.1:视频通信 G.729:SCDMA,发展方向,语音质量更好 延时更短 算法更复杂 抗干扰能力更强 带宽要求更小,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报