1、2020 6 25 语音编码技术 2020 6 25 学习目标 学习完本课程 您应该能够 掌握语音编码的基本概念掌握语音编码的分类及原理了解语音编码质量的评定了解常用的语音编码算法 2020 6 25 课程内容 第一节语音编码技术介绍第二节移动通信系统中的语音编码技术 2020 6 25 第一节语音编码技术介绍 语音编码技术介绍波形编码技术参数编码技术混合编码语音编码质量的评定 2020 6 25 语音编码技术介绍 信源编码是指利用信源的统计特性 解除信源的相关性 去掉信源多余的冗余信息 以达到压缩信源信息率 提高系统有效性的目的 语音编码为信源编码 语音信号是模拟信号 语音的编解码就是将语音
2、的模拟信号转换为二进制数字信号 到了接收端 再将收到的数字信号还原为模拟语音 同时语音编码的作用还有减少信源冗余 解除信源相关性 压缩话音码率 提高信源有效性语音编码技术有波形编码 参数编码和介于两者之间的混合编码三大类 下面简单介绍这三类编码技术 2020 6 25 第一节语音编码技术介绍 语音编码技术介绍波形编码技术参数编码技术混合编码语音编码质量的评定 2020 6 25 波形编码技术 波形编码技术是通过对语音波形进行采样 量化 然后用二进制码表示出来 波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样 然后将幅度样本分层量化 并用代码表示 解码是其反过程 将收到的数字序列经过解码
3、和滤波恢复成模拟信号 由于这种编码系统保持了信号原始样值的细节变化 从而保留了信号的各种过渡特征 所以波形编码的语音质量一般较高 但是由于波形编码没有充分利用语音信号的冗余特性 使其压缩比不大 造成只有在较高速率上才能得到满意的语音质量 当编码速率降低到16Kbps以下时 编码语音质量将迅速下降 脉冲编码调制 PCM 和增量调制 M 以及它们的各种改进型自适应增量调制 ADM 自适应差分编码 ADPCM 等 都属于波形编码技术 2020 6 25 第一节语音编码技术介绍 语音编码技术介绍波形编码技术参数编码技术混合编码语音编码质量的评定 2020 6 25 参数编码技术 参数编码技术利用人的发
4、声机制 仅传送反映话音波形产生的主要变化参量 主要是指表征声门振动的激励参数和表征声道特性的声道参数 在接收端根据发声机制 由传送来的变化参量人工合成话音 参量编码是通过对语音信号特征参数的提取和编码 力图使重建语音信号具有尽可能高的可靠性 即保持原语音的语意 但重建信号的波形同原语音信号的波形可能会有相当大的差别 这种编码技术可实现低速率语音编码 比特率可压缩到2 4 8Kbps 甚至更低 但语音质量只能达到中等 特别是自然度较低 连熟人都不一定能听出讲话人是谁 线性预测编码 LPC 及其他各种改进型都属于参量编码 2020 6 25 第一节语音编码技术介绍 语音编码技术介绍波形编码技术参数
5、编码技术混合编码语音编码质量的评定 2020 6 25 混合编码 混合编码是波形编码和参数编码两种系统优点的结合 既利用了语音生成模型 通过对模型中的参数进行编码 减少了波形编码对象的动态范围或者数目 又使得编码的过程产生接近原始语音波形的合成语音 以保留语音的各种自然特征 提高了合成语音的质量 利用混合编码技术能够在4 16Kbps速率上能够得到高质量的合成语音 多脉冲激励线性预测编码 MPLPC 规划脉冲激励线性预测编码 KPELPC 码本激励线性预测编码 CELP 等都是属于混合编码技术 很显然 混合编码是适合于数字移动通信的语音编码技术 2020 6 25 第一节语音编码技术介绍 语音
6、编码技术介绍波形编码技术参数编码技术混合编码语音编码质量的评定 2020 6 25 语音编码质量的评定 如何评价语音编码质量也成为语音编码领域所研究的一个重要课题 对此多年来人们提出了许多方法 归纳起来大致可分为两类 即客观评定方法和主观评定方法 客观评定方法用客观测量的手段来评价语音编码的质量 常用的方法有信噪比 加权信噪比 平均分段信噪比等 它们都是建立在度量均方误差的基础上 其特点是计算简单 但不能完全反映人对语音质量的感觉 这个问题对于速率为16Kbit s以下的中 低速率语音编码尤为突出 因此主要适用于速率较高的波形编码类型 主观评定方法符合人类听话时对语音质量的感觉 因而目前得到广
7、泛应用 最主要的主观评定方法是主观评定等级 SubjectiveOpinionScale 或称平均评定得分 MeanOpinionScore 缩写MOS MOS得分采用五级评分标准 其方法是 由数十名试听者在相同信道环境中试听并给予评分 然后对评分进行统计处理 求出平均得分 2020 6 25 主观评定等级表 2020 6 25 常见的语音编码方案 1 2 2020 6 25 常见的语音编码方案 2 2 2020 6 25 课程内容 第一节语音编码技术介绍第二节移动通信系统中的语音编码技术 2020 6 25 第二节移动通信系统中的语音编码技术 移动通信系统对语音编码技术的要求移动通信系统中语
8、音编码算法介绍 2020 6 25 移动通信对数字语音编码的要求 速率较低 纯编码速率应低于16kbit s 在一定编码速率下音质应尽可能高 编码时延应较短 控制在几十毫秒以内 在强噪声环境中 算法应具有较好的抗误码性能 以保持较好的话音质量 算法复杂程度适中 易于大规模集成 2020 6 25 第二节移动通信系统中的语音编码技术 移动通信系统对语音编码技术的要求移动通信系统中语音编码算法介绍 2020 6 25 GSM系统的语音编码系统 GSM的语音编码系统采用规则码激励长期预测编码算法 RPE LTP 下图为RPE LTP算法的编解码原理图 2020 6 25 RPE LTP算法 RPE
9、LTP算法的对象是窄带语音 300 3400Hz 经8000Hz采样进行13比特均匀量化后的数字信号 每20ms 160样点 为一帧 每帧比特数为2080 编码后成为大小为260比特的净话音数据块 所以编码后的速率为260bit 20ms 13kbit s 我们这里介绍的是GSM中全速率 FR 的编码方式 除此之外还有半速率 HR 和增强型全速率 EFR 等编码方式 2020 6 25 IS 96CDMA系统的语音编码系统 IS 96CDMA系统的语音编码系统采用QCELP QualcommCodeExcitedLinearPrediction 方案 即码激励线性预测的可变速率混合编码方案 该
10、方案为美国Qualcomm通信公司的专利语音编码算法 其特点为 基于线性预测编码 使用矢量码表替代简单线性预测中产生的浊音准周期脉冲的脉冲位置和幅度 即使用码表矢量量化差值信号 可变速率 采用话音激活检测 VAD 技术 在话音间隙期 根据不同信噪比背景分别选择9 6kbit s 4 8kbit s 2 4kbit s和1 2kbit s4个档次 1 1 2 1 4 1 8 的传输速率 它可以使平均速率比最高速率下降两倍以上 参量编码的主要参量分为三类 且每帧不断更新 2020 6 25 典型的QCELP方案实现框图 2020 6 25 QCELP方案的实现 在首先对模拟话音按8KHz取样 其次
11、按照20ms划分为一个话音帧 每一帧会有160个样点值 将160个样点值生成3个参数子帧 滤波参数 音调参数 码表参数 3个参数不断更新 更新后参数按一定帧结构送至接收端 即完成整个语音编码过程 2020 6 25 WCDMA中的语音编码AMR 1999年初 3GPP The3rdGenerationPartnershipProject 采纳了由Ericsson Nokia和Siemens提出的AMR标准 AdaptiveMulti RateStandard 作为第三代移动通信中的语音编码器的标准 AMR提供了多达8种的编码速率 而且每种速率都有了不同的容错度 AMR语音编码器拥有12 2K到
12、4 75K不同的编码速率 一方面是为了提供不同无线传愉环境下不同容错率的编码器 从而使系统中语音质量和系统容量的折衷更加平稳 灵活 更加完美 另一方面也是为了满足系统可能的特殊要求 AMR有8种固定的信源速率模式 从4 75Kbit s到12 2Kbit s 2020 6 25 AMR语音编码 2020 6 25 CDMA2000中的语音编码 CDMA2000系统中的语音编码采用采用增强型可变速率编码算法 增强型可变速率声码器 EnhancedVariableRateCodec EVRC 是基于RCELP算法的一种编解码算法 在CDMA系统中 它根据语音的激活程度产生一个可变的输出数据速率 并且具有较高的鲁棒性