1、1,学习目标,理解信源编码的定义、作用和分类; 掌握语音编码的基本概念和分类; 了解移动通信对语音编码的要求; 掌握GSM系统、IS95系统、CDMA2000系统和WCDMA系统的语音编码方案; 了解图像压缩编码的分类和相应标准;,2,前 言,通信系统的任务就是将由信源产生的信息通过无线信道有效、可靠地传送到目的地。 移动通信的编码技术包括信源编码和信道编码两大部分,信源编码是为了提高信息传输的有效性,信道编码(差错控制编码)是为了提高信息传输的可靠性。,3,子模块一 信源编码,一、信源编码 二、语音编码 三、移动通信中的语音编码 四、图像压缩编码,4,一、信源编码,(一)信源编码的定义 信源
2、编码就是信源信号的模数(AD)变换,即将模拟的信源信号转化成适于在信道中传输的数字信号形式。 (二)信源编码的作用 1、实现模数(AD)变换,使之适合于在信道中传输; 2进行信息压缩编码,提高信息传输的有效性。 (三)信源编码的分类 1、根据信源信号是离散的信号还是连续的信号,可以将信源编码分为:,5,一、信源编码,离散信源编码; 模拟信源编码。 2、根据信源信号是语音还是图像,可以分为: 语音编码; 图像编码。 移动通信系统中,信源有语音信号、图像(如可视移动电话)或离散数据(如短信息服务)。在这里主要讲语音编码和图像编码。,编码的可行性 语音和图像信号中存在大量的冗余信息 移动通信系统中的
3、最终接收者是人,而人的听觉和视觉器官都存在不敏感性,6,子模块一 信源编码,一、信源编码 二、语音编码 三、移动通信中的语音编码 四、图像压缩编码,(一)语音编码的基本概念,(一)语音编码的基本概念 1、语音编码的定义 语音编码就是实现语音信号的模数(AD)变换,即将模拟的语音信号转换成数字的语音信号。 2、语音编码的目的 减少信源冗余,解除语音信源的相关性,压缩语音编码的码速率,提高信源的有效性。 3、语音质量的评价 在语音编码技术中,对语音质量的评价归纳起来大致可分为客观评定方法和主观评定方法。,7,(一)语音编码的基本概念,(1)客观评定方法: 客观评定方法是用客观测量的手段来评价语音编
4、码的质量。 常用的客观评定方法有: 信噪比法; 加权信噪比法; 平均分段信噪比法等。 客观评定方法的应用: 客观评定方法的优点是计算简单,缺点是不能完全反映人对语音质量的感觉。这一缺点对于速率为16kb/s以下的中低速率语音编码尤为突出。 客观评定方法主要适用于速率较高的波形编码类型。,8,(一)语音编码的基本概念,(2)主观评定方法: 主观评定方法主要是依靠试听者对语音质量的主观感觉来评价语音质量的。 最主要的主观评定方法是主观评定等级(Subjective Opinion Scale),也称为平均评定得分(MOS)。 由CCITT建议采用的平均评价得分(MOS)采用五级评分标准: 5分(第
5、5级),Excellent表示质量完美; 4分(第4级),Good表示高质量; 3分(第3级),Fair表示质量尚可(及格);,9,(一)语音编码的基本概念,2分(第2级),Poor表示质量差(不及格); 1分(第1级),Bad表示质量完全不能接受。 平均评定得分(MOS的方法是: 由数十名试听者在相同信道环境中试听,并分别给予评分,然后对评分进行统计处理,求出平均得分。 减小评分波动的措施: 由于主观和客观上的种种原因,每次试听所得的评分会有波动,为了减小评分波动的措施有: 试听者人数要足够多;所测语音材料要足够丰富;试听环境应尽量保持相同。,10,(一)语音编码的基本概念,主观评定方法:
6、由于主观评定方法符合人类听语音时对语音质量的感觉,因而目前得到广泛应用。 在5级主观评测标准中,MOS达到4级以上就可以进入公共骨干网,达到3.5级以上可以基本进入移动通信网。,11,(二)语音编码的分类,(二)语音编码的分类 各种语音编码方式在信号压缩方法上是有区别的,根据信号压缩方式的不同,通常将语音编码分为以下3类: 1、波形编码 (1)波形编码的定义 波形编码是将随时间变化的信号直接变换为数字代码,力图使重建的语音波形保持原语音信号的波形形状。 (2)波形编码的特点 波形编码是一种高速率(在1664kbits之间)、高质量的编码方式。 (3)波形编码的基本原理,12,1、波形编码,波形
7、编码器可将时域的模拟信号的波形信号经过取样、量化、编码而形成数字话音信号。 取样就是将连续的模拟信号转变为离散的信号序列的过程。取样后,连续的模拟信号在时间上离散化,但幅度值仍然连续。于一个频带限制在0fm内的低通信号,可以用fs2fm的抽样频率对其进行抽样(即 满足奈圭斯特抽样定理),则抽样过程中不会丢失信号信息。 量化就是将样值转变为离散的有限个值的过程。量化后的目的是将波形的幅度值离散化,并且量化分层数要大。把量化过程中取样值与量化幅度值之间的差值叫量化噪声。 编码就是将量化幅度值用二进制码来表示的过程。量化幅度值越多,编码比特数越大,量化噪声越小。,13,1、波形编码,波形解码器则是将
8、收到的数字序列经过解码和滤波恢复成模拟信号。 (4)常见的波形编码技术 常见的波形编码技术有脉冲编码调制(PCM)、增量调制( M)、自适应增量调制(ADM)和自适应差分编码(ADPCM)等。 通信中最常用的脉冲编码调制(PCM)方式: 对语音进行频谱分析,人的语音频带范围为3003400HZ,故采用8KHZ取样速率; 8bit量化值来表示对应的模拟值; 编码速率为64Kbit/s。,14,1、波形编码,(5)波形编码技术的应用 波形编码需要较高的编码速率,但有较高的话音质量和成熟的技术实现方法,适用于公用骨干(固定)通信网。在采用低速率传输的数字移动通信系统中不能直接采用波形编码器。,15,
9、图4-1 脉冲编码调制(PCM)的组成,2、参量编码,2、参量编码 (1)参量编码的定义 参量编码又称为声源编码,它利用人类的发声机制,对语音信号的特征参数进行提取,再进行编码。 (2)参量编码的特点 参量编码是一种低速率(速率在1.24.8kbits内)、低质量的编码方式。 (3)参量编码的基本原理 在发送端,对语音进行分析以提取特征参数,然后将这些参数经过编码后发送出去;,16,2、参量编码,在接收端,根据接收数据恢复出参数,再由语音产生模型合成出相应的语音信号。由于传输的是特征参数,而不是时间波形,因此参量编码可以大大降低数据速率。 (4)常用的参量编码技术 最常用的是人工合成语音(声码
10、器)的线性预测技术,它是移动通信的语音混合编码器的最基本依据。分析如下: 语音产生物理模型 人的发音器官主要是由三部分组成:喉、声道和嘴。发出的声音主要有两种:清音和浊音。它们之间的主要区别在于在发浊音时声带不振动。这样模拟人的发音机制,可以建立一个语音信号产生的模型,如图43所示。,17,2、参量编码,18,图42 语音产生物理模型,2、参量编码,u(n)表示波形产生的激励参量,G为语音增益,C(n)为人工合成语音。 周期性信号源近似表示浊音信号源,随机性信号源近似表示清音的信号激励,根据瞬时语音信号种类以决定采用哪一种激励源。 人的喉部声道特性及嘴唇边界条件等都可以近似看成一个时变线性系统
11、,频域上是一个时变滤波器。 根据发音器官的惯性限制,时变特性为慢变化。大约几十毫秒(ms)内可以认为是近似不变的,它是传送时变参量周期的重要依据。,19,2、参量编码,线性预测LPC编译码,20,图43 线性预测LPC编译码,2、参量编码,首先,在发送端对每帧(10ms20ms)语音进行分析并提取15个基本参量(基音周期P、清浊音判决U/V、语音增益G及12个线性时变合成语音滤波器系数ai,i1,2,12); 然后,将15个基本参量经过量化、编码再送至信道; 再,在接收端先通过参量译码恢复这15个基本参量; 最后,按照发声的物理模型,利用这些参数激励并合成人工语音。,21,2、参量编码,(5)
12、参量编码的应用 参量编码只传送话音的特征参量(低速率),收端合成话音虽有一定的可懂度,自然度却下降很多,话音质量只能达到中等水平,不能满足商用话音通信的要求。 而仅适用于特殊通信系统,如军事与保密通信系统。,22,3、混合编码,3、混合编码 (1)混合编码的定义 混合编码是吸取波形编码和参量编码的优点,以参量编码为基础并附加一定的波形编码特征,以实现在可懂度基础上适当改善自然度目的的编码方法。 (2)混合编码的特点 混合编码是一种较低速率(在416kbits之间)、较好质量的编码方式。 (3)混合编码的四个主要参量 数据比特率(bps),23,3、混合编码,数据比特率是度量语音信源压缩率和通信
13、系统有效性的主要指标。 比特率越低,压缩倍数越大,在同样带宽下传输的语音路数就越多,通信系统的有效性也就越好。但是比特率越低,语音质量也相应降低,为了减少语音质量的下降,往往采用提高设备的硬件复杂度和软件算法的复杂度的办法,但是这又会带来成本的提高和处理时延的增大。 降低比特率的另一个有效办法是采用可变速率,即采用语音激活检测(VAD)技术。在语音间隙期,根据不同信噪比分别选择几个不同档次(f ,1/2 f ,1/4 f ,1/8 f ,)的传输速率,它可以使平均速率比最高速率下降两倍以上,大大降低了语音的平均传送率。,24,3、混合编码,语音质量 在语音编码技术中,对语音质量的评价是一个很重
14、要的问题。多年来人们提出了许多方法,归纳起来大致可分为两类,即客观评定方法和主观评定方法。这个已经在前面介绍过了。 复杂度与处理时延。 语音编码通常可采用数字信号处理器DSP来实现。其算法的复杂度指完成语音编码所需要的加法、乘法运算的次数,一般可采用MIPS(百万条指令/秒)表示。 通常在取得近似相同语音质量的前提下,语音的码速率每下降一倍,MIPS大约需要增大一个数量级,同时算法的复杂也会带来更长的运算时间和更大的处理时间延迟(简称处理时延)。,25,3、混合编码,在语音双向通信中,处理时延、传输时延再加上未消除的回声,对实时通信会有一定的影响。 在低数据比特率、高压缩比的混合编码中,数据比
15、特率、语音质量、算法复杂度与处理时延是4个主要参量。混合编码的任务就是力图使上述参量及其关系达到综合最优化。,26,3、混合编码,(4)混合编码的应用 常用的混合编码技术有:多脉冲激励线性预测编码(MPLPC)、规则脉冲激励线性预测编码(RPELPC)、码本激励线性预测编码(CELP)等。 因为移动通信频率资源有限,低码率、高压缩比至关重要,并且入公用网的信噪比又不能太低,所以数字移动通信系统中均采用混合编码。 如GSM系统采用的就是规则脉冲激励线性预测编码(RPELPC),IS95系统采用的就是码本激励线性预测编码(CELP)。,27,28,子模块一 信源编码,一、信源编码 二、语音编码 三
16、、移动通信中的语音编码 四、图像压缩编码,(一)移动通信对语音编码的要求,三、移动通信中的语音编码 (一)移动通信对语音编码的要求 1、编码速率要适合在移动信道内传输,纯编码速率应低于16kb/s。 2、在一定编码速率下语音质量应尽可能高,即解码后的复原语音的保真度要高,平均评定评分(MOS,Mean Opinion Score)应不低于3.5分(按长途语音质量要求)。 3、编解码时延要短,总时延不得超过65ms。 4、要能适应衰落信道的传输,即抗误码性能要好,以保持较好的语音质量。 5、算法的复杂程度要适中,应易于大规模电路的集成。,29,(二)GSM系统的语音编码,(二)GSM系统的语音编
17、码 1、GSM系统的语音编码方案: GSM系统采用规则脉冲激励长期预测(RPELTP)编码方案,属于混合编码中的多脉冲激励线性预测编码。其净比特率为13kbits,加上前向纠错后为22.8Kbits。 2、RPE-LTP编码方案: (1)GSM语音编码将话音帧(20ms,含160个抽样值),划分为4个子帧(5ms,含40个抽样值); (2)在RPE激励序列对应的40个抽样值脉冲中,按3:1等间隔抽取13个样点,非抽取的样点设为0; (3)选择一个与话音信号误差最小的RPE序列,将其参数进行编码传输,能有效地降低传输误码率。,30,(二)GSM系统的语音编码,(4)对于每一个话音子帧(5ms),
18、选用不同的RPE序列去激励语音合成模型,得到收端合成语音; 3、RPE-LTP编码方案的特征: (1)采用等间隔、相位与幅度优化的规则脉冲序列作为RPE激励序列,以减少计算复杂度,使合成后的波形更接近原始信号; (2)该方案结合长期预测以消除信号的冗余度,降低编码速率,同时其算法较简单,计算量适中且易于硬件实现。,31,(二)GSM系统的语音编码,4、GSM系统的RPE-LTP话音编码器基本原理: (1)语音编码器的输入信号 输入信号是8KHz取样的话音样值信号。该样值产生于移动台模拟数字转换器,或来自PSTN网络的PCM信号变换后的样值序列。 话音信号被分成20ms的帧,每帧含有160个语音
19、取样值。,32,RPE-LTP编码每帧比特分配表,(二)GSM系统的语音编码,34,图44 RPELTP话音编码器原理图,(二)GSM系统的语音编码,(2)RPE-LTP编码器基本原理 RPE-LTP编码器的主要组成部分有:LPC分析、短期分析滤波器、RPE参数编码、RPE译码、长期分析滤波、LTP分析等。 线性预测编码(LPC)分析: 是一个8抽头横向滤波器,对20ms话音帧进行分析,根据输入语音信号与预测信号误差最小的原则求得线性预测滤波器的系数,再将系数转换为对数面积比(LAR)信号输出。 短时分析滤波: 是用预测滤波器系数,以5ms子帧为间隔,求出预测值,并由此产生短时残差。在20ms
20、内输出对短时残差估值4次。,35,(二)GSM系统的语音编码,所谓规则脉冲激励,就是用短时残差估值去选择位置和幅度都优化了的脉冲序列来代替短时残差信号,并将所选的RPE脉冲序列作为激励信号,其相应的编码参数(RPE )输出至接收端。由此可以降低计算量,并有相当好的话音质量。 长时预测(LTP)分析: 是在5ms子帧计算一次对长期分析滤波器的修正值,利用残差信号的相关性使对输出信号之估值得到优化。RPE参数馈至本地RPE译码,以产生长期残差(20ms的160个残差样本)信号。LTP分析,在5ms子帧内,利用由短期分析滤波器输出的40个残差样本与前面的120个残差样本相加来获得长期预测的时延和增益
21、。在20ms内评估时延和增益4次,并修正长期分析滤波器的参数。LTP( )是反映时延和增益变化的输出参数。,36,(二)GSM系统的语音编码,长期分析滤波器: 在5ms子帧内,根据前面短时残差估计样本和长期残差中的40个残差样本相加值,产生新的短时残差样本估计,使短时分析滤波器输出残差估值更为优化。 RPE话音编码器将LAR参数、RPE参数和LTP参数等三种参数编码比特进行复合,获得 (即 )的话音编码输出信号。 (3)RPE-LTP话音解码器 话音译码器则利用接收到的话音编码参数,建立RPE样本,激励重建滤波器;合成话音信号。,37,(三)IS-95系统的语音编码,(三)IS-95系统的语音
22、编码 1、IS-95系统的语音编码标准: Qualcomm公司提出了用于IS-95系统的语音编码标准: QCELP声码器。该方案是可变速率的混合编码器,是基于线性预测编码的改进型码激励线性预测,即采用码激励的矢量码表替代简单的浊音的准周期脉冲产生器。 2、QCELP采用可变速率编码: (1)QCELP利用语音激活检测(VAD)技术,可采用可变速率编码。在语音激活期内,可根据不同的信噪比分别选择4种速率:9.6Kbps,4.8Kbps,2.4Kbps和1.2Kbps。,38,窄带CDMA系统中的声码器原理,CELP声码器原理,QCELP编码原理图,(三)IS-95系统的语音编码,(2)速率的确定
23、是根据话音帧(20ms)能量与三个门限的比较。每帧话音能量由话音自相关函数决定,而三个门限由前一帧话音自相关函数与前一帧噪声电平决定,每帧更新一次。 若话音自相关函数大于三个门限,选择全速率(9.6kbit/s); 大于二个门限,选择半速率(4.8kbit/s); 仅大于一个门限,选择 速率(2.4kbit); 当小于所有三个门限时,选择 速率(1.2kbit/s)速率,只传背景噪声。 (3)采用可变速率编码,可以使平均速率下降两倍以上。,41,(三)IS-95系统的语音编码,3、QCELP的编码特征: (1)将激励脉冲设置为:N个样值为一组,构成一个N维矢量的码字,K个码字形成一个码书。选择
24、与原语音误差最小的激励码字,并将其在码书中的位置编码送至接收机。 (2)与脉冲激励线性预测编码不同,QCELP用一个矢量码代替了激励脉冲的幅度和位置。因为不需要传输N个激励样值本身,所以可以有效地压缩传输信号的速率。 4、QCELP声码器的基本工作原理 TIAEIA IS-95的QCELP语音编译码系统如图45所示。,42,(三)IS-95系统的语音编码,43,图45 TIAEIA IS-95的QCELP语音编译码系统,TIAEIA IS-95的QCELP语音编译码系统,首先对输入模拟语音按8kHz取样,再按照20ms划分为一个语音帧,每帧含有1 60个样点值; 接着将160个样点值生成3个参
25、数子帧:矢量码表参数、音调参数、滤波系数参数,为了进一步降低LPC参数的码率,提高稳定性,需要将LPC参数变换成线性频谱对LSP参数,且每个子帧LSP参数是通过相邻子帧线性内插求得的,它对于任何速率都是20ms更新一次。 上述3组参数均需不断更新,更新后的参数再按一定的子帧结构打包传送至接收端。 接收端的数据经解包,取得结构参数,并根据这些参数重组发送信号。,44,(四)CDMA2000系统的语音编码,(四)CDMA2000系统的语音编码 1、CDMA2000系统的语音编码方案 美国电信工业协会TIAEIA于1996年提出EVRC(Enhaneed Variable-Rate Codec)即增
26、强型可变速率语音编码器,作为CDMA2000系统的语音编码方案。1997年通过IS-127标准,其复杂度大约为30MIPS。 2、EVRC语音编码速率: 全速率96Kbps,其对应每帧参数为171bit; 半速率48Kbps,其对应每帧参数为80bit; 速率12Kbps,其对应每帧参数为16bit,平均速率为8Kbps。,45,(四)CDMA2000系统的语音编码,3、EVRC语音编码的特征: (1)EVRC方案采用基音内插方法减小基音参数传送速率,使其在每个语音帧仅传两次,而将节省下的信息位(比特数)用于提高激励信号质量。 (2)EVRC编码器基于码激励线性预测,与传统CELP算法的主要区
27、别是:它能基于语音能量、背景噪声和其他语音特性动态调整编码速率。 4、EVRC语音编码器的基本工作原理(1)速率EVRC语音编码的取样率为8kHz,语音帧长为20rns,每帧有160个取样点。,46,(四)CDMA2000系统的语音编码,47,图4-6 EVRC编码器结构图,(四)CDMA2000系统的语音编码,(2)EVRC编码器结构: 由图4-6可见,发送端主要由下列几部分组成。 高通滤波器: 它是预处理的一部分,目的是为了去除直流和过低的频率分量。噪声抑制模块,也是预处理的一部分,采用频域滤波方案。 首先将20ms语音帧划分为两个子帧,处理时先将时域信号变换至频域,然后估计信号的功率与噪
28、声功率,并计算相应信噪比SNR,再根据SNR确定信道增益,并利用信道增益控制频域信号的大小,以达到抑制噪声的目的,最后将受抑制后的频域信号还原为时域信号。,48,(四)CDMA2000系统的语音编码,线性预测器的参数提取模块: 它首先将抑制噪声后的时域信号进行加Hamming窗处理; 再计算自相关函数,由递推算法计算LPC参数; 将LPC参数转换成谱线对参数LSP,进一步求出短时预测残差、基音延时和长时预测增益等参数; 最后通过滤波器脉冲响应求得LPC增益。 速率确定模块: 它利用自相关函数值与长时预测增益值确定是全速率、半速率还是 速率,每次只能从3类速率中选取其中之一。,49,(四)CDM
29、A2000系统的语音编码,参数量化模块: 它对选定的不同速率下的参数进行量化: 对全速率,采用4个码本进行量化; 对半速率,采用3个码本进行量化; 对 速率,采用2个码本进行量化。 对每一个码本,通过搜索量化前后的LSP参量的最小加权平均误差求得最佳量化序号,并将该序号量化值作为LSP参量的量化值,传递至接收端并加以保存。,50,(四)CDMA2000系统的语音编码,参数编码模块: 对不同的速率编码方法有所区别。全速率情况下,对LPC参数提取求得的基音延迟、谱线对参数LSP及由基音延迟求得的差分延迟进行编码。半速率情况下,仅对基音延迟进行编码。 无论是全速率还是半速率编码,均需将语音帧分为3个
30、子帧,每个子帧包含的样点数为:53,53,54,且每个子帧分别进行处理。基音合成滤波器通过自适应码本搜索方法选取,而激励矢量则是由自适应码本与固定码本共同合成,最佳激励使合成语音与原语音误差最小。最后将每一子帧的自适应码本增益和固定码本序号与增益编码,其中全速率每一子帧编成43bit;半速率每一子帧编成17bit。1/8速率不需要对语音帧进一步划分子帧,仅需传送LSP量化序号和固定码本增益即可。,51,(四)CDMA2000系统的语音编码,(3)EVRC译码原理,52,(五)WCDMA系统中语音编码,(五)WCDMA系统中语音编码 1、WCDMA系统的语音编码方案WCDMA采用AMR(Adap
31、tive Multi-Rate,自适应多速率)语音编码,编码共有8种,速率从12.2Kbps4.75Kbps 。 2、AMR编码的自适应: AMR编码的基本思路是联合自适应调整信源和信道编码模式来适应当前信道条件与业务量大小。AMR编码自适应有两个方面:信源和信道。 (1)对于信道存在两类选择: 全速率(FR):228Kbps; 半速率(HR):114Kbps。,53,(五)WCDMA系统中语音编码,(2)信源编码速率: 对于FR和HR,不同信道模式分别有8种和6种信源编码速率,如表41所示。,54,(五)WCDMA系统中语音编码,55,4、AMR编码器的基本工作原理:,AMR译码原理图,(五
32、)WCDMA系统中语音编码,(1) AMR语音编码的取样率为8kHz,语音帧长20ms,每帧160个取样点。 (2)AMR编码器: 由图48可知,AMR声码器以CELP为基础, 其中的CELP单元是自适应的,即ACELP,它有14种信源编码速率选择,其中全速率(FR)为8种,半速率有6种,见表4-2。 AMR的自适应特点主要体现在由信道检测与估值确定当时的信道状态,再由信道状态选择最合适的传输速率。 合成滤波器采用自适应式码本搜索方法来激励,而这种码本则由自适应码本与固定码本合成。码本的最佳合成搜索程序的选择与感知加权滤波器及其失真度量密切相关。,57,(五)WCDMA系统中语音编码,(3)A
33、MR译码器 AMR译码器的结构如图49所示。,58,(五)WCDMA系统中语音编码,在译码端,按可选模式,从被接收的数据帧中对发送端传送来的参量索引(序号)译码。 每帧数据可分为4个子帧,每个子帧40个样点,自适应码本和固定码本均按子帧传递量化和非量化的LP参数,同时其内插转化值也按子帧进行。 在每帧数据中,各类参量索引(序号)被译码,这些参量包含LSP矢量、更新码本矢量、基音增益、基音延时等。 重构激励通过自适应码本、更新码本及各自增益加权后获得。 激励信号通过LP合成滤波器并在其对应滤波器系数激励下重构合成语音信号,并最后通过后置滤波器输出。,59,60,子模块一 信源编码,一、信源编码
34、二、语音编码 三、移动通信中的语音编码 四、图像压缩编码,四、图像压缩编码,四、图像压缩编码 在移动通信中,从2.5G开始就逐步引入数据业务,第三代移动通信推广为含语音、数据与图像的多媒体业务,因此必须对图像压缩编码有所了解。 图像的信息量远大于语音、文字、传真和一般数据,它所占用频带比其他类型的业务宽。 传输、处理、存储图像信息要比语音、文字、传真及一般数据技术更复杂、实现更困难。,61,四、图像压缩编码,(一)图像的类型: 1、静止图片: 如照片、医用图片、遥感图片等,这类图像是完全静止的。 2、准活动图像: 可视电话、话剧、各类型会议电视,这类图像是准活动或准静止的,其特点一般是背景基本
35、上是静止的,活动人物是有限度的。 3、活动图像: 广播电视、高清晰电视HDTV等,这类图像中的人物与背景均为全活动的。,62,四、图像压缩编码,(二)各类图形压缩编码系列标准: 表42各类图形压缩编码标准,63,四、图像压缩编码,1、 静止图像压缩标准JPEG (1)基于DPCM与熵编码的无失真编码系统; (2)基于离散余弦变换DCT的限失真编码系统。 2、准活动图像视频压缩标准H26X (1)编码标准H26X是由ITU-T制定的建议标准,现已制定了H261,H262,H263和H264。其中,H262和MPEG-2视频编、译码标准是同一个标准,而H264就是MPEG-4 AVC。 (2)H2
36、61标准主要用于传输会议电话及可视电话信号,其数据比特率为64Kbps192Mbps。 (3)H263系列适合于PSTN、无线网络和因特网。,64,四、图像压缩编码,3、活动图像视频压缩标准MPEG (1)这类标准是由国际标准化组织ISO和国际电工委员会于1998年成立的一个研究活动图像的专家组MPEG(Moving Picture Experts Group)负责制定的。 (2)现已制定了MPEG-1,MPEG-2,MPEG-4及补充标准MPEG-7与MPEG-21等,其中MPEG-2与MPEG-4是与ITU-T联合研制的。 (3)在MPEG系列标准中,MPEG-l,MPEG-2属于第一代视频压缩标准,而MPEG-4则属于第二代视频压缩标准。,65,66,小 结,理解信源编码的定义、作用和分类; 掌握语音编码的基本概念和分类; 了解移动通信对语音编码的要求; 掌握GSM系统、IS95系统、CDMA2000系统和WCDMA系统的语音编码方案; 了解图像压缩编码的分类和相应标准。,