1、语音送话流程刘文虎 2008-11-11一、 概述:发送语音信号的处理过程:(1)MIC 送话,将话音信号转换为电信号。(2)PCM 处理,将模拟的电信号转化为数字信号。 (电源)(3)信源编码,将 PCM 信号进行压缩。 (CPU)(4)信道编码,将要传送的信号进行加密。 (CPU)(5)GMSK 调制,将离散的数字信号对应于不同相位的连续正弦波信号。 (中频)(6)发射变换电路,将发射信号的频率搬移到指定的发射频率上。 (中频)二 、简要的原理分析:(一)MIC 送话:MIC 的功能是把声音转化成电信号。MIC 工作原理:当声波到来时,振动膜在声压的驱动下前后运动,两个极板之间的距离就发生
2、了变化;极板距离变化导致电容器的电容量发生变化;由于负载电阻极大,电容器上的电荷很难运动,此时可以认为电容器上的电量 Q 不变;根据公式 U QC ,电容量 C 的变化导致电容器两端的电压 U 发生变化。这样,声压的变化电容量的变化电压的变化,声音信号转化成电信号。(二)PCM 语音编码:发射信号产生的第一步是模拟信号转换成数字信号。该处理采用脉冲编码调制技术PCM(Pulse Code Modulation)语音编码包括两个过程:取样和量化。实际编码速率为64kbps,采用的时 A 律 13 折线。1、取样由取样定理可知:只要取样频率不小于语音信号最高频率的 2 倍,则采样后的脉冲样值序列可
3、以不失真的还原成原来的语音信号。因为语音信号频率是 300-3400HZ,所以采样频率 Fs23400HZ。所以 GSM 手机的取样频率取为 8KHZ。图 1 MIC 内部电路下面通过简单的取样电路来分析取样原理:信号取样受控于取样脉冲,当取样脉冲来的时候,场效晶体管 VT 的栅极加上正向电压处于导通状态,输入信号经过场效应管的漏极-源极到达输出端。没有取样脉冲时,场效应管 VT 截止,信号不能通过。因此,该电路在取样脉冲高电平时取样,低电平为取样间隔时间。如左图所示。2、量化量化的实质是将连续的无限多个样值变为有限种取值,然后再用不同的数字数列表示,从而实现模数转换。如图 3 所示:3V 的
4、电压被量化后对应 00000011 的数字信号。量化的两种方式为均匀量化和非均匀量化。均匀量化:将取样信号幅度变化范围划分为若干量化级,每个量化级的间隔相等。如图 4 所示:图 3 量化示意图图 4 均匀量化横轴表示量化器输入样值的幅度,纵轴表示量化器量化后输出的样值量化电平。斜线是不经过量化的输入于输出关系,阶梯型曲线表示量化后的输入输出关系。 (X 取值的间隔数极为量化级数)因为均匀量化间隔是固定的,它不随信号幅度而改变,所以它对小信号的量化存在较大的误差。非均匀量化:将取样后的信号经过压缩电路(非线性放大器,对小幅度信号有较大的放大量,对大幅度信号有较小的放大量) ,然后再经过均匀量化,
5、如图 5 所是。对于语言信号来说,在实际中常用对数压扩特性,但我们知道,对数曲线在自变量趋于零时,函数趋于无穷大,这显然是不满足要求的,为此需要修正对数曲线,以使其满足在输入为零时,压扩的输出也为零,我们实际中采用的修正方法为A律压扩特性(即在原点的附近由某一斜率的直线近似代替,其余的用对数曲线代替),它们接近于最佳的压扩特性,并且易于进行二进制编码。PCM 采用 A 率 13 折线 8 比特编码,13 折线法如图 6 所示,图中先把 轴的0,1区间分为 8 个不均匀段。在这里我们需要建立一个合适的数学模型来描述被压缩的曲线。图 5 非均匀量化示意图其中 x 和分别是归一化的压缩器输入和输出电
6、压,A 为压缩系数,表示压缩的程度,A 为一时对应着不压缩的均匀量化。其具体分法如下:将区间0,1一分为二,其中点为 1/2,取区间1/2,1作为第八段;将剩下的区间0,1/2再一分为二,其中点为 1/4,取区间1/4,1/2作为第七段;将剩下的区间0,1/4再一分为二,其中点为 1/8,取区间1/8,1/4作为第六段;将剩下的区间0,1/8再一分为二,其中点为 1/16,取区间1/16,1/8作为第五段;将剩下的区间0,1/16再一分为二,其中点为 1/32,取区间1/32,1/16作为第四段; 将剩下的区间0,1/32再一分为二,其中点为 1/64,取区间1/64,1/32作为第三段;将剩
7、下的区间0,1/64再一分为二,其中点为 1/128,取区间1/128,1/64作为第二段最后剩下的区间0,1/128作为第一段。然后将 轴的0,1区间均匀地分成八段,从第一段到第八段分别为0,1/8,(1/8,2/8,(2/8,3/8,(3/8,4/8,(4/8,5/8,(5/8,6/8,(6/8,7/8,(7/8,1。分别与 轴的八段一一对应。段落 1 2 3 4 5 6 7 8斜率 16 16 8 4 2 1 1/2 1/4可以看出,除一、二段外,其他各段折线的斜率都不相同。图 7-4-8 中只画出了第一象限的压缩特性,第三象限的压缩特性的形状与第一象限的压缩特性的形状相同,且它们以原点
8、为奇对称,所以负方向也有八段直线,总共有 16 个线段。但由于正向一、二两段和负向一、二两段的斜率相同,所以这四段实际上为一条直线,因此,正、负双向的折线总共由 13 条直线段构成,这就是 13 折线的由来。由 A 率特性在可知 A 率曲线原点附近的斜率应为:令上式子等 16,可的 A=87.6。依照(式 A)可以求出 Y 轴均匀 8 段分割所对应的 X 轴坐标。如下表所示:对于 Y 取值的两种情况 X 值几乎相等,这就说明按 1/2 递减进行非均匀分段的折线近似于A=87.6 的 A 率特性式非常逼近的。(三)信源编码语音编码及信源编码,语音编码目的是为了把模拟语音转变为数字信号以便在信道中
9、传输,语音编码技术在移动通信系统中与调制技术直接决定了系统的频谱利用率。在移动通信中,节省频谱是至关重要的,移动通信中对语音编码技术的研究目的是在保证一定的话音质量的前提下,尽可能地降低语音码的比特率,因此,须对 PCM 转化后的数字信号进行信源编码。信源编码技术通常分为三类:波形编码、参量编码和混合编码。GSM 手机采用规则激励线性预测(RPE-LTP )即一个语音取样值可用过去若干各语音表 1 折线斜率表表 2 13 折线对应 X 轴坐标取样值得线性组合来拟和 GSM 所用的语音编码是(RPELTP) ,规则码激励长期预测编码就是一种混合编码技术,是为适应无线通信而制定的,具备码率较低、算
10、法复杂程度不高、延迟适中、抗误码能力强的特点,同时保证了较高的话音质量。因此,RPE-LTP 算法还可以应用于语音邮件,话音记录,录音数字存储等领域。RPE-LTP 是混合编码。它既利用了语音信号的相关性进行参数编码,又利用了激励源信号的幅度特性进行波形编码。另外,还利用人耳的听觉特性,进一步消除语音信号中的主观冗余度。其纯码速率为 13kbitS,输入的语音信号分 20ms 时间间隔划分为一段(一帧) ,编码器通过三个分析电路对语音信号提取峰值参数,按帧进行处理和编码。信源编码实现的框图:(1)线性预测器:8 抽头滤波器组成的 8 个声域分析电路在 20ms 的语音段内输出 36bit 的加
11、权系数。(2)长周期预测器每一帧内,长周期预测器评估语音峰值间隔和增益 4 次,即每 5ms 测定一次,每次测定产生 7bit 滞后系数和 2bit 增益系数,在 1 帧 20ms 内产生 36bit 数码。长周期预测器提取的特征参数用于表征浊音的音调结构。(3)激励脉冲发生器输入的语音数据信号与合成的预测值两者进行比较获得误差电信号,该误差数据信号确定脉冲序列中各脉冲的幅度和起始位置。每帧有 40 个脉冲,各脉冲相对位置不变,但对于每一帧语音信号分别用不同起始位置和各个脉冲幅度变化来表征浊音的特征,接收端用该脉冲去激励语音合成模型。在一帧内激励脉冲发生器产生 188bit 数码。由此可得 2
12、0ms 语音信号经过语音编码后被压缩成 260bit 数码,所以数据得传输速率为 260bit/20ms=13kbit/s。(四)信道编码:信道编码主要是使用分组码即在每组信息码后附加若干个校验码。Dn-1Dr Dr-1D0K 位信息码 R 位校验码图 8 信道编码中检验语音帧(20ms)比较器误差电信号激励脉冲发生器线性预测器长周期预测器参数编码 语编 图 7 语音信源编码在分组码中,校验码仅校验本码的信息位,校验后,检验纠错能力就越强,校验码位数的多少通常用多余度来衡量。GSM 信道编码器信息码与检验码位数相同,即每个信息码都有一个校验码,多余度为 1/2, 182bit 加 3bit 奇
13、偶校验,4bit 尾识别码,编码后数据增加一位数 2(182+3+2)=378 bit。对语音质量无重要影响的数码 78bit,378+78=456,编码后传输速率位 456bit/20ms=22.8kbit/s信道编码包括:1、偶校验码;2、重要码;3、循环码。 其目的是通过增加码数来纠正个别错码,但它对于突发性错码或成串差错的纠错能力不是很好。因此又采用了交织技术将成半的错码转换位随机性差错,从而可用信道编码加以纠正。在发送端将信息码排列数需打乱,重新排列组合,使不同帧的信息码相互穿插交织后再发送到信道中去。20ms 为一帧的语音信号经过信道编码输出为 456bit,交织编码器将两帧语音信
14、号(40ms)的 912bit 数据按每行 8bit 写入,写完共 114 行。取出时按列进行,分别有 114bit 语音数据。这样 40ms 的语音信号被交织分散成 8 个时段,每个时段安插在一个信道帧中对应的一个时隙上,分时传送。语音时隙的基本格式是 257bit 语音数码,另外有 2bit 用于识别基带传输的语音,还加入 26bit 同步数据,3bit 头识别码,3bit 尾识别码,36.5ns(8.25bit)的保护时间,由此可得每时隙数据为 156.25bit。(五)调制调试方式有:调幅(AM) ;调频(FM) ;调相(PM) ;与之对应数字信息也有三种最基本的调制方式:幅移键控 A
15、SK 频移键控 FSK 相移键控 PSK其波形如下:图 10 三种调制波形GSM 使用一种称作 0.3GMSK(高斯最小频移键控)的数字调制方式。 0.3 表示高斯滤波器带宽与比特率之比。 GMSK 是一种特殊的数字 FM 调制方式。给 RF 载波频率加上或者减去 67.708KHz 表示 1 和 0。使用两个频率表示 1 和 0 的调制技术记作 FSK(频移键控) 。在 GSM 中,数据速率选为 270.833kbit/sec,正好是 RF 频率偏移的 4 倍,这样作可以把调制频谱降到最低并提高信道效率。比特率正好是频率偏移 4 倍的 FSK 调制称作 MSK(最小频移键控) 。使用高斯调制
16、滤波器进一步减小调制频谱。它可以降低频率转换速度,否则快速的频率转换将导致向相邻信道辐射能量。 如果没有高斯滤波器,当传送一连串恒定的 1 时,MSK 信号将保持在高于载波中心频率 67.708KHz 的状态。如果将载波中心频率作为固定相位基准,67.708KHz 的信号将导致相位的稳步增加。相位将以每秒 67.708 次的速率进行 360 度旋转。在一个比特周期内(1/270.833KHz),相位将在 I/Q 图中移动四分之一圆周、即 90 度的位置。数据 1 可以看作相位增加 90 度。两个 1 使相位增加 180 度,三个 1 是 270 度,依此类推,数据 0 表示在相反方向上相同的相
17、位变化。实际的相位轨迹是被严格地控制的。GSM 无线系统需要使用数字滤波器和 I/Q 或数字 FM 调制器精确地生成正确的相位轨迹。GSM 规范允许实际轨迹与理想轨迹之间存在均方根(RMS)值不超过 5 度、峰值不超过 20 度的偏差。MSK 调制的过程为:1 先将输入的基带信号进行差分编码,2 然后将其分成 I、Q 两路,3 并互相交错一个码元宽度,4 再用加权函数 cos(t/2Tb)和 sin(t/2Tb)分别对 I、Q 两路数据加权,5 最后将两路数据分别用正交载波调制。MSK 调制的调制电路图及波形图: 由于接收端在解调时载波恢复存在着相位的模糊性,从而引起相当大的误码率,为了解决这
18、一问题,应采用相对调相法。此方法与绝对调相法的不同之处在于数字信号 0、1 与载波相位 0、180无固定关系而是与载波相位的改变(相位差)有关。GSM 手机的数字调制框图如图所示。1 差分编码器:其实质为二进制计数器,工作原理为即来一脉冲输出状态翻转一次。2 数据分离器:其实质是将数据流中的奇与偶位分开。如下表所示:图 12 绝对相移键控调制波形3 加权相乘器:用 DIDQ 数字码直接对载波进行调制,由于其幅度为+1,-1 属不连续的脉冲信号,调制载波会产生相位的突变,当信号通过非线性放大器时,引起频谱较大的展宽,容易对邻近的频道产生干扰,为了有姣好的抑制带外干扰的能力,应采用连续的相位调制,
19、该方式就是由加权相乘器先将跳变的调制数码转换为连续变换的正弦脉冲信号,然后再进行载波调相。这样输出的调相载波信号的相位是连续的。4 载波调相器:奇偶数两位二进制数码的组合称为双位码,双位码可传送的信息有 00 01 10 11,利用载波的四种相位 0,/2 ,3/2 来表征双位码的四种数据状态。其原理如下:在该调制系统中,DI 与 DQ 均设为不归零的脉冲信号,其值不是 1 就是-1。分别表示二进制中的 1 和 0,为了获得调制信号的波形,D I 对同相 cos0t 进行幅度调制。DQ 对 cos(0t+ /2)进行幅度调制U(t)=VIcos0t+VQ cos( 0t+ /2) = VIco
20、s0t-VQsin0t双位码 DI、DQ 为 00 码时,DQVQ=-1 ;DIVI=-1。V(t)=sin0t-cos0t= cos(0t+5/4),可见 DQ、 DI 为 00 码时,调制载波的初始相位为 5/4。TXI/Q 为已调中频信号,其频率为一百兆赫兹左右,该信号被送到发射变换电路进行频率变化,得到包含语音信息的射频信号。(六) 发射变换电路:发射变换模块通常完成如下处理:发射已调的 TXI/Q 中频信号; TXVCO 与 RXVCO 信号进行混频,得到反映 TXVCO 变换的取样信号;发射已调中频信号的取样信号在发射变换模块中的鉴相器进行比较,输出包含发送数据的信号去控制发射 V
21、CO 电路。示意图如下:表 3 数据的奇偶分离1 手机中的混频电路如图 12 所示,是将 RXVCO 与 TXVCO 信号进行混频,取其差频,从而得到另一个发射中频信号。该信号被送到鉴相器中与发射 I/Q 调制电路输出的已调中频信号进行比较,得到包含数据的控制信号。混频原理:混频就是对某一信号进行频率变换,将其频率固定到某一固定的频率上,而特征信号(即要发送的信号)的特征(如调制规则)不可改变。设信号载频为 f0,本机振荡电路产生的信号频率为 fL,则混频要完成的频率变换为:fL-f0=fi 下边频 (低中频方案)fL+f0=fi 上变频(高中频方案)简析混频器的组成及波形变化:2 鉴相器:本质是对对两个信号进行相位比较,得到控制信号。由图 12 可知 I/Q 调制电路输出的已调中频信号也被送到鉴相器,与混频器输出信号进行比较。得到的控制信号就是要控制TXVCO 电路输出信号的变化与已调中频信号的变化一致。在这里可以将已调中频信号看作参考信号。假设语音信号要在 GSM900 的 37 信道发射,则混频器输出信号的频率应为:890+37*0.2=897.4(MHZ)左右,在经锁相环校准后,送往 PA 进行功率放大,从而发射到指定信道上。