1、2019/4/29,ISSUE2.0,光接入窄带业务故障处理,Page 2,学习完此课程,您将会: 掌握故障处理的基本流程 掌握故障定位的常用方法 对疑难故障问题能够及时准确进行信息采集 能处理常见语音故障,目 标,Page 3,参考资料,本胶片参照 UA5000故障处理手册SUPPORT网站上的案例资料等 EPON语音问题工程师内部指导,Page 4,第1章 故障处理概述 第2章 XPON VOIP业务故障处理 第3章 传真和MODEM故障处理,内容介绍,Page 5,故障处理的思路,发现故障,排除故障,信息收集,故障分析,故障定位,Page 6,故障处理的思路,故障排除是指合理的、一步一步
2、找出故障原因并解决的总体原则。,它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。,Page 7,故障处理模型,Page 8,了解故障现象的一般流程,了解故障出现状态(突发、升级、新开局),了解故障范围、现象,了解故障是否在控制台上报,了解单板指示灯状态,了解设备版本信息,了解故障前后人为操作,了解上、下行设备状态,了解相关接口状态,了解设备应用的业务类型,Page 9,故障信息采集的一般流程,采集设备单板配置,采集设备版本信息,设备数据配置信息,采集详细日志信息,采集详细告警信息,采集对接设备告警信息,采集对接设备接口信息,采集
3、组网信息,采集设备环境信息,Page 10,故障定位的过程及其方法,在处理故障时,很关键的一点是要确定故障的原因是否在设备上, 避免因此造成的人力、物力、财力的浪费。实际操作过程中可以遵循由外到内、由大到小、由整体到局部的原则,即先查看外部线缆连接是否牢靠、各指示灯状态是否正常,然后通过控制台查看系统的整体运行状态,最后再查看各个模块的运行状态。 非常关键的一点故障信息的反馈一定要准确,关注细节,同时需要防止信息传递过程中的失真,Page 11,信息采集常用工具介绍及使用方法,工具介绍: 1、TOOLBOX工具 2、DBWIN工具 3、ETHEREAL工具,优缺点: 1、采用DBWIN和TOO
4、LBOX工具抓包,只能抓到信令流,即只有控制信令报文,没有媒体流信息,TOOLBOX工具可以根据端口抓取信令。2、采用ETHEREAL工具抓包,即可以抓信令流报文,也可以抓媒体流报文,一般需要镜像端口或者级联HUB抓包。,Page 12,故障处理概述,故障处理的一般流程是什么?,小结,您学会如何收集故障信息了吗?,Page 13,第1章 故障处理概述 第2章 XPON VOIP业务故障处理 第3章 传真和MODEM故障处理,内容介绍,Page 14,VOIP业务原理,原理简介设备通过语音模块进行TDM语音到IP包的转换,基本原理与QQ及Skype等通讯软件类似,都是通过IP来承载语音。MGCP
5、,H248,SIP分别是VOIP的三大控制信令。目前使用较多的是H248,随着固定移动的融合,SIP正在被越来越广泛应用,Page 15,VOIP业务常见故障,常见故障设备不能在SoftSwitch上成功注册 摘机无拨号音 数图类问题 主叫号码显示问题 单通、串号问题 语音质量问题(回声、断续、杂音等) 二次拨号问题 Fax&Modem类问题,我注册不了啊!,吵死了!,Page 16,设备不能在SoftSwitch上成功注册,【现象描述】softx3000下带MXU设备MG接口无法注册。 【组网】,Page 17,设备不能在SoftSwitch上成功注册,【原因分析】 1、先外部网络是否正常;
6、 2、再内部对接数据配置是否正确; H248信令流程是否正常? 【处理过程】 1、ping MGC测试网络 2、检查对接参数 3、跟踪H248信令,MG和MGC哪些参数需要协商一致?,Page 18,案例分析:MA5606T新开局MG接口不能注册,【现象描述】MA5680T+MA5606T开EPON VOIP业务mg接口状态为Wait ack 。 【组网】softx3000IP网 MA5680T+MA5606T 【原因分析】外部内部整体局部,Page 19,案例分析:MA5606T新开局MG接口不能注册,【处理过程】1、检查MDU与软交换数据,MGIP、MGPORT、MGCIP、MGCPORT
7、等都能够对应。 2、查看ONU状态,display ont info,状态匹配;ONU能够ping通OLT,ONU可以ping通软交换网关地址。 3、在OLT上行端口上做镜像抓包如下: SVMT=RS,V=3,RE=“901”,20080507T15302326 软交换没有信令响应。分析MG与MGC之间248协议交互的版本不一致,查看mg-software parameter 20,版本由高往低协商,将此参数修改为由低往高协商,重启MG接口,接口状态normal,注册成功。,Page 20,摘机无拨号音,【原因分析】1、先外部线路,终端; 2、设备数据配置错误,端口闭塞;3、单板模块信令流程错
8、误等。,Page 21,摘机无拨号音,【定位方法】 1、对用户端口进行内外线测试,以便检验线路是否有问题。 2、查看MG接口是否正常。 3、检查用户端口是否配置用户数据。 4、跟踪AG的信令消息。 5、检查DSP是否正常。 6、重新加载语音文件。,Page 22,案例分析:MA5606T用户摘机无拨号音,【现象描述】MA5606T用户摘机听不到拨号音,软交换,IP 骨干网,语音流,用户线,TG,没声音啊,5606T,Page 23,案例分析:MA5606T用户摘机无拨号音,【原因分析】软交换没有下发数图,或者下发了错误的数图 【处理过程】1、先抓取H248信令报文。 报文如下: 9d: 163
9、12:54:00.360msg from mgc(172.31.8.4:2944) to mg(172.18.112.94:2944): !/1 :2944 T=2146463428C=-MF=AG58900DM=DM940938949318 (EF0-90-9E.F|EExx|FF|EFxxF|ExxExxxxF|100x 9d: -x|101x.|102x.|108x.|110|114|119|111x.|118x.|120|122|121xx|123xx|125x.|160|162|163xx|1643|16500|166xSx.|168xxSxxx|17xxxS.|19xxxxS.|2
10、00|2010|20188|20198|20170|20130|201x.|400xxxxxxx|800xxxxxxx|600x.|70 9d: -0x.|950x.|951x.|955xx|958x.|968xxx|96168xxxxx|90-5,7-9xxxSx.|960-2,4-9xxSx.|963xx|96366xSx.|00xxSx.|01358xxxxxxxxx|010xxxSxxxxx|02xxxxSxxxxx|0592346789xxxSxxxx|05915xxxSxxxxx|03-9xxxxxSxx 9d: -xxx|0311xxxSxxxxx|037179xxxSxxxxx
11、|04151xxxSxxxxx|051023xxxSxxxxx|05312xxxSxxxxx|057147xxxSxxxxx|07557xxxSxxxxx|0769xxxSxxxxx|08918xxxSxxxxx|026023xxxSxxxxxSxxx|2-8xxxxxx|1358xxxxxxx 9d: -xx),E=2146940020dd/ceDM=DM940938949318 ,mfd/ceDM=DM940938949318 ,al/on,al/fl,SGcg/dt 9d: 16412:54:00.360msg from mg(172.18.112.94:2944) to mgc(172
12、.31.8.4:2944): !/1 :2944 ER=400“Syntax error in message“,Page 24,案例分析: MA5606T用户摘机无拨号音,分析报文发现5606回应400语法错误,表明5606不能识别对方下的数图,故通过分析数图发现0-5,7-9xxxSx.|960-2,4-9这个数图子中含有非法字符“,”逗号,核对中国电信标准,数图中不能含有逗号符号。 2、协调Z公司修改了数图,去掉逗号符号后,摘机有拨号音,业务正常。,Page 25,数图类问题拨号后听忙音或者等待时间过长,数图格式一般如下: (2-9xxxxxx|9xxxx|10124-9x|E|x.F|
13、0-9EF.L) 例如拨号95566的时候即可以匹配到2-9XXXXXXX方案又可以匹配到9XXXXX方案,那么拨号95566的时候是否将号码上报给软交换就取决于配置为最大匹配还是最小匹配方式 采用最大匹配的时候如果软交换下发的数图不精确,则肯能会需要等待一定时长后才能够接通电话 采用最小匹配的时候如果软交换不支持逐位收号,则可能拨号后听忙音 目前我司软交换大多采用最小匹配逐位收号的方式 中兴软交换大多采用最大匹配 + 精确数图的方式,Page 26,主叫号码显示问题(一),【原因分析】主叫号码显示的原理是:在被叫振铃的第一声和第二声之间,AG把主叫号码以FSK信号的方式下发给话机。 用户操作
14、是否有问题,如摘机太快 主叫号码格式配置是否正确 信令不正常 端口增益和电话机的配合问题。 MGCP协议正常来显消息解析: RQNT 801784165 aaln/0191.1.104.1 MGCP 1.0 X:16000408 R: S:L/rg,L/ci(05/24/09/29, 81320800,) H248协议正常来显消息解析: SGandisp/dwaddb=040F303830343137343736363633303030E9 ,Page 27,主叫号码显示问题(二),【处理方法】被叫用户接电话不能太快,要在第一声振铃后再等一段时间; 检查用户线是否超长。 话机要支持主叫显示的功
15、能,并且安装了电池(或外接电源); 通过信令跟踪, 如果SoftX3000下发的信令正确,显示不出来就是AG本身的问题; AG支持的主机号码显示有FSK单数据格式(SDMF),FSK复合数据格式(MDMF),DTMF的单数据格式(DTMF),其中MDMF相对SDMF支持了主叫姓名的显示,AG上的设置要与话机支持的制式一致。,Page 28,语音单通(一),【组网】 软交换IP网XPON 【原因分析】 1、网络质量原因 2、对端网关问题 3、媒体网关设备问题 4、NAT防火墙限制,软交换,IP 骨干网,语音流,用户线,TG,没声音啊,Page 29,语音单通(二),【处理方法】 1、先查看AG到
16、对端网关(AG/IAD/TG)网络是否正常。 2、信令跟踪,判断最后通话时媒体方向是否为sendrecv。如果不是,肯定单通,此问题需要软交换进行分析原因。 3、联网问题:软交换下发的流模式为SendReceive,但是由于使用一些特殊业务,进行了放音处理,导致在中间改变了联网模式。 4、媒体流跟踪:将媒体流还原为语音文件进行分析。,Page 30,案例分析:AG呼叫PSTN用户单通 (一),【现象描述】AG内部和AG间用户呼叫通话均正常,AG呼叫PSTN用户时单通。 【原因分析】1、外部有哪些原因?2、内部有哪些原因?,Page 31,案例分析:AG呼叫PSTN用户单通 (二),【处理过程】
17、1、抓包分析:对用户呼叫的信令流程抓包,查看通话时的媒体方向为sendrecv,排除软交换的问题;对RTP流分析为单向报文,分析网络不通。 2、考虑到AG呼叫PSTN用户时经过了TMG设备,检查发现AG和TMG之间的路由器开启了防火墙功能,关闭该防火墙后,单通现象消失。,Page 32,语音质量问题(断续、剪切),【原因分析】 承载网丢包 对端网关EC矫枉过正 AG的EC矫枉过正 【处理方法】 先排除承载网丢包 ,确认是否为承载网质量问题 :在AG或TMG上使用ping命令,可以得到初步的丢包率和网络时延 ;使用第三方工具Chariot(或安捷伦软件)进行端到端测试网络质量(该工具可以分析丢包
18、);对业务口进行抓包,并进行流分析。,Page 33,语音质量问题(断续、剪切)续,【处理方法】(续上) 如果承载网络没有问题,则在AG业务网口处进行抓RTP媒体包,然后使用媒体流转换工具将RTP流转换成语音来判断 如果对端网关发向AG的RTP流就存在语音断续和剪切,那么应该是对端网关的EC矫枉过正了,这时可以先检查一下AG的PCM-IP增益和对端网关的PCM-IP增益是否相差太大,可以尝试修改一下AG的PCM-IP增益,减小两者的差异。如果还没有改善,请联系对端网关处理。 如果AG发向对端网关的RTP流就存在语音断续和剪切,那么应该是AG的EC矫枉过正了,这时可以先检查一下AG的PCM-IP
19、增益和对端网关的PCM-IP增益是否相差太大,可以尝试修改一下AG的PCM-IP增益,减小两者的差异。如果还没有改善,请联系对端网关处理。,Page 34,语音质量问题(回声),【原因分析】 声学回声 EC没有打开 双方增益值配合不当 EC长度不当。【处理方法】 先排除声学回声回声有两种:1、电学回声 2、声学回声网关设备无法消除声学回声,声学回声只能由引起声学回声的终端设备消除。 排除方法如下,在出现回声的对端捂住话筒送声器,如果是声学回声,捂住之后回声现象应该消失。,Page 35,语音质量问题(回声)续,【处理方法】如果是AG下用户听到回声,应该是对端网关EC没能完全消除回声。 首先看出
20、现回声时对端网关是否打开了EC。先跟踪信令,看软交换是否给对端网关下发了打开EC的信令以及通话过程中EC是否因为误检测到传真信号而关闭了EC。 如果EC打开了,再看AG的PCM-IP增益和对端网关的PCM-IP增益是否不匹配,可以尝试修改AG的PCM-IP增益或者对端网关的PCM-IP增益,使两者的增益差异扩大,因为有些网关的EC设备要求回声同正常话音增益差别为6dB才认为是回声。 如果修改AG以及对端网关的增益不能消除回声,建议增加对端网关设备的EC长度。如果是对端网关用户听到回声,则是AG的EC没有能够完全消除回声 网络时延对回声也有影响,时延越大可能回声越明显。,Page 36,语音质量
21、问题(杂音),【原因分析】 话机本身质量问题 外线问题 AG自身问题 对端网关问题 承载网问题 【处理方法】 话机问题更换话机,如果现象消失,确认是话机问题用户听到 外线问题直接在机房配线架上接话机,如果现象消失则为外线问题,Page 37,语音质量问题(杂音)续,【处理方法】 对端网关问题在XPON侧抓包,利用语音还原工具将RTP包转化成语音文件,在PC上听一下,如果下行方向语音已经有杂音,那应该是对端网关引入的,如果下行方向没有杂音或者上行方向已经有杂音,则应该是XPON自身的问题 AG自身问题 通过环回操作缩小问题范围,如果是AG下用户听到杂音,可进行用户侧环回,若对端听到杂音,可进行网
22、络侧环回; 如果是用户板引入杂音,更换用户板 ;,Page 38,二次拨号(2833)问题(一),【原因分析】1、AG设置问题2、对端网关兼容性问题 【定位方法】 1、检查AG数据配置,查看系统参数设置2833载荷类型是否与对端一致。 2、镜像AG业务网口抓包,看看2833报文是否正常。按照RFC2833协议,2833报文主要有以下几个关键点: 1)、所有事件的第一个2833包里将RTP包中maker标志置为true,后面置为false。图1是AG发送的2833报文。,Page 39,二次拨号(2833)问题(二),【定位方法】 图1,Page 40,分享,你在工作中处理了哪些VOIP语音类故
23、障?如单通问题、摘机无拨号音、拨号后打不通电话问题、反极性计费问题等等分享一下你的经验给大家吧!,Page 41,第1章 XPON故障处理概述 第2章 XPON VOIP业务故障处理 第3章 传真和MODEM故障处理,内容介绍,Page 42,传真流程回顾,一.按照编解码方式T.38透传VBD(G711) 二.按照协商模式自切换协商,Page 43,传真流程回顾,【协商流程】,传真信号,软交换下发信令切换到传真模式(T38或者透传),Page 44,传真流程回顾,【自切换流程】,网管检测到传真开始,语音模式,语音模式,dtt,=,V,21,flag,MG,1,MG,2,MGC,网管检测到传真开
24、始,传真模式,传真模式,根据配置切换到VBD或者T38,根据配置切换到VBD或者T38,Page 45,影响传真的因素,影响传真的因素是多方面的,主要因素有: 网络质量:时延、抖动、丢包; 传真方式:低速传真(T.38,透传),高速传真; 设备因素:输出舒适噪音,jitter buffer,RTP发送间隔时间,PCM编码方式,DSP芯片输入增益,DSP输出增益,CPU占用率,EC和EC时长,VAD,CODEC和打包时长; 传真终端:各类传真终端型号, ECM(纠错模式)要求不同。高速传真必须使用ECM模式,低速可以选择使用。,Page 46,传真问题-传真质量差、图像文字不清晰,【处理方法】确
25、认传真机是否正常工作 重点检查数据承载网络质量,确认是否有丢包或者延时现象存在。 跟踪信令,看信令协议是否有异常,Page 47,案例分析:上海MXU传真不成功,【问题现象】上海与贝尔软交换对接采用MA561X开局发现传真有时候不成功组网:XPON-软交换(贝尔)版本:基线版本。【原因分析】一款传真机有问题还是多款传真机有问题?MXU的传真配置是否符合局方要求?网络状态是否良好?丢包,抖动,时延?抓取H248信令查看是否有错误?用Ethereal工具抓取媒体报文交给研发分析?通过上海办事处张亮检查发现MXU配置不正确,局方全网应用为自切换方式,而设备配置为协商方式,Page 48,案例分析2:
26、T38传真不成功,【现象描述】组网:XPON-软交换(Z公司)。版本:基线版本。故障现象:新开局业务,电话能正常呼入呼出,但是传真业务不正常,传真类型为V3T38。 【原因分析】1、传真参数设置错误导致。2、信令协议不规范导致接入网无法识别。,Page 49,案例分析2:T38传真不成功,【处理过程】 1、核实接入网侧已经配置好FAX/MODEM参数,并且参数正确无误。 2、通过在XPON侧抓报文分析,信令中语音业务正常,且软交换已经修改关联,检测T38传真事件,但是ag回错误信息:,Page 50,案例分析2:T38传真不成功,【处理过程】 3、从信令文件看出,软交换下发信令中,包文件并无误,但出现以下下格式不正确:v=0 c=IN IP4 $ m=image $ udptl t38 a=ptime:20 a=T38FaxRateManagement这几个参数之间存在空格不符合国标要求,导致UA5000无法解释成功。 4、根据分析情况,软交换修改相关下发的协议之后,再测试传真业务正常,问题解决。,Page 51,讨论,你在工作中处理了哪些传真类故障? 分享一下你的经验给大家吧!,Page 52,通过本课程,希望对大家今后定位语音、传真等故障时,能够有所帮助。,小结,