ImageVerifierCode 换一换
格式:PPT , 页数:56 ,大小:624.50KB ,
资源ID:300262      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-300262.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(6-故障处理.ppt)为本站会员(无敌)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

6-故障处理.ppt

1、STUB _052ZXSM-150/600/2500维护专题故障专题 V0409,课程内容:故障处理思路和方法故障分类故障实例,故障处理的思路和方法,故障处理流程,机房维护人员维护工作中,不免会遇见设备出现故障,在处理故障时,应该遵循:一、“查看”二、“询问”三、“思考”四、“动手”的基本原则,排除故障的一般思路,故障原因,工程问题 外部原因 操作不当 设备对接问题 设备原因,排除传输设备外部故障 故障定位到单站 故障定位到单板并最终排除,故障排除的基本步骤,故障定位的常见方法,1. 观察分析法 当系统发生故障时,在设备和网管上将出现相应的告警信息。通过观察设备上的告警灯运行情况,可以及时发现

2、故障;故障发生时,网管上会记录非常丰富的告警事件和性能数据信息,通过分析这些信息,并结合SDH帧结构中的开销字节和SDH告警原理机制,可以初步判断故障类型和故障点的位置。,2. 测试法 (以环回操作为例)进行环回操作时,先将故障业务通道的业务流程进行分解,画出业务路由图,将业务的源和宿,经过的网元,所占用的通道和时隙号罗列出来。然后逐段环回,定位故障网元。故障定位到网元后通过线路侧和支路侧环回基本定位出可能存在故障的单板。最后结合其他处理办法,确认故障单板予以更换排除故障。,3. 拔插法对最初发现某种电路板故障时,可以通过插拔一下电路板和外部接口插头的方法,排除因接触不良或处理机异常的故障。在

3、插拔过程中,应严格遵循单板插拔的操作规范。插拔单板时,若不按规范执行,还可能导致板件损坏等其它问题的发生。,4.替换法当用拔插法不能解决故障时,可以考虑替换法。替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一块单板或一个设备。,4.配置数据分析法 在某些特殊情况下,如外界环境的突然改变,或由于误操作,可能会导致设备的配置数据遭到破坏或改变,导致业务中断等故障的发生。此时,故障定位到网元单站后,可通过查询、分析设备当前的配置数据;对于网管误操作,还可以通过查看网管的用户操作日志来进行确认。,5.更改配置法 更改配置

4、法更改的配置内容可以包括时隙配置、板位配置、单板参数配置等。因此更改配置法适用于故障定位到单个站点后,排除由于配置错误导致的故障。更改配置法最典型的应用是排除指针问题。,6. 仪表测试法 仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接问题。 通过仪表测试法分析定位故障,比较准确。缺点是对仪表有需求。,7.经验处理法 业务中断、ECC通信中断等,可能伴随相应的告警,也可能没有任何告警,检查各单板的配置数据可能也是完全正常的。经验证明,在这种情况下,通过复位单板,网元掉电重启。重新下发配置或将业务倒换到备用通道等手段,可有效地及时排除故障、恢复业务。建议尽量少使用该方法来处理,因为该方

5、法不利于故降原因的彻底查清。,故障分类,1. 故障原因传输设备侧或交换机侧的故障导致通信业务的中断或者大量误码产生。,通信故障,2. 处理流程通信故障在定位故障点时必须将连接界面打断,分清是交换还是传输的问题(如果经过多级维护单位的传输还必须和其他维护单位协调配合逐级定位故障点)、DDF架的问题还是连接线等硬件问题。如果故障定界到传输侧,需要继续定位传输故障;如果故障定界到交换侧,则协调交换班组处理。,发生故障后,启动备用通道保证现有通信业务的正常进行。 在交换设备和传输设备连接的DDF架上通过硬件环回的方式准确定界和定性故障:确定究竟是传输侧故障还是交换侧故障。 如果定位在传输侧,则按照流程

6、图进行传输故障的分类。,判断种类后,按照相应的故障处理流程排除故障。,1.故障原因外部原因:供电电源故障;光纤、电缆故障。操作不当:由于误操作,设置了光路或支路通道的环回;由于误操作,更改、删除了配置数据。设备原因:单板失效或性能劣化。,业务中断故障,2.处理流程采用观察分析法、测试法、拔插法和替换法。通过测试法,逐级挂表环回来定位故障网元。逐级环回如果是高阶通道以上的故障:依次从本端网元的故障光方向做故障AU的终端侧环回、临近网元的近端光路故障AU的线路侧环回、 如果是低阶通道的故障:依次将本端该支路时隙在临近网元、次临近网元、,通过测试法定位出故障网元后,可通过观察设备指示灯的运行情况,分

7、析设备故障,如某块单板红、绿指示灯均熄灭,而其它板正常,则可能该单板电源模块有故障,请立即更换单板;同时分析网管的告警和性能,根据故障反映出来得到告警和性能定位故障单板并加以更换。这一过程可结合使用拔插法和和替换法。,误码类故障,1. 故障原因外部原因:光纤接头不清洁或连接不正确;光纤性能劣化、损耗过高;设备接地不好;设备附近有强烈干扰源;设备散热不好,工作温度过高。设备原因:交叉板与线路板、支路板配合不好;时钟同步性能不好;单板失效或性能不好等。,2.定位故障点误码字节包括B1,B2,B3和V5字节,其性能级别B1B2B3V5,对于网管上报的性能应首先处理高级别性能,如果高级别性能处理后还有

8、低级别性能上报,再处理低级别的性能。正常情况下,必须保证业务运行的任意时刻网管采集任意单板的性能值为零性能值。查询故障网元的性能,如果网管上有B1/B2的性能,说明光路不好,,3.检查故障网元的性能如果网管上没有B1/B2,只有B3的性能,说明高阶通道不好,问题可能在交叉板或支路板上,可以通过网管的交叉板控制操作来倒换交叉板定位故障单板。,处理流程采用测试法,环回挂表按照上述原则对误码的发源地进行定位。如果是线路板误码,分析线路板误码性能事件,排除线路误码。 如果是支路板误码,分析支路板误码性能事件,排除支路误码。若只有支路误码,则可能是支路板或交叉板的问题,应更换支路板或交叉板。,时钟同步类

9、故障,故障原因外部原因:光纤接反;外时钟质量问题。操作不当:时钟源配置错误,出现同一组网中两个时钟源的情况;时钟源级别设置错误;时钟对抽。设备问题:线路板故障,提供时钟质量不好;时钟板故障,提供的时钟源质量不好;交叉板故障,给各单板分配的工作时钟质量不好。,处理流程采用观察分析法、替换法、配置数据分析法、更改配置法,具体操作如下:检查网管的时钟配置,避免时钟对抽的人为故障现象,并将正确的时钟配置下发至NCP板,保持网管数据与NCP数据的一致。通过网管检查光路和支路是否有AU PJE/TU PJE的性能值。如果只有TU PJE,说明该支路板故障,更换即可。如果AU PJE/TU PJE同时存在,

10、先处理AU PJE,处理后如果还有TU PJE,继续处理TU PJE。,网管连接故障,故障原因外部原因:供电电源故障,如设备掉电、供电电压过低等;光纤故障,如光纤性能劣化、损耗过高等。操作不当:配置有误。设备故障:网卡故障、光板故障、时钟板故障、网元有大量的性能数据上报到网管,造成ECC通道阻塞。,处理流程采用观察分析法、测试法、替换法、配置数据分析法等,具体操作如下: 排除外部原因,如掉电、光纤性能劣化等。检查网管配置是否有误。采用测试法,逐段自环定位故障网元。采用告警分析法对光板、时钟板进行检查。,公务故障,故障原因外部原因:掉电、光纤折断等。操作不当:开销处理板(OW)配置数据错误。设备

11、原因:光板、OW板故障。,处理流程采用观察分析法、拔插法、替换法、配置数据分析法和经验处理法,具体操作如下检查光路是否有告警。因为光路不通,公务也不能通。检查公务电话是否出现故障,可更换电话测试。检查OW板,观察指示灯及网管告警,可采用拔插法、替换法确定开销板是否产生故障。检查OW板的配置。,故障原因外部原因:风扇电缆故障、风扇插箱与背板接触不良。操作不当:电源开关、拨码开关位置错误。设备原因:NCP板、风扇控制板(FAN)故障。,风扇故障,处理流程采用观察分析法、拔插法、替换法和经验处理法,具体操作如下:观察设备风扇运转是否正常,检查电缆和接口的连接,或通过网管的“风扇配置”命令查询风扇运转

12、情况。排除外部原因或操作不当导致的风扇故障。检查FAN板,观察网管告警,可采用拔插法、替换法确定FAN板或NCP板是否产生故障。,设备对接故障,故障原因光纤或电缆接错位置。与其他厂商提供的设备对接时,一方设备接地有问题,或双方设备不共地。传输、交换各自的网络内部时钟同步,但两个网络之间不同步。各厂家SDH帧结构中开销字节的定义不同。,处理流程采用观察分析法、测试法、拔插法、替换法、更改配置法、仪表测试法等,具体操作如下:检查设备间物理连接的正确性,防止电缆的漏焊、虚焊、接触不良。检查对接设备两侧的告警和性能,以帮助定位故障。检查双方设备的接地和共地情况。 检查全网的时钟同步。 检查对接设备的S

13、DH帧结构中开销字节的定义是否不同。,故障实例,故障描述:某本地传输网采用ZXSM-10G系统组网,整个网络为一个二纤双向复用段共享保护环。升级前运行正常,但全网升级(包括网管、网元、单板的逐一升级)后,复用段倒换不正常,网管上查询APS标识已启动,保护关系配置正确。,复用段故障,故障分析:复用段无法正常倒换产生的原因可能包括光纤错连、APS标识错误、APS暂停或复用段保护关系配置错误等。由于本组网在升级前工作正常,因此排除光纤错连和APS标识错误两个故障原因,定位故障的发生可能是由升级后网管复用段倒换数据失效导致。,故障定位和排除步骤:首先通过网管对该复用段保护环上的每个网元重新启动APS标

14、识,下发命令后再次进行复用段保护倒换测试,倒换仍然不正常。通过网管清空原复用段保护关系的配置信息,下发清除命令,并按照原保护关系重新进行配置,命令下发后,倒换恢复。,系统概述各站点都在A点上下业务。有一次环上H、G两站点间光缆断,系统倒换时G、F、E点出现断业务的情况,在不影响业务的情况下处理好故障。,A,B,C,D,E,F,G,H,I,J,故障分析因为不能影响正常业务,所以无法断光缆来模拟当时倒换状态。但从故障现象分析可知,很有可能问题出在E点。,故障处理从G点单独配一个2M到F点下,插入告警,正常。再把上面那个2M配到E点下,正常。继续配到D点,不正常。从A点配一个2M也是到D点正常,到E

15、点就不正常继续对新配的2M做环回检查,发现故障很可能在E点。但查看各单板性能告警却没有异常,因为以前业务在E点是走3#AU,G点到D的业务改走5#AU就正常了,再改走其它也正常。,窍门当时隙配置没错,但业务不通时,可以通过逐个站点检查的方法来定位故障。,光缆线路中断导致业务全阻,故障描述某局本地传输网采用ZXSM-10G设备组网,整个网络由5端ZXSM-10G网元组成,构成一个通道保护环带链的结构,环一上的传输速率是10Gbit/s,F到C的链上的传输速率是2.5Gbit/s,B和D的链上的传输速率是622Mbit/s。网络结构如图5.1-1所示。中心局设在E网元,网管终端放在中心局。,所有其

16、他网元均只和E网元有业务配置,A到E的业务使用链上的1#AU,B到E的业务使用链上的2#AU,C到E的业务使用链上的3#AU,D到E的业务使用链上的4#AU。网元A设置为内时钟,其余网元通过S1字节使用双向提取线路时钟。,A,B,C,D到E的业务全部中断,通过网管采集告警发现,F网元的2#OL16上有“2.5G接收信号丢失”,A网元的7#OL16上有“2.5G接收信号丢失”,7#和2#OL16上有14#AU的“AU通道告警指示信号”、“不可用时间开始”等告警。B,C,D网元的光板上有相关AU的“AU通道告警指示信号”、“不可用时间开始”等告警。A网元和F网元间有B1/B2/B3 UAS性能指示

17、。,故障分析由于有再生段和复用段等高级别的告警和B1/B2性能,首先必须排除光路上的故障和外部光缆线路的因素。通过上面的告警指示可以知道,A和F都没有收到光信号。故障在A和F之间,由于A和F光板同时产生故障的可能性比较小,因此外部光缆线路等因素导致上述故障的可能性比较大。,故障定位和排除步骤 1. 用光功率计逐级测量F点收光功率,光功率计上均为收无光功率指示。测试发送口光功率,测试值在发送指标范围内。2.进一步的工作:必须确认A网元7#OL16和F网元的2#OL16收口良好。采用尾纤自环的办法将光板的收口和发口自环,但必须保证光板收口接收从尾纤过来的光功率在指标范围内。此时如果该网元“2.5G

18、接收信号丢失”告警消失,证明该光板收口良好。,通过用户检查确认光缆线路由于工程施工被挖断,熔接处理后光缆恢复正常。在网元A和F测试收口光功率正常后,将光板上的尾纤接回,光路正常,告警消失。,设备温度过高导致B2误码 系统概述某局本地传输网采用ZXSM-10G系统组网,整个网络由2端ZXSM-10G网元组成,传输速率是10Gbit/s。采用点对点无保护链形组网,网络结构如图5.2-1所示。中心局设在B网元,网管终端放在中心局。,A网元和B网元的业务配置使用20个AU资源。网元B设置为外时钟,网元A提取线路时钟。,故障现象描述用户反映交换业务层有误码,怀疑是传输有故障。检查网管发现:网元A的3#O

19、L64板上有大量的“B2,B3 BBE/ES/SES性能值”上报,同时有“复用段信号劣化”和“B2,B3 BBE/ES/SES性能超值”告警。网元B的3#OL64板上有大量的“B2,B3 FEBBE/FEES/FESES性能值”,同时有“复用段远端缺陷指示”和“B2,B3 FEBBE/FEES/FESES性能超值”告警。,故障分析由于有B2/B3和复用段告警,是复用段上的故障。首先检查机房环境和设备状况,然后再使用高阶故障定位处理的一般方法处理故障。故障定位和排除步骤检查设备发现设备的风扇被用户的维护人员关掉,单板温度非常高,怀疑故障由此引起。将风扇打开10分钟后,观察网管性能和告警指示,故障消除。故障原因:由于单板温度过高,芯片不能正常工作而产生误码。,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报