1、NGN IP 网络设备日常维护指导手册 UTS.610G13.A0 作者 杭建峰 沈柳芃 审稿 薛京 黄江涛 日期 2004 年 6 月 UT 斯达康通讯有限公司 项目与技术支持部 UT 斯达康公司以 “客户成功, 我们成功“的价值观衡量,规范员工的行为,致力于服务创新和服务承诺的兑现,力求为用户提供超越客户期望的服务. UT 斯达康公司拥有完善的服务体系,技术服务中心拥有一批优秀的专业技术人员, 并在全国设有服务分支机构, 提供 24 小时技术服务.本着用户至上,信守承诺的原则,UT 斯达康公司承诺 :在 24 小时之内对用户的问题给予答复.为客户提供优质,高效 ,专业的服务是 UT 斯达康
2、的追求. UT 斯达康通讯有限公司项目与技术支持部 联系地址:浙江省杭州市教工路 1 号 12 号楼 邮政编码:310012 电话号码:(0571)88916789 传 真:(0571)88916789 800 免费电话:8008571466 邮件地址: 客户支持网站:http:/ 版权声明 本文档属 UT 斯达康通讯有限公司版权所有,侵权必究. 本文档专供用户,本公司职员以及经本公司许可的人员使用.未经公司书面同意,任何单位或个人不得以任何方式复制, 翻印,改编,摘编, 转载,翻译,注释, 整理 ,出版或传播手册的全部或部分内容. UTStarcom,PAS,WACOS, iAN, AIRS
3、TAR, WLL, ISP, WICOPS, NGDLC, Intranode, Internode, Xtr-m-IP, UNITECH,iPATH, !-Volution, mSwitch, 小灵通, 为 UT 斯达康公司或其子公司,关联公司的注册商标,受商标法保护,任何个人或团体非法使用以上商标,UT 斯达康公司有权追究其法律责任 . NGN IP 网络设备日常维护指导手册 出版说明 内容简介 UT 斯达康 NGN 系统维护指导对网络维护人员的分工和职责,以及相应的网络维护流程提出了科学而合理的建议;对网络的日常维护项目和周期进行了详细的阐述;对于维护人员如何进行网络的巡检,巡检的项目和
4、周期作了详尽的描述;维护指导中还汇集了丰富的故障解决案例.为了读者阅读,更好的服务于客户, 维护指导共有以下几部分组成: NGN 核心网维护指导: NGN 核心网维护建议和日常维护指导 NGN 核心网巡检指导 NGN 核心网故障分析和解决指导 NGN 接入设备日常维护指导手册 NGN IP 网络设备日常维护指导手册 NGN 服务器设备日常维护指导手册 NGN ORACLE 数据库日常维护指导手册 本文档为其中的NGN IP 网络设备日常维护指导手册 本文将根据现场情况不断更新,更新后的文档将及时发布于客户支持网站 (http:/ ),如果你有更新硬拷贝的需求,请通过当地的客户经理向我们申请.
5、本文档的读者范围 UT 斯达康 NGN 系统的维护工程师及其相关人员, 读者要求具备 IP 网络的相关知识和丰富的系统维护经验. 维护过程中如遇到困难或有什么建议,非常欢迎你拨打我们的客户服务中心电话寻求技术支持.我们公司随机发给客户的各种手册资料上也对所有操作维护和技术问题有详细的说明请参考使用. 客户成功,我们成功 NGN IP 网络设备日常维护指导手册 写作目的: 本手册描述了例行维护的内容以及正确的操作步骤,为用户确定本局维护方案提供了 IP 网络例行维护的基本方法和参考依据. 使用方法说明: IP 网络日常维护指导书的主要作用在于向机房维护人员说明日常维护需要作什么工作,如何做,结果
6、应该怎样 .在维护过程中机房维护人员需要将维护的结果记录下来,以作为以后检查设备运行情况调查故障原因的依据,以保证设备的正常运行做到防患未然. 客户成功,我们成功 NGN IP 网络设备日常维护指导手册 目 录 第一章 网络维护建议.1 1.1 维护人员分工与职责.1 1.2 故障处理流程1 1.3 日常维护参考资料.1 1.4 维护求助途径1 第二章 维护内容.2 2.1 日常维护指导2 2.1.1 值班日志表2 2.2 月度维护.4 2.3 突发维护.6 2.3.1 一级故障6 2.3.2 二级故障7 2.3.3 突发故障处理记录8 第三章 网络巡检.9 3.1 网络巡检的重要性和目的9
7、3.2 设备运行情况分析.9 3.3 节点连通及网络冗余性分析.12 3.4 网络性能分析12 3.4.1 直接测试12 3.4.2 使用工具进行监测13 3.5 IP 网络总体运行状况分析及报告21 3.5.1 设备运行情况分析21 3.5.2 节点连通及网络冗余性分析.21 3.5.3 网络性能分析.21 第四章 常见网络故障及解决方法,工具使用.22 4.1 接口故障.22 4.1.1 以太接口故障排除22 4.1.2 路由器广域口故障排除22 客户成功,我们成功 I NGN IP 网络设备日常维护指导手册 4.2 二层故障.24 4.3 三层路由问题24 4.4 检测工具使用及 cis
8、co 网络日志分析 .24 4.4.1 Ping 命令24 4.4.2 trace 命令.26 4.4.3 理解 Cisco 错误消息28 4.4.4 Ethereal 使用.28 4.5 SBC 常见问题解决.29 4.5.1 Voip 穿越 SBC 通话一段时间后中断 29 4.5.2 MGCP IAD 无法通过 SBC 注册的问题29 4.5.3 SIP 话吧通过 Cisco2611 无法注册的问题30 4.5.4 sip 终端释放以后短时间内不能注册的问题.30 4.5.5 UTSMART 电话无法拨打外部电话的问题31 客户成功,我们成功 II NGN IP 网络设备日常维护指导手册
9、 第一章 网络维护建议 1.1 维护人员分工与职责 维护人员要求具有一定的 IP 网络基础,熟悉掌握相关 IP 网络技术理论;清楚网络的结构设计,包括网络拓朴,设备连接, 系统参数设置及软件使用 ;了解网络正常运行状况, 注意收集网络正常运行时的各种状态和报告输出参数;熟悉常用的诊断工具,准确的描述故障现象.做好日常维护工作,并及时填写相应记录.一旦有异常情况发生, 在第一时间按照流程通知 Call_log 及当地工程师.同时,作为维护人员, 定期观测网络运行状态,在故障发生时, 能同我们工程师共同确定网络故障点,恢复网络的正常运行. 1.2 故障处理流程 IP 网络设备处理流程同 Call_
10、log 处理流程类似,维护人员在第一时间内将相关信息反馈给Call_log. 具体信息包括:设备机箱序列号,各模块信息, 软件版本信息, 问题描述,相关检测命令等运行结果. 1.3 日常维护参考资料 各设备的特性,命令:http:/ 1.4 维护求助途径 UT 斯达康技术支持热线 :0571-88916789 客户成功,我们成功 1 NGN IP 网络设备日常维护指导手册 第二章 维护内容 IP 网络建设完成后,搞好网络的运行管理是避免网络故障的关键.以下描述相关内容希望能作为日常的维护工作的参考,及时掌握当前网络运行状况及隐患,保障系统的安全稳定运行. 2.1 日常维护指导 2.1.1 值班
11、日志表 交换局名 日期: 年 月 日 值班时间 时 至 时 值班人 接班人 维护类别 维护项目及指导 检查结果 备注 操作人 系统运行状态灯 系统各模块状况 sh module 系统运行温度 sh env temp 硬件情况及外部环境检查 系统外部电源情况 sh env power 设备各部分运行温度应该在 45 度以下,系统状态灯为红,不正常 基本状况检查: CPU 利用率 内存利用率 #show processes cpu #show processes memory #show buffer #show process 显示正常的 CPU 使用率 Averange: 2M 客户成功,我们
12、成功 2 NGN IP 网络设备日常维护指导手册 系统日志检查 检查 log server 上系统的日志 无四级及以下告警(0 到 4级)为正常 系统运行状态灯 液晶面板显示 网络连接检查#Show arp 路由检查#show routes SBC 相关状态检查 HA 检查#show health SBC 可以通过 telnet 其物理端口 IP 地址登陆,进行相关操作(结束需用exit 正常退出 ,否则会造成下次登陆无法配置). 端口直连链路中断时,液晶屏上会有闪烁的英文提示.液晶屏左边下面的灯应常绿,上面的灯为常灭,或者常红(做 HA 时 ),黄色表示网络正在切换. Health 值应为
13、100 , 当前工作 SBC 为 active,另一台为 Standby. 各关键节点连通性 利用我们提供的 trayping软件, 对各关键节点进行ping 所有节点的时延平均值小于 20ms;时延最大值小于 100ms;丢包率在1/10000 以内 故障情 况及其 处理 遗留 问题 班长核查 表 1 值班日志表 客户成功,我们成功 3 NGN IP 网络设备日常维护指导手册 2.2 月度维护 交换局名 维护周期 年 月 日 至 年 月 日 维护时间 检查人 维护类别 维护项目及指导 检查结果 备注 操作人 IOS,配置文件备份检查 在特定的备份服务器上,检查配置文件及软件版本备份是否与运行
14、设备一致, 如不一致,利用 tftp软件, 下载运行设备的 config 及到 cisco网站下载相应的软件 路由状况检查: 单播路由 组播路由 #show ip route summary #show ip route #show ip mroute #show ip mroute act #show ip mroute summary #show ip mroute count 有到各节点路由 有正确组播路由 HSRP 状态检查 : #show standby brief #show standby 主备设备的状态应相符 VLAN 状态检查: #show vlan #show vlan s
15、um Vlan 名称 ,标示正常 Trunk 和 Channel #show trunk #show ethernetchannel port n(n 与 portchannel号对应) Trunk 工作正常,多条 trunk 存在时,对应 vlan 通过范围应无重叠. OSPF 状态检查: #show ip ospf OSPF 状态应正常,包括正常的 ospf 路由客户成功,我们成功 4 NGN IP 网络设备日常维护指导手册 #show ip route ospf #show ip ospf database #show ip ospf neighbor #show ip ospf int
16、erface 括正常的 ospf 路由信息,neighbor 信息 PIM 状态检查: #show ip pim #show ip pim summary stp 检查 #show spantree 应与设计情况相同 NTP 同步状态检查: #show clock #show ntp status 检查端口状态 检查正在使用的主要端口的状态 为保证数据有效性,建议提前 20 小时将各端口计数器清零: #clear counter 其后执行如下命令: #show controller #sh ip int brief #show interface #show int port-channel
17、n 显示工作的端口为UP 状态; Interface(除 GW-MPU 接口)冲突,错误等非信息小于1/10000. 端口名称正确; GW 联接的 Ethernet端口在 half duplex/100M 状态 防火墙检查 #show failover #show xlate #show conn #Show sipd SBC 检查 #Show algd #show memory #show buffer 查看 SIP 以及 MGCP 的相关统计信息;参看系统内存使用情况. 客户成功,我们成功 5 NGN IP 网络设备日常维护指导手册 CDP 检查 #show cdp nei 无多余的设备连
18、接 其它 #Sh tech 故障情 况及其 处理 遗留 问题 班长核查 表 2 月度维护表 2.3 突发维护 2.3.1 一级故障 一级故障是指现有的网络停机或对最终用户的业务运作有严重影响. 由于目前我们的系统已经做到所有网络设备冗余备份,在单个网络设备(比如某台核心交换机)完全停机的情况下,系统能自行恢复正常,但存在某些特殊情况对最终用户的业务运作有严重影响 ,原因及解决办法有以下几方面: 1.对于互相备份的两台交互机,信令的 EtherChannel 一旦不通将致使整个系统中主备设备无法通讯,造成业务异常.目前在现有的系统中, 大部分系统信令的 Etherchannel 只有一对光纤连接
19、,光纤损坏 ,GBIC 口损坏,网络拓朴结构改变 STP 设置不正确情况下, 就导致信令Etherchannel 不通 ,具体表现在网关等设备主备切换. 紧急处理方法: 1)在网络拓朴结构没有改变的情况下, 交换机上 channel 端口的指示灯变为黄色,在尝试重启端口等操作无效的情况下, 立即重新选择另外的端口,配置Etherchannel. 2)如果由于新的二层设备的接入,STP 设置的原因造成 Etherchannel 不通,可以先断开新接入的二层设备,升高接入设备的 Bridge ID,使其大于核心交换设备的 Bridge ID,重新连接. 客户成功,我们成功 6 NGN IP 网络设
20、备日常维护指导手册 2. 网络环路的影响.在目前的系统中,某些错误的操作引起网络环路的产生 ,致使系统形成广播风暴,整个系统中服务器和终端通讯不正常, 从而发生通话中断.具体表现在交换机上端口指示灯快速闪动,交换设备 cpu 利用率短时间迅速提高 . 紧急处理方法: (1) 检查 log,一般环路形成时在网络设备的 log 中可以看到某一 MAC 地址在两端口之间 flapping,断开其中一个端口的连接 ,检查本交换设备这两个端口的 STP 的设置,如果为 off,将其打开.如果 portfast 已经打开,将其关闭.然后再重新连接.同样的方法检查其余网络设备. 3.服务器不能与远端服务器通
21、讯,具体表现在涉及到此类服务器的业务发生异常 . 紧急处理方法: (1) 本地服务器是否可以 ping 通本地网关,如果不行,检查所连接的交换机端口状态是 否正常. (2) 如果可以 ping 通本地网关,检查是否已经设置缺省网关. (3) 检查是否可以 ping 通远端路由网关,如果不行,检查设备间的联通性.具体方法是检查本地路由表中是否有远端网段路由. (4) 如果可以 ping 通远端路由网关,检查远端服务器是否设置了缺省网关. 2.3.2 二级故障 二级故障是指现有网络的操作性能严重下降,或由于网络性能明显下降,使最终用户的业务运作重要影响. 主要表现在某节点或某些节点大量丢包. 如果
22、是某节点丢包,检查此节点的网络连接, 物理连线是否有损,所连接的端口状态统计情况.紧急处理方法: 对于双网卡冗余的服务器,可以切换网卡,对于其他单网卡设备, 可以更换上联端口或物理连线. 如果是某模块上的节点都大量丢包,如果是模块有损引起,可以使整个模快 down 掉. 客户成功,我们成功 7 NGN IP 网络设备日常维护指导手册 2.3.3 突发故障处理记录 发生时间: 解决时间: 值班人: 处理人 : 故障类别: 故障来源: 故障描述: 处理方法及结果: 客户成功,我们成功 8 NGN IP 网络设备日常维护指导手册 第三章 网络巡检 3.1 网络巡检的重要性和目的 力求覆盖当前网络设备
23、的运行状态, 发现网络规划和配置中欠佳之处,改善和优化网络的性能;观察网络的运行状况,及时预测网络通信质量. 3.2 设备运行情况分析 针对*市的*设备,确认系统设备的运行状况(由于各版本的 IOS 命令差异,文中提到的命令只做参考). 网络设备运行状态 序号 内容 参考命令 期待结果 1 检查版本 IOS/COS Image 及配置文件 #show version #show running-config #show conf 显示版本和配置同设计相符. 包括端口的速率,全半双工,portfast 等方面 2 基本状况检查: CPU 利用率 内存利用率 #show processes cpu
24、 #show processes memory #show memory #show buffer #show process 显示正常的 CPU 使用率(20 万用户时). Averange: 2M 客户成功,我们成功 9 NGN IP 网络设备日常维护指导手册 3 路由状况检查: 单播路由 组播路由 #show ip route summary #show ip route #show ip mroute #show ip mroute act #show ip mroute summary #show ip mroute count 有到各节点路由 有正确组播路由包括: *.source
25、address Group-address.Source-address 和对应转发端口 如: 224.0.1.1 239.255.0.1 4 HSRP 状态检查: #show standby brief #show standby 主备设备的状态应相符,priority 分别为 110 和105,正常情况下主备状态在单一设备上应尽为一种. 5 VLAN 状态检查 : #show vlan #show vlan sum Vlan 名称 ,标示符合设计要求,主备交换机 vlan 设置一致. 6 Trunk 和 Channel #show trunk #show ethernetchannel #
26、show ethernetchannel port #show ethernetchannel port-chann Trunk 工作正常,多条trunk 存在时,对应 vlan 通过范围应无重叠. 7 OSPF 状态检查: #show ip ospf #show ip route ospf #show ip ospf database #show ip ospf neighbor #show ip ospf interface Ospf 协议运行正常 客户成功,我们成功 10 NGN IP 网络设备日常维护指导手册 8 PIM 状态检查: #show ip pim #show ip pim
27、summary 组播协议运行正常 9 Spanning Tree 状态: #show spanning-tree brief #show spanning-tree #show spanning-tree postfast 根节点指向应唯一,且符合设计要求. 端口 forwarding 和 blocking状态符合设计. 10 NTP 同步状态检查: #show clock #show ntp status 时间应统一准确; ntp 同步正常 11 检查端口状态 检查正在使用的主要端口的状态 为保证数据有效性,建议提前 20小时将各端口计数器清零: #clear counter 其后执行如下命
28、令: #show controller #show ip interface brief #show interface #show port-channel 显示工作的端口为 UP 状态; Interface(除 GW-MPU 接口)冲突, 错误等非信息小于 1/10000. 端口名称正确; GW 联接的 Ethernet 端口工作在 half duplex/100M 状态 12 系统日志检查: #show logging #show logging buffer 1024 无 4 级以上告警. Logging buffer size 512000 13 其它检查 #show tech 14
29、 SBC 检查 #show memory #show buffer #show sipd #show algd 检查系统运行情况,查看sip 以及 mgcp 的当前信息以及相关历史信息. 客户成功,我们成功 11 NGN IP 网络设备日常维护指导手册 3.3 节点连通及网络冗余性分析 检查从各节点到核心系统服务器,各网络设备间的连通性和路由的冗余性,保证指定路由畅通和冗余 测试分项目:各节点间连通性及网络冗余 序号 测试步骤 命令 期待结果 1 用 PING 命令检查与各设备的连通性 #ping *.*.*.* 显示“!“,所发包全部成功 2 用 traceroute 命令观察所经路由 tr
30、aceroute ip_address 所显示的路由正确,为设计所定的优先路由 3 用 PING 命令检查到各组播组所在网段组播路由正常. #ping 224.0.1.1 #ping 239.255.0.1 有多个应答,且应答方地址应包括各组播组所在网段设备地址. 4. 用 traceroute 命令观察所经路由 traceroute ip_address 所显示的路由表中冗余路由与设计情况相符 3.4 网络性能分析 网络越复杂对网络性能的要求也越高,特别是语音, 图像等的传播,对带宽和时延都有比较苛刻的要求,因此, 我们有必要对网络性能进行分析 .其主要包括网络时延,丢包率和IP 网络系统带
31、宽两部分. 3.4.1 直接测试 测试分项目:网络时延与丢包率及带宽检测 序号 测试步骤 命令 期待结果 客户成功,我们成功 12 NGN IP 网络设备日常维护指导手册 1 用 PING 扩展命令检查与各远端交换机路由器的端口的连通性, 测试包数量不小于100000 #ping Protocol ip: Target IP address: 210.52.128.11 Repeat count 5: 10000 Datagram size 100: Timeout in seconds 2: Extended commands n: Sweep range of sizes n: 显示“!“
32、,丢包率小于 1/10000; 时延平均值小于 20ms; 时延最大值小于 100ms 2. 本地接入带宽测试: 在 FTP Client 上从本地 FTP Server下载* ftp ip_address username: * password:* ftpget * 应大于数据流所经链路(E1/10M/100M)最小带宽标称值的 70%. 3 远程 (跨E1/10M/100M/1000M)接入带宽测试: 在 FTP Client 上从远端 FTP Server 下载* ftp ip_address username: * password:* ftpget * 应大于数据流所经链路(E1/
33、10M/100M)最小带宽标称值的 70%. 3.4.2 使用工具进行监测 目前的网络监测工具,大致可以分为软件测试和硬件测试两个方面.硬件由于其投入较大且使用较为专业,在此不做介绍.在 MSwitch 系统里.可以通过网管软件得到一些简单的网络统计信息,不过为了得到较为直观, 准确,实时的测试结果, 推荐使用专业软件进行网络检测, 评估 . 客户成功,我们成功 13 NGN IP 网络设备日常维护指导手册 3.4.2.1 BWMeter BWmeter 是一个功能强大的带宽测试和监视程序,它可以测量并显示出你的网络上的所有流量. 对于使用 UTsmart 软件的 PC 来说,可以使用该软件判
34、断当前 pc 的带宽使用情况,根据实际情况调整网络资源分配.该软件可以在各知名下载站点免费下载,大小几百 k,利用安装向导安装该软件并重启 pc 后,就可以运行. 图 1 图一是一些基本配置,包括需要监视的端口(每个端口都会生成一个监测窗口 ).在上图中定义了监视两个端口,点击“OK“确认后,得到如图二的两个检测窗口 . 在窗口里,我们可以看到实时的网络流量, 以及 UL(上载)和 DL(下载) 的平均值和峰值. 客户成功,我们成功 14 NGN IP 网络设备日常维护指导手册 图 2 在图三所示的过滤设置当中,我们可以根据源地址, 目的地址,协议以及端口进行过滤,从而可以监视特定的流量. 图
35、 3 客户成功,我们成功 15 NGN IP 网络设备日常维护指导手册 在图 4 的 StopWatch 这个选项里面, 可以选择在设定的时间段里检测特定端口的网络流量. 图 4 使用 BUmeter,可以让我们对自己的网络使用情况有一个清晰,直观的了解.但是对于语音数据在特定网络环境下的检测,BUmeter 力不从心. 3.4.2.2 NetIQ Chariot Chariot 软件由 Chariot 控制台, 测试脚本以及 EndPoint 组成 ,这样面对不同的网络环境,只需要提供不同的脚本, 就可以完成真实数据流的模拟,是业界公认的第三方评测软件.该软件分为 console 端和客户端
36、, 至少需要两台 PC 才能进行点到点之间的测试(其中一台同时运行控制台和 Endpoint).可以到 http:/ 找到下载试用版本,在下载之前, 会被要求进行注册. 客户成功,我们成功 16 NGN IP 网络设备日常维护指导手册 运行该软件,可以看到如下的界面.图 5 点击红色框中的按钮,弹出如图 6 的设置选项,可以进行协议选择,终端 IP 选择等等.点击“Run“选项里面的“run“就开始进行两个终端之间的语音流量检测. 图 6 运行一段时间后,Chariot 生成相应的测试结果. 客户成功,我们成功 17 NGN IP 网络设备日常维护指导手册 由下面的 Throughput 曲线
37、可以看到,IP 语音所占用的带宽大致都在 0.008M 上下;这个与我们设置里面的 G.729 协议标准是相符的 . 图 7 同时, 该软件可以看到语音传输的 MOS 值(图 8),时延(图 9)等等. 图 8 客户成功,我们成功 18 NGN IP 网络设备日常维护指导手册 图 9 上述测试,只是得到了在纯语音包传输时的网络情况, 而在实际的语音传输中,语音包还有相应的一些 RTP,IP 报头,报尾等等,我们需要进行进一步的测试. 打开一个新的测试窗口,点击图 10 中红色框中的按钮,可以得到一个弹出窗口,进行相关设置. 图 10 进行相关设置时,我们需要点击弹出框下方的“Select Sc
38、ript“进行测试脚本的选择.在图中, 我们选择了远距离, 文件发送这个脚本来进行测试 (如图 11 所示). 客户成功,我们成功 19 NGN IP 网络设备日常维护指导手册 图 11 点击运行后,就可以看到语音包在实际的传输当中加上必要的包头,包尾后所需要占用的带宽的测试结果.同时,测试结果里还可以看到时延, 丢包率等相关参数. 图 12 在实际的网络环境里,通常是多种数据流在一个物理线路上面传输,网络设计者对网络进行了相应的 QOS,而 Chariot 软件也可以根据需求进行在不同的排队策略下特定的网络流量传输测试. 客户成功,我们成功 20 NGN IP 网络设备日常维护指导手册 除了
39、对语音流量进行测试外,Chariot 还可以对数据流,媒体流,组播,多播等进行模拟评测, 需要时请参照 Chariot 的说明手册进行相关测试. 3.5 IP 网络总体运行状况分析及报告 *市*系统 IP 网络系统的巡检包括设备运行情况,节点连通及网络冗余情况,网络性能三个方面,其分析结果如下 : 3.5.1 设备运行情况分析 本部分检测涉及 IOS 版本,设备基本状况等方面 ,其中*参数符合网络设计和运行要求,* 参数不符合要求 ,原因有 *,改造建议有* . 3.5.2 节点连通及网络冗余性分析 本部分检测涉及节点连通及网络冗余方面,其中*符合网络设计要求 ,*不符合要求,原因有*, 改造
40、建议有 *. 3.5.3 网络性能分析 本部分检测涉及及网络冗余方面,其中*符合网络设计要求 ,*不符合要求,原因有*,改造建议有*. 客户成功,我们成功 21 NGN IP 网络设备日常维护指导手册 第四章 常见网络故障及解决方法,工具使用 4.1 接口故障 4.1.1 以太接口故障排除 以太接口的典型故障问题是:带宽的过分利用;碰撞冲突次数频繁;使用不兼容的帧类型.使用 show interface fa mod/num 命令可以查看该接口的吞吐量,碰橦冲突, 信息包丢失,和帧类型的有关内容等. 1)通过查看接口的吞吐量可以检测网络的利用.如果网络广播信息包的百分比很高,网络性能开始下降.
41、 可以进一步查明网络广播源, 是否存在二层环路等. 2)两个接口试图同时传输信息包到以太电缆上时, 将发生碰撞.以太网要求冲突次数很少, 不同的网络要求是不同的, 一般情况发现冲突每秒有 3,5 次就应该查找冲突的原因了.碰撞冲突产生拥塞,碰橦冲突的原因通常是由于敷设的电缆过长,过分利用,端口全半工不匹配导致. 4.1.2 路由器广域口故障排除 端口及线路协议状态 错误原因 解决方案 Serial x is up, line protocol is up 此状态为正确状态 Serial x is down, line protocol is down 路由器未检测到载波信号 1.传输线路不通
42、2.路由器的连接线未连接,或未连接正确. 3.路由器硬件故障 步骤 1 检测传输线路 步骤 2 检查你是否使用正确的电缆与端口 步骤 3 改换路由器另外端口 ,以确认是否为硬件故障 Serial x is up, 1.本地或远程路由器配置错误 步骤 1 设置端口本地自环,再用 show interfaces serial command 观察线客户成功,我们成功 22 NGN IP 网络设备日常维护指导手册 line protocol is down 错误 2. 远程路由器未配置keepalives 参数 . 3. 传输线路错误: problem-noisy line, or misconfi
43、gured or failed switch 4.本地或远端的 CSU/DSU 故障 5.路由器硬件故障 路协议是否为 up 若为 up 状态则表明故障原因在于传输线路或远程路由器配置错误 步骤 2 确认电缆插在正确的端口,正确的 CSU/DSU,和正确的配线架端口上 步骤 3 如认为路由器硬件故障,更换端口进行测试. Serial x is up, line protocol is up (looped) 线路中存在自环设置: 1. 硬件自环 2. 软件自环 步骤 1 使用 show running-config 命令察看端口设置中是否有 loopback 设置 步骤 2 若存在 loopb
44、ack 设置 用 no loopback 去掉此设置 步骤 3 若不存在 loopback 设置,检查CSU/DSU 是否存在自环设置 Serial x is administratively down, line protocol is down 1.路由器端口配置中存在shutdown 命令 2.重复的 IP 地址 步骤 1 检查路由器配置是否存 shutdown 命令 步骤 2 使用 no shutdown 端口命令去掉shutdown 命令 步骤 3 使用 show running-config 命令检查是否存在重叠的 IP 地址. 步骤 4 若存在,则改变 IP 地址. 客户成功,我
45、们成功 23 NGN IP 网络设备日常维护指导手册 4.2 二层故障 目前对于我们网络影响较大的是二层环路的影响,由于私自添加 HUB 等设备, 在物理连接导致二层环路. 在这种情况下,可以通过 sh logging 命令检查,发现某一 mac 在两个 port 之间 flap, 通过断开某一个端口的连接来解决. 4.3 三层路由问题 路由器中部分或全部 ospf 路由表现不稳定 ,路由表中一会加上, 一会又没了,且时间间隔很短,变化很快, 可以从以下几方面考虑. a.网络中线路状态不佳,导致线路时通时断; b.有可能同一 AS 内,Router ID 重复了,ospf 协议中规定,一个 A
46、S 内,Router ID 必须唯一,否则协议会出现故障.建议查找 cisco 设备 log,看是否有 Router ID 重复告警. 4.4 检测工具使用及 cisco 网络日志分析 4.4.1 Ping 命令 Ping 是最常使用的故障诊断与排除命令.它由一组 ICMP 回应请求报文组成,如果网络正常运行将返回一组回应应答报文.ICMP 消息以 IP 数据包传输,因此接收到 ICMP 回应应答消息能够表明第三层以下的连接都工作正常. Cisco 的 ping 命令不但支持 IP 协议, 而且支持大多数其他的桌面协议,如 IPX 和 AppleTalk协议的 ping 命令 .我们首先看一下
47、支持 IP 协议的 ping 命令以用户 EXEC 方式执行的情况,然后再讨论在特权模式下,扩展的 ping 命令包含的许多强大功能. 用户执行模式 IP PING 简单的 IP ping 既可以在用户模式下执行, 也可以在特权模式下执行.正常情况下,命令会发送回 5 个回应请求,5 个惊叹号表明所有的请求都成功地接收到了响应.输出中还包括最大,最小和平均往返时间等信息. 每一个“!“表明一个 echo 响应被成功的接受,如果不是“!“ 号,则表明 echo 响应未被接收到的原因: ! 响应成功接收 请求超时 客户成功,我们成功 24 NGN IP 网络设备日常维护指导手册 U 目的不可达 P
48、 协议不可达 N 网络不可达 Q 源抑制 M 不能分段 不可知报文类型 特权执行模式 在特权执行模式下,扩展的 ping 命令适用于任何一种桌面协议.它包含更多的功能属性,因此可以获得更为详细的信息.通过这些信息我们可以分析网络性能下降的原因而不单单是服务丢失的原因.扩展的 ping 命令的执行方式也是敲入 ping.然后路由器提示各种不同的属性. EXTENDED IP PING 其使用方法如下所示: YH-Router#ping Protocol ip: Target IP address: 165.48.183.12 Repeat count 5: 10 Datagram size 10
49、0: 1600 Timeout in seconds 2: Extended commands n: y Source address or interface: 165.48.48.3 Type of service 0: Set DF bit in IP header no: Data pattern 0xABCD: Loose, Srict, Record, Timestamp, Verbosenone: Sweep range of sizes n: Type escape sequence to abort. Sending 10, 1600-byte ICMP Echoes to 165.58.183.12, timeout is 2 seconds: ! 客户成功,我们