1、1、 例行维护简介设备稳定运行一方面依赖于完备的网络规划,另一方面,通过日常的维护和监测发现设备运行隐患也是非常必要的。2、 设备环境检查设备运行环境正常是保证设备正常运行的前提。No. 检查项 评估标准和说明长期工作环境温度:045;短期工作环境温度:-555。机房的长期工作环境相对湿度应在 5%RH85%RH 之间,不结露;短期工作环境相对湿度应在 0%RH95%RH 之间,不结露。若机房的环境温度长期不能满足要求,应考虑检修或更换机房的空调系统。若机房的相对湿度过大,应考虑为机房安装除湿设备;若机房的相对湿度过小,应考虑为机房安装加湿设备。说明:1机房温度状况短期工作条件是指连续不超过
2、48 小时和每年累计不超过 15 天。具体设备的温度规格要求请参见S7700&S9700 智能&核心路由交换机 硬件描述所有项目都应干净整洁无明显尘土附着。2 清洁状况 注意防尘网的清洁状况,及时清洗或更换,以免影响机柜门及风扇框的通风、散热。设备正常工作时,要求保持风扇正常运转(清理风扇期间除外),擅自关闭风扇会引起设备温度升高,并可能损坏单板。3 散热状况不要在设备子架上通风口处放置杂物,还应定期清理风扇的防尘网。4 线缆布放电源线与业务线缆分开布放。电源线布放整齐、有序。业务线缆布放整齐、有序。5 线缆标签 线缆标签清晰、准确,符合规范。6 机框散热机框进风口没有过多灰尘堵塞,不影响设备
3、正常散热。如果防尘网上灰尘较多,需要及时清洗。机框的防尘网清洗建议一季度进行一次。3、 设备基本信息检查检查设备的基本信息,如软件版本、补丁信息、系统时间等是否正确。No. 检查项 检查方法 评估标准1 设备运行的版本 display version单板 PCB 版本号、软件版本号与要求相符。2 检查软件包 display startup设备正在使用及下次启动时将要加载的产品版本软件和配置文件的文件名正确。3 License 信息 display licenseLicense 文件已经激活,且“Expired date”为“PERMANENT”(即永久有效)或在运行截至日期之内。补丁文件必须与
4、实际要求一致,建议加载华为公司发布的该产品版本对应的最新的补丁文件。4 检查补丁信息 display patch-information 补丁必须已经生效,即补丁的总数量和正在运行的补丁数量一致。时间应与当地实际时间一致(时间差不大于 5 分钟),便于故障时通过时间精确定位。5 检查系统时间 display clock 如果不合格,请执行 clock datetime命令修改系统时间或者配置 NTP 同步网络时间。dir cfcard:6 CF 卡中的文件 dir slave#cfcard:CFcard 里的文件都必须是有用的,否则请执行 delete/unreserved 命令删除。7 检查
5、配置正确性 display current-configuration通过查看当前生效的配置参数,验证设备配置是否正确。8 检查 debug 开关 display debugging设备正常运行时 debug 开关应该全部关闭。9 检查配置是否保存 compare configuration业务配置正常后,要进行保存。运行配置需要与保存过的配置相同。4、 设备运行检查检查设备的运行情况,如单板运行状态、设备复位情况、设备温度等是否正常。No. 检查项 检查方法 评估标准重点关注单板在位信息及状态信息是否正常,当显示如下信息时表示为正常。单板“Online”为“Present”。单板“Power
6、”为“PowerOn”。单板“Register”为“Registered”。1 单板运行状态 display device单板“Status”为“Normal”。2 风扇状态。 display fan Status 为 normal 表示正常。3 电源状态。 display power state 项为 supply 时表示正常。4主用板/备用板的备份状态。 display switchover state主备板同时存在时,要同时有主备板的显示状态信息。倒换完成,设备开始正常工作后,主用板需要显示为“realtime or routine backup”表示正常。5FTP 网络服务端口 dis
7、play ftp-server 不使用的 FTP 网络服务端口要关闭。无告警信息。6 告警信息 display alarm all 如果有告警,需要记录,对于严重以上告警需并立即分析并处理。7 CPU 状态 display cpu-usage各模块的 CPU 占用率正常。如果 CPU占用率如果超过 80%,建议重点关注。8 内存占用率 display memory-usage内存占用情况正常,如果“Memory Using Percentage”超过 60时需要关注。display logbuffer9 日志信息display trapbuffer不存在异常信息。5、 端口内容检查检查设备的端
8、口信息,如端口协商模式、端口配置、端口状态等是否正确。No. 检查项 检查方法 评估标准1 端口错包 display interface业务运行时,要检查端口有无错包,包括CRC 错包等。2端口协商模式display interface端口协商模式正确,两边端口要一致,不能有半双工模式。3 端口配置display current-configuration interface接口的配置项合理,如接口协商模式、速率、隔离、限速等。4 端口状态 display interface brief 端口的 Up/Down 状态满足规划要求。5端口统计数据执行 display ip interface 命
9、令。分两次隔5 分钟后收集数据,然后比较。正常情况下,两次的数据没有增长,且基数不大于 500。6、 业务检查检查设备运行的业务是否正常。1组播成员接口和路由器接口信息display igmp-snooping port-info静态成员接口、动态成员接口、静态路由器接口和动态路由器接口的信息正确。2组播报文统计信息display igmp-snooping statistics vlanVLAN 接收/发送的 IGMP 报文和 PIM Hello报文个数,以及所有 VLAN 内发生的二层事件次数统计合理。执行 display l2-multicast forwarding-table 命令查
10、看二层组播转发表项。3组播转发表信息 执行 display multicast forwarding-table 命令查看三层组播转发表项。组播转发表项正确。域内组播路由协议采用 PIM-SM。4组播路由协议执行 display multicast routing-table 命令。 与组播相连的接口都必须要使能 IGMP。5 DHCP Snooping 绑 display dhcp snooping user-bind all 静态表项和动态表项正确。定表6MAC 地址表信息display mac-addressMAC 地址表信息正确。具有默认路由或者其他精确路由,便于故障时候可以远程定位。
11、7 路由表信息 display ip routing-table 对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。8OSPF 错包情况执行 display ospf error命令。分两次隔 5 分钟后收集数据,然后比较。正常情况下,两次的数据没有增长。执行 display vrrp 命令。 “State”不为“Initialize”状态。执行 display vrrp statistics 命令。备份组中的设备的 VRRP 状态“State”不能同时为“Master”。9 VRRP 状态“Chec
12、ksum errors”、“Version errors”和“Vrid errors”为零。应该有防攻击的配置。10防攻击检测执行 display current-configuration |include car 命令。如果未配置,请使用 car 命令为设备配置防攻击功能。具体步骤请参见S7700&S9700 智能&核心路由交换机配置指南-安全中的“本机防攻击配置”。指定端口和根端口的“STP State”为“FORWARDING”。11 MSTP 状态执行 display stp brief 命令。 备份根端口的“STP State”为“DISCARDING”。查看交换机上当前生效的 M
13、ST 域配置信息。12MST 域配置信息执行 display stp region-configuration 命令。 输出内容包括:域名、域的修订级别、VLAN 与生成树实例的映射关系以及配置的摘要。查看 MSTP 拓扑变化相关的统计信息。13MSTP 拓扑变化执行 display stp topology-change 命令。 如果设备拓扑变化次数递增,则可以确定网络存在震荡。14TC/TCN 报文收发计数执行 display stp tc-bpdu statistics 命令。 查看实例端口的 TC/TCN 报文收发计数。执行 display loop-detection 命令。 LDT
14、 功能配置正常的情况下:15LDT 环路检测执行 display loop-detection interface interface-type interface-number |interface-name “Following ports are block for loop”、“Following ports are shutdown for loop”下无端口,证明启动环路检测的 VLAN 中没有出现环路。端口的“Status”为“Normal”,证明该端口所属的 VLAN 没有出现环路。OSPF 邻居状态执行 display ospf peer 命令。 OSPF 邻居状态:IS-I
15、S 邻居状态执行 display ospf peer last-nbr-down 命令。 邻居状态“State”为“Full”。BGP 邻居状态执行 display isis peer 命令。正常情况下,要求该邻居建立时间不应该小于一天。执行 display bgp peer 命令。 正常情况下,没有邻居 down 掉。IS-IS 邻居状态:邻居状态“State”为“Up”。BGP 邻居状态:16邻居状态“State”为“Established”。执行 display ip routing-table 命令。与前一次记录的路由信息比较,检查是否由明显变化。正常情况下,路由表中有默认路由。17
16、路由信息并可抽样对其中的路由项进行 ping 或者 tracert 操作。对于处于一个网络中同一层次的设备,如果运行相同的路由协议,各设备上的路由条目应该相差不大(因为静态路由的配置差异,路由条目上可能存在一定差异)。指定 Router ID 为 Loopback 口地址。如未分配 Loopback 口地址,则要指定为上行口地址或其他 Down 掉概率最小接口的地址。18OSPF Router ID执行 display current-configuration configuration ospf 或者display router id 命令。 配置的 Router ID 必须与 OSPF
17、正在使用的Router ID 一致。19OSPF 路由引入配置执行 display current-configuration configuration ospf 命令。尽量使用 network 发布路由,也可以通过import 方式引入路由。20 OSPF 虚连接执行 display ospf vlink命令。 不允许使用虚连接。21 OSPF STUB区域执行 display current-configuration configuration ospf 命令。STUB 区域,不能有 import-route 命令。除了 VPN 路由,禁止采用 import-route 命令发布 IP
18、 路由。22BGP 路由发布执行 display current-configuration configuration bgp 命令。应使用 network 命令和 ip route-static ip-address mask | mask-length null0 命令手工聚合路由后再静态发布。23 IBGP 邻居执行 display current-configuration 基于协议稳定性的考虑,建议使用Loopback 这类状态总为 UP 的接口建立邻居configuration bgp 命令。 关系。24ISIS 路由引入执行 display current-configuration configuration isis 命令。尽量使用 network-entity 发布路由,也可以通过 import 方式引入路由。25 VLAN 信息 执行 display vlan 命令。 查看所有 VLAN 的基本信息。