1、常见环路解决方案影响:出了环路在 10 分钟内解决不了的基本都是 2 级事件;在此谈下个人的两点建议:首先环路出现不外乎两种情况:1 汇聚没断;2 汇聚断了;(注:因汇聚都是 2 级监控)1:针对汇聚设备没断情况下,我们可以在最短时间内定位故障及排除故障 (一般 10 分钟左右);处理方法:1) telnet 汇聚设备,reset counters interface 接口统计信息清零;2) display interface,只需要对比下那个端口 INPUT 的包比OUTPUT 的多就行了, (汇聚设备端口 UP 的不是很多,因此 2 至 3 分钟内就可以找到异常端口了)3) 把这个端口给他
2、 SHUT DOWN 了,也就几分钟,汇聚就不会报 2 级,汇聚所接的其它大部分设备也就恢复了,(如果有下接小汇聚的同理排查就 OK 了,也就是你要在第一时间登陆没断的汇聚设备同理排查就 OK 了,这样不会超过 10 分钟时间)4) 这样范围就会缩到很小,如果有用户报他网络不通那就更简单了,你都不用去机房排查了,直接告诉他,就是那个区域有人接错线缆导致 XX 大面积网络不通,属于信息安全违规的,先让他找下,等你到现场,估计他都找出环路原因了, (这样报故障的用户他还要感谢你了,是他们自己搞出问题的,你再说下要登记责任人,他还不吓的推这个推那个,具体和用户的交流,大家就自己发挥吧,命令就那么几个
3、,细心点就行了)2:针对汇聚设备中断情况下(很少见,因为环路都是在上班时间,下班了也没人去接线了,其次,有设备断了监控中心也会第一时间联系我们,所以在上班时间,在汇聚未断之前我们就会接到事件的,因此汇聚都断了,就很少见了)处理方法:1) 汇聚都断了,在最短时间内赶到机房吧;2) 接上 console 线连接汇聚设备,能进入最好,进不了,把设备重启下了(目的:清空缓存) ,这样超级终端就能接进去了,3) 同上面汇聚未断排查思路相同,首先 reset counters interface,再 display interface 对比了,同理向下查,也会很快定位故障, (此方法就是大部分时间浪费在去机房的途中,但汇聚都断了,无法远程也没办法,就跑快点了)注:为什么没提到建议大家拔线,首先拔线你要到机房去,你就要到机房去(浪费多少时间啊),其次你从汇聚往下拔,相信拔过线的同学都知道,机房里的线有多难拔,手都发痛啊,最麻烦的是拔了后你咋接进去,大家有没有想过,汇聚端口都是有描述的,那么多线你咋知道那个线接那个口,不是为日后遗留问题吗,所以向这种费时费力的事,建议别做,OK,本人一点小小建议,希望对大家有帮助;阳光雨露:刘涛,13480609195