1、ME60 多机备份培训,2011-04-06,Page 2,课程内容,Page 3,第一章 多机备份原理介绍,设备间备份的基本原理: 利用VRRP协议协商主备,并使用bfd/ethoam快速检测故障。 使用RUI(冗余用户信息)协议,通过在主备设备之间的TCP连接同步主备用户信息。 发生故障时,利用免费arp和控制路由来引导用户流量,保持业务不中断。,Page 4,第一章 多机备份原理介绍,BRAS-1,BRAS-2,Switch,VRRP主备选择,BFD Peer状态检测,TCP备份信息传输通道,BFD/ETHOAM Link链路检测(可选),MPLS TE/GRE隧道、LSP 户流量保护隧
2、道(可选),连接控制模块,远端备份模块,转发模块,接口板,主控板,连接控制模块,远端备份模块,转发模块,TCP连接,主用设备,备用设备,提取用户信息,保存到备份数据库,封装用户信息,通过TCP发给对端设备,解封装用户信息,保存到备份数据库,热备时,从备份数据库中构造消息触发用户上线,下发转发表项 可以随时接管 流量,第一章 多机备份原理介绍,Page 6,课程内容,Page 7,第二章 多机备份版本差异介绍,Page 8,第二章 多机备份版本差异介绍,Page 9,第二章 多机备份版本差异介绍,Page 10,课程内容,Page 11,第三章 多机备份常用定位命令步骤,步骤一:全局视图下通过d
3、isplay vrrp admin-vrrp display vrrp admin-vrrpAdmin-vrrp number: 1 Interface: GigabitEthernet1/0/0.2, admin-vrrp vrid: 1, state: Master display vrrp admin-vrrpAdmin-vrrp number: 1 Interface: GigabitEthernet1/0/0.2, admin-vrrp vrid: 1, state: Slave,Page 12,第三章 多机备份常用定位命令步骤,步骤二:检查主device上是否存在备份用户 全局视图
4、下通过display backup-user命令可以查看 dis backup-user user-id 1User index : 1User Name : 11User MAC : 0010-0000-0001User CID : 3Session ID : 4User Ip Address : 1.0.255.252User access Interface : GigabitEthernet2/0/3.1Remote-backup-server : masterRemote-backup-profile : 92QinQVlan/UserVlan : 0/1QOS-profile-na
5、me : defaultIp-Pool : 1UpPriority : 15DownPriority : 15Vpn-instance : -Ip-Pool Lease : 4294967295Vrrp ID : 1Comes from : Local Server,Page 13,第三章 多机备份常用定位命令步骤,步骤三:检查主device上TCP是否连接成功 全局视图下,display remote-backup-server 命令可以查看 display remote-backup-server master-Server-Index : 0Server-Name : masterTCP
6、-State : EstablishedPeer-IP : 91.0.0.1Source-IP : 92.1.1.1TCP-Port : 1234Tunnel : Tunnel1/0/0Ip-Pool : 1-END-INFO-,Page 14,第三章 多机备份常用定位命令步骤,步骤四:检查用户上线domain是否配置远端备份使能(peer-backup enable) Domain视图下,display domain verbose display domain name 1 verboseBasic:Domain-name : 1Domain-state : ActiveDomain-ty
7、pe : Normal domainService-type : STBTime-range : DisabledPeer-backup : EnabledPPP-NCP-type : IPCPUser-access-limit : 278528Online-user-total : 1Efm-enable : Disabled,Page 15,第三章 多机备份常用定位命令步骤,步骤五:检查隧道是UP,路由是否可达 Tunnel接口视图下通过display this interface命令可以查看。 display interface Tunnel 1/0/0 Tunnel2/0/4 curr
8、ent state : UP Line protocol current state : UP Last line protocol up time : 2010-04-14 11:21:09 Description:HUAWEI, Quidway Series, Tunnel2/0/4 Interface Route Port,The Maximum Transmit Unit is 1500 Internet Address is unnumbered, using address of LoopBack0(92.1.1.1/32) Encapsulation is TUNNEL, loo
9、pback not set Tunnel destination 91.0.0.1 Tunnel up/down statistics 7 Tunnel protocol/transport MPLS/MPLS, ILM is available, primary tunnel id is 0x400801c, secondary tunnel id is 0x0300 seconds output rate 0 bits/sec, 0 packets/sec0 packets output, 0 bytes0 output error,Page 16,第三章 多机备份常用定位命令步骤,步骤六
10、:检查备device上是否存在备份用户 全局视图下通过display backup-user命令可以查看 display backup-userRemote-backup-server: slaveTotal Users Numer: 1-,Page 17,第三章 多机备份常用定位命令步骤,步骤七:检查备device上是否存在备份用户 全局视图下通过display backup-user命令可以查看 display backup-userRemote-backup-server: slaveTotal Users Numer: 1-,Page 18,第三章 多机备份常用定位命令步骤,步骤八:上
11、述若出现无用户表项情况,可以查看上线失败原因 全局视图下,display aaa online-fail-record /display aaa offline-record/ display abnormal-offline-record 重要的定位方法trace信息:全局视图下trace object -结束,Page 19,课程内容,Page 20,第四章 多机备份问题定位-案例1,案例1:某运营商静态用户倒换后用户无法上线,Page 21,第四章 多机备份问题定位-案例1,现象:某运营商在部署RUI,复位主用设备用户所在单板,静态用户在备设备上无法上线,15分钟后用户才可以接入。 定位
12、步骤: 1、在复位主设备单板的时候,在主备设备同时打开trace信息, ME60-2trace object mac-address H-H-H 2.分析trace信息,在主设备上用户下线的时候没有发送了计费停止报文,而在备设备上上线失败的原因为用户已经存在。3.原因分析: ME60 V1R6C05对于在双机热热备下的静态用户是在备设备上不备份的,在主备切换的后新生成的设备发送免费的arp触发用户重新上线,由于主设备静态用户下线的时候没有发停止计费,在AAA的服务器上海存在表项,导致切换后用户上不不线,而在AAA上15分钟检查不到用户把用户就主动下线了,这就是15分钟又能上线的原因。,Page
13、 22,第四章 多机备份问题定位-案例2,现象:某在部署RUI,复位主用设备用户所在单板,DHCP用户掉线的。 定位步骤: 1、在复位主设备单板的时候,在主备设备同时打开trace信息, ME60-2trace object mac-address H-H-H 2.分析trace信息,在主设备上会下线,然后由RUI触发一次上线,而在切换的过程中,用户下线时候发了停止计费报文。3.原因分析: ME60 V1R6C05对于在双机热热备下的HDCP,PPPOE用户是在主设备上,插拔单板时会下线,呆板卡注册上后有RUI表项重新触发上线。由于下线走了下线流程,发了停止计费报文,呆别设备上升主后,开始发计
14、费报文的时候,AAA服务器任务已经下线,就给设备发了一个DM报文,导致用户下线。,Page 23,第四章 多机备份问题定位-案例3,现象:某运营商,采用RUI隧道方案,备用设备上无法上线,且备设备cpu过高。 定位步骤: 1、在主备设备上通过命令查看用户数:display access-user,主设备上用户明显比别用设备用户多。 2、通过命令display backup-user 主备设备用户数相同,说明备设备上好多用户没有触发上去。通过查看配置发现被设备上上线的接口VLAN和主设备的VLAN配置不一致。 3.CPU ,内存高的原因是,备用设备因为找不到上线接口,导致打印大量断言所致。补丁已
15、经解决。,Page 24,第四章 多机备份问题定位-案例4,现象:某运营商,主备切换后导致用户无法访问网络。,Page 25,第四章 多机备份问题定位-案例4,定位步骤: 1.display vrrp admin-vrrp Admin-vrrp number: 1 Interface: GigabitEthernet7/0/0.888, admin-vrrp vrid: 7, state: Master 2. display remote-backup-profile 7 - Profile-Index : 4 Profile-Name : 7 Remote-backup-server: ru
16、i-hot-backup Backup-ID : 7 VRRP-ID : 7 VRRP-Interface : GigabitEthernet7/0/0.888 Interface : GigabitEthernet7/0/0.10 State : Master Slot-Number : 7 Port-Number : 0 Peer-backup : hot -,Page 26,第四章 多机备份问题定位-案例4,3.查看两端配置发现主备进行了切换,用户是通过备设备绕过隧道转发流量的 interface GigabitEthernet16/0/1.888 vlan-type dot1q 888
17、 ip address 192.168.17.2 255.255.255.0 vrrp vrid 7 virtual-ip 192.168.17.1 admin-vrrp vrid 17 vrrp vrid 7 priority 120 # interface GigabitEthernet16/0/1.888 vlan-type dot1q 888 ip address 192.168.17.3 255.255.255.0 vrrp vrid 7 virtual-ip 192.168.17.1 admin-vrrp vrid 17 vrrp vrid 7 priority 100 #,Pag
18、e 27,第四章 多机备份问题定位-案例4,4.从PC ping 网络测地址发现报文也从ME60出去了,当时丢在了下面的设备,进一步在丢掉的设备上分析发现,ping 的TLL为4,可以断定由于TTL的值,报文没有到达PC就丢到了。5.通过在remote-backup-server视图下修改TTL的值解决。 如: ME60-1-rm-backup-srv-ruitunnel 1/0/0 ip ME60-1-rm-backup-srv-ruitunnel 1/0/0 ip-ttl ?INTEGER IP ttl , Default is 4 为什么tll的值为4? 防止在无用户的情况下,主备切换后
19、,有到用户地址的流量在隧道里成环。,Page 28,第四章 多机备份问题定位-案例5,现象:某运营商,隧道不通导致用户无法访问网络 组网示意图,Page 29,第四章 多机备份问题定位-案例5,故障分析 PC的报文可以送到ME60C,ME60C作出了回应,报文被送到ME60A,ME60A将该报文又送给了ME60C,如此循环,导致报文不能正确到达PC 处理步骤 1.ME60A与ME60B上执行以下操作。 2.执行命令system-view,进入系统视图。 3.执行命令diplay backup-user,查看备份用户,发现已经存在。 4.执行命令diplay remote-backup-serv
20、er ,查看TCP已经连接成功,Page 30,第四章 多机备份问题定位-案例5,SRV-2dis remote-backup-server rui -Server-Index : 1Server-Name : ruiTCP-State : EstablishedPeer-IP : 88.88.88.88Source-IP : 22.22.22.22TCP-Port : 6000Tunnel : 1/0/0Ip-Pool : ruiIp-Pool : rui2-END-INFO-,Page 31,第四章 多机备份问题定位-案例5,5.进入Tunnel 1/0/0接口视图,检查tunnel是否U
21、P SRV-5- Tunnel1/0/0 display this interface Tunnel1/0/0 current state : UP Line protocol current state : DOWN Description:HUAWEI, Quidway Series, Tunnel8/0/0 Interface Route Port,The Maximum Transmit Unit is 1500 Internet Address is unnumbered, using address of LoopBack123(80.0.0.1/32) Encapsulation
22、 is TUNNEL, loopback not set Tunnel destination 22.0.0.1 Tunnel up/down statistics 62 Tunnel protocol/transport MPLS/MPLS, ILM disabled300 seconds output rate 0 bits/sec, 0 packets/sec0 packets output, 0 bytes 0 output error 。,Page 32,第四章 多机备份问题定位-案例5,6.检查Tunnel配置,发现没有进行commit,配置后故障解除。 SRV-5- Tunnel1/0/0 display this # interface Tunnel8/0/0ip address unnumbered interface LoopBack123tunnel-protocol mpls tedestination 22.0.0.1mpls te tunnel-id 123mpls te commit,