1、故 障 处 理 常 见 问 题通 用 问 题无 线 网 卡 搜 索 不 到 AP 的 无 线 信 号问题现象:无线网卡搜索不到 AP 的无线信号问题分析:无线网卡搜索不到 AP 的信号, 原因可以从两方面着手:(1)无线网卡,(2)AP 本身,在遇到该问题的时候,我们可以从以上两个方面进行处理.处理过程:1. 无线网卡侧:(1)查看 PC 的无线网卡是否打开,是否可以搜索到空间中其他的无线信号 ,确认无线网卡使用正常。(2)检查网卡的无线参数,例如无线工作模式等。(3)检查网卡与 AP 的间距,确认网卡在 AP 的覆盖范围内。2. AP 侧(1)查看 AP 是否加电,工作是否正常, 天线是否牢
2、固。(2)查看 AP 的配置信道是否为 12,13 信道,欧洲制式的笔记本不支持 12,13 信道。(3)串口登陆 AP,执行 iwconfig 观察 WLAN 接口是否已启动。(4)如果是瘦 AP,通过 AC 检查 AP 的在线情况以及是否将 AP 分组和对应的 WLAN分组绑定。处理结论:一般进行上述步骤的查找,问题就应该能够解决.如果还是存在问题,建议把无线网卡的型号,AP 的型号发给我们进行测试。AP 不 稳 定 ,丢 包 很 严 重 .导 致 上 网 速 度 很 慢问题现象:无线客户端无线网卡关联上 AP 后很不稳定,从无线网卡 ping 网关地址时丢包很严重,上网速度很慢。问题分析
3、:这种现象一般有几个常见的原因引起:1. 无线 AP 之间的同频干扰导致,相邻 AP 的信道设置为同一信道。2. AP 距离很近或者室分天线间距很近,会产生无线干扰。3. 由于某些 AP 的天线是定向天线,所以对于定向天线的覆盖角度和距离要有所了解。4. 无线网卡正处在 AP 覆盖范围的边缘,信号强度较弱引起。5. AP 与室分系统对接问题。处理过程::1. 针对第一个原因,需要调整 AP 的布网环境和信道设置,避免相邻 AP 的信道一样.2. 针对第二个原因,需要调整 AP 或者室分天线的间距。3. 针对第三和第四个原因,移动无线客户端到 AP 定向天线的覆盖范围内,寻找信号强度最好传输速率
4、最稳定的位置摆放终端。4. 对于第 5 点原因,可以抛开室分进行测试,如果确认是室分的问题,室分进行整改。处理结论:针对这类问题,我们首先要查看 AP 的工作环境,然后还要查看无线网卡与 AP 之间的距离。交 换 机 不 能 对 AP 进 行 远 程 供 电问题现象:交换机不能对 AP 进行供电问题分析:交换机按供电来分,有两种:一是普通的交换机,没有供电功能。二是带有 POE 模块的交换机,能够对 AP 进行供电。问题处理:1. 首先需要确认现场的交换机类型,是否为带有 POE 模块的交换机 2. 带有 POE 模块的交换机默认的远程供电是关闭的,需要通过命令来打开,需要执行如下的命令:se
5、t poe-port dynamic。处理结论:在处理这类问题时,重要的是要搞清楚所接的交换机是否具有供电功能即可。WLAN 无 线 终 端 可 以 搜 索 到 WLAN 信 号 , 但 是 没 有 办 法 关 联问题现象:WLAN 无线终端可以搜索到 WLAN 信号,但是没有办法关联。问题分析:出现这种情况可以从如下几个方面检查:1. pc 机系统使用时间太长,无线缓存出现问题。2. 查看无线网卡目前支持的无线模式,是支持 11B 还是 11B/G 都支持。问题处理:1. 确认无线网卡支持的模式,一些老的无线网卡只支持 11B 模式,而我们的设备默认的为 11G,因此建议调整 AP 的无线工
6、作模式后再进行测试。图 ERROR! NO TEXT OF SPECIFIED STYLE IN DOCUMENT.-1 密 码 修 改2. 要是还是不能解决,可以做如下的操作。首先可以修复一下 WLAN 无线终端3. 然后再重新搜索,重新关联。问题结论:这类问题大致可以按照上面的方法进行排出,基本可以解决。WLAN 无 线 终 端 可 通 过 关 联 到 AP, 但 无 法 正 常 上 网问题现象:WLAN 无线终端可以正常的关联到搜索到的 AP 信号,但是不能上网。问题分析:可以关联到 AP 上,说明 AP 的无线没有存在问题,现在出现该问题,分析可能出现如下的问题1. 信号过弱2. WL
7、AN 无线终端地址设置错误3. AP 所连上行网络 DNS 出现问题。问题处理:1. 尽量减少无线客户端和 AP 之间的障碍物且不要距离太远2. 确认现场的网络使用没有问题,可以使用有线来检查。3. 查看 WLAN 无线终端是否设置了静态的地址而不满足现场的使用。主要有两种可能:1现场使用的是 DHCP+WEB 认证的方式,但是电脑配置了静态的地址。 2现场 AP 使用路由器模式,给 WLAN 无线终端自动分配地址,但是 WLAN 无线终端手动配置地址有误。3 现场采用静态地址配置,但是所使用的地址有问题。问题结论:1. 注意 AP 的物理的使用的距离, 以及密码的正确输入,尽量配置自己熟悉的
8、密码.2. 准确的了解现场网络的使用,到底以何种方式接入,何种方式计费等。AC+瘦 AP 问 题AP 注 册 到 AC, 但 配 置 没 有 下 发问题现象:AC 管理板上能够看到 AP,但现场搜索不到无线信号。问题分析:该种用法属于比较普遍的用法,测试的时候也是重点验证的功能,因此应该不存在使用上的问题,故怀疑是配置上的原因导致。问题处理:1. 首先确认该 AP 是否正确添加到对应的 AP 分组。2. 查看 AP 所在的分组是否和相应的 WLAN 分组正确关联。3. 在 web 管理页面,基本配置-AP 版本信息中,升级特征码、目标版本以及目标版本文件是否配置正确,如果 AP 升级失败,可能
9、会不断重启循环走升级流程,导致配置无法正确下发。4. 串口或者 telnet 方式登陆管理板,show wtp,然后选择 ping 其中的某一个AP,看是否能 ping 通,如果不通参考上一节中的步骤处理。用 户 获 取 不 到 IP 地 址问题现象:用户采用 dhcp 方式实现业务,但获取不到 IP 地址问题分析:首先确认是普遍现象还是个别现象,个别现象可能是终端设置问题。同时了解组网模式,确认需要重点排查的设备。问题处理:图 ERROR! NO TEXT OF SPECIFIED STYLE IN DOCUMENT.-2 用 户 获 取 不 到 地 址 问 题 排 查 流 程1. 确认是普
10、遍现象还是个人现象,如果是个别现象,要看这些 STA 是否有相同属性,比如在同一个热点(一个 ONU 下或者一个接入交换机下或者一个 AP 下),主要关注传输故障、AP 故障、某个热点的 SSID 配置是否正确等。同时还要注意现场AP 无线信号质量如何,是否干扰严重,这个都会影响到用户获取地址(参考 3.1.2节进行排查)。如果所有 STA 都无法获取地址,那么按照以下方法排查。2. 本地转发模式情况:(1)web 方式登陆管理板,WLAN 中找到对应的 WLAN 分组,检查给 AP 下发的无线参数中的业务 vlan 是否正确。(2) 本地转发模式的情况下,一般由外置 dhcp 设备(例如 b
11、as 设备)作为 dhcp server 给用户分配地址。在 dhcp server 侧抓包检查 DHCP 交互过程。(3)如果 dhcp server 侧没有收到 discover 报文,重点检查中间链路是否正确配置业务vlan。3. 集中转发模式情况:(1)首先检查下发的 SSID 是集中转发模式还是本地转发模式,然后检查隧道配置是否正确(执行 show wireless station,隧道建立成功会有隧道表项),检查 AP 和 AC上配置的 tunnel ip 是否路由可达,确保隧道能正常工作。接入平台下 show wireless station 是否有隧道表,有则表示数据同步正常。
12、如果没有,检查相关隧道配置,比如管理平台的 access.conf 和 forword.conf 文件配置,管理平台隧道目的地址(接入平台地址,AP 路由可达的接入平台地址)、隧道端口(5248)、隧道模式(1-MACBrigde),接入平台的相关隧道配置。(2)检查 AP 和 AC 上配置的 tunnel ip 是否路由可达。telnet 方式登陆 AP,执行sendcmd 1 tunnel_mgr show(如下图),查看 AP 获取到的 AC 地址(dest ip),然后从 AP ping 该地址,必须保证能够 ping 通。(3)三层隧道时,要检查管理平台的业务 VLAN 配置,特别是
13、 WLAN 和 VLAN 关联,如果没有 qinq 配置,内层 VLAN 就是对应业务 VLAN,外层 VLAN 配置为 0。(4)如果是二层隧道模式,show wireless station 隧道表建立正常,用户还是获取不到地址,则需要检查上面 dhcp server(如 BRAS)的数据是否制作正确,以及透传的业务 VLAN 是否准确。(5)如果是三层隧道模式,show wireless station 隧道表建立正常,用户还是获取不到地址。可以在接入板上打开 debug dhcp(注意,打开 debug 前,先用 show statistics packet reset,连续执行两遍,
14、看一下一秒内 dhcp 报文不要超过 200,超过 200(可能下面有环路)直接打开 debug,AC 会被冲死 ),看是否收到用户的dhcp discover 报文。如果接入平台有收到用户 DHCP 请求报文,看 AC 是否回给用户 OFFER 报文,以及用户终端收到 OFFER 报文后是否发出 REQUEST 报文,AC收到用户终端的 REQUSET 报文后会发一个 ACK 确认报文,用户终端收到 ACK 确认报文,整个 DHCP 流程就正常走完,用户终端就可以获取到正确 IP 地址,任何一个环节出现问题,都会导致用户终端获取不到地址。分下面几种情况。情况一:提示找不到可用的地址池,一般是
15、地址池中的 available-interface port X vlan XXX 语句配置参数与用户终端上报的端口和 VLAN 号不匹配,或者是地址池中配置有 option 60 属性。情况二:接入平台有回 OFFER 报文,但未收到用户的 REQUEST 报文,此种情况可能是 AP 到 AC 单向通信造成,比如中间交换机有配置 QINQ,也有可能是接入交换机端出现了环路,产生了广播风暴,导致报文在接入交换机端丢失,重点排查放在中间链路。如果条件允许可以在 AP 接入交换机和 AC 下行口(用户报文上传 AC端口)同时抓包。情况三:接入平台报 CPU 利用率高,show statistics
16、 packet reset,连续执行两遍,查看一秒内 AC 收到大量广播包(如 dhcp 包超过 200 个/秒),基本上是接入交换机戒者是传输端发生环路,产生广播分包,AC 收到大量广播报文,导致拒绝服务。用 户 获 取 到 地 址 , 但 无 法 推 出 PORTAL 页 面问题现象:用户获取到正常的业务 IP 地址后,在浏览器中随便输入网址,没有强制推出 portal 认证界面,当然也无法实现上网业务。问题分析:主要检查 AC 配置,重点是隧道以及 portal 相关的配置。问题处理:图 ERROR! NO TEXT OF SPECIFIED STYLE IN DOCUMENT.-3 用
17、 户 获 取 到 地 址 但 推 不 出 PORTAL 页 面问 题 排 查 流 程1. 如果走的是二层隧道,用户业务不在 AC 上管理,如果能获取外置 BRAS 分配的地址,但弹不出正确的 portal 页面,则和外置 BRAS 有直接关系,需联系 BRAS 厂家排查故障。2. STA 侧在 windows dos 窗口下输入命令 ping portal 服务器地址(例如221.176.1.140), 如果能 pint 通,再在 dos 窗口下输入 nslookup 命令,根据提示输入 或者其他网站域名,看是否能解析成 IP 地址,如果提示 time out 无法正确解析,则肯定是 DNS
18、域名服务器出现故障了,可以尝试在 IE 浏览器页面直接输入 1.1.1.1 回车,正常情况应该是能打开 portal 页面;3. 如果 STA 无法 ping 通 portal 服务器地址,则重点放在 AC 上。通过串口或者 telnet方式登陆 AC 接入板,在 AC 上 ping portal 地址,如果不通,排查 AC 的出口路由,主要是定位 AC 与 portal 服务器间网络是否正常。如果在 AC 上可以 ping 通,检查AC 配置,例如过滤策略和服务策略配置,用户地址池内引用的策略是否允许用户不经过认证就访问 portal 服务器。4. 如果无线用户通过浏览器无法重定向 port
19、al 的 URL,重点检查 AC 上的认证策略(用户地址池认证前只允许访问 portal 地址、自服务地址和国漫服务器地址)以及 AC 负荷情况(查看 CPU 利用率等,看是否遭到了 TCP 同步攻击等现象)。5. 如果打开 portal 页面时提示非热点区域,或者获取不到 AC 地址等错误提示,则表示portal 服务器侧未注册 ac 和用户地址段相关信息。6. 有的省市具有集团的 portal 和省内 portal 两套系统,对重定向的 url 后携带的字段要求不一致,例如有的省份要求携带 wlanacip 字段、vlan 字段等,而移动集团也为CMCC 和 CMCC-EDU 用户定制了个
20、性化的 portal 页面都需要携带 ssid 字段,这些字段如果上报不正确也无法弹出正确的相应的 portal 页面。列出几个常用的在全局模式配置携带字段的语句:(1)配置 AC 推送的 portal-url 中 ac-name 值和 wlanacip 的值,其中 wlanacip 为可选参数,不配置则推送的 portal-url 不会携带 wlanacip。ex-portal ac-name string wlanacip ipaddress(2)开启星巳克功能,如果重定向 url 中需要携带 ssid 字段,通过不同的 ssid 推送不同的 portal 页面,需开启此功能。wirele
21、ss star-bucks enable如果热点开启了多 SSID 多 PORTAL 功能,需要查看 show wireless station 表,看 sta 是否连接的对应的 ssid,对应正确才能弹出相对应的 portal 页面。用 户 获 取 到 地 址 , 也 能 够 弹 出 PORTAL 页 面 , 但 无 法 通 过 认 证 。问题现象:能够弹出 portal 页面,提交用户账号密码后,提示认证失败,或者没有权限等。问题分析:该问题涉及 AC,portal,AAA 服务器(radius 服务器)三方的交互。要分别进行排查。问题处理:图 ERROR! NO TEXT OF SPEC
22、IFIED STYLE IN DOCUMENT.-4 能 够 推 送 PORTAL 页 面 但 无 法 认 证 成 功问 题 处 理 流 程1. 首先应了解用户认证不成功是属于个别现象还是普遍现象,如果是个别现象,很有可能是账号问题所导致,例如:账号已经登录、账号密码不对。2. 如果是整体认证问题,可以先了解一下其他 BRAS 下接的用户是否同样认证不成功,排除一下认证服务器问题。排除认证服务器问题后,如果是开局,应确保局方数据已经做好,比如 ac-name 已经在 portal 服务器上注册,radius-client ip 已经在认证服务器注册,有的省级 portal 服务器需注册用户的
23、ip 地址网段才能确保 portal 认证正常。3. 检查 AC 的配置,radius-client ip 是否配置正确,radius 服务器 ip,端口号和 key 是否配置正确,域和 radius 服务器的对应关系是否正确等;确认 AC 到认证服务器的路由是否可达,防火墙是否屏蔽相关端口(1645/1646 、1812/1813)等。4. 在特权模式下打开 debug radius(radius 调试开关)和 debug exportal(外置 portal的调试开关),查看 AC 和 portal 服务器的交互流程以及 AC 是否有向 radius 服务器发起认证请求和收到 radius
24、 响应报文,通过调试打印信息还可以查看到报文中字段值是否有问题。5. 特权模式下还有两个 portal 报文和 radius 报文的统计指令(1)show exportal statistics #统计 AC 不 portal 服务器交互报文(2)show radius server x.x.x.x authentication #x.x.x.x 为 radius 服务器地址,统计AC 与 radius 服务器间的认证交互报文(3)show radius server x.x.x.x accounting # x.x.x.x 为 radius 服务器地址,统计AC 与 radius 服务器间的计费交互报文这些统计信息中包含了发送和接收的报文总数,请求成功和被拒绝的报文数目等,可以给排查故障提供详细信息。注意:DHCP+web 方式实现上网业务时,遇到涉及 AC,portal,radius 三方交互的问题,应该首先对该业务方式的实现流程有所了解。具体业务流程可以参见附录 A.2