现象描述
AP异常掉线。
可能原因
- 由于配置变更导致的AP下线(如配置下发后AP重启等),请等待AP重新上线。如果AP无法上线,请参考AP上线失败(AC)处理。
- 由于中间网络异常导致的AP下线。
- 由于AP、网线等硬件故障导致的AP下线。
操作步骤
1、检查AP下线原因记录
在AC上执行命令display ap offline-record all,查看AP下线原因。
display ap offline-record all ------------------------------------------------------------------------------ MAC Last offline time Reason ------------------------------------------------------------------------------ 0023-0024-0080 2015-01-31/16:21:50 Reboot by ap-reset command 60de-4476-e360 2015-01-31/14:02:35 Reboot by ap update reset command 1047-80b1-56a0 2015-01-31/13:52:35 Reboot by ap update reset command ------------------------------------------------------------------------------ Total records: 3
以V200R010版本为例,下表为AP下线的原因及处理建议。其他版本请查阅产品文档中相应的命令行。
AP下线原因 |
解释 |
处理建议 |
---|---|---|
The AC country code is modified. |
修改国家码。 |
无需处理,正常配置变更触发。 |
The AP is replaced. |
此AP被替换。 |
无需处理,正常配置变更触发。 |
Reboot by ap update reset command. |
下发升级复位命令。 |
无需处理,AP升级后需要重启刷新版本。 |
A command is delivered to reboot an AP. |
下发复位命令。 |
无需处理,AC下发复位命令。 |
An AP is deleted. |
删除AP。 |
无需处理,AC删除AP。 |
The license expires. |
License过期导致AC管理AP的资源不足。 |
请重新申请License。 |
Insufficient license resources. |
License资源不足。 |
根据实际组网情况确定处理方法:
|
The AP is added to the blacklist. |
AP被添加到黑名单。 |
请确认是否需要将此AP加入黑名单。 |
A CAPWAP tunnel is faulty (due to inconsistent link IDs). |
内部LINK ID不匹配导致的CAPWAP链路异常。 |
无需处理,AP会自动尝试修复链路。 |
The DTLS configuration of the CAPWAP tunnel changes. |
CAPWAP链路DTLS配置变更。 |
无需处理,正常配置变更触发。 |
The AP’s factory settings are restored. |
AP恢复出厂配置。 |
无需处理,正常配置变更触发。 |
The radio type is inconsistent between the AC and AP. |
AC和AP间射频类型不匹配。 |
请执行命令display ap config-info检查AP射频配置是否正确。 |
Heartbeat packet transmission for the CAPWAP data tunnel between the AC and AP times out. |
AC与AP间的CAPWAP数据链路心跳超时。 |
请检查AP和AC中间网络并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
Heartbeat packet transmission for the CAPWAP control tunnel between the AC and AP times out. |
AC与AP间的CAPWAP控制报文心跳超时。 |
请检查AP和AC中间网络并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
The dual-link networking configuration is modified. |
修改双链路组网配置。 |
无需处理,配置导致AP自动重启。 |
The AP name is modified. |
更改AP名称。 |
无需处理,正常配置变更触发。 |
The AP group name is modified. |
更改AP组配置。 |
无需处理,正常配置变更触发。 |
The management VLAN is modified. |
修改管理VLAN。 |
无需处理,正常配置变更触发。 |
AP provisioning parameters are set. |
配置AP上线参数。 |
无需处理,正常配置变更触发。 |
The CAPWAP source IP address is deleted. |
删除CAPWAP源地址。 |
无需处理,正常配置变更触发。 |
The central AP goes offline. |
中心AP掉线导致RU掉线。 |
请检查中心AP掉线原因。 |
The central AP proactively reboots RUs. |
中心AP主动重启RU。 |
无需处理,正常配置变更触发。 |
The AP is powered off and restarts. |
AP断电重启。 |
请确认AP供电是否异常。 |
An internal error (KP) occurs. |
设备内部异常(内存KP异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (VOS signal error) occurs. |
设备内部异常(VOS信号异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (forwarding error monitored by MFPI) occurs. |
设备内部异常(MFPI监控到转发异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (PKO error monitored by MSC) occurs. |
设备内部异常(MSC监控到PKO异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (reset due to timer expiration) occurs. |
设备内部异常(定时器超时复位)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (reset of the write CPLD register) occurs. |
设备内部异常(写CPLD寄存器复位)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
The reset button is pressed to reset the AP. |
手动按复位键重启。 |
请确认是否人为复位,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
The AP restarts due to a CANBUS reset. |
CANBUS复位重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
The AP restarts due to AP interference. |
AP靠太近,干扰导致AP复位重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
The AP restarts due to a firmware exception. |
芯片异常重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
The CAPWAP sensitive-info PSK is modified. |
CAPWAP链路敏感信息PSK变更。 |
无需处理,配置导致AP自动重启。 |
The CAPWAP integrity-check PSK is modified. |
CAPWAP链路报文完整性校验PSK变更。 |
无需处理,配置导致AP自动重启。 |
The country code is inconsistent on the AC and AP. |
国家码不匹配。 |
请确认AC上的国家码配置与AP所支持的国家码是否一致。 |
The AP is forcibly disconnected. |
特定场景下(比如CAPWAP隧道满)强制AP断开。 |
无需处理。 |
CAPWAP link down for DTLS smooth. |
HA或VRRP主备倒换时DTLS平滑导致AP掉线。 |
无需处理。 |
The wideband status change. |
wideband使能状态变更。 |
无需处理,正常配置变更触发。 |
An internal error (MSC error monitored by MFPI) occurs. |
设备内部异常(MFPI监控到MSC异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (MSU error monitored by MFPI) occurs. |
设备内部异常(MFPI监控到MSU异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (KAP error monitored by MFPI) occurs. |
设备内部异常(MFPI监控到KAP异常)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (TX DMA stop) occurs. |
设备内部异常(TX DMA停止)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (other reason) occurs. |
设备内部异常(其他原因)。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
Reboot for AP Channel-load-mode change. |
信道集模式变更。 |
无需处理,正常配置变更触发。 |
Reset for the data link DTLS configuration change. |
数据链路DTLS配置更改,导致AP重启。 |
无需处理,配置导致AP自动重启。 |
Reset for the AC list configuration change. |
更改AC list配置导致AP重启。 |
无需处理,配置导致AP自动重启。 |
Reset for the change of the IP address obtaining mode. |
更改AP获取IP地址的模式导致AP重启。 |
无需处理,配置导致AP自动重启。 |
Reset for the IP address configuration change. |
更改IP地址配置导致AP重启。 |
无需处理,配置导致AP自动重启。 |
Reset for a configuration delivery failure. |
配置下发失败,导致AP重启。 |
请确认网络连通性是否正常,如无问题请联系技术支持人员。 |
Reboot for the branch group of AP change. |
修改AP分支组配置,导致AP重启。 |
无需处理,正常配置变更触发。 |
The AC license expires. |
AC license过期,导致AP重启。 |
请重新激活License。 |
A CAPWAP tunnel is faulty (due to a CAPWAP link entry verification failure). |
因CAPWAP LINK表项校验失败导致CAPWAP链路异常。 |
无需处理,AP 会自动尝试修复链路。 |
Batch delete |
主备AC场景下,主AC切换备AC时,主AC上的AP下线,在备AC上线。 |
检查主AC和网络是否异常,主AC恢复后AP切回主AC上线。 |
Switch service radio to proxy scanning radio. |
射频的工作模式切换为proxy-scan导致重启。 |
无需处理,配置导致AP自动重启。 |
Switch proxy scanning radio to service radio. |
射频的工作模式从proxy-scan切换为其他模式导致重启。 |
无需处理,配置导致AP自动重启。 |
Reset for the AC mode switching. |
AC模式切换。 |
无需处理。 |
The WAC license expires. |
云管理平台的License已超期。 |
购买新的License并加载到云管理平台。 |
The device has been disconnected from the Agile Controller-Campus for more than 90 days. |
AC与云管理平台持续断链超过90天。 |
执行命令display cloud-mng info,查看AC上配置的云管理平台地址是否正确,并检查网络连通性。 |
The device is deleted from the Agile Controller-Campus. |
云管理平台删除AC设备。 |
无需处理。 |
The Agile Controller-Campus does not deliver AP information. |
云管理平台未下发AP信息。 |
|
An internal error (Reset for firmware abnormal) occurs. |
WIFI芯片固件异常导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for abnormal network port self-healing) occurs. |
网口异常自愈导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for the forcible AP disconnection in specific scenarios) occurs. |
特定场景下强制AP断开。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for slow task switching) occurs. |
系统运行慢导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for MFPI detect CAP PBUF use out) occurs. |
MFPI监控到转发PBUF耗尽导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for abnormal wifi txrx self-healing) occurs. |
WIFI驱动侧收发包长时间异常后自愈重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for exception(redis-server exit)) occurs. |
redis-server进程异常退出导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for exception(confd exit)) occurs. |
confd进程异常退出导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for exception(callhome exit)) occurs. |
callhome进程异常退出导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
An internal error (Reset for an abnormal process) occurs. |
进程异常导致AP重启。 |
请联系技术支持人员,并采集/logfile及/corefile目录下的文件,monfile.txt,daemon.log,daemon.log.bak,一键诊断等信息。 |
2、如果AP被误加入黑名单,请采取如下措施:
a、请执行命令display ap blacklist命令,查看被加入黑名单的AP的MAC地址。
display ap blacklist -------------------------------------------------------------------------------- ID MAC -------------------------------------------------------------------------------- 0 0025-9e07-8280 -------------------------------------------------------------------------------- Total: 1
b、执行命令undo ap blacklist mac ap-mac,删除AP黑名单中的指定AP。
system-view [AC] wlan [AC-wlan-view] undo ap blacklist mac 0025-9e07-8280
3、如果AP的下线原因是静态IP地址相关配置导致的AP重启,且重启后AP无法重新上线,说明IP信息配置错误,可以在AP上通过以下两种方法重新配置。
方法一:配置AP上线方式为DHCP动态获取方式。
system-view [Huawei] ap-address mode dhcp //配置AP上线方式为DHCP动态获取方式 [Huawei] quit reboot //重启AP生效
方法二:重新配置正确的静态IP地址。
system-view [Huawei] ap-address static ip-address 10.1.15.253 255.255.240.0 //重新配置正确的静态IP地址 [Huawei] quit reboot //重启AP生效
4、如果AP的下线原因是License过期,请联系华为售前或代理商购买新的License。
5、如果AP的下线原因是AP断电重启,请检查AP供电是否正常。
a、检查网线等物理连接设备,是否出现老化。
在交换机或AC执行virtual-cable-test命令,检测网线是否正常工作。需要注意执行virtual-cable-test命令会导致交换机或AC对应接口的业务中断。
[HUAWEI] interface gigabitethernet 0/0/1 [HUAWEI-GigabitEthernet0/0/1] virtual-cable-test Warning: The command will stop service for a while. Continue?[Y/N]y Info: This operation may take a few seconds. Please wait for a moment..........done. Pair A length: 18meter(s) Pair B length: 18meter(s) Pair C length: 18meter(s) Pair D length: 18meter(s) Pair A state: Ok Pair B state: Ok Pair C state: Ok Pair D state: Ok
最后四个状态均为OK表示网线是正常的,否则建议更换网线
b、检查AP的供电模块是否正常。
以AC为AP提供PoE供电为例,可在AC上执行命令行display poe power-state查询直连该AP端口的PoE的状态。
<AC> display poe power-state interface GigabitEthernet 0/0/1 Port legacy detect : disable Port power enabled : enable Port power ON/OFF : on Port power status : Powered Port PD class : 4 Port reference power(mW) : 30000 Port power priority : Low Port max power(mW) : 30000 Port current power(mW) : 4240 Port peak power(mW) : 4399 Port average power(mW) : 4134 Port current(mA) : 80 Port voltage(V) : 53
6、如果AP下线原因为心跳超时,请按如下步骤进行排查
a、检查AC长ping AP时是否存在丢包。
- 如果不能ping通或丢包严重,请检查网络是否正常、网线等连接线是否老化。
- 如果能够ping通,请登录AP获取日志文件,查看AP掉线时间点记录的网络ping结果。如果ping包结果超时,则AP下线为网络异常导致,请联系技术支持人员进行定位。
b、检查中间网络是否存在某类型报文过量的情况。
大量报文(如ND报文等)上送设备,会导致设备CPU使用率过高,很可能导致AP掉线。在AC上执行命令display cpu-defend statistics,查看上送CPU的报文统计。如果存在某些报文数量过多,则需要排查网络,找到该类报文的来源,具体请联系技术支持人员寻求技术支持。
<AC> display cpu-defend statistics wireless ----------------------------------------------------------------------- Packet Type Pass Packets Drop Packets ----------------------------------------------------------------------- 8021X 0 0 8021X-ident 0 0 8021X-start 0 0 arp-miss 0 0 arp-reply 0 0 arp-request 0 0 dhcp-client 0 0 dhcp-server 0 0 dns 0 0 fib-hit 0 0 ftp-client 0 0 ftp-server 0 0 http-client 0 0 icmp 0 0 ip-option 0 0 snmp 0 0 ssh-server 0 0 tcp 0 0 telnet-client 0 0 telnet-server 0 0 ttl-expired 0 0 unknown-multicast 0 0 unknown-packet 0 0 -----------------------------------------------------------------------
c、检查CPU使用率是否过高。
如果设备的CPU利用率一直很高(超过80%),会导致各种业务异常,出现丢包、网络延迟大等现象。在AC上执行命令display cpu-usage history,查看设备CPU使用率历史信息。造成设备CPU使用率高的原因有很多,当设备的CPU使用率一直很高时,请查询华为CPU占用率高怎么进行处理。
<AC> display cpu-usage history 100%| 95%| 90%| 85%| 80%| 75%| 70%| 65%| 60%| 55%| 50%| 45%| 40%| 35%| 30%| 25%| 20%| 15%| 10%|* *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** 5%| ------------------------------------------------------------------------------------------------------------------------- 20 15 10 5 0 (minutes)
d、排查接入层交换机的配置,检查是否存在风暴告警或存在大量广播报文。
在交换机上执行命令display interface,查看接口上的组播和广播报文的统计信息,并观察组播、广播报文增长速率。
<Switch> display interface gigabitethernet 0/0/1 GigabitEthernet 0/0/1 current state : UP Line protocol current state : UP Description: Switch Port,Link-type : access(negotiated), PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0025-9ef4-abcd Last physical up time : - Last physical down time : 2015-12-21 16:12:29 UTC+08:00 Current system time: 2012-06-05 18:56:41 Port Mode: COMMON FIBER, Transceiver: 1000_BASE_SX_SFP Speed : 1000, Loopback: NONE Duplex: FULL, Negotiation: ENABLE Mdi : -, Flow-control: DISABLE Last 300 seconds input rate 0 bits/sec, 0 packets/sec Last 300 seconds output rate 0 bits/sec, 0 packets/sec Input peak rate 0 bits/sec, Record time: - Output peak rate 0 bits/sec, Record time: - Input: 7650 packets, 1327062 bytes Unicast: 0, Multicast: 7650 Broadcast: 0, Jumbo: 0 Discard: 0, Pause: 0 Total Error: 0 CRC: 0, Giants: 0 Runts: 0, Fragments: 0 Alignments: 0, Symbols: 0 Output: 38348 packets, 3683776 bytes Unicast: 0, Multicast: 32314 Broadcast: 6034, Discard: 0 Pause: 0 Input bandwidth utilization threshold : 80.00% Output bandwidth utilization threshold: 80.00% Input bandwidth utilization : 0% Output bandwidth utilization : 0%
如果该接口接收到的广播、组播报文过多,则需要继续检查是否配置了风暴控制。
在交换机上执行命令display storm-control,查看对应接口上配置的风暴控制信息。
<HUAWEI> display storm-control interface gigabitethernet 0/0/1 PortName Type Rate Mode Action Punish- Trap Log Int Last- (Min/Max) Status Punish-Time -------------------------------------------------------------------------------- GE0/0/1 Multicast 1000 Pps Block Normal Off On 90 - /2000 GE0/0/1 Broadcast 1000 Pps Block Normal Off On 90 - /2000 GE0/0/1 Unicast 1000 Pps Block Normal Off On 90 - /2000
如果“Action”显示为“Error-Down”,则建议先排除引起接口Error-Down的原因。有以下两种方式可以恢复接口状态:
- 手动恢复(Error-Down发生后)
当处于Error-Down状态的接口数量较少时,可在该接口视图下依次执行命令shutdown和undo shutdown,或者执行命令restart,重启接口。
- 自动恢复(Error-Down发生前)
如果处于Error-Down状态的接口数量较多,逐一手动恢复接口状态将产生大量重复工作,且可能出现部分接口配置遗漏。为避免这一问题,用户可在系统视图下执行命令error-down auto-recovery cause storm-control interval interval-value使能接口状态自动恢复为Up的功能,并设置接口自动恢复为Up的延时时间。可以通过执行命令display error-down recovery查看接口状态自动恢复信息。
e、检查AC、中间交换机上是否存在IP冲突或者ARP miss。
可通过命令行display trapbuffer查看设备Trap缓冲区信息,看是否存在大量“ARP detects IP conflict”或“arp-miss”相关告警。排查网络中是否存在与AP网关冲突的IP地址。
f、如果使用交换机作为AP网关,需要排查交换机上是否存在大量TC报文,导致AP的ARP表项频繁刷新,引发AP掉线。
正常情况下,当STP检测到网络的拓扑发生变化,会发送TC报文通知ARP模块对ARP表项进行老化或者删除,此时设备需要重新进行ARP学习,以获得最新的ARP表项信息。但是如果网络的拓扑变化频繁,或者网络中设备的ARP表项很多,ARP的重新学习会导致网络中的ARP报文过多,极大地占用系统资源,影响其他业务的正常运行。
为了尽量避免这种情况的发生,可以让ARP表不响应TC报文,这样即使网络的拓扑发生了变化,网络中设备的ARP表项也不会被老化或者删除。同时,开启MAC刷新ARP功能,避免ARP表项没有得到及时刷新,可能导致用户业务中断。
display stp topology-change //查看拓扑变化 display stp tc-bpdu statistics //查看端口TC报文收发计数
如果交换机上存在大量TC报文,可以执行如下命令解决:
<Switch> system-view [Switch] mac-address update arp //开启MAC刷新ARP功能,即MAC地址的出接口变化时,通知更新ARP表项的出接口 [Switch] arp topology-change disable //关闭设备响应TC报文的功能,即当设备收到TC报文时,不对ARP表项进行老化或删除
g、检查CAPWAP配置是否正确。
①心跳检测间隔时间的配置是否合理。
CAPWAP心跳检测间隔时间如果配置得过短,在网络状况不佳时,可能会导致AP掉线。
缺省情况下,CAPWAP心跳检测的间隔时间为25秒,心跳检测报文次数为6。如果开启了双链路备份功能,则缺省情况下,CAPWAP心跳检测的间隔时间为25秒,心跳检测报文次数为3。如果“Echo interval(seconds)”小于缺省值,建议适当调高该值。
<AC> display capwap configuration ------------------------------------------------------------ Source interface : vlanif120 Source ip-address : - Echo interval(seconds) : 25 Echo times : 6 ......
②、检查CAPWAP配置的源接口是否被误shutdown,如果被shutdown,需要undo shutdown。
<AC> system-view [AC] interface vlanif 120 [AC-Vlanif120] undo shutdown
③检查capwap source是否配置了VLANIF 1,如果是,需要修改为其他VLANIF接口。
<AC> system-view [AC] undo capwap source interface vlanif 1 [AC] capwap source interface vlanif 120
h、如果有获取报文头的条件,可同时获取AP、AC侧CAPWAP报文,查看中间链路是否存在丢包。
本文由 @老李 发布于弱电智能网 。
题图来自Unsplash,基于CC0协议
内容观点仅代表作者本人,弱电智能网平台仅提供信息存储空间服务。
如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
文章名称:《华为APV200R007版本异常掉线,怎么处理?》
文章链接:https://www.ruodian360.com/tech/networking/33450.html
添加微信ydian188免费入群,记得备注“弱电智能网”。